模型比较工具 (habit compare)

概述

在完成机器学习训练后,您可能训练了多个模型(例如逻辑回归、随机森林、XGBoost)。HABIT Compare 工具可以帮助您将这些模型的性能画在同一张图上,方便直观比较。

它可以自动生成: * ROC 曲线对比图:比较不同模型的区分能力。 * 校准曲线对比图:比较不同模型的预测概率准确性。 * 决策曲线对比图 (DCA):评估模型的临床净收益。

使用方法

1. 准备预测结果文件

在使用 habit model 训练后,每个模型都会生成一个预测结果 CSV 文件。您需要创建一个配置文件(例如 config_compare.yaml),告诉工具这些文件在哪里。

配置文件示例 (config_compare.yaml):

# 输出目录
out_dir: ./results/comparison

# 要比较的模型列表
models:
  - name: LogisticRegression          # 模型名称(显示在图例中)
    file: ./results/ml/lr/predictions.csv  # 预测结果文件路径
    # 告诉工具哪一列是真值,哪一列是预测概率
    label_col: Label
    prob_col: Probability

  - name: RandomForest
    file: ./results/ml/rf/predictions.csv
    label_col: Label
    prob_col: Probability

  - name: XGBoost
    file: ./results/ml/xgb/predictions.csv
    label_col: Label
    prob_col: Probability

2. 运行命令

habit compare --config config_compare.yaml

输出结果

运行完成后,您将在 out_dir 目录下看到:

  • roc_curves.png: 所有模型的 ROC 曲线对比。

  • calibration_curves.png: 校准曲线对比。

  • dca_curves.png: 决策曲线分析对比。

  • metrics_comparison.csv: 包含 AUC, Accuracy, F1-Score 等指标的汇总表格。

示例图

(此处将展示自动生成的 ROC 曲线对比图)