模型比较工具 (habit compare)
概述
在完成机器学习训练后,您可能训练了多个模型(例如逻辑回归、随机森林、XGBoost)。HABIT Compare 工具可以帮助您将这些模型的性能画在同一张图上,方便直观比较。
它可以自动生成: * ROC 曲线对比图:比较不同模型的区分能力。 * 校准曲线对比图:比较不同模型的预测概率准确性。 * 决策曲线对比图 (DCA):评估模型的临床净收益。
使用方法
1. 准备预测结果文件
在使用 habit model 训练后,每个模型都会生成一个预测结果 CSV 文件。您需要创建一个配置文件(例如 config_compare.yaml),告诉工具这些文件在哪里。
配置文件示例 (config_compare.yaml):
# 输出目录
out_dir: ./results/comparison
# 要比较的模型列表
models:
- name: LogisticRegression # 模型名称(显示在图例中)
file: ./results/ml/lr/predictions.csv # 预测结果文件路径
# 告诉工具哪一列是真值,哪一列是预测概率
label_col: Label
prob_col: Probability
- name: RandomForest
file: ./results/ml/rf/predictions.csv
label_col: Label
prob_col: Probability
- name: XGBoost
file: ./results/ml/xgb/predictions.csv
label_col: Label
prob_col: Probability
2. 运行命令
habit compare --config config_compare.yaml
输出结果
运行完成后,您将在 out_dir 目录下看到:
roc_curves.png: 所有模型的 ROC 曲线对比。
calibration_curves.png: 校准曲线对比。
dca_curves.png: 决策曲线分析对比。
metrics_comparison.csv: 包含 AUC, Accuracy, F1-Score 等指标的汇总表格。
示例图
(此处将展示自动生成的 ROC 曲线对比图)