PR&ROC

ROC

receiver operating characteristic curve, 即受试者工作特征曲线,是反映敏感度和特异度连续变量的综合指标,用作图法展示两度之间的关系。
计算公式如下
二分类结果混淆矩阵


image

真正例(True Positive;TP):将一个正例正确判断成一个正例
伪正例(False Positive;FP):将一个反例错误判断为一个正例
真反例(True Negtive;TN):将一个反例正确判断为一个反例
伪反例(False Negtive;FN):将一个正例错误判断为一个反例

具体计算公式如下:


image

作图方法如下
实验结果为计量资料即连续变量,至少计算5个临界点的指标,以敏感度(真正例率)为Y轴,1-特异度(假正例率)为X轴,将各点连成曲线,即ROC曲线。如下图所示:
image
图片参考 http://blog.csdn.net/abcjennifer/article/details/7359370

1. 正确选择临界点

  • 敏感度越高,漏诊病例越少,而1-特异度越低,误诊率越少。
  • 最好的临界值在左上角区域, 敏感度和特异度都比价高。

2. AUC用于评估试验的诊断价值

AUC(area under the ROC curve)即ROC曲线下面积,AUC越大越好,提示该试验的诊断价值越高。

  • AUC≈1.0:最理想的检查指标;
  • AUC在0.7-0.9之间:试验准确性高;
  • AUC=0.5:试验无诊断价值。
    一般来说,AUC达到==0.9==以上才认为是一个准确性很高的诊断试验,此时的cutoff才有实际意义哦!