二值分类器的优劣判断
发布日期:2022-02-14 23:02:42 浏览次数:20 分类:技术文章

本文共 784 字,大约阅读时间需要 2 分钟。

  • ACC
    • TP: 判定正确的样本
    • FP:判定错误的样本
    • FN:应该判断正确,而没有判断/没有抽中的样本
    • TP + FP:判断的总样本/抽取的总样本
    • TP + FN:正确样本的总量
    • P = T P T P + F P P = \frac{TP}{TP + FP} P=TP+FPTP
    • R = T P T P + F N R = \frac{TP}{TP + FN} R=TP+FNTP
    • 2 F 1 = 1 P + 1 R = > F 1 = 2 × P × R P + R = > F 1 = 2 × T P 2 × T P + F P + F N \frac{2}{F1} = \frac{1}{P} + \frac{1}{R} => F1 = \frac{2 \times P \times R}{P + R} => F1 = \frac{2 \times TP}{2 \times TP + FP + FN} F12=P1+R1=>F1=P+R2×P×R=>F1=2×TP+FP+FN2×TP
    • x x x轴:FPR(false positive rate):误纳率(误认为负类的样本为正类)
    • y y y轴:正类样本中被判定为正类的样本,1-TPR也就是传说中的误拒率(误认为正类的样本为负类)
    • 重要的四个点
      • (0, 1): 完美分类器:错误率为0
      • (1, 0): 错误率100%
      • (0, 0):所有的样本均规定为负类:阈值过高
      • (1, 1): 所有的样本均规定为正类:阈值过高
  • : ROC曲线下的面积
  • 总结
    • ROC解决ACC的问题:ACC对于正负样本量差异巨大的情况下(全正/全负的情况下,acc依然很棒),无法说明分类器的好坏,而ROC可以
    • ROC曲线并不能清晰的说明哪个分类器效果更好,而对AUC(ROC曲线下的面积)的值而言,值越大,分类器效果越好

转载地址:https://blog.csdn.net/fish2009122/article/details/103460485 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:抽样分布定理
下一篇:Python未定义参数的传参与识别

发表评论

最新留言

很好
[***.229.124.182]2024年03月26日 14时24分31秒