二值分类器的优劣判断-白红宇的个人博客

二值分类器的优劣判断

发布日期：2022-02-14 23:02:42 浏览次数：20 分类：技术文章

本文共 784 字，大约阅读时间需要 2 分钟。

ACC
- TP: 判定正确的样本
- FP：判定错误的样本
- FN：应该判断正确，而没有判断/没有抽中的样本
- TP + FP：判断的总样本/抽取的总样本
- TP + FN：正确样本的总量
- ： $\frac{TP}{TP + FP}$
- ： $\frac{TP}{TP + FN}$
- ： $\frac{2}{F1} = \frac{1}{P} + \frac{1}{R} => F1 = \frac{2 \times P \times R}{P + R} => F1 = \frac{2 \times TP}{2 \times TP + FP + FN}$

- $x$ 轴：FPR(false positive rate)：误纳率（误认为负类的样本为正类）
- $y$ 轴：正类样本中被判定为正类的样本，1-TPR也就是传说中的误拒率（误认为正类的样本为负类）
- 重要的四个点
  - (0, 1)：完美分类器：错误率为0
  - (1, 0)：错误率100%
  - (0, 0)：所有的样本均规定为负类：阈值过高
  - (1, 1)：所有的样本均规定为正类：阈值过高

： ROC曲线下的面积

总结
- ROC解决ACC的问题：ACC对于正负样本量差异巨大的情况下(全正/全负的情况下，acc依然很棒)，无法说明分类器的好坏，而ROC可以
- ROC曲线并不能清晰的说明哪个分类器效果更好，而对AUC(ROC曲线下的面积)的值而言，值越大，分类器效果越好

转载地址：https://blog.csdn.net/fish2009122/article/details/103460485 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：抽样分布定理

下一篇：Python未定义参数的传参与识别

发表评论

最新留言

很好

[***.229.124.182]2024年03月26日 14时24分31秒

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

推荐文章

HDU4725（spfa+双端队列优化） 2019-04-26

高斯消元法(Gauss Elimination) 分析 & 题解 & 模板—czyuan原创 2019-04-26

PowerOj 2392（树状数组 or CDQ分治） 2019-04-26

HDU 6119（区间交叉问题） 2019-04-26

hdu 6143（精妙的递推） 2019-04-26

数位dp 2019-04-26

Power oj 2540 （FFT卷积） 2019-04-26

hdu 6165（dfs or bfs or tarjan+topsort） 2019-04-26

hdu 6168（stl） 2019-04-26

hdu 6170（正则表达式） 2019-04-26

排列组合 "n个球放入m个盒子m"问题总结（转） 2019-04-26

codeforces845C（stl） 2019-04-26

图的几种存储方式（邻接矩阵+邻接表+vector） 2019-04-26

[LeetCode] 67. 二进制求和(简单模拟二进制求和) 2019-04-26

HDU1233(基础最小生成树 prim和 kruskal) 2019-04-26

终于找到可以一文多发的平台了！ 2019-04-26

IntelliJ IDEA 2019 快捷键终极大全，速度收藏！ 2019-04-26

第3章-5 字符转换 (15分)【python】 2019-04-26

L1-068 调和平均 (10 分) 2019-04-26

L1-069 胎压监测 (15 分) 2019-04-26

白红宇的个人博客 - 记录点点滴滴的事 - 您是第 307715754 位访客

访问时间: 2024-04-25 02:53:19 访问IP: 3.138.113.188 Copyright © 2020 - 2023 blog.css8.cn 京ICP备2021015314号-1 手机版