非参数检验-白红宇的个人博客

非参数检验

发布日期：2022-02-14 23:02:46 浏览次数：25 分类：技术文章

本文共 1927 字，大约阅读时间需要 6 分钟。

分布函数的拟合检验：

- 皮尔逊定理：不论 $F_0(x)$ 是什么分布，当 $H_0: F(x) = F_0(x)$ 正确时，则检验统计量 $\eta = \sum_{i=1}^m\frac{(v_i - n \times p_i)^2}{n \times p_i} = \sum_{i=1}^m\frac{v_i^2}{n \times p_i} - n$ ，故统计量 $\eta$ 以自由度 $m - 1$ 的 $\chi^2-$ 分布为极限分布，其中 $F_0(x)$ 不带有任何参数。其中 $v_i$ 为实测频数， $\times p_i$ 为理论频数
- 皮尔逊 $\chi^2$ 检验的五个步骤
  - 抽样
  - 频数分布表
  - 计算理论频数
  - 建立检验统计量： $\eta = \sum_{i=1}^m\frac{(v_i - n \times p_i)^2}{n \times p_i} = \sum_{i=1}^m\frac{v_i^2}{n \times p_i} - n$
  - $H_0$ 的显著性检验： $H_0: F(x) = F_0(x), H_1: F(x) \neq F_0(x)$

随机变量间的独立性检验

- Pearson相关系数
  - 局限
    - 须假设数据是成对地从正态分布中取得的
    - 数据至少在逻辑范围内是等距的
- Spearman秩相关系数
  - 特点：无参数（与分布无关）检验方法，用于度量变量之间联系的强弱
- 相关性与相似性
  - 相关性：相关系数
  - 相似性：余弦相似度

- $\chi^2$ 独立性检验的列联表检验法
  - 无参假设检验
  - 自由度：(rows-1)*(cols-1) = $\times (s - 1)$
  - ： $\eta = n \times \sum_{i=1}^r\sum_{k=1}^s\frac{(n_{ik} -\frac{n_{i.} \times n_{.k}}{n})^2}{n_{i.} \times n_{.k}} = \sum_{i}^{kk+1}\frac{(O_i - E_i)^2}{E_i} \sim \chi^2(kk)$ ， $\times (s - 1)$ ，即各个列表元素的卡方值之和（每个元素的卡方值： $\frac{(O - E)^2}{E}$ ，其中 $O$ ：实验观测值， $E$ ：期望值）
  - 结论：在给定置信度 $\alpha$ 的情况下，用检验统计量 $\eta$ 与该置信度下的自由度为 $\times (s - 1)$ 的卡方值(查表得)比较
    - 当 $\eta$ 大于查表所得值时，则否定 $H_0$ 的相互独立的假设；反之亦然
    - 在置信度和自由度不变的情况下， $\eta$ 值越小说明变量之间越独立( $H_0成立$ )，越大说明变量之间越相关( $H_1成立$ )

转载地址：https://blog.csdn.net/fish2009122/article/details/104152893 如侵犯您的版权，请留言回复原文章的地址，我们会给您删除此文章，给您带来不便请您谅解！

上一篇：DW及建模

下一篇：【转载】概率分布的自由度

发表评论

最新留言

表示我来过！

[***.240.166.169]2024年03月27日 00时55分44秒

关于作者

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！

-- 愿君每日到此一游！

推荐文章

【多线程与高并发】 Java两个线程轮流打印字符串？ 2019-04-26

【Linux命令篇】Linux命令实践 2019-04-26

【Leetcode单调队列】Leetcode239 滑动窗口最大值 2019-04-26

【Leetcode-单调栈】单调栈相关的题目-下一个更大的元素I 每日温度 2019-04-26

【Leetcode单调队列】- 洛谷P1714切蛋糕 2019-04-26

【Leetcode优先级队列】- 数据流的中位数 2019-04-26

【Leetcode优先级队列】-合并K个升序链表 2019-04-26

【多线程与高并发】-Java如何实现一个阻塞队列呢？ 2019-04-26

【多线程高并发】-Java使用阻塞队列ArrayBlockingQueue实现生产者消费者模式？ 2019-04-26

【多线程高并发】-多线程实现数组的读与写 2019-04-26

【Java设计者模式】-Java实现订阅-发布者模式 2019-04-26

【计算机操作系统】-什么是系统调用呢？什么是用户态？什么是内核态？ 2019-04-26

【计算机操作系统-进程管理】-进程通信是什么呢？ 2019-04-26

Python程序元素分析 2019-04-26

TurtleArt美景图 2019-04-26

margin布局 2019-04-26

盒模型之border实践--三角形 2019-04-26

块状元素与内敛元素 2019-04-26

CSS控制段落和文字属性和背景 2019-04-26

Python语言开发工具 2019-04-26

白红宇的个人博客 - 记录点点滴滴的事 - 您是第 306483288 位访客

访问时间: 2024-04-20 16:02:56 访问IP: 18.223.0.53 Copyright © 2020 - 2023 blog.css8.cn 京ICP备2021015314号-1 手机版