非参数检验
发布日期:2022-02-14 23:02:46 浏览次数:25 分类:技术文章

本文共 1927 字,大约阅读时间需要 6 分钟。

分布函数的拟合检验:

    • 皮尔逊定理:不论 F 0 ( x ) F_0(x) F0(x)是什么分布,当 H 0 : F ( x ) = F 0 ( x ) H_0: F(x) = F_0(x) H0:F(x)=F0(x)正确时,则检验统计量 η = ∑ i = 1 m ( v i − n × p i ) 2 n × p i = ∑ i = 1 m v i 2 n × p i − n \eta = \sum_{i=1}^m\frac{(v_i - n \times p_i)^2}{n \times p_i} = \sum_{i=1}^m\frac{v_i^2}{n \times p_i} - n η=i=1mn×pi(vin×pi)2=i=1mn×pivi2n,故统计量 η \eta η以自由度 m − 1 m - 1 m1 χ 2 − \chi^2- χ2分布为极限分布,其中 F 0 ( x ) F_0(x) F0(x)不带有任何参数。其中 v i v_i vi为实测频数, n × p i n \times p_i n×pi为理论频数
    • 皮尔逊 χ 2 \chi^2 χ2检验的五个步骤
      • 抽样
      • 频数分布表
      • 计算理论频数
      • 建立检验统计量: η = ∑ i = 1 m ( v i − n × p i ) 2 n × p i = ∑ i = 1 m v i 2 n × p i − n \eta = \sum_{i=1}^m\frac{(v_i - n \times p_i)^2}{n \times p_i} = \sum_{i=1}^m\frac{v_i^2}{n \times p_i} - n η=i=1mn×pi(vin×pi)2=i=1mn×pivi2n
      • H 0 H_0 H0的显著性检验: H 0 : F ( x ) = F 0 ( x ) , H 1 : F ( x ) ≠ F 0 ( x ) H_0: F(x) = F_0(x), H_1: F(x) \neq F_0(x) H0:F(x)=F0(x),H1:F(x)=F0(x)

随机变量间的独立性检验

    • Pearson相关系数
      • 局限
        • 须假设数据是成对地从正态分布中取得的
        • 数据至少在逻辑范围内是等距的
    • Spearman秩相关系数
      • 特点:无参数(与分布无关)检验方法,用于度量变量之间联系的强弱
    • 相关性与相似性
      • 相关性:相关系数
      • 相似性:余弦相似度
    • χ 2 \chi^2 χ2独立性检验的列联表检验法
      • 无参假设检验
      • 自由度:(rows-1)*(cols-1) = ( r − 1 ) × ( s − 1 ) (r - 1) \times (s - 1) (r1)×(s1)
      • η = n × ∑ i = 1 r ∑ k = 1 s ( n i k − n i . × n . k n ) 2 n i . × n . k = ∑ i k k + 1 ( O i − E i ) 2 E i ∼ χ 2 ( k k ) \eta = n \times \sum_{i=1}^r\sum_{k=1}^s\frac{(n_{ik} -\frac{n_{i.} \times n_{.k}}{n})^2}{n_{i.} \times n_{.k}} = \sum_{i}^{kk+1}\frac{(O_i - E_i)^2}{E_i} \sim \chi^2(kk) η=n×i=1rk=1sni.×n.k(niknni.×n.k)2=ikk+1Ei(OiEi)2χ2(kk) k k = ( r − 1 ) × ( s − 1 ) kk = (r - 1) \times (s - 1) kk=(r1)×(s1),即各个列表元素的卡方值之和(每个元素的卡方值: ( O − E ) 2 E \frac{(O - E)^2}{E} E(OE)2,其中 O O O:实验观测值, E E E:期望值)
      • 结论:在给定置信度 1 − α 1 - \alpha 1α的情况下,用检验统计量 η \eta η与该置信度下的自由度为 ( r − 1 ) × ( s − 1 ) (r - 1) \times (s - 1) (r1)×(s1) 的卡方值(查表得)比较
        • η \eta η 大于 查表所得值时,则否定 H 0 H_0 H0的相互独立的假设;反之亦然
        • 在置信度和自由度不变的情况下, η \eta η值越小说明变量之间越独立( H 0 成 立 H_0成立 H0),越大说明变量之间越相关( H 1 成 立 H_1成立 H1)

转载地址:https://blog.csdn.net/fish2009122/article/details/104152893 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:DW及建模
下一篇:【转载】概率分布的自由度

发表评论

最新留言

表示我来过!
[***.240.166.169]2024年03月27日 00时55分44秒