【数据挖掘】关联规则之灰色关联分析法
发布日期:2021-06-23 04:28:55 浏览次数:4 分类:技术文章

本文共 1501 字,大约阅读时间需要 5 分钟。

灰色关联分析法


利用灰色关联分析的九个步骤:

1.根据分析目的确定分析指标体系,收集分析数据。

       设n个数据序列形成如下矩阵:

                     

其中m为指标的个数,

2.确定参考数据列

参考数据列应该是一个理想的比较标准,可以以各指标的最优值(或最劣值)构成参考数据列,也可根据评价目的选择其它参照值.记作

 

3.对指标数据进行无量纲化

由于系统中各因素的物理意义不同,导致数据的量纲也不一定相同,不便于比较,或在比较时难以得到正确的结论。因此在进行灰色关联度分析时,一般都要进行无量纲化的数据处理。常用的无量纲化方法有均值化法(见(12-3)式)、初值化法(见(12-4)式)和 变换等.

 

无量纲化后的数据序列形成如下矩阵:

4.逐个计算每个被评价对象指标序列(比较序列)与参考序列对应元素的绝对差值

 即  (  , n为被评价对象的个数).

 

5. 确定

6.计算关联系数

由(12-5)式,分别计算每个比较序列与参考序列对应元素的关联系数.

    

其中 ρ为分辨系数,0<ρ<1。若ρ越小,关联系数间差异越大,区分能力越强。通常ρ取0.5

当用各指标的最优值 (或最劣值),构成参考数据列计算关联系数时,也可用改进的更为简便的计算方法:

 

改进后的方法不仅可以省略第三步,使计算简便,而且避免了无量纲化对指标作用的某些负面影响.

7.计算关联序

对各评价对象(比较序列)分别计算其个指标与参考序列对应元素的关联系数的均值,以反映各评价对象与参考序列的关联关系,并称其为关联序,记为:

 

8.如果各指标在综合评价中所起的作用不同,可对关联系数求加权平均值即

9.依据各观察对象的关联序,得出分析结果.


应用举例:利用灰色关联分析对6位教师工作状况进行综合分析

1.分析指标包括:专业素质、外语水平、教学工作量、科研成果、论文、著作与出勤.

2.对原始数据经处理后得到以下数值,见下表

 

3.确定参考数据列:

4.计算 , 见下表

 

5.求最值

6.依据(12-5)式,ρ取0.5计算,得

 

同理得出其它各值,见下表

7.分别计算每个人各指标关联系数的均值(关联序): 

 

8.如果不考虑各指标权重(认为各指标同等重要),六个被评价对象由好到劣依次为1号,5号,3号,6号,2号,4号.

 即


 参考代码:基于MATLAB 2016b编程

clc,clearload x.txt %把原始数据存放在纯文本文件 x.txt 中,其中把数据的"替换替换成.for i=1:15    x(i,:)=x(i,:)/x(i,1); %标准化数据endfor i=16:17    x(i,:)=x(i,1)./x(i,:); %标准化数据enddata=x;n=size(data,2); %求矩阵的列数,即观测时刻的个数ck=data(1,:); %提出参考数列bj=data(2:end,:); %提出比较数列m2=size(bj,1); %求比较数列的个数for j=1:m2    t(j,:)=bj(j,:)-ck;endmn=min(min(abs(t'))); %求最小差mx=max(max(abs(t'))); %求最大差rho=0.5; %分辨系数设置ksi=(mn+rho*mx)./(abs(t)+rho*mx); %求关联系数r=sum(ksi')/n %求关联度[rs,rind]=sort(r,'descend') %对关联度进行排序

运行结果的r为各指标和成绩的关联度,rind即为各指标和成绩的关联度大小排序的结果。在使用本程序的时候,只需要把数据换成自己自己的数据,以及把循环次数改一下即可。

参考资料:

1.

2. 

转载地址:https://xinzhe.blog.csdn.net/article/details/86630861 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:懂得感恩的人,运气都不会太差
下一篇:Spring Boot 项目打成 war 包部署到 Tomcat

发表评论

最新留言

表示我来过!
[***.240.166.169]2024年04月20日 09时41分14秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章