数据归一化与z-score标准化
发布日期:2021-06-30 15:15:58
浏览次数:2
分类:技术文章
本文共 628 字,大约阅读时间需要 2 分钟。
现实应用中,归一化和标准化都快被叫烂了,很多时候我们都认为二者有相同的意思。粗略上是可以这样认为的,功能是一样的,目的都是消除量纲的影响,以解决指标之间的可比性问题。细细品味,背后还是有些意思的。从几种方法出发。
一.min-max标准化
min-max标准化,也称为极差法,这是对原始数据的一种线性变换,使原始数据映射到[0-1]之间。
所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的 最大值映射成1,是 最大值归一化。
二.z-score标准化
z-score标准化,也称为标准化分数,这种方法根据原始数据的均值和标准差进行标准化,经过处理后的数据符合标准正态分布,即均值为0,标准差为1(根据下面的转化函数很容易证明),转化函数为:
所以说,这种标准化我们称之为归一化的时候,本质上是指将原始数据的标准差映射成1,是标准差归一化。标准差分数可以回答这样一个问题:“给定数据距离其均值多少个标准差”的问题,在均值之上的数据会得到一个正的标准化分数,反之会得到一个负的标准化分数 。
reference to:
http://www.09dsj.com/index.php/archives/1568
http://blog.csdn.net/dkcgx/article/details/46634471
http://www.cnblogs.com/chaosimple/archive/2013/07/31/3227271.html
转载地址:https://jianzhuwang.blog.csdn.net/article/details/51839721 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
网站不错 人气很旺了 加油
[***.192.178.218]2024年04月20日 10时46分20秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
Ubuntu更新后终端中字体的颜色全是白色
2019-04-30
vscode git
2019-04-30
基于MATLAB的二进制数字调制与解调信号的仿真——2PSK
2019-04-30
基于MATLAB的模拟调制信号与解调的仿真——DSB
2019-04-30
HDU - 1166 敌兵布阵 (树状数组模板题/线段树模板题)
2019-04-30
CodeForces - 456C Boredom (dp)
2019-04-30
CodeForces - 675A Infinite Sequence(简单数论 细节)
2019-04-30
CodeForces - 1042B Vitamins (思维)
2019-04-30
ACM 2013 长沙区域赛 Collision (几何)
2019-04-30
ACM 2014 鞍山区域赛 E - Hatsune Miku (dp)
2019-04-30
反向传播&梯度下降 的直观理解程序(numpy)
2019-04-30
CodeForces - 931B World Cup (思维 模拟)
2019-04-30
ACM 2017 北京区域赛 J-Pangu and Stones(区间dp)
2019-04-30
java常用类 String面试题
2019-04-30
Windows10下的powershell美化教程
2019-04-30
利用ffmpeg合并音频和视频
2019-04-30
select下拉框分组展示插件的使用--(select-mania插件的使用)
2019-04-30