深度学习工作笔记003---数据预处理:独热编码(One-Hot Encoding)
发布日期:2021-06-29 18:04:06 浏览次数:2 分类:技术文章

本文共 440 字,大约阅读时间需要 1 分钟。

 

问题由来

在很多机器学习任务中,特征并不总是连续值,而有可能是分类值。

例如,考虑一下的三个特征:

["male", "female"]

["from Europe", "from US", "from Asia"]

["uses Firefox", "uses Chrome", "uses Safari", "uses Internet Explorer"]

如果将上述特征用数字表示,效率会高很多。例如:

["male", "from US", "uses Internet Explorer"] 表示为[0, 1, 3]

["female", "from Asia", "uses Chrome"]表示为[1, 2, 1]

--------------------- 
作者:-柚子皮- 
来源:CSDN 
原文:https://blog.csdn.net/pipisorry/article/details/61193868 
版权声明:本文为博主原创文章,转载请附上博文链接!

转载地址:https://credream.blog.csdn.net/article/details/85268723 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:My97DatePicker 组件使用方法---My97DatePicker
下一篇:Linux工作笔记038---Centos下Linux下解决root用户Operation not permitted

发表评论

最新留言

第一次来,支持一个
[***.219.124.196]2024年04月21日 17时49分49秒