Pandas入门3(dtype+fillna+replace+rename+concat+join)
learn from
发布日期:2021-07-01 03:25:50
浏览次数:3
分类:技术文章
本文共 1985 字,大约阅读时间需要 6 分钟。
文章目录
上一篇:
5. dtype 数据类型
print(wine_rev.price.dtype)
,float64
wine_rev.dtypes
,整张表,需要加复数s
!!!
country objectdescription objectdesignation objectpoints int64price float64province objectregion_1 objectregion_2 objecttaster_name objecttaster_twitter_handle objecttitle objectvariety objectwinery objectcritic objecttest_id int32dtype: object
- 字符串的数据类型为
object
astype()
,可以进行类型转换wine_rev.points.astype('float64')
0 87.01 87.02 87.03 87.04 87.0 ... 129966 90.0129967 90.0129968 90.0129969 90.0129970 90.0Name: points, Length: 129971, dtype: float64
wine_rev.index.dtype
,索引的类型是dtype('int64')
6. Missing data 缺失值
6.1 查找缺失值 pd.isnull(),pd.notnull()
缺少值的条目将被赋予值NaN
,是Not a Number
的缩写。这些NaN
值始终为float64
dtype。
NaN
条目,可以使用pd.isnull()
,pd.notnull()
wine_rev[pd.isnull(wine_rev.country)]
6.2 填补缺失值 fillna(),replace()
wine_rev.region_2.fillna('Unknown')
,原始数据不改变- 还可以把缺失值填成之前出现的第一个非空值,称为回填策略
wine_rev.taster_twitter_handle.replace("@kerinokeefe", "@kerino")
,把前者替换成后者
7. Renaming and Combining 重命名、合并
7.1 Renaming 重命名
- 把名字改成我们喜欢的,更合适的,
rename()
,可以把索引名、列名更改 wine_rev.rename(columns={'points':'score'})
- 更改
index
,wine_rev.rename(index={0:'michael',1:'ming'})
,index={字典}
rename_axis()
,可以更改行索引、列索引名称wine_rev.rename_axis("酒",axis='rows').rename_axis('特征',axis='columns')
7.2 Combining 合并数据
concat(),join() 和 merge()
canadian_youtube = pd.read_csv("../input/youtube-new/CAvideos.csv")british_youtube = pd.read_csv("../input/youtube-new/GBvideos.csv")pd.concat([canadian_youtube, british_youtube])
left = canadian_youtube.set_index(['title', 'trending_date'])right = british_youtube.set_index(['title', 'trending_date'])left.join(right, lsuffix='_CAN', rsuffix='_UK')
完成了课程+练习,获得,继续加油!🚀🚀🚀
上一篇:
转载地址:https://michael.blog.csdn.net/article/details/106200551 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
很好
[***.229.124.182]2024年04月19日 10时54分35秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
EL、JSTL、servlet
2019-05-02
2 QCreator调试并查看源码
2019-05-02
4 Qt 之 pro 配置多个子工程/子模块
2019-05-02
12 Qt 之 QToolBox、QLCDNumber
2019-05-02
32 Qt 之绘图之绘制一个漂亮的西瓜
2019-05-02
33 Qt 之绘图之绘制卡通蚂蚁
2019-05-02
35 Qt 之绘制闪烁文本
2019-05-02
QT知识点总结(一)
2019-05-02
Unix环境变量--文件操作
2019-05-02
Unix环境变量--进程管理
2019-05-02
Unix环境变量--线程基础
2019-05-02
Unix环境变量--缓冲区
2019-05-02
Unix环境变量--POSIX异步I/O
2019-05-02
UNIX环境变量--存储映射I/O
2019-05-02
tinyhttpd源码学习1
2019-05-02
Plus One
2019-05-02
Linux内核完全剖析0.12(一)
2019-05-02
Sum Root to Leaf Numbers
2019-05-02
Reverse Linked List II
2019-05-02
为什么 Redis 要比 Memcached 更火?
2019-05-02