pandas数据处理 笔记2
发布日期:2022-03-04 11:48:30 浏览次数:8 分类:技术文章

本文共 667 字,大约阅读时间需要 2 分钟。

导入所需要的库文件

import numpy as np

import pandas as pd

读取excel

df=pd.read_excel(r’’,skiprows=2) # 因为数据有两行空值,需要跳过。

df.head()

检测excel文件是否存在空值

df.isnull #is null/not null 用来检测空值,可用于df和series

df[“姓名”].isnull # 用来检测该列有没有空值

空值的处理

df.dropna(how=“all”,axis=“columns”,inplace=True) # 将列全部为空值的列删去

df.dropna(how=“all”,axis=“rows”,inplace=True) # 将行方向全部为空值的删去
注意:inplace为true则修改当前的df,否则将返回新的df。
df.loc[:,“姓名”]=df[“姓名”].fillna(method=“ffill”) # 将姓名这一列中的空值,用ffill的方式填充。ffill:为取上一行的不为空的值填充空值,bfill:使用后一个不为空的值填充。
df.loc[:,“分数”]=df[“分数”].fillna(0)# 用0将分数这一列的空值填充
还有一种方法,等同于 df.fillna({“分数”:0})

清洗后的数据存入到新的excel

df.to_excel(r’’,index=False) # 当index=false时,index这一列将不导入到excel中。

修改前的数据

修改前的数据
修改后的数据
修改后的数据

转载地址:https://blog.csdn.net/xxy_yinji/article/details/119391196 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:python学习笔记1
下一篇:2021-09-25

发表评论

最新留言

关注你微信了!
[***.104.42.241]2024年03月28日 23时13分22秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章