python dataframe中缺失值处理
发布日期:2021-06-29 03:49:10 浏览次数:3 分类:技术文章

本文共 803 字,大约阅读时间需要 2 分钟。

一、缺失值检测与统计

1.按列

df.isna().sum()df.isnull().sum()df.shape[0] - df.count()

2. 按行

df.isna().sum(axis=1)df.isnull().sum(axis=1)df.shape[1] - df.count(axis=1)

二、相关处理函数

df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

函数作用:删除含有空值的行或列

axis:维度,axis=0表示index行,axis=1表示columns列,默认为0
how:"all"表示这一行或列中的元素全部缺失(为nan)才删除这一行或列,"any"表示这一行或列中只要有元素缺失,就删除这一行或列
thresh:一行或一列中至少出现了thresh个才删除。
subset:在某些列的子集中选择出现了缺失值的列删除,不在子集中的含有缺失值得列或行不会删除(有axis决定是行还是列)
inplace:得新数据是存为副本还是直接在原数据上进行修改。

df.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None)

函数作用: 填充缺失值

value: 需要用什么值去填充缺失值
axis: 确定填充维度,从行开始或是从列开始
method: fill:用缺失值前面的一个值代替缺失值,如果axis =1,那么就是横向的前面的值替换后面的缺失值,如果axis=0,那么则是上面的值替换下面的缺失值。backfill/bfill,缺失值后面的一个值代替前面的缺失值。注意这个参数不能与value同时出现
limit: 确定填充的个数,如果limit=2,则只填充两个缺失值。

转载地址:https://blog.csdn.net/zdx1996/article/details/108461692 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:pyhon生成等差数列
下一篇:python进度条

发表评论

最新留言

很好
[***.229.124.182]2024年04月14日 12时56分19秒