pandas进行数据清洗及其处理
发布日期:2021-11-08 19:55:32 浏览次数:2 分类:技术文章

本文共 795 字,大约阅读时间需要 2 分钟。

导入pandas

import pandas as pd

读取csv文件

house1 = pd.read_csv("jinjiang.csv")

给csv文件添加表头

这个表明根据自己的进行设置

'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i','j', 'k', 'l', 'm', 'n', 'o','p'
house1 = pd.read_csv("jinjiang.csv",header=None,names=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i','j', 'k', 'l', 'm', 'n', 'o','p'])

去除所有空格

house1.replace('\s+','',regex=True,inplace=True)

删除重复行

house1.drop_duplicates()

删除title为空的所有行

index=house1['title'].notnull()house1=house1[index]

切割数据

title = house1["title"].str.split("·",expand=True)house1['title']= title[0]

计算平均值

house1["a"] = (house1["a"].astype('float') / ((house1['b'].str.split("㎡",expand=True))[0]).astype('float')).round()

替换数据

house1.replace('暂无数据', 0, inplace=True)

将所有的空值替换为0

house1.fillna(0, inplace=True)

另保存

house1.to_csv("jinjiang1.csv",index=0)

转载地址:https://blog.csdn.net/zhou_xiong1130/article/details/115950444 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:vue封装axios
下一篇:Django中会出现AssertionError异常,在使用try时 不能抛出异常,解决方法如下所示

发表评论

最新留言

感谢大佬
[***.8.128.20]2024年04月05日 19时02分25秒