pandas进行数据清洗及其处理
发布日期:2021-11-08 19:55:32
浏览次数:2
分类:技术文章
本文共 795 字,大约阅读时间需要 2 分钟。
导入pandas
import pandas as pd
读取csv文件
house1 = pd.read_csv("jinjiang.csv")
给csv文件添加表头
这个表明根据自己的进行设置
'a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i','j', 'k', 'l', 'm', 'n', 'o','p'
house1 = pd.read_csv("jinjiang.csv",header=None,names=['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i','j', 'k', 'l', 'm', 'n', 'o','p'])
去除所有空格
house1.replace('\s+','',regex=True,inplace=True)
删除重复行
house1.drop_duplicates()
删除title为空的所有行
index=house1['title'].notnull()house1=house1[index]
切割数据
title = house1["title"].str.split("·",expand=True)house1['title']= title[0]
计算平均值
house1["a"] = (house1["a"].astype('float') / ((house1['b'].str.split("㎡",expand=True))[0]).astype('float')).round()
替换数据
house1.replace('暂无数据', 0, inplace=True)
将所有的空值替换为0
house1.fillna(0, inplace=True)
另保存
house1.to_csv("jinjiang1.csv",index=0)
转载地址:https://blog.csdn.net/zhou_xiong1130/article/details/115950444 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
感谢大佬
[***.8.128.20]2024年04月05日 19时02分25秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
变量名与存储空间
2019-04-28
C语言基本数据类型(1)
2019-04-28
C语言基本数据类型(2)
2019-04-28
C语言标识符
2019-04-28
变量定义、初始化和赋值
2019-04-28
无符号类型
2019-04-28
有符号数的符号位扩展
2019-04-28
常量与符号常量
2019-04-28
符号常量的优点
2019-04-28
常类型变量
2019-04-28
推理 arm-linux-gcc/g++ v3.4.1 版本的一个漏洞
2019-04-28
XML--XSD--类的循环编程过程
2019-04-28
select 和 pselect 函数使用的分析
2019-04-28
Linux信号处理机制分析 并 模拟VC实现多定时器机制
2019-04-28
Linux 多线程编程
2019-04-28
poll、ppoll 浅析
2019-04-28
C++对象内存空间变化的问题!只是引入一个析构函数而已!
2019-04-28
STL vector 的 erase(); 函数漏洞?
2019-04-28