pandas21 读csv文件read_csv(6.命名和使用列)(详细 tcy)
发布日期:2021-06-29 14:48:24
浏览次数:3
分类:技术文章
本文共 3289 字,大约阅读时间需要 10 分钟。
命名和使用列 2015/12/27
目录:第1部分:csv文本文件读写 pandas 读csv文件read_csv(1.文本读写概要)https://mp.csdn.net/postedit/85289371 pandas 读csv文件read_csv(2.read_csv参数介绍)https://mp.csdn.net/postedit/85289928 pandas 读csv文件read_csv(3.dtypes指定列数据类型)https://mp.csdn.net/postedit/85290575 pandas 读csv文件read_csv(4.to_csv文本数据写)https://mp.csdn.net/postedit/85290962 pandas 读csv文件read_csv(5.文本数据读写实例)https://mp.csdn.net/postedit/85291123 pandas 读csv文件read_csv(6.命名和使用列)https://mp.csdn.net/postedit/85291430 pandas 读csv文件read_csv(7.索引)https://mp.csdn.net/postedit/85291658 pandas 读csv文件read_csv(8.方言和分隔符)https://mp.csdn.net/postedit/85291994 pandas 读csv文件read_csv(9.浮点转换和NA值)https://mp.csdn.net/postedit/85292391 pandas 读csv文件read_csv(10.注释和空行)https://mp.csdn.net/postedit/85292609 pandas 读csv文件read_csv(11.日期时间处理) https://mp.csdn.net/postedit/85292925 pandas 读csv文件read_csv(12.迭代和块)https://mp.csdn.net/postedit/85293639 pandas 读csv文件read_csv(13.read_fwf读固定宽度数据)https://mp.csdn.net/postedit/85294010 第2部分: pandas hdf文件读写简要https://mp.csdn.net/postedit/85294299 pandas excel读写简要https://mp.csdn.net/postedit/85294545 第3部分: python中csv模块用法tcy https://mp.csdn.net/postedit/85228189 pandas读csv文件read_csv错误解决办法7种https://mp.csdn.net/postedit/85228808 pandas to_string用法https://mp.csdn.net/postedit/85294935
1.处理列名
# 文件可能有也可能没有标题行。pandas假设第一行应该用作列名:data = 'a,b,c\n1,2,3\n4,5,6\n7,8,9'pd.read_csv(StringIO(data)) #列名为a,b,cpd.read_csv(StringIO(data), names=['s1', 's2', 's3'], header=0) #列名为s1,s2,s3,丢弃标题行pd.read_csv(StringIO(data), names=['s1', 's2', 's3'], header=None)#列名为s1,s2,s3,数据中保留标题行data = 'skip this skip it\na,b,c\n1,2,3\n4,5,6\n7,8,9'pd.read_csv(StringIO(data), header=1) #列名为a,b,c;标题位于第2行,数据跳过第1行
2.重复名称解析
# 如果文件或标题包含重复的名称,则pandas默认会区分它们以防止覆盖数据:data = 'a,b,a\n0,1,2\n3,4,5'pd.read_csv(StringIO(data),mangle_dupe_cols=True) #列名为a,b,a.1 # 标题包含重复的名称pd.read_csv(StringIO(data), mangle_dupe_cols=False)#出现重复数据抛出ValueError
3.过滤列usecols
# 该usecols参数允许您使用列名,位置号或可调用来选择文件中列的任何子集:data = 'a,b,c,d\n1,2,3,foo\n4,5,6,bar\n7,8,9,baz'pd.read_csv(StringIO(data)) #4列数据,列名为a,b,c,dpd.read_csv(StringIO(data), usecols=['b', 'd'])#2列数据,列名为b,dpd.read_csv(StringIO(data), usecols=[0, 2, 3]) #2列数据,列名为a,c,dpd.read_csv(StringIO(data), usecols=lambda x: x.upper() in ['A', 'C']) #2列数据,列名为a,cpd.read_csv(StringIO(data), usecols=lambda x: x.upper() in ['A', 'c']) #1列数据,列名为a# 指定在最终结果中不使用哪些列:pd.read_csv(StringIO(data), usecols=lambda x: x not in ['a', 'c']) #2列数据,列名为b,d
4.索引列和尾随分隔符
# 如果文件的列数据多于列名数,则第一列将用作DataFrame行名:data = 'a,b,c\n4,apple,bat,5.7\n8,orange,cow,10'pd.read_csv(StringIO(data)) #列名为a,b,cdata = 'index,a,b,c\n4,apple,bat,5.7\n8,orange,cow,10'pd.read_csv(StringIO(data), index_col=0) #列名为a,b,c;'index'为行名# 数据行的末尾使用分隔符:禁用索引列推断并丢弃最后一列用index_col=Falsedata = 'a,b,c\n' \ '4,apple,bat,\n' \ '8,orange,cow,'pd.read_csv(StringIO(data)) a b c4 apple bat NaN8 orange cow NaNpd.read_csv(StringIO(data), index_col=False) a b c0 4 apple bat1 8 orange cow# 用usecols选项解析数据子集,则 index_col规范基于该子集,而不是原始数据。pd.read_csv(StringIO(data), usecols=['b', 'c']) b c4 bat NaN8 cow NaNpd.read_csv(StringIO(data), usecols=['b', 'c'], index_col=0) b c4 bat NaN8 cow NaN
转载地址:https://chunyou.blog.csdn.net/article/details/85291430 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
做的很好,不错不错
[***.243.131.199]2024年04月22日 17时24分21秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
字符串外面是b“ “的转换 -亲测有效
2019-04-29
单通道和多通道卷积
2019-04-29
npy文件和pkl文件的保存和读取
2019-04-29
lmdb文件的读取和保存
2019-04-29
二分查找及原理
2019-04-29
torch Missing key(s) in state_dict
2019-04-29
PA,MIOU,FWIOU
2019-04-29
middle-判断二分图-深度优先和广度优先
2019-04-29
买卖股票的最佳时机
2019-04-29
AUC粗浅理解笔记记录
2019-04-29
torch 模型运行时间与forward没对应的可能原因
2019-04-29
JavaScript 的addEventListener() 事件监听详解!
2019-04-29
上传图片到阿里云OSS和获取上传图片的url的详解 !
2019-04-29
经典面试题:如何保证缓存与数据库的双写一致性?
2019-04-29
一份来自亚马逊工程师的Google面试指南,GitHub收获9.8万星,已翻译成中文
2019-04-29
硬货 | Redis 性能问题分析
2019-04-29
Kafka为什么这么快?
2019-04-29
Java 生产者和消费者面试题
2019-04-29
生产者消费者问题
2019-04-29
本机电脑连接虚拟机redis失败解决方法
2019-04-29