pandas21 读csv文件read_csv(8.方言和分隔符)(详细 tcy)
发布日期:2021-06-29 14:48:27
浏览次数:3
分类:技术文章
本文共 2777 字,大约阅读时间需要 9 分钟。
方言和分隔符 2018/12/26
目录:第1部分:csv文本文件读写 pandas 读csv文件read_csv(1.文本读写概要)https://mp.csdn.net/postedit/85289371 pandas 读csv文件read_csv(2.read_csv参数介绍)https://mp.csdn.net/postedit/85289928 pandas 读csv文件read_csv(3.dtypes指定列数据类型)https://mp.csdn.net/postedit/85290575 pandas 读csv文件read_csv(4.to_csv文本数据写)https://mp.csdn.net/postedit/85290962 pandas 读csv文件read_csv(5.文本数据读写实例)https://mp.csdn.net/postedit/85291123 pandas 读csv文件read_csv(6.命名和使用列)https://mp.csdn.net/postedit/85291430 pandas 读csv文件read_csv(7.索引)https://mp.csdn.net/postedit/85291658 pandas 读csv文件read_csv(8.方言和分隔符)https://mp.csdn.net/postedit/85291994 pandas 读csv文件read_csv(9.浮点转换和NA值)https://mp.csdn.net/postedit/85292391 pandas 读csv文件read_csv(10.注释和空行)https://mp.csdn.net/postedit/85292609 pandas 读csv文件read_csv(11.日期时间处理) https://mp.csdn.net/postedit/85292925 pandas 读csv文件read_csv(12.迭代和块)https://mp.csdn.net/postedit/85293639 pandas 读csv文件read_csv(13.read_fwf读固定宽度数据)https://mp.csdn.net/postedit/85294010 第2部分: pandas hdf文件读写简要https://mp.csdn.net/postedit/85294299 pandas excel读写简要https://mp.csdn.net/postedit/85294545 第3部分: python中csv模块用法tcy https://mp.csdn.net/postedit/85228189 pandas读csv文件read_csv错误解决办法7种https://mp.csdn.net/postedit/85228808 pandas to_string用法https://mp.csdn.net/postedit/85294935
方言:
# 该dialect关键字默认用Excel方言,但您可以指定方言名称或csv.Dialect实例。# 所有方言选项都可以通过关键字参数单独指定
#实例1:dialect
print(data)label1,label2,label3index1,"a,c,eindex2,b,d,f# 使用dialect:dia = csv.excel()dia.quoting = csv.QUOTE_NONEpd.read_csv(StringIO(data), dialect=dia)
label1 label2 label3index1 "a c e #数据包含引号index2 b d f
# 实例2:lineterminator行分隔符data = 'a,b,c~1,2,3~4,5,6'pd.read_csv(StringIO(data), lineterminator='~') a b c0 1 2 31 4 5 6# 实例3:方言选项skipinitialspace,在分隔符后跳过任何空格:data = 'a, b, c\n1, 2, 3\n4, 5, 6'pd.read_csv(StringIO(data), skipinitialspace=True) a b c0 1 2 31 4 5 6
2.转义字符:
# 嵌入字段中的引号(和其他转义字符)可以通过多种方式处理。# 一种方法是使用反斜杠; 要正确解析此数据,您应该传递escapechar选项:data = 'a,b\n"hello, \\"Bob\\", nice to see you",5'print(data)a,b"hello, \"Bob\", nice to see you",5pd.read_csv(StringIO(data), escapechar='\\') a b0 hello, "Bob", nice to see you 5
3.自动“嗅探”分隔符 # read_csv用csv.Sniffer csv模块的类;指定sep=None能够推断分隔(不一定是逗号分隔)的文件。print(open('tmp2.sv').read())data=':0:1:2:3\n' \ '0:0.46:-0.28:-1.5:-1.135\n' \ '1:1.21:-0.17:0.1:-1.044\n' \ '2:-0.8:-2.1:-0.49:1.07\n' \ '3:0.7:-0.7:-1.03:0.27 'pd.read_csv(StringIO(data), sep=None, engine='python') Unnamed: 0 0 1 2 30 0 0.46 -0.28 -1.50 -1.1351 1 1.21 -0.17 0.10 -1.0442 2 -0.80 -2.10 -0.49 1.0703 3 0.70 -0.70 -1.03 0.270
转载地址:https://chunyou.blog.csdn.net/article/details/85291994 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
感谢大佬
[***.8.128.20]2024年05月01日 11时23分14秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
中科院刘康:低资源环境下的事件知识抽取
2019-04-29
提高软件工程技能的关键技术,这些资源赶紧收藏起来
2019-04-29
走进数据科学:最好是通过比网课更好的方法
2019-04-29
机器学习背后的数学支柱,这5本书帮你搞定!
2019-04-29
AI革命第一步:最容易被忽略但必不可少的物联网
2019-04-29
2020年开发运维工具清单:选择开发运维工具堆栈吧
2019-04-29
效率提升法则:高效人士不会去做的4件事
2019-04-29
8.PostgreSQL约束
2019-04-29
【技术分享】使用AES加密技术保障数据安全
2019-04-29
【应用实例】布线多?成本高?不可靠?泽耀方案没烦恼!
2019-04-29
数据可视化工具:Matplotlib绘图
2019-04-29
用Python写个超级小恐龙跑酷游戏,上班摸鱼我能玩一天
2019-04-29
闺蜜看我用Python画了一幅樱花图,吵着要我给他介绍程序员小哥哥
2019-04-29
【Python爬虫实战】知乎热榜数据采集,上班工作摸鱼两不误,知乎热门信息一网打尽
2019-04-29
Python抓取哔哩哔哩up主信息:只要爬虫学的好,牢饭吃的早
2019-04-29
有个码龄5年的程序员跟我说:“他连wifi从来不用密码”
2019-04-29
领导让我整理上个季度的销售额,幸好我会Python数据分析,你猜我几点下班
2019-04-29
【Python爬虫实战】为何如此痴迷Python?还不是因为爱看小姐姐图
2019-04-29
零基础自学Python,你也可以实现经济独立!
2019-04-29