pandas21 读csv文件read_csv(8.方言和分隔符)(详细 tcy)
发布日期:2021-06-29 14:48:27 浏览次数:3 分类:技术文章

本文共 2777 字,大约阅读时间需要 9 分钟。

方言和分隔符 2018/12/26

目录:第1部分:csv文本文件读写    pandas 读csv文件read_csv(1.文本读写概要)https://mp.csdn.net/postedit/85289371    pandas 读csv文件read_csv(2.read_csv参数介绍)https://mp.csdn.net/postedit/85289928    pandas 读csv文件read_csv(3.dtypes指定列数据类型)https://mp.csdn.net/postedit/85290575    pandas 读csv文件read_csv(4.to_csv文本数据写)https://mp.csdn.net/postedit/85290962    pandas 读csv文件read_csv(5.文本数据读写实例)https://mp.csdn.net/postedit/85291123    pandas 读csv文件read_csv(6.命名和使用列)https://mp.csdn.net/postedit/85291430    pandas 读csv文件read_csv(7.索引)https://mp.csdn.net/postedit/85291658    pandas 读csv文件read_csv(8.方言和分隔符)https://mp.csdn.net/postedit/85291994    pandas 读csv文件read_csv(9.浮点转换和NA值)https://mp.csdn.net/postedit/85292391    pandas 读csv文件read_csv(10.注释和空行)https://mp.csdn.net/postedit/85292609    pandas 读csv文件read_csv(11.日期时间处理) https://mp.csdn.net/postedit/85292925    pandas 读csv文件read_csv(12.迭代和块)https://mp.csdn.net/postedit/85293639    pandas 读csv文件read_csv(13.read_fwf读固定宽度数据)https://mp.csdn.net/postedit/85294010    第2部分:    pandas hdf文件读写简要https://mp.csdn.net/postedit/85294299    pandas excel读写简要https://mp.csdn.net/postedit/85294545    第3部分:    python中csv模块用法tcy https://mp.csdn.net/postedit/85228189    pandas读csv文件read_csv错误解决办法7种https://mp.csdn.net/postedit/85228808    pandas to_string用法https://mp.csdn.net/postedit/85294935

方言: 

# 该dialect关键字默认用Excel方言,但您可以指定方言名称或csv.Dialect实例。# 所有方言选项都可以通过关键字参数单独指定 

#实例1:dialect

print(data)label1,label2,label3index1,"a,c,eindex2,b,d,f# 使用dialect:dia = csv.excel()dia.quoting = csv.QUOTE_NONEpd.read_csv(StringIO(data), dialect=dia)
label1 label2 label3index1      "a      c      e  #数据包含引号index2       b      d      f
# 实例2:lineterminator行分隔符data = 'a,b,c~1,2,3~4,5,6'pd.read_csv(StringIO(data), lineterminator='~')   a  b  c0  1  2  31  4  5  6# 实例3:方言选项skipinitialspace,在分隔符后跳过任何空格:data = 'a, b, c\n1, 2, 3\n4, 5, 6'pd.read_csv(StringIO(data), skipinitialspace=True)   a  b  c0  1  2  31  4  5  6  

2.转义字符: 

# 嵌入字段中的引号(和其他转义字符)可以通过多种方式处理。# 一种方法是使用反斜杠; 要正确解析此数据,您应该传递escapechar选项:data = 'a,b\n"hello, \\"Bob\\", nice to see you",5'print(data)a,b"hello, \"Bob\", nice to see you",5pd.read_csv(StringIO(data), escapechar='\\')                               a  b0  hello, "Bob", nice to see you  5  
3.自动“嗅探”分隔符 # read_csv用csv.Sniffer csv模块的类;指定sep=None能够推断分隔(不一定是逗号分隔)的文件。print(open('tmp2.sv').read())data=':0:1:2:3\n' \     '0:0.46:-0.28:-1.5:-1.135\n' \     '1:1.21:-0.17:0.1:-1.044\n' \     '2:-0.8:-2.1:-0.49:1.07\n' \     '3:0.7:-0.7:-1.03:0.27 'pd.read_csv(StringIO(data), sep=None, engine='python')          Unnamed: 0     0       1     2       30                  0     0.46 -0.28 -1.50 -1.1351                  1     1.21 -0.17  0.10 -1.0442                  2    -0.80 -2.10 -0.49  1.0703                  3     0.70 -0.70 -1.03  0.270  

 

转载地址:https://chunyou.blog.csdn.net/article/details/85291994 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:pandas21 读csv文件read_csv(9.浮点转换和NA值)(详细 tcy)
下一篇:pandas21 读csv文件read_csv(7.索引)(详细 tcy)

发表评论

最新留言

感谢大佬
[***.8.128.20]2024年05月01日 11时23分14秒

关于作者

    喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!

推荐文章

中科院刘康:低资源环境下的事件知识抽取 2019-04-29
提高软件工程技能的关键技术,这些资源赶紧收藏起来 2019-04-29
走进数据科学:最好是通过比网课更好的方法 2019-04-29
机器学习背后的数学支柱,这5本书帮你搞定! 2019-04-29
AI革命第一步:最容易被忽略但必不可少的物联网 2019-04-29
2020年开发运维工具清单:选择开发运维工具堆栈吧 2019-04-29
效率提升法则:高效人士不会去做的4件事 2019-04-29
8.PostgreSQL约束 2019-04-29
【技术分享】使用AES加密技术保障数据安全 2019-04-29
【应用实例】布线多?成本高?不可靠?泽耀方案没烦恼! 2019-04-29
数据可视化工具:Matplotlib绘图 2019-04-29
用Python写个超级小恐龙跑酷游戏,上班摸鱼我能玩一天 2019-04-29
闺蜜看我用Python画了一幅樱花图,吵着要我给他介绍程序员小哥哥 2019-04-29
【Python爬虫实战】知乎热榜数据采集,上班工作摸鱼两不误,知乎热门信息一网打尽 2019-04-29
自从我学会了数据挖掘Matplotlib、Numpy、Pandas、Ta-Lib等一系列库,我把领导开除了 2019-04-29
Python抓取哔哩哔哩up主信息:只要爬虫学的好,牢饭吃的早 2019-04-29
有个码龄5年的程序员跟我说:“他连wifi从来不用密码” 2019-04-29
领导让我整理上个季度的销售额,幸好我会Python数据分析,你猜我几点下班 2019-04-29
【Python爬虫实战】为何如此痴迷Python?还不是因为爱看小姐姐图 2019-04-29
零基础自学Python,你也可以实现经济独立! 2019-04-29