原始语料库
发布日期:2021-07-01 04:21:51 浏览次数:26 分类:技术文章

本文共 489 字,大约阅读时间需要 1 分钟。

第一步:

判断数据中是否存在重复数据
创建python文件–

代码框架

'''author: kzbtime: 2018-12-10'''import pandas			as pdimport os,csvdataPath = os.path.join("音译原始数据.csv")def import_data(dataPath):	'''	导入文件中的数据	return:dataFrame	'''	passdef find_En_Cn_excess(dataFrame):	'''	查出EnName、CnName列中存在多余数据的项	例如:“Abaagu,”、“阿布(教名Abijah、Able、Abner、Absalom的昵称)”	param:dataFrame	return:dataFrame	'''	passdef write_to_file(dataFrame):	'''	将数据写入文件中	param:dataFrame	'''	passdef main():	'''	程序入口	'''	passif __name__ == '__main__':	main()

转载地址:https://mtyjkh.blog.csdn.net/article/details/84934644 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:python 正则表达式
下一篇:pandas库简单入门

发表评论

最新留言

路过按个爪印,很不错,赞一个!
[***.219.124.196]2024年03月24日 09时46分21秒