python_数据分析_广东省历年专利申请数量和类别
发布日期:2021-06-29 19:49:29 浏览次数:5 分类:技术文章

本文共 1030 字,大约阅读时间需要 3 分钟。

因为手上有相关专利数据,想着还是做点分析吧,万一对社会有价值呢?

原始数据如下:
在这里插入图片描述

处理分析后的数据如下:

在这里插入图片描述

分析的代码如下:

import pandas as pdimport osimport matplotlib.pyplot as pltos.chdir(r'D:\data\广东省\\')dir = r'D:\data\广东省\\'save = r'D:\data\专利数据\\''''本文件重要统计分析内容:1、统计广东省历年专利公告数量2、专利分类统计'''ton = pd.read_csv(save + '专利统计分析数据.csv', engine='python')ton['size'] = ton['size'].map(lambda x:int(x))def count_data():    files = os.listdir(dir)    for file in files:        data = pd.read_excel(dir+file)        data['category'] = data['分类号'].map(lambda x:x[:1])        year = file.split('.')[0].split('_')[1]        groups = data.groupby('category').size()        groups = groups.reset_index(name='size')        groups['year'] = year        groups.to_csv(save+'专利统计分析数据.csv',index=False,header=False,mode='a')def year_size():    year_count = ton.groupby('year').agg({
'size':sum}) year_count.plot() plt.show()year_size()def category_size(): year_count = ton.groupby('category').agg({
'size':sum}) year_count.plot() plt.show()category_size()

如需要更详细的分析、或者需要数据,请到我其他文章找到我的qq

转载地址:https://data-mining.blog.csdn.net/article/details/113743941 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:百度PaddlePaddle_OCR文字识别_准确率98%
下一篇:山东数据大赛-供水管网压力预测-排名106-6.45分

发表评论

最新留言

逛到本站,mark一下
[***.202.152.39]2024年04月24日 18时13分29秒