python_数据分析_广东省历年专利申请数量和类别
发布日期:2021-06-29 19:49:29
浏览次数:5
分类:技术文章
本文共 1030 字,大约阅读时间需要 3 分钟。
因为手上有相关专利数据,想着还是做点分析吧,万一对社会有价值呢?
原始数据如下:处理分析后的数据如下:
分析的代码如下:
import pandas as pdimport osimport matplotlib.pyplot as pltos.chdir(r'D:\data\广东省\\')dir = r'D:\data\广东省\\'save = r'D:\data\专利数据\\''''本文件重要统计分析内容:1、统计广东省历年专利公告数量2、专利分类统计'''ton = pd.read_csv(save + '专利统计分析数据.csv', engine='python')ton['size'] = ton['size'].map(lambda x:int(x))def count_data(): files = os.listdir(dir) for file in files: data = pd.read_excel(dir+file) data['category'] = data['分类号'].map(lambda x:x[:1]) year = file.split('.')[0].split('_')[1] groups = data.groupby('category').size() groups = groups.reset_index(name='size') groups['year'] = year groups.to_csv(save+'专利统计分析数据.csv',index=False,header=False,mode='a')def year_size(): year_count = ton.groupby('year').agg({ 'size':sum}) year_count.plot() plt.show()year_size()def category_size(): year_count = ton.groupby('category').agg({ 'size':sum}) year_count.plot() plt.show()category_size()
如需要更详细的分析、或者需要数据,请到我其他文章找到我的qq
转载地址:https://data-mining.blog.csdn.net/article/details/113743941 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
逛到本站,mark一下
[***.202.152.39]2024年04月24日 18时13分29秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
QT 容器类之关联存储容器
2019-04-30
windows虚拟机搭建Qt开发环境之IOS
2019-04-30
Redhat安装Mplayer问题汇总
2019-04-30
查看linux是32位还是64位
2019-04-30
ffmpeg
2019-04-30
XCode编译器介绍
2019-04-30
X86汇编语言从实模式到保护模式14:用户程序编程接口及其实现
2019-04-30
SystemC自带example的simple_perf研习
2019-04-30
SystemC自带example的rsa研习
2019-04-30
Python实用小技巧
2019-04-30
美科学家研发BIC-TCP协议 速度是DSL六千倍
2019-04-30
AIDL使用注意
2019-04-30
SDL以及扩展库的交叉编译过程简介
2019-04-30
SDL arm linux平台交叉编译(好文章已测试)
2019-04-30
linux 常用查看设备命令
2019-04-30
Linux内核及文件系统配置编译 - 关于内核配置
2019-04-30
android应用前期开发之经验总结
2019-04-30
Linux 下zip包的压缩与解压
2019-04-30
Andoird SDK目录解析
2019-04-30
Google Guava官方教程(中文版)
2019-04-30