hanlp java api_java分词工具hanlp介绍
发布日期:2021-06-24 13:24:28
浏览次数:4
分类:技术文章
本文共 537 字,大约阅读时间需要 1 分钟。
前几天(6月28日),在第23届中国国际软件博览会上,hanlp这款自然语言处理工具荣获了“2019年第二十三届中国国际软件博览会优秀产品”。
HanLP是由一系列模型预算法组成的工具包,结合深度神经网络的分布式自然语言处理,具有功能完善、性能高效、架构清晰、语料时新、可自定义等特点,提供词法分析、句法分析、文本分析和情感分析等功能,是GitHub最受欢迎、用户量最大(超过13000个star)、社区活跃度最高的自然语言处理技术。
HanLP完全开源,包括词典。不依赖其他jar,底层采用了一系列高速的数据结构,如双数组Trie树、DAWG、AhoCorasickDoubleArrayTrie等,这些基础件都是开源的。官方模型训练自2014人民日报语料库,您也可以使用内置的工具训练自己的模型。
通过工具类HanLP您可以一句话调用所有功能,文档详细,开箱即用。底层算法经过精心优化,极速分词模式下可达2,000万字/秒,内存仅需120MB。在IO方面,词典加载速度极快,只需500 ms即可快速启动。HanLP经过多次重构,目前已经更新到了1.7版本,新增并完善了中文分词、命名实体识别、信息抽取、文本分类、文本聚类、画法分析等功能,使用效率和适用性得到了大幅提升。
转载地址:https://blog.csdn.net/weixin_33137081/article/details/114995810 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
很好
[***.229.124.182]2024年04月26日 06时32分14秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
财务凭证过账增强 BAPI_ACC_DOCUMENT_POST
2019-04-28
离散式生产和流程式生产的区别
2019-04-28
Configuration T codes in SAP MM / WM
2019-04-28
SAP日志log:SLG0,SLG1
2019-04-28
SOA与EAI的比较
2019-04-28
物料帐启用时间
2019-04-28
OA登录时长统计
2019-04-28
销售单据条件价格明细表
2019-04-28
ABAP面向对象
2019-04-28
PP: 混合生产方式(MTO与MTS为例)
2019-04-28
【修复版本】SAP PP模块生产版本主数据维护
2019-04-28
资产相关Table
2019-04-28
ABAP 字符串操作
2019-04-28
给采购凭证分配合作伙伴方案
2019-04-28
【常识】高尔夫计分规则
2019-04-28
高尔夫球专业术语
2019-04-28
SAP and ABAP Memory总结
2019-04-28
程序间数据共享与传递(1):EXPORT/IMPORT、SAP/ABAP Memory
2019-04-28
程序间数据共享与传递(2):EXPORT/IMPORT、SAP/ABAP Memory
2019-04-28
程序间数据共享与传递(3):EXPORT/IMPORT、SAP/ABAP Memory
2019-04-28