拼音分词扩展elasticsearch-analysis-pinyin安装
发布日期:2021-07-01 06:08:09
浏览次数:2
分类:技术文章
本文共 1435 字,大约阅读时间需要 4 分钟。
1、打开找到对应的版本
2、复制下载链接安装
例如:
我的elasticsearch是5.6.16./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v5.6.16/elasticsearch-analysis-pinyin-5.6.16.zip
3、重启ES!
4、分词测试
GET _analyze{ "text": "学习", "analyzer": "pinyin"}
分词结果
{ "tokens": [ { "token": "xue", "start_offset": 0, "end_offset": 1, "type": "word", "position": 0 }, { "token": "xi", "start_offset": 1, "end_offset": 2, "type": "word", "position": 1 }, { "token": "xx", "start_offset": 0, "end_offset": 2, "type": "word", "position": 1 } ]}
自定义参数
参数 | 默认值 | 说明 |
---|---|---|
keep_first_letter | true | 刘德华>ldh |
keep_separate_first_letter | false | 刘德华>l,d,h |
limit_first_letter_length | 16 | set max length of the first_letter result |
keep_full_pinyin | true | 刘德华> [liu,de,hua] |
keep_joined_full_pinyin | false | 刘德华> [liudehua] |
keep_none_chinese | true | keep non chinese letter or number in result |
keep_none_chinese_together | true | true:DJ音乐家 -> DJ,yin,yue,jia; false:DJ音乐家 -> D,J,yin,yue,jia |
keep_none_chinese_in_first_letter | true | 刘德华AT2016->ldhat2016 |
keep_none_chinese_in_joined_full_pinyin | false | eg: 刘德华2016->liudehua2016 |
none_chinese_pinyin_tokenize | true | eg: liudehuaalibaba13zhuanghan -> liu,de,hua,a,li,ba,ba,13,zhuang,han |
keep_original | false | - |
lowercase | true | - |
trim_whitespace | true | - |
remove_duplicated_term | false | de的 > de |
ignore_pinyin_offset | true | - |
转载地址:https://pengshiyu.blog.csdn.net/article/details/103136799 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!
发表评论
最新留言
初次前来,多多关照!
[***.217.46.12]2024年04月14日 06时12分46秒
关于作者
喝酒易醉,品茶养心,人生如梦,品茶悟道,何以解忧?唯有杜康!
-- 愿君每日到此一游!
推荐文章
山东科技大学2015-2016学年第一学期程序设计基础期末考试第一场 题解
2019-05-03
蓝桥杯题解(三)
2019-05-03
Scala学习第十二天 Scala中的继承:超类的构造、重写字段、重写方法代码实战
2019-05-03
剑指offer:字符串的组合(java)
2019-05-03
实时开发框架Meteor API解读系列<二>Core
2019-05-03
实时开发框架Meteor 实际应用系列<一>---文件的上传和下载[补充]
2019-05-03
启用fcitx-qimpanel面板程序
2019-05-03
浅谈Q的基本实现
2019-05-03
阿里云短信服务(JAVA)
2019-05-03
GCD使用 串行并行队列 与 同步异步执行的各种组合 及要点分析
2019-05-03
深入研究 Runloop 与线程保活
2019-05-03
iOS 版本更新(强制更新)检测问题
2019-05-03
Struts2(1)简介
2019-05-03
XSS漏洞解析(一)
2019-05-03
Springboot使用详解
2019-05-03
leetcode算法 111. 二叉树的最小深度
2019-05-03
李洪强iOS开发之-cocopods安装
2019-05-03
实现string toHex(int)把一个十进制转换成十六进制。(完全用算法实现)
2019-05-04
覃仙球- 时装品牌Chilly Chin创始人 | 到「在行」来约见我
2019-05-04
struts2.5.10.1
2019-05-04