elasticsearch安装中文分词器
2024-10-19 11:40:36
1. 分词器的安装
./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.3/elasticsearch-analysis-ik-6.2.3.zip
NOTE: replace 6.2.3 to your own elasticsearch version
github上面的地址
https://github.com/medcl/elasticsearch-analysis-ik
需要注意安装的版本和对应的elasticsearch相匹配
使用方法:
1> 在ElasticSearch的配置文件config/elasticsearch.yml中的最后一行添加参数 index.analysis.analyzer.default.type: ik,则设置所有索引的默认分词器为ik分词。
2> 也可以通过设置mapping来使用ik分词
2. IK分词器的两种分词模式。
1> ik_max_word: 会将文本做最细粒度的拆分,比如会将"北京邮电大学"拆分,会穷尽各种可能的组合;
{
"tokens":[
{
"token":"北京邮电",
"start_offset":0,
"end_offset":4,
"type":"CN_WORD",
"position":0
},
{
"token":"北京",
"start_offset":0,
"end_offset":2,
"type":"CN_WORD",
"position":1
},
{
"token":"邮电大学",
"start_offset":2,
"end_offset":6,
"type":"CN_WORD",
"position":2
},
{
"token":"邮电",
"start_offset":2,
"end_offset":4,
"type":"CN_WORD",
"position":3
},
{
"token":"电大",
"start_offset":3,
"end_offset":5,
"type":"CN_WORD",
"position":4
},
{
"token":"大学",
"start_offset":4,
"end_offset":6,
"type":"CN_WORD",
"position":5
}
]
}
2> ik_smart: 会做最粗粒度的拆分
{
"tokens":[
{
"token":"北京",
"start_offset":0,
"end_offset":2,
"type":"CN_WORD",
"position":0
},
{
"token":"邮电大学",
"start_offset":2,
"end_offset":6,
"type":"CN_WORD",
"position":1
}
]
}
最新文章
- chrome浏览器js 导出excel
- Windows 8.1/2012R2在脱机模式下安装.NET Framework 3.5
- Spring与Struts2整合VS Spring与Spring MVC整合
- java 调用OpenOffice将word格式文件转换为pdf格式
- hadoop format过程
- Hadoop中的一些基本操作
- 机器学习之Adaboost (自适应增强)算法
- 如何写出如散文般的代码――《代码整洁之道》读书笔记(Ch1-Ch3)
- Angular4.0入门
- 【scrapy】笔记一:安装,以及遇到的坑
- FromData获取表单数据
- python基础篇_001_初识Python
- mysql5.5大数据量下表结构升级
- 树莓派上使用Slowloris进行DDoS攻击
- package.json版本号
- python 廖雪峰的官方网站
- day 69-70 一对一 一对多 多对一联表查询
- Javascript class获取回调函数数据
- I/O多路复用 select poll epoll
- Xcode的路径小知识纪录
热门文章
- api的使用机制:继承、实例化、实现(继承)配置、实例(参数化)配置、机制管理模块
- ajax 三级联动商品分类(转载)
- 【转】Spring Boot特性
- 不推荐在iOS的浏览器应用上使用click和mouseover
- LeetCode22.括号生成 JavaScript
- 课时49.非input标签(掌握)
- dubbox provider cosumer 包坐标及xml
- IF()判断变量是否为空
- Error creating bean with name 'mapper' defined in class path resource [applicationcontext.xml]: Cannot resolve reference to bean 'factory' while setting bean property 'sqlSessionFactory'; nested excep
- MYSQL命令简要笔记