1. 分词器的安装

./bin/elasticsearch-plugin install https://github.com/medcl/elasticsearch-analysis-ik/releases/download/v6.2.3/elasticsearch-analysis-ik-6.2.3.zip

NOTE: replace 6.2.3 to your own elasticsearch version

github上面的地址

https://github.com/medcl/elasticsearch-analysis-ik

需要注意安装的版本和对应的elasticsearch相匹配

使用方法:

1> 在ElasticSearch的配置文件config/elasticsearch.yml中的最后一行添加参数 index.analysis.analyzer.default.type: ik,则设置所有索引的默认分词器为ik分词。

2> 也可以通过设置mapping来使用ik分词

2. IK分词器的两种分词模式。

1> ik_max_word: 会将文本做最细粒度的拆分,比如会将"北京邮电大学"拆分,会穷尽各种可能的组合;

{
"tokens":[
{
"token":"北京邮电",
"start_offset":0,
"end_offset":4,
"type":"CN_WORD",
"position":0
},
{
"token":"北京",
"start_offset":0,
"end_offset":2,
"type":"CN_WORD",
"position":1
},
{
"token":"邮电大学",
"start_offset":2,
"end_offset":6,
"type":"CN_WORD",
"position":2
},
{
"token":"邮电",
"start_offset":2,
"end_offset":4,
"type":"CN_WORD",
"position":3
},
{
"token":"电大",
"start_offset":3,
"end_offset":5,
"type":"CN_WORD",
"position":4
},
{
"token":"大学",
"start_offset":4,
"end_offset":6,
"type":"CN_WORD",
"position":5
}
]
}

2> ik_smart: 会做最粗粒度的拆分

{
"tokens":[
{
"token":"北京",
"start_offset":0,
"end_offset":2,
"type":"CN_WORD",
"position":0
},
{
"token":"邮电大学",
"start_offset":2,
"end_offset":6,
"type":"CN_WORD",
"position":1
}
]
}

最新文章

  1. chrome浏览器js 导出excel
  2. Windows 8.1/2012R2在脱机模式下安装.NET Framework 3.5
  3. Spring与Struts2整合VS Spring与Spring MVC整合
  4. java 调用OpenOffice将word格式文件转换为pdf格式
  5. hadoop format过程
  6. Hadoop中的一些基本操作
  7. 机器学习之Adaboost (自适应增强)算法
  8. 如何写出如散文般的代码――《代码整洁之道》读书笔记(Ch1-Ch3)
  9. Angular4.0入门
  10. 【scrapy】笔记一:安装,以及遇到的坑
  11. FromData获取表单数据
  12. python基础篇_001_初识Python
  13. mysql5.5大数据量下表结构升级
  14. 树莓派上使用Slowloris进行DDoS攻击
  15. package.json版本号
  16. python 廖雪峰的官方网站
  17. day 69-70 一对一 一对多 多对一联表查询
  18. Javascript class获取回调函数数据
  19. I/O多路复用 select poll epoll
  20. Xcode的路径小知识纪录

热门文章

  1. api的使用机制:继承、实例化、实现(继承)配置、实例(参数化)配置、机制管理模块
  2. ajax 三级联动商品分类(转载)
  3. 【转】Spring Boot特性
  4. 不推荐在iOS的浏览器应用上使用click和mouseover
  5. LeetCode22.括号生成 JavaScript
  6. 课时49.非input标签(掌握)
  7. dubbox provider cosumer 包坐标及xml
  8. IF()判断变量是否为空
  9. Error creating bean with name 'mapper' defined in class path resource [applicationcontext.xml]: Cannot resolve reference to bean 'factory' while setting bean property 'sqlSessionFactory'; nested excep
  10. MYSQL命令简要笔记