1.问题

现在项目中用的是ES5.6.3的版本,在解决Field注解没有加载mapping的问题后又发现IK分词好像不理想。

后来查看5.5.0 IKAnalyzer.cfg.xml的配置发现

<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">custom/ext_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

这里Ik是默认帮我们配置了分词的文件,这些文件是IK已经分过的词。

然后再查看5.6.3IK的配置文件

<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

5.6.3并没有帮我们去配置分词文件的位置。

接下来查看一下源码

加载配置文件的文件名都不对。

接下来通过修改文件把文件名与源码中的名称对应,发现还是加载不了。 最后通过修改配置文件。

<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">extra_main.dic;extra_single_word_low_freq.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">extra_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>

这下就可以正常的分词了。

参考-----https://github.com/medcl/elasticsearch-analysis-ik/issues/602

最新文章

  1. JVM-内存管理
  2. SRM 146 DIV1 600
  3. nyoj 364 田忌赛马(贪心)
  4. RadGridView标头分行
  5. UVA 12906 Maximum Score 排列组合
  6. javascript进击(六)Jquery
  7. 解决 SQL Server 耗尽内存的情况
  8. 安装JDK+Tomcat,进行环境变量设置,和运行JSP
  9. ASP.NET产生随机验证码
  10. input的type属性引申的日历组件
  11. testlink(以及服务器)问题定位思路
  12. vertx的Actor模型实现
  13. 红帽 Red Hat Linux相关产品iso镜像下载【百度云】【更新7.2】
  14. laravel框架——验证码(第二种方法)
  15. SSAS 内部错误:操作未能成功
  16. Flask组件
  17. 如何正确实现 Java 中的 HashCode
  18. CSS实现水平垂直同时居中的6种思路
  19. pytest一:pytest 框架介绍
  20. C# 4.0 可选参数 和 命名参数

热门文章

  1. 搜狗输入法在Ubuntu下突然不能输入中文
  2. 再谈编码 decode和encode
  3. SPOJ3276 D-query
  4. &lt;转载&gt; MySQL 性能优化的最佳20多条经验分享 http://www.jb51.net/article/24392.htm
  5. 转载:return *this和return this
  6. Appium -选择、操作元素
  7. groovy Date 格式化
  8. WebService与RESTful WebService
  9. 深度学习原理与框架-Tensorflow卷积神经网络-卷积神经网络mnist分类 1.tf.nn.conv2d(卷积操作) 2.tf.nn.max_pool(最大池化操作) 3.tf.nn.dropout(执行dropout操作) 4.tf.nn.softmax_cross_entropy_with_logits(交叉熵损失) 5.tf.truncated_normal(两个标准差内的正态分布)
  10. MySQL数据库备份工具mysqldump的使用(转)