Ik分词器没有使用---------elasticsearch-analysis-ik 5.6.3分词问题
2024-08-25 08:29:51
1.问题
现在项目中用的是ES5.6.3的版本,在解决Field注解没有加载mapping的问题后又发现IK分词好像不理想。
后来查看5.5.0 IKAnalyzer.cfg.xml的配置发现
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">custom/mydict.dic;custom/single_word_low_freq.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">custom/ext_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
这里Ik是默认帮我们配置了分词的文件,这些文件是IK已经分过的词。
然后再查看5.6.3IK的配置文件
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict"></entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords"></entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
5.6.3并没有帮我们去配置分词文件的位置。
接下来查看一下源码
加载配置文件的文件名都不对。
接下来通过修改文件把文件名与源码中的名称对应,发现还是加载不了。 最后通过修改配置文件。
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">extra_main.dic;extra_single_word_low_freq.dic</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">extra_stopword.dic</entry>
<!--用户可以在这里配置远程扩展字典 -->
<!-- <entry key="remote_ext_dict">words_location</entry> -->
<!--用户可以在这里配置远程扩展停止词字典-->
<!-- <entry key="remote_ext_stopwords">words_location</entry> -->
</properties>
这下就可以正常的分词了。
参考-----https://github.com/medcl/elasticsearch-analysis-ik/issues/602
最新文章
- JVM-内存管理
- SRM 146 DIV1 600
- nyoj 364 田忌赛马(贪心)
- RadGridView标头分行
- UVA 12906 Maximum Score 排列组合
- javascript进击(六)Jquery
- 解决 SQL Server 耗尽内存的情况
- 安装JDK+Tomcat,进行环境变量设置,和运行JSP
- ASP.NET产生随机验证码
- input的type属性引申的日历组件
- testlink(以及服务器)问题定位思路
- vertx的Actor模型实现
- 红帽 Red Hat Linux相关产品iso镜像下载【百度云】【更新7.2】
- laravel框架——验证码(第二种方法)
- SSAS 内部错误:操作未能成功
- Flask组件
- 如何正确实现 Java 中的 HashCode
- CSS实现水平垂直同时居中的6种思路
- pytest一:pytest 框架介绍
- C# 4.0 可选参数 和 命名参数
热门文章
- 搜狗输入法在Ubuntu下突然不能输入中文
- 再谈编码 decode和encode
- SPOJ3276 D-query
- <;转载>; MySQL 性能优化的最佳20多条经验分享 http://www.jb51.net/article/24392.htm
- 转载:return *this和return this
- Appium -选择、操作元素
- groovy Date 格式化
- WebService与RESTful WebService
- 深度学习原理与框架-Tensorflow卷积神经网络-卷积神经网络mnist分类 1.tf.nn.conv2d(卷积操作) 2.tf.nn.max_pool(最大池化操作) 3.tf.nn.dropout(执行dropout操作) 4.tf.nn.softmax_cross_entropy_with_logits(交叉熵损失) 5.tf.truncated_normal(两个标准差内的正态分布)
- MySQL数据库备份工具mysqldump的使用(转)