下载IK分词IK Analyzer 2012FF_hf1.zip

下载地址:http://yunpan.cn/cdvATy8899Lrw (提取码:c10d)

1、将IKAnalyzer2012FF_u1.jar包上传到服务器,复制到solr-4.10.4/example/solr-webapp/webapp/WEB-INF/lib目录下

2、在solr-4.10.4/example/solr-webapp/webapp/WEB-INF目录下创建目录classes,然后把IKAnalyzer.cfg.xml和stopword.dic拷贝到新创建的classes目录下即可

3:修改solr core的schema文件,默认是solr-4.10.4/example/solr/collection1/conf/schema.xml,添加如下配置

<fieldType name="text_ik" class="solr.TextField">

<!--索引时候的分词器-->
<analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
<!--查询时候的分词器-->
<analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>

4、启动solr集群

自定义词库

到sougou 下载对应的词库:http://pinyin.sogou.com/dict/

由于sougou 下载后的文件是scel 格式不能直接用,需要用工具转化下格式,推荐使用深蓝工具,下载地址

http://yunpan.cn/cmuyuQhCasFMR (提取码:6432)

然后将文件格式转化为dic结尾的。词库的文件格式必需是:无BOM的UTF-8格式,分词库可以为多个,以分号隔开即可。

将下载的词库复制到/home/hadoop/cloudsolr/solr-4.10.4/example/solr-webapp/webapp/WEB-INF/classes目录下

修改配置文件:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties>
<comment>IK Analyzer 扩展配置</comment>
<!--用户可以在这里配置自己的扩展字典
<entry key="ext_dict">ext.dic;</entry>
-->
<entry jey = "mingxing">mingxing.scel</entry>
<!--用户可以在这里配置自己的扩展停止词字典-->
<entry key="ext_stopwords">stopword.dic;</entry> </properties>

重启solr集群

测试结果:

这样分词有一个问题:分词方式是按照maxword 的方式

集群启动的时候主节点不会报错。从节点会报错

配置文件信息如下:

IK的lib文件已经上传

改配置的都配置了,启动还是报错:

{msg=SolrCore 'collection1' is not available due to init failure: Could not load conf for core collection1: Plugin init failure for [schema.xml] fieldType "text_ik": Cannot load analyzer: org.wltea.analyzer.lucene.IKAnalyzer. Schema file is /configs/myconf/schema.xml,trace=org.apache.solr.common.SolrException: SolrCore 'collection1' is not available due to init failure: Could not load conf for core collection1: Plugin init failure for [schema.xml] fieldType "text_ik": Cannot load analyzer: org.wltea.analyzer.lucene.IKAnalyzer. Schema file is /configs/myconf/schema.xml
at org.apache.solr.core.CoreContainer.getCore(CoreContainer.java:745)
at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:347)

问题原因:

配置了IK分词后,没有同步到zk,删掉zkdata 里面的数据重新启动zk即可

最新文章

  1. 写Java也得了解CPU--伪共享
  2. Subsonic简单的语法整理
  3. Candies-POJ3159差分约束
  4. java目录与classpath
  5. ios app响应background,foreground 事件实现
  6. Angular SEO方案
  7. spark在eclipse上配置
  8. position:absolute,绝对定位和相对定位,JQ隐藏和显示
  9. chrome常用插件
  10. hdu 1281
  11. linux中ls、ls -l、ls -al、ll命令
  12. 从一个简单的Java单例示例谈谈并发 JMM JUC
  13. usaco 17.Jan 铜组T3
  14. UWP_小说在线阅读器:功能要求与技术要求
  15. 实验吧_NSCTF web200&amp;FALSE(代码审计)
  16. Virtual Box下虚拟机复制后ip地址重复
  17. linux shell编程语句if、case.
  18. C++标准库之右值引用相关:引用折叠
  19. jquery动态添加元素无法触发绑定的事件的解决方案
  20. FortiGate防火墙内存使用率高问题

热门文章

  1. ES6 教程
  2. vue简单的input校验手机号
  3. postgresql修改自增序列
  4. 截取url中的某个字符串后面的值
  5. 修改 firefox 默认缩放比例
  6. CTF杂项思路工具分享————2019/5/30
  7. Java内存通道
  8. Editor REST Client
  9. 第一章 Linux是什么
  10. C# WinfForm 控件之dev报表 XtraReport (四) 动态绑定主从关系表