Solr7.x学习(3)-创建core并使用分词器
2024-08-23 22:11:48
1、创建core文件夹
ck /usr/local/solr-7.7.2/server/solr
mkdir first_core
cp -r configsets/_default/* first_core/
chown -R solr:solr first_core
2、添加core
3、配置中文IK分词器
参考:https://github.com/magese/ik-analyzer-solr
1)将ik-analyzer-7.7.1.jar复制到solr-7.7.2/server/solr-webapp/webapp/WEB-INF/lib目录下
2)将https://github.com/magese/ik-analyzer-solr/tree/v7.7.1/src/main/resources目录下的dynamicdic.txt、ext.dic、ik.conf、IKAnalyzer.cfg.xml、stopword.dic文件复制到solr-7.7.2/server/solr-webapp/webapp/WEB-INF/classes目录下。
3)修改managed-schema,添加配置:
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
4)重启solr服务,测试IK分词器
4、使用solr自带的smart中文分词器
1)复制solr-7.7.2\contrib\analysis-extras\lucene-libs\lucene-analyzers-smartcn-7.7.2.jar到solr-7.7.2/server/solr-webapp/webapp/WEB-INF/lib目录下
2)修改managed-schema文件,增加配置
<fieldType name="text_smart" class="solr.TextField" positionIncrementGap="100">
<analyzer type="index">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.apache.lucene.analysis.cn.smart.HMMChineseTokenizerFactory"/>
</analyzer>
</fieldType>
3)重启solr,测试smart分词器
最新文章
- linux脚本编程技术
- ubuntu下读取数据库中文乱码解决
- JS 实现新浪微博, QQZone 等的分享
- java.net.SocketException: Too many open files
- 0-N背包为题(动态规划算法)
- MongoDB的分组统计 group
- POJ 3440 Coin Toss(求概率)
- js获取上传文件内容(未完待续)
- KEIL、uVision、RealView、MDK、KEIL C51区别比较
- HDU 1248 冰封王座(dp)
- gettimeofday(struct timeval *tv, struct timezone *tz)函数
- JDBC--手动开启Connection事务
- HDU 1008 u Calculate e
- 关于bootstrap的modal弹出层嵌套子Modal所引发的血案(转)
- EF异常探究(An entity object cannot be referenced by multiple instances of IEntityChangeTracker.)
- QQ音乐API-借他人之力实现我的音乐盒
- 用greenlet实现Python中的并发
- seaborn使用(绘图函数)
- Mint-UI组件 MessageBox为prompt 添加判断条件
- sjms-4 行为型模式