Lucene基于IKAnalyzer配置的词典扩充
2024-08-24 21:48:51
在web项目的src目录下创建IKAnalyzer.cfg.xml文件,内容如下
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">
<properties> <comment>IK Analyzer 扩展配置</comment>
<!-- 用户可以在这里配置自己的扩展字典 -->
<entry key="ext_dict">use.dic.dic;googlepy.dic</entry>
<!-- 用户可以在这里配置自己的扩展停止词字典 -->
<entry key="ext_stopwords">dicdata/ext_stopword.dic</entry> </properties>
注意:
1. use.dic的格式是无BOM 的UTF-8 编码的中文文本文件,文件扩展名不限。词典中,每个中文词汇独立占一行,使用\r\n 的DOS 方式换行。(注,如果您不了解什么是无BOM 的UTF-8 格式, 请保证您的词典使用UTF-8 存储,并在文件的头部添加一空行)。您可以参考分词器源码org.wltea.analyzer.dic 包下的.dic 文件。
2. use.dic文件应部署在src中。(推荐同IKAnalyzer.cfg.xml 放在一起).
3.IKAnalyzer.cfg.xml中路径的写法:前面不能加/,否则是绝对路径。
http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html
http://blog.sina.com.cn/s/blog_4c9d7da201013wv2.html
http://www.itzhai.com/ikanalyzer-lucene-demo-performance-test.html#read-more
最新文章
- 【ios开发】使用自定义的TableViewCell
- CAGradientLayer的一些属性解析
- ORA-06519: active autonomous transaction detected and rolled back
- firefox浏览器不能使用window.close的解决方案
- oracle数据库备份
- java File.mkdirs和mkdir区别
- 遍历Dataset并输出数据实例
- opencv + numpy for python
- 预定义异常 - PHP手册笔记
- HDU2276 - Kiki &;amp; Little Kiki 2(矩阵高速幂)
- Nubia Z5S 官方4.4 201内測版 内核版本号信息
- Another Eight Puzzle
- OOP面向对象程序设计
- mysql的学习笔记(九)
- C# 之 下载EXCEL文件,自动用迅雷下载aspx
- dedecmsv5.7 ueditor编辑器上传视频/修改,视频显示空白,解决方案
- Reasoning With Neural Tensor Networks For Knowledge Base Completion-paper
- 用Python做股市数据分析(一)
- HTML —— 小记
- dp专题练习
热门文章
- netlink+netfilter
- iOS Bluetooth Reconnect
- 使用AnkhSvn-2.5.12478.msi管理vs2013代码的工具安装步骤使用
- 【分享】生成Revit扩展的addin文件小工具
- FTP上传文件夹
- [转]强悍的跨平台开源多媒体中心XBMC介绍
- [小技巧]让你的GridView支持IQueryable,并自动实现真分页
- [原]Java修炼 之 基础篇(一)Java语言特性
- Android -- Home按键
- IOS用CGContextRef画各种图形(文字、圆、直线、弧线、矩形、扇形、椭圆、三角形、圆角矩形、贝塞尔曲线、图片)