Solr+ik分词支持特殊符号分词
2024-10-20 13:33:08
在工具类(CharacterUtil.java)里,找到方法 identifyCharType,加入以下代码:
} else if (ub == Character.UnicodeBlock.GREEK // 希腊符号
// 希腊扩展符号
|| ub == Character.UnicodeBlock.GREEK_EXTENDED
// 拉丁字符
|| ub == Character.UnicodeBlock.BASIC_LATIN
// 拉丁补充字符
|| ub == Character.UnicodeBlock.LATIN_1_SUPPLEMENT
// 拉丁扩展A字符
|| ub == Character.UnicodeBlock.LATIN_EXTENDED_A
// 拉丁扩展B字符
|| ub == Character.UnicodeBlock.LATIN_EXTENDED_B) {
return CHAR_CHINESE; }
原理很简单,把特殊符号当作中文处理。
不想改代码的,可以直接下载:
最新文章
- JavaScript将字符串中的每一个单词的第一个字母变为大写其余均为小写
- runtime-给系统已有类添加属性
- opencv计算运行时间
- MySQL数据库索引的设计原则
- yum命令详解
- Mysql创建用户的三种基本方法
- javascript数组浅谈1
- php部分---函数、四类常用函数、例子(下拉菜单添加内容);
- Microsoft SQL Server 数据库 错误号大全
- fedora 安装pylab 并简单绘制三角函数
- Redis(四)-持久化
- java 规则引擎资料汇集
- Linux 下安装mysql 5.7
- C语言100个经典的算法
- centos7目录统计之du命令
- 解决ConfigParser配置option的大小写问题
- php大流量高并发解决方案
- 隐藏windows任务栏中的窗口显示
- 使用Fiddler后谷歌浏览器访问https不安全
- 使用RAID与LVM磁盘阵列技术。