ThinkPHP3.2添加scws中文分词
2024-10-19 12:02:39
前言
前一段时间,公司网站做站内搜索,只简单针对输入的文字进行搜索,作全匹配检索,搜索出来的内容很少。如何达到模糊搜索,匹配到更多的内容成了需要解决的问题。于是,今天想到可以做分词检索,如何对输入的一段文字进行分词就是关键,本着不做轮子的想法网上找找,还真有一些分词方案scws中文分词。
正文
1.引入PSCWS4文件包和XDB词典文件(utf-8),放进Vendor文件夹:
2.通过PSCWS4工具类进行分词操作:
//搜索页面
public function searched($keyword,$type=0,$page=1){
$keyword = rawurldecode($keyword);
Vendor('scws.pscws4');
$pscws = new \PSCWS4();
$pscws->set_dict(VENDOR_PATH.'scws/lib/dict.utf8.xdb');
$pscws->set_rule(VENDOR_PATH.'scws/lib/rules.utf8.ini');
//$keywords='第三方中文分词';
$pscws->set_ignore(true);
$pscws->send_text($keyword);
$words = $pscws->get_tops(5);
$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
$pscws->close();
}
其中,$tag就是所得的分词。
最新文章
- 关于java中多态的理解
- ionic2 图片上传
- Redis内存使用优化与存储
- MVC Cookie的使用
- Windows系统小知识
- 【Beta】第二次任务发布
- JQuery------如何判断当前点击的是否是哪个类
- 循序渐进Python3(七) --1-- 面向对象
- suse linux修改hostname
- Android网络框架Volley(实战篇)
- 微博广告推荐中有关Hadoop的那些事
- [转]ANDROID 探究oom内幕
- 使用moment.js轻松管理日期和时间
- 2018蓝桥杯 省赛B题(明码)
- Python算法之二分查找法
- array_multisort以及php中的排序函数
- 计蒜客 31447 - Fantastic Graph - [有源汇上下界可行流][2018ICPC沈阳网络预赛F题]
- wf4 FlowChart 理解
- 如何重启 Windows 10 子系统(WSL) ubuntu
- 在Eclipse中执行、配置Hadoop