前言

前一段时间,公司网站做站内搜索,只简单针对输入的文字进行搜索,作全匹配检索,搜索出来的内容很少。如何达到模糊搜索,匹配到更多的内容成了需要解决的问题。于是,今天想到可以做分词检索,如何对输入的一段文字进行分词就是关键,本着不做轮子的想法网上找找,还真有一些分词方案scws中文分词

正文

1.引入PSCWS4文件包和XDB词典文件(utf-8),放进Vendor文件夹:

2.通过PSCWS4工具类进行分词操作:

    //搜索页面
public function searched($keyword,$type=0,$page=1){
$keyword = rawurldecode($keyword);
Vendor('scws.pscws4');
$pscws = new \PSCWS4();
$pscws->set_dict(VENDOR_PATH.'scws/lib/dict.utf8.xdb');
$pscws->set_rule(VENDOR_PATH.'scws/lib/rules.utf8.ini');
//$keywords='第三方中文分词';
$pscws->set_ignore(true);
$pscws->send_text($keyword);
$words = $pscws->get_tops(5);
$tags = array();
foreach ($words as $val) {
$tags[] = $val['word'];
}
$pscws->close();
}

其中,$tag就是所得的分词。

最新文章

  1. 关于java中多态的理解
  2. ionic2 图片上传
  3. Redis内存使用优化与存储
  4. MVC Cookie的使用
  5. Windows系统小知识
  6. 【Beta】第二次任务发布
  7. JQuery------如何判断当前点击的是否是哪个类
  8. 循序渐进Python3(七) --1-- 面向对象
  9. suse linux修改hostname
  10. Android网络框架Volley(实战篇)
  11. 微博广告推荐中有关Hadoop的那些事
  12. [转]ANDROID 探究oom内幕
  13. 使用moment.js轻松管理日期和时间
  14. 2018蓝桥杯 省赛B题(明码)
  15. Python算法之二分查找法
  16. array_multisort以及php中的排序函数
  17. 计蒜客 31447 - Fantastic Graph - [有源汇上下界可行流][2018ICPC沈阳网络预赛F题]
  18. wf4 FlowChart 理解
  19. 如何重启 Windows 10 子系统(WSL) ubuntu
  20. 在Eclipse中执行、配置Hadoop

热门文章

  1. 洛谷oj U3936(分成回文串) 邀请码:a0c9
  2. 微信小程序入门学习-- 简易Demo:计算器
  3. 【IDEA】安装Jrebel插件:JRebel6.4.3+破解补丁
  4. js实现查询关键词,使其高亮
  5. Oracle的服务介绍以及正常运行必须启动的服务
  6. ArcGIS runtime for wpf 部署
  7. centos7 docker镜像加速器配置
  8. 【我的Android进阶之旅】 高效的设计稿标注及测量工具Markman介绍
  9. Android ViewGroup onInterceptTouchEvent
  10. 通信—HTTP与HTTPS