ThinkPHP3.2.3扩展之自动分词获取关键字
2024-08-31 04:46:45
ThinkPHP自动获取关键词调用在线discuz词库
先按照下图路径放好插件
/**
* 自动获取关键词(调用第三方插件)
* @return [type] [description]
* www.shouce.ren
*/
public function keyword()
{
Vendor('autokeyword.AutoKeyword');
$keyword = new \AutoKeyword();
$str='自动获取关键词并发大数据我们大家好吃饭啦调用第三方插件';
$title = trim($str);
$keys=$keyword::discuz($title);
var_dump($keys);
}
插件源码:
AutoKeyword.php
<?php /**
* 分词
* @author zhao jinhan <326196998@qq.com>
*
*/
class AutoKeyword
{ /**
* 使用discuz词库
* @param unknown_type $title
* @param unknown_type $content
*/
public static function discuz ($title = '', $content = '')
{
$subjectenc = rawurlencode(strip_tags($title));
$messageenc = rawurlencode(strip_tags(preg_replace("/\[.+?\]/U", '', $content)));
$data = @implode('', file("http://keyword.discuz.com/related_kw.html?title=$subjectenc&content=$messageenc&ics=utf-8&ocs=utf-8")); if ($data) {
$parser = xml_parser_create();
xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
xml_parse_into_struct($parser, $data, $values, $index);
xml_parser_free($parser);
$kws = array ();
foreach ($values as $valuearray) {
if ($valuearray['tag'] == 'kw' || $valuearray['tag'] == 'ekw')
$kws[] = trim($valuearray['value']);
}
// $return = '';
// $dot='';
// if ($kws) {
// foreach ($kws as $kw) {
// $kw = CHtml::encode(strip_tags($kw));
// $return .= $dot.$kw ;
// $dot = ',';
// }
// $return = trim($return);
// } return $kws;
} }
/**
* 简易自定义获取关键词
* @param string $title
* @param string $content
* @return JSON
*/
public static function simple($title = '', $content=''){
$words = include_once dirname(__FILE__).DIRECTORY_SEPARATOR.'words.php';
$data = array();
$max = 10; //最多匹配10个
if($words){
foreach((array)$words as $word){
if(count($data) > $max){
break;
}else{
if($title && preg_match('/'.$word.'/is', $title)){
array_push($data, $word);
}
if($content && preg_match('/'.$word.'/is', $content)){
if(!in_array($word, $data)){
array_push($data, $word);
}
}
}
}
}
return array_unique($data);
} }
word.php
<?php
/**
* 词库(权重越高越靠前)
*/
return array(
'php',
'mysql',
'web',
'html',
'js',
'jquery',
'sql',
'myisam',
'innodb',
'apache',
'nginx',
'yii',
'linux',
'cms',
'yiifcms',
'redis',
'memcache',
'explain',
'ueditor',
'kindeditor',
'api',
'w3c',
'高性能',
'大数据',
'存储过程',
'事物',
'触发器',
'索引',
'并发',
'编程',
'算法',
'排序',
'安装包',
'下载',
'服务器',
'手册',
'指南',
'文章',
'图集',
);
最新文章
- 在代码设置RelativeLayout的属性,比如layout_below
- SharePoint 2010 站点附加数据升级到SP2013
- MyEclipse转换Eclipse项目无法启动问题(转)
- discuz函数解析--写日志
- JVM-对象
- 去ECSHOP版权,去官方后门
- [Bootstrap] 5. Button and well
- Linux&;shell 之Shell命令进阶
- 谷歌Dremel即时数据分析解决方案
- Python 对象引用、可变性和垃圾回收
- iOS 获取当前应用的信息以及用户信息:版本号手机号手机型号
- 你可能需要为你的 APP 适配 iOS 11
- ie11的版本判断
- 我的github地址 https://github.com/1010de/Test.git
- sap 最新财报以及云业务转型情况
- 使用sys用户创建其他用户下的dblink
- The Gene of Bitizens
- Generalized Linear Models
- HDCMS留言插件的使用!
- 秒杀多线程之CyclicBarrier