pysparnn 模块使用,相似句子召回
2024-09-07 13:29:26
import pysparnn.cluster_index as ci
from sklearn.feature_extraction.text import TfidfVectorizer data = [
"hello world",
"oh hello there",
"Play it",
"Play it again Sam",
] tv = TfidfVectorizer()
tv.fit(data)
#特征向量
features_vec = tv.transform(data) #建立搜索索引
cp = ci.MultiClusterIndex(features_vec,data) #搜索带有索引的
search_data = [
"oh there",
"Play it again Frank"
] search_feature_vec = tv.transform(search_data) #k是返回的个数,k_clusters代表聚类的个数
print(cp.search(search_feature_vec,k = 1,k_clusters=2,return_distance=False)) [['oh hello there'], ['Play it again Sam']]
最新文章
- Nagios
- linux svn 服务端搭建
- (转载)(收藏)Awk学习详细文档
- JavaScript学习笔记- 省市级联效果
- asp.net mvc 简单文件下载
- 获得省市 json 后台代码
- 近期Windows 10 RedStone 2 Insider版本安装进度停留在百分之23、24解决方案
- AS3垃圾回收整理
- typedef struct
- Linux 安装SVN服务器 (转)
- ovs+dpdk numa感知特性验证
- Knowledge_SPA——精研查找算法
- Java Web项目(Extjs)报错六
- 《深入分析Java web技术内幕》读书笔记(一)
- webapp检测安卓app是否安装并launch
- Spring定时服务QuartZ
- HDU - 1716 排列2 水题
- C#委托和事件详解
- 钉钉机器人集成Jenkins推送消息模板自定义发送报告
- 【BZOJ 1129】[POI2008]Per 二叉堆