import pysparnn.cluster_index as ci
from sklearn.feature_extraction.text import TfidfVectorizer data = [
"hello world",
"oh hello there",
"Play it",
"Play it again Sam",
] tv = TfidfVectorizer()
tv.fit(data)
#特征向量
features_vec = tv.transform(data) #建立搜索索引
cp = ci.MultiClusterIndex(features_vec,data) #搜索带有索引的
search_data = [
"oh there",
"Play it again Frank"
] search_feature_vec = tv.transform(search_data) #k是返回的个数,k_clusters代表聚类的个数
print(cp.search(search_feature_vec,k = 1,k_clusters=2,return_distance=False)) [['oh hello there'], ['Play it again Sam']]

  

最新文章

  1. Nagios
  2. linux svn 服务端搭建
  3. (转载)(收藏)Awk学习详细文档
  4. JavaScript学习笔记- 省市级联效果
  5. asp.net mvc 简单文件下载
  6. 获得省市 json 后台代码
  7. 近期Windows 10 RedStone 2 Insider版本安装进度停留在百分之23、24解决方案
  8. AS3垃圾回收整理
  9. typedef struct
  10. Linux 安装SVN服务器 (转)
  11. ovs+dpdk numa感知特性验证
  12. Knowledge_SPA——精研查找算法
  13. Java Web项目(Extjs)报错六
  14. 《深入分析Java web技术内幕》读书笔记(一)
  15. webapp检测安卓app是否安装并launch
  16. Spring定时服务QuartZ
  17. HDU - 1716 排列2 水题
  18. C#委托和事件详解
  19. 钉钉机器人集成Jenkins推送消息模板自定义发送报告
  20. 【BZOJ 1129】[POI2008]Per 二叉堆

热门文章

  1. linux-aapt文件调用问题
  2. Gin框架系列02:路由与参数
  3. nginx 安装教程
  4. 三层架构之UI层
  5. 【Java技术系列】爱情36技之记忆永存
  6. 新建基于STM32F103ZET6的工程-HAL库版本
  7. python编程心得(1)
  8. PTA数据结构与算法题目集(中文) 7-27
  9. 一篇blog带你了解java中的锁
  10. 关于Git我们不得不知道的事(一)