Solr中提供了MoreLikeThis的功能,用于查询相似的文档 。应用场景(个人理解):1. 你写的文章和别人文章相似度高的话,有一方是抄袭的可能性就很大。2. 查找相似的产品。

MoreLikeThis 可以作为searchComponent使用,也可以作为requestHandler使用。

MoreLikeThis 的基础属性:

参数 描述
mlt.fl 指定用于判断是否相似的字段。如可能,尽量设置这些字段的 termVectors=true
mlt.mintf 指定最小的分词频率。小于此频率的分词将不会被计算在内
mlt.mindf 指定最小的文档频率。分词所在文档的个数小于此值的话将不会被忽略。
mlt.maxdf 指定最大的文档频率。分词所在文档的个数大于此值的话将不会被忽略。比如“的”之类的词,几乎每个文档都有,此类分词不应用于相似度的计算
mlt.minwl 指定分词的最小长度。小于此长度的单词将被忽略。
mlt.maxwl 指定分词的最大长度。大于此长度的单词将被忽略。
mlt.maxqt 指定最大的用于查询的分词数
mlt.maxntp 对于termVectors=false的字段,需要分析的最大的token数。
mlt.boost 是否开启字段加权功能
mlt.qf 设置 mlt.fl中的各个字段的权重。

MoreLikeThis 做为searchComponent 使用时的属性:

参数 描述
mlt 设置为true时,启用MoreLikeThis的功能
mlt.count 默认值5. 设置返回的相似的文档数

MoreLikeThis 做为requestHandler 使用时的属性:

参数 描述
mlt.match.include 设置是否返回符合的文档。醉了,如果不返回的话,我配置这个requestHandler干嘛?
mlt.match.offset  
mlt.interestingTerms 控制如何呈现terms. 三个可选的值:none(不显示), list(列出terms), details(列出terms并加上权重信息)

例子:

<requestHandler name="/mlt" class="solr.MoreLikeThisHandler">
<lst name="defaults">
<str name="wt">json</str>
<str name="fl">content,title</str>
<str name="mlt.qf">
content^2.0 title^1.0
</str>
<str name="mlt.fl">content,title</str>
<str name="mlt.match.include">true</str>
<str name="mlt.mintf">1</str>
<str name="mlt.mindf">1</str>
<str name="mlt.minwl">2</str>
<int name="mlt.count">3</int>
</lst> </requestHandler>

最新文章

  1. Python基础知识整理
  2. No space left on device 解决Linux系统磁盘空间满的办法
  3. android 常用类
  4. ajax:post 400错误
  5. React Native入门教程 3 -- Flex布局
  6. &lt;realsense D400&gt;同步采集深度图和彩色图
  7. mysql存储过程变量的拼接
  8. SpringAOP+注解实现简单的日志管理
  9. Git学习笔记一《版本控制之道-使用Git》
  10. AJAX请求状态码返回200却跳到error的function
  11. 20155227《网络对抗》Exp2 后门原理与实践
  12. swap file &quot;*.swp&quot; already exists!
  13. linux命令总结之state命令
  14. Android中Intent的显示和隐式使用
  15. django 文档
  16. mysql时间统计,查询月份,周数据
  17. Mysql的TIMESTAMPDIFF和TIMESTAMPADD的用法
  18. day 22 内置的模块
  19. IntelliJ IDEA for MAC 注释模板、快捷键生成注释
  20. 关于Linux环境变量DISPLAY的设置

热门文章

  1. ALV TREE 实例
  2. (*)(转)要快速学习SSM框架,你需要一套学习曲线平滑的教程
  3. hashMap的线程不安全
  4. IIS 7.5 虚拟主机独立用户的配置.
  5. Linux2.4文件系统中vfsmount、安装点的dentry、设备的dentry之间的关系【转】
  6. Contiki 2.7 Makefile 文件(六)
  7. [干货]兼容HTML5的Placeholder属性-更新版v0.10102013
  8. 灰色大气企业html5模板
  9. Android窗口系统第一篇---Window的类型与Z-Order确定
  10. linux标准输入输出与重定向