Lucene中有两种分页查询方式

1、一次查询出大量数据,然后根据页码定位是哪个文档,其实就是暴力获取了

2、通过调用searchAfter来实现

我们都知道collect是lucene中对搜索到的文档进行收集和排序过程,searchAfter也是通过一个收集器来控制的,叫PagingTopScoreDocCollector

 
PagingTopScoreDocCollector中最主要的方法是getLeafCollector()判断分页查询的代码为,collect中包含了判断视为当前页的结果还有结果排序,排序方法是pq.updateTop();
 

 
updateTop中就执行两部操作,在查询到结果中找到最小的,然后返回heap[1],i默认从1开始所以head【0】为空,所以返回heap[1],每次都会和heap[1]对比把最小的放在前面
 这是一个弄了一个二叉堆,具体分析的可以看http://quweiprotoss.blog.163.com/blog/static/408828832011523114133876/这个

当score分数一样的时候会对比文档大小,最后是按照文档id的大小进行排列的

 
说白了searchAfter也是全部搜索了一遍只不过在collect过程中添加了一个上一页最后doc和当前返回的doc对比,这个过程时间复杂度为o(n),而用普通的查询这个过程会没有从某种程度上来说兴许速度还会由于searchAfter

最新文章

  1. 记录下帮助一位网友解决的关于android子控件的onTouch或onClick和父OnTouch 冲突的问题。
  2. 关于Unity的网络框架
  3. 自定义UICollectinviewFlowLayout,即实现瀑布流
  4. Buffer Cache
  5. [css]《CSS知多少》
  6. 浏览器打开应用指定的界面-b
  7. 《Python爬虫学习系列教程》学习笔记
  8. HTML5它contenteditable属性
  9. 浅析如何在Nancy中生成API文档
  10. Python丨Python 性能分析大全
  11. eclipse中的System.getProperty("user.dir")
  12. SSM-Spring-09:Spring中jdk动态代理
  13. js 向上和向下取整
  14. mumu模拟器设置代理/打开网络连接(windows)
  15. POJ - 1062(昂贵的聘礼)(有限制的spfa最短路)
  16. swift - 3D 视图,截图,关键字搜索
  17. 给dede添加栏目图片和栏目描述
  18. 在NGUI中高效优化UIScrollView之UIWrapContent的简介以及使用
  19. 5.3.1 RPC端点RpcEndpoint
  20. Netty4.x中文教程系列(六) 从头开始Bootstrap

热门文章

  1. 基于PhantomJS的网页抓取及写入文件
  2. webpack和webpack-dev-server安装配置
  3. python使用scikit-learn计算TF-IDF
  4. ROS使用国内的DDNS服务
  5. Dynamics CRM 2011 权限管理
  6. python报头解决粘包简单实现
  7. 20165233 实验二 Java面向对象程序设计
  8. MPI 计时器函数 MPI_Wtime()
  9. VisualStudio2012轻松把JSON数据转换到POCO的代码(转)
  10. leetcode290