协调节点默认使用文档 ID 参与计算(也支持通过 routing),以便为路由提供合适的分片。

shard = hash(document_id) % (num_of_primary_shards)

1、当分片所在的节点接收到来自协调节点的请求后,会将请求写入到 Memory

Buffer,然后定时(默认是每隔 1 秒)写入到 Filesystem Cache,这个从 Momery

Buffer 到 Filesystem Cache 的过程就叫做 refresh;

2、当然在某些情况下,存在 Momery Buffer 和 Filesystem Cache 的数据可能会

丢失,ES 是通过 translog 的机制来保证数据的可靠性的。其实现机制是接收到请

求后,同时也会写入到 translog 中,当 Filesystem cache 中的数据写入到磁盘中

时,才会清除掉,这个过程叫做 flush;

3、在 flush 过程中,内存中的缓冲将被清除,内容被写入一个新段,段的 fsync

将创建一个新的提交点,并将内容刷新到磁盘,旧的 translog 将被删除并开始一

个新的 translog。

4、flush 触发的时机是定时触发(默认 30 分钟)或者 translog 变得太大(默认

为 512M)时;

补充:关于 Lucene 的 Segement:

1、Lucene 索引是由多个段组成,段本身是一个功能齐全的倒排索引。

2、段是不可变的,允许 Lucene 将新的文档增量地添加到索引中,而不用从头重

建索引。

3、对于每一个搜索请求而言,索引中的所有段都会被搜索,并且每个段会消耗

CPU 的时钟周、文件句柄和内存。这意味着段的数量越多,搜索性能会越低。

4、为了解决这个问题,Elasticsearch 会合并小段到一个较大的段,提交新的合并段到磁盘,并删除那些旧的小段。

最新文章

  1. MySql Access denied for user 'root'@'localhost' (using password:YES) 解决方案
  2. APUE学习之三个特殊位 设置用户ID(set-user-ID),设置组ID(set-group-ID),sticky
  3. linux常用命令之文件权限
  4. 初探psutil
  5. Poisson回归模型
  6. Myeclipse2014添加mybatis generator插件
  7. 安卓服务(Service)的两种开启方式以及服务的生命周期
  8. Bootstrap之Button.js
  9. java udp (使用类调用双通信)1
  10. 1635: [Usaco2007 Jan]Tallest Cow 最高的牛
  11. 读懂源码:一步一步实现一个 Vue
  12. Notepad++ 使用探索
  13. Linux基础优化与安全归纳总结
  14. pip install PIL The _imagingft C module is not installed
  15. java 面试题2
  16. XLMHttpRequest对象的status属性,readyState属性以及onreadystatechange事件
  17. Java操作MongoDB:连接&增&删&改&查
  18. 创建http.Server实例,端口占用就换个端口
  19. framework中编译anroid工程并在模拟器上运行
  20. C++之初体验

热门文章

  1. [GAMEDEV] 个人开发如何找到合适的图片素材?
  2. 批量自动化配置Dell服务器idrac管理口IP
  3. python+pytest(2)-HTTP协议基础
  4. windows系统如何远程桌面连接
  5. ts转js运行报错:“tsc : 无法加载文件
  6. GAN实战笔记——第六章渐进式增长生成对抗网络(PGGAN)
  7. MySql日常解决错误
  8. LeetCode-004-寻找两个正序数组的中位数
  9. LeetCode-092-反转链表 II
  10. oracle 中的decode函数