.pcb{margin-right:0}


问题导读

1.Elasticsearch&Kibana 7.哪些需要修改?

2.Elasticsearch7 有哪些新特性?

3.Elasticsearch 7升级有哪些注意事项?





Elastic{ON}北京分享了Elasticsearch7.0在Speed,Scale,Relevance等方面的很多新特性。





1、Elasticsearch&Kibana 7.部署体验

1.1 Elasticsearch 7.0 默认自带 JDK



不用再为安装什么版本的 JDK和环境冲突而苦恼了,下载安装即可使用。



对比可知,包大了200MB+,正是JDK的大小。

1.png (44.08 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:46 上传

1.2 默认节点名称为主机名。

1.png (69.38 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:47 上传

不过仍然可以在elasticsearch.yml中显式配置。



实际业务场景中,以主机名区分不同节点比随机起名字更便于甄别,不易混淆。





1.3 默认分片数改为1,不再是5。

微信图片_20190414094627.png (17.25 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:47 上传

1.4 Elasticsearch 7.0 没有 Type 了,包括 API 层面的。



如下所示,确切的说,正确的使用方法,使用默认的_doc作为type就可以了。

type会在8.X版本彻底移除。

微信图片_20190414094743.jpg (44.27 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:49 上传

1.5 hits.total返回对象,而非仅结果值



现在,与搜索请求匹配的总命中数将作为具有值和关系的对象返回。

value表示匹配的匹配数,



关系表示值是准确的(eq)还是非准确的(gte)。

微信图片_20190414094816.png (15.11 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:49 上传

1.6 Kibana 支持全局开启“黑暗”模式



用户可以选择打开主题:Kibana->高级设置->dark Mode,而不是必须在很多地方打开黑暗模式,它将适用于所有应用程序。

微信图片_20190414094849.png (22.24 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:50 上传

微信图片_20190414094908.jpg (54.32 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:50 上传

2、Elasticsearch7 革命性更新

2.1 查询相关性速度优化



Weak-AND算法在Term Query查询场景有3700%的性能提升。



如下所示,除了Term检索,Fuzzy,Phrase, Bool And .Bool OR都有大幅的性能提升!

微信图片_20190414094947.jpg (51.16 KB, 下载次数: 0)

下载附件

保存到相册

2019-4-14 09:51 上传

啥是weak-and算法?

核心原理:取TOP N结果集,估算命中记录数。

简单来说,一般我们在计算文本相关性的时候,会通过倒排索引的方式进行查询,通过倒排索引已经要比全量遍历节约大量时间,但是有时候仍然很慢。



原因是很多时候我们其实只是想要top n个结果,一些结果明显较差的也进行了复杂的相关性计算,



而weak-and算法通过计算每个词的贡献上限来估计文档的相关性上限,从而建立一个阈值对倒排中的结果进行减枝,从而得到提速的效果。

2.2 间隔查询(Intervals queries)



某些搜索用例(例如,法律和专利搜索)引入了查找单词或短语彼此相距一定距离的记录的需要。



Elasticsearch 7.0中的间隔查询引入了一种构建此类查询的全新方式,与之前的方法(跨度查询span queries)相比,使用和定义更加简单。



与跨度查询相比,间隔查询对边缘情况的适应性更强。



2.3 引入新的集群协调子系统

移除 minimum_master_nodes 参数,让 Elasticsearch 自己选择可以形成仲裁的节点。



典型的主节点选举现在只需要很短的时间就可以完成。

集群的伸缩变得更安全、更容易,并且可能造成丢失数据的系统配置选项更少了。



节点更清楚地记录它们的状态,有助于诊断为什么它们不能加入集群或为什么无法选举出主节点。

2.4 升级 Elasticsearch 7,0 ,不再内存溢出



新的 Circuit Breaker 在JVM 堆栈层面监测内存使用,Elasticsearch 比之前更加健壮。



设置indices.breaker.fielddata.limit的默认值已从JVM堆大小的60%降低到40%。



2.5 时间戳纳秒级支持,提升数据精度



利用纳秒精度支持加强时间序列用例



到目前为止,Elasticsearch仅以毫秒精度存储时间戳。 7.0增加了几个零并带来了纳秒精度,这提高了高频数据采集用户存储和排序所需数据的精度。



显然,7.0的特性远不止这些,更多新版本特性推荐阅读:



http://t.cn/EXyStrW



http://t.cn/EXyStrO





3、Elasticsearch 7升级注意事项



3.0 升级前必知必会



查看新版本的重大更改特性,并对7.0.0的代码和配置进行必要的更改。



如果您使用自定义插件,请确保兼容版本可用。



在升级生产集群之前,在开发环境中测试升级。



备份您的数据! 您必须拥有数据快照才能回滚到早期版本。





3.1 升级API



Rolling upgrade ——滚动升级允许Elasticsearch集群一次升级一个节点,升级不会中断服务。



不支持在升级期间在同一群集中运行多个版本的Elasticsearch,因为无法将已升级的节点复制到运行旧版本的节点。



3.2 版本升级路线



小版本之间升级:举例:5.4.1升级到5.6



平滑升级——从5.6版本到6.7版本



平滑升级——从6.7版本到7.0.0版本



3.3 借助Reindex升级索引数据



Elasticsearch可以读取在先前主要版本中创建的索引。如果您在5.x或之前创建了索引,则必须在升级到7.0.0之前重新索引或删除它们。



如果存在不兼容的索引,Elasticsearch节点将无法启动。



3.4 ELK Stack要一起升级



升级到新版本的Elasticsearch时,需要升级Elastic Stack中的每个产品。



3.5 6.6或更早版本集群,需要先关闭



要从6.6或更早版本直接升级到7.0.0,必须关闭群集,安装7.0.0并重新启动。



3.6 切记,7.0+版本`无type`的索引结构。



这点,如果考虑未来更新版本,在6.X或者更早版本的项目中,就严格按照7.x规范走,这样升级会相对比较省事。





4. 新版本的变



4.1实际上,高版本较低版本,主要在性能上的提升和部分新功能点的实现。



新版本更高效。

比如:6.6+提出的ilm索引生命周期管理,你如果关注Elastic Meetup的话,印象ebay和阿里还有其他公司自己就实现过类似功能。



原有版本有类似的功能,只不过是非常、非常麻烦、繁琐,所以,才有了ilm的诞生。



新版本迎合了市场的需求。

比如:7.0的黑暗模式,实际在grafana或类似竞品BI中都有类似的功能,猜测Kibana升级一方面是用户需求,另一方面也是竞品分析的结果。



新版本性能极大提升。

比如:7.0的terms融合新算法,有37倍的提升。



4.2 新版本的不变



《暗时间》作者刘未鹏说过“底层的技术永远不过时”。



不必说倒排索引机制不会变,也不必说Lucene的改动也相对较小。单是:ES的基础功能全文检索、多种聚合等几乎不会有太大的变动。







原文链接





转载地址:http://www.aboutyun.com/thread-27003-1-1.html
作者: 铭毅天下

最新文章

  1. 通过批处理来运行python程序
  2. Ubuntu环境下安装TinyOS系统
  3. 如何以nobody用户执行命令?
  4. 正则匹配<{$vcode}>变量
  5. 重新想象 Windows 8 Store Apps (56) - 系统 UI: Scale, Snap, Orientation, High Contrast 等
  6. how-to-install-hyper-v-on-a-virtual-machine-in-hyper-v.aspx
  7. Centering HTML elements larger than their parents
  8. ADB Offline
  9. [Oracle] - 性能优化工具(2) - ASH
  10. cocos2d-x中的Jni使用(C++与Andriod方法互调)
  11. AndroidStudio 更新gradle Error:Failed to complete Gradle execution. Cause: Connection reset
  12. 编译原理Tiny语言的定义
  13. PWM(脉宽调制)——LED特效呼吸灯设计
  14. WTL--SDI框架分析
  15. C#中消息的工作流程
  16. BZOJ 4282(慎二的随机数列
  17. 使用vue iview遇到的一些问题
  18. CentOS7安装maven3.6.1
  19. nginx中文乱码问题
  20. Maven核心概念

热门文章

  1. Maximal Rectangle [leetcode] 的三种思路
  2. jqm文件上传,上传图片,jqm的表单操作,jqm的ajax的使用,jqm文件操作大全,文件操作demo
  3. oc08--局部变量,全局变量,函数方法的区别
  4. 深度学习实战篇-基于RNN的中文分词探索
  5. [TB-Technology] 淘宝在数据处理领域的项目及开源产品介绍
  6. java基本数据类型(二)和分支结构
  7. Arduino-IIC-Wire.h
  8. BZOJ 2324 (有上下界的)费用流
  9. css中max-width和min-width的应用
  10. Bin文件