Neo4j 3.5发布,在索引方面大幅增强
<p class="md-end-block md-focus" contenteditable="true"><span class="md-expand">Neo4j 3.5版本已正式发布,这也是Neo4j宣布企业版闭源以来发布的第一个版本。</span></p>
这个版本在性能、资源使用率以及安全方面均有增强,我们可以先快速浏览一下这个版本:
全文索引
基于Index的快速排序
Go语言Driver
内置索引完善,性能有5X提升
将Transaction State移到Off heap区
接下来的内容,将重点探讨Neo4j的索引能力,Neo4j索引包含两大部分:
Neo4j的内置索引能力
基于Lucene的全文索引
Neo4j内置索引
基于单个Property构建的索引
创建单个Property索引的语法举例如下(本文范畴内的例子均来自Neo4j Document,见本文末尾的引用信息):
CREATE INDEX ON :Person(firstname)
如果一个Node拥有Label(“Person”),且同时拥有Property(“firstname”),那么这个Node将被添加到这个Index中。
基于多个Property构建的组合索引
创建两个Property组合索引的语法举例如下:
CREATE INDEX ON :Person(age, country)
如果一个Node拥有Label(“Person”),且同时拥有两个Property(“age”)与Property(“country”),那么这个Node将被添加到这个Index中。
例如:
NodeA: (a:Person {firstname: ‘Bill’, age: 34, country: ‘USA’})
NodeB: (b:Person {firstname: ‘Sue’, age: 39})
这个索引索引将包含NodeA但不包含NodeB,因NodeB缺乏Property(“country”)。
在查询中发挥的作用
假设系统中已经基于Person(firstname)创建了一个索引,对于如下查询:
MATCH (person:Person)
WHERE person.firstname = 'Andy'
RETURN person
基于这个索引,可以快速命中结果记录。
同样,如下两种查询也是可以基于这个索引进行的:
MATCH (person:Person)
WHERE person.firstname > 'B'
RETURN person
MATCH (person:Person)
WHERE person.firstname IN ['Andy', 'John']
RETURN person
对于组合索引,如果所关联的所有的Property都在查询条件中以Equal条件出现,则能起到最显著的加速作用。
全文索引
无论是Node还是Relationships的Property,都可能包含复杂的描述信息,基于这些信息的全文检索,则是一个关键需求。
Neo4j的全文索引能力是基于Apache Lucene实现:
既可以索引Nodes,也可以索引Relationships。
索引的创建,删除与更新均为事务性操作。
定制了Analyzer。
在Cypher中支持Lucene查询语法。
支持返回查询结果的Scoring信息。
索引可基于Node/Relationship的变化而自动更新。
可以基于Cypher Procedures进行访问。
可配置的数据一致性模型。
提供了数据与索引的一致性检查工具,并支持索引重建
下面我们给出一个创建索引,写数据以及查询的样例:
索引创建
CALL db.index.fulltext.createNodeIndex("titlesAndDescriptions",["Movie", "Book"],["title", "description"])
为Label名称为”Movie“以及”Book“的Nodes的Property(“title”)及Property(“description”)创建全文索引,索引名称为”titlesAndDescriptions“。
写数据
假设写入如下一条记录:
CREATE (m:Movie { title: "The Matrix" })
RETURN m.title
这条记录包含Label(“Movie”)并且包含了Property(“title”),因此,会被增加到索引”titlesAndDescriptions”中。
查询
CALL db.index.fulltext.queryNodes("titlesAndDescriptions", "matrix") YIELD node, score
RETURN node.title, node.description, score
这个查询中指定了返回score信息。查询结果如下所示:
因为这个Node的title信息中包含了关键词”matrix”,所以与查询条件相匹配。
总结
本文讲解了Neo4j的内置索引以及基于Lucene的全文索引能力,放眼整个数据库的角度,这些索引的实现并无亮点之处,但它们却很好的丰富了Neo4j所支持的查询类型。从整个NoSQL生态来看,索引能力支持力度参差不齐,但索引方面的增强,都是未来关键的发力方向。
参考信息
Graph Modeling Tips, Full-Text Search Preview, Building a Graph App
原文地址:http://www.nosqlnotes.com/technotes/graphdb/neo4j-index/
</div>
最新文章
- 用Vagrant和Ansible搭建持续交付平台
- hibernate中表关系为多对多时,如何只删除中间表数据
- 详解CSS中clear属性both、left、right值的含义
- 跟随标准与Webkit源码探究DOM -- 获取元素之getElementsByClassName
- Java GUI 画点
- Git配置安装使用教程操作github上传克隆数据
- UVa 10034 - Freckles
- 用css控制字数,多余的用省略号代替
- Error 1313: RETURN is only allowed in a FUNCTION SQL Statement
- Spark:scala集合转化为DS/DF
- Java虚拟机三:OutOfMemoryError异常分析
- winform 跨线程访问问题
- 平滑升级nginx到新版本
- 项目thymeleaf
- SpringBoot系列: Java应用程序传参和SpringBoot参数文件
- Trident的过滤操作
- u-boot移植(十三)---代码修改---支持文件系统及补丁制作
- python-flask-Flask-SQLAlchemy与Flask-Migrate联合进行数据化迁移
- Spring Cloud Eureka Server使用(注册中心)
- PAT 1012 数字分类 (20)(代码+测试点)