Elasticsearch基础入门，详情可见官方文档

索引文档：

对于员工目录，我们将做如下操作：

每个员工索引一个文档，文档包含该员工的所有信息。
每个文档都将是 employee 类型。
该类型位于索引 megacorp 内。
该索引保存在我们的 Elasticsearch 集群中。

实践中这非常简单（尽管看起来有很多步骤），我们可以通过一条命令完成所有这些动作：

PUT /megacorp/employee/

{

    "first_name" : "John",

    "last_name" :  "Smith",

    "age" :        ,

    "about" :      "I love to go rock climbing",

    "interests": [ "sports", "music" ]

}

注意，路径 /megacorp/employee/1 包含了三部分的信息：

megacorp 索引名称
employee 类型名称
1 特定雇员的ID

检索文档：

这在 Elasticsearch 中很简单。简单地执行一个 HTTP GET 请求并指定文档的地址——索引库、类型和ID。使用这三个信息可以返回原始的 JSON 文档：

GET /megacorp/employee/

返回结果包含了文档的一些元数据，以及 _source 属性，内容是 John Smith 雇员的原始 JSON 文档：

{

  "_index" :   "megacorp",

  "_type" :    "employee",

  "_id" :      "",

  "_version" : ,

  "found" :    true,

  "_source" :  {

      "first_name" :  "John",

      "last_name" :   "Smith",

      "age" :         ,

      "about" :       "I love to go rock climbing",

      "interests":  [ "sports", "music" ]

  }

}

轻量搜索：

GET /megacorp/employee/_search

可以看到，我们仍然使用索引库 megacorp 以及类型 employee`，但与指定一个文档 ID 不同，这次使用 `_search 。返回结果包括了所有三个文档，放在数组 hits 中。一个搜索默认返回十条结果。

{

   "took":      ,

   "timed_out": false,

   "_shards": { ... },

   "hits": {

      "total":      ,

      "max_score":  ,

      "hits": [

         {

            "_index":         "megacorp",

            "_type":          "employee",

            "_id":            "",

            "_score":         ,

            "_source": {

               "first_name":  "Douglas",

               "last_name":   "Fir",

               "age":         ,

               "about":       "I like to build cabinets",

               "interests": [ "forestry" ]

            }

         },

         {

            "_index":         "megacorp",

            "_type":          "employee",

            "_id":            "",

            "_score":         ,

            "_source": {

               "first_name":  "John",

               "last_name":   "Smith",

               "age":         ,

               "about":       "I love to go rock climbing",

               "interests": [ "sports", "music" ]

            }

         },

         {

            "_index":         "megacorp",

            "_type":          "employee",

            "_id":            "",

            "_score":         ,

            "_source": {

               "first_name":  "Jane",

               "last_name":   "Smith",

               "age":         ,

               "about":       "I like to collect rock albums",

               "interests": [ "music" ]

            }

         }

      ]

   }

}

接下来，尝试下搜索姓氏为 ``Smith`` 的雇员。为此，我们将使用一个高亮搜索，很容易通过命令行完成。这个方法一般涉及到一个 查询字符串 （_query-string_）搜索，因为我们通过一个URL参数来传递查询信息给搜索接口：

GET /megacorp/employee/_search?q=last_name:Smith

　curl -X GET "localhost:9200/megacorp/employee/_search?q=last_name:Smith&pretty"

{

   ...

   "hits": {

      "total":      ,

      "max_score":  0.30685282,

      "hits": [

         {

            ...

            "_source": {

               "first_name":  "John",

               "last_name":   "Smith",

               "age":         ,

               "about":       "I love to go rock climbing",

               "interests": [ "sports", "music" ]

            }

         },

         {

            ...

            "_source": {

               "first_name":  "Jane",

               "last_name":   "Smith",

               "age":         ,

               "about":       "I like to collect rock albums",

               "interests": [ "music" ]

            }

         }

      ]

   }

}

现在尝试下更复杂的搜索。同样搜索姓氏为 Smith 的员工，但这次我们只需要年龄大于 30 的。查询需要稍作调整，使用过滤器 filter ，它支持高效地执行一个结构化查询。

GET /megacorp/employee/_search

{

    "query" : {

        "bool": {

            "must": {

                "match" : {

                    "last_name" : "smith"

                }

            },

            "filter": {

                "range" : {

                    "age" : { "gt" :  }

                }

            }

        }

    }

}

全文搜索：

截止目前的搜索相对都很简单：单个姓名，通过年龄过滤。现在尝试下稍微高级点儿的全文搜索——一项传统数据库确实很难搞定的任务。

搜索下所有喜欢攀岩（rock climbing）的员工：

GET /megacorp/employee/_search

{

    "query" : {

        "match" : {

            "about" : "rock climbing"

        }

    }

}

显然我们依旧使用之前的 match 查询在about 属性上搜索 “rock climbing” 。得到两个匹配的文档：

{

   ...

   "hits": {

      "total":      ,

      "max_score":  0.16273327,

      "hits": [

         {

            ...

            "_score":         0.16273327,

            "_source": {

               "first_name":  "John",

               "last_name":   "Smith",

               "age":         ,

               "about":       "I love to go rock climbing",

               "interests": [ "sports", "music" ]

            }

         },

         {

            ...

            "_score":         0.016878016,

            "_source": {

               "first_name":  "Jane",

               "last_name":   "Smith",

               "age":         ,

               "about":       "I like to collect rock albums",

               "interests": [ "music" ]

            }

         }

      ]

   }

}

Elasticsearch 默认按照相关性得分排序，即每个文档跟查询的匹配程度。第一个最高得分的结果很明显：John Smith 的 about 属性清楚地写着 “rock climbing” 。

短语搜索：

找出一个属性中的独立单词是没有问题的，但有时候想要精确匹配一系列单词或者短语。比如，我们想执行这样一个查询，仅匹配同时包含 “rock” 和 “climbing” ，并且二者以短语 “rock climbing” 的形式紧挨着的雇员记录。

为此对 match 查询稍作调整，使用一个叫做 match_phrase 的查询：

GET /megacorp/employee/_search

{

    "query" : {

        "match_phrase" : {

            "about" : "rock climbing"

        }

    }

}

毫无悬念，返回结果仅有 John Smith 的文档。

高亮搜索：

许多应用都倾向于在每个搜索结果中高亮部分文本片段，以便让用户知道为何该文档符合查询条件。在 Elasticsearch 中检索出高亮片段也很容易。

再次执行前面的查询，并增加一个新的 highlight 参数：

GET /megacorp/employee/_search

{

    "query" : {

        "match_phrase" : {

            "about" : "rock climbing"

        }

    },

    "highlight": {

        "fields" : {

            "about" : {}

        }

    }

}

{

   ...

   "hits": {

      "total":      ,

      "max_score":  0.23013961,

      "hits": [

         {

            ...

            "_score":         0.23013961,

            "_source": {

               "first_name":  "John",

               "last_name":   "Smith",

               "age":         ,

               "about":       "I love to go rock climbing",

               "interests": [ "sports", "music" ]

            },

            "highlight": {

               "about": [

                  "I love to go <em>rock</em> <em>climbing</em>"

               ]

            }

         }

      ]

   }

}

参考文档：

Elasticsearch官方教程：https://www.elastic.co/guide/cn/elasticsearch/guide/cn/getting-started.html

SpringData与Elasticsearch结合教程：https://docs.spring.io/spring-data/elasticsearch/docs/3.1.10.RELEASE/reference/html/#elasticsearch.repositories

巴特西