文章:[Elasticsearch] 全文搜索 (一) - 基础概念和match查询

全文检索,是从最初的字符串匹配和简单的布尔逻辑检索技术,演进到能对超大文本、语音、图像、活动影像等非结构化数据进行综合管理的复合技术。

概念:字符串匹配、非结构化数据、复合技术。(不全部分,自己补充)

全文数据系统的构建,提出全文检索系统的实现技术,主要分为5个步骤:
(1)数据准备:它是指针对计划加载到全文数据库中的数据进行收集、整理、归类等预先处理的过程。加载到全文数据中的数据可以从多种途径获得,常见的数据来源有:电脑打字产生的文件,电子印刷产生的文稿,计算机网上传送的文件,电子出版物,图文处理产生的文件,专门组织人力录入建库。
(2)文本预处理:包括规范格式,当格式多种多样时,应加以整理,使文献的格式规范化;批式标引,文本预处理阶段完成的批式标引,不受全文数据库结构的限制,效率较高。
(3)数据加载:数据准备好以后,便可以加载(拷入、输入)到数据库文件中去了。加载数据可有单篇方式或批量方式。单篇方式一次加载一篇,适于平时文献随时加载的情况。批量方式一次加载多篇,适于集中大量加载的情况。
(4)数据检索:数据库建立起来之后,便可根据全文检索系统提供的检索功能对数据库进行检索。
(5)数据维护:全文数据建立以后,需要经常对数据库的内容进行索引、更新、追加和清理。
 
 
 
 
 

最新文章

  1. iOS逆向工程之Hopper中的ARM指令
  2. Mybatis框架中实现双向一对多关系映射
  3. [OC][地图] 高德地图之定位初探(一)
  4. Java多线程系列--“JUC线程池”05之 线程池原理(四)
  5. 编程思想┊从实例谈面向对象编程(OOP)、工厂模式和重构
  6. 用distinct在MySQL中查询多条不重复记录值[转]
  7. 常用ADB命令
  8. CPU 材料学才是最顶级的学科
  9. getHibernateTemplate()为NUll
  10. linux lsof命令详解
  11. Hive Metastore ObjectStore PersistenceManager自动关闭bug解析
  12. Git命令行和Xcode结合使用
  13. Oracle 与Mysql区别
  14. docker 安装NexusRepository Manager
  15. 【Unity与23种设计模式】装饰模式(Decorator)
  16. Makefile自动生成
  17. java开发环境配置——IntelliJ IDEA
  18. Tomcat启用GZIP压缩,提升web性能
  19. Hdoj 4508.湫湫系列故事——减肥记I 题解
  20. 文件上传下载显示进度(vue)

热门文章

  1. 题解报告:hdu1219AC Me
  2. HDFS执行getDatanodeReport时权限不足的解决办法
  3. 1、IO概述及File类
  4. 配置maven环境变量cmd控制台提示:mvn不是内部或外部命令,也不是可运行的程序或批处理文件
  5. webapp开发学习--Ionic+Cordova 环境搭建
  6. 对于JS == 运算的一些理解
  7. [BZOJ2005][NOI2010]能量采集 数学
  8. axis2客户端的几种调用方式
  9. C#方法参数关键字
  10. CentOS 7 安装Oracle VirtualBox