1.Luncene介绍

案例:
实现一个文件的搜索功能,通过关键字搜索文件,凡是文件名或文件内容包括关键字文件都需要找出来。还可以根据中文词语进行查询,并且需要支持多个条件查询。
Lucene可以解决

数据分类
  1.结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据
  2.非机构化数据:指不定长或无固定格式的数据,如邮件,word 文档等磁盘上的文件

非结构化数据方法
  1.顺序扫描法
    因为是顺序扫描所以相当慢不建议使用
  2.全文检索
    非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目地。这部分从非结构化数据中提取出来的然后重新组织的信息,我们称之索引这种先建立索引,再对索引进行搜索的过程就叫全文检索创建索引的过程非常耗时,但是索引一旦创建就可以多次使用,全文检索主要处理的是查询,所以耗时间创建索引是值得的。

如何实现全文检索
  可以使用Lucene实现全文检索,它是 apache下的一个开源代码的全文检索引擎工具包,提供了完整的查询引擎和搜索引擎,部分文本分析引擎。

使用应用场景
  对于数据量大、数据结构不固定的数据可采用全文搜索方式搜索,百度、Google、论坛站内搜索、电商网站站内

luncene是基础 Solr是它的框架 变更的速度很快使用率高

  左边索引过程,对搜索的原始内容进行索引创建一个索引库,索引过程包括:确定原始内容要搜索的内容->采集文档->创建文档->分析文档->搜索文档
  右边搜索过程,从索引库中搜索内容的过程包括:用户通过搜索界面->创建查询->执行搜索,从索引库搜索->渲染搜索结果

最新文章

  1. linux安装tomcat
  2. DirectX9 Sample_Empty Project
  3. linux查看系统命令
  4. 两步验证Authy时间同步问题
  5. Yii2.0 实现的短信发送
  6. php YAF
  7. hibernate之saveorupdate()、save()、update()都有什么区别
  8. hdu 4632区间 dp
  9. BZOJ 1261: [SCOI2006]zh_tree( 区间dp )
  10. 基于visual Studio2013解决C语言竞赛题之1075大数阶乘
  11. Asp.Net实现FORM认证的一些使用技巧
  12. Flask -- 静态文件 和 模板渲染
  13. 剑指offer之有序二维数组查找
  14. USACO Section 1.3 Barn Repair 解题报告
  15. eclipse中svn的各种状态图标详解
  16. Scanner对象及其获取数据出现小问题和解决方案
  17. Python简单实现KNN算法
  18. Android Tools&Cmd
  19. uva-10245-分治
  20. 检测Android手机的IP地址

热门文章

  1. 对nginx中location的认识
  2. mysql 开发进阶篇系列 35 工具篇 mysqldump(数据导出工具)
  3. C++虚表详解
  4. lua脚本在游戏中的应用
  5. SpringBoot之使用Lettuce集成Redis
  6. JavaScript之使用AJAX(适合初学者)
  7. angular 禁止缓存
  8. [转]git提交代码时遇到代码库有更新以及本地有更新的解决方法
  9. soapui 自动化教程
  10. VB.NET网络是否联通Function