Luncene介绍
2024-08-26 06:58:03
1.Luncene介绍
案例:
实现一个文件的搜索功能,通过关键字搜索文件,凡是文件名或文件内容包括关键字文件都需要找出来。还可以根据中文词语进行查询,并且需要支持多个条件查询。
Lucene可以解决
数据分类
1.结构化数据:指具有固定格式或有限长度的数据,如数据库,元数据
2.非机构化数据:指不定长或无固定格式的数据,如邮件,word 文档等磁盘上的文件
非结构化数据方法
1.顺序扫描法
因为是顺序扫描所以相当慢不建议使用
2.全文检索
非结构化数据中的一部分信息提取出来,重新组织,使其变得有一定结构,然后对此有一定结构的数据进行搜索,从而达到搜索相对较快的目地。这部分从非结构化数据中提取出来的然后重新组织的信息,我们称之索引这种先建立索引,再对索引进行搜索的过程就叫全文检索创建索引的过程非常耗时,但是索引一旦创建就可以多次使用,全文检索主要处理的是查询,所以耗时间创建索引是值得的。
如何实现全文检索
可以使用Lucene实现全文检索,它是 apache下的一个开源代码的全文检索引擎工具包,提供了完整的查询引擎和搜索引擎,部分文本分析引擎。
使用应用场景
对于数据量大、数据结构不固定的数据可采用全文搜索方式搜索,百度、Google、论坛站内搜索、电商网站站内
luncene是基础 Solr是它的框架 变更的速度很快使用率高
左边索引过程,对搜索的原始内容进行索引创建一个索引库,索引过程包括:确定原始内容要搜索的内容->采集文档->创建文档->分析文档->搜索文档
右边搜索过程,从索引库中搜索内容的过程包括:用户通过搜索界面->创建查询->执行搜索,从索引库搜索->渲染搜索结果
最新文章
- linux安装tomcat
- DirectX9 Sample_Empty Project
- linux查看系统命令
- 两步验证Authy时间同步问题
- Yii2.0 实现的短信发送
- php YAF
- hibernate之saveorupdate()、save()、update()都有什么区别
- hdu 4632区间 dp
- BZOJ 1261: [SCOI2006]zh_tree( 区间dp )
- 基于visual Studio2013解决C语言竞赛题之1075大数阶乘
- Asp.Net实现FORM认证的一些使用技巧
- Flask -- 静态文件 和 模板渲染
- 剑指offer之有序二维数组查找
- USACO Section 1.3 Barn Repair 解题报告
- eclipse中svn的各种状态图标详解
- Scanner对象及其获取数据出现小问题和解决方案
- Python简单实现KNN算法
- Android Tools&;Cmd
- uva-10245-分治
- 检测Android手机的IP地址