1.Lucene  -全文搜索引擎

Apache Lucene 是一个基于Java的全文搜索引擎,利用它能够轻易的为Java软件添�全文搜索引擎的功能。

Lucene最重要的工作是替文件的每个字索引,索引让搜索娥效率比传统的逐字搜索高出非常多。

Lucene 提供一组解析、过滤、分析文件,已经编排和有用索引的API。它的强大之处除了高效和简单外,最重要的是使开发人员能够随时依据自己的须要自己定义其功能。

2.Lucene是所中搜索引擎框架的基础。下面是基于Lucene的,分别实现了不同功能的拓展。

Nutch -全文搜索和网络爬虫

Solr -基于Lucene的全文搜索引擎框架

Compass -基于Lucene的搜索有引擎框架

LIUS-基于Lucene的多文件格式索引框架

WebLucene-基于Lucene和XML的网页索引引擎

3.原理

Lucene不是一个完整的全文索引应用,而是一个用Java写的全文索引引擎工具包,它能够嵌入到各种应用中实现针相应用的全文索引/检索功能。
Lucene进行索引,首先会将进行索引的文件存储到Lucene索引库,并对文档进行索引,然后搜索时使用搜索的API接口查到被索引的文档。
这一过程与数据库存入数据记录、创建索引、SQL查下的过程类似。

4工作过程

1.创建文档对象Document
2.IndexWriter保存文档索引(能够使用不同的中文分词器)
3.使用IndexSercher进行搜索
4.使用IndexReader删除索引







最新文章

  1. linux之cp/scp命令+scp命令详解
  2. [LeetCode] Department Top Three Salaries 系里前三高薪水
  3. piap.excel 微软 时间戳转换mssql sql server文件时间戳转换unix 导入mysql
  4. 重新想象 Windows 8.1 Store Apps (78) - 控件增强: ScrollViewer, FlipView, Popup
  5. sql的游标使用(转)
  6. php 购物车完整实现代码
  7. use ContourPlot-使用ContourPlot
  8. return及break区别
  9. Jquery消息提示插件toastr使用详解
  10. Oracle报错ORA-12516 TNS:listener could not find available handler with matching protocol stack
  11. day22 Pythonpython 本文xml模块
  12. urllib设置debuglevel打开调试开关
  13. SIMTRACE环境搭建
  14. python模块:datetime
  15. leecode第四十六题(全排列)
  16. legend2---开发日志4(常用的链接传值方式有哪些)
  17. 翻译:使用红外传感器与Arduino进行简单动作与手势检测
  18. “Info.plist” couldn’t be removed
  19. Python 文件 write() 方法
  20. 泛型 for to/in 遍历 PK 效率;TEnumerator、TEnumerable

热门文章

  1. Python多线程下的_strptime问题
  2. Codeforces 468D Tree
  3. MySQL如何查询LINESTRING数据
  4. Java 自定义日志写入
  5. __sleep和__wakeup
  6. zoj 1134 - Strategic Game
  7. 初入Android--环境搭建
  8. 6.MIL采集和实时显示
  9. Python前世今生
  10. ImageMagick wrapper for php