Sharepoint搜索引擎主要由6种组件构成,他们分别是爬网组件,内容处理组件,分析处理组件,索引组件,查询处理组件,搜索管理组件。可以将这6种组件分别部署到Sharepoint场内的多个服务器上,组成适合需求的Sharepoint搜索场,搜索场的体系结构设计主要参考量是爬网内容量,微软根据爬网内容量不同将搜索场分为大型场,中型场和小型场,更多详细信息可参考:SharePoint Server 2013 中的搜索概述在SharePoint Server 2013 中规划企业搜索体系结构

              Sharepoint搜索引擎构架图

内容量

搜索体系结构

0 - 1000 万个项

小型搜索服务器场

1000 万 - 4000 万个项

中型搜索服务器场

4000 万 - 1 亿个项

大型搜索服务器场

  下图为一个小型搜索拓扑的例子,据微软测试可以支持1000万个项目,并测量出它每秒可以爬网 50 个文档,且每秒服务 10 个查询。对于每秒 50 个文档的爬网率,首次完全爬网中,需要搜索 55 个小时来爬网 1000 万个项目。

小型场服务器拓扑

以下为这个小型场的硬件需求说明:

机服务器

应用程序或数据库服务器

存储量

RAM

处理器

A、B

带有查询处理和索引组件的应用程序服务器

500 GB

16 GB

1.8 GHz 4x CPU 内核

A、B

带有爬网、搜索管理、分析和内容处理组件的应用程序服务器。

200 GB

8 GB

1.8 GHz 4x CPU 内核

A、B

带有所有搜索数据库的数据库服务器。

100 GB

16 GB

1.8 GHz 4x CPU 内核

搜索组件说明:

搜索组件名称

说明

爬网组件

对内容源进行爬网可从已爬网项目中收集已爬网属性和元数据,并将此信息发送到内容处理组件

内容处理组件

转换已爬网项目并将其发送到索引组件。此组件还会将已爬网属性映射到托管属性

分析处理组件

执行搜索分析和使用情况分析

索引组件

从内容处理组件中搜索已处理的项目并将其写入搜索索引。此组件还可以处理传入查询、从搜索索引中检索信息并将结果集发送回查询处理组件

查询处理组件

分析传入查询。这有助于提高精确度、改进检索和提高相关性。查询将发送到索引组件,该组件将为查询返回一组搜索结果

搜索管理组件

运行搜索的系统进程,添加并初始化搜索组件的新实例

搜索数据库说明:

搜索数据库名称

说明

爬网数据库

存储跟踪信息和有关已爬网项目(如文档和 URL)的历史信息。还将存储上一次爬网时间、上一次爬网 ID 和上一次爬网期间的更新类型(添加、更新、删除)等信息。

链接数据库

存储由内容处理组件提取的未处理信息和有关搜索单击的信息。分析处理组件将分析此信息。

分析报告数据库

存储使用情况分析的结果。

搜索管理数据库

存储搜索配置数据

最新文章

  1. redis:hash 数据类型
  2. Erlang 内存泄漏分析
  3. 避免使用CSS表达式
  4. IE6/IE7中display:inline-block解决办法
  5. gridcontrol中使用右健菜单popupMenu1
  6. 关于SWT中的表格(TableViewer类)
  7. SQL入门学习4-复杂查询
  8. Javascript学习7 - 脚本化浏览器窗口
  9. Progit Update Check Page
  10. json解包与json封包
  11. php 多条件查询
  12. kafka环境搭建
  13. Spring 使用介绍(六)—— AOP(二)
  14. C语言 16进制转float
  15. VSCode 打开文件tab键空格数量异常问题
  16. weld
  17. linux shell创建目录、遍历子目录
  18. oracle 如何查看oracle数据库版本
  19. Ubuntu 13.04下安装WPS for Linux
  20. linux下启动springboot服务

热门文章

  1. CAN总线位仲裁技术
  2. 如果axios请求失败,如何获取后端接口返回的状态码及错误信息
  3. Oracle日常性能问题查看
  4. Unity3D 4.3在Windows下打包iOS资源
  5. Three.js响应和移动物体
  6. Python not readable
  7. Android使用图表库简单教程
  8. VIM基本命令及自用配置
  9. Django模板语言之组合搜索
  10. C#使用windows服务定时调用api接口