一、定义

官网的定义:

Solr是基于Lucene构建的流行,快速,开放源代码的企业搜索平台。它具有高度的可靠性,可伸缩性和容错能力,可提供分布式索引,复制和负载平衡查询,自动故障转移和恢复,集中式配置等。 Solr支持许多世界上最大的互联网站点的搜索和导航功能。

简单的理解solr就是一款搜索框架,通常用实现查询功能,比如电商网站的商品检索。

二、环境搭建

本文基于以下开源组件版本搭建,约定下载后组件和解压缩的文件都放置在/opt目录下

  • solr-8.2.0

  • apache-tomcat-8.5.47

首先下载solr-8.2.0.tgz,可以使用wget命令:

wget http://mirrors.tuna.tsinghua.edu.cn/apache/lucene/solr/8.2.0/solr-8.2.0.tgz

解压缩:

tar -zxvf solr-8.2.0.tgz -C .

解压后,/opt目录下会多一个solr-8.2.0目录

下载apache-tomcat-8.5.47:

wget https://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-8/v8.5.47/bin/apache-tomcat-8.5.47.tar.gz

解压缩:

tar -zxvf apache-tomcat-8.5.47.tar.gz

为了将solr部署到tomcat服务器,不使用solr自带的jetty,首先在/opt目录下创建一个目录用于部署solr服务,名称无限制,这里取名solr了。

mkdir solr

复制一份tomcat到/opt/solr目录下,重命名为tomcat8

cp -r apache-tomcat-8.5.47 solr/tomcat8

solr本质是一个web服务,我们将它复制到tomcat8下:

cp -r solr-8.2.0/server/solr-webapp/webapp solr/tomcat8/webapps/solr

复制solr-8.2.0/server/lib/ext下的部分jar到solr目录中,为了简便可以完全复制所有的,然后忽略掉disruptor-3.4.2.jar

cp solr-8.2.0/server/lib/ext/* solr/tomcat8/webapps/solr/WEB-INF/lib/

复制solr-8.2.0/server/lib下以metrics开头的jar到solr目录:

cp solr-8.2.0/server/lib/metrics* solr/tomcat8/webapps/solr/WEB-INF/lib/

上面这两项注意是复制到solr服务的lib目录下,不是复制到tomcat8/lib下。

复制solr-8.2.0/server/resources下的log4j*.xml文件到solr

首先在solr创建classes目录:

mkdir solr/tomcat8/webapps/solr/WEB-INF/classes

复制日志配置文件:

cp solr-8.2.0/server/resources/log4j2*.xml solr/tomcat8/webapps/solr/WEB-INF/classes/

将solr-8.2.0/server/solr目录复制到solr/目录下,并重命名为solrhome:

cp -r solr-8.2.0/server/solr solr/solrhome

修改日志路径

vim solr/tomcat8/webapps/solr/WEB-INF/classes/log4j2.xml

指定fileName和filePattern的路径:

<RollingRandomAccessFile
name="MainLogFile"
fileName="/opt/solr/solrhome/log/solr.log"
filePattern="/opt/solr/solrhome/log/solr.log.%i" >
<PatternLayout>
....

关联solr及solrhome

修改solr里的web.xml文件

vim solr/tomcat8/webapps/solr/WEB-INF/web.xml

web.xml中<web-app></web-app>标签内添加如下配置,指定sorlhome路径

<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/opt/solr/solrhome</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>

注释掉下方的下列配置:

<!--
<security-constraint>
<web-resource-collection>
<web-resource-name>Disable TRACE</web-resource-name>
<url-pattern>/</url-pattern>
<http-method>TRACE</http-method>
</web-resource-collection>
<auth-constraint/>
</security-constraint>
<security-constraint>
<web-resource-collection>
<web-resource-name>Enable everything but TRACE</web-resource-name>
<url-pattern>/</url-pattern>
<http-method-omission>TRACE</http-method-omission>
</web-resource-collection>
</security-constraint>
-->

最后启动tomcat,访问服务器的solr服务:

sh solr/tomcat8/bin/start.sh

访问地址:

localhost:8080/solr/index.html

三、配置IK分词器

首先从IK分词器下载与solr版本匹配的jar包,并放置在solr服务的lib目录下,

cp ik-analyzer-8.2.0.jar solr/tomcat8/webapps/solr/WEB-INF/lib/

在solr/solrhome/下创建目录test_core,拷贝配置文件到test_core中:

cp -r solr/solrhome/configsets/sample_techproducts_configs/conf/ solr/solrhome/test_core/

修改conf中的solr.xml文件,修改jar路径:

<lib dir="${solr.install.dir:../}/contrib/extraction/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-cell-\d.*\.jar" /> <lib dir="${solr.install.dir:../}/contrib/clustering/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-clustering-\d.*\.jar" /> <lib dir="${solr.install.dir:../}/contrib/langid/lib/" regex=".*\.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-langid-\d.*\.jar" /> <lib dir="${solr.install.dir:../}/dist/" regex="solr-ltr-\d.*\.jar" /> <lib dir="${solr.install.dir:../}/contrib/velocity/lib" regex=".*\.jar" />
<lib dir="${solr.install.dir:../}/dist/" regex="solr-velocity-\d.*\.jar" />

修改managed-schema文件,添加ik分词器配置:

<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>

重启solr服务,打开管理界面,添加test_core:



打开管理界面,分词示例:

最新文章

  1. windows下cmd记录MYSQL操作
  2. Effective Python2 读书笔记2
  3. Java并发编程核心方法与框架-CountDownLatch的使用
  4. 基于iSCSI的SQL Server 2012群集测试(二)--SQL群集安装后初始化配置测试
  5. HDU 2689Sort it 树状数组 逆序对
  6. atitit.spring3 mvc url配置最佳实践
  7. android知识体系
  8. NETMON&amp; Message Analyzer
  9. RDO部署openstack(1)
  10. iOS网络通信类库
  11. Leetcode 226 Invert Binary Tree python
  12. SSIS DB目录设置 (Integration Services Catalogs)
  13. WebService 使用wsdl.exe生成代理类
  14. AngularJs ui-router 路由的介绍
  15. 如何卸载wineQQ?
  16. Mysql使用中文字段排序的实现--order by
  17. python性能:不要使用 key in list 判断key是否在list里
  18. &#39;假定以下程序经编译和连接后生成可执行文件PROG.EXE,如果在此可执行文件所在目录的DOS提示符下键入:PROG ABCDEFGH IJKL&lt;回车&gt;,则输出结果为( ). void main( int argc, char *argv[]) { while(--argc&gt;0) cout&lt;&lt;argv[argc]; cout&lt;&lt;&quot;\n&quot;; }
  19. c++ std 最小堆的使用 (用于实现top100之类的功能)
  20. IOS Using UIAlertView to show alerts

热门文章

  1. [转帖]mysql数据库主从配置
  2. Python 如何用列表实现栈和队列?
  3. xss过滤与单例模式(对象的实例永远用一个)
  4. WPF拖拽文件(拖入拖出),监控拖拽到哪个位置,类似百度网盘拖拽
  5. 第7天:Django模板使用与表单
  6. 用eclipse怎么打war包?
  7. react native 在vscode上运行
  8. SpringMVC拦截器(资源和权限管理)
  9. ELK报错及解决方案
  10. RMQ 区间最大值最小值 最频繁次数