Solr服务器搭建
Solr 是一个基于 Apache Lucene 的开源搜索平台,广泛应用于全文检索、数据索引和搜索解决方案,本文将详细介绍如何在 Tomcat 环境中搭建 Solr 服务器,包括环境配置、索引库设置、IK 分词器的安装与配置等步骤,以下是详细步骤:
一、准备工作
在开始搭建 Solr 之前,需要确保服务器已经安装了 Java 运行环境(JRE 或 JDK),可以通过命令java -version
来检查 Java 是否已安装并且配置正确,还需要下载并安装 Tomcat,用于运行 Solr 的 Web 应用。
二、下载 Solr
1、访问 Solr 官方网站:https://lucene.apache.org/solr/
2、选择适合的版本:下载最新的稳定版 Solr 压缩包文件,solr-8.11.2.zip(版本号可能随时间更新)。
三、解压 Solr 压缩包
将下载的 Solr 压缩包上传到 Linux 系统,然后使用命令解压:
tar -xf solr-8.11.2.tgz -C /usr/local/
四、启动 Solr
进入解压后的 Solr 文件夹,使用以下命令启动 Solr 服务:
cd /usr/local/solr-8.11.2/ bin/solr start -force
启动成功后,可以通过浏览器访问 [http://localhost:8983/solr](http://localhost:8983/solr) 查看 Solr 管理界面。
五、创建 Solr Core
Core 是 Solr 中索引的逻辑集合,使用以下命令创建一个新的 Solr Core:
bin/solr create_core -c mycore
这将在 Solr 目录下创建一个名为mycore
的核心,并在该核心目录下生成默认的配置文件。
六、配置 Solr Core
每个 Solr Core 都有一系列的配置文件,用来定义其行为和属性,主要的配置文件包括solrconfig.xml
和schema.xml
,这些文件位于新创建的 Core 的目录下,例如mycore/conf/
。
1. 修改solrconfig.xml
根据需要编辑solrconfig.xml
文件,以配置请求处理、请求参数、索引配置等,可以添加自定义的请求处理器或调整缓存设置。
2. 修改schema.xml
schema.xml
定义了索引中的字段、数据类型、分词器等信息,根据项目需求,添加或修改字段类型和分词器配置,添加一个文本字段并使用 IK 分词器:
<fieldType name="text_ik" class="solr.TextField"> <analyzer type="index"> <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </analyzer> <analyzer type="query"> <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzer"/> </analyzer> </fieldType>
七、安装 IK 分词器
IK 分词器是一款优秀的中文分词工具,适用于 Solr,下载 IK Analyzer for Solr,并将 jar 包复制到 Solr 项目的lib
目录中,在schema.xml
中引用该分词器。
1. 下载 IK Analyzer
从 [GitHub](https://github.com/medcl/lucene-analysis-ik) 下载最新版本的 IK Analyzer。
2. 复制 jar 包
将下载的 jar 包复制到 Solr 项目的lib
目录中,例如/usr/local/solr-8.11.2/server/solr-webapp/webapp/WEB-INF/lib/
。
3. 配置schema.xml
在schema.xml
中添加对 IK 分词器的引用,如上文所示。
八、重启 Solr 服务
每次修改配置文件后,需要重启 Solr 服务使更改生效:
bin/solr restart -force
九、验证 Solr 服务器
通过浏览器访问 [http://localhost:8983/solr/mycore/](http://localhost:8983/solr/mycore/),查看 Solr Core 的管理界面,确认 Solr 服务器正常运行。
十、部署到生产环境
在开发环境中测试完成后,可以将 Solr 应用程序部署到生产环境的 Web 容器中,如 Tomcat、Jetty 等,根据具体的需求,可以进行其他配置和优化,如调整 JVM 参数、配置集群等。
十一、FAQs
1、如何修改 Solr 的默认端口?
编辑solr.in.cmd
文件,找到SOLR_PORT=8983
,将其修改为所需的端口号,然后重新启动 Solr 服务。
2、如何备份和恢复 Solr 数据?
备份:将 Solr 核心目录(如/usr/local/solr-8.11.2/server/solr/mycore
)复制到安全位置。
恢复:停止 Solr 服务,删除现有的核心目录,然后将备份的核心目录复制回原位置,最后重新启动 Solr 服务。
通过以上步骤,您已经成功搭建了一个基本的 Solr 服务器,并为其添加了中文分词支持,根据具体的应用需求,您可以进一步进行配置和优化。
原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/1251057.html
本网站发布或转载的文章及图片均来自网络,其原创性以及文中表达的观点和判断不代表本网站。如有问题,请联系客服处理。
发表回复