服务器设置和教程 · 6 10 月, 2024

CentOS 7 下搭建 Solr 6.6 全文檢索伺服器及 IK 分詞器配置

CentOS 7 下搭建 Solr 6.6 全文檢索伺服器及 IK 分詞器配置

Apache Solr 是一個強大的開源全文檢索伺服器,廣泛應用於各種搜索解決方案中。本文將介紹如何在 CentOS 7 上搭建 Solr 6.6 伺服器,並配置 IK 分詞器,以提升中文文本的檢索效果。

環境準備

在開始之前,確保你的 CentOS 7 系統已經更新到最新版本。可以使用以下命令進行更新:

sudo yum update -y

接下來,安裝 Java,因為 Solr 需要 Java 環境運行。可以使用以下命令安裝 OpenJDK:

sudo yum install java-1.8.0-openjdk -y

安裝完成後,檢查 Java 是否安裝成功:

java -version

下載與安裝 Solr

接下來,下載 Solr 6.6 的安裝包。可以使用 wget 命令來下載:

wget http://archive.apache.org/dist/lucene/solr/6.6.0/solr-6.6.0.tgz

下載完成後,解壓縮安裝包:

tar xzf solr-6.6.0.tgz

然後,進入解壓後的目錄,並運行安裝腳本:

cd solr-6.6.0
sudo bin/solr install -c mysolr

這將會在你的系統上安裝一個名為 “mysolr” 的 Solr 實例。

啟動 Solr 伺服器

安裝完成後,可以啟動 Solr 伺服器:

sudo bin/solr start

啟動後,可以通過瀏覽器訪問 Solr 的管理界面,網址為 http://localhost:8983/solr

安裝 IK 分詞器

IK 分詞器是一個針對中文的分詞工具,能夠有效提升中文檢索的準確性。首先,下載 IK 分詞器的最新版本:

wget https://github.com/IKAnalyzer/IKAnalyzer/archive/refs/tags/v1.8.5.zip

解壓縮下載的文件:

unzip v1.8.5.zip

將 IK 分詞器的 jar 包複製到 Solr 的 lib 目錄中:

cp IKAnalyzer-1.8.5.jar solr-6.6.0/server/solr/mysolr/lib/

配置 Solr 使用 IK 分詞器

接下來,需要修改 Solr 的 schema.xml 文件,以使用 IK 分詞器。打開 schema.xml 文件:

nano solr-6.6.0/server/solr/mysolr/conf/schema.xml

在需要使用分詞的字段中,將 analyzer 的類型設置為 IKAnalyzer。例如:

<fieldType name="text_ik" class="solr.TextField">
    <analyzer>
        <tokenizer class="solr.IKTokenizerFactory"/>
    </analyzer>
</fieldType>

然後,將需要使用的字段類型設置為 text_ik。

重啟 Solr 伺服器

完成配置後,重啟 Solr 伺服器以使更改生效:

sudo bin/solr restart

測試分詞效果

可以通過 Solr 的查詢界面來測試 IK 分詞器的效果。在查詢框中輸入中文文本,查看分詞結果是否符合預期。

總結

本文介紹了如何在 CentOS 7 上搭建 Solr 6.6 全文檢索伺服器,並配置 IK 分詞器以提升中文檢索效果。這一過程涉及到環境準備、Solr 安裝、IK 分詞器配置及測試等步驟。若您需要穩定的 香港 VPS 服務來運行您的 Solr 伺服器,請考慮我們的解決方案,確保您的應用能夠高效運行。