云帆文檔管理系統里的全文檢索使用的是solr技術。它是不同于數據庫查詢的一種技術,全𝓰文檢索可以根據分詞,查詢文檔中的內容。下面詳細的說明下solr技術的基本知識。
Solr是一種開放源碼的、基于 Lucene Java 的搜索服務器。Solr 提供了層面搜索(就是統計)、命中醒目顯示并且支持多種輸出格式(包括XML/XSLT 和JSON等格式)。它易于安裝和配置,而且附帶了一個基𝓰于HTTP 的管理界面。Solr🧜的特性包括:
A.高級的全文搜索功能
B.專為高通量的網絡流量進行的優化
C.基于開放接口(XML和HTTP)的標準
D.綜合的HTML管理界面
E.可伸縮性-能夠有效地復制到另外一個Solr搜索服務器
F.使用XML配置達到靈活性和適配性
solr如何實現搜索的呢?
&n🌱bsp; 倒排索引(倒排索引是實現“單詞-文檔矩陣”的一種具體存儲形式,通過倒排索引,可以根據單詞快速獲取包含這個單詞的文檔列表。倒排索引主要由兩個部分組成:“單詞詞典”和“倒排文件”。),先抽取文檔中詞,并建立詞與文檔id的映射關系,然后查詢的時候會根據詞去查詢文檔id,并查詢出文檔。
IK分詞器原理
ܫ 本質上是詞典分詞,在內存中初始化一個詞典,然后在分詞過程中逐個讀取字符,和字典中的字符相匹配,把文檔中的所有詞語拆分出來的過程。
云帆文檔管理系統是怎樣基于solr實現文件內容的檢索功能的呢?
首先,在管理端,新建資料時會初始化全文檢索的索引
管理端-新建資料的截圖
用戶端:
1.全文檢索的默認查詢界面
全文檢索的默認界面
2.輸入檢索的關鍵字,可以將文檔中的內容檢索出來
&nඣbsp; 根據關鍵詞進行全文搜索
3.點擊具體的標題,可以查看文檔的詳細內容
詳細查看界面
云帆文檔管理系統致力于為企業ꦕ提供安全穩定的文檔系統解決方案。我們一直在努力提升文檔的安全性,穩定性,可操作性,功能細節的完善性。我們致力于成為最好ജ文檔系統解決方案提供商,為企業的文檔管理保駕護航。
商業版地址://rfremote.cn/?plan=qwjs
微信號:18710213152
微信二維碼: