Python 全文搜索組件 PyLucene 3.4.0 發布

fmms 13年前發布 | 15K 次閱讀 Python

PyLucene 是 Python 語言用來訪問 Lucene 索引庫的封裝。通過 PyLucene 可以用來創建索引和對索引進行搜索。

示例說明:

Java 代碼:

for (int i = 0; i < hits.length(); i++) {
     Document doc = hits.doc(i);
     System.out.println(hits.score(i) + " : " + doc.get("title"));
}
而 Python 的代碼則是:
for hit in hits:
    hit = Hit.cast_(hit)
    print hit.getScore(), ':', hit.getDocument['title']
PyLucene 3.4.0 發布了,該版本新增一個聯合的 contrib 模塊,另外使用 JCC 2.11 和 Lucene 3.4.0 源碼進行構建。
項目地址: http://lucene.apache.org/pylucene/


Lucene是一套用于全文檢索和搜尋開源程式庫,由Apache軟件基金會支持和提供。Lucene提供了一個簡單確強大的應用程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索程式庫,就像是搜尋引擎,但是不應該將資訊檢索程式庫與網搜索引擎相混淆。

Lucene最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構的研究。他貢獻出Lucene的目標是為各種中小型應用程式加入全文檢索功能。

JCC 是 Python 的一個包,主要用來生成 C++ 代碼以在 C++ 和 Python 程序中調用 Java 代碼。

 本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!