Python 全文搜索組件 PyLucene 3.4.0 發布
PyLucene 是 Python 語言用來訪問 Lucene 索引庫的封裝。通過 PyLucene 可以用來創建索引和對索引進行搜索。
示例說明:
Java 代碼:
for (int i = 0; i < hits.length(); i++) { Document doc = hits.doc(i); System.out.println(hits.score(i) + " : " + doc.get("title")); }而 Python 的代碼則是:
for hit in hits: hit = Hit.cast_(hit) print hit.getScore(), ':', hit.getDocument['title']PyLucene 3.4.0 發布了,該版本新增一個聯合的 contrib 模塊,另外使用 JCC 2.11 和 Lucene 3.4.0 源碼進行構建。
項目地址: http://lucene.apache.org/pylucene/
Lucene是一套用于全文檢索和搜尋的開源程式庫,由Apache軟件基金會支持和提供。Lucene提供了一個簡單確強大的應用程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索程式庫,就像是搜尋引擎,但是不應該將資訊檢索程式庫與網搜索引擎相混淆。
Lucene最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構的研究。他貢獻出Lucene的目標是為各種中小型應用程式加入全文檢索功能。
JCC 是 Python 的一個包,主要用來生成 C++ 代碼以在 C++ 和 Python 程序中調用 Java 代碼。
本文由用戶 fmms 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!