網絡中的資源非常豐富,但是如何有效的搜索信息卻是一件困難的事情。建立搜索引擎就是解決這個問題的最好方法。本文首先詳細介紹了基于英特網的搜索引擎的系統結構,然后從網絡機器人、索引引擎、Web服務器三個方面進行
Compass是一個強大的,事務的,高性能的對象/搜索引擎映射(OSEM:object/search engine mapping)與一個Java持久層框架.Compass包括: * 搜索引擎抽象層(使用Lucene搜索引薦)
Nutch?是一個開源Java?實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬蟲。 盡管Web搜索是漫游Internet的基本要求, 但是現有web搜索引擎的數目卻在下降
Hawk 搜索引擎平臺 是面向中小型網站,可以定制的垂直搜索引擎平臺。本搜索引擎平臺目標是方便用戶搭建站內搜索、某個領域的垂直搜索、以及檢索個人文檔以及自己關注的網站信 息的桌面搜索等應用領域。它改造
IndexTank, 一套基于Java的索引-搜索引擎實現,支持的特性包括:variables (boosts), categories (facets), faceted search, snippeting
程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索
程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索
Nutch 致力于讓每個人能很容易, 同時花費很少就可以配置世界一流的Web搜索引擎. 為了完成這一宏偉的目標, Nutch必須能夠做到: * 每個月取幾十億網頁 * 為這些網頁維護一個索引
程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索
Apache Lucene 5.5.0 發布了,該版本包含 bug 修復、優化和改進。
MG4J 是一個高度可定制的,高性能的,全文Java搜索引擎。適用于大型文件集,它提供了一些高級的功能(如BM25/BM25F得分)和新的研究算法。
MG4J 是一個高度可定制的,高性能的,全文Java搜索引擎,主要用于大型文件集。它提供了先進的功能(如BM25/BM25F得分)和新的研究算法。 這次發布增加了新的I/O工廠,使得它可以在類似HDFS這樣的文件系統上構建索引。
從Nutch的開發者郵件中得到消息。Nutch 1.6 RC 將在未來數日內發布。將修復和增超過40個的bug/功能要求。
程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索
發布,此版本現已提供在: http://www.apache.org/dyn/closer.cgi/lucene/java/5.1.0 。 更新內容如下: 新特性 (9) LUCENE-6066 : Added
Lucene 最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構
在這個信息相當繁雜的互聯網時代,我們已經學會了如何利用搜索引擎這個強大的利器來找尋目標信息,比如你會在Google上搜索情人節如何討女朋友 歡心,你也會在百度上尋找正規的整容醫療機構(盡管有很大一部分
import java.io.IOException; import java.util.LinkedList; import java.util.List; import java.util.Queue;
MG4J 是另一個搜索引擎。與Lucene 主要區別是,它提供了cluster 功能,具有更OO的設計方式。 MG4J可以讓你為大量的文檔集合構建一個被壓縮的全文本索引,通過使內插編碼(interpolative
提供了一個簡單確強大的應用程式接口,能夠做全文索引和搜尋,在Java開發環境里Lucene是一個成熟的免費開放源代碼工具;就其本身而論,Lucene是現在并且是這幾年,最受歡迎的免費java資訊檢索程式庫。人們經常提到資訊檢索