Nutch 是一個開源Java?實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬蟲。 盡管Web搜索是漫游Internet的基本要求, 但是現有web搜索引擎的數目卻在下降
Egothor是一個用Java編寫的開源而高效的全文本搜索引擎。借助Java的跨平臺特性,Egothor能應用于任何環境的應用,既可配置為單獨的搜索引擎,又能用于你的應用作為全文檢索之用。 主要特性 采用Java開發,實現跨平臺支持
OSS (Open Search Server) 是一個用 Java 開發的搜索引擎服務器,基于 Lucene 、ZK 和 Tomcat 等開源軟件架構。 Open Search Server 1
OSS (Open Search Server) 是一個用 Java 開發的搜索引擎服務器,基于 Lucene 、ZK 和 Tomcat 等開源軟件架構。 Open Search Server 1
OSS (Open Search Server) 是一個用 Java 開發的搜索引擎服務器,基于 Lucene 、ZK 和 Tomcat 等開源軟件架構。 Lucene 是一套用于全文檢索和 搜尋
從一個練手項目開始到搜索引擎行業的巨頭,Lucene 項目已經在 Apache 組織整整 10 年了。2001年9月18日,Jason Van Zyl 首次將 Doug Cutting 的 Lucene
Terrier 是一個用來快速開發Web、企業內部網、桌面搜索引擎的軟件,是一個模塊和的平臺用來構建大規模的信息獲取應用,提供索引和數據獲取功能,提供一個桌面搜索應用。 項目主頁: http://www
robot; import java.io.IOException; import java.util.LinkedList; import java.util.List; import java.util.Queue;
起點R3企業級搜索引擎是起點軟件提供的企業搜索解決方案,支持企業環境下的數據訪問控制(ACL),能夠通過定義用戶數據訪問權限來控制檢索數據的安全。 R3是一個強大的,高性能的JAVA企業級搜索引擎產品,R
DDH垂直搜索引擎,是目前互聯網中唯一可以商業運作的垂直搜索引擎系統,由JAVA語言開發,可以運行在大規模集群中的網絡信息整合系統。DDH整合Nutch(開源搜索引擎系統),UCI(網頁信息抽取系統)
Lucene 最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構
Nutch 是一個開源Java?實現的搜索引擎。它提供了我們運行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬蟲。 盡管Web搜索是漫游Internet的基本要求, 但是現有web搜索引擎的數目卻在下降
full-featured text search engine library written entirely in Java. It is a technology suitable for nearly any application
Apache Lucene 是一個高性能,全功能的全文搜索引擎庫,完全用Java編寫。它適用于幾乎需要全文搜索功能的任何應用程序,尤其是跨平臺的。 Lucene通過一個簡單的API,提供了強大的功能:
?Lucene:基于Java的全文檢索引擎簡介 文章來源http://www.chedong.com/tech/lucene.html Lucene是一個基于Java的全文索引工具包。 1. 基于Java的全文索
Lucene 最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構
Lucene 最初是由Doug Cutting所撰寫的,是一位資深全文索引/檢索專家,曾經是V-Twin搜索引擎的主要開發者,后來在Excite擔任高級系統架構設計師,目前從事 于一些INTERNET底層架構
Summa是一種由java開發的,快速模塊化和可擴展的搜索引擎. Summa 有如下特點: 綜合搜索 . Summa 能夠同時訪問許多不同的數據和資料來源,并以一個統一的接口公開 模塊化設計
元數據節點(Namenode)和數據節點(datanode) 18 Zookeeper介紹 18 Lucene搜索引擎 20 Minion搜索引擎 20 Lily 分布式搜索 Lily以NoSQL技術為主題,是建立在云計算上的內容倉庫(content
多級Merger與自定義分區 7. GC上進行了一些優化 自 己進行內存管理,關鍵地方的內存對象的創建和釋放Java內部自己控制,減少GC的壓力(類似Hbase的Block Buffer Cache)。 不使用W