• P309

      羅剛著:自己動手寫搜索引擎 文檔

    30分鐘實現的搜索引擎,我們從一個簡單的搜索引擎入手,實現一個簡單的指定目錄文件的搜索引擎。實現之前需要有java開發方面的基礎知識。

    emmerich 2011-08-23   982   0
    P6

      Linux中使用eclipse編譯nutch-1.0 文檔

    test1go 2011-08-19   4298   0
    搜索引擎   HTTP   Java   nutch  
    P6

      Lucene學習筆記 文檔

    Directory的另外一個實現類是RAMDirectory,測試的時候可以將索引保存在內存中,然后測試完成后就自動銷毀了,不在硬盤中留下任何痕跡。 2:Lucene只能處理文本。因為Lucene的內核本身只處理String和Reader兩種對象。可以處理非文本,但是處理起來沒有那么簡單,需要轉換。

    menglh 2011-08-18   4772   0
    P28

      基于java的搜索引擎的設計與實現 文檔

    網絡中的資源非常豐富,但是如何有效的搜索信息卻是一件困難的事情。建立搜索引擎就是解決這個問題的最好方法。本文首先詳細介紹了基于英特網的搜索引擎的系統結構,然后從網絡機器人、索引引擎、Web服務器三個方面進行詳細的說明。為了更加深刻的理解這種技術,本人還親自實現了一個自己的搜索引擎——新聞搜索引擎。 新聞搜索引擎是從指定的Web頁面中按照超連接進行解析、搜索,并把搜索到的每條新聞進行索引后加入數據庫。然后通過Web服務器接受客戶端請求后從索引數據庫中搜索出所匹配的新聞。 本人在介紹搜索引擎的章節中除了詳細的闡述技術核心外還結合了新聞搜索引擎的實現代碼來說明,圖文并茂、易于理解。

    lijinfei 2011-08-16   5085   0
    P40

      信息服務平臺基礎設施 - 搜索引擎 文檔

    典型搜索引擎、 搜索引擎分類、 搜索引擎的成功之道、 搜索引擎系統技術原理、 數據庫檢索與全文檢索區別、 打造元器件知識庫服務平臺、 信息服務平臺未來趨勢——個性化服務推薦

    hot00123 2011-08-16   4273   0
    P34

      全文檢索及Lucence 文檔

    全文檢索是計算機程序通過掃描文章中的每一個詞,對每一個詞建立一個索引,指明該詞在文章中出現的次數和位置。當用戶查詢時根據建立的索引查找,類似于通過字典的檢索字表查字的過程。全文檢索系統是按照全文檢索理論建立起來的用于提供全文檢索服務的軟件系統。

    gongandkai 2011-08-16   6056   0
    P25

      Lucene培訓 文檔

    Lucene簡介、Lucene工程代碼結構、核心Index類介紹、Lucene各種Query 。

    yintaibing 2011-08-15   6587   0
    P40

      Lucene&Solr蘇寧易購搜索組 文檔

    Lucene是什么包括:全文索引庫。簡單的語言解析功能。不包括:爬蟲、文檔格式解析、“PageRank”等排序算法。

    yintaibing 2011-08-15   682   0
    P41

      文本挖掘的 文檔

    文本高層次理解的對象可以是僅包含簡單句子的單個文本也可以是多個文本組成的文本集,但是現有的技術手段雖然基本上解決了單個句子的分析問題,但是還很難覆蓋所有的語言現象,特別是對整個段落或篇章的理解還無從下手。 將數據挖掘的成果用于分析以自然語言描述的文本,這種方法被稱為文本挖掘(Text Mining)或文本知識發現(Knowledge Discovery in Text).

    cameron6 2011-08-14   6240   0
    P24

      Solr Lucene開發經驗 文檔

    Lucene是一個使用Java語言寫的全文檢索開發包(API),利用它可以實現強大的檢索功能,它的詳細介紹大家可以去Google上搜索一下,本文重點放在Solr相關的討論上。

    jiangyad 2011-08-07   7126   0
    P63

      開源企業搜索引擎solr的應用教程 文檔

    Apache Solr 是一個開源的搜索服務器,Solr 使用 Java 語言開發,主要基于 HTTP 和 Apache Lucene 實現。定制 Solr 索引的實現方法很簡單,用 POST 方法向 Solr 服務器發送一個描述所有 Field 及其內容的 XML 文檔就可以了。定制搜索的時候只需要發送 HTTP GET 請求即可,然后對 Solr 返回的信息進行重新布局,以產生利于用戶理解的頁面內容布局。Solr 1.3 版本開始支持從數據庫(通過 JDBC)、RSS 提要、Web 頁面和文件中導入數據,但是不直接支持從二進制文件格式中提取內容,比如 MS Office、Adobe PDF 或其他專有格式。更重要的是,Solr 創建的索引與 Lucene 搜索引擎庫完全兼容。通過對 Solr 進行適當的配置,某些情況下可能需要進行編碼,Solr 可以閱讀和使用構建到其他 Lucene 應用程序中的索引。此外,很多 Lucene 工具(如Nutch、 Luke)也可以使用 Solr 創建的索引。

    SevnInfor 2011-08-02   776   0
    P648

      搜索引擎核心技術與實現(基于Lucene和Solr) 文檔

    第一章首先概要的介紹搜索引擎的總體結構和基本模塊,然后會介紹其中的最核心的模塊:全文檢索的基本原理。為了盡快普及搜索引擎開發技術,本章介紹的搜索引擎結構可以采用開源軟件實現。為了通過實踐來深入了解相關技術,本章中會介紹相關的開發環境。本書介紹的搜索技術使用Java編程語言實現,之所以沒有采用性能可能會更好的C/C++,是希望讀者不僅能夠快速完成相關的開發任務,而且可以把相關實踐作為一個容易上手的游戲。另外,為了集中關注程序的基本邏輯,書中的Java代碼去掉了一些錯誤和異常處理,實際可以運行的代碼可以在本書附帶的光盤中找到。在以后的各章中會深入探索搜索引擎的每個組成模塊。

    SevnInfor 2011-08-02   2133   0
    P17

      Windows下Nutch的安裝 文檔

    ggyi2003 2011-07-31   5937   0
    搜索引擎   HTTP   HTML   XML   nutch  
    P17

      Nutch初體驗 文檔

    Lucene 不是完整的應用程序,而是一個用于實現全文檢索的軟件庫。 Nutch 是一個應用程序,可以以 Lucene 為基礎實現搜索引擎應用。

    ggyi2003 2011-07-31   550   0
    P5
    P4

      聚類方法及原理介紹 文檔

    將物理或抽象對象的集合分組成為有類似的對象組成的多個簇的過程被稱為聚類。由聚類所生成的簇是一組數據對象的集合,這些對象與同一個簇中的對象彼此相似,與其它簇中的對象相異。在許多應用中,可以將一個簇中的數據對象作為一個整體來對待。   目前在文獻中存在大量的聚類算法。算法的選擇取決于數據的類型、聚類的目的和應用。如果聚類分析備用作描述或探查的工具,可以對同樣的數據嘗試多種算法,以發現數據可能揭示的結果。

    fivesmallq 2011-07-23   4445   0
    P9

      Lucene多線程操作實現 文檔

    Lucene多線程操作實現對于并發,Lucene遵循以下規則:?1.允許任意多的讀操作并發,即任意數量用戶可同時對同一索引做檢索操作。2.即便正在進行索引修改操作(索引優化、添加文檔、刪除文檔),依然允許任意多的檢索操作并發執行。3.不允許并發修改操作,也就是說同一時間只允許一個索引修改操作。Lucene內部已經對多線程安全進行了處理,很多操作都使用了lock進行多線程同步鎖定。只要遵循一定的規則,就可以在多線程環境下安全運行Lucene。?

    shenhua 2011-07-21   564   0
    P4

      一個例子學懂搜索引擎(lucene) 文檔

    其實,lucene是一個很容易上手的搜索引擎框架,傳統的搜索引擎,涉及到爬蟲,也就是爬取網頁,然后對網頁進行加工,也就是索引,最后用于搜索,lucene這個框架可以很方便的幫你做到后面兩個步驟,也就是索引和搜索!本文嘗試通過一個例子,使大家掌握lucene的使用核心方法,包括分詞、索引、搜索不同的目錄、搜索不同的域,希望大家通過這個實例,對lucene和搜索引擎能有比較全面的認識! 其實,lucene是一個很容易上手的搜索引擎框架,傳統的搜索引擎,涉及到爬蟲,也就是爬取網頁,然后對網頁進行加工,也就是索引,最后用于搜 索,lucene這個框架可以很方便的幫你做到后面兩個步驟,也就是索引和搜索!本文嘗試通過一個例子,使大家掌握lucene的使用核心方法,包括分 詞、索引、搜索不同的目錄、搜索不同的域,希望大家通過這個實例,對lucene和搜索引擎能有比較全面的認識!

    shenhua 2011-07-21   560   0
    P4

      Solr簡介 文檔

    Solr是一個開源企業搜索服務器。她是一個成熟的互聯網搜索引擎(就像baidu,google),同時她也是一個優秀的企業搜索引擎。她是使用Java編寫的,便于進一步擴展和修改。服務器通訊采用HTTP和XML,除了一些搜索、返回結果列表常用功能,Solr還具有一些其他高級應用如:關鍵詞高亮顯示、搜索結果分類(大多數電子商務網站都可以見到)、拼寫檢查、自動建議、相似搜索結果。

    shit_up 2011-07-21   7546   0
    P44

      搜索引擎解密(Lucene與Solr) 文檔

    chaohuis 2011-07-11   5916   0
    1 2 3 4 5 6 7 8 9 10

    關鍵詞

    最新上傳

    熱門文檔

  • sesese色