出于我前面的貼子大贊了 Apache Ignite 的基于內存的文件系統和緩存功能,我將總結一下我將總結一下 Ignite 和 Spark 的主要區別。我發現這樣的問題被重復提出。這很容易回答,因此不必在網上“挖墳”。
Apache Tika是一個Java工具包用于利用現有的解析類庫,從不同格式的文檔中(例如HTML,PDF,Doc),檢測和提取出元數據和結構化內容。 功能包括: 1.檢測文檔的類型,字符編碼,語言,等其他現有文檔的屬性。2.提取結構化的文字內容。3.該項目的目標使用群體主要為搜索引擎以及其他內容索引和分析工具。目前支持的文檔格式和對應的解析類庫如下: 文檔格式 相應的解析類庫 HTML TagS
Pig是一個基于Hadoop的大規模數據分析平臺,它提供的SQL-LIKE語言叫Pig Latin,該語言的編譯器會把類SQL的數據分析請求轉換為一系列經過優化處理的MapReduce運算。Pig為復雜的海量數據并行計算提供了一個簡單的操作和編程接口。 Pig的實現有 5 個主要的部分構成: 如圖所示: 1. Pig自己實現的一套框架對輸入、輸出的人機交互部分的實現,就是Pig Latin 。 2
Apache Lenya 是java的開源內容管理系統。它基于一些標準的技術比如XML 與 XSLT。它其中的代碼核心來自于另外一個開源項目Cocoon
除 Hibernate 之外的另一個開源 O/R 框架 Cayenne ,被成功用于商業生產環境。NHL.com 就是使用的 Cayenne ,每天超過 5 million 次的訪問量。Apache Cayenne是一個強大而易于掌握的Java? ORM框架。Cayenne提供了 Java 對象到關系型數據庫的持久化映射管理,單方法調用查詢和更新(包括細粒度的更新所有被修改的對象),無縫隙的把多種
Apache Cassandra是一套開源分布式Key-Value存儲系統。它最初由Facebook開發,用于儲存特別大的數據。擁有:分布式;基于column的結構化;高伸展性等特點。它不是一個數據庫,而是由一堆數據庫節點共同構成的一個分布式網絡服務,對Cassandra 的一個寫操作,會被復制到其他節點上去,對Cassandra的讀操作,也會被路由到某個節點上面去讀取。對于一個Cassandra
這個Slide項目的主要模塊是一個可以做為內容管理框架底層的內容倉庫.它可以把內容信息存取到專門的,異質的,分布式的數據庫中.Slide還增加了security, locking, versioning等特性.Slide也提供了一個WebDAV訪問模塊(由于一個servlet實現),WebDAV是一個IETF標準被許多公司認可如Microsoft, IBM, Novell, Adobe等,所以所有
Apache POI可以讓你使用Java來讀寫MS Excel ,Word、PowerPoint文件
Solr是一個高性能,采用Java5開發,基于Lucene的全文搜索服務器。文檔通過Http利用XML加到一個搜索集合中。查詢該集合也是通過http收到一個XML/JSON響應來實現。它的主要特性包括:高效、靈活的緩存功能,垂直搜索功能,高亮顯示搜索結果,通過索引復制來提高可用性,提供一套強大Data Schema來定義字段,類型和設置文本分析,提供基于Web的管理界面等。
Apache Cassandra是一套開源分布式 Key-Value 存儲系統。它最初由 Facebook 開發,用于儲存特別大的數據。 Cassandra 不是一個數據庫,它是一個混合型的非關系的數據庫,類似于 Google 的 BigTable。本文主要從以下五個方面來介紹 Cassandra:Cassandra 的數據模型、安裝和配制 Cassandra、常用編程語言使用 Cassandra
Apache Geronimo 是 Apache 軟件基金會的開放源碼J2EE服務器,它集成了眾多先進技術和設計理念。 這些技術和理念大多源自獨立的項目,配置和部署模型也各不相同。 Geronimo能將這些項目和方法的配置及部署完全整合到一個統一、易用的模型中。 作為符合J2EE標準的服務器,Geronimo提供了豐富的功能集和無責任 Apache 許可,具備“立即部署”式J2EE 1.4容器的各
Apache Archiva是一套可擴展的Artifact Repository管理系統。它能夠與Maven,Continuum和ANT等構建工具完美結合。Archiva提供的功能包括:遠程Repository代理,基于角色的安全訪問管理,Artifact分發、維護、查詢,生成使用報告,提供基于Web的管理界面等。
Apache Forrest是一個把來自各種不同的輸入數據源轉換成用一種或多種輸出格式(比如HTML,PDF等)來統一顯示的發布系統。它基于Apache Cocoon并分離了內容與內容結構,不僅可以生成靜態的文檔也可以當作一個動態的服務器。
Apache DeviceMap當前還是一個孵化項目,用于創建數據倉庫包含所有各種移動設備(平板、手機等)的信息,鏡像(images),和其它相關的信息。
前言Maven - 這一Java社區事實標準的項目管理工具,能幫你從瑣碎的手工勞動中解脫出來,幫你規范整個組織的構建系統。不僅如此,它還有依賴管理、自動生成項目站點等特性。有了它,你不需要再到處找依賴的JAR,源代碼,API文檔,更不用在Eclipse里手工搭建項目,無數次的在JavaBuildPath里嘗試依賴的Projects。Eclipse中使用Maven+Git5分鐘入門安裝開發環境只需要Java和Eclipse。為了使用私服,Maven需要配置一個用戶文件,否則配置這一環節可以跳過。
制作一臺服務器,來提高網頁服務,只要安裝了一個能提供網頁服務的軟件的電腦,就可以稱之為網頁服務器。常見的網頁服務器軟件ApacheIISNginxGoogle安裝Apache1.在D盤根目錄下新建一個文件,命名為amp,并分別創建apache、php和mysql文件夾2.填寫基本信息選擇自定義安裝,選擇安裝路徑安裝,完成6測試安裝是否成功在瀏覽器中
Apache CXF一個開源的Service框架,它實現了JCP與Web Service中一些重要標準。CXF簡化了構造,集成,面 向服務架構(SOA)業務組件與技術的靈活復用。在CXF中,Service使用WSDL標準定義并能夠使用各種不同的消息 格式(或binding)和網絡協議(transports)包括SOAP、XML(通過HTTP或JMS)進行訪問。CXF同樣支持多種model 如:JA
Apache Neethi該組件為Axis2提供了非完整的WS-Policy實現,允許 Axis2用戶操作和組合策略文檔。是Axis2用于創建策略文檔的運行時表示形式、以及對策略文檔執行規范化、合并和求交操作的工具。WS-Policy 提供了指定Web服務的可能配置以及執行定義的安全性和身份驗證的一種方式。 收錄時間:2011-04-13 15:57:14
Apache Torque是一個使用關系數據庫作為存儲手段的Java應用程序持久化工具,是 Apache 的公開源代碼項目,Torque是一個開源項目,由Web應用程序框架Jakarta Apache Turbine發展而來,但現在已完全獨立于Turbine。 Torque 主要包含兩部分:一部分是 Generator,它可以產生應用程序需要的所有數據庫資源,包括 sql 和 java 文件;另外
Apache Harmony是Apache軟件基金會的一個開放源碼JavaSE的實現。其目標是完成一個兼容的、獨立的JavaSE5 JDK實現,并基于Apache License v2許可發布;和一個由社區開發的模塊化的運行時(包括虛擬機和類庫)體系結構。