領英宣布開源數據挖掘軟件WhereHows

jopen 8年前發布 | 6K 次閱讀 WhereHows

領英宣布開源數據挖掘軟件WhereHows

領英稱即將開源他們內部的應用軟件 WhereHows,一個企業級的數據挖掘軟件。 

準確的說,領英稱它為“數據發現軟件”。從商業角度講,WhereHows 的目標是從分布式的多種元數據中進行挖掘。 

據領英發布的資料顯示,WhereHows 已經挖掘了 50,000 條數據集,14,000 條評論和 35,000,000 個工作機會,多達 15PB 的數據。 

在一篇博客中,領英解釋了創造 WhereHows 的原因:建造一個數據生態,適配各種程序,專注一項工作。因為領英有各種各樣形式的數據,從 Informatic 到 Spark,到 Oracle,再到 Hadoop、Teradate 等。領英稱: 

領英積累了大量的數據,形式多種多樣。對于不同的業務我們有不同的方案,而對于不同的方案我們有不同的驅動。這種專業化的解決方案很棒,因為它能讓我們在各方面都用上最好的工具,但是,這也帶來了問題。從這些不同的平臺、框架、系統中總覽所有數據非常困難。這將造成生產力方面的損失,我們的員工需要花多余的時間來尋找合適的數據集,同時也失去了對數據總體的理解。

企業需要將數據聯系起來。領英也有專業的數據倉庫團隊,但問題是,隨著系統的家里,數據的空間激增。 

領英宣布開源數據挖掘軟件WhereHows

很多企業有相同的問題,領英有 Hadoop,多種數據庫,Teradata 和各種應用程序。有了 WhereHows,這些數據都可以移動到同一個地方。這個項目完成之后,將是很大一筆財產。 

領英的想法是,希望開源社區能夠做些貢獻,比如解決 bug,增加特性之類的。

來自: www.iteye.com

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!