盤點2014:十家最酷的大數據創業公司
英文原文:The 10 Coolest Big Data Startups Of 2014
近年來,很少有 IT 細分市場可以像大數據市場一樣吸引企業家的關注。如今,商業和消費者正在產生 TB 乃至 PB 級數據,大量公司也加大了研發,致力于收集、存儲、管理、分析數據。
以下是 2014 年大數據領域格外矚目的十家新興大數據創業公司
1. Aerospike
創始人和 CTO:Brian Bulkowski
包括 MongoDB、CouchBD 和 Redis 等公司都在爭奪下一代數據庫的市場份額。Aerospkie 創建于 2009 年,總部位于加州山景城。該公司研發了一組用于高性能應用的、實時的、閃存優化的 NoSQL 數據庫。
內存數據庫滿足可靠事務處理的 ACID(原子性、一致性、隔離性、持久性)需求。Forensiq 是一家提供在線廣告詐騙檢測服務的公司,11 月 Forensiq 宣稱其每個月需要用 Aerospike 提供的數據庫處理 1 萬億次請求。
年初 Aerospike 獲得 2000 萬美金的C輪融資。11 月,Aerospike 對數據庫性能進行了優化,提升了存儲能力,并進行了新功能和 Hadoop 的整合。
2. Altiscale
CEO: Raymie Stata
Hadoop 在 2014 年很火,但是其大數據平臺仍然十分復雜,并且很難用。這也是 Altiscale 和它的 Hadoop 服務引人注目的原因。Altiscale 的服務主要目的是解決 Hadoop 的抽象性與復雜性,為工程師搭建一個完整的 Hadoop 環境,并且對其進行維護與管理,讓用戶可以更專注于他們的數據與應用。當客戶的需求發生變化的時,Altiscale 也會做出相應的調整與變化。他還可以將 Apache Hadoop 加上業務支持作為云服務進行交付。
Altiscale,總部位于加州 Palo Alto,成立于 2012 年。今年 10 月這家公司開始提供 Hadoop 上的 SQL 服務,這使得可以通過使用 SQL 用戶接口或 API 訪問 Hadoop 數據。
Altiscale 的高層包括 CEO Raymie Stata 和 CTO David Chaiken 都來自雅虎,雅虎也是 Hadoop 的發源地。這些人知道他們自己在做什么。這個月初 Altiscale 獲得了 3000 萬美元的二輪融資。
3. Databricks
CEO:Ion Stoica
2014 年,Apache Spark 是大數據領域最火的技術之一,它是一款可以像 Hadoop 一樣提高大數據系統性能的內存數據處理引擎。這個開源軟件來自加州伯克利大學的一個項目。
Databricks 提供了一個基于 Spark 的平臺(該平臺發布于六月),用于處理數據轉換、探測、分析等大數據任務。2013 年成立的 Databricks 公司不是一家以開源技術為噱頭的創業公司。DatabrickCEOIon Stoica(加州伯克利大學的計算機科學的教授)和 CTO Matei Zaharia 創建了 Spark,他們借助大數據一站式服務軟件將他們的專業技術發揮的淋漓盡致。
4. DataStax
CEO:Billy Bosworth
DataStax 是下一代數據庫市場的另一個引領者,該公司支持 Apache Cassandra。Apache Cassandra 是高擴展性、容錯的 NoSQL 數據庫,思科、eBay 和 推ter 都在使用這種數據庫。
DataStax 銷售 DataStax 企業版,這是商化版本的 Cassandra,還銷售支持該平臺的工具和服務。這個月初,公司推出了 DSE4.6,其具備新的 Spark 流分析性能,這表明該公司開始涉足物聯網。
DataStax 成立于 2010 年,總部位于加州圣克拉拉,在 9 月的E輪融資中獲得驚人的 1 億 600 萬美元的融資,當下總計獲得 1.9 億美元融資。
5. DataTorrent
聯合創始人兼 CEO:Phu Hoang
DataTorrent 是幫助用戶即時處理、監控、分析數據的企業級實時流分析平臺。該公司聲稱基于 Hadoop 的 DataTorrent RTS 系統每秒可以執行數億次、甚至十億次處理。
當今,很多行業在大數據領域面臨的一大挑戰是延遲——如處理類似事務的流數據。DataTorrent 的聯合創始人兼 CEO Phu Hoang 曾在雅虎領導 Hadoop 的研發,也看到了類似 Data Torrent RTS 類產品的發展機會。這家在圣克拉拉的創業公司成立于 2012,在該年 6 月發布了 DataTorrent RTS,10 月發布了 RTS 2.0。
6. Qubole
聯合創始人和 CEO:Ashish Thusoo
基于 Haddop 的 Qubole 數據服務是一個云平臺,企業可以用該平臺存儲和管理大量的結構化和非結構化數據,且可執行數據分析和一些其它任務。你可能說 Qubole 很自戀:公司注重于使自己的平臺盡可能隨著規模及其他內置管理性能進行自管理;此外,友好的用戶交互自服務和數據整合功能都不需要數據科學家或程序員。
該公司 CEO Ashish Thusoo 與印度總裁 Joydeep Sen Sarma 在 2012 年一起創立了 Qubole。先前他們共同管理 非死book 的數據基礎建設團隊,負責大數據處理,之后他們共同參與了 Hadoop 的 Apache Hive 數據倉儲基礎建設項目。月初,這家公司在B輪融資獲得 1300 萬美元融資。
7. Snowflake Computing
CEO: Bob Muglia
Snowflake Computing 于 10 月悄然出現,推出了基于云的數據倉儲服務,其服務定位是成為復雜、昂貴本地數據倉庫系統的替代者,旨在實現靈活和易于管理等特性。Snowflake 的 Elatic 數據倉儲目前還是測試版,在未來將很有可能替代亞馬遜網絡服務 Redshift 和 Google 的 Big Query。
CEO Bob Muglia 說:“Snowflake 的 Elastic 數據倉儲服務相較于本地數據倉儲可以節省 90% 的成本,而且比競爭者 AWS 和 Google 的產品更易于使用。Snowflake Computing 目前研發的數據庫系統既可以處理結構化和半結構化的數據”
8. SumAll
CEO: Dane Atkinson
SumAll 認為不僅大企業需要大數據分析,中小型也需要。這家在紐約的初創公司為企業提供了一個可以收集企業電子商務、郵件市場、社交媒體、廣告系統(如谷歌的 AdWords)上的數據并在一個互動可視化界面進行展示的在線分析平臺。
SumAll 成立于 2011 年,側重于產品的易用性,其產品不僅銷往大企業,也銷往中小型企業。該公司網站的統計數據顯示,公司擁有 23.3 萬的 SumAll 用戶,獲得 1400 萬美元融資,雇員平均年齡 32.6 歲,每年消費 22 桶啤酒。
9. Tamr
聯合創始人和 CEO:Andy Palmer
大數據的一個問題是數據太大了,大數據通常有很多不同的數據源,而且這些數據源一直在變換。
Tamr 公司的軟件通過機器學習技術為這些數據源提供單一視角,同時為企業提供一個完整的數據資產庫存并尋找分布數據集之間的聯系。該公司的技術最早來自 MIT 的計算機與人工智能實驗室。
2013 年,數據庫專家 Michael Stonebraker、行業資深專家 Andy Palmer 和 Ihab Ilyas 共同創建了 Tamr,今年 5 月,公司正式運行。同時,這家基于劍橋和麻省的公司籌集了 1600 萬美元的風險投資。
10. WibiDat
聯合創始人和 CEO:Christophe Bisciglia
大家都很了解亞馬遜可以為商戶提供定制化的體驗。位于舊金山的 WibiData 創建于 2010 年,研制了一款可提供類似服務的實時應用。
該公司的 Wibi 企業平臺使用先進的分析技術給消費者提供推薦、定制化的內容和相關搜索結果。該平臺基于一組開源 Apache 技術,其中包括 Hadoop、HBase 和 Cassandra,也包括用于實時收集、分析、服務數據的 Kiji 開源框架。年初該公司發布了 WibiRetail,該應用是公司為零售商提供的首個“開箱即用”的應用。
投資人包括谷歌董事長 Eric Schmidt 和 Cloudera 創始人 Mike Olson。
<span id="shareA4" class="fl"> </span>
</div>