大數據與機器學習周報 第5期

jopen 8年前發布 | 30K 次閱讀 數據挖掘 大數據

新聞

  1. 《非死book發布了新工具AAT,盲人也可以“看到”圖片內容了》 :非死book 新發布了一個工具——自動選擇文本( Automatic Alternative Text ,以下簡稱 AAT ),通過物體識別技術識別圖像內容并讀出相關文本,幫助盲人和視力障礙者 “看到” 網站上的圖片。這個工具由 非死book 的無障礙小組研發,他們已經在這一項工具的研發上花費了幾個月的精力

  2. 《Salesforce收購人工智能初創公司MetaMind》 :對于此次收購,MetaMind 的聯合創始人兼 CEO Richard Socher 表示:“Salesforce 打算將 MetaMind 的技術融入到 Salesforce 的產品中去。對于 Salesforce 的非付費用戶,MetaMind 產品將于 5月4日 正式停止服務;對于 Salesforce 的付費用戶,MetaMind 將于 6月4日 正式停止服務。我們將在 4月11日 后開始刪除用戶儲存在上面的數據。”

  3. 《麻省理工學院推出“數據美國”大數據可視化工具》 :數據美國”項目得益于美國總統奧巴馬2013年簽署的一項政務數據公開(Open Data)法令,要求所有新增政府數據都必須以電腦文件形式向企業、研究者和公眾開放。當時的美國聯邦政府CIO Steven VanRoekel以GPS和天氣數據對公眾開放催生導航市場為例,指出開放數據將推動企業創新。奧巴馬認為,政務數據公開OpenData將刺激企業創新,增加就業機會,并提高政府執政效率

大數據

  1. 《深入對比數據科學工具箱:Python 和 R 之爭》 :本文從應用場景、數據流編程、數據可視化、速度等多個方面對Python和R做了對比

  2. 《Spark在美團的實踐》 :大數據處理滲透到了美團各業務線的各種應用場景,選擇合適、高效的數據處理引擎能夠大大提高數據生產的效率,進而間接或直接提升相關團隊的工作效率

  3. 《你的大數據項目使用的工具正確嗎?》 :工具/產品/解決方案是數據科學家洞察數據的利器。KDNuggets網站對此觀點進行了年度調查,來分析數據科學家在用哪些類型的工具,并提供了調查的匿名原始數據

  4. 《專訪盧億雷:談Hadoop生態的最新發展》 :在2016年Hadoop十歲生日之際,InfoQ策劃了一個Hadoop熱點系列文章,為大家梳理Hadoop這十年的變化,技術圈的生態狀況,回顧以前,激勵當下。本文是InfoQ處于一線開發的社區編輯對盧億雷老師進行的采訪,對大家關心的問題進行了專業的解答

  5. 《淘寶實戰——教你數據挖掘好方法》 :下面通過4種對應的場景來幫助讀者理解數據挖掘的4種任務

  6. 《大數據到底在用什么姿勢塑造我們》 :從龐雜的數據背后挖掘、分析用戶的行為習慣和喜好,找出更符合用戶「口味」的產品和服務,并結合用戶需求有針對性地調整和優化自身,就是大數據的價值

機器學習

  1. 《硅谷認為人工智能是下一個熱點》 :當硅谷巨頭們還在討論最新的科技熱潮是否正在滑向蕭條時,關于什么會推動行業下一次井噴式發展的言論已經出現了。我們使用計算機的方式正在朝著這樣一種趨勢發展(如果以經驗判斷,這種趨勢只是行業泡沫)——將海量數據儲存在所謂的云計算中心,然后根據數據分析結果建立新的商業模式。與這種使用方式聯系最緊密的詞應該是 “機器學習” 和 “人工智能”,或者說是 “AI”。其所涉及市場催生的創新產品影響范圍極廣,從遍布全球的計算機系統到自助餐廳的支付方式

  2. 《谷歌大腦團隊科學家出書了》

    經過兩年半的努力,由谷歌大腦團隊科學家 Ian Goodfellow, Yoshua Bengio and Aaron Courville撰寫MIT出版的《Deep Learning》,今天完成最終稿了,打印版本還需要些時日

  3. 《mxnet:結合R與GPU加速深度學習》 :近年來,深度學習可謂是機器學習方向的明星概念,不同的模型分別在圖像處理與自然語言處理等任務中取得了前所未有的好成績。在實際的應用中,大家除了關心模型的準確度,還常常希望能比較快速地完成模型的訓練。一個常用的加速手段便是將模型放在GPU上進行訓練。然而由于種種原因,R語言似乎缺少一個能夠在GPU上訓練深度學習模型的程序包

  4. 《將機器學習平臺H2O應用于物聯網》 :H2O是一個開源的、功能豐富的機器學習平臺。它整合了R和Spark,且因其易用性而出名。本文是對其應用于物聯網領域的概覽

  5. 《2025年前實現大陸汽車無人駕駛技術縱覽》 :眾所周知,勇于創新的互聯網巨頭谷歌在2009年啟動了無人駕駛汽車的試驗研究,作為一家非汽車制造商,此舉也讓歐美日各大汽車制造商的無人駕駛技術浮出水面。Tesla甚至喊出要第一個將無人駕駛汽車推向市場。相比而言,汽車零部件巨頭在自動駕駛領域的研發更顯低調,今天我們就來看一看德國大陸汽車集團在這方面的技術儲備

感謝杜小芳對本文的審校。

給InfoQ中文站投稿或者參與內容翻譯工作,請郵件至editors@cn.infoq.com。也歡迎大家通過新浪微博(@InfoQ,@丁曉昀),微信(微信號: InfoQChina )關注我們。

來自: http://www.infoq.com/cn/news/2016/04/Big-data-machine-learning-5

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!