揭秘騰訊大數據平臺與推薦應用架構

jopen 10年前發布 | 311K 次閱讀 架構 分布式/云計算/大數據

內容簡介:

  • 騰訊的月活躍用戶8.3億
  • 微信月活躍用戶4.4億
  • QQ空間月活躍用戶6.5億
  • 游戲月活躍用戶過億
  • </ul>

    如今騰訊的數據分析已經能做到始終“不落地”,即全部的實時處理。騰訊大數據平臺有如下核心模塊:TDW、TRC、TDBank、TPR和 Gaia。簡單來說,TDW用來做批量的離線計算,TRC負責做流式的實時計算,TPR負責精準推薦,TDBank則作為統一的數據采集入口,而底層的 Gaia則負責整個集群的資源調度和管理。李勇還特別強調了數據平臺體系化是應用基礎,數據應用商業化是價值導向。

    數據平臺體系化是應用基礎,數據應用商業化是價值導向。

    騰訊深度學習平臺的挑戰

    深度神經網絡模型復雜,訓練數據多,計算量大

    • 模型復雜:人腦有100多億個神經細胞,因此DNN的神經元和權重多
    • 訓練數據多:大量訓練數據才能訓練出復雜模型
    • ?微信語音識別:數萬個神經元,超過50,000,000參數,超過4,000,000,000樣本,單機訓練耗時以年計,流行的GPU卡需數周
    • </ul>

      深度神經網絡需要支持大模型

      • ?更深更寬的網絡能獲得更好的結果
      • ?以圖像識別為例,增加卷積層的filter數量,加大模型深度等,可獲得更好的模型質量
      • </ul>

        ?深度神經網絡訓練中超參數多,需要反復多次實驗

        • ?非線性模型:代價函數非凸,容易收斂到局部最優解
        • ?敏感的超參數:模型結構、輸入數據處理方式、權重初始化方案、參數配置、激活函數選擇、權重優化方法等
        • 數學基礎研究稍顯不足,倚重技巧和經驗
        • </ul>

          騰訊深度學習平臺Mariana

          ?騰訊有廣泛的深度學習應用需求,其挑戰如下

          • ?模型復雜,訓練數據多,計算量大
          • ?需要支持大模型
          • 訓練中超參數多,需要反復多次實驗
          • </ul>

            ?Mariana騰訊深度學習平臺提供三個框架解決上述問題

            • ?Mariana DNN: 深度神經網絡的GPU數據并行框架
            • ?Mariana CNN: 深度卷積神經網絡的GPU數據并行和模型并行框架
            • Mariana Cluster: 深度神經網絡的CPU集群框架
            • </ul>

              ?Mariana已支持了訓練加速、大模型和方便的訓練作業

              • ?微信語音識別6 GPU做到4.6倍加速比
              • 微信圖像識別4 GPU做到2.5倍加速比,并支持大模型
              • </ul>

                ?Mariana已成功應用到微信語音識別和微信圖像識別,并在廣點通廣告推薦的點擊率預估中積極嘗試

                揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構

                揭秘騰訊大數據平臺與推薦應用架構

                揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構 揭秘騰訊大數據平臺與推薦應用架構

                演講視頻查看>>>


                來自36大數據(36dsj.com):36大數據

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!