Quora數據科學家和機器學習工程師是如何合作的

jopen 8年前發布 | 6K 次閱讀 機器學習

 

數據科學家和機器學習工程師如何有效協作是一個困擾許多公司的問題。在前不久于舊金山舉行的MLConf大會上,Quora工程副總裁 Xavier Amatriain 介紹 了他們應對這一問題的方法。近日,他又援引Quora數據科學家 William Chen的說法 進一步闡述 了Quora的做法。

按照William的說法,在Quora,機器學習工程師是工程部門的組成部分,而數據科學家是數據科學部門的組成部分。工程部門負責構建產品和算法,并保證其快速可靠地運行,而數據科學部門負責理解Quora的數據,并指導產品決策。但機器學習工程師和數據科學家都會參與機器學習項目,他們的工作主要有如下兩個方面的差別:

  • 機器學習工程師構建、實現和維護機器學習系統;
  • 數據科學家進行研究,提出有關機器學習項目的構想,并通過分析了解機器學習系統對公司指標的影響。

更具體地講,機器學習工程師負責:

  • 構建和實現機器學習系統;
  • 維護機器學習系統,包括速度、可靠性和性能;
  • 開發供內部(機器學習工程師和數據科學家)使用的機器學習框架,為了一些常見任務(如訓練/測試)提供便利。

數據科學家負責:

  • 評估潛在的或現有的方法、功能、算法或誤差度量指標,幫助改進機器學習系統;
  • 分析機器學習算法對公司關鍵指標的影響;
  • 通過構建機器學習模型(僅用于一次性分析而不放入生產環境)研究和了解用戶行為模式。

通常,機器學習項目會同時配備數據科學家和機器學習工程師。在Quora,他們通過如下三個步驟實現合作:

  • 數據科學家進行研究,確定機器學習系統可能的需求或改進項;
  • 機器學習工程師構建、實現或改進機器學習系統;
  • 數據科學家評估機器學習系統對公司關鍵指標的影響。

對于William的說法,Xavier作了一些補充。他認為,機器學習團隊和數據科學團隊的界限很模糊。他更喜歡談論兩者的工作重心,而不是界限,因為定義團隊的目標是明確重點,而不是制造分歧。同樣地,機器學習工程師和數據科學家的界限也不清晰,那取決于個人的職業選擇和背景。例如,機器學習工程師并不一定是個編碼專家,他可以是一個有豐富機器學習經驗的人。數據科學家同樣如此。

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!