GitHub “唯星論”可以休矣

五嘎子 4年前發布 | 917 次閱讀 Github

  本文最初發表在 Towards Data Science,經原作者 Caleb Kaiser 授權,InfoQ 中文站翻譯并分享。

  開源項目在 GitHub 上的星(Star)并不是它的全部意義。

譯注:星是倉庫的書簽或贊賞表示。星標是項目受歡迎程度排名的手動方式。

  憑直覺我們都知道,GitHub 的星,對于開源項目來說并不是決定性的因素。點擊“星”按鈕這個行為只是表示用戶認為:“我覺得這個項目很有趣。”這是一個不錯的信號,但它并不是項目是否成功的定論。

  盡管如此,GitHub 的星還是很有誘惑力的。星很簡單,可以計數,而且還是積極反饋的信號。作為用戶,較高的星標數讓你有理由查驗一個項目而不是另一個項目。作為一個維護者,每一次星標數的增長都會讓你感到興奮——這是我的經驗之談。

  我在 Cortex 工作, Cortex 是開源機器學習基礎設施,盡管明知如此,我仍然會對星標數的激增感到莫名的亢奮。

GitHub “唯星論”可以休矣

  來源: https://star-history.t9t.io/#cortexlabs/cortex

  很顯然,我并不孤單。圍繞著 GitHub 的星,有一個完整的生態系統。開源營銷已經成為自己的利基市場。

GitHub “唯星論”可以休矣

  開源團隊致力于通過公告實現星的里程碑。已經出現了一套完整的工具,可用于跟蹤和分析星標數增長的情況(見上圖)。

  曾不知幾何起,GitHub 的星,從“支持一個項目的公開方式”悄然變為“開源軟件的流通貨幣”,因此,重新評估 GitHub 的星到底有什么價值是很有必要的。

  為什么 GitHub 的星沒有你想象的那么重要

  GitHub 的星確實是有價值的,不過這一點我們稍后再談。但今天對它們的強調,卻有些不相稱。總的來說,GitHub 的星并不像我們所認為的那樣有價值,原因有以下幾點:

  1. 星并不等同于用戶

  你可以在不使用項目的情況下就為它標星。你也可以在不標星的情況下去使用某個項目。這可能是顯而易見的事實,但必須強調的是,星與用戶之間并不存在必然的因果關系(當然,其中一個可以導致另一個)。

  例如,在 Cortex,就有數量驚人的用戶沒有在其倉庫上進行標星。

  我們評估 Cortex 是否健康是看它在生產環境中部署模型的人數。我們通過與實際用戶的互動來衡量。如果這個數字上升,我們就知道我們做的是對的。如果它下降了,就說明我們有一些問題需要去解決,即使星標數仍在增加。

  2. 星高度依賴環境

  GitHub 的星并不是一個一致的價值單位,不同項目之間的星標數比較,并非完全直截了當。

  一個項目的社區規模和活躍度、潛在用戶的數量以及維護者的營銷力度,都對該項目的星標數有著巨大的影響。

  比如,如果你是前端 JavaScript 框架,并且你有 非死book 的營銷預算,那么你的星標數就會比 DevOps 工程師的工具還要高。換言之,與 Elasticsearch 的星標數為 4.9 相比,Rect 的星標數只有 14.8 萬,但這一事實并不能說明 Elasticsearch 是否成功——它們的關系就好比蘋果和橘子一樣,沒有可比性。

  3. 從根本上說,GitHub 的星仍然是一種社交媒體

  雖然 GitHub 顯然不是 推ter,但 GitHub 的星仍然是一種社交媒體,所有通常的注意事項都適用。

  首先,一些 GitHub 用戶在社交方面比其他用戶更為活躍。有些用戶為 2000 個項目進行了標星,而有些用戶幾乎就沒標過星。

  同樣,很多 GitHub 用戶也會用標星來表示對一個項目的普遍支持,即使他們從未打算使用這個項目。例如,當我們剛推出 Cortex 時,我們收到了很多來自 Go 社區用戶標的星,甚至是那些對機器學習不感興趣的人。這并沒有什么不對,我們非常感謝大家的支持,但這只是強化了星與使用量的脫節。

  星并非所有的一切,但它們仍然很有價值

  盡管我提出了如前所述的注意事項,但如果你能獲得一顆星,仍然是好事一樁。

  GitHub 的星是人們普遍對一個項目感興趣的信號,同樣的道理,星標數可以為類似項目之間提供一個有用的基準。比較 React 和 Elasticsearch 可能沒有什么意義;但 React 的星標數是 Angular 的兩倍以上,這一事實可能是有意義的。

  GitHub 的星也會提供一些反饋,告訴你哪些人覺得這個項目有意思。對于 Cortex,我們發現這個項目不僅在數據科學家中很受歡迎,在開發人員中也很受歡迎,這一點很讓人驚訝。這就影響了我們如何開發這一項目的一些決策。

  最后,我要說的是,GitHub 的星,能夠讓一個項目更容易被發現。除去顯而易見的事實外,較高的星標數有助于項目脫穎而出,還會影響 GitHub 的推薦。我經常發現新的機器學習項目,那是因為我曾經給類似的項目標過星:

GitHub “唯星論”可以休矣

  出于所有這些原因,GitHub 的星還是有價值的,只不過它們并非評估開源項目的完整指標。

  作者介紹:

  Caleb Kaiser,Cortex Lab 創始團隊成員,曾在 AngelList 工作,最初在 Cadillac 供職。

  原文鏈接:

  https://towardsdatascience.com/github-stars-are-overvalued-15ba780b36

 本文由用戶 五嘎子 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!
  轉載自:https://www.infoq.cn/article/uRVsEzG2JTaCXFHW6Rza?utm_source=feedly&utm_medium=article