GitHub中國開發者年度分析報告

jopen 9年前發布 | 13K 次閱讀 Github

原文  http://www.infoq.com/cn/articles/github-chinese-developers-annual-analysis-report

近日,GitHuber.info以 GitHub API 為基礎,結合GitHub用戶的地理位置信息,整理發布了 《2014年GitHub中國開發者年度報告》 。報告中分析了GitHub中國用戶的比例、活躍用戶數、活躍時間段、倉庫數量、PR數量、項目Star數量、組織等信息,并就相關指標與美國開發者做了對比。同樣,GitHub官方也會發布 年度的用戶報告 ,InfoQ編輯結合官方與社區發布的數據,對GitHub上的中國開發者情況做了一個簡單的回望。

1. GitHub用戶數

GitHub成立于2008年,是一個社區型的代碼協作平臺。根據 2012年的報告 顯示,GitHub在2008年就有4萬多的用戶,在2009年迅速增長為16萬,根據官方發布的增長數據可以推斷出2013年已經有近600萬(具體數 字是5843193)用戶,新增用戶有300萬之多。GitHuber.info社區通過API計算得出,截止到2015年1月20日,GitHub用戶 數已經超過千萬(10475867)。如果這個數據準確,那2014年GitHub的用戶增長就有400萬。

GitHub中國開發者年度分析報告

從2012年的報告中得知,GitHub中用戶數最多(官方給出的數據是訪問量最多,這里姑且認為訪問量和用戶數成正比)的五個國家分別是美國、德國、英 國、中國和日本,2013年是美國、德國、中國、英國、印度,而據微博上一位GitHub員工透漏,2014年中國已經成為GitHub用戶數最多的第二 大國家。2013年官方公布的數據顯示,所有的注冊用戶中中國用戶占5.8%,如果以此比例來計算,那現在GitHub上的中國開發者大概有60萬。

2. 開發語言

2014年5月就曾有分析機構 利用GitHub來統計分析編程語言的發展趨勢 ,分析結果顯示GitHub 上主流的五種開發語言分別是JavaScript、Ruby、Java、PHP和 Python,其中CSS占的比例也比較大,C和C++處于中等水平,Go之類的新型語言體量還是比較小。GitHuber.info對中美開發者的語言 情況做了對比,其中JavaScript和CSS占絕對優勢,兩者加起來接近1/3,這也不難理解,JavaScript和CSS是前端開發的必備語言, 更何況還有Node.js之類的服務器端JavaScript語言。而排名第三的語言中美國和中國分別是Ruby和Java,緊接著是Shell和 Python。值得注意的是,PHP并沒有進入前五,這也可能和該語言的使用場景有關(見過最多的PHP類開源項目就是各類CMS)。兩個國家的開發者中 使用.NET的用戶都比較少,這和微軟一直不鼓勵開源的社區生態有關,隨著新一年微軟在開源方面的投入,相信.NET相關的開源項目會逐漸增多。

需要注意的是,由于GitHuber.info統計國家時只能根據用戶的Location信息識別,而很多用戶都沒有填寫Location信息,所以文中涉及到GitHuber方的數據時均指帶有Location信息的用戶。

GitHub中國開發者年度分析報告

GitHub中國開發者年度分析報告

3. 項目情況

從倉庫數來看,大多數開發者(75%)都擁有0-5個倉庫,中美開發者差別不大。由于統計的是去除Fork的倉庫,所以0-5個也屬于正常情況,一個用戶能玩轉屬于自己的幾個開源項目,已經非常不錯了。

GitHub中國開發者年度分析報告

而考量項目的質量可以從項目的Star數量來看,同樣,絕大多數的項目都只有0-5個Star,其中中國開發者的比例為67%,美國開發者為80%。如果以Star大于1萬的標準來衡量優質項目,那中國沒有,Star數量最高的是 awesome-python ,有9393個Star。

GitHub中國開發者年度分析報告

從項目的代碼量來看,中美開發者懸殊比較大,GitHuber.info統計到的數據中美國用戶的代碼數量(字節)大多在1萬到10萬之間,而中 國用戶大多在0到1000之間(也就是基本為0),美國開發者的代碼量遠大于中國。從分支數來看,美國和中國的對比相差不多,大多項目的分支數量都在3個 以下,這也反映出?部分項目還是純個人業余開發,并沒有達到需要規范分支的程度。但同樣由于美國開發者基數比較大,所以總體來看,美國開發者好于中國開發 者。另外,90%的項目的貢獻者不超過5個人,90%的項目幾乎沒有PR和Issue,所以在人力投入比較少,且沒有反饋的情況下,大多數的項目都沒有長 遠的發展。

4. 活躍時間

GitHuber.info官方沒有列出美國開發者的活躍時間,這里將官方2013年的數據作為對比,與美國開發者一樣,一周中中國開發者最活躍 的是周二和周三,最不活躍的是周六。比較有意思的是,周末兩天美國開發者的活躍度都比較低,而中國開發者周日非常活躍,甚至比周五的還要高。細化到每天, 更是傷人心。中國開發者每天最活躍的時間是凌晨0點到2點之間,而美國開發者是上午9點左右和下午1點左右。總體來看,代碼推送的活躍度上午明顯高于下 午,美國開發者是白天明顯高于晚上,而中國開發者是晚上明顯高于白天。

GitHub中國開發者年度分析報告

GitHub中國開發者年度分析報告

5. 組織

組織是GitHub新的賬號管理模式,旨在滿足大型開發團隊的需求。組織是非登錄賬號,需要以GitHub用戶身份登錄,然后再創建自己的組織。 截止2015年1月20日,GitHuber.info根據API統計到一共有2500 個中國區組織和約25000個美國區組織,GitHub的用戶數美國是中國的4倍,但是組織數美國卻是中國的10倍,看來中國使用者并不喜歡團隊協作。

組織部分總體的分布趨勢和項目很類似,不過各項統計按比例來算要比項目信息稍差一些。按理說組織中的項目應該更容易吸引成員參與,從而在PR、 Issue上有更好的表現。反過來說,目前中國的組織并沒有充分發揮組織的作用,對開源項目的發展推動不大。目前國內的優秀開源項目主要還是依靠線下團隊 的合作開發,距離美國開源項目的眾包模式還有些差距。

GitHub中國開發者年度分析報告

剛剛從GitHub官方郵件中得知,GitHub今年不會再發布 Octoverse報告 ,不過感興趣的讀者可以郵件 press@github.com獲取一些官方可以公布的數據,InfoQ正在與官方聯系,希望獲取一些中國開發者的詳細報告,我們也會及時公開各項數 據。從GitHub用戶增長數量也可以看到開源的趨勢,隨著國內開源環境的成熟,優質的國產開源項目也越來越多,InfoQ也會全程跟蹤報道國內的開源狀 態,敬請關注。

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!