用大數據告訴你身邊的IT故事
最近我們 Team 利用 Dream 分布式計算平臺,做了這樣一件事情,將 Github 的大量數據通過爬蟲抓取下來,通過分析后,我們抽取最近一年中部分的開發者和項目信息,得到了如下有趣的信息,故分享之,數據原汁原味,無人工干涉。
第一份數據:全球 IT 人才分布
圖 1 全球 IT 人才分布圖
其中顏色越深,表示聚集的 IT 人才越多。其實從這一份數據來看,我們都能理解美國、中國、印度、俄羅斯是軟件大國,但是我們也發現,南非和巴西表現也不錯。
第二份數據:全球軟件城市排行榜
這些城市按照名次依次是:San Francisco、London、Berlin、Paris、New York、Stockholms、Beijing、Bangalore
通過對前 8 名的統計得出,硅谷地區依然是世界的 IT 中心,我們不要感覺歐洲 IT 產業不怎么好,從數據來看,他們的能力依然是非常出色的,北京與世界的差距依然存在,印度的硅谷與北京的差距并不明顯。
第三份數據:中國軟件城市排行榜
按照名次,他們依次是:Beijing、Shanghai、Hangzhou、Guangzhou、Shenzhen、Chengdu、Nanjing、Dalian、Xiamen、Qingdao。
這份數據再次證明了,北京上海是中國無法震撼的 IT 城市,即使是杭州,也有相當大的差距。南京市政府一直努力的中國軟件名城,需要很大的努力。
第四份數據:全球軟件企業排行榜
我們分析出來了其中 7 家企業,分別是: Google、推ter、Microsoft、Yandex、Red Hat、Globo.com、ThoughtWorks。
從這個圖來說:谷歌是開源社區的貢獻主力,但是名單上也有微軟公司,這也再次證明,微軟是同樣一家致力于開源世界的企業,當然這里肯定發現不了 Oracle。所有企業都發現了兩個問題:1.投資開源社區可以提升企業綜合影響力。2.要達到相同的影響力,投資額度小于廣告。
第五份數據:中國軟件企業排行榜
你期待這里出現什么樣的公司?我不敢瞎編,用數據說話,他們是:TaoBao、Baidu、Tencent、Douban Inc、Alibaba、netease。
這些公司都是國內目前比較活躍的軟件公司,但是 360 奇虎公司是個意外。我們很少關注的網易,最近一年也為開源社區做了不少貢獻。
第六份數據:全球 IT 高校排行榜
這份數據我真的不想拿出來,因為沒有中國的高校,我試圖讓名次更多一點,但是依然沒有發現。全球 IT 高校排行榜名單:Carnegie Mellon University、University of Washington、Stanford University、University of Michigan、Cornell University、Columbia University、University of Cambridge、University of Toronto、University of Waterloo。
數據再次驗證了卡內基梅隆是全球 IT 精英的殿堂。教育是非常重要的一部分,中國要成為軟件大國,還需要在教育上努力下功夫。
第七份數據:中國 IT 高校排行榜
雖然在上一份數據中,我們沒有發現中國高校,但是我們還是拿出了中國軟件高校排行榜:Tsinghua University、Zhejiang University、Peking University、Sun Yat-Sen University、Nanjing University、Shenzhen University。
清華大學一直是中國 IT 教育領域最好的高校,很多關于計算機的圖書都是清華大學出版的,當然中山大學卻有點讓人意外。
總結:事實告訴我們,所有的什么軟件大國,所有的軟實力,都不能只是口號,我們需要實際行動,中國要成為軟件大國,甚至是強國,還有很長的路要走。為什么?開源是在醞釀新技術,是新技術發展的搖籃!