外國科學家探秘新浪微博
我們都知道,新浪微博是一個很和諧的地方,這也沒什么需要探尋或質疑的成分。然而,有那么一群人對新浪微博的和諧機制產生了興趣。這些人思想不正常嗎?不,因為他們是一群外國人。
以 Dan Wallach 為首的計算機專家們今日通過 technologyreview 發布了他們對新浪微博和諧機制的研究結果。令他們感到好奇并加以研究的是,新浪微博作為一個用戶破 4 億、每天產生 1 億條微博的社交平臺,究竟如何完成如此大規模的平臺內容凈化工作,這背后又需要多少的工作人員。
很明顯,Dan Wallach 和他的同事們生活在中國,或至少是新浪微博的用戶。他們準確地分清了用戶自主刪除微博與平臺和諧刪除微博的區別,還劃定了自己的研究范圍——研究不恰當微博在發出后多長的時間內會被系統刪除,從而推測平臺背后的運行方式。
監測微博上的所有用戶很不現實,研究團隊因此選定了一個有代表性的樣本團體——樣本中只有 3500 位用戶,但他們在研究前 15 天內發布了全站 12% 的不和諧內容。監測結果顯示,30% 的微博被當即刪除(1 分鐘內),另外有 5% 會在 8 分鐘內被刪除;總體上,90% 的不恰當微博會在一天內被刪除,偶爾會有一些漏網之魚能夠存活一天以上。
低延遲的刪除效率透露了一個事實,新浪微博負責凈化內容的工作人員工作得很賣力,而且人很多。有多少人呢?Dan 估算,一個檢查員每分鐘審查 50 條微博,每天連續工作 8 小時,這就需要 4200 個人輪崗。當然,這只是理想情況,現實數字會更大。
好奇心害死貓,Dan 的研究團隊又對這些工作人員的作息產生了興趣。經過他們的觀察,新浪微博在夜間的刪除效率普遍低于白天,Dan 認為這是因為上夜班的人比較少。令人感興趣的是,觀測結果顯示,晚上 7 點左右新浪微博的刪除效率會出現短暫性的下降。Dan 解釋道,這大概是因為新聞聯播的播出。當然,這是一個外國人能給出的合理解釋,也有可能刪微博的是軍人。
眾所周知的是,新浪微博會通過一系列輔助機制幫助凈化平臺內容,例如監控曾有不良記錄的用戶、敏感詞檢查等等。Dan 表示,他們會繼續對此進行進一步的分析研究,比如新浪微博后臺如何制定微博審查的優先級標準。最后,Dan 希望團隊的研究不會被不可抗力所阻擋,希望他們的微博賬戶及 Tor 網絡連接不要被查封。