推特上有多少「新五毛」?
大家都知道,相對于微博來說,推特上不存在言論管制,但是這種事情怎么可以讓他發生呢?那還不天下大亂?隨時隨地都要關心你的組織當然得把偉大的 光芒投射到這一片「法外之地」,于是從很久以前開始,組織就會弄很多帳號來關心大家的思想動態。當然,有的負責聽,有的負責說。不過之前的手段都很粗糙, 特別是頂著一個蛋頭,說一些連微博上的五毛都不好意思說的話,廣大推友們迅速就能識別,要么拉黑要么舉報,很快的這些帳號就消失了,也不知道組織設立這些 帳號的成本有多大。當然,另一方面,如果只是以發推數目來計算工作量,而不是以「輿論導向」的結果來算的話,我覺得這些帳號還是完成任務了的。
很長一段時間都沒有被這樣的五毛帳號(我稱之為「老五毛」)騷擾了,突然前幾天,我發了一條
中紀委給老外解釋“四風”:都是“胖子”干壞事:形式主義:一個干部模樣的胖子被公章、文件包圍;官僚主義:還是那個胖子坐在高椅上,另外一個瘦瘦 的群眾模樣的人可憐地站在下面仰望他;享樂主義:胖子躺進酒杯里,臉喝得紅撲撲;奢靡之風:擺滿大餐的桌前,胖子大吃大喝——習總:尼瑪
過會在推上突然就遭到了圍攻,如下圖:
然后我點開進去這些賬號的頁面看了看,發現似乎官方在利用另一個方法來開展五毛活動(我稱之為「新五毛」),具體表現如下:
- 頭像不再是蛋頭,而且昵稱顯得比較正常
- 用戶名多數是字母+數字,而且多數情況下字母是若干英文名拼起來的,比如 matthewjesus00,quentinsamuel8
- 大多數時間,自動發雞湯段子,而且一定帶圖,雞湯段子一般來自 推ter for Google TV 這個客戶端,估計是自己寫的,而且一看就是自動發的,比如這條
- 條件觸發后,若干個賬號會開始同時攻擊,攻擊推文一般來自 推ter for iPhone 和 TweetDeck
- 不再關注「敏感人士」,而是關注其他的「五毛賬號」
既然有這最后一點,于是我寫了個爬蟲,從某一個賬號開始,抓取他的關注列表,篩選后放入數據庫,然后再抓這些關注列表中五毛的關注列表,就這樣不斷循環。篩選標準為
- 發的是中文推
- Fav 很少,這里閾值我取的是5
- 最后一推基本上來自 iPad、Windows Phone、Google TV、TweetDeck 和 Mac 這幾個客戶端,顯然是用的官方 Key/Secret
- 注冊時間晚于 13 年 1 月 1 日
一開始我還想著這樣的賬號很多,我這樣抓應該是抓不完的,萬萬沒想到,最后抓取能夠完成,并且形成了一個封閉的集合。一共抓取到2581名用戶,148995條互相關注的信息。
下面是對這些賬號和關注情況的分析:
- 74. 6% 采用字母+數字作為賬號,純字母為 25.1%,純數字不到1%
- 有很多很明顯的冒充賬號,集中在 @huangbin87 和 @ggnn9,前者有 19 個冒充賬號,后者有 22 個冒充賬號,名字和頭像都一樣。這個冒充賬號 @huanqbin87 簡直可以以假亂真,看 foer 里面有不少是上當受騙了的。
- 都是 2014 年注冊的,注冊月份分布如下圖:
看來六月份一定有什么要緊的事件,需要這么多的賬號來引導輿論。
-
計算一下在他的 Foing/Foer 里面有多少是抓取到的五毛,這個分布說明抓取的結果還是不錯的
-
Foing/Foers 數分布集中在 200 左右,如下圖
-
最后一推的客戶端分布,以 TweetDeck 和 Google TV 為主
-
日推分布,不高:
-
將他們的最后一推按時間分布,看不出什么規律,不過似乎我們睡覺的時候五毛也睡了。
-
最后,看一張「新五毛網絡」全圖:
-
在這個高度互相關注的「新五毛網絡」里面,Foer 最多的是 @eubinnvrok 這個賬號,高達 719 位,而他實際上也就只有 719 個 Foer,第二多的是 @ioannrfcptasy 這個賬號,有 642 位「新五毛」關注了他,但是他的 Foer 是有 643 位,是哪一個正常賬號會關注他呢?一看是一位叫做「五毛黨主席」的 @lpzhawei,實至名歸。
總結:看來現在組織對之前的「人盯人」五毛已經不是很滿意了,開發出了新一代的「雞湯五毛」,平時裝作雞湯手,還能騙幾個 fo,條件一觸發(不知道是人肉還是自動)就展開攻擊。但是能不能裝得更像正常人一點呢?或許人工智能的突破口就在這里呢。
<span id="shareA4" class="fl">
</span>