道哥 - 我理解的大數據(二)

jopen 10年前發布 | 7K 次閱讀 大數據

我理解的大數據(二)

 

昨天偷懶了少了一次文字排版,沒想到好多朋友發消息來說字體變小了不習慣,看來堅持大一點的字體還是有好處的。

雖然很想保持高頻率更新,但沒想到回阿里后工作竟然比創業時還忙。經常回家得比較晚,再加上每天腦力使用過度,所以竟是硬生生的斷更了兩周。在接下來我想如果可能的話,把更新的時間調整到周日的晚上,周末可能會稍微空閑點。

在此也再征集一下大家想看的話題,可以向我提問,我會選取部分作為接下來文章的選題。

延伸一下昨天關于大數據的話題。在安全行業里未來真正會具備核心競爭力的,我認為正是這樣的全局視角帶來的改變。

比如近年來興起的「撞庫」攻擊。因為各大公司用戶數據的泄露,黑客手上已經擁有了數十億條用戶數據,其中20%包含了明文密碼。在過去黑客想破解一 個用戶的密碼,可能會通過字符的排列組合生成一部字典,逐個嘗試,這樣破解的效率無疑是相當低的。但現在因為有了全網用戶的「密碼庫」,只需要簡單的查詢 用戶名,多半就能知道密碼是什么,簡單粗暴。

大數據就應該這么簡單粗暴的應用,以一種完全不講道理的方式直接達到效果,根本不需要什么精巧的算法,就像「把大象裝進冰箱」里一樣。

類似的,國外一家安全公司Akamai宣稱他們能非常有效的阻斷DDoS攻擊,原因是他們通過和運營商合作的方式獲取了全球30%左右的流量,從而能有效的監控到全球所有的惡意IP,發現有攻擊過來,直接根據IP信息就阻斷了。這也是大數據的一種典型應用。

再舉一個例子,數據可能來自于過去沒有注意到的地方。對于電話詐騙的傳統解決思路,一般是從用戶的來電號碼著手,或者是從周邊信息比如短信、傳播來 源入手。這些傳統方法已經逐漸的變得效率低下。但目前有一種解決思路是根據用戶的「聲紋」信息進行有效識別,這樣只要積累了一個用戶的「聲紋信息庫」,就 能夠在每個用戶通話時,直接識別出被標記為詐騙的那個用戶。

所謂「聲紋」就像是指紋信息一樣,每個人說話的聲音其實都是獨一無二的,通過數字化的方法能夠有效的識別出來。目前國外一些安全公司會把這種技術用 在Call Center中進行反欺詐。但聲紋信息和指紋信息一樣,會成為國家安全基礎設施的一部分。比如國外的一些機構,一旦掌握了所有中國人,包括政府領導人的指 紋信息,會釀成什么后果很難想象。這也是為什么中國政府的工作人員會禁用蘋果手機的原因,至少蘋果收集用戶的指紋信息會威脅到國家安全。

所以,我理解的大數據,和各種復雜的算法沒有直接關系,那最多只是錦上添花。我理解的大數據,就是這么簡單粗暴,以高一個維度的視角毫不講道理的直搗黃龍。

兩點之間什么最短?在二維空間是直線最短。但到了三維空間,兩點之間距離可以為零(蟲洞),比如把一張紙上的兩點對折后貼起來。
 

==== 道哥的黑板報 ====

走在創業道路上的文藝白帽子。

微博、知乎:aullik5

http://taosay.net

微信公號:道哥的黑板報,微信ID:taosay

原文鏈接: http://taosay.net/index.php/2014/12/01/%e6%88%91%e7%90%86%e8%a7%a3%e7%9a%84%e5%a4%a7%e6%95%b0%e6%8d%ae%ef%bc%88%e4%ba%8c%ef%bc%89/

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!