在整個互聯網中,成人網站有多大?

jopen 11年前發布 | 12K 次閱讀 互聯網

        上網之人,多少都會接觸過成人網站。這是一個舉世公認的事實。

        不過這是一個難以洞察的領域,因為相關數據少之又少。我們知道成人網站都是那些在互聯網上有著超高流量的網站。根據 Google DoubleClick 的 Ad Planner 服務(通過 cookie 跟蹤網民)顯示,全球 Top 500 網站中,就有數十個成人網站。全球最大的色情網站 Xvideos 每月網頁瀏覽量(Page Views,PV)高達 44 億,是 CNN 或 ESPN 新聞網站的 3 倍,是 Reddit 的 2 倍。LiveJasmin 也不小。除了 Google 和 非死book 等大站,其他網站在 YouPorn、Tube8 和 PornHub 面前都是小巫見大巫。

        雖然網頁瀏覽量是一個很好的起始點,但它們僅告訴我們某些色情網站比某些非色情網站要受歡迎。40 億的 PV,聽起來很多,但當我們把那些X站用戶實際在做的事考慮進來,成人網站的大小和規模就有點明朗了。

        規模

在整個互聯網中,成人網站有多大?

        色情網站和非色情網站的主頁區別是訪客的平均停留時間。諸如 Engadget 等新聞網站的平均停留時間是 3 – 6 分鐘,大約是是閱讀 1 – 2 篇文章。然而色情網站的停留時間,大約是在 15 – 20 分鐘。

        大部分網站的內容主要是文本和圖像,而成人大站則是視頻。ExtremeTech 首頁完全加載大約是幾兆數據,打開一篇文章,大約是 500kb 數據。訪問色情網站,假設是打開一個 480×200 低分辨率的視頻,每秒傳輸 100 kb 數據。15 分鐘的話,那就大約是 90 MB 數據了。

        Xvideos 每月有 3.5 億訪問次數,乘以 90 MB,那就每月傳輸大約 29 PB 數據,也就是每秒傳送數據約 50 GB。做個對比,你家網絡連接可能每秒傳送兩兆(2 MB),Xvideos 是你家的 25,000 倍。

        簡而言之,色情網站是在處理天文數字級別的數據。在原始帶寬(Raw Bandwidth)方面,能與之匹敵的網站,也就只有 油Tube 或 Hulu,而 YouPorn 卻又是 Hulu 的 6 倍。

        基礎設施

        就支持視頻所需的資源,數據存儲器、CPU 周期、I/O 和帶寬,遠超過文本和圖像所需要的資源。

        當然了,雖然每個網站的情況又不一樣了,但大部分成人站點都有 50 至 200 TB 的成人資料。對一個網站來說,這是個大數目(Google、非死book、Blogger 和 油Tube 之流存儲的數據比這還要多),好在現在 2 TB 的硬盤便宜。

        CPU 周期和 I/O 會影響視頻流和 PV 數量。首先,色情網站要提供動態、可搜索的海量視頻數據庫,然后點播視頻時,從硬盤讀取文件,再網絡上傳輸。如果你有過在局域網傳送大量大文件的經歷,你就會知道網絡系統的壓力有多大了。

        硬件設備情況,實際上我們幾乎無法知曉,因為色情網站也沒公布過。雖然如此,但我們討論的大型色情網站會有四核服務器、千兆交換機、負載均衡 器。在軟件方面,大部分大型色情網站都會使用超高吞吐量的數據庫(比如 Redis )來存儲和提供視頻,還有輕量級的 HTTP 服務器(比如 Nginx )。

        最后說帶寬。還是以 Xvideos 為例(基于 Ad Planner 的數據估測),大型色情網站必須有足夠的連通性(connectivity)來支撐每秒 50 GB(400Gbps )。這還只是平均傳輸速率。在高峰期間,Xvideos 或許要 1,000Gbps  (1Tbps) ,或更高 。在倫敦和紐約直接的連通性也才 15Tbps。

        有很多方法來處理高流量:自己搞個數據中心,或者去大數據中心租賃幾排架的服務器,或者使用諸如 Amazon AWS 和 Microsoft Azure 之類的云服務。

        真實案例

        YouPorn 是全球第二大的色情網站,足夠提供研究數據。另外要說一下,DoubleClick  的 Ad Planner 中的估測數據比實際數據要低很多的。

        YouPorn 有“超過 100 TB 的干貨”,每天網頁瀏覽量超過 1 億。總而言,這相當于每天傳送 950 TB 數據(大部分都是視頻流),每月大約傳送 29 PB。Xvideos 肯定不止 28 PB 這個估測值了,它可能是每月 35 – 40 TB。

在整個互聯網中,成人網站有多大?

        在高峰期,YouPorn 每秒得響應 4000 個網頁,相當于有每秒 100 GB 或(800 Gbps )的突發流量。這相當月每秒傳送 10+ 張雙層 DVD。

        在軟件方面,YouPorn 的主數據庫是 Redis,用 MySQL 作為管理工具,用于管理和向 Redis 簇中添加數據。后端是 Perl 和 MySQL,不過在 2011 年改成了 PHP + Redis。HTTP 服務器是 Nginx,同時用 HAProxy  和 Varnish  做負載均衡。

        Redis 服務器可以每秒處理 30 萬請求,每小時記錄下 8 – 15 GB 數據,包括訪客日志、行為數據等。據說 Redis 可以抗住 2 億的日 PV。

        (譯注:2012 年 2 月份,YouPorn 的技術人員 Eric Pickup 在 Google 群組宣告他們網站改用 Redis DB 后。扛住了每天 1 億 PV 瀏覽量,每秒 30 萬請求,已經堅持 2 周。Eric 還將去加拿大一個技術大會分享經驗。)

        令人悲傷的是,YouPorn 拒絕透露硬件設備信息。從 YouPorn 的 CDN 的 IP 地址來看,它應該沒有使用云服務,應該托管在某地的大型數據中心。

        互聯網每天大約處理 1/2 EB 數據,相當于每秒處理 50Tb, YouPorn 的 800Gbps 這個數字,幾乎就占了互聯網中每秒流量的 2%。而全球有幾十個和 YouPorn 規模相當的色情網站。互聯網流量中色情內容占據了 30%,這個說法也就不是不現實的哦。

        (譯注:1 EB = 1024 PB = 1024 * 1024 TB = 1024 * 1024 * 1024 GB)

        The internet really is for porn.

 本文由用戶 jopen 自行上傳分享,僅供網友學習交流。所有權歸原作者,若您的權利被侵害,請聯系管理員。
 轉載本站原創文章,請注明出處,并保留原始鏈接、圖片水印。
 本站是一個以用戶分享為主的開源技術平臺,歡迎各類分享!