分布式/云計算/大數據 - 開源經驗 - 第10頁

0推薦

44K 瀏覽

摘要：說到處理大規模數據，R、Python、Scala和Java基本上都能滿足你的要求。

bencker 9年前

Python Java Scala 分布式/云計算/大數據

0推薦

39K 瀏覽

2016年QCon全球軟件開發大會北京站于4.21-4.23在北京國際會議中心舉辦，參會者對整體內容設置及安排反饋良好。這里我們梳理出了22號“大數據生態構建”廠商共建專場的重點演講內容，為沒...

ozhc1633 9年前

大數據分布式/云計算/大數據 QCon

0推薦

14K 瀏覽

本文將要介紹如何應用 OpenStack 中 Host Aggregates 的機制來更為有效地分配 nova computes 節點上的硬件資源，從而達到 OpenStack 的用戶能夠合理地...

qnmx2195 9年前

OpenStack KVM 分布式/云計算/大數據

0推薦

52K 瀏覽

楊尚剛，美圖公司數據庫高級DBA，負責美圖后端數據存儲平臺建設和架構設計。前新浪高級數據庫工程師，負責新浪微博核心數據庫架構改造優化，以及數據庫相關的服務器存儲選型設計。

KristalGrev 9年前

MySQL 大數據運維技術分布式/云計算/大數據

0推薦

14K 瀏覽

分為Administrator和Development兩門課程運維事故

mrul0595 9年前

Hadoop 運維技術分布式/云計算/大數據

0推薦

27K 瀏覽

最近在對已有的大數據采集和數據集成工具進行梳理，并考慮進行相關的產品整合工作，經過對已有的產品的測試和驗證，已經實際需要的業務場景，初步考慮清楚后續需要進行新增和完善部分的內容。

BraHewitt 9年前

數據庫大數據分布式/云計算/大數據

0推薦

25K 瀏覽

大數據不再像過去幾年一樣，受限于工具缺乏的問題。那時候搞大數據意味著團隊里必須有數據科學家，還會被R和Hadoop之類的開源工具搞得心煩意亂。現在許多公司在大數據分析中最頭疼的問題，其實是如何獲取數據。

xuanlingzi 9年前

大數據分布式/云計算/大數據

0推薦

9K 瀏覽

云計算也許并不是盡善盡美，但不可否認的是總有一種方式適合你。首先我想要說，未來大多數企業都會從具體的機房遷移出來。雖然你企業中并不是所有負載系統都適合云計算，但是大多數公司可以而且應該采用云計算。

GleDonahue 9年前

云計算企業應用分布式/云計算/大數據

0推薦

48K 瀏覽

編者注：原文是 FirstMark Capital 的 Matt Turck 的文章。本文全面總結了大數據領域的發展態勢，分析認為盡管大數據作為一個術語似乎已經過氣，但是大數據分析與應用才...

XZSIsa 9年前

大數據分布式/云計算/大數據

0推薦

35K 瀏覽

總結一下我讀過的機器學習/數據挖掘/數據分析方面的書，有的適合入門，有的適合進階，沒有按照層次排列，先總結一下，等總結的差不多了再根據入門--->進階分塊寫。下面列的書基本上我寫的都是讀完過的，...

cy_ygs 9年前

數據挖掘數據分析分布式/云計算/大數據

0推薦

21K 瀏覽

之前寫過一篇文章，如何提高ElasticSearch 索引速度。除了對ES本身的優化以外，我現在大體思路是盡量將邏輯外移到Spark上,Spark的分布式計算能力強，cpu密集型的很適合。這...

ukon7587 9年前

Hadoop Spark ElasticSearch 分布式/云計算/大數據

0推薦

18K 瀏覽

niubi-job是一款專門針對定時任務所設計的分布式任務調度框架，它可以進行動態發布任務，并且有超高的可用性保證。

alen9988 9年前

Java 分布式系統作業調度框架分布式/云計算/大數據

0推薦

24K 瀏覽

自從相關工具創建以來，我們一直通過對海量的隨機數據執行排序來測試MapReduce。這種方式很受歡迎，因為生成任意數量的數據非常簡單，想要驗證輸出結果是否正確也很簡單。

iammatrix 9年前

大數據分布式/云計算/大數據

0推薦

23K 瀏覽

OpenStack遵循這樣的設計原則，“不要重復發明輪子”，即對已實現的功能，開發者直接拿來用即可。這一設計原則最終形成了一個由專門團隊維護的Oslo——OpenStack公共庫，實現硬件、操作...

wblr6035 9年前

OpenStack WSGI 分布式/云計算/大數據

0推薦

56K 瀏覽

美團是數據驅動的互聯網服務，用戶每天在美團上的點擊、瀏覽、下單支付行為都會產生海量的日志，這些日志數據將被匯總處理、分析、挖掘與學習，為美團的各種推薦、搜索系統甚至公司戰略目標制定提供數據支持。...

櫻桃大丸子 9年前

Spark 分布式/云計算/大數據

0推薦

22K 瀏覽

消息隊列中間件是分布式系統中重要的組件，主要解決應用耦合，異步消息，流量削鋒等問題。實現高性能，高可用，可伸縮和最終一致性架構。是大型分布式系統不可缺少的中間件。

免費教程 9年前

架構教程分布式/云計算/大數據

0推薦

26K 瀏覽

由于有些物理集群處于不同的地點，或者某一些物理集群規模太大，就需要創建多個openstack集群對其進行管理。而每個openstack集群是單獨管理的，這就導致管理入口太多，不方便統一管理。那么...

rxra5030 9年前

數據庫 memcached OpenStack 分布式/云計算/大數據

0推薦

56K 瀏覽

前言在移動互聯網時代，企業需要尋找新的軟件交付流程和IT架構，從而實現架構平臺化，交付持續化，業務服務化。容器將成為新一代應用的標準交付件，容器云將幫助企業用戶構建研發流程和云平臺基礎設施，縮...

云舒網絡 9年前

Docker 分布式/云計算/大數據

0推薦

92K 瀏覽

因為在Spark的MLlib模塊中只有MF算法，文章之后會講述如何使用Matrix Factorization來做相關的推薦。

ilmangle 9年前

算法 Spark 推薦系統分布式/云計算/大數據

0推薦

48K 瀏覽

1.MapReduce作業運行流程下面貼出我用visio2010畫出的流程示意圖：

ty448667 9年前

MapReduce 分布式/云計算/大數據

R、Python、Scala 和 Java，到底該使用哪一種大數據編程語言？

構建大數據生態需要哪些核心技術？

OpenStack 中如何應用 Host Aggregates 來更有效地分配硬件資源

單表60億記錄等大數據場景的MySQL優化和運維之道 | 高可用架構

Hadoop運維經驗雜談

大數據-數據采集和集成

大數據應用？你先搞定數據獲取再說

10步搞定系統的云遷移

大數據的明天將駛向何方？

數據分析/數據挖掘/機器學習---- 必讀書目

自定義Spark Partitioner提升es-hadoop Bulk效率

niubi-job一個分布式的任務調度框架

谷歌的海量數據排序實驗史

OpenStack 通用技術有哪些

Spark在美團的實踐

大型網站架構系列：分布式消息隊列（一）

openstack multi-region管理

基于Docker的CaaS容器云平臺架構設計

一位算法師工程師的Spark機器學習筆記：構建一個簡單的推薦系統

MapReduce工作原理圖文詳解

熱門問答

熱門文檔