Spark核心概念RDD（Resilient Distributed Datasets）

U4dbsfaasa 10年前發布 | 8K 次閱讀分布式/云計算/大數據

本文介紹Spark的RDD。作為一個概念，RDD本身是與編程語言無關的，你即可以用Scala實現，也可以是Java、C++之類的語言。當初伯克利決定用Scala就是因為它寫的代碼簡單明了。

RDD是一種數據模型，跟分布式的共享內存類似。RDD的特征在于：

有兩種方式創建RDD：

RDD的適用性：

RDD上可用的變換操作（transformations ）和其他操作

本文由用戶 U4dbsfaasa 自行上傳分享，僅供網友學習交流。所有權歸原作者，若您的權利被侵害，請聯系管理員。

轉載本站原創文章，請注明出處，并保留原始鏈接、圖片水印。

本站是一個以用戶分享為主的開源技術平臺，歡迎各類分享！