（简答题）

描述Spark集群计算中RDD的含义和作用。

正确答案

Spark的核心概念是RDD (resilientdistributed dataset)，指的是一个只读的，可分区的分布式数据集，这个数据集的全部或部分可以缓存在内存中，在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD，把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算，数据在内存中将大大提升IO操作。这也是Spark涉及的核心：内存计算。Spark和RDD的关系可以理解为：RDD是一种具有容错性基于内存的集群计算抽象方法，Spark则是这个抽象方法的实现。

答案解析

略

相似试题

（简答题）
什么是集群？Hadoop采用哪些实现集群？
答案解析
（简答题）
试说明轴的按弯扭合成强度计算的公式各项参数的含义
答案解析
（简答题）
试说明轴的按弯扭合成强度计算的公式各项参数的含义
答案解析
（简答题）
计算题：某机器中的两构件采用2个螺栓联接，所受载荷为F。设螺栓的预紧力为F0。采用如下图1（普通螺栓联接）、图2（普通螺栓联接）两种联接方案时，试分别写出螺栓强度校核计算的相关计算公式并指明各参数的含义。（不考虑倾覆力矩作用。要求分步写出）
答案解析
（单选题）
虽然可以使用自然语言描述由数据元素组成数据的关系，但为了更加清晰简洁，建议采用符号来表示，其中 1{a}5 所代表的含义是（）
答案解析
（简答题）
单向穏定变应力r=c时零件的疲劳强度计算公式Sca=σ-1/（Kσσσ+φσσa），试分析该式分子σ-1的含义和分母的含义。
答案解析
（单选题）
广大农民在致富奔小康的过程中深切体会到：“要富口袋，先富脑袋”，这一说法在哲学上的含义是（）
答案解析
（单选题）
强度计算中，机械零件的需用应力的定义是（）
答案解析
（单选题）
在蜗杆传动中，进行轮齿承载能力计算时，主要是计算（）
答案解析