(简答题)
描述Spark集群计算中RDD的含义和作用。
正确答案
Spark的核心概念是RDD (resilientdistributed dataset),指的是一个只读的,可分区的分布式数据集,这个数据集的全部或部分可以缓存在内存中,在多次计算间重用。Spark解决迭代计算的主要实现思想就是RDD,把所有计算的数据保存在分布式的内存中。迭代计算通常情况下都是对同一个数据集做反复的迭代计算,数据在内存中将大大提升IO操作。这也是Spark涉及的核心:内存计算。Spark和RDD的关系可以理解为:RDD是一种具有容错性基于内存的集群计算抽象方法,Spark则是这个抽象方法的实现。
答案解析
略
相似试题
(简答题)
什么是集群?Hadoop采用哪些实现集群?
(简答题)
试说明轴的按弯扭合成强度计算的公式各项参数的含义
(简答题)
试说明轴的按弯扭合成强度计算的公式各项参数的含义
(简答题)
计算题:某机器中的两构件采用2个螺栓联接,所受载荷为F。设螺栓的预紧力为F0。采用如下图1(普通螺栓联接)、图2(普通螺栓联接)两种联接方案时,试分别写出螺栓强度校核计算的相关计算公式并指明各参数的含义。(不考虑倾覆力矩作用。要求分步写出)
(单选题)
虽然可以使用自然语言描述由数据元素组成数据的关系,但为了更加清晰简洁,建议采用符号来表示,其中 1{a}5 所代表的含义是()
(简答题)
单向穏定变应力r=c时零件的疲劳强度计算公式Sca=σ-1/(Kσσσ+φσσa),试分析该式分子σ-1的含义和分母的含义。
(单选题)
广大农民在致富奔小康的过程中深切体会到:“要富口袋,先富脑袋”,这一说法在哲学上的含义是()
(单选题)
强度计算中,机械零件的需用应力的定义是()
(单选题)
在蜗杆传动中,进行轮齿承载能力计算时,主要是计算()