interSection算子对源RDD和参数RDD求交集后返回一个新的RDD
reduceByKey算子在一个(K,V)的RDD上调用,返回一个(K,V)的RDD,使用指定的reduce函数,将相同key的值聚合到一起
点击查看答案
以下属于spark启动后进程的是()A、rdd是由一系列的partition组成的B、原子性C、算子作用在partition上D、每个rdd都会提供一批最优的计算位置
RDD可以转化为DataFrames,但是DataFrames不能转化为RDD
mapPartitions算子类似于map,但独立地在RDD的每一个分片上运行,因此在类型为T的RDD上运行时,func的函数类型必须是Iterator[T]=>Iterator[U]
count算子返回RDD的元素个数
map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成
union算子对源RDD和参数RDD求并集后返回一个新的RDD