reduceByKey算子在一个(K,V)的RDD上调用,返回一个(K,V)的RDD,使用指定的reduce函数,将相同key的值聚合到一起
PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。()此题为判断题(对,错)。
点击查看答案
groupByKey算子在一个(K,V)的RDD上调用,返回一个(K,Iterator[V])的RDD
mapPartitions算子类似于map,但独立地在RDD的每一个分片上运行,因此在类型为T的RDD上运行时,func的函数类型必须是Iterator[T]=>Iterator[U]
count算子返回RDD的元素个数
interSection算子对源RDD和参数RDD求交集后返回一个新的RDD
map算子返回一个新的RDD,该RDD由每一个输入元素经过func函数转换后组成
union算子对源RDD和参数RDD求并集后返回一个新的RDD