问题:flume中的source组件是专门用来收集数据的...
查看答案
问题:maven项目是通过pom.xml文件来进行依赖jar包的加载的...
问题:只有主构造函数才可以写参数...
问题:spark中的图计算框架是()...
问题:reduce求和输出结果为varlist1=list1(1,2,3,4)varsum=list1.reduce(_+_)println(sum)()A、10B、1C、4D、以上答案都不对...
问题:对于以下2个列表的操作,那些说法说法不正确vart=List(1,2,3)vart2=List(4,5)()A、vart3=t++t2得到List(1,2,3,4,5)B、vart3=List.concat(t,t2)得到List(1,2,3,4,5)C、vart3=t:::t2得到List(1,2,3,4,5)D、vart3=t.:::(t2)得到List(1,2,3,4,5)...
问题:yarn中的nodemanager的作用()...
问题:SparkSQL是一个用来处理结构化数据的spark组件。它提供了一个叫做()的可编程抽象数据模型A、DataFramesB、TableC、DataSetD、RDD...
问题:spark中的rdd不存储数据,存储的是()...
问题:DAG调度器会将结果以什么样的形式传给Task调度器()A、TaskSetB、TaskC、DAGD、Job...
问题:zookeeper数据模型是带有默认权限的...
问题:scala中,类成员的缺省访问级别是()A、publicB、privateC、protectD、以上都不是...
问题:下列关于Scala对于异常的处理处理正确的是:()A、Case匹配的方式处B、Throw出去C、抛插值器D、singleton=false...
问题:scala中String类没有插值器的概念...
问题:以下哪个算子是懒执行的()A、mapB、foreachC、countD、reduce...
问题:以下有返回值的函数有哪些()A、mapB、flatMapC、foreachD、filter...
问题:spark为分布式数据集的处理提供了一个有效框架,并以高效的方式...
问题:以下哪些不属于rdd特性()A、冗余性B、一致性C、rdd之间具有依赖性D、每个rdd都会提供一批最优的计算位置...
问题:以下哪个选项是spark的核心框架?()A、spark?coreB、spark?streamingC、hdfsD、hadoop...
问题:sparkjob默认的调度模式是()...