spark中弹性分布式数据集指的是哪个()
spark中的弹性分布式数据集相当于java中的()概念A、类B、接口C、方法D、内部类
点击查看答案
下列spark算子中可以将数据持久化到硬盘上的算子是哪些()A、persistB、checkpointC、cacheD、map
spark支持的分布式部署方式中哪个是错误的()A、standaloneB、spark on mesosC、spark on YARND、spark on local
spark中如果想要获取hdfs中的数据,则需要使用哪个系统()A、spark?coreB、spark?streamingC、mapreduceD、Grophx
spark中,可以运行sql脚本的框架是哪个()A、spark?coreB、hdfsC、hadoopD、spark?sql
spark的源码是由哪几种语言编写完成的()A、acheSpark是一种快速、通用、可扩展的大数据分析引擎B、spark为分布式数据集的处理提供了一个有效框架,并以高效的方式处理分布式数据集C、spark强调一站式解决方案,集批处理、实时流处理、交互式查询与图计算于一体,避免了多种运算场景下需要部署不同集群带来的资源浪费D、spark可以将数据分析过程的中间输出保存在内存中,从而不需要从外部持久化存储中反复读写数据,相较mapreduce能更好地适用于数据挖掘和机器学习等需要迭代运算的场景
spark内部集成的资源调度框架是哪个()A、driverB、standaloneC、masterD、yarn