单选题

24/545在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在shuffle操作时,会大大增力hash分桶数,严重影响性能。Fusioninsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,!从而避免在shuffle的时候,生成过多的hash分桶,提升性能?

A、

group by

B、

coalosce

C、

connect

D、

join

下载APP答题
由4l***s2提供 分享 举报 纠错

相关试题

单选题 6/545 HBase默认使用什么组件作为其底层文件存储系统?

A、File
B、Kafka
C、Memory
D、HDFS

单选题 4/545下列哪个不是Flink支持的状态存储()?

A、FsStateBackend
B、RocksDBStateBackend
C、MemoryStateBackend
D、FileStateBackend

单选题 7/545 Redis中哪个命令是查看键的剩余生存时间?

A、persist
B、expire
C、ttl
D、expireat

单选题 3/545下列哪个不是HBase读取数据流程中涉及的角色或服务?

A、HDFS
B、HRegionServer
C、HMaster
D、ZooKeeper

单选题 8/545以下不属于KrbServer核心要素的是?

A、KDC (Key Distribution Center)
B、Kerberos Client
C、Kerberos KDC Client
D、Kerberos KDC Server

单选题 2/545下面哪一个是ElasticSearch的节点?

A、EsNode
B、Index
C、EsMaster
D、Cluster

单选题 1/545可以通过以下哪个命令创建节点数据?

A、get /node
B、create /node
C、set/node data
D、ls/node

单选题 5/545 MRS平台中,Flume数据流在节点内不需要经过哪个组件?

A、Sink
B、Channel
C、Topic
D、Source