单选题 24/545在很多小文件场景下,Spark会起很多Task,当SQL逻辑中存在shuffle操作时,会大大增力hash分桶数,严重影响性能。Fusioninsight中,针对小文件的场景通常采用()算子,来对Table中的小文件生成的partition进行合并,减少partition数,!从而避免在shuffle的时候,生成过多的hash分桶,提升性能?
相关试题
单选题 6/545 HBase默认使用什么组件作为其底层文件存储系统?
单选题 4/545下列哪个不是Flink支持的状态存储()?
单选题 7/545 Redis中哪个命令是查看键的剩余生存时间?
单选题 3/545下列哪个不是HBase读取数据流程中涉及的角色或服务?
单选题 8/545以下不属于KrbServer核心要素的是?
单选题 2/545下面哪一个是ElasticSearch的节点?
单选题 1/545可以通过以下哪个命令创建节点数据?
单选题 5/545 MRS平台中,Flume数据流在节点内不需要经过哪个组件?