单选题 大模型训练中,混合精度训练的核心优势是?

A、 降低显存占用,提升训练速度
B、 无限提升模型精度
C、 减少训练数据量
D、 降低模型参数量
下载APP答题
由4l***zo提供 分享 举报 纠错

相关试题

单选题 大模型部署中,用于衡量从请求发送到完整响应生成的总时间的指标是?

A、TTFT
B、TPOT
C、时延
D、吞吐量

单选题 以下哪种大模型高效微调技术,仅通过低秩矩阵分解新增少量参数,不修改基座模型原生参数?

A、Full Fine-tuning
B、LoRA
C、Prefix Tuning
D、Prompt Tuning

单选题 半精度浮点数的标准缩写是以下哪一项?

A、FP32
B、FP64
C、FP16
D、FP8

单选题 BERT 模型中,用于区分两个句子边界的特殊标记是?

A、CLS
B、SEP
C、PAD
D、MASK

单选题 以下关于 Stable Diffusion 模型的描述,错误的是?

A、核心扩散过程在潜空间执行
B、自编码器完成图像编解码
C、直接在像素空间执行扩散过程
D、属于文生图扩散模型

单选题 大模型训练中,思维链(CoT)技术的核心作用是?

A、提升模型文本生成速度
B、增强模型逻辑推理能力
C、压缩模型参数量
D、降低训练算力消耗

单选题 大语言模型 GPT 系列的核心架构是基于 Transformer 的哪个部分?

A、Encoder 结构
B、Decoder 结构
C、Encoder+Decoder 结构
D、以上都不是

单选题 以下哪种高效微调方法,仅更新模型的偏置项参数,属于 “选取部分参数更新” 类别?

A、BitFit
B、LoRA
C、P-Tuning
D、Adapter Tuning