相关试题
单选题 在深度学习网络中,反向传播算法用于计算各层参数的梯度,在反向传播算法中使用什么法则进行链式求导?
多选题 LSTM 网络结构中由哪些模块共同决定了当前细胞状态需要保留的信息?
单选题 a = [0,1,2,3,4,5,6,7,8,9]; a = Tensor (a, dtype=float32); 在 MindSpore 中,执行以上这段代码后,以下描述正确的是哪个选项?
单选题 Self-Attention 机制无法捕捉到序列的位置信息,因此在 Transformer 模型中需要添加位置编码。
多选题 以下哪些选项属于终端设备上所使用的 AI 芯片特征?
单选题 在 AI 模型开发时,以下哪种操作不属于模型定义的步骤?
单选题 智能驾驶的能力越来越强,以下哪一项因素不是支撑它的关键因素?
单选题 DeepSeek V3 是一个基于 GPT 结构的多模态模型,较 V2 版本相比,其训练成本和推理速度都有很大的提升。