新建题库07150245_在线真题试卷与模拟练习_新建题库07150245

更新时间：试题数量：购买人数：提供作者：

有效期：个月

章节介绍：共有个章节

我的练习

我的错题
(0道)

我的收藏
(0道)

我的斩题
(0道)

我的笔记
(0道)

专项练习

顺序练习 0 / 0

随机练习 自定义设置练习量

题型乱序 按导入顺序练习

模拟考试 仿真模拟

题型练习 按题型分类练习

易错题 精选高频易错题

学习资料 考试学习相关信息

搜索

题库预览

请求平均长度：假设该场景请求平均长度为 100token。

日均请求量：当前线上服务的日均请求量约为 60 万次。

吞吐量峰值：系统在高峰时段的吞吐量峰值为 3200 token/s。

算力分配：70% 的推理任务由华为 910B 卡承担，其余 30% 由 NVIDIA A10 卡处理。

单卡性能：基于 Qwen 2.5-32B 模型实测，每张 910B 卡的吞吐量约为 370 token/s。

并发能力：该模型支持约 40 + 并发请求。

为了保证系统的稳定运行，需要预留三张 910B 卡用于新场景上线。请计算总共需要多少张 910B 卡来满足上述需求。