单选题 分词(Tokenization)的主要作用是什么?

A、 将文本转换为固定长度的向量
B、 将输入文本分割成单词、子词或字符等更小的语义单元
C、 提取文本的语义特征以计算情感值
D、 为模型提供上下文信息
下载APP答题
由4l***1a提供 分享 举报 纠错

相关试题

单选题 模型微调最适合以下解决哪种问题?

A、需要实时检索最新互联网信息的任务
B、需要提升模型在特定任务的表现
C、需要快速响应简单问答的任务
D、需要结合用户界面操作的任务

单选题 假设你正在使用大模型解决以下数学问题:“小明每天存入银行10元钱,但每周末(周六和周日)会取出20元用于消费。如果小明从某周一(第一天)开始存钱,青问小明需要多少天才能存够100元?”为了提升大模型解答此类问题的准确率,以下哪种提示方法最能有效引导大模型生

A、提供少量样例
B、明确输出要求
C、思维链方法
D、提供受众和角色

单选题 你在开发一个基于RAG的智能客服系统,用于回答用户关于产品功能的技术问题。为了提升回答的准确性,你调整了检索模块的相似度阈值,从默认的0.7提高到了0.95。然而,测试后发现,部分用户的提问得不到满意的回答。可能的原因是什么?

A、检索模块的计算复杂度增加,导致大模型推理速度变慢
B、用户提问的语言风格与产品文档内容不一致,导致检索失败
C、回答准确但不全面,因为过于严格的检索条件过滤掉了部分有用的上下文信息
D、系统成功过滤掉了所有无用数据,回答的准确性和完整度都得到了显著提升

单选题 你在优化RAG应用时,检索条件改得非常宽松,相似度很低的文本段也可以被召回。这可能会导致出现以下哪种情况

A、ContextRecall(文本段召回率)变高
B、ContextRecall(文本段召回率)变低
C、ContextRecall(文本段召回率)基本不变
D、文本段精度变高

单选题 你将PDF文档转成普通文本后,RAG的检索质量变差。下列哪种做法最能提升检索准确度?

A、将文本转成更结构清晰的Markdown
B、提前把文档压缩成ZIP再索引
C、调整大模型输出温度(temperature)
D、用正则表达式彻底删除停用词

单选题 在测试RAG应用性能时,你发现检索阶段总是出现不太相关的段落。为了提高检索准确度,你应该怎么做?

A、尝试增加大模型重复惩罚系数,避免召回不相关内容
B、尝试使用领域相关知识微调大模型,让其能更好的识别相关段落
C、尝试调整embedding模型、并使用重排(rerank)
D、尝试减少模型推理温度

单选题 某RAG系统回答“张伟是哪个部门的”时,总是只检索到一个无关切片,导致答案不准确。为改进检索效果,下列哪种做法有助于改善这个问题?

A、换用更大参数量的大模型
B、提高检索时的召回数量(TopK)
C、放弃知识库,全部"对话式"推理
D、修改前端界面外观

单选题 你所在的医院技术部正在翻译一份医学影像技术手册,包含上千条内部非公开的专业术语与缩写。如果想在翻译时保证准确性,并减少对大量示例的依赖,以下哪种做法更合适?

A、仅提供少量缩写翻译示例.如"MRI—>磁共振成像","CT—>计算机断层扫描",让大模型依照模仿.
B、分配"专业医学翻译员"角色,依靠零样本提示直接解决
C、接入专业术语库,并使用RAG技术,以动态查询并统一术语标准
D、尽可能增加示例数量,用穷举方式涵盖所有缩写的翻译场景.