分词（Tokenization）的主要作用是什么？

单选题分词（Tokenization）的主要作用是什么？

A、将文本转换为固定长度的向量

B、将输入文本分割成单词、子词或字符等更小的语义单元

C、提取文本的语义特征以计算情感值

D、为模型提供上下文信息

查看答案

下载APP答题

由4l***1a提供分享举报纠错

相关试题

单选题模型微调最适合以下解决哪种问题？

A、需要实时检索最新互联网信息的任务

B、需要提升模型在特定任务的表现

C、需要快速响应简单问答的任务

D、需要结合用户界面操作的任务

查看答案

单选题假设你正在使用大模型解决以下数学问题：“小明每天存入银行10元钱，但每周末（周六和周日）会取出20元用于消费。如果小明从某周一（第一天）开始存钱，青问小明需要多少天才能存够100元？”为了提升大模型解答此类问题的准确率，以下哪种提示方法最能有效引导大模型生

A、提供少量样例

B、明确输出要求

C、思维链方法

D、提供受众和角色

查看答案

单选题你在开发一个基于RAG的智能客服系统，用于回答用户关于产品功能的技术问题。为了提升回答的准确性，你调整了检索模块的相似度阈值，从默认的0.7提高到了0.95。然而，测试后发现，部分用户的提问得不到满意的回答。可能的原因是什么？

A、检索模块的计算复杂度增加,导致大模型推理速度变慢

B、用户提问的语言风格与产品文档内容不一致,导致检索失败

C、回答准确但不全面,因为过于严格的检索条件过滤掉了部分有用的上下文信息

D、系统成功过滤掉了所有无用数据,回答的准确性和完整度都得到了显著提升

查看答案

单选题你在优化RAG应用时，检索条件改得非常宽松，相似度很低的文本段也可以被召回。这可能会导致出现以下哪种情况

A、ContextRecall(文本段召回率)变高

B、ContextRecall(文本段召回率)变低

C、ContextRecall(文本段召回率)基本不变

D、文本段精度变高

查看答案

单选题你将PDF文档转成普通文本后，RAG的检索质量变差。下列哪种做法最能提升检索准确度？

A、将文本转成更结构清晰的Markdown

B、提前把文档压缩成ZIP再索引

C、调整大模型输出温度(temperature)

D、用正则表达式彻底删除停用词

查看答案

单选题在测试RAG应用性能时，你发现检索阶段总是出现不太相关的段落。为了提高检索准确度，你应该怎么做？

A、尝试增加大模型重复惩罚系数,避免召回不相关内容

B、尝试使用领域相关知识微调大模型,让其能更好的识别相关段落

C、尝试调整embedding模型、并使用重排(rerank)

D、尝试减少模型推理温度

查看答案

单选题某RAG系统回答“张伟是哪个部门的”时，总是只检索到一个无关切片，导致答案不准确。为改进检索效果，下列哪种做法有助于改善这个问题？

A、换用更大参数量的大模型

B、提高检索时的召回数量(TopK)

C、放弃知识库,全部"对话式"推理

D、修改前端界面外观

查看答案

单选题你所在的医院技术部正在翻译一份医学影像技术手册，包含上千条内部非公开的专业术语与缩写。如果想在翻译时保证准确性，并减少对大量示例的依赖，以下哪种做法更合适？

A、仅提供少量缩写翻译示例.如"MRI—>磁共振成像","CT—>计算机断层扫描",让大模型依照模仿.

B、分配"专业医学翻译员"角色,依靠零样本提示直接解决

C、接入专业术语库,并使用RAG技术,以动态查询并统一术语标准

D、尽可能增加示例数量,用穷举方式涵盖所有缩写的翻译场景.

查看答案