Loading... # 召回率(Recall)理解 ## 核心定义 ``` 召回率 = 正确检索到的相关信息 / 所有应该被检索到的相关信息 ``` ## 在大海捞针测试中的含义 **测试方法**:在超长文本中随机插入一段特定信息,让模型找出来 | 召回率 | 含义 | |--------|------| | 90%+ | 10次测试能找到9次以上 | | 50% | 抛硬币水平,一半找不到 | ## 为什么差距这么大 **第一性原理拆解**: 1. **注意力机制质量** - Claude/GPT 的长序列注意力衰减控制更好 2. **训练数据质量** - 长文本高质量语料差距 3. **位置编码设计** - RoPE 等技术的工程实现差异 4. **算力投入** - 长上下文训练成本极高 ## 实际影响 ```bash # 场景:分析一份 100 页合同找关键条款 Claude: 基本都能找到 国产 50%: 漏一半关键信息 → 生产环境不可用 ``` ## 结论 **128K 上下文 + 50% 召回率 = 虚标** 真正可用的长上下文,召回率必须 **>85%**,否则就是营销噱头。千问 70% 勉强可用但需人工复核。 最后修改:2026 年 02 月 26 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏