Loading... # Context Mode:MCP 服务器减少上下文窗口消耗 98% # 一、新闻概述 ## 1. 标题 Stop Burning Your Context Window — We Built Context Mode ## 2. 发布时间 2025 年 2 月 20 日 ## 3. 来源 mksg.lu(作者:Mert Köseoğlu) # 二、核心内容 ## 1. 事件摘要 ### A. 主要内容 Mert Köseoğlu 发布了 Context Mode,这是一个 MCP(Model Context Protocol)服务器,位于 Claude Code 和工具输出之间,可将上下文窗口消耗减少 98%。 ### B. 核心亮点 - 上下文占用从 315 KB 降至 5.4 KB,降幅达 98% - 会话可用时间从约 30 分钟延长至约 3 小时 - 提供 10 种语言运行时的沙箱执行环境 - 使用 SQLite FTS5 实现知识库全文检索 ## 2. 关键信息 ### A. 版本信息 开源项目,MIT 许可证 GitHub 仓库:github.com/mksglu/claude-context-mode ### B. 重要数据 - 工具调用前上下文占用:143K tokens(72%) - 单次 Playwright 快照:56 KB - 优化后输出:大多在 1 KB 以下 - 会话时间延长:6 倍 ### C. 涉及技术 - MCP(Model Context Protocol) - SQLite FTS5 全文搜索 - BM25 排序算法 - 进程隔离沙箱 ## 3. 背景介绍 ### A. 前置问题 MCP 已成为 AI 代理使用外部工具的标准方式,但其核心存在一个矛盾:每次工具交互都会从两个方向填充上下文窗口——工具定义进入时,原始输出返回时。 ### B. 相关上下文 Cloudflare 曾展示 Code Mode 可将工具定义压缩 99.9%。作者提出了另一个问题:输出端能否优化? # 三、详细报道 ## 1. 主要内容 ### A. 问题分析 在激活 81+ 个工具的情况下,143K tokens(72%)的上下文会在第一条消息发送前被工具定义占用。随后工具开始返回数据,每次调用都会消耗剩余空间: - 一次 Playwright 快照消耗 56 KB - `gh issue list` 转储 59 KB - 运行测试套件、读取日志、获取文档——每个响应都在蚕食剩余空间 - 30 分钟后,40% 的上下文已消失 ### B. 解决方案 Context Mode 提供两个核心功能:沙箱执行和知识库检索。 **沙箱执行机制**: ```mermaid graph LR A[Claude Code] -->|execute 调用| B[Context Mode] B -->|创建隔离子进程| C[沙箱环境] C -->|执行代码| D[语言运行时] D -->|捕获 stdout| C C -->|仅返回 stdout| B B -->|5.4 KB| A C -.原始数据.-> E[不进入上下文] ```  每个 `execute` 调用都会生成一个带有独立进程边界的隔离子进程。脚本无法访问彼此的内存或状态。子进程运行代码、捕获标准输出,只有标准输出会进入对话上下文。原始数据——日志文件、API 响应、快照——永远不会离开沙箱。 **支持的 10 种语言运行时**:JavaScript、TypeScript、Python、Shell、Ruby、Go、Rust、PHP、Perl、R。Bun 会自动检测,使 JS/TS 执行速度提升 3-5 倍。 **认证 CLI 工具支持**:`gh`、`aws`、`gcloud`、`kubectl`、`docker` 等通过凭证透传工作——子进程继承环境变量和配置路径,而不暴露给对话。 ### C. 知识库检索 ```mermaid graph TD A[用户调用 index] --> B[按标题分块] B --> C[保留代码块] C --> D[存入 SQLite FTS5] E[用户调用 search] --> F[BM25 排序] F --> G[返回精确代码块] H[用户调用 fetch_and_index] --> I[获取 URL] I --> J[转 Markdown] J --> D ```  `index` 工具按标题对 Markdown 内容进行分块,同时保持代码块完整,然后将它们存储在 SQLite FTS5(Full-Text Search 5)虚拟表中。搜索使用 BM25 排序——一种概率相关性算法,根据词频、逆文档频率和文档长度归一化对文档进行评分。 Porter 词干提取在索引时应用,因此 running、runs 和 ran 匹配同一个词根。 当调用 `search` 时,它返回带有标题层级的精确代码块——不是摘要,不是近似值,而是实际索引的内容。`fetch_and_index` 将此扩展到 URL:获取、将 HTML 转换为 Markdown、分块、索引。原始页面永远不会进入上下文。 ## 2. 技术细节 ### A. 性能数据 在 11 个真实场景中验证——测试分类、TypeScript 错误诊断、git diff 审查、依赖审计、API 响应处理、CSV 分析。每个输出都在 1 KB 以下。 | 场景 | 原始大小 | 优化后大小 | |------|---------|-----------| | Playwright 快照 | 56 KB | 299 B | | GitHub issues(20 条) | 59 KB | 1.1 KB | | 访问日志(500 请求) | 45 KB | 155 B | | 分析 CSV(500 行) | 85 KB | 222 B | | Git log(153 次提交) | 11.6 KB | 107 B | | 仓库研究(子代理) | 986 KB | 62 KB(5 次调用 vs 37 次) | ### B. 整体效果 整个会话:315 KB 的原始输出变成 5.4 KB。 - 减速前的会话时间:约 30 分钟 → 约 3 小时 - 45 分钟后剩余上下文:99% 而非 60% ### C. 安装方式 两种安装方式。Plugin Marketplace 提供自动路由钩子和斜杠命令: ```bash /plugin marketplace add mksglu/claude-context-mode /plugin install context-mode@claude-context-mode ``` 或仅 MCP 工具: ```bash claude mcp add context-mode -- npx -y context-mode ``` 重启 Claude Code 即可。 ## 3. 使用体验 ```mermaid graph LR A[用户工作] -->|工具调用| B[Context Mode] B -->|自动路由| C{输出类型?} C -->|执行类| D[沙箱处理] C -->|搜索类| E[知识库检索] D --> F[精简输出] E --> F F --> G[Claude Code] G -->|98% 节省| H[上下文窗口] ```  用户无需改变工作方式。Context Mode 包含一个 PreToolUse 钩子,自动将工具输出通过沙箱路由。子代理学习将 `batch_execute` 作为主要工具使用。Bash 子代理升级为 general-purpose,以便访问 MCP 工具。 实际差异:上下文窗口停止填满。以前 30 分钟就会撞墙的会话现在可以运行 3 小时。同样的 200K tokens,使用更谨慎。 # 四、影响分析 ## 1. 行业影响 ### A. 技术趋势 MCP 生态正从工具定义优化转向工具输出优化。Cloudflare 的 Code Mode 解决输入端,Context Mode 解决输出端,形成完整的上下文管理解决方案。 ### B. 竞争格局 - 类似项目:目前未见其他专注于 MCP 工具输出优化的项目 - 补充生态:不替代现有 MCP 服务器,而是增强所有服务器的效率 ## 2. 用户影响 ### A. 现有用户 - 升级成本:低,即插即用 - 收益:会话时长显著延长,上下文利用率大幅提升 ### B. 潜在用户 - 目标群体:重度使用 Claude Code 的开发者 - 吸引点:解决上下文耗尽的痛点,提升工作流效率 ### C. 迁移建议 - 兼容性:与现有 MCP 服务器兼容 - 配置:通过 MCP 配置文件即可启用 ## 3. 技术趋势 ### A. 技术方向 - 上下文优化成为 MCP 生态的重要方向 - 沙箱隔离 + 知识库检索的组合模式可能成为标配 ### B. 生态影响 - 为 MCP 服务器开发者提供了输出优化的参考实现 - 可能催生更多专注于特定场景的上下文优化工具 # 五、各方反应 ## 1. 官方回应 作者 Mert Köseoğlu 表示,他运营 MCP Directory & Hub,每天处理 10 万+ 请求,能看到所有发布的 MCP 服务器。模式很清晰:每个人都构建将原始数据转储到上下文的工具。没有人解决输出端的问题。 Cloudflare 的 Code Mode 博客文章使这个问题变得清晰。他们压缩工具定义,Context Mode 压缩工具输出。相同的原则,另一个方向。 ## 2. 业内评价 目前文章刚发布,尚未有广泛的业内评价。但从 MCP 社区活跃度来看,此类优化工具受到欢迎。 ## 3. 用户反馈 用户可以访问 GitHub 仓库体验和反馈: - 开源地址:https://github.com/mksglu/claude-context-mode - 作者联系方式:X(Twitter)@mksglu、LinkedIn linkedin.com/in/mksglu # 六、相关链接 ## 1. 官方公告 - Context Mode 博客:https://mksg.lu/blog/context-mode - GitHub 仓库:https://github.com/mksglu/claude-context-mode - MCP Directory & Hub:https://mcp.directory/ ## 2. 相关报道 - Cloudflare Code Mode(工具定义压缩方案) ## 3. 技术文档 - MCP 官方文档 - SQLite FTS5 文档 *** ## 参考资料 1. [Stop Burning Your Context Window — We Built Context Mode](https://mksg.lu/blog/context-mode) 最后修改:2026 年 03 月 01 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏