Loading... # AI Agent 编程一年观察报告 # 一、新闻概述 ## 1. 标题 AI Agent 编程一年观察报告:模型能力飞跃、IDE 时代终结 ## 2. 发布时间 2026 年 2 月 8 日 ## 3. 来源 David Crawshaw 个人博客 # 二、核心内容 ## 1. 事件摘要 ### A. 主要内容 作者 David Crawshaw 分享了在过去一年中使用 AI Agent 进行编程的观察和经验总结,对比了 2025 年 2 月与 2026 年 2 月的变化。 ### B. 核心亮点 - 前沿模型代码生成能力从 25% 提升至 90% - IDE 使用率显著下降,作者回归 Vim 编辑器 - 提出「面向 Agent 编程」新哲学 - 本地模型与前沿模型的能力差距仍在扩大 ## 2. 关键信息 ### A. 作者背景 David Crawshaw,正在构建 exe.dev 平台,此前写过《用 LLM 编程》和《用 Agent 编程》两篇观察文章。 ### B. 观察周期 - 首篇文章:一年前 - 二次更新:八个月前 - 本次更新:2026 年 2 月 ### C. 涉及产品/技术 - Claude Code、Codex 等 Agent 工具 - Opus、GPT 等前沿模型 - Stripe、云计算平台 ## 3. 背景介绍 ### A. 前置观察 作者此前已发布两篇文章,记录了从 LLM 辅助编程到 Agent 编程的演变过程。 ### B. 相关上下文 AI Agent 在过去一年经历了快速发展,模型能力和应用场景都有显著变化。 # 三、详细报道 ## 1. 主要内容 ### A. Agent 能力大幅提升 **模型进步**: - 2025 年 2 月:Claude Code 能完成 25% 的代码 - 2026 年 2 月:Opus 模型能完成 90% 的代码 **工作方式变化**: - 大公司时代:80% 阅读代码,20% 编写代码 - 创业公司时代:50% 阅读代码,50% 编写代码 - Agent 时代:95% 阅读代码,5% 编写代码 ```mermaid graph LR A[大公司时代] -->|80%读20%写| B[创业公司时代] B -->|50%读50%写| C[Agent 时代] C -->|95%读5%写| D[代码审查者角色] ```  ### B. IDE 时代终结 **历史回顾**: - 1999 年:Visual Studio C++ 6.0 是作者心中最伟大的 IDE - 2021 年:GitHub Copilot 发布,IDE 似乎不可避免 - 2026 年:作者放弃 IDE,回归 Vim/Vi **转变原因**: - Agent 提供了比 IDE 更高效的编程方式 - 唯一保留的 IDE 功能是「跳转到定义」 - Vim 即将迎来 50 岁生日 ```mermaid timeline title IDE 发展时间线 1999 : Visual Studio 6.0<br/>IDE 黄金时代 2021 : GitHub Copilot 发布<br/>AI 辅助编码兴起 2026 : Agent 时代<br/>回归轻量编辑器 ```  ### C. 前沿模型与本地模型的差距 **作者观点**: - 使用非前沿模型是「有害」的 - 不仅浪费时间,还会学到错误的教训 - 本地模型终将获胜,但前沿模型仍有领先优势 **经济信号**: - 模型的渐进式改进是今天最积极的经济信号 - 前沿模型值得支付溢价 - 这种差距只会持续几年时间 ### D. Agent 沙箱的困境 **问题分析**: - 内置沙箱频繁提示「能否运行 xxx 命令」 - 沙箱限制导致 Agent 无法完成复杂任务 - 需要关闭内置沙箱,自行提供 **解决方案**: - 使用独立的虚拟机作为沙箱环境 - 给 Agent 无约束的执行权限 - 这正是作者构建 exe.dev 的动机 ### E. 软件形态的改变 **Stripe 案例分析**: - Stripe Sigma 提供 SQL 查询功能 - 内置的 LLM 助手能力有限 - 作者用 Agent 三句话实现了更好的替代方案 **实现过程**: - Agent 调用 Stripe API 拉取所有账户数据 - 构建本地 SQLite 数据库 - 实现比 Sigma 更强大的查询能力 ## 2. 技术细节 ### A. 编程哲学转变 **传统软件设计**: - 产品经理告诉工程师:你不是客户 - 以最终用户体验为中心 **Agent 时代新哲学**: - 「最适合 Agent 的软件,就是最适合程序员的软件」 - 每个客户都有 Agent 为其编写代码 - 构建程序员喜爱的产品,所有人都会跟随 ### B. 开发工具生态变化 **Agent 套具进展缓慢**: - 六个月前 Sketch 能做到的事情,今天的流行 Agent 仍做不到 - Agent 套具是关键领域,有大量创新空间 - 但目前最重要的因素是模型本身 ### C. 软件开发新常态 **程序数量激增**: - 作者现在拥有比以往更多的程序和服务 - 许多过去没有时间写的程序现在得以实现 - Agent 将一句话笔记转化为实用程序 ```mermaid graph TD A[想法/待办笔记] --> B{Agent 处理} B -->|大部分时间| C[转化为实用程序] B -->|偶尔| D[需要人工调整] C --> E[程序库扩充] D --> E ```  ## 3. 数据与事实 ### A. 模型能力对比 | 时间 | 模型 | 代码完成比例 | |------|------|-------------| | 2025 年 2 月 | Claude Code | 25% | | 2026 年 2 月 | Opus | 90% | ### B. 工作方式演变 | 阶段 | 阅读代码 | 编写代码 | |------|---------|---------| | 大公司时代 | 80% | 20% | | 创业公司时代 | 50% | 50% | | Agent 时代 | 95% | 5% | ### C. 农业就业历史对比 1900 年:33% 的美国人居住在农场,40% 从事农业 2000 年:不到 1% 居住在农场,1% 的劳动者从事农业 # 四、影响分析 ## 1. 行业影响 ### A. 开发工具市场 - 传统 IDE 厂商面临转型压力 - 轻量级编辑器可能重新流行 - Agent 套具成为新赛道 ### B. 云计算平台 - 作者认为云平台是当前最糟糕的产品 - 需要重新设计以适应 Agent 时代 - exe.dev 试图解决这个问题 ### C. 软件开发范式 - 从「为最终用户设计」转向「为程序员和 Agent 设计」 - API 优先变得比 UI 优先更重要 - 可编程性成为核心竞争力 ## 2. 用户影响 ### A. 现有开发者 - 角色从「编写者」转向「审查者」 - 需要重新学习如何与 Agent 协作 - 生产力大幅提升 ### B. 新手开发者 - 入门门槛可能降低 - 但仍需理解代码才能有效使用 Agent - 需要使用前沿模型才能获得正确经验 ### C. 非开发者 - 通过 Agent 也能获得定制软件 - 不再依赖软件厂商的所有功能更新 - 可以让 Agent 为自己编写定制化解决方案 ## 3. 技术趋势 ### A. 前沿模型与本地模型 - 前沿模型将持续领先几年 - 本地模型最终会追上 - 边际收益递减将是转折点 ### B. 软件架构 - API 变得比 UI 更重要 - 可编程性成为设计原则 - 软件需要为 Agent 优化 ### C. 开发工作流 - 代码审查成为主要工作 - 快速原型成为常态 - 程序数量大幅增加 # 五、各方反应 ## 1. 作者观点 ### A. 积极态度 - 编程变得比以往任何时候都更有趣 - Agent 带来了探索的乐趣和工作的喜悦 - 许多过去没时间写的程序得以实现 ### B. 担忧与理解 - 理解人们对 AI 带来的变化的恐惧 - 对智能对社会终极影响的担忧 - 但认为在编程领域,这些工具带来了纯粹的积极影响 ### C. 对反 LLM 论点的困惑 - 一年前还能理解的反 LLM 论点,现在无法理解 - 将其比作反对木工使用电动工具 - 认为这如同「水是湿的」一样显而易见 ## 2. 行业观察 ### A. 基准测试失效 - 公共基准测试已被过度优化 - 应该忽略公共基准 - 前沿模型公司有良好的内部评估体系 ### B. 变化速度 - Agent 的能力边界在不断移动 - 需要持续重新学习 - 没有明显的「GPT-2 时刻」,但有巨大的增量改进 # 六、相关链接 ## 1. 作者相关文章 - Programming with LLMs(一年前) - Programming with Agents(八个月前) ## 2. 作者项目 - exe.dev:VM 平台,支持无约束 Agent 执行 ## 3. 相关技术 - Claude Code - OpenAI Codex - Stripe Sigma *** ## 参考资料 1. [Eight more months of agents - David Crawshaw](https://crawshaw.io/blog/eight-more-months-of-agents) 最后修改:2026 年 02 月 10 日 © 允许规范转载 赞 如果觉得我的文章对你有用,请随意赞赏