
过去一年,AI 编程从一个效率工具,逐渐变成了软件行业最重要的变量之一,如今甚至成为了普通 AI 用户的标配。开发者不再只是让 Copilot 补全几行代码,而是开始把需求拆解、代码生成、调试、测试甚至部分部署流程交给 Agent 完成。Andrej Karpathy 在 Sequoia AI Ascent 2026 的演讲中,把这种变化放进了一个更大的叙事框架里:Software 3.0。
一、全文速览图

Google I/O 2026大会的背后,谷歌正在把 AI 变成新的互联网入口一、全文速览图 如果说过去两年的 AI 行业还在比拼「大模型谁更强」,那今年的 Google I/O,已经开始进入另一个阶段:AI 不再只是聊天工具,而是在逐步接管搜索、创作、开发、购物和个人设备。阅读文章 >
Karpathy 对软件演化阶段的划分很清楚。Software 1.0 是人类直接写规则,用 C++、Python、JavaScript 这样的语言告诉计算机如何执行;Software 2.0 是神经网络时代,人类不再手写全部规则,而是通过数据训练出模型权重;Software 3.0 则是大模型时代,人类用自然语言给模型下达任务,把上下文窗口变成新的编程界面。
这个定义之所以重要,是因为它明确了未来软件生产的入口,划清了此刻和未来之间的分水岭。过去,软件开发的核心动作是「把人的意图转译成代码」;现在,这个转译层开始被大模型接管。自然语言不再只是需求文档,而是可以直接驱动系统执行的接口。
但这并不意味着代码会消失。更准确地说,代码正在从人类工作的中心,退到机器可生成、可检查、可迭代的中间层。人类仍然需要理解系统,只是不一定需要亲手写下每一行实现代码。
二、Vibe Coding 产生了新的分支
在 Software 3.0 的讨论里,Vibe Coding 是一个绕不开的词。它指的是一种更随性的 AI 编程方式:开发者用自然语言描述目标,让模型快速生成可运行的原型,再通过不断试错和迭代把产品推向可用状态。它降低了软件创造门槛,也让很多非专业开发者第一次具备了「做出应用」的能力。
但 Karpathy 的关键判断是:Vibe Coding 并不是 AI 编程的终点,并且 Vibe Coding 正在分叉。一条路继续服务于原型验证、个人项目和快速实验;另一条路则进入生产环境,演化为 Agentic Engineering。
二者的区别不在于是否使用 AI,而在于是否具备工程约束。Vibe Coding 更看重速度和灵感,目标是快速跑通一个东西;Agentic Engineering 更看重可靠性、可验证性和可维护性,目标是让 Agent 参与真实的软件交付。

这也是很多团队从感受到「AI 写代码很爽」逐步意识到「AI 写代码也很危险」的转折点。一个 Demo 可以接受幻觉、漏洞和不稳定;一个生产系统不能。到了生产环境,AI 生成的每一次提交,都需要测试、审查、回滚和厘清责任边界。
三、真正的护城河是驾驭 Agent 的工程能力
Agentic Engineering 可以理解为一套新的工程方法:人类不再只负责写代码,而是负责定义任务、拆解流程、设计评估、设置权限、观察输出,并在关键节点接管判断。
在这个框架下,Prompt 只是入口。真正重要的是 Spec design、Eval design、Diff review、Security oversight 和 Quality bar。也就是说,专业能力不再只体现在「我能不能实现」,而是体现在「我能不能让 AI 在正确边界内实现」。

这会带来一个直接后果:程序员的价值开始从中间实现层,向上游的系统设计和下游的验证体系迁移。写函数、补样板代码、查文档、生成测试这些工作,会越来越多地被模型吸收;但定义系统边界、判断架构取舍、设计评估标准的能力,会变得更重要。
Karpathy 那句被反复引用的话,概括了这种变化:你可以外包思考,但不能外包理解。AI 可以给出方案、代码和解释,但它不会替你承担系统失败的后果。
四、一直在波动的大模型不是传统软件
理解 Agentic Engineering 的前提,是理解并承认大模型并不是传统意义上的软件模块。传统软件是确定性的,输入、逻辑和输出之间有清晰关系;大模型则更像一个能力不均匀的智能体,在一些复杂任务上表现惊人,又会在基础问题上犯低级错误。
Karpathy 用「幽灵」来形容这种智能:它有时像专家,有时像新手;它能写出复杂程序,也可能编造一个不存在的依赖包。它的能力边界不是平滑的,而是锯齿状的。

这就是为什么 AI 编程不能只讨论生成能力。生成越强,验证越重要。因为模型不稳定的地方,往往不是任务描述里最显眼的地方,而是藏在边界条件、依赖关系、安全策略和长期维护成本里。
对企业来说,引入 Agent 不是简单采购一个工具,而是重建一套工作流。它需要日志、权限、测试、评估、监控、回滚和人工审查。没有这些基础设施,Agent 只是一个更快的代码生成器;有了这些基础设施,它才可能成为工程系统的一部分。
五、「可验证性」决定 AI 最先改造哪些行业
Karpathy 框架里最有操作性的部分,是「可验证性」。一个任务是否适合被 AI 自动化,不只取决于它看起来有多复杂,而取决于结果能否被低成本、高确定性地验证。

软件开发是一个天然适合 Agent 的领域,因为它有大量现成的验证节点。代码能不能编译,测试能不能通过,接口是否符合规范,性能是否退化,这些都可以被工具链捕捉。模型可以犯错,但错误可以被自动化系统发现并反馈。
因此,AI 最先规模化落地的场景,往往不是最「开放」的场景,而是那些生成难、验证相对容易的场景。例如代码生成、测试生成、合规审计、法律文本比对、医疗影像标注、金融风控、工业质检等。相反,战略判断、品牌定位、组织管理、复杂创意决策等任务,虽然 AI 也可以生成建议,但验证成本高,反馈周期长,结果标准不稳定。因此它们更适合作为辅助决策,而不是完全自动化。
这对 AI 产品创业也有启发。不要只问「AI 能不能做」,而要问「AI 做完之后,谁来判断它做对了」。如果验证机制不清晰,产品很容易停留在炫技阶段;如果验证机制足够强,AI 才能进入真实流程。
六、Software 3.0 不是「无代码」,而是「高验证代码」
很多人把 Software 3.0 理解为无代码时代,但这个判断可能过于乐观。更准确地说,它是一个高生成、高验证的软件时代。代码仍然存在,只是生成代码的主体发生变化;工程师仍然重要,只是价值核心发生变化。
未来的软件团队,可能会更像一个由人类工程师和 AI Agent 组成的混合系统。人类负责目标、架构、质量和责任;Agent 负责执行、搜索、生成、修复和局部优化。这也解释了为什么「会不会写代码」不再是唯一门槛,「懂不懂系统」才是新的分水岭。初级的实现能力会被快速商品化,但系统理解、业务理解、安全意识和评估能力会更稀缺。
对于个人开发者来说,最现实的策略不是抵抗 AI 写代码,而是尽快掌握 AI 工作流:如何写清楚需求,如何拆解任务,如何设计测试,如何审查 Diff,如何让 Agent 在失败时重新尝试。对于技术管理者来说,重点也不该停留在「团队用了多少 AI 工具」,而是要看 AI 是否进入了可度量的工程流程。没有评估体系的 Agent,很难形成生产力;没有质量检测和验证的自动化,只会放大风险。
七、国内开发者需要补课的地方还有很多
在中文语境下,Software 3.0 的落地还会遇到更多现实约束。模型能力、英文技术资料、开源生态、企业合规、数据边界、内部代码权限,都会影响 Agent 能走多远。

这意味着,国内的团队不能只复制硅谷的 AI 编程叙事。真正重要的是把 Agent 放进自己的工程系统里:连接代码仓库、测试平台、知识库、权限系统和发布流程,并明确哪些任务可以自动化,哪些任务必须人工确认。
对国内开发者来说,一个可能更实际的判断,是短期内 AI 不会让所有人都变成优秀工程师,但会迅速拉高「能做出东西」的下限。与此同时,它也会放大工程质量差异。会用 AI 做 Demo 的人会更多,会用 AI 交付可靠系统的人仍然稀缺,而这恰恰也是机会所在。
相应的,这也让 Kimi、DeepSeek、Claude、Gemini、Codex 等工具的选择,变成一个工程组合问题,而不是单一模型排名问题。不同模型适合不同环节:有的适合架构讨论,有的适合代码生成,有的适合长文本分析,有的适合低成本批量执行。
八、结语:软件行业的新瓶颈是理解力
Software 3.0 最值得关注的地方,不是它让代码生成变得更快,而是它重新定义了软件生产中最稀缺的能力。过去,稀缺的是能把需求翻译成代码的人;现在,稀缺的是能把目标翻译成系统、把系统翻译成约束、把约束翻译成验证机制的人。
AI 会继续接管越来越多具体实现工作,这是大概率事件。但它不会自动带来可靠的软件系统。可靠性来自评估、测试、架构、反馈和人类最终判断。所以,Software 3.0 背后不是关于「程序员消失」的故事,而是一个关于软件工程重组的故事。代码变便宜了,理解变贵了;生成变容易了,验证变重要了;工具变强了,人类的判断反而更不能外包。
参考来源: Sequoia AI Ascent 2026 / Andrej Karpathy 演讲:https://www.youtube.com/watch?v=96jN2OCOfLs websearchapi.ai《Andrej Karpathy on Agentic Engineering》:https://websearchapi.ai/blog/andrej-karpathy-from-vibe-coding-to-agentic-engineering Anthropic《Effective Harnesses for Long-Running Agents》:https://www.anthropic.com/engineering/effective-harnesses-for-long-running-agents LangChain《State of AI Agents》:https://www.langchain.com/stateofaiagents 36氪:http://www.36kr.com/p/3768680039088902 《Agent Engineering — Karpathy’s Ceiling-Raising Discipline》:https://primores.org/wiki/glossary/agent-engineering/ 《Navigating the Jagged Technological Frontier》:https://www.hbs.edu/ris/Publication%20Files/24-013_1703bc6f-9b03-40ff-b322-cf81feeefe4d.pdf mindstudio.ai《Karpathy’s Sequoia Talk: 5 Predictions About Agentic Engineering》:https://www.mindstudio.ai/blog/karpathy-sequoia-talk-5-predictions-agentic-engineering/
