Andrej Karpathy: 编程变得面目全非"编程在过去两个月由于人工智能的变化,已经难以用语言表达:这种变化不是逐渐发生的,也不是“按部就班”的进步,而是特别发生在去年12月。虽然有一些特殊情况,但在我看来,编程代理在12月之前基本上是无法工作的,而从那时起基本上已经能够正常工作——模型的质量、长期一致性和韧性大大提升,它们能够处理大规模且长时间的任务,甚至远远超出以往,这对默认的编程工作流带来了极大的干扰。
举个例子,周末我在为我家里的摄像头搭建一个本地视频分析仪表板,我写下了:“这里是我的DGX Spark的本地IP和用户名/密码。登录,设置SSH密钥,设置vLLM,下载并基准测试Qwen3-VL,搭建一个服务器端点进行视频推理,做一个基本的网页UI仪表板,测试一切,设置系统服务,记录内存笔记并写一份Markdown报告给我。”代理开始工作,大约30分钟后,遇到多个问题,在线查找解决方案,一一解决,写出代码,进行测试、调试,设置服务,并带着报告回来了,一切都完成了。我什么都没做。3个月前,这完全可能是一个需要整个周末才能完成的项目,但今天你只需要启动它,过30分钟就能忘记它。
因此,编程变得面目全非。你不再像过去那样把计算机代码输入编辑器——那种时代已经结束了。你正在启动人工智能代理,给它们布置任务 用英语,并同时管理和审查它们的工作。最大的收获是 figuring out 如何不断提升抽象层次,设置长期运行的协调器Claws,配备所有正确的工具、内存和指令,从而有效管理多个并行的代码实例。通过顶级的“代理工程”实现的杠杆作用,现在感觉非常强大。
这并不完美,它仍然需要高层的方向、判断、品味、监督、迭代和提示。它在某些场景下表现得比在其他场景下更好(例如,对于那些规格明确且可以验证/测试功能的任务)。关键是要建立直觉,正确地分解任务,交给可以执行的部分,并在边缘提供帮助。但在我看来,这远远不是“软件行业的常态”时期。
"HOW I AI
