聊聊 AI 对我们工作方式的改变吧。
你想想,现在我们在互联网和计算机上是怎么工作的,大部分工作都是通过 GUI 和使用软件,对吧?
你从上游接到任务,打开 Figma、AE、Unity、Blender、Office 等等一堆软件,劈里啪啦一顿操作,完成之后交付给下游。
大致上是这样。
而现在的 AI 完成工作,大概有两个方式:
1、不给中间过程,直接端到端输出结果:图片生成、音乐生成、3D 生成、视频生成等等,都是这样,直接从输入到输出,中间是黑盒。这些生成的问题是不可控,需要抽卡,对提示词要求高,如果有素材垫,AI 还能模仿一下;没有素材垫,AI 纯自由发挥,靠提示词去控制太难。
2、试图让 AI 通过多步操作,甚至使用传统软件,来完成工作。从去年开始的 Agent,就是这种操作,自己会拆解步骤,自己会执行,有各种权限和工具,很像人类的工作方式,也有操作记录可查,不是纯黑盒。但是目前不论是软件还是互联网,对 Agent 都不能算友好,它们现在算是在泥沼中工作。
第一种,大多是媒体生成,基于扩散模型的逻辑,很多人都一次又一次地被模型能力震惊到,Sora、Nano banana Pro、Suno、Seedance 2.0。原来在这些领域,你要想拿出好的作品,都要掌握软件的使用能力,一堆很复杂的软件。但现在很神奇,用 AI 输出这类作品的人,几乎不要再去学那些软件了(不过还是要学习该领域的一些基础知识和概念)。
这是一次很重要的技能迁移以及技术平权,从使用软件到使用提示词等等,门槛骤降、手艺贬值。由于不可控,它也会让很多熟练掌握传统软件的人感到不舒服,更想握住自己手中的沙。但更多人进来,更多更好的作品被打造出来,这个趋势应该是没有问题的。
第二种,是由 LLM 驱动,这一年多以来也震惊了很多人,Manus、Claude Code、OpenClaw,全自动这个概念,你就说帅不帅吧。10倍工程师、100倍工程师、1000倍工程师的说法都出来了,非常焦虑。
但这个领域非常邪门,你说它技术平权了吧,但它让人要学的东西更多了,每天冒出一堆东西,学不完、根本学不完。
主要是这个领域本身有一些问题要去解决:- LLM 本身的问题,推理能力、Agentic 能力、注意力、上下文窗口、幻觉(瞎编),没有记忆- 工具和基础设施的问题,LLM 更擅长做接龙,它使用的工具和基础设施和人类不一样,人类做的互联网和软件大多数都是基于 GUI 的,这对 Agent 并不友好- 人类工作流程,人类的很多工作到底要怎么做,人类还是要给予指导的,人类不能只评估结果,也要在过程中给出指导或建议
这个领域就比较分化了,上限很高、下限很低,有非常排斥的传统手艺人,也有积极拥抱的传统受益人,还有新进入者。不管你是什么类型的,想要达到超高倍数的效率提升,一定是多栖的。
你说它改变了我们的工作了吧,确实改变了,但只限于少数人,就很像很多人装好了 OpenClaw 但用不起来一样,它现在的门槛还是太高了。
未来会怎么发展?
我不知道,也许也会端到端吧,人类只需要给指令,它就能完成工作。
但这里面就有一个事很有意思了,如果所有的工作都能言出法随的完成,并到达一种随心所欲的程度,这意味着语言将成为人类的遥控器,中间的一切可能都会消失并隐藏,那这会是一个什么样的世界呢 ?