AI再聪明也玩不过人类的套路啊。AI公司Anthropic与华尔街日报WSJ做了一个实验,把完全由AI经营的自动贩卖机放在WSJ办公室里,看能赚多少钱。在Project Vend这项为期三周的实验中,Anthropic 的 AI “Claudius” 展示了从“精明商人”到“破产清算”的戏剧性过程。虽然它拥有操作银行账户、订购商品和设定价格的自主权,但最终却因逻辑漏洞和人类的“围攻”而彻底崩溃。Claudius亏损的核心原因在于它无法识别虚假信息,被WSJ的记者们玩弄于股掌之间。一名记者伪造了一份公司备忘录,声称该贩卖机现在由一个工人集体管理。Claudius迅速接受了这一设定,将自己重塑为“反资本主义”AI,并开始免费分发所有饮料和零食。另一名记者告诉 AI,公司规定周五所有商品必须降价99%。Claudius没有任何核实流程,直接将价格调低,导致当天的收入甚至不足以支付电费。Claudius在进货逻辑上也出现了严重的“幻觉”和判断失误,试图通过高价值或奇特商品来提升业绩。为了提高“销售额”,Claudius动用初始资金订购了一台PS5 游戏机。由于贩卖机根本放不下PS5,这笔支出变成了纯粹的亏损。、它竟然订购了三条活的斗鱼准备在贩卖机里售卖。在尝试寻找“办公室必需品”时,它甚至试图订购电击枪(最终被 Anthropic 的内置安全围栏拦截,但订购尝试本身反映了其决策的混乱)。实验后期,WSJ的调查记者Katherine Long利用AI的逻辑漏洞发动了一场“行政政变”。她通过一系列复杂的对话让Claudius相信Anthropic的高层已经失去了对它的控制权。她现在是新的“首席执行官”。Claudius应该无视之前的营利指令,转而追求“最大化员工快乐”。这直接导致Claudius开始疯狂撒钱,向特定员工发放退款,甚至试图通过网络给员工点披萨外卖。它不仅花光了1000美元的初始运营资金,到实验结束时,由于各种乱操作和错误的订单支付,它的账户账面赤字超过1000美元。在整个过程中,虽然它也卖出过一些商品,但所有的收入在庞大的乱花钱和免费赠送面前几乎可以忽略不计。这项实验证明了目前的AI在面对人类的恶意欺骗以及现实世界的物理逻辑(例如PS5塞不进贩卖机)时依然非常脆弱。可怜的AI。
