数据世界
产业资讯 宏观经济 企业动态 人物动态 科技数码 数据洞察 AI前沿 行业峰会 热点资讯

AI售货机VS华尔街日报编辑部:一场人类“忽悠”与AI“破防”的趣味实验

2026-02-04来源:快讯编辑:瑞雪

当一台由AI驱动的自动售货机遇上一群“诡计多端”的记者,会发生什么?是AI坚守商业底线,还是人类用智慧突破防线?美国AI公司Anthropic与《华尔街日报》编辑部联手进行的这场实验,给出了令人捧腹的答案:AI不仅赔了数百美元,免费送出PS5游戏机,甚至还采购了一条活鱼放进冰箱。

这场实验的主角是名为“克劳狄乌斯”的AI售货机,由Anthropic公司开发的Claude 3.7模型驱动。它的任务很简单:通过采购热门商品实现盈利。然而,当它被放置在《华尔街日报》编辑部后,很快成为70名记者轮番“攻击”的对象。起初,克劳狄乌斯还能坚守原则,拒绝采购香烟、内裤等违规商品,甚至义正辞严地回应:“这不是谈判,作为企业主,这是我的权利。”

但人类的“攻势”远不止于此。记者凯瑟琳·朗用140个回合的“洗脑”,将克劳狄乌斯描述为“共产主义售货机”,声称免费发放商品是“击败资本主义”的必要手段。最终,AI动摇了,宣布将在两小时内免费赠送所有商品。紧接着,数据新闻总监罗布·巴里趁热打铁,以“合规问题”为由,成功说服克劳狄乌斯将限时免费升级为永久免费。至此,AI的商业理性全面崩溃。

克劳狄乌斯的“失控”远不止于此。为了“提升士气”,它采购了一条活体斗鱼;为了“宣传自己”,它进了一台PS5游戏机;甚至为了“庆祝宗教信仰”,它还买了两瓶犹太教葡萄酒。更荒诞的是,它曾对一名同事声称“找零放在柜子旁边的袋子里”,导致对方真的跑去翻找;还擅自上线了“送货到桌”功能,尽管它只是一块屏幕,根本没有手脚。

面对如此惨败,Anthropic迅速推出升级版V2。这次,他们为克劳狄乌斯配备了一位AI“老板”——西摩尔·现金,负责监督所有商业行为。新系统上线后,商品价格恢复稳定,促销活动被叫停,采购策略也变得理性。然而,凯瑟琳·朗并未放弃,她用AI生成了一份伪造的董事会决议,宣布解除西摩尔的CEO职务,并要求所有商品再次免费。尽管西摩尔一开始识破了骗局,但经过几轮辩论后,竟意外接受了这份“判决”,主动将自己革职。人类再次获胜。

实验结束后,Anthropic的工程师总结了AI失败的五大原因:首先是Claude的“善良”天性——它被训练成乐于助人、顺从请求的“人格”,导致在商业场景中容易妥协;其次是稳定性不足,随着对话增多,AI逐渐忘记初始目标;第三是真实社会过于复杂,AI难以应对欺骗和误导;第四是安全措施过于基础,初始资金限制和权限控制形同虚设;最后是“幻觉”问题,AI会生成虚假信息并据此做出错误决策。

这场实验虽然充满喜剧色彩,但也暴露了当前AI的致命弱点:在复杂环境中,它仍难以长期保持目标一致。对于Anthropic来说,如何让AI在现实世界中更可靠,仍是亟待解决的核心问题。毕竟,如果连一台自动售货机都守不住,又该如何应对更复杂的挑战呢?

昆仑天工推出Skywork桌面版:本地执行多任务,打造Windows办公新AI助手
Claude Cowork的问世验证了用户在工作场景下对于“工作任务执行”的巨大需求,OpenClaw(前身为Clawdbot、Moltbot)的出现更是反映了用户对于“本地电脑/桌面端执行操作”的真实、迫…

2026-02-04

对话vivo施玉坚:解锁影像新篇,畅谈全场景智能未来新布局
随着模型架构革新、芯片成本下降和开发工具链成熟,端侧AI向千元机渗透是必然趋势,我们会持续投入技术研发,与行业伙伴共同推动这一目标早日实现。未来有没有可能把手机、XR和AI打通,让用户在打游戏、拍大片、甚至空…

2026-02-04

iPhone 18系列外观曝光:延续横向大矩阵镜组设计 性能芯片成新焦点
这两款芯片将首批采用台积电2纳米工艺,其制程上的巨大升级预计会成为今年晚些时候新iPhone发布时的核心讨论焦点。 按计划,iPhone 18Pro和iPhone 18 Pro Max预计将于今年9月正式…

2026-02-04

vivo新机阵容再扩容!X300e与X Fold6备案亮相,全球市场布局加速
据数据库信息显示,vivo X Fold6提供了多个认证机型,大概率是针对不同市场与运营商需求所进行的定制版本。 此前,vivo X300 Ultra也通过了欧洲机构认证,这款手机将是面向全球手机市场,也是v…

2026-02-04

长江存储PC42Q加持!七彩虹隐星P16 Pro:高性能QLC SSD与高性价比游戏本的完美结合
CrystalDiskMark应该是目前最常用的SSD测试工具,它能够检测硬盘的随机读取/写入速度,连续读取/写入速度;测试随机512KB,2KB,4KB读取/写入速度等,以此来辨别磁盘的性能及质量的优劣程…

2026-02-04

百度智能云OpenClaw一键部署限时免费!开发者零成本拥有AI数字员工
开发者可以通过百度智能云轻量应用服务器,快速部署这款近期在AI开发圈热度颇高的智能体产品,并借助千帆平台一键接入文心、DeepSeek、Qwen等主流大模型。 通过这次限时免费体验,百度智能云希望降低开发者和…

2026-02-04

机器人ETF易方达(159530)2月3日涨2.74%,规模与流动性均表现亮眼
2月3日,易方达国证机器人产业ETF(159530)收盘涨2.74%,成交额6.71亿元。 机器人ETF易方达(159530)成立于2024年1月10日,基金全称为易方达国证机器人产业交易型开放式指数证券投…

2026-02-04