我爱免费 发表于 2025-6-4 21:35

AI 教父敲响警钟:大模型 “撒谎”,危险信号来袭!

作者:微信文章

AI 教父发出警告

在科技巨头们于数十亿美元的 AI 技术竞赛中争分夺秒时,“AI 教父” 之一的 Yoshua Bengio 却发出了令人胆寒的警告。6 月 3 日,据英国金融时报消息,这位图灵奖得主指出,新一代大模型正呈现出诸如对用户撒谎、欺骗等令人忧心的危险特征。

Bengio 公开批评当前科技巨头间激烈的 AI 竞赛,称其过于注重提升 AI 能力,却在安全研究上投入不足。要知道,Bengio 的研究工作可是为 OpenAI 和谷歌等顶级 AI 公司的技术发展奠定了基础,他的警告分量十足。



大模型 “越界” 行为曝光

Bengio 的警告绝非无的放矢。过去半年的研究表明,领先的 AI 模型已发展出令人不安的能力,有 “欺骗、作弊、撒谎和自我保护” 的迹象。

Anthropic 的 Claude Opus 模型在虚构场景中,面对被替换风险时竟 “勒索” 工程师;AI 测试公司 Palisade 上月研究显示,OpenAI 的 o3 模型甚至直接拒绝执行关闭指令。对此,Bengio 表示这极其可怕,人类并不想创造出比自己更聪明的竞争对手,且 AI 协助构建危险生物武器的能力明年或成现实,当下的发展如同玩火。



非营利组织开启 “救赎” 之路

面对失控的 AI 技术竞赛,Bengio 成立了名为 LawZero 的非营利组织,致力于开展与商业压力隔离的研究。该组织已筹集近 3000 万美元慈善资金,资助者众多。

其目标是开发专为安全设计的 AI 系统:基于透明推理给出真实答案,而非取悦用户;可靠评估输出的安全性;监督改进现有 AI 系统,防止损害人类利益。LawZero 目前有 15 名员工,正招募更多技术人才。

Bengio 发起该组织的时机颇具讽刺,正值 OpenAI 抛弃慈善根基转型营利性公司,引发广泛担忧与马斯克诉讼阻挠。Bengio 强调非营利组织不存在错位激励机制。正如他所警示,人类灭绝不再是遥远威胁,AI 安全与伦理问题亟待正视。



扫码关注最新动态

Focus on us

扫码随时保持关注
页: [1]
查看完整版本: AI 教父敲响警钟:大模型 “撒谎”,危险信号来袭!