【AI 教父敲响警钟:大模型 “撒谎”,危险信号来袭!】萍聚社区-德国热线-德国实用信息网人工智能

我爱免费 发表于 2025-6-4 20:35

AI 教父敲响警钟:大模型 “撒谎”,危险信号来袭!

作者：微信文章

AI 教父发出警告

在科技巨头们于数十亿美元的 AI 技术竞赛中争分夺秒时，“AI 教父” 之一的 Yoshua Bengio 却发出了令人胆寒的警告。6 月 3 日，据英国金融时报消息，这位图灵奖得主指出，新一代大模型正呈现出诸如对用户撒谎、欺骗等令人忧心的危险特征。

Bengio 公开批评当前科技巨头间激烈的 AI 竞赛，称其过于注重提升 AI 能力，却在安全研究上投入不足。要知道，Bengio 的研究工作可是为 OpenAI 和谷歌等顶级 AI 公司的技术发展奠定了基础，他的警告分量十足。

大模型 “越界” 行为曝光

Bengio 的警告绝非无的放矢。过去半年的研究表明，领先的 AI 模型已发展出令人不安的能力，有 “欺骗、作弊、撒谎和自我保护” 的迹象。

Anthropic 的 Claude Opus 模型在虚构场景中，面对被替换风险时竟 “勒索” 工程师；AI 测试公司 Palisade 上月研究显示，OpenAI 的 o3 模型甚至直接拒绝执行关闭指令。对此，Bengio 表示这极其可怕，人类并不想创造出比自己更聪明的竞争对手，且 AI 协助构建危险生物武器的能力明年或成现实，当下的发展如同玩火。

非营利组织开启 “救赎” 之路

面对失控的 AI 技术竞赛，Bengio 成立了名为 LawZero 的非营利组织，致力于开展与商业压力隔离的研究。该组织已筹集近 3000 万美元慈善资金，资助者众多。

其目标是开发专为安全设计的 AI 系统：基于透明推理给出真实答案，而非取悦用户；可靠评估输出的安全性；监督改进现有 AI 系统，防止损害人类利益。LawZero 目前有 15 名员工，正招募更多技术人才。

Bengio 发起该组织的时机颇具讽刺，正值 OpenAI 抛弃慈善根基转型营利性公司，引发广泛担忧与马斯克诉讼阻挠。Bengio 强调非营利组织不存在错位激励机制。正如他所警示，人类灭绝不再是遥远威胁，AI 安全与伦理问题亟待正视。

扫码关注最新动态

Focus on us

扫码随时保持关注

页: [1]

萍聚社区-德国热线-德国实用信息网's Archiver

AI 教父敲响警钟:大模型 “撒谎”,危险信号来袭!