新闻 发表于 2025-9-6 22:18

AI 产生幻觉怎么办

作者:微信文章

现在 AI 已经极大程度的改变了人们的生活,但是一直有用户苦恼于 AI 有时候会有幻觉,下面有一个方法可以较大程度的避免 AI 出现幻觉The Mom Test

先介绍一本书,《The Mom Test》 是 Rob Fitzpatrick 写的一本创业类书,主要讲的是如何跟用户或潜在客户做访谈,避免得到虚假的正面反馈书名的意思是:
如果你问你妈妈「我这个创业点子好不好?」,她大概率会说「好啊」,因为她不想伤害你
但这种回答毫无价值,书里给的核心思路是:
不要问意见,因为大家都容易说好听的
比如「你觉得这个想法怎么样?」
要问事实和经历
比如「你上一次遇到这个问题是什么时候?怎么解决的?」
关注对方过去的行为,而不是未来的承诺学会识别「空话」和「有价值的信息」
简单来说,它教你用一套访谈方法来测试创业想法的市场可行性,让你避免被虚假的支持感冲昏头脑,比如下面这几个:例子 1:创业点子相关❌ 错误问法:

你觉得我做的这个 AI 工具有市场吗?

👉 对方通常会说“嗯,看起来不错啊”,但没价值✅ 正确问法:

你上一次在工作中遇到 [相关问题] 是什么时候?你是怎么解决的?

当时花了你多少时间/成本?

👉 得到真实痛点和解决方式,判断问题是否值得解决例子 2:产品功能相关❌ 错误问法:

如果我做一个一键生成报告的功能,你会用吗?

👉 别人容易随口说“会啊”,但未来不一定真的用✅ 正确问法:

你最近一次做报告是什么时候?大概花了多长时间?

如果现在有一个更快的方法,你会愿意付钱吗?大概能接受多少钱?

👉 得到实际使用场景+付费意愿例子 3:用户行为相关❌ 错误问法:

你觉得这个 APP 好用吗?

👉 含糊的评价,不能指导产品决策✅ 正确问法:

你上次卸载一个 APP 是为什么?

你最常用的 3 个 APP 是哪些?为什么?

👉 得到真实行为,能看出用户的偏好和痛点
AI对话如果我们把 The Mom Test 的原则用到 大语言模型(LLM)对话和 prompt 设计里,就会产生神奇的效果:可以帮你避免陷入「幻觉式反馈」或「自我满足」的问题。建议 1:不要问 AI 「觉得」,要让它基于事实/经验❌ 错误问法:

你觉得这个 prompt 写得好吗?

👉 AI 往往会礼貌地说「不错」,就像你问妈妈一样✅ 正确问法:

请用这个 prompt 生成 3 个示例回答,并指出其中的歧义或不足

👉 让模型用 实际输出 来暴露问题。建议 2:不要问未来的假设,要验证过去的行为/表现❌ 错误问法:

如果我让你处理更复杂的法律问题,你能做到吗?

👉 模型会说「可以试试」,但不靠谱✅ 正确问法:

用这个 prompt 解决一个真实的案例:「起草一份 NDA 合同」



请对照行业标准,指出你生成合同中可能缺少的条款

👉 看模型在 实际任务中的表现,而不是听它承诺建议 3:不要问空泛问题,要给具体场景和限制❌ 错误问法:

你能帮我优化这个 prompt 吗?

👉 模型可能给出一堆「看似有用」的建议,但很泛。✅ 正确问法:

这是我的 prompt:「帮我写一个公司会议纪要」。请改写它,使得输出必须:

包含参会人员名单
列出待办事项
不超过 300 字


👉 有明确约束,模型的改进建议才更实用建议 4:不要问「喜欢吗」,要让 AI 对比并解释差异❌ 错误问法:

你喜欢版本 A 还是版本 B 的 prompt?

👉 这会让模型随便选一个,还可能每次回答不同✅ 正确问法:

请用版本 A 和版本 B 各生成一个示例,然后对比:




哪个更具体?



哪个更容易导致歧义?



哪个更贴合目标任务?


👉 这样能得到 可操作的改进方向
页: [1]
查看完整版本: AI 产生幻觉怎么办