上个月我用DeepSeek查一个技术文档的版本号,它非常自信地告诉我“最新的3.8版本引入了XX特性”。我查了GitHub发现这个项目压根没发布过3.8版本,最新稳定版是2.7。
这种AI“一本正经胡说八道”的现象,学名叫幻觉(Hallucination),是目前所有大语言模型都绕不开的问题。而且有个残酷的真相——幻觉不是bug,是模型工作原理的副产品。
大模型为什么会“编造”信息?
先把原理用大白话说清楚。
大语言模型本质上是一个超级复杂的“下一个词预测器”。你给它一段话“中国的首都是”,它根据训练数据里学到的东西,算出“北京”这个词的出现概率最高,于是输出“北京”。
问题在于,当你的问题超出了训练数据的覆盖范围,或者涉及需要精确记忆的事实(比如一个具体项目的版本号),模型不会说“我不知道”——因为这个能力没有被训练出来。它只会继续做它擅长的事情:生成一个看起来合理的下一个词。
举个例子。如果你问DeepSeek“张三这个人是谁”,训练数据里没有任何张三的信息,但模型已经学会了“XXX是著名的YYY,出生于ZZZ年”这种回复格式。于是它现编一个“张三,著名计算机科学家,出生于1985年”——这段话从语法和结构上看完全没问题,但内容是纯编的。
这跟搜索引擎的“无结果”完全不同。搜索引擎查不到就告诉你查不到,AI模型的底层逻辑决定了它很难主动承认自己不知道。
幻觉的三种常见类型
实际使用中,AI幻觉大概分三种:
类型1:事实性幻觉。最常见的一种,比如编造人名、时间、数据。特征是非常自信,甚至会加上看似合理的细节。比如你问“请介绍一下《水浒传》第121回的内容”——《水浒传》总共120回,但AI会给你编一段第121回出来,写得有模有样。
类型2:逻辑性幻觉。推理过程中产生的错误。比如让它算“一个苹果2块钱,小明买了3个,小红买了5个,一共多少钱?”它能答对。但如果问题变成“一个苹果2块钱,小明买了3个苹果和2个橘子,橘子比苹果贵1块,一共多少钱?”,有时候就会在中间某一步算错。
类型3:来源性幻觉。引用不存在的文献、论文或链接。这个在学术场景里危害最大。你让它推荐几篇相关论文,它可能给你编出看起来很正经的论文标题、作者和期刊名,但全部是虚构的。
哪些场景幻觉风险最高?
根据我自己用AI一年多踩过的坑,这几个场景是幻觉高发区:
- 具体的数字和日期:销售额、GDP数据、发布日期——尽量用联网搜索验证
- 代码细节:API参数名、函数签名——让AI写代码没问题,但不要完全信任它调用的具体API
- 名人语录:“鲁迅说过”“乔布斯说过”——AI编名言的能力已经炉火纯青了
- 法律条款:具体的法条编号和内容——这个绝对不能信,必须查原文
普通人怎么应对?四个实用技巧
1. 开启联网搜索。现在DeepSeek、豆包、Kimi都支持联网搜索,涉及实时信息、具体数据的时候一定要开。开了联网之后幻觉率能降低80%以上。
2. 交叉验证。拿不准的事实性信息,换个AI再问一遍。如果两个不同的模型给出一样的数据,可信度会高很多——因为它们训练数据不同,不可能同时编出一模一样的错误。
3. 让AI引用来源。提问时加一句“请注明信息来源”。虽然AI有时候会给假来源,但如果它给不出来具体的URL或引用,至少说明这个信息它自己也不太确定。
4. 学会识别AI的“不确定信号”。当AI回复中出现“一般来说”“通常”“可能”这类模糊词的时候,大概率是它不太确定的地方。这句话里的信息千万不要拿来当依据。
一句话总结:把AI当成一个知识面很广但记性不太好的同事——聊思路、写初稿、做总结,它是一把好手。但涉及到具体数据、法律条文、技术细节,自己查一遍再信。
标签: AI幻觉 大模型 AI科普 DeepSeek 人工智能
还木有评论哦,快来抢沙发吧~