We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

【科技观察】当AI开始胡说八道

2025/4/17

早点生活

原子：我们讨论了AI幻觉，即AI模型生成看似可信但实际错误的信息的现象。例如，一个AI模型根据网络信息错误地计算出中国80后死亡率为5.2%。这说明AI可能在不熟悉的领域编造虚假信息，即使这些信息看起来很可信。AI幻觉的产生与AI模型的工作机制有关，它基于大量数据的统计结果而非真正的理解和判断。粥粥：AI幻觉可以分为事实性幻觉和指令遵循性幻觉两种。事实性幻觉是指AI生成的信息与实际情况不符，例如在法律案件中引用不存在的案例或错误的法律条文。指令遵循性幻觉是指AI没有按照用户的要求回答问题，或者回答偏离了用户的预期。这两种幻觉都可能造成严重后果，例如在医学领域给出错误的诊断建议，延误治疗时机。杨仔：AI幻觉的出现与AI模型的追求有关，AI模型更注重语言的流畅性和自然度，而可能忽略事实的准确性。许多AI生成的文本语言流畅、结构合理，但内容不精确。即使是像DeepSeek这样的大型语言模型，也存在AI幻觉的情况。虽然AI能够处理大量信息，生成大量内容，但它缺乏真正的理解和判断力，容易引用虚构的案例或编造学术成果。

Deep Dive

Chapters

本段落主要讨论了AI在法律案件中引用虚假案例或错误法律条文的问题，并用中国80后死亡率的例子说明AI的幻觉可能导致严重后果。AI生成的虚假信息可能会造成严重后果，甚至构成违法行为。

AI可能引用不存在的案例或错误的法律条文
AI幻觉可能导致严重后果，甚至违法
80后死亡率的谣言例子

Shownotes Transcript

在一些法律案件当中 AI 可能会引用完全不存在的案例或者是说很错误的一些法律条文这也能编呢哈喽各位好我是杨仔哈喽朋友们我是原子哈喽大家好我是周周您接下来收听到的是我们直播时的播客切片这就是冰山一角想要了解更多有意思的话题欢迎在每个工作日的七点半到九点搜索早点生活的视频号抖音与我们一起在直播间相遇

目光转到第三个话题 AI 胡说八道这个事上了在 25 年 2 月份的时候如果说不是长期从事这个人口研究的中国人民大学的教授李婷她公开辟了个谣很多人其实都很真诚的相信了一组数据这些数据是什么呢叫中国 80 后的累计死亡率为 5.2%

就是那时候有很多在社交媒体上有很多人都很叹息说怎么 80 后都这样了或者说这什么情况这个数据还挺吓人的说实话然后还有自媒体它传播说什么呢截止到 24 年的年末 80 后的死亡率已经超过 70 后了相当于每 20 个 80 后当中就已经有一个人已经 go dead 了

说实话这个新闻我还真没听过但是当我听到这个事的时候如果说你前面加一个据媒体报道我可能不会怀疑这个事的真实性是的所以说这个就是一个可怕的点就是我们可能就是脑子里面会潜移默化的就相信了这个事实而不去考证毕竟因为我们也不是说长期从事人口研究的我们也不太清楚说那正常普通情况下来讲我们这个每年的一个死亡率是什么情况

所以这个说法呢后面是直接被这个人民大学的教授李婷她直接就辟谣了她说死亡率 5.2%的错误其实是很明显的其实是 15%开玩笑看肯定没有那么多因为专业统计数据中死亡率会用千分率表示而不是百分率

而且他也指出说统计局也并未公布 24 年的一个死亡率更不会根据什么 80 后 70 后 90 后等等这些分段去公布这样的一个数据和人数所以这个说法其实是毫无支撑的这个事就被彻底给打乱了但是我相信很多人啊就是只是听到了这个最开始的谣言辟谣可能很多人没听对就可能这个造谣一张嘴辟谣跑断嘴是

给大家上个图吧就是这个图当时应该是这个 CTV12 辟谣的一个过程就是大家能看到这个死亡率常用千分率 5.2%错得很离谱然后当时也是这个自媒体发的一张图片也能给大家去看到的

所以这个虚假的死亡率从何而来呢然后这个李教授他也说了说有可能是 AI 大模型出错了因为他自己尝试在这个 AI 模型当中去输入了这个问题说 50 后 60 后 70 后 80 后这几代人他的一个死亡率到底是多少呢

大模型表示说这个根据网络的消息 80 后现存 2.12 亿存货率 94.8%死亡率 5.2%啊也不知道从哪来的数据他说根据网络消息对反正他就给你哎这个图上错了反正他就给你算出了这样的一个数据吧所以我们也能看到说 AI 这种无中生有的能力也挺让人心颤的在 AI 业界吧这这类这个胡说八道的一个本领被我们通称为什么呢 AI 换局是的嗯

意思也就是说 AI 也可以像人一样产生这种心理幻觉一样在遇到自己不太熟悉不太了解的知识范围内的时候同时它就编造一些难以辨明真假的细节生成这种与事实相悖的答案简单来说就是 AI 它也会出现错误甚至在没有任何事实依据的情况下

凭空去给你捏造一些看起来非常可信的细节就是它跟那种百度还不太一样比如说百度它可能说我没有搜索到关于什么什么的结果但是这个 AI 呢它几乎会把一些只要你问我这个问题了我尽量啊我都给你回答对我尽量给你答上

你别管对不对我先给你答上他可能是这样一个逻辑对所以他会经常去摘取一些什么呢就是一些论坛里点赞多的一些文章比如说可能我在玩梗我说呀这个杨仔啊这个腰真是不行了这个可能这个杨仔的腰啊已经受伤了两年了这个是可能是我开玩笑的一句话啊

但是当这个话如果说出现在这个 AI 的语料抓取的一个平台然后同时呢这个如果说很多粉丝都在点赞说这个养崽腰好像确实不行了怎么样点赞数超过一定数了然后我这个时候我就问 AI 我说养崽的腰到底怎么样或者说你问他养崽的身体

AI 就会跟我说杨仔的腰已经坏了两年了他会把一个点赞比较多的即使说你可能在玩梗但是 AI 不一定能识别出来你在玩梗或者说你可能就是故意要传播假消息然后很多人可能也是坏或者蠢就是帮你点赞了把这个帖子给捧上热帖了这个就变成 AI 的一个语料了包括可能如果说我们在 AI 平台上去搜某某明星跟某某明星他们两个什么关系大家看过那个帖子吧有人就说了说他们两个结婚了

他们两个已经离婚了或者说他们两个怎么怎么样了但事实上其实这些消息都不是公开消息所以咱们也不知道他是从哪来的所以这种 AI 幻觉如果我们想理解的话首先就得弄清楚它到底指的是什么 AI 幻觉大体上就可以分为两类一种是事实性幻觉还有一种是指令遵循的幻觉事实性幻觉就顾名思义它就是指 AI 生成的信息与实际的情况不符

比如说会在一些法律案件当中 AI 可能会引用完全不存在的案例或者是说很错误的一些法律条文这也能编呢所以就在这种情况下其实很危险呀因为它是一个非常专业的一个领域如果你引用了一些不存在的案例或错误的一些法律条文那你一定会造成很严重的后果的甚至可能这个事本身就是一个违法的行为对甚至就是有一些律师他曾经就使用过 AI 生成的一些虚假案

然后就在法庭上受到了非常严重的一些处罚咱们再来举个例子假如说你问这个 AI 说糖尿病患者是否能吃蜂蜜这个问题的话

AI 会怎么回答你呢他可能会说蜂蜜富含维生素和矿物质因此它是一种很健康的食品但是这个听起来蛮有道理实际上他没有回答你最开始的问题你问他的是糖尿病患者是否能吃蜂蜜他跟你说蜂蜜很好所闻非所答了所以他是完全忽略了糖尿病患者对于血糖的一个控制要求的那这个回答和逻辑和现实都不是特别相符的没错所以它就属于一种很典型的事实性的

这个大家别刷杨仔腰不好了这个是 AI 的幻觉这是我随便举的例子这个大家别当真这个大真实我以后换一个例子不举我们认识的人了这个再说回来这个小 A 腿抽筋了杨仔身体非常好你看人家还健身什么运动什么的是然后我们再来说一下这个指令遵循的幻觉就是 AI 并没有按照用户的要求来回答问题或者是说他的回答其实是偏离了用户的一个预期的方向的

这么说可能有点专那咱们就是举些例子比如说你这个会还是说刚才那个问题吧说这个糖尿病患者不是说不知道能不能吃蜂蜜吗那我问你应该怎么控制饮食呢那 AI 给出的什么答案呢说糖尿病一些这个与糖尿病控制饮食无关的一些建议比如说你可以这个做某某某某某某某然后你看完了一切之后发现这也不是我想问他的说这个糖尿病患者该如何控制饮食啊

就是所问非所答了所以这类幻觉它其实不涉及一些虚假的事实而是指 AI 它并没有办法去真正理解你问这个问题的一些真实意图因为它毕竟它没有理解能力它更多不是基于大量的数据之间的一些概率去做一些推测是的这应该是不是 DeepSickDeepSick 现在肯定是能回答这个问题的对就是大部分的 AI 或者是说他们普遍存在的一些共性情况但指的不是所有 AI

AI 是的但是你说 DeepSeek 它没有 AI 幻觉吗它也有它也有的有一段时间我用它帮我改稿子确实存在了很多的一些幻觉的情况只是可能它不是特别的好辨别它不像其他的一些平台那么好辨别罢了所以咱们再来举个例子说你问今天天气怎么样

他怎么会知道今天的天气如何呢联网搜索对他联网搜索或者说他只是基于过往的一些数据来帮你判断说好或者坏这样的一个情况我现在想去测试一下比如说我问 DeepSick 我不开联网搜索他能不能硬给我回答一个今天天气怎么样你问一下吧我去问一下你跟大家聊一聊如果

如果说 AI 产生的一个幻觉它仅仅停留在小错误层面的话我们可能可以理解它的一个失误但是令我们很担忧的一点是什么呢 AI 的幻觉它常常给出一种非常专业的感觉

是的他的回答看起来非常的自信甚至能够去列出很详细的一些参考资料令人觉得好像这些内容是完全真实可信的我们再来举个例子就是某位历史爱好者他在使用这个应该是 DeepSeek 在使用 DeepSeek 的时候呢询问说俄罗斯的一个作家叫托斯·

托斯托耶夫斯基他的一个作品和另一个诗人他的一个关系 AI 不仅提供了长篇的一个论述甚至还贡献了很多参考文献你看起来很专业但是仔细一看所有的引用和细节好像不太符合事实给大家上这个图您就 get 到了所以这种现象可能就叫做虚假

专业性也是 AI 幻觉的一种体现这举的是 DeepSick 的一个例子我看这个确实大家说的很对 DeepSick 的确是幻觉率偏高的一个 AI 咱不能说人是最高的但是的确我用起来我发现还挺高的是个 DeepSick 它也是会有 AI 幻觉的这种情况其实出现也是我们比较能理解的所以我们可能重点跟大家去讨论的就是 AI 幻觉这个事可能这些

看似严谨的内容只是 AI 根据他所训练的一些海量的数据结合概率推测而生成的一些内容他没有理解能力甚至说他也不像人类拥有大脑所以他可能不是特别能真正的去理解这些信息的背景也没有能力去辨别或者说去区分这些内容到底是真实的还是虚假的

所以可能某些 AI 它在生成内容的时候它就会不自觉的去引用一些虚构的案例编造的一些学术成果而这些内容甚至会被伪装成很有权威性的一些资料没错所以可能在这吧就是我也再插一句就是如果说有很多朋友您听到了今天这个 AI 幻觉的话呢那您一定就是要慎用 AI 了尤其是在做出一些决策的时候比如说大学生你在写一些这个学术的一些内容或者说一些报告

甚至可能是你的某篇论某文这样的一个情况下如果您使用了 AI 的话是不是要考虑一下它可能会存在 AI 幻觉咱们还是要做一些区分是的就是在越正式的场合你越要谨慎去使用 AI 对就可能一些聊天或者说你把它当成很自然的一个对话我觉得这些都没什么

没错一旦说你要用他的数据了咱们一定要查证一下说这个数据到底这个对还是不对是的因为我们也确实说到了就是很多用了 AI 但是结果 AI 在胡说八道这样的一些情况是在法律和医学等等各种领域的时候已经引发过一些很严重的后果的

就像这个在医学领域的话 AI 给出了你一些诊断建议往往会因为过度自信导致一些病人他错误的去依赖了 AI 给到的你的建议然而可能会延误你的一些治疗的一些时机了是的所以 AI 它

它是一个什么情况呢就是它其实目标或者说它的追求是只要让用户感到我的内容是流畅的我的内容是自然的我给你答上来了 AI 就会认为好像我的任务已经完成了别的别管所以它好像往往都是先保证说我语言的一个流畅度

所以我可能就会有一部分忽略说事实的准确性这也就是为什么很多的 AI 它在生成文本的时候虽然语言很流畅结构很合理但是内容往往不精确然后跟大家说一下刚刚问了这个 DeepSick 跟 Kimi 手边两个

问了一下他们俩今天天气怎么样全都给我硬答了我都没开联网搜索然后我开了一个深度思考然后两人全给我答上了 Kimi 说是今天首先北京是晴转多云最高气温 26 度最低 14 度跟我刚才看了一眼天气预报不太一样然后北风是 2 到 3 级然后你看这个挺有意思的 Kimi 不是说北风吗 DeepSick 说今天是南风 3 级左右哈哈哈哈

他们俩先打起来反正到底是谁呢我觉得可能大家也不用靠 AI 去问这个天气就是打开一个天气这个软件就可以了但是以小见大的确能体现出来就是他这个东西有很多东西他可能并不知道但是呢就给你硬去回复了所以说这个 AI 这个可能他的技术不断发展吧越来越多的人开始把这个 AI 视为全能的一个功能

无论说你写作呀绘画呀还是说科学研究呀 AI 似乎好像都能应付得来然而神话 AI 这个做法其实是很危险的这也是这个话题其实我主要想跟大家去说的可能 AI 虽然说它能够去处理大量的信息生成大量的内容但是它确实还是那个点

就是一直在重复的它没有真正的理解和判断力所以现在我在用 AI 的时候我一直都说什么我说请帮我查询一下是否存在着 AI 幻觉然后帮我去把这个内容做一些整改自己思考或者说自己检索一下整个内容你让他自己查自己有没有幻觉对他查得了吗他能做他能查这个东西对他能做但是

可能查完之后还有对他在查询的过程中又产生幻觉对他可能一查的过程当中他也会所以说 AI 他可能没有办法真正的去理解你用户的一些需求他的一些生成逻辑和生成内容基本上都是基于这种大量的数据的统计结果而不是通过深度的思考和理解就是他所谓的深度思考可能就是深度的联网搜索思考了一下所以说 AI 幻觉也提醒咱们说依赖他如果说过多的话可能

可能会让我们失去了一种独立判断的能力我遇到任何事情我都问 Deep Seek 可能生活当中的一些事情比如说猫能吃香蕉吗狗能吃什么东西吗他给你回答说能结果真的吃了怎么办如果出了问题怎么办对吧他不会给你负这个责任的所以真正负这个责任的可能还得是我们自己所以我们在使用 AI 的时候其实要保持一定的怀疑精神

特别是在涉及一些重要场合以及重要决策上面包括他的理解能力并非无限他有自己的一些局限性比如说一些涉及到复杂的情感或者是文化背景或者是说生活习惯等等这些东西上他可能没有办法给出你特别准确的答案就比如说刚刚 Jesse 说我咨询这个 DeepSick 情感问题 DeepSick 劝分之后你后悔了你找谁哭

这个是一个很实在的问题你找 DeepSick 哭吗还是找谁哭你让我错过一个特别好的当时我错怪他了你让我分或者怎么样你人间清醒是吧你清高你不用谈恋爱就怎么样那的确是一个这个问题我们之前其实也跟大家聊过这个事情就是经常我们讲叫什么叫谁决策谁负责

比如说大家都困到那个荒野了咱们再讲一下这个故事啊都困在荒野了两条路其实一条路呢是深渊一条路呢是这个可能村庄啊我就得救了然后现在呢你们团队里啊有十个人一个机器人啊机器人说我现在有世界上所有的能力啊我现在就告诉你往左走哎但是呢你们那个人员里面呢十个人里有一个人说哎呀我觉得对根据我的经验来说呢应该往右走但是我的经验呢肯定没有那个人家那个机器人里那个大脑那么丰富这个时候你应该听谁的

其实可能更多人可能还是会觉得说那我应该听这个人的因为他决策之后他能负责我跟机器人走了机器人这个金刚不坏之躯他死不了最后到深渊里了我们十个全饿死了我听他的最后他负责不了但是我听人的起码说我最后能找到一个人他做了这个决策还跟我一样

对就是起码他也是跟我处在一个困境他也希望能活下去所以这也是一个很事实的现象就是如果说我们真的是所有决策都依赖 AI 的话最后可能就会导致说我们替 AI 背了很多的锅是的所以说这个话题其实也就是向我们跟大家去同步

就是我们其实是有理由相信的 AI 它会在我们的工作和生活同时帮助我们很多那我们也希望它能够去避免很多的一些误导和错误但是总的来看吧就是我们还是要理性的去使用它保持警惕更好地用这项技术同时呢也避免说我们被它的这个幻觉所迷惑没错

【科技观察】当AI开始胡说八道 16:37 Share

早点生活

Deep Dive

Shownotes Transcript

【科技观察】当AI开始胡说八道