We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

E265. AI认知障碍研究惊人发现 | 用户数据隐私风险上升

2025/1/13

创新灯塔

AI Deep Dive AI Insights AI Chapters Transcript

People

西

西娅

Topics

西娅：我关注到AI在认知能力测试中的表现，以及由此引发的数据隐私和安全问题。最近的研究表明，一些先进的AI模型在认知测试中表现出类似人类轻度认知障碍的症状，例如在视觉空间测试和记忆测试中出现错误或健忘现象。虽然在文本分析和抽象推理方面表现出色，但这提醒我们不能盲目乐观地看待AI的能力，需要保持清醒的认识。与此同时，AI产品的普及也带来了日益严重的数据隐私风险。大量的用户数据被收集用于模型训练，但不同公司在数据使用方面存在差异，有些公司默认使用用户数据，有些提供退出机制，但用户往往不会仔细阅读条款，处于弱势地位。更重要的是，收集用户数据并不一定能显著提升模型能力，反而增加了隐私泄露的风险，也使得隐私保护更加困难。因此，我们需要加强对AI产品数据采集和使用的监管，以更好地保护用户隐私和数据安全。此外，我还关注到大学生对AI工具的广泛使用，以及AI在学习和生活中的应用。许多大学生利用AI工具提升学习效率，例如定制教材、制定复习计划、论文润色等。AI搜索工具也越来越受欢迎，许多学生减少了对传统搜索引擎的使用。AI陪伴类工具也种类繁多，满足不同用户的需求。然而，大厂AI应用也面临着获客压力大、投流成本高昂等挑战，一些大厂产品开始聚焦内部存量市场。具身智能作为人工智能的热点方向，也面临着技术瓶颈和伦理挑战。虽然具身智能在智能制造和数字服务领域具有巨大的潜力，但其感知能力有待提升，数据隐私和安全问题也需要关注。AI情感陪伴类应用市场规模巨大，但隐私安全问题也需要重视。马斯克推出的Grok AI聊天机器人，虽然与X平台联动，并具有图像生成等功能，但在一些问题回答上表现参差不齐。总而言之，AI技术发展迅速，机遇与挑战并存，我们需要谨慎前行，平衡发展与安全。

Deep Dive

Key Insights

AI在认知障碍测试中的表现如何？

AI在认知障碍测试中表现出类似人类轻度认知障碍的症状。例如，ChatGPT 4.0在蒙特利尔认知评估量表中得分为26分，而谷歌Gemini 1.0仅得16分。AI在视觉空间测试中表现不佳，如连线测试和时钟绘制测试，错误模式与认知障碍患者相似。然而，AI在文本分析和抽象推理任务中表现完美。

AI产品的用户数据隐私存在哪些风险？

AI产品的用户数据隐私风险包括数据泄露和未经授权的数据使用。例如，OpenAI的ChatGPT在2023年4月因数据泄露在意大利被调查。不同公司在数据使用上差异显著，部分公司默认使用用户数据进行模型训练，而部分提供退出机制。用户常不细看条款，处于弱势地位。

大学生如何利用AI工具提升学习效率？

大学生利用AI工具贯穿学习生活的90%，如定制教材解读、制定复习计划、论文润色等。例如，侯泰宇使用AI工具提升了自学能力和效率，若拿走AI工具会极不适应。陈浩南在数理课程和编程上借助AI工具，如让Cloud帮忙写代码，对他帮助很大。

具身智能的发展面临哪些挑战？

具身智能的发展面临技术瓶颈，如感知能力有待提升，以及数据隐私与安全问题。此外，社会和伦理层面的难题，以及全球法律和监管尚不完善，也是具身智能发展的挑战。

马斯克的AI聊天机器人Grok有哪些特点？

马斯克的AI聊天机器人Grok在回答数学问题时表现与ChatGPT不分上下，但在餐厅推荐等回答上较粗糙。Grok的图像生成能力强，能生成各种有趣照片，即便涉及版权敏感内容也较大胆。Grok的优势在于国内用户能直接使用，且有临时绘画选项保障隐私。

Chapters

一项研究对五种大型语言模型进行了认知能力评估，结果显示AI在某些测试中表现出类似人类轻度认知障碍的症状，但在其他任务中表现完美。这表明AI与人类医生之间可能存在优势互补的格局。

大型语言模型在认知能力测试中的表现参差不齐，部分测试结果与轻度认知障碍患者相似
AI在视觉空间测试中表现不佳，但在文本分析和抽象推理方面表现完美
未来可能是人类与AI优势互补的格局

Shownotes Transcript

Hello 你好呀歡迎收聽創新燈塔這是一檔給你帶來每日全球科技資訊的節目我是西亞每天都會為你解讀科技和商業動態今天是 2025 年 1 月 14 號星期二讓我們開始吧今天的節目將探討幾個引人注目的問題 AI 技術是否真的能夠取代人類醫生尤其是在面對認知障礙測試時表現如何

随着 AI 的普及,我们的隐私安全又该如何保障学生们如何利用 AI 工具提升学习效率和生活质量以及巨声智能的发展将如何影响我们的未来接下来让我们来解锁这些商业科技动态吧

随着 AI 技术发展,人们猜测 AI 是否会取代人类医生最近英国医学杂志的一项研究有了意外发现 AI 会表现出类似人类轻度认知障碍的症状以色列哈达萨医疗中心研究团队对五种常见大语言模型进行认知能力评估如用蒙特利尔认知评估量表等测试

结果显示表现最好的 ChatGPT 4.0 警达级格线 26 分谷歌 Gemini 1.0 只得到 16 分

這些模型在視覺空間等測試中表現不佳如連線測試、時鐘繪製測試等任務裡錯誤模式與認知障礙患者相似專密聯模型在記憶測試中還出現健忘現象不過 AI 在需於文本分析並抽象推理的任務中表現完美研究人員指出 AI 雖有認知缺陷但未來可能是人類與 AI 優勢互補的格局我們要保持對 AI 能力的清醒認識

全球每天有數億人向 AI 產品傾訴想法等就鮮有人知這些對話正突破移動互聯網產品的數據使用界限主流 AI 產品大多會在用戶協議寫明收集用戶輸入用於模型訓練像 2023 年 4 月 OpenAI 的 ChatGPT 因私洩漏在義大利被戰鋒

2024 年 9 月埃爾蘭相關委員會對 X 公司訴訟等不同公司在數據使用上差異顯著如 Timmy、豆包等各有其數據收集及使用說明部分公司默認用用戶數據訓練部分提供退出機制但用戶常不細看條款處於弱勢

而且收集用户数据未必能大幅提升模型能力大模型训练根基多是公开数据用户数据质量不一与模型缺乏直接反馈回路大模型带来的隐私挑战复杂不仅有泄露风险还因参数化学习等让隐私保护更难如今 AI 产品的数据采集使用权限还在扩大相关讨论亟待加强

在恰吉 PT 和生成式 AI 席卷全球的當下大學生成了深度使用者硅谷 101 播客主理人洪君邀請四位不同階段的全身嘉賓分享他們在各種場景裡與 AI 相處的體驗就像一次用戶調研得出了不少有意思的結論

比如侯泰宇日常使用大模型产品频率极高贯穿学习生活的 90%在学习中可定制教材解读制定复习计划等考试阶段能帮助论文润色他觉得 AI 提升了自学能力和效率若拿走 AI 工具会极不适应再如陈浩南在数理课程编程等学习上借助 AI 工具如让 Cloud 帮忙写代码等对他帮助很大

還有在 AI 搜索工具使用方面侯泰宇常用 Perplexity 後發現密塔搜索在中文檢索上表現佳能提供很多來源引用且可自動生成追問問題使用 AI 搜索後他對 Google 等傳統搜索引擎的使用比重下降了約 70%~80%

另外,AI 陪伴类工具也有不同类型陈浩南介绍了严肃陪伴类如 PAT、Ti 心理治疗类如 YSA 以及非严肃类如心野、Talkie 等各有特点和用户群体

近日 AI2C 应用领域动态不断阿里通易 APP 团队在与阿里云分拆前就已从日活考核分拆也基于此需求其在千万月活俱乐部排名受批评等冲击大厂 AI 应用获客压力大投流虽关键但面临高昂费用指标难改善等挑战不少大厂产品便聚焦内部存量市场

一些 AI 應用走向新聞化如通應 APP 設置每日新鮮事、日期天氣組件以對話形式輸出新聞等但引發爭議被指有傳統流量運營色彩文小妍、元寶等也有類似問題而豆包披靡未過多投入於此此外,字節內部提升簡應級夢幽先級引發對 AI 應用發展型態思考

大廠 AI 應用競爭激烈騰訊元寶情況也受關注進入 2025 年大廠間在大模型各層的競爭將更白熱化是否有應用率先出局引人關注洛杉磯街頭曾發現一起特別的交通事故為某公司的無人出租車撞上了正在配送外賣的機器人

近几年科技发展迅猛 AI 大模型已被人们习以为常如今巨声智能成为人工智能热点方向巨声智能发展历程波折

1956 年達特茅斯會議是人工智能起點早期內在主義佔主流後因機器人學進展顯著巨生智能誕生 20 世紀 80 年代它風光一時有諸多理論成就但因側重低級智能的原因 90 年代陷入低谷 21 世紀受多因素推動再次興起且與內在主義關係從衝突轉向合作

巨声智能带来诸多机遇在智能制造领域可提升自动化水平支持柔性化生产实现更高效人机合作在数字服务领域能应用于养老教育等场景缓解相关问题其经济潜力巨大

不过巨生智能发展也面临挑战存在技术瓶颈如感知能力带提升等有数据隐私与安全问题涉及社会和伦理层面诸多难题且全球针对它的法律和监管尚不完善 1 月 8 日月文集团旗下众梦岛开启独立运营并完成超 1000 万美元新一轮融资由商汤国乡基金月文集团等投资

祝夢島定位新一代 AI 虛擬互動娛樂平台近 500 萬註冊用戶中近 80%是年輕女性人均日對話超 120 輪國內主打 AI 情感陪伴的 APP 不少像字節跳動的貓相可與虛擬 AI 角色互動 SO 的虛擬伴侶能超擬人化社交互動新也可支持創建和分享 AI 智能體

「祝夢島」APP 頁面由多個模塊組成產品豐富注重引導用戶創作交互據數據 2022 年全球虛擬 AI 陪伴市場規模達 8.97 億美元預計 2030 年將達 62 億美元 AI 情感陪伴能滿足精神需求或發展成新社交方式其受眾廣泛有諸多實用價值但隱私安全等問題也需關注

近日,馬斯克在直播中畫餅,稱 Tesla Bolt 產量將擴充百倍等與此同時,其旗下 AI 聊天機器人 Grok 的獨立應用昨日正式官宣率先在美國推出 iOS Beta 版目前雖能在 X 平台免費體驗 Grok2,但獨立應用仍值得一試,可免註冊體驗

经测试,Crowcap 能获取 X 平台部分内容不过存在信息滞后情况与 ChatGPT 对比,Crow 可以优势在于国内用户能直接使用且有临时绘画选项保障隐私等

在一些问题回答上 Grok 表现有优有劣如数学问题答案不分上下餐厅推荐回答较粗糙等此外 Grok 图像生成能力强能生成各种有趣照片即便涉及版权敏感内容也较大胆当前 AI 助手市场竞争激烈 Grok 虽姗姗来迟但凭借与 X 平台联动及自身个性或代表新可能宛如马斯克在数字世界的另一个自己

你知道历史上的今天都发生过哪些事情吗?在 1967 年 1 月 14 日美国宇航员尤金·塞尔南成为第一个在月球上行走的人塞尔南是阿波罗 11 号任务的成员他在月球表面行走了超过 21 个小时收集岩石样本并进行科学实验

1994 年 1 月 14 日美国国家航空航天局 NASA 发射了克莱门廷号月球探测器克莱门廷号是第一个使用激光测高仪对月球表面进行详细测绘的探测器它为科学家提供了大量关于月球地形和地质结构的数据 2005 年 1 月 14 日欧洲航天局 ESA 成功发射了金星快车探测器

金星快車是第一個對金星大氣進行詳細研究的歐洲探測器它收集了大量關於金星氣候大氣成分和表面特徵的數據 2010 年 1 月 14 日中國成功發射了第一顆月球探測器嫦娥二號嫦娥二號是中國探月工程的一部分它對月球表面進行了高分辨率成像並為後續的月球著陸和採樣任務提供了重要數據

2014 年 1 月 14 日美国国家科学基金会 NSF 宣布发现了迄今为止最大的黑洞之一其质量约为太阳的 110 亿倍这一发现有助于科学家更好地理解黑洞的形成和演化过程 2019 年 1 月 14 日 SpaceX 成功发射了首批 Stalin K 星

STARLINK 是 SpaceX 企划部署的全球卫星互联网网,旨在为全球用户提供高速、低延迟的互联网接入服务。这些事件展示了人类在科技、航空航天和科学领域的不断探索和进步。从月球探测到黑洞发现,每一次突破都为我们打开了新的知识领域,推动了人类文明的发展。

好了,以上就是本期的所有内容感谢你的收听祝你今天过得愉快我们下期见

E265. AI认知障碍研究惊人发现 | 用户数据隐私风险上升 10:53 Share