We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 张奇:AGI来了,人类准备好了吗 | 年度行业新锐

张奇:AGI来了,人类准备好了吗 | 年度行业新锐

2025/1/18
logo of podcast 第一财经

第一财经

AI Deep Dive Transcript
People
张奇
Topics
张奇:我从事人工智能研究20年,见证了AGI从概念到如今大模型的快速发展。虽然大模型在处理多种任务方面展现出强大能力,例如长上下文建模、多任务学习等,但其推理能力仍有待提高,尤其在理解和灵活运用知识点方面,现阶段主要依赖数据驱动学习方式,难以学习因果逻辑,例如在解决小学应用题时,面对与计算无关的附加信息,模型得分大幅下降。 要实现真正的人类水平AGI,需要在模型框架、训练方法和人工智能理论上取得突破,这不仅仅是参数量和数据量的问题,时间难以预测。 AGI和AI技术已经深刻融入我们的日常生活,带来效率提升的同时,也带来信息真伪难辨、信息茧房效应等问题。AI生成的文本、图像等信息,看似合理,但可能存在事实偏差,缺乏严格审核机制,容易造成信息混乱,影响人们的判断。个性化推荐系统虽然方便,但也可能导致信息茧房,限制人们接触多元观点,加剧社会认知隔阂。 应对这些挑战,需要法律、企业、政府和个人共同努力,积极拥抱AI,提升自身能力,将工作与新技术深度融合,才能在AI时代站稳脚跟。大模型的快速发展也对人工智能研究界产生巨大影响,许多研究方向消失或不再重要,大量低水平研究人员面临淘汰,甚至我们这样的从业者也必须积极适应。客服、美工、程序员等岗位都可能被AI替代,我们需要提升自身技能,胜任更需要深度思考的工作。

Deep Dive

Shownotes Transcript

大家好 我是来自复旦大学计算机学院的张奇非常感谢第一财经给我颁发的 2024 年行业新锐奖我从事人工智能研究 20 年回想起 2022 年 11 月 ChinaGPG 宛如一颗璀璨的星星横空出世瞬间让大家知道了大模型和通用人工智能

也成为了大众所关注的焦点大模型如今的发展势头可谓极其迅猛这也使得不少人产生了一种错觉仿佛通用人工智能在短短几年之内就能成为现实然而通用人工智能究竟距离人类还有多久呢人类需要怎样准备迎接

今天我就围绕着这个话题从通用人工智能实际进化方向和程度以及人类在科技进步学习就业科学伦理方面产生的影响来分享一下我的思考和见解首先我们明确一下通用人工智能它的英文是 Artificial Journal Intelligence 简称 AGI

自 1956 年人工智能这个名词诞生起它就成为了人工智能领域始终不懈追求的终极目标从名字上看通用人工智能就意味着拥有如同人类一样的认知能力是可以处置多种类别的任务的人工智能体系

这和以往那些专注于单一的特定任务比如语音识别图像分类之类的狭义人工智能有很大的不同 AGI 能够去理解去学习并且能够在形形色色的领域以及任务情景当中展开推理进而解决问题

通用人工智能所设定的目标极其宏大其愿景是能够完全期待人类所从事的所有脑力劳动然而如此宏伟的目标并非一蹴而就必然需要经历漫长且复杂的发展过程虽然人工智能的发展进程并不完全与人类的认知能力发展轨迹相契合但当下已经有大量的相关工作逐步开展起来

比如 2024 年 众多手机厂商纷纷推出了具备一定程度自主决策能力的手机这些手机能够依据用户所下达的指令在多个 APP 之间自如切换并且可以根据用户具体要求自主地对界面内容进行分析进而完成诸如搜索 点选等操作甚至在某些情况下还能够直接替用户下单

可以想象不久之后我们或许就能够直接通过语音控制手机轻松的让它帮我们完成订外卖修改各种 APP 中的设置等等一系列的操作这无疑将为用户带来极大的便利有了上述简单的分析之后接下来我们回到这次的核心问题通用人工智能距离我们还有多远

当前大模型普遍被认为是实现 AGI 最有可能的道路也是目前绝大部分公司和研究人员所走的道路那么大模型真的是实现 AGI 的必由之路吗当下大模型的推理能力究竟处于一个什么样的水平呢我们留意到几个具有代表性的实验现象

苹果 AI 研究院近期采用了和我们类似的思路针对小学应用题开展了相关测试比如原题是小明在星期五摘了 44 个猕猴桃在星期六摘了 58 个猕猴桃星期天他摘的猕猴桃数量是星期五的两倍那么问题是小明一共摘了多少猕猴桃

那苹果 AI 研究院的研究人员在这道题的最后增加了一个与题目原本的计算没有直接关联但是又包含数字的问题比如但其中五个比平均大小要小面对这样修改的题目时 GBT-01 模型的分数就下降了 18 分其他模型在这种情况下分数下降的更为严重有的模型甚至下降了 60 分

我们不难发现就目前的情况看大模型似乎还尚未真正的理解各个知识点或者说至少还没有能够做到对知识点进行灵活自如的运用那么现阶段大模型所采用的都是纯数据驱动的学习方式

这种学习方式倘若不加以改变那么它将很难真正的学习到因果逻辑要知道构建不了因果逻辑也就很难完成真正意义上的推理就拿在大数据分析领域我们经常提及到的一个经典问题来说吧

在晚上小超市商品购买的情况下从销售数据上我们会发现一个非常有趣的现象那就是小孩子的尿布和啤酒这两种商品经常会一起出现在顾客的购物清单上并且如果我们将尿布的陈列位置和啤酒的陈列位置摆得更为靠近那么啤酒的销售数量还会进一步的增加

实际上这是因为小超市购买尿布的情况大多数是应急使用而前来购买尿布的更多是男性顾客所以他们在购买尿布的同时顺道买一瓶啤酒的概率就会提高很多然而这样的因果关系仅仅通过数据是很难被学习到的

尽管如此现阶段大模型也已经展现出了很多此前小模型所不具备的能力包括长上下文的建模多任务学习跨语言迁移以及文本生成等能力这些能力都是之前小模型所不具备的

倘若能够充分利用好这些能力同样可以发挥出非常不错的作用例如现在的 AI 搜索就完整的利用了上述大模型所具备的这些能力它能够高效的帮助我们解决以往搜索结果需要我们仔细阅读的大量内容才能去解决的问题

所以说根据大模型所已经验证过的这些能力去积极的寻找与之匹配的应用场景也是当下一个极为重要的发展方向但是我觉得仅依靠大模型的参数量使用更多的数据很难达到解决人类水平的 AGI 系统

我们需要进一步的考虑如何使得 AI 系统具备真正的推理能力这不仅仅是参数量和数据量的问题更多的是如何设计模型框架训练方法以及在人工智能理论上的突破而这个时间很难估计可能明天就出现了新的人工智能理论一个月之后就可以实现 Level 5 能力的 AGI 系统

也可能我们沿着大模型的道路走了十年也无法真正达到 Level 2 水平的 AGI 系统这需要更多基础性的研究接下来我想通过梳理 AGI 或者 AI 给人类社会带来哪些影响聊聊人类又该如何接招呢第一个思考无法分割无法否认 AI 已然悄无声息地融入了我们的日常生活成为其中不可或缺的一部分

就拿日常使用的输入法来说吧早期的拼音输入法十分机械刻板每次输入拼音呈现字词的顺序固定不变全然不顾此前输入的内容这极大限制了输入的效率打字速度慢得让人着急

随着计算机运算速度的不断提升研究人员开始将语言模型引入输入法它能够根据用户此前输入的文字精准的预测当下打出字的概率把最符合的词语优先推送出来极大的提高了输入速度现在的拼音输入法使得我们几乎不需要对文字进行选择仅输入拼音串就可以完成文字输入

再比如使用的搜索引擎我说的不是现在的 AI 搜索而是传统搜索我们每次输入关键词背后有超过 200 个模型从各个层面协同工作为我们找到最相关的文档

再比如我们日常浏览短视频新闻外卖等 APP 也都使用了大量的 AI 技术支撑产品服务但是这些 AI 技术都隐藏在产品的背后大众并不容易直接感知到第二个思考事实偏差

AI 技术也宛如一把双刃剑在为我们带来巨大效率提升和优质服务的时候也裹挟着一系列潜在的问题 AI 能够依据所学到的大量知识和模式快速生成文本图像等各类信息

其表述往往看似合理且颇具逻辑性比如生成一篇新闻报道或者学术论文的片段初看可能很难发现其中的不实之处但是 AI 可能存在对知识理解不够深入准确的情况或者因为数据偏差等原因编造出不符合事实的内容

而且由于其生成速度快产量大在缺乏严格审核机制的情况下就很容易让大家真假混杂的内容流入网络等传播渠道进而误导读者干扰正常的信息获取与判断给人们在判别信息真实性上增加了不少的难度

思考三 信息减防 AI 驱动的个性化推荐系统无处不在社交 APP 们依据用户过往浏览偏好 点赞 评论等行为精准推送契合个人喜好的内容长此以往 用户仿若置身于一间无形的减防之中目光所及皆是熟悉 认同的信息难以接触多元的观点和意志的思维

人们不自觉的就被困在了思维定势里对复杂现实的认知愈发片面愈发根深蒂固进而在重大议题上判断失误加剧社会群体的认知隔阂和分歧

比如关注娱乐八卦的用户页面会被海量明星资料所填满无暇顾及科技前沿民生百态热衷于某类偏激观点的受众持续接收同类信息愈发笃定自身的立场不愿意换位思考理性的探讨致使社会舆论环境愈发浮躁极端给公共理性讨论空间带来压缩新型的信息检防正悄然筑起

当然解决这些问题绝非单一主体能够化解而是迫切需要法律层面助劳根基企业主动担当政府有力的引导个人积极适应凝聚全社会之力协同寻求破局之策最后我们说一说人类需要如何应对呢

大模型的发展速度着实惊人其迅猛程度甚至让我这个在人工智能领域工作了 20 年的从业者都深感焦虑与巨大的压力

回顾往昔人工智能的发展原本就在逐年的加速然而之前的模型往往只能解决单一的特定的问题所以每当一种新算法问世便能够开拓出众多崭新的研究方向但是如今的大模型却截然不同

其具备多任务处理和多语言交互的特性这使得原本需要几十个不同任务模型和研究方向的工作如今都能够整合到一个大模型的研究框架之中不仅如此大模型的研究对资金的需求极为庞大相较于以往其所需要的资金常常是过去的数百倍之多一个千亿模型完成一次训练需要花费近千万的费用

在这样激烈竞争的环境下如果研发速度稍有迟缓就极有可能陷入落后的困境进而陷入恶性循环难以自拔

就达 2022 年 11 月 Chad GPT 横空出世来说在其后的半年时间里我们整个实验室几乎全员处于每周 7 天每天 14 个小时的连轴转的高强度工作状态不过辛勤的付出也换来了相应的回报福丹自然语言处理实验室相共成功发布了 MOS 以及多模态 MOS 等成果同时还推出了许多关键技术

但是回顾整个过程其实大模型的发展也对人工智能研究界产生了巨大的影响很多原来的研究方向已经消失或者不再重要大量低水平人工智能研究员面临淘汰大模型最直接最快速影响的岗位其实是我们人工智能的研究员所以即便是我们这样的从业者也必须以积极的心态面对拥抱它接受它使用它大

大模型在很多领域也彰显出其强大的影响力和巨大的潜力比如在客服领域其替代率从过去的 60%大幅度跃升至 80%在编程领域工作效率普遍提升了 20%左右对于一些简单的编程任务效率提升的幅度甚至能达到 40%

而这些显著的变化仅仅是发生在短短的一年时间之内我的分享也是在书写完初稿之后使用大模型进行了润色和修改我觉得整体上节省了我两天的时间再以图像生成领域为例如果我们将现在模型与 2023 年年底的模型进行对比我们就会由衷地感叹图像生成质量提升速度之快

然而这些技术的飞速进步也不可避免地导致了许多岗位数量的大幅度减小比如随着大模型强大的多语言回答能力的出现小于种岗位的人力需求在短时间之内迅速萎缩从短期来看客服美工程序员以及算法研究员岗位都存在大幅度减小的可能性

从长远的视角出发当前人们所从事的工作中可以被自动化所覆盖的部分都极可能被 AI 逐步替代这一严峻的形式无疑对我们提出了更高的要求促使我们必须努力提升自身的能力以便能够胜任那些需要更高技能水平与深度思考的工作而不是仅仅局限于简单的文字整理数据收集等基础性工作

其实我想着重倡导的是我们务必积极的主动拥抱 AI

无论 ACI 是否会在短期内得以实现 AI 早已悄无声息的渗透进我们的生活的方方面面唯有不断提升自我的能力更积极的将自身工作与新技术深度融合通过提升工作效率持续不断学习新知识才能够在工作中不断取得进步从而在 AI 汹涌澎湃的时代中站稳脚跟实现个人与社会的协同发展谢谢大家