We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 116: 当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”

116: 当AI研究者写科幻,与Meta田渊栋聊他的智能想象:我们终会“所思即所得”

2025/5/17
logo of podcast 晚点聊 LateTalk

晚点聊 LateTalk

AI Deep Dive AI Chapters Transcript
People
曼琪
田渊栋
Topics
田渊栋: 我想写出有 AI 内核的科幻小说,因为每个技术时代都对应着不同的科幻命题和故事。我希望将博士阶段的感悟融入小说创作中,并融合少年热血和中年反思。小说《破晓之钟》讲述了外星人入侵地球,人类如何在新时代背景下争取应有地位的故事。我惊讶于小说中的一些设定与最近 AI 的进展非常吻合,这让我感到惊讶。 曼琪: 这一期节目会从《破晓之钟》这本书开始,讨论田渊栋对未来 AI 技术、社会与人类命运的想象。不同的技术时代有不同的科学幻想,AI 时代也有其独特的幻想。外星人通过提供虚拟世界来诱惑人类,而非直接攻击地球。故事的主角是一群科研人员,他们带领人类对抗外星人。

Deep Dive

Chapters
本期节目探讨了田渊栋创作科幻小说《破晓之钟》的灵感来源、核心概念以及 AI 科学家的技术思维。小说设定在一个 AI 时代,外星人以虚拟世界诱惑人类,一群研究者则寻找出路。小说预言了算力与智能的攻防战,并讨论了人类不再需要工作后可能面临的危机。
  • 《破晓之钟》写作于 ChatGPT 热潮之前,全部内容由田渊栋一人完成。
  • 小说融合了少年热血与中年反思,探讨了 AI 时代可能面临的科幻命题。
  • 小说的核心科幻概念体现了 AI 科学家的技术思维,部分设计预言了后来的技术发展。

Shownotes Transcript

欢迎收听晚点聊,我是曼琪这是 I.A.I 的第二期这个系列会讨论 AI 和我们日常工作与生活的关系这一期的嘉宾是 MetaGen AI 研究总监田渊栋他既是 AI 研究者,自 2005 年开始探索智能和人工智能最近十年他一直在 Meta 从事 AI 研发田渊栋也有另一重职业生涯,做一名小说家从博士生期间开始

他就陆陆续续的写小说在 2021 年连载完了第一部长篇科幻小说《破晓之钟》这本书在 2024 年正式出版《破晓之钟》是写作于 ChatGPT 热潮之前的书全部内容都是人写的没有 AI 而书里的核心科幻概念和点子则体现了一个 AI 科学家的技术思维田元栋认为每个技术时代工业时代电器时代信息时代智能时代都对应不同的科幻命题和故事他就是想写出有 AI 内核的科幻

回头看书里的一些核心设计预言了后来围绕算力与智能的攻防战也讨论了当人类不再需要工作时可能会带来什么危机这一期我们会从《破晓之中》这本书开始聊延展到田园栋对未来 AI 技术社会与人类命运的想象

因为这本书里的主角和英雄们是一群研究者我们也由此聊了 AI 研究人员的生活与选择最后田园栋也分享了 2023 年之后他如何尝试在写作的工作流程里加入更多的 AIAI 现在到底能帮他做什么

还不能做什么由于本期是远程录制所以音质有一些瑕疵请听有见谅本期中提到的《破晓之中》的续作《优业新火》正在网上连载连载地址我贴在了 sholos 里的相关链接部分感兴趣的朋友们可以阅读下面我们就正式进入本期节目吧

今天很高兴邀请到 MetaGen AI 的田园栋做客玩电聊它的主要研究方向包括决策强化学习算法设计等曾领导了 Open Go 这个围棋项目不过这期的主题比较特别我们不是聊具体的 AI 研究而是关于田园栋的一项业余活动科幻小说创作田老师主持

请不吝点赞 订阅 转发 打赏支持明镜与点点栏目

我们这边有一些团队在做一些关于推理然后弹幕性推理的一些工作大概是这样子我在 Meta 已经 10 年多了

然后一直是在做人工智能方向的工作而业余的时间我是有一些比较特别的爱好包括就是写科幻小说这样那么我写小说已经很多年了我可能是 2005 到 06 年开始就是接触网络小说并且想法是把长途自己写那一开始写的不是特别好到后来就是慢慢有一些感悟吧

所以中间其实是写了一些小说的那么这次这部贺小时中呢是在 2020 年开始连载当然连载之前呢其实已经有大量的存稿那么当时是这样这部小说一直是有构思然后有一些片段在写完之后我会觉得如果没有一个连载的压力的话可能这部小说永远不会完稿啊

所以就是在 2020 年的某一天因为当时也是疫情也比较无聊所以就是会去想就是就某一天跟大家说我们要连载一部小说那么这样的话就会有线上的压力那么就每一天就必须要写出去一张那么通过这个方式呢大概写了三个多月到四个月左右最终把这部小说给连载完了所以其中呢就是在这个比较紧张的过程中呢其实有很多的那个

感悟吧也有很多的那个学习到的一些知识和体验啊所以啊在小周连载完之后呢呃大概在呃 20222023 年的时候呢那个电子工业出版社啊联系到我啊他们对这部小说的出版是有兴趣的啊当时我也是比较啊

我也是比较惊讶因为我其实放在网上写的也是写着玩的嘛但是放在植物上连载其实也是有少评论那么但是后来想了想就是既然有出版社联系我呢肯定是希望这部小说有个圆满的结局吧所以最后同意了然后

2024 年就是去年 6 月份终于正式出版了对现在在多半上和在无印度上都有我们现在多半评分是 7.9 还可以吧还还就已经算是挺不错的一个分数对微信上无印度上是前面 75%所以都还可以就是属于值得一读在这个范围不是说特别差但肯定也不会特别好但是作为

我的一个业绩暗号其实这个已经出乎我的意料说外了我觉得非常感谢广大读者对我的支持你可以就是讲一讲《破晓之中》的大概的故事情节吗因为这样的话我觉得方便就是没有看过这本小说的听友他可以比较好的进入到我们后面的讨论

对这部小说其实怎么说呢它主题是想要做一些在人工智能这个时代的科学幻想因为大家都知道就是每一个时代都有自己的科学幻想就是真机时代大家都幻想着就开真机我去很远的地方如果到电气时代或者到机械时代大家比如说像海底两万里就是我开着一个金属制的一个潜艇我潜到很深很深的地方或者说我

把那个像法兰大的小说把那个一个大的桶一个金属桶把射到月球上去然后在那边去进行那个探索所以这些其实都是在反映就是在那个时候的科技生产力水平下对应的这个小说的和科幻的这样的一个思维和方式那么

其实在人工智能时代出现之前大家其实也对人工智能有很大的幻想就比如说计算机刚出来的时候很多人其实就已经开始设想如果以后有机器比人更厉害更聪明那么这个社会是什么样子的

这个幻想其实在应该说在 50 年 60 年前都已经出现了 195 几年 196 几年的时候就已经出现因为那个时候曾经有一次是第一波人工智能的一个浪潮大家会觉得用计算机的方式去蒙古人道能够达到人道相当水平甚至比人道的水平更优

灌注了大量的机器人的这种形态对吧但是这些形态往往都是比较比较刻板的有这种刻板印象比如说都是计算机器精确但是没有缺乏人类情感就是那种类型的机器人或者说机器人永远超过不了人类的这样的一些论调就是这样的一个论调但是真的到 2020 年 21 年的时候出来然后

我们再次卷入了一个深圳市人工智能的浪潮之中的时候再回去看之前的 56 年代 60 年代的那些幻想其实有些时候会觉得它其实应该算是比较偏颇的就是你有很多很多的当时的设想跟现在其实是不一样的

其实这样所以这部小说当时呢就是我写的时候呢其实那个深圳市 AI 还没有真正出现当时应该说是前一波深中学习的浪潮刚刚过去但是大家可能看到平台期的这样一个时间段这样当时我们就在想就是如果 AI 真的发展到很厉害的时候会有什么样的一个故事出现那么这部小说同时也是柔和了我之前在

博士阶段的一些感悟和心得吧但是当时我也写了很多小碎的这种小心得或者说小的一些文字那我希望总有一天能够把这东西写出来所以这是一部其实相当于说比较有些杂柔风格的

一些一个小说所以他应该说是这样他其实融合了其实比如说少年时候的这种少年心性我说我是做一个弱者我想要要你一封翻盘这样的一个心态我是又结合了一个就是中年大叔的这样的一种

想法吧就是说就中间大叔来说一个重要的事我是不是应该躺平啊然后在原地过完自己一生还是说不甘寂寞想做一些有趣的新的事情就是说有这样的各种各样的一些思维结合起来之后呢产生这样的一个小说

总的那个故事性界应该说是比较老套的吧就是很简单的外星人日星地球然后我们怎么样战胜外星人或者说不说战胜外星人但是至少能跟他打得有来有回最终获取自己应得的一个地位大概是这样一个思路只是说在这个新的 AI 时代的背景下我们怎么样把这个故事演绎的更像是现在新时代 AI 浪潮之后

我们对这世界有更新的认知了之后呢它应该会发生这个故事所以大概是这样的一个故事对我可以补充一下这个情节因为刚才其实田老师讲了比较多他想表达的东西对大的框架就是你刚才说的外星人要来入侵地球这是银河联盟对吧派来的一个你可以叫做一个前哨吧要来入侵地球然后他入侵地球的方式我觉得也是挺 AI 的他不是像以前那样就是我直接来攻击地球他

给地球人算是设置了一个诱惑这个诱惑就是可以让很多地球人生活到一个虚拟世界里在这个虚拟世界里你是衣食无忧的而且你不会变老你也可以就是一直的生活下去不会死以及你在现实生活中可能是残疾或者说有各种缺陷的人你到了这个虚拟的世界里也可以获得一个更完整更健康的身体你的触觉这些感官都是非常的真实的

就给了这样一种选择就相当于在人类之中就分成两派有一类人就要去这个虚拟世界生活然后还有一类人他们只能苟延残喘在地下因为虽然他没有攻击地球本体但是他反正就对太阳做了什么导致这个地球的能源供给出了一些问题对就大概是一个大的危机背景然后最后就是你刚刚说的人类怎么去跟他战斗然后获得一个应有的地位他这个战斗的方式我觉得也是非常 AI 的

就也不是以前那样就是直接比如说我开个飞船去和外星人打就不完全是那样大概是这样一个故事情节以及比较特别的是就是这个故事里的这一群带领人类去对抗外星人的主角他是一群博士生可以这么说吧一群研究者科研人员嘛对吧就是为什么呢

我当时在科研阶段会有博士阶段会有很多素材那么这些素材最终会用在就是它有个制作性对吧可能时间现在拿到这个故事里面去用所以就会有这样一个设定

那我们可以讲到就是你刚才讲到有一个主题就是你写这个小说的一个设想我觉得是很有意思的就是每一个不同的技术时代它其实有不同的科学幻想对吧从可能以前有蒸汽捧客然后是凡尔纳那个海底两万里那个工业革命的时代然后你想表达的是 AI 时代它可能的科学幻想确实你这个书里有很多设置我看的时候我是觉得

能看出来这作者确实搞 AI 的然后我自己也联想了一些比如说我看到好像是有强化学习因为这个里面就是大家居住的那个虚拟世界它有个物理载体就叫临界立方嘛然后在这个里面它其实大家也是在想就说这个里面是不是可以通过左右互搏然后这个立方本身涌现出智能我好像也看到了就是后面 23 年 CHPT 火了之后很多人讨论的对齐你这个小说里也提到了就是说最开始

捡到或者说发现这个立方的那个人类他是其实想利用这个外星人的这个手段来保存人类的一些活种的但他觉得这个里面必须要类似一个人类的思维否则他觉得就是这个立方可能和我们人的价值观是不同意的这个我觉得也很像对齐的那一部分

包括里面还有一些就是他计算这个相似性什么这个大家可以自己去看具体的情节我觉得有点像这个注意力机制就是您自己可以完成讲讲就是你哪些设计是来自你对 AI 技术的一些思维的应用然后把它放到这个故事情节里的对就是您看得很细我觉得这个我非常感动作者你们里面有一个地方其实我应该说是一个表达的设定然后这设定其实也跟最近的那个 AI 的进展也是非常吻合了当然这个我觉得也是让我觉得非常惊讶的

因为我们当时在写的时候是 2021 年 2020 年的时候当时大家都用了新伟大的卡但是没有人真的去拿这些卡做很大的集群做很大的训练所以我在这本里面准备写就是说可能就是承载每个人意志的意识的一个临界地方就有个小的假设有抽象的小地方那么这个东西其实影射了比如说你给伟大的 GPU 然后地方之间是可以互联的

那么互联之后如果互联的带宽足够大那么它们混在一起那么进行计算会产生一个超级的智能当时这是这样的一个设定但是就是无独有在才 23 年 24 年之后你会发现确实 GPU 是 GPU 之间其实可以通过比如说 NVIDIA 的 NV-Link 连起来它的速度非常快的有这样的很快的互联方式它的训练才会有很大的一个提高那么

但是呢就是说如果互联的那个速度不够快呢就可以限制这个整个机群的这样一个训练的速度和达成的那个超级智能的程度大概是这样那么其实这个跟这个银河联盟在这部小说里面用的方案也是一样的对所以真的是很有意思那么破解这样方案的一个方法呢其实也是就是通过某种方式呢去压缩这个

两个立方之间的那个通信的带宽就是说也许带宽就这么点但是呢我可以通过某种方式把信息通过某种样式传过去这样不用损失信息本身但同时可以降低这个带宽的程度那么当时呢就是小说里面有一些角色像苏燕把这个问题通过某种方式解决了那么现实世界里面你会发现其实大家广大研究者呢其实也用这种方式去绕过了这样的一些限制所以其实很多时候呢就是

研究的思路和科幻的思路很多时候是有一致性的所以这个很有意思你当时 2020 年开始写这个小说吗你当时设定临界立方你心里想的就是英伟达的 GPU 是吗这肯定是有关系的对因为我觉得 GPU 是当年的就是 2022 年的时候是当然能看见就是对 GPU 需求是很大的就是我们

那么做生物学习肯定是要 GPU 这个没有任何问题那么 GPU 怎么把它连起来然后变成一个巨大无比的集群然后去训练那么这个当时也是有但是并没有想过就是正通过这个训练我们可以得到像大圆模型这样一些非常强的模型那么这模型可以做很多事情

当时其实并没有预见到这样的训练能够那么快的时间内达到那么好的效果这个我觉得我应该说明了我把它作为科幻点子来写的对两年之后科幻照进现实所以这个是我也是挺非常惊讶的事情因为我觉得我把它写成科幻点子意味着就可能这件事情可能要过十年或者五十年才能发生但其实没有

所以这个有些时候会觉得科幻小说还是早点写反正的话可能点的就是过时了因为别人玩实践了我们现在这个进化到这样的速度对你刚才讲到那个互联确实最近有很多进展因为 24 年在 GDC 上其实黄仁勋就是也是他当时不是讲了这个 NVL72 吗就是我把那个 72 个单格的芯片连起来一个更大的互联方式

最近华为也发了一个新的技术他们叫超节点他们那个更吓人他们是 380 多个芯片然后连起来一个是弥补它单个芯片的性能可能没有因为打好另外可能就它也是应该是通过什么方式就是去把这个通信做得更好然后让整个系统的性能可能达到一个差不多的这个状态啊

我觉得这些都还挺实际的就是这个从情节里看还挺有前瞻性的我觉得这应该是很有趣的一个体验对就是发现自己写的东西后来就真的成为了一个不一样的方法就在现实中呈现出来所以你刚才也提到就是这本书是有一些是你的科幻的想法或者是对 AI 技术的想法

然后有一些是你多年来积累的在做研究包括读研究生读博士期间的一些心得这也是我看这个书的我自己的一个感受就是它是给你两种很反差的体验的一是基本上所有科幻小说都会包含的一些科幻概念或者是你刚刚说的科幻点子比如说这个里面的灵界以及它的情节上

这确实也是比较经典典型的课幻就有末日危机然后人类面临生死存亡的抉择但是那一方面它有非常日常的一面就你这里面写了很多科研工作者什么怎么开组会了师兄怎么带师弟然后导师是一个什么样的角色怎么去争取资源以及不同的学术思路然后还有一些办公室

种植之类的东西就对吧学术圈也有人情是果所以我觉得接下来我们可以分这两个大的方面去展开聊一聊第一部分我觉得可能更多是聊 AI 和未来然后第二部分我觉得是可能对挺多更年轻的研究者我觉得也会有一些启发吧就是我可以讲一下就是破晓之中你展现的这个未来世界就我读到的一个大的部分就是我刚才说的其实是把人类置于一个两种选择人类变成了两派一类它是走向虚拟世界可以安稳的生活

但是他们应该不可能再有更多的科学发现和进步了因为其实你是生活在外星人给你就是设置的这个虚拟空间里面然后还有一排就是我们要奋力一搏我们要对抗银河联盟强加的这个安乐世界去自主的寻找在宇宙中发展的空间然后就是你可以讲讲就是你当时设计了这个大的这个情节是是怎么想的这个

算是本书的一个出发点之一吗对当然就是这种就是小作者里面这种冲突肯定是必要的不然的话就不好看了所以你永远会存在这样的一个可能就是说你总是会想就是我 AI 对于人类来说我到底是想要一个欲求的一个世界然后就不用去探索了还是说我希望真的去永远去找未知的世界因为这未知世界是你没有经历过的

这个总是会出现的我觉得周末小说应该可能比较有意思的一点就是也许最终的结案答案是两者一个结合这样的一个答案就是说我们一方面确实还是需要最终可能会走进虚拟世界这是我觉得是有可能的而且很大可能另外一方面就是我们可以带着虚拟世界继续去星际里流浪我觉得也许就是这两边都会有

因为毕竟人类的肉体还是太脆弱了所以你要把一个人把一个宇航员放松向太空所以需要很多需要很大的能量而且还需要照顾他的各种饮食起居然后照顾他的各种身体上的需求但是这个其实就是对于星际航行来说其实是很大的负担这个是一个然后另外就是说然后人的肉体在 100 年之后其实还是会腐朽的所以肯定是需要有办法去让肉体能够有永生的能

所以最终人进入虚拟世界我觉得这个是不可避免的但是在进入虚拟世界之后人本身的求知和欲望或者说人本身对未来的探求其实也仍然是会存在在那里所以最终我们还是会愿意去翱翔在星海之中所以这两个应该是合在一起而不是对立的所以这个其实我很早以前就想过这个问题我觉得这可能是我们

唯一的一个真的走出太阳系的方案这个选择就是你要看到其实要看到这个小说很后面你才会发现是你刚刚说的那个方案只是一方面大家又是在虚拟世界里就所有人类其实最后都进入了虚拟世界但是它其实还是有一个计算载体的这个计算载体是可以在宇宙中的不同的地方去探索的

就那个时候其实我们已经在你这个小说里是已经来到比林星了对吧不在太阳星对太阳星已经被大战毁灭了比如说这样子的所以大概是这样的一个思路吧当然这是最后的一部分吧对所以这个还是一个比较有意思的一个方案吧就是最后会这样那么这里面会带来很多各种各样的问题

这个问题就是说因为一个首要的问题就是说你可能会在一个虚拟世界里面突然之间你所有毕生所追求的所有东西马上脱出可得了对吧你要多少钱就有很多钱你要海景房马上脑袋一动就给海景房送给你如果你要什么乡村美女马上就有无数乡村美女送过来对所以就对于就是在这个虚拟世界中就是日常的或者说是之前在现实社会现实世界里面那些所有的欲望全部呃

都变成了突如其来的东西的话那么人本身的进步的能力人的进取的动力到底在哪里我觉得这个是一个很大的问题我觉得这个可能是之后第二步会继续写的这样一个主题这个可能就是未来世界怎么样能够让未来世界还有动力继续前进所以这个是一个很大的问题其实你这个小说后面也写到了一些就是在这个虚拟世界里它也是有经济系统的甚至还有房价对吧然后就是

就那虚拟世界里的人到后面还在讨论说这个房价在上涨什么的对这个是因为是这样就是比如说吧我们可以说就是一开始造出来的这个虚拟世界是个低版有临界 1.0 版那么这个版本里面呢所有人的欲望都会被满足那么大家后来发现了这个版本的问题因为里面的那些人呢其实已经不在乎地球

安危了就对他们说地球其实是一个遥不可及的梦他们在里面待了半年之后他已经不记得地球这个东西了因为生活太舒适了所以对于母星或者说对于虚拟世界的物质基础他们有很深的理解

所以那么这一版就是会让因为我们在小说后期其实会想写到一些这一方面的工作比如说我们让邻届的人和虚拟世界的人和现实人去投票投票到底是愿不愿意加入银河联盟投降了我们说我们就直接加入银河联盟算了我不想跟你打如果你要投票的话你觉得邻届的人会投给谁就是 Dev

真的去想想你会觉得邻届的人其实会更愿意去直接加入银河联盟并不是说去要维护五星本身的一个独立性所以这个其实是对于可能对于邻届 1.0 版本这个版本可能质量就会有一些人会觉得这个版本不是特别好所以在这故事的最后其实倒退到了一个比如说

领界的 1.5 版本那个版本里面可能就是房子或者说是物品并不是完全无价的赠送的可能是需要回到现实生活中的经济系统让大家拥有这个动力去继续努力但这个版本应该说不是一个完美的版本

因为这个版本本身就不是很稳定的所以在第二部里面应该会讲一下它的弱点还讲一下有没有什么更好的方案所以这些东西其实会有意思就是可以会继续往下想因为在这个新的系统中就是什么样的经济系统是稳定的然后最终大家会以什么样的方式和思路去在这个训练系中生活然后继续爆发出各自的重要的创造力

我觉得这个是很有意思的话题其实这个故事到最后还有一个悬念苏燕就是其中一个角色她算是带领人类成功反抗银河联盟的最大功臣之一然后还有小河也是这个反抗者的其中之一然后他们最后的一个对话其实揭示出了就有可能就这个小说最后展示了这个结局也不是说人类真的逃离了银河联盟

而是银河联盟就像梦中梦一样就银河联盟让你以为你逃离了银河联盟其实你还是在它所设置的这个虚拟空间里面这个有点像黑镜最近一起就是讲的那个比如说宇宙的 infality 的那种游戏的感觉其实你还是在这个虚拟世界里作者可以官方解答一下吗就这个悬念它

到底是更偏向我们真的跑出来了还是我们实际上还是在银河联盟的控制之下应该说是这样就是说这个是有解答的因为这个其实是一个藏得很深的一个坑这个坑会在第二步出现对我觉得就是说其实应该这么说吧就是说其实还是会受到比如说在银河联盟的控制之下但是呢这个控制呢不是像虚拟时间那样进行的完全的控制

那么这一方面其实体现住了就是银河里门本身的科技科技含量是很高的还有很多黑科技你想要不到黑科技能够让你能够制造还是能把你控制住但是另外一方面其实也是说也可以引出银河里门本身的它的目的就是说它对于偏远行星的一个文明来说为什么它要

天天跑到你这来对你做一些事情其实确实在的就是这个事情如果没想清楚的话其实很不违背逻辑的因为如果比如说我们把我们比作我们现在是在第四个银河系的第三旋壁的某个角落里面这个角落应该说是非常荒芜的非常跟中心一点关系也没有的一个小村庄比如这样为什么比如说银河系中央的大军要跑到我们这来特别对我们这些人有兴趣

所以这个其实那个背后呢其实是有那个银河联盟的一个目的的一个深层次的一个解读的所以这两个其实是结合在一起的因为这样所以他们才会过来他们才会采取就是各种手段嘛就比如说如果这个礼文文明是不是特别强的

他们可以对他置之不理如果这个文明比较强那么我们可以希望银行联盟会说我希望你加入我们就像小说里面讲的那样子我们就搞个通告说你们加入了你们现在是 A 级文明我们很荣幸的把你们拉进来但是如果当地的文明再强一点的话就是这个时候银行联盟会感到威胁那么这个威胁它不是怎么

去处理的然后他们是怎么样对待这个当地的这个新的文明的那所以这个其实是不一样的如果要剧透一点的话应该是这么说因为最终对银河联盟来说他想要的是一个叫就是独一无二的这样一个性质因为对于联合联盟来说很重要的是他

已经完成了一个非常高级的文明能达成的一切比如说任何一个个体它都有一个叫所思即所得的能力就是他没想到什么这件事情马上就会具现化成为真实的东西然后这东西可以为他而服务我想我要一个工厂然后马上建起来我要一个飞船这飞船马上就建起来所以这个过程应该是非常顺滑的因为科技已经达到了很高的境界这个整个生产过程是毫无问题毫无障碍的那么对于这样的一个文明来说它到底还需要什么

就是我想要的所有东西都已经会满上满足所以我当时就是我觉得吧再往下走的话他们想需要的是什么呢他们想要知道的是自己是不是处在就是发展的一个最优路径上因为如果这个联盟除了这样的一个高等文明他有这个能力的时候他也会担心就是自己的思路走入了一个死胡同那么如果有偏远地区的任何一个新的文明他们可以同样有这个

所思即所得的能力但是他们有一种新的思路和新的见解那么这种新的思路和新的见解可以通过所思即所得的能力瞬间具现化然后变成了一个比银行盐盟更加强大的或者更加有能力的这样的一套体系这套体系就会代替

这个其实类比成什么呢就是应该说一百多年前比如说那个清政府跟比如说八国联军或者跟那个那些殖民政府去聊的时候呢就是一开始比如说他们会觉得我们要把那些路都修好那些

路修好之后呢就是那些偏远的村庄他们就可以把那些物资运出来然后卖给别人这个是一个很好的想法但是过一阵子呢青州会觉得我不应该修这条路因为修了这条路之后呢就是虽然说那些偏远村庄的物资能很快的运出来但是呢别人也会很快打进去

所以为了让自己不那么容易被征服宁愿把那条路修的差一点那么这个其实和银行联盟的设计是一样的就是银行联盟你到了比如说已经想到什么就一定会发生的这样一个境界之后那么任何一个外来的人或者说外来的一个思路他都会马上变成现实那么这个现实可能会威胁到联盟短线的一个架构

在这种情况下其实他其实非常是希望找到银河系的每个角落里面的一个新的新生的这样的文明你们看这个文明有什么新的思路和新的想法能够被银河灵物所吸纳但是又不至于银河灵物的控制之下不会产生一个

和银河联盟不一样的一个一起的力量我觉得这可能是银河联盟的一个就是在这样的情况下它的一个最大的一个目的如果地球持有这样的一个地位的时候那么它就要小心对待了因为对于银河联盟来说一个是我希望把这块东西保留起来

因为他们是他们里面有一些非常先进的思路这些思路呢可能银河里面自己是没有的所以我们希望它保留起来就像把它变成一个野外保护地一样的地方我不希望自己的想法去污染它如果污染它了之后那么这块地就没有用了因为这块地的思维就被我囤化了那么它的一些新的想法和新的思维就没有办法再展现出来

但是另外一方面呢我又不希望这块地呢发展的太过厉害然后呢反过来把通过银河临摹的这个科技呢把它的那个思路呢给展现出来所以它其实是应该是一个非常矛盾的这样一个中间状态所以这是为什么就是最终在第一步的结局的时候呢是会有这样的一个结构出来那这个实施是也就在这儿就其实是因为它得让你以为你自己是独立的你还在探索未知你才能真的有产生不同的想法但是它又要让

把这种探索置于它的控制之下是的这个是就是为什么它会有这样的一个一错失的一样原因你刚才讲的这个我觉得也特别反映了就是从之前的工业革命时代到现在 AI 的不同的科学幻想因为你看这本小说可能你最开始看到这个外星人的表层的目的

他是比较像以前的那种目的的就是他是为了争夺能源最开始的表层的目的但实际上他最后他想要的是智能或者叫智慧或者 idea 散落在宇宙各处的不管他有多么偏远的地方的可能性的不同的智慧他想要的是这个是的是这样这个应该说是那个第二部分

这个我觉得应该会挺有趣的你觉得就是如果真的到了所思己所得的这个状态首先是你觉得科技有可能到这个状态吗其次就是如果到了这个状态之后可能会面临的大危机是什么呀

就可能会面临的非常高级的文明也会遇到的大的危险可能会是什么对我觉得是这样就是首先第一个在科技上来说这个应该是迟早会发生的因为我们的你看过去 400 年的这样的科技史其实很多时候是把一个很难的问题转化成一个很简单的问题然后最后变成水和空气那样子就是突如可得的东西

这个过程一直在发生比如说我们的手机当年 EMIC 计算机做出来是算弹道的就算高大上的一些科学计算现在我们这些手机里面芯片速度比原来的晶体管要快在几百万倍但是拿来给我们玩游戏玩刷网页所以

这个是通过这个方式呢把这个高大上的东西平平化然后最终呢变成一个水和空气一样的这样的东西那么中间里很多链条很多科技上的一些具体的那个技术上的困难呢被它绕过去了然后变成了就让这个思路可以直接和最后的那个结果能够结合起来所以这个过程一直一直在出现

意外出现所以一直在那迭代所以我觉得以后如果中间有任何的科技上的一些困难那么这些困难也会被克服然后被压缩到一个就是你看不见的地方然后你的思路和你的想法会直接的作用于这个现实世界那么现实世界可以

当你想要的东西所以这个故事一直在出现而且一直存在的所以我觉得这个事情一定会发生虽然说我不知道是什么时候会发生因为有很多的技术上的限制或技术上的局限性需要大家去克服但是总的来说我觉得以后一定会出现的就比如说我现在把水龙头一打开就水滑滑流下来但是古代人去拿水是很困难的事情

我们要去河边打水然后打完水之后在里面放冥反而让里面的脏东西沉淀下来对吧还有杀菌然后终于可以喝然后煮水才可以喝但是现在我们都使用了这些步骤比如出水瓦桶的发明让人的入水环境变得非常好所以这些都是很重要的一个过程我相信以后

就是你想要制造这种东西或者说想要制造啊任何的部件的话都可以通过这个方式啊产生出来啊我觉得这个是很重要的啊然后比如说我们现在单元模型可以用它来写代码啊写完代码之后可以直接跑啊可以直接完全想到事情那么这个事情这个以前也是不想象的啊以前我就说我要做一个网页或者说我要做一个那个商务逻辑啊

跟别人去对接我需要招一个团队比如说招 10 个人团队我是老板然后我跟大家说我们要做什么东西然后大家把计划书写下来然后把它分解成子任务对吧然后一个个人去把代码写完了之后测试然后上线然后终于可以服务于其他人但是现在整个过程就被压缩了被大圆模型压缩了变成一个自动化的过程你可以让那个

AI agent AI 代理去做很多这样的一个细活然后最后他会直接把代码写完然后还能够上线还可以直接用所以其实整个过程其实也是很相似的就是把一个非常繁杂的一个很大的任务通过自动化的方式越来越缩越短越缩越自动化然后最终让一个普通人都能完成这个过程所以这个过程一直是有的我相信以后只会变门加厉然后最终会达到

索斯基索德的境界吧就这样已经开始有一些迹象对有些体验确实是对那刚才第二个问题就是说如果你已经到索斯基索德这么高级的科技和能力了之后可能会面临的大危机是什么其实我自己有想到一个就是我前段时间跟马毅老师就是港大的

马亦老师录了一期播客就我们聊到就他认为那个生命是智能的载体嘛因为智能是一个学习的过程你可以去学习外部的规律但是如果按照我们现在对宇宙的观测就有可能它是一个商增的系统那有一天这个宇宙岂不是就非常混乱然后你就没有规律可以学

那智能怎么继续存在就这个问题可以解决吗我觉得这个是这个可能是另外一个更大的问题吧因为这是跟物理学有关系的问题因为总的来说宇宙当然上增的了就是但是呢局部只要有局部的那个负商流进来那么这部分的生命和这部分的那个复杂系统就可以发展所以像地球太阳就是一个典型的系统

对吧太阳把能量给地球然后地球最后把能量散播出去那么这过程中会造成一些那个负上流因为太阳过来的能量是高度有序的它从一面过来的这个能量可以转化成很多其他的能量比如说通过光合作用可以变成葡萄糖所以我觉得局部上来说这个是对的

那马耀说可能比较大了就是在整个宇宙的那个命运就整个宇宙的这个年龄识度下那个最终智能会怎么样啊这个但是这很远啊这很远这可能是几十亿年后的事啊对对对可能不止几十亿几百亿年是千亿年后的是因为就是我看过一些讨论吧就是你最终还是可以找到一些小区域甚至生命还可以继续活下来比如说你在黑洞附近比如说你找到一个地方那么你通过你把东西扔进黑洞那么它给你会有黑的能量啊那么这个过程可以重复很多很多年

那么因为黑洞不会只会越来越大它不会天然线柱子变小所以在这附近你会有很多时间来做这个事情所以另外还有方面就是说也许你是整个物理规律或者说物理的世界其实应该说是说它里面有很多的未知的规律我们可能还不知道也许我们才能探索宇宙

可能会发现无效修改的那么在这里面可能会发现新的有意思的事情可能可以让这个某些大家认为是正确的那个趋势呢反而逆转就是你刚才说就是关于这个到底未来人类是随着这

计算机和 AI 这种技术发展之后人类未来是进入虚拟世界还是说我们变成一个信息文明你很早就在思考这个问题这个起点是什么呀包括你觉得在真实生活中因为现在我觉得这可能真的越来越现实了这可能是个比较现实的问题你觉得真实生活中人实际上会怎么选择

我觉得这个是我们看过去的历史吧就是这个问题有两个层次吧一个层次是说为什么我会想这个问题另外一个层次是说人类建设生活会怎么选对一个就是说我本身也是一个特别喜欢想东西的人然后会有一些有意思的奇怪的思路会冒出来所以为什么我会去选比如说我们要选计算机我们选人工智能这个方向当时也是基于一些想法觉得以后 AI 是不是可以代替人类或者说为什么

人总是有一个天生的先进性好像先进性其实并没有被正式的定义所证实或者证伪所以因为有这样的一个思维在那里所以你与我一样是想着问题也许哪天大家发现人没有那么特殊那么在这种情况下我们应该怎么样所以通过这个方式去思考这个世界或者说 AI 会怎么去发展

那这是在 08 年左右吗因为你是 08 年开始就是研究生然后后面读博士那个时候正式做人工智能这方向对吧 算是可能更早吧因为其实我在那个 05 年到 08 年这段时间我是在江东大学做硕士嘛所以那个时候呢其实是在那个我们

有一个叫脑科学的就是说应该说是脑机接口的实验室是张立青老师的一个实验室里面那么实验室里面其实是做这样的一些研究就是研究大脑是在各种不同的刺激下或者不同任务下它是怎么样运作的比如说你可以戴一个帽子然后上面有各种胶插上去之后然后你可以算你可以检测脑电图如果让这个人做什么事情

我其实也曾经是受负者之一因为所有的所有的那些世界世界的人都可以被自动认为受负者对所以这很有意思一个一个一个一个但是我会去想这些这些问题会觉得这个很有意思然后为什么那个人大了那么神奇这个是一个很大的一个出发点当然就是说我不会觉得一定要通过大脑的方式才能去理解清楚这个人是怎么做这事情的

可以从数学出发从第一性原理出发也许会有更好的会有更清晰的一个思路但是不管怎么样我们是存在着这样一个系统这系统就是无能人脑这个无能人脑功率非常低比如说只有 30 瓦比如说二手 30 瓦然后获取的知识它的效率也非常低往远远低于现在的 AI 比如说跟别人交流的效率很低比如我跟你说话可能每秒钟只能最多给你个 10 个比特的信息然后这一次就可能只能看比如说那个

一个 billion token 这样的大或者 10 个 billion token 这样的一个数量级的数据这些数据对于现在的机器学习来说真的是毛毛雨什么都不是但就是数据的输入和交流能够产生那么聪明的东西所以其实我一直觉得现在的 AI 它的能力其实还远远不如上线我们现在用的算法还是非常笨的

所以有这个也是一个很大的原动力吧去去思考啊这个这个问题这是为什么我要去想这个问题为什么会有这样的想法啊会往这方面去走另外一个问题就是说全世界人类呢会不会进入虚拟世界会不会那个进入这个那个跟 AI 结合的这样的一个一条路径我觉得这个是肯定是可能的因为现在其实已经这样了就比如说现在大家都知道有手机对吧然后这手机基本上表示不能离生的

有各种各样的信息汇存进来所以其实我们应该说已经一只脚踩进了虚拟世界这个虚拟世界里面有很多的信息有很多的讨论有很多的情绪对吧所以这个其实已经在慢慢适应中了我们虽然一直在说人类还是跟机器是要发行界限的其实已经

不是那么清楚了所以我觉得其实这个事情应该慢慢去会发生以后之后可能会这样如果你用了某个特别的电子元件或者某个特定的 APP 或者说是芯片然后你的成绩提高 20%那这个产生一个效应就是你如果不用你会落后于别人所以一定大家会拼命的去使用这些东西最后慢慢会就是说会有一个融合的过程这个过程会自然的方式发生

对但不会像小树中那样小树中那个时候是因为有外星人的外界的压力让你不得不进入虚拟世界不然的话你肯定在地表会冻死比如地表现在变成零下五十度了你如果不进入虚拟世界你就会死掉所以你就必须在很短时间内全部都进来这个是一个外界的压力但是如果没有这个外界压力的话呢

我觉得人类也会慢慢的进入这个状态对就是一个慢慢融合的过程就有了这个融合过程之后就一方面可能就像你说的你认为它是不可避免的但另一方面它肯定也会带来一些新的问题其实这个我在小说里也看到了你的讨论就是这个小说就我可以再讲点情节就到了比较后面的一章就已经很到后面了

讲了一个新人物在虚拟世界的故事然后他是一个三流画家然后他就是一直自怨自哀觉得怎么都比不上一个他的一流画家的朋友我当时看到这一节开始的时候我是觉得非常莫名其妙因为前面都已经讲了那么多事情然后很后面的突然出现一个新的人然后后来我看到更后面我才知道为什么你这写了这个是因为苏燕就是那个人类的大功臣他其实是故意把整个灵界的时间节奏给调得非常的快

就是相比于真实的物理世界的节奏所以在一个比较短的时间里面这些灵界里的人就类似于这个三流画家这样的人他们就经历了很漫长的一段时间然后他们慢慢觉得在这个灵界里待着其实是很空虚甚至很残酷的然后这样人类就是两派不同的人虚拟的人和真实的人才能达成共识去一起反抗银河联盟

你可以讲讲就是你想设想到的这些问题吧就是当那个人和虚拟融合然后界限变得更模糊之后对对这部分的其实是特意作为一章写在里面的通过这个方式呢让大家知道就是我们是怎么翻盘的就是说说这个人类是怎么翻盘的这是第一个对吧然后第二个就是其实也是设想了就是虚拟世界真的铺开之后呢大家会有什么样的想法和思路对吧这个是一个非常明显的一个情况我觉得就是这样就是这种融合呢短期一定会产生很多问题

然后这个问题是就比如说对于现实生活来说 AI 来了之后其实大家接下来几年肯定会对世界产生很大的变化很多人会发现自己赖以生存的工作就是说可能会被 AI 取代或者被 AI 给代替对然后这个其实是有很大的空虚感

很多人会觉得突然之间获得了很多东西这些东西呢可能是以前我一辈子都拿不到的然后呢我就不想干活了或者说是我发现我做的事情做的再好都没有 AI 做的好那基本上就不会再去想着要把这个事情做好我觉得这个是一个短期的一个很大的一个问题我不知道大家会从什么方式来克服是第一个然后中期呢就是就是那个你刚才说的那个情况我觉得大家开始卷了就开始卷那些就是已有的赛道大家都知道我

我们以前的事情就做不了了我得去想办法去求新搞怪吸引别人的眼球通过制造一些独一无二的这样的一个感觉让大家去觉得自己是有价值的那么这个过程其实是应该说是比较痛苦的过程

因为很多人会觉得自己并没有天赋但是一定要去被迫去卷这些直接赛道但是再往前我觉得长远来说我觉得应该说是乐观的因为大家可能会意识到我们以前的工作有时候我们以前有 T4 的惯事我们现在上学受到教育上教育之后目的是获得一些有用的技能然后用这些技能去工作工作了之后拿到薪水

然后养家户口然后养育下一代然后继续这样循环但是这样子一个是用这样的方式来赚起来的但是以后如果你发现大部分人受到教育之后做的工作这个工作本身和 AI 产品没有竞争力的话其实大家可能会放弃这个想法

因为常常来说每个人最好还是想做自己想要想喜欢的东西像我看到我很多朋友他们业余可能是个画家或者说业余是个小说家或者说业余是歌唱家但是对他们来说这也只是业余活动因为他们还是要比如说做携带马然后通过这方式来获取工资然后可以买房然后可以买车然后可以养孩子所以这个过程其实是限制了大家真正天性的发挥

如果大家真的去做自己想要的或者说完全出于内心特别热爱的工作的话呢而不需要担心就是收入是多少或者说有什么样的地位的话我觉得这可能是会是更有意思的一个事情那么这样的话呢可能会出现这个职业的那个多样化的爆发期大家都会发现其实有那么多事情以前没有想过的但是可以去做这个爆发期之后呢就是大家可能会发现其实最后还是比原来更开心了一点嗯

我感觉上是会有这几个阶段对长远上来说我还是比较乐观但是就是说中间有什么波折就很难讲你现在有观察到就是你说的第一个阶段或者第二个阶段的一些情况吗因为从 23 年 24 年到现在其实 AI 确实发展的很快包括

coding 啊然后这个写作啊它都是有很多的进展的那可能对程序员对吧对一些文案从事者他可能都会有一些影响对对对是的我觉得现在已经开始出现了对那个但是呢就是可能没有什么权威机会去统计这个或者说已经开始统计了只是我还不是知道这个事情

对应该说冲击是很大的比如说写文案的朋友们他们可能会觉得用 XGB 写出来的东西其实比自己写的好或者说给你 XGB 先写然后自己就认色这个都可以跟以前的流程有很大的不同所以这个一定会发生那么之后所以 AI 越来越强

然后用的起来越来越便利我觉得更多的人会波及到这个应该是一个很大的一个过程可能再问一下比如 2~3 年的时间内可能会有很多的比较大的变化这些变化可能对于 AI 研究院来说没有那么

看得见因为我们比如说天天看文章或者感觉有什么最新的进展但是这些 AI 本身会下沉到哪个领域的各个戏风的一个方向上那么会改变就是每很多人的一个具体的工作流程那么这个过程呢应该说是滞后的但是应该会慢慢也会在慢慢的情况下在慢慢的发生那么这个发生的过程呢会改变这个世界的或整个社会的运作的一个方式我觉得这个很大的一个变化你觉得你自己的这类工作什么时候可能会被 AI

很大程度的取代我只做研究的这类工作因为现在其实很多人他们的想法就包括很多 AI 研究员自己的想法就是希望 AI 能做科研对我觉得是现在看起来有些比较简单的科研的操作其实都是可以的比如说让他查文献对吧让他去收集一些资料现在这个叫 deep search 其实都已经还不错了当然就是说能不能提出有深度的观点

能不能找到一些深层次的联系和想法和思路这个现在的这个 AI 还做不到就是就是它现在属于这种这种状态就是外行看起来这个东西很内行内行看起来很外行状态对就是如果我去查一些我不知道的东西这个对现在的那个大元末性非常低但是如果真的碰到了就是我喜欢的啊

或者说我热衷的如果我特别精准的东西的话就是我能看见很多的漏洞所以但是这样的话其实意味着就是研究员还是有事情可以做的因为他对这个世界有很深的理解那么这个理解而且是随着就是经验的增多那个研究的深入会越来越深而这个理解的速度其实是超过大圆模型的学习速度的

所以这一块其实 AI 研究员还是有自己的优势大运模型现在还是有一个问题就是它的数据的复杂度还是太高比如说你学一件事情你肯定要很多样本不过学一个事情你肯定要需要 1000 个一万个样本才能学会当然对于顶级的那些研究员来说他们可能一两个样本看一下

然后知道这里有问题那里有问题它会联想到一个正确的但是非常细小的一个因素上面去并且这个因素是确实是正确的影响它的因素因为有这个能力所以人类连续员还是能够站在大模型的前面大概是这样的一个感觉对所以这个问题可能在现在的大圆模型它的训练的算法没有改进之前可能还是很难解决的因为现在还是对数据的方式训练

就说现在这种预训练的这种方法或者说这个机制它没有变化的话它其实和人的那种真正的去思考理解或者发现一些东西的那个状态是不一样的这我觉得是不一样的当然可能每个人想法不一样有些人可能会觉得就是一样但是照在我来讲的话说我觉得还是有很大的区别那么这个区别可能是本质上的一个区别这个是有不一样的地方但是如果以后真的是 AI 进化了之后比人的学习速度更快

可能研究员的工作就干掉了所以这个时候你可以考虑比如说我可以去写小说或者会做一些跟现在不一样的事情你觉得这件事情很快会发生吗比如说数年内有可能会发生吗 5 到 10 年内我没有那么乐观这的我倒没有那么乐观我觉得这种是属于涉及到怎么样去训练模型本身的一个改变这没办法通过对数据来完成的所以这个可能没有那么容易

也许可能还需要比如说 10 年的时间 20 年的时间我觉得是这样子因为就是比如说你要去问一个下围棋的围棋国手他一定会说哎呀不行对所以但是过一段时间之内你会发现啊 AI 的水平你超过啊围棋最强的那些人啊所以就是对于每个人来说他有没有自己的我也有自己的那个比如说一个自尊呢或者说是就是人应有于傲的这个这部分

但是就不一定就是 AI 不一定超过他这都是有可能的那接下来正好可以聊一下就是研究生的生活的这一部分因为其实这个也是书里的一个主线我觉得对很多其他的类似的人士会有启发的就我看这本书的时候我是感觉这里面的博士生非常艰苦尤其是最开始出现的那个角色就是他们的大师兄风希云他是要在赚钱养家和继续做科研中做一个非常难的选择

但是这个好像跟我理解的最近这几年的 AI 领域的现实是不太相符的我想问一问就是你这个博士生的生活是来自于什么呢是来自于因为你可能是更早进入这个领域吗就当时那还是在 2012 年之前的好几年是因为那个时候这个领域比较冷是吗所以你们当时确实挺艰苦的

还是故事性的原因 08 年那段时间其实是比较没有那么热的应该说在我毕业那一年才开始真正的发展起来对那段时间是这样就是大家都知道有记忆学习这样的一个方向但是这个方向有没有用有没有效果其实大家还是存有一意的大家可能会觉得我记忆学习其实我的数据和我的特征还是需要人去写

数据需要人说的人确实需要人去写所以计学习可能就是现行礼盒或者说是一个最好而成这样的一些统计的方法吧就当时大家认识是停留在这上面的所以很多时候是这样我当时我记得有个师兄告诉我说你不要做计学习这东西没有效果肯定不行我们得做一些更加接地气的东西

就这么说就是没有那个就当时我的老板我当时的博士导师他也不赞同技学系他对他来说他做的工作是一个基于物理的一个图像识别或者说基于物理的图像上的分析对他来说真实的东西就是物理公式这些公式因为它是真正是对的那么通过这个对的公式可以得到对的答案

如果通过机器学习的方式它里面是黑盒子所以他也不知道会发生什么事他也是很反对机器学习的介入他甚至跟我说他觉得他的世界里面没有概率他觉得他世界里面都是确定性的物理写好了最后公式写好之后就是对的要不是错的所以当然他没有反对我去做更加配合机器学习的方向所以这也是挺好的

最后变成了就是我去专门去那个研究这个技术上的一个突破那么他帮我去帮忙去比如说让我让我能够更好的那个演讲啊更好的表达自己啊那个交流能力常常有些提高那这个这种这种组合呢其实对我来说应该说在过去在我在这个博士阶段呢还是比较好的一个组合有一个就是他我自己会发挥另外就是我能够发现自己短板然后让自己变得更加成熟啊

这个是比较一个组合那在卡奈基梅农的读博士的时候那个组里就是只有你自己在做机器学习吗对应该说是这样因为其实我其他的师兄师姐他们都不是做这个方向他们都是做就偏物理的一些建模然后对视觉的一些分析吧大概是这样的一个方向对我觉得可以讲讲就是你当时的一些学术选择和你怎么度过就是这个领域那会儿看起来还有点前途未卜的这个阶段我觉得这个对现在更年轻的研究者也有启发嗯

对因为还是说比较喜欢我特别喜欢做一些自己想做的事情对所以比较我可能是一个比较内心驱动的人不是很在乎外面怎么说怎么想所以我觉得这个东西我搞出来了或者说这个东西我想通了我特别开心我其实并不想要外面有什么样的奖励或者说有什么样的认可

所以这样的话呢就是一般来说如果对自己的东西特别有兴趣或者特别喜欢的话呢就会有一个自信和坦诚的这样的态度所以通过这方式呢就可以把这个不日就在这个比较艰苦的日子给它度过去大概是这样的一个

其实我以前也是一个非常内向的人然后也不太说话我在上台说话的时候就被卡住我之前有口述的毛病但是在通过这个学习过程中我会慢慢的发现就是自己特别喜欢的东西会把这个自信给发挥出来所以你现在看到我现在这个样子其实也是说是因为博士决断的有这样一个断念吧

在博士阶段包括就是后面早期开始工作的时候你觉得中间做到哪些事情或者说做的哪些成果让你慢慢对机器学习这个方向的信心是变得越来越强了一个当然是就是我觉得就是自己那个对有些问题的理解变得更深入了这个对我自信是很大的帮助然后另外就是说确实能看见就机器学习在整个过程中就是能够做一些比较重要的效果比如说我们领导力为奇的项目对吧这个项目能够

真正做出一个模型来这个模型下期的水平非常高那么这个时候你其实对机学系的或者说对生物学系的它的能力有更深的更好的理解我觉得这个很重要就是真的自己做出东西来了然后不仅是理解方向的而且还是实践方向的那么这两个东西都能够给自己一个强化的一个动力然后觉得这个东西真的是有效果的

而且这个效果呢历程度上来说呢我自己也是可以预测的那我就对这个问题呢或者对这种东西的理解就变得非常深入我也会对它更有自信在这个过程中外部反馈重要吗比如说你们投会然后有些他中一些顶会的这个奖啊什么的因为还是希望有一个自我的一个一个与内心驱动力去做这个事情我觉得这个事情是对的我觉得应该做下去

这个跟外面有关系在外面如果承认了我会更开心因为我会觉得我说的话至少别人还认同或者别人会觉得这个动画是有道理的所以这是两个人相互加强的过程但是我觉得为博士生可能先要有内心的驱动然后才有外界的反馈当然有些人可能想反的但是最终这个反馈能够转起来成为一个非伦理效应之后那么这个博士生就会慢慢慢慢做得更好你刚才也讲到你当时读博的时候有师兄劝你要接地气一点吗

然后你这个书里面也是写了两类研究者我觉得它确实代表了两种做学术的思路一个就是风希云还有林福宇就是他们是很执着于做一些颠覆性的但比较冒险而未知的研究而且他是有可能做不出来的

如果是对一个普通的博士生来说这个可能就是搭上了自己的青春但是后来因为人类面临危机嘛所以他们去赌这个方向其实也有可能会搭上人类的命运然后另一种就是他们都是罗老板下位的就另一个老师就孟天风他就是想用有限的资源去做一些小的改进一些实用性的技术可以比较快能用起来的我觉得这两类角色就是在这个小说里他们都是很有魅力的我觉得并没有就是特别明显说谁好谁不好啊

你可以讲讲你当时为什么设置了这两类角色包括你觉得如果在一个非常极端的情况下实际上可能应该把资源放在做什么样的研究是你比较认同的我觉得这样的人都是应该有的都是非常重要的应该不能说是谁好谁坏对吧对因为就算是非常接地气的或者说非常拼音用的研究员他的贡献也是很大的

他可能会把这个比如说把整个地下城的通风系统做得很好然后大家都过得很开心这个对他来说其实是很大的一个动力特别就是我小说里面可能就是我有些写的比较多了就是有些东西可能写的太散但是像天风这样的一个人他其实应该说更加注重别人对他的看法

所以他会特别想要让别人开心我觉得他肯定是这样的一个角色最终在最后那一张他牺牲的时候他其实也是为了想要让别人开心想要让米河不同的见解之间的人的一些裂缝他愿意坐下来跟大家谈判但是这个本身因为他有这样的一个内心的动力在那里所以他其实肯定愿意去做一些更加偏应用的研究另外一波人就比如说像林富宇和朱熹海这样的人或者

包括冯希林这样的人他们可能总的来说就是他们可能更偏向于内心深处的一个动力那么他们希望这件事情一定要在他的手里面做得更好他们没有那么想太多就是别人对他的评价所以对他们来说可能会更加想要去做一个别人做不出来的事情那么他们就会去冒险去赌

所以这个两类人他们的驱动力是不一样的那么驱动力不一样的话导致他们不同的结果当然驱动力还有加上能力能力如果不够强但是驱动力很强的话可能会造成比较悲剧性的结果温习近平其实是这样的一个应该说是这样的一个角色就是他的驱动力非常强但是他能力没有那么强那么这样的话就会产生一个问题就是

可能会有很长的时间之内他得不到很好的反馈啊比如说我作为一个博士生我资质是很平平的但是我非常想要发鼎会我非常想要发全世界震动的结果那么这种情况下就会有很多很多年他没有办法达成他想要的东西那么他就会非常郁闷对吧他会非常伤心那么他有可能会做出一些比较极端的或者说比较冒险的举动啊这就是为什么这个书中会有这样的一些剧情的因素原因啊

所以其实这两类人其实我是当时在写的时候是一个平常来说做了一些比较深入的思考和写的当然可能写完之后因为这里面东西太多了所以我觉得很多读者也没有完全看得很细所以很多时候会有些反馈说这个人物表扁平不是特别不一样但是其实是有一些不一样的一个动机在里面的

所以我觉得从社会角度上来说这两个人都是需要的因为就算像 OpenAI 这样很伟大的一个公司因为他们做了一个 Inter-GBT 引进整个世界他需要伊利亚这样的一个制造方案的人但是也需要很多的研究员他们能够把具体的数据然后把具体的技术设施给搭好这样的话整个系统才能真的跑起来所以这两个人都是需要的所以至于最后的问题就是如果真的地球处于

小猪中的危机那么什么样的研究员是比较重要的所以这个很难讲因为在这种情况下任何一个小小的信号或者说小小的发现都可能会改变整个人类的一个研究的思路其实是很难的应该说就是这两个人类人最终可能会统一到一个方向上就是说我不管怎么样我要拯救地球然后怎么拯救地球我也可以用任何手段去做这个事情可能变成这样子我也许可以

赌博或者冒险或者说我可以做那些非常简单的但是非常重要的具体的事情这两件事情都可以切换但是这完完全全取决于每个人看到什么样的迹象和踪迹然后每个人心里有什么样的道路然后自己走过去大概是这样子所以这两个人可能会合并就是在真正地球里面出现这样的危机的时候可能会出现这样的情况

然后这也涉及到我想问的下一个问题就你刚刚说的这个情况他要合并或者说这两类人要更好的协作大家来一起使用比较有限的资源那就需要一个统筹的角色嘛心理书里也有这样的角色就是他们共同的老板就是这个罗教授嗯

罗教授就是一个开始看觉得他好像有点那种官样或者说甚至有点学习但是你后面会觉得这个人还是挺有魅力的他有一些他的考虑就像你说的他可能是有一个大的目标然后他要用很多手段去达成他他也要用不同的人不同的团队去达成他

然后你自己其实也带团队嘛就你这个书特别好玩的地方就是它这一部分真的特别日常就写了这些包括罗老板是怎么管团队的然后他下面那几个老师你刚刚说天风对吧然后林富宇他们是怎么带团队的他们每个人都有不同的风格然后你自己也做技术 leader 其实很多年了你每年的这个年终总结里面你会发来知乎上你会分享一些带团队的思考就你现在会觉得一个技术团队里面好的 leader 他应该做什么不做什么

对我觉得是这样的我现在的想法是这样就是一个技术理论最重要的事就是能不能把握好方向就是这个团队整体来说我要做什么这个做的东西应该通过什么方式来完成然后团队里面哪个人他想要做他应该做什么样的事情然后哪个人有什么要长处然后能不能无为而治就是

大家其实我就比如说表现来说我其实没有那么过多关注大家但是最终大家和在一起把事情做成了我觉得这可能是一个比较好的一个状态因为你现在在 Meta 这个大的体系里面就是你们组做什么你是自己比较自由的是吗

还是说也会就是整个组织会有一些压力给到不同的团队了对这个完全看具体在哪个大的那个环境下吧对吧就之前我们在那个在那个 Fair 这个环境下的时候呢其实还是比较自由的应该说这个组下面的那个具体的方向呢其实我这边有一些话语权其实可以定下来的

对所以这个是一个比较好的情况这种情况下因为大家做研究研究的前沿是无限的所以其实这个空间是比较大的关键是作为一个团队的方向上这个人比如说像 leader 这个 leader 怎么样把这个方向定下来然后让大家觉得这个方向是有前途然后有希望的并且大家愿意花时间花力气把它做完我觉得这个是一个比较重要的一个结果当然我们最近是从 FIRE

转到了 JNI 那么整个大环境其实是不一样的那么对这个对于 Leader 来说其实能不能找到一个好的方向一个是就是让大家有活可以干然后另外就是而且指出来大家就是别人看不见的方向让大家觉得跟着我跟着 Leader 往前走是有前途这个其实是一个很重要的一个

因为其实我觉得在现在这个就各个公司或者各个组织之间技术竞争非常激烈的情况下其实最核心的最中间的力量就是每个组织里的技术的 leader 因为 leader 也会吸引到更多好的人然后他其实也是关于就说实际上一个成果是怎么做出来的一个最关键的角色这个是很难当因为他其实要在两个关系做平衡一个是就技术上来说

这个 lead 还是需要有一定技术高度的然后大家愿意跟你一起做然后有吸引力让大家愿意过来加入一个人另外其实 lead 也要有个人事上的一些能力和敏锐的洞察力对如果人和人之间出现关系裂痕或者说人和人之间有一些不同的问题那么怎么样去解决它其实需要有管理的一些能力所以这个都是比较难的一个组合对

就是我看你在知乎上写的这个年度总结有一个跟你自己的角色相关的变化就是 2021 年的年度总结里面你是说首要的任务不是埋头苦干就类似你刚刚说的可能最重要的是我要是要看方向然后到 24 年的这个年度总结我看到你说要更多的 hands on 可以讲讲这个转变吗包括这个转变适不适合 ChadGBT 之后整个深层次 AI 的一个加速

的变化是有关系的对这个是这个问题是非常好的问题了我觉得能看那么细我觉得是我非常感动这是一个这里面其实有一些一些变化吧就是有个成语叫先看山试山然后再看山试山然后又回到看山试山这样的状态比如说一开始吧比如对于我来说你看那开始是一个 individual contributor 就是说实话实说就是

贡献者就是作为一个大头兵对吧然后我把一件事情做好啊这个是我的目的啊但是呢就是如果要承让我一个 leader 的话呢就是不停不停要把手上的事情做好而且肯定要看得更加长远啊然后对整个团队的方向要有一定的感觉啊那么这个时候呢就是说很多时候

不要纠结于手上的一个基础细节然后就要往外看就是你可能要在更高的楼去看往下看啊这是第一个飞跃因为这个飞跃其实是一个比较难的一个飞跃有很多人可能就是我就是希望把手上的事情做好我也不想去管太多的那么就很难去达成这第一个飞跃啊

那么第一个飞了之后那我对这个团队的整个故事有了解了然后我对这个战略的思考也会有比较明确的方向那么这样的话一般会成为一个比如大厂里面一个标准的 leader 比如说一个 manager 一个经理然后管一些人做一些事情那么这个状态的时候就是我会在这个时段时间会写一些博客说我不应该去首要任务是不能买头工作我得去看看

总结一下过去的弯路对吧然后看看有没有什么大的方向去想然后大的格局上是怎么样子的这个是我去想的那么这是从一到二转变然后从二到三的转变就是一旦变成了一个比如说更加偏管理者的角色变成了偏大方向控制的人角色有些时候你会慢慢的失去自己对技术上的一个细节上的把握这个实际是很难的平衡因为很多人是这样从大家在大厂上比如说成为经理之后然后慢慢也不管下面的人在干什么了

你们千万随便做然后对我来说我只要保证每天报告写得很好对吧然后项目文档做得很好然后上面有交代就行了但是其实你会慢慢发现这模式在新一代的深圳式 AI 出现之后慢慢的会受到一个挑战因为你会发现那些做得最好的那些 Lab 像 OpenAI 像 Trofic 他们很多时候是这样他们里面的所有的 leader 他们所有的那些人都是会写代码的然后都是懂技术的

然后对于技术很高的敏感性有这样的团队这样的团队如果工作的好的话它的产出和速率是非常高的而且同时交流起来的速率也是非常快在这边传统的大厂这种就是上面有一层精力然后下面那个

做事的人拼在一起这样的一个模式上来说呢他们其实有更强的战斗力那么现在整个现在 AI 出来之后呢我觉得大家都在往这方向去走就是希望上面那些经理甚至是总监都是有些基础的能力那么这个能力呢就可以让这个整个团队的那个速度变得很快然后球队变得非常通畅然后也不会出现就是一和一和在干活八和为官这种情况哦哦

对所以这个是一个很大的一个转变另外一方面就是待会你会发现就是之后一个人战斗力会变很强一个人加上很多 AI 他战斗力可能会强于一个小的团队那么这种情况下就是这个核心的这个人他对于技术上的敏感性是远远重要的就是比那些大厂那些大的就是偏那个人事管理的那些经理他的技术上的那个深度是更要高于那边的经理

所以这个其实也是一个很大的转变所以我会看到这样一个趋势这个趋势是说就团队越来越变得少而精然后团队里面每个人特别是他的核心人员他的技术能力要求变得越来越高通过这个方式才能很快抓到问题关键而且你也很快执行下去

而不是说是在不停的交流和扯皮中消磨时间这个转变其实应该说是在最近的两年里面变得非常明显为什么很多小公司它执行速度会比大公司要快很多的所以主要是因为这个原因所以我们也肯定也是往这方向去转的

对包括外界就是去分析 DeepSeek 说他们也是有这样一个特点嘛就是梁文峰他自己作为创始人他也是会参与到比较一线的工作对的对的对的我是听说是这样子嗯对听说如果下面人没有拦着他写代码他就会写代码啊

比如说那个时候 OpenAI 的 O1O1 preview 出来了之后他其实对这个方向是非常敏感的我觉得这个是一个非常好的就是因为技术的一个 leader 他对于最新前进技术非常敏感的话整个团队的转向和集中力会非常强大这个原来强于一个对技术已经太敏感的团队 leader 那么这样的话就是对于公司或者整个团队来说他的转向速度和他的产出的一个步骤就会

敏感性表现在什么地方就是比较细的认知比如说对推理模型它能做到什么程度然后有什么样的局限性有什么样的能够做的事情然后什么样的问题能够在这上面做得更好这个都是会有很表现的想法现在的这种办事或者说方法之下能不能达到更高的智能就类似于可以发现支持发现规律的这种智能因为你刚才有说到其实你是站在不太能做到的那一派的

我觉得主要还是看在目前的范式下什么样的改变能够更大程度上的去榨取模型的能力应该这么说这可能是更加切合现实的东西比如说我们要改变整个训练的思维方式对吧思讯人的模式对吧能不能把整个问题给重新 formulate 一遍对吧现在大模型什么问题这都可以讲但是因为这些东西相对来说更加难执行

它可能是一个更加难的研究问题所以更加深刻的或者说更加深入的或者说更加能够做的事情那可能就是看现有的模型还有什么样的能力能够被激发出来对他们确实是在现有这个机制之下我觉得是做了很多改进的包括我们最开始聊到的就是他用这个 FP8 对吧就是一种更低精度的方式我怎么去弥补就是这个带宽的问题因为他们用的是 H800 嘛他们

没有用 H100 是的这个其实在他的报告里面是有写的就很细他们把一些 GPU 上本来来计算的那些 stream processor 拿出来让这些 stream processor 专门去做通信的工作应该说是一个就打破封锁的一个方案对吧

应该是这样子你自己现在就是保持这种技术敏感性包括去学习这种新的 AI 的变化的方法是什么这个是应该说是这样嘛一个你经常会读文章嘛这是一个对吧然后在我去整理之后其实应该说看代码的时间会更多因为有很多的重要的东西要看一下对甚至有时候会自己写这个都是需要去做的然后

文章还是要看这个都是比较重要的一些工作在你之前自己合作过的其他的技术 leader 里面你觉得哪些人的风格或者说方法是你觉得很好的是值得学习的应该说是这样就是我其实之前也合作过一些人然后他们有些人学相比有些人非常非常聪明然后反应非常快然后他们对问题有很深的理解然后

听了这问题之后肯定很快的速度反映出来最大最难的问题在哪里或者最本质上的一个思维和那个根在哪里这个很重要就是这种 critical thinking 的能力看到有些人非常强他们能够在很就是说不是在几分钟的讨论中马上找到最大问题然后想要通通去改进这个是很重要的一个能力

还有一类人就是他们看过很多文章然后思维非常广想法非常多那么他们可能会发现比如说这个和那个不一样的研究的方向这两个方向之间其实有相似的地方或者说有非常接近的一些部分

那么通过这把这两个方式连起来我们也可以得到一些更深的结论这是也这样的人对还有一些人就说他们可能对具体的应用的方案或者说是现在这个细节非常了解你对他们说我们要做这件事情他们容易说这件事情不能做或者说有什么原因就是他不能做这些都是很厉害的人

这个形象有点让我想想到乐坤对

但是我不知道你写的时候想了没有可能你没有想到这个对对对他对一些重要的问题有自己的非常独特的坚持这个坚持会让他一直走下去大概是这样子他经常会在社交媒体上对现在的一些方法他会有一些比较犀利的评价吧是的是的就是这个其实对于研究员来说很重要因为每个人都有自己的一个独一无二的地方吧

就是每个人有自己的一个语言和想法要把这个事情做好对那为了做这件事情呢就必须把这些资源聚融起来然后把它这个事情做成了所以其实都是就是如果一个人只会人云一云呢就不说我我觉得大冒险是对的那所有人都觉得大冒险是对的那这个其实就是构不成一个研究员的一个方向吧对因为大家都做一样东西呢其实无法就是说明就是这个人他到底有什么样独特的见解和

我觉得以后在 AI 泛滥的年代在大家都去世界了然后大家都有 AI 来做自己的研究助理的时候有没有自己独具外的观点和想法和思路比较能够坚持下去

这可能非常重要对我觉得最后这一部分是想聊聊就是你自己作为一个 AI 的使用者我是指就是作为创作者的这个角色和 AI 的研究者之间的这个双重身份的关系而且你现在作为创作者你也是会来用 AI 的吗虽然可能之前没有用因为破晓之中这本书是 20 年开始写的 21 年写完的然后我知道这一本是你完全手写的

就是手敲的没有借助任何的大模型那你后来也是有分享过说你写续作优越星火的时候你是试了用一些模型来辅助自己的你可以分享一下这些体验吗对体验上来说呢还是应该说现在的模型还没有那么好啊这个是我现在一个初步的一个体验呃

因为主要还是在于就是模型本身它的目的呢一个是我希望这个模型去模仿人的写法就是说我希望预测比如说人给他喂给他的那些数据希望他预测下一个那个字符下个 token 预测比较准是这样的一个非常简单的一个目标函数那么意味着就是说这个模型训练完之后它的能力就局限于这个模型这个数据给给他的能力

他的目的是希望去模仿别人的写法所以他就没法出新就是具体版上来说就是这样就是你让他写一段故事他可能会写到最后就收敛到一个王子和公主幸福结局或者说是从此之后地球又和平了这样的一些就比较范的一些故事就比较难让他真的去思考一些在一些极端情况下会发生一些奇怪的走向他是非常不擅长的

这个是我跟 Kat 很大的一个问题就可能你会发现就是他在写的比如前 500 个字或者前 1000 个字他会有一些比较有趣的人或者这个互动但是再往下写他就失去了这个互动的意义然后他会收敛到现在说比较频繁的或者说比较无聊的一个结尾

所以这个其实是比较大的一个问题吧对应该说这里面因素是有多方面的有一些方面是因为这个模型目的是为了服务于人所以它必须和人类价值观是一致的所以你想让他写些不一样的东西他就写不出来了所以这个是一个问题另外一个问题就是说就是模型本身的长文本能力也没有那么强

如果现在常的话他就忘记之前那些设定然后回到一些比较简单的比较单纯的设定这都是问题你觉得不同的模型在表现上会有什么区别比如说像 CO 像 Cloud 还有 Gemily 还有 Lama 包括我知道春节的时候我看你发朋友圈说你也用 DeepSeq 就是试了一下它的这个文本创作的能力

对 DeepSeek 虽然说你乍一用看起来好像他的故事脑洞非常大但是真正用起来也不是很好使因为他的逻辑性没有那么强还是有很多的奇怪怪的莫名其妙的想象所以他的脑洞太大了然后有很多想象是没有根据的对于小说创造者来说这个是比较麻烦的事情

所以它比较适合脑洞但是真的成文我觉得这个模型不太好使啊所以还是比较适合比如说用 Jemina 来来写这个最后的文字这个是我的想法啊

然后 Cloud 我感觉上它的训练的方式应该跟其他模型并没有那么一致我感觉它里面应该也没加了一些很多的比如说合成数据或者加了一些有意思的数据要让它写出来的东西就是感觉上逻辑和分析性比较强就比如说你给它一段话里面有几个角色包括一个主角和主干配角其他的模型只会根据主角去写故事

但是他这个模型 Cloud 这个模型 3.5 这个模型 3.7 我还没试他至少会分析这些角色之间的关系而且并且写出一些就是他们之间有可能会浮生的互动这个让我觉得非常有趣应该说其他模型没有那么强的对配角的一个感知的能力对 SO 可能比较平淡应该就是说可能就是一般的情节发展最终会得到一个比较无聊的

这样子一个东西 Gemini 至少我在 2.0 的时候我用了一下 2.5 还没有用 2.0 的时候用的时候我觉得应该说它比较细它写的时候文笔其实还是不错的就是它的文笔或者它是描述性文笔它会跟你说环境什么样子的然后这个人在什么地方怎么做什么事情就是它写的会比较细相对于其他的模型来说所以这个其实让 Gemini 2.0

至少我觉得好像让他写一点具体的情节给定这个大纲之后写情节他还是可以写一点但是就是写了之后还是会觉得比较平淡吧其中还是希望有一些比较好的那个转折转折还是需要人去思考总的来说呢还没有那么强大但是应该说比一年前要强大的多因为我们

23 年的时候我们还有一部分工作是做用大圆模型来写小说是有过几篇文章这时候用的还是比较差的模型比如 GB3.5 这样的模型那么这个时候就是你会发现这个水平就差很多了所以现在这个模型的水平已经远远超过之前的模型但是还没有达到人类携手的能力应该说有一些巨大的鸿沟应该是怎么这么说

嗯那完整总结一下的话现在可以用的部分或者说你自己摸索出来的让 AI 帮你写小说的这个工作流是怎样的你刚刚提到了一点就是说给大纲的情况下 Gemly 2.0 是可以写一些具体的情节的是的是一般是这样一般是你先有个想法然后用它来细化大纲对吧然后那个大纲慢慢的再细化一下然后把每个大纲拿出来写一些一段大概是这样子一个一个过程嗯只要保证这个大纲它的结构是比较完整的然后

人和人之间的关系也比较自然或者说比较一致你最终写出来的文或者情节应该没有太差就是说这是能看的可能是可以作为一个比较拙劣的作品可以拿出来给大家看看这可以但是你要真的去细的去

独一俱俱的话的话你会觉得这个人写的描述不是很够位或者说那个人写的描述跟这个人写的描述差不多或者说前面这个人在做了一个很细微的事情之后后来把这件事情忘了所以这些问题现在来说没有那么容易解决

你西华大纲也是用 Gemily 来做吗还是用哪个模型会更顺手啊大纲的话还是会用比如说人来写就是有些重要的故事那个发展就是因为你在故事发展的时候你还是会想希望有些新奇的东西出现对吧然后希望这个故事的发展呢还是要让人去真正的去体验去思考我觉得这还是重要的

就是你试图用模型来做过这个小说的大纲但是都效果不太好的吧可以这么说吧现在对应该说是这样比较因为就总说就是他们会陷入某些套路对比如说像外星入星地球这样的一个大纲他们一定会说先入星地球了然后地球爱红电也全部快挂了然后有一个领袖出现了

然后他带领大家战胜了外星人然后自由过的和平是这种故事应该说你是烂大街了大家都知道怎么写但是你作为小说家你不太希望就是故事真的是按照这个方式写或者说至少在这里面应该会有一些比较更加自我的或者更加大的波折然后把这个事情做成应该说就是小说家应该是很挑剔的一个人就是反正是被 AI 生成过的东西就不想写成这个样子所以他就是我感觉上是

可能小说家永远不可以满足玩意还是这样子你现在用 AI 来辅助写小说的话它会就怎么影响你写作时的那种状态就是比如说它会让你更有心流更专注还是它会打断这个感觉对这个很好的问题我觉得其实还是会打断的就是应该说很多时候这样的一个过程就是如果有一段是真的我是想写的然后我也不想让 AI 打断的话我就会往上让自己写还不会去让 AI 去

然后把这段写完之后然后可以说这段是我保留的我不希望你动或者说你有些运色就可以然后有些部分我可能是有部分我也没有空写了然后我让他来去填充通过这方式可以组合 AI 跟人之间的创作这是这种办法但这个其实需要一些就是你需要写个程序就是

比如说你输的时候你有一大堆的东西就是里面有一些是人写的有些是空的但是有些大的想法然后这大一部分拿过来然后用 AI 去处理一下然后他发现这部分需要用 AI 填充的那么你去呼叫 AI 呼叫 Gemline 呼叫这个模型然后把它填进去所以你是自己做了一个这样的小工具给自己用了是吗

对我有这样很多量的小工具这个我觉得挺好的它其实是一个囊括了 AI 和人的一个协作的一个协作的软件我可以这么理解吧对对对但是其实也这种东西也是变化很大的就是你可能你今天换一个想法重新再写一套这都是有可能

你这个是现在只是在自己用是吗你有分享给比如说其他写东西的朋友用吗没有没有没有这个我都不太好意思拿出来因为我眼上都非常糟对吧然后很多东西要修改而且这个流程本身也在不断变化中吧也不是说是固定的那你写这个工具本身你是自己敲代码写的还是也是用 AI 帮你编了一部分程序那当然是 AI 帮忙的哦

就是比如说科色之类的这种是吗对我是订阅的我是科色的用户嘛我一个月 20 美金可以订阅了解所以这个 AI 其实是渗入了现在的很多环节对吧先用 AI 帮助编成一个写作的软件然后再用这个写作的软件又可以调模型来和人一起写小说了

这个肯定是目前最有解我现在看不到更好的但是具体怎么调用具体通过什么方式把人和 AI 的写作合起来这个都是常常的问题对 我觉得你现在这个生活很有意思就一方面你是一个 AI 研究者这是很新的一种职业然后另一方面作为一个小说作者其实是讲故事这是人类可能有了语言文字以来最古老的一个活动之一就是你同时做这两件事它给你带来的比较特别的体验是什么

体验应该是这样就是之前我也曾在主顾上分享过就是我觉得我不靠谱的想法我就写小说靠谱的想法用来写论文大概是这样的一个想法吧那么这样的话不会浪费掉我的一些想法然后这两边的那个交互呢其实也可以让我自己有些新的想法和体验也就包括你说这次的就是这个采访对吧也会让我一些新的想法

所以这个本身是一个让我觉得非常 enjoy 的一个过程也是一个调剂吧因为如果你天天想写代码或者天天想那个 research idea 的话他思维还是会枯竭的如果有一些跳出这个局部的那个优化或者局部的工作的这样一个大的一个脑洞式的工作的话呢可能会让这个局部的工作更有趣同时能够看到更远的东西比如今天的采访会让你想到什么新的东西啊

对就是今天才反正会让我去想就是像比如说之前那个您跟我问的那些问题啊比如说 Leader 的一些转变对吧其实那个你在问我这个问题之前呢我没有意识到我在我的博客里面会有这样的一个转化过程提纲里面写完之后我突然意识到哎我真的是有这样的一个就是就是全身明明把您做了这样一个数据化学的工作然后我发现啊我的博客里面确实就这么写过我意识到其实我的思想和想法也是在随时进行变化的

这个对我来说是很大的一个帮助我也非常感谢这个很有意思像之前还有个问题就比如说包括这部小说写的博士生是搞物理的搞纳米的而不是搞那个计算机的对吧我觉得我在写的时候没有想过为什么要从搞物理入水但我潜意识的觉得从搞物理那边去写会更有意思一点

所以我从这个方向去写但是我看了这个问题之后我就想到其实我当时可能潜意识的觉得如果从计算机的方向出发可能我也陷入赛博朋克的风格就是有个黑客然后计算机非常厉害他潜入了某个系统然后把系统黑掉了然后从此成为救世主这样的一个模式其实应该说比如说在 matrix 黑客帝国里面已经出现过了对吧所以我可能在写作的时候下笔的时候下笔的时候会避开由一而套路

去找另外一条路但是我自己没有想过这个问题但是你这边一问我会想到可能是这个原因所以通过这个方式可以把一些就是潜移式的东西给具象化然后会有更好的思路会冒出来而且它在情节上也是更严谨的因为你这个故事里它其实是中间有一个东西完成了所思己所得那个还是靠物理完成的就是他们

那群博士生当时在研究的这个纳米机器人对就你有这个东西你才能实现就是最后我们又生活在一个虚拟世界里然后实际上我们又有一个服务器可能被发射到了比林星或者一个很遥远的宇宙的角落然后让人类可以用虚拟的方式在这个宇宙里去探索嗯是的是对你才需要物质基础嘛对吧你不可能直接完全是那个数字化的所以这个还是是需要这么写的

所以总的来说我觉得通过这样交流是有很大的一些有意思的一个思维碰撞你觉得未来一段时间什么样的写作可能会被 AI 替代什么样的写作是不会被 AI 替代的比如说就未来五年吧可能说我们可以说稍微短一点的时间我觉得是这样吧就是还是希望每个人能够分享自己独一无二的或者说是没有人见过的一个见解我觉得这个可能是不会被 AI 取代的一部分

因为总的来说 AI 还是需要新的知识作为它的知识支援吧然后进行训练如果这个新的知识 AI 现在没有办法创造或者说没有办法生成的话呢那么每个人类自己携带的新的知识它可能会成为 AI 最想要的东西或者说会成为最有价值的信号

我觉得这部分应该说是比较难就是最终可能大家会变成自己的个性化写作的过程就每个人都想分享自己的经验然后每个经验可能是从来没有被探索过从来没有见过的比如说是这样子一个设定那么这可能会成为人类真的是探索星海的一个原动力这可能我之前也在一个 blog 里面写过就是如果真的大家变成这样的一个

社会的话可能有人说我愿意去月球或者我愿意去火星我成为一个登陆火星的人然后把所有登陆火星的知识都分享给大家因为这部分知识是我们的数据库里面从来没有过的我觉得这个应该说是非常重要的但是那种程序性写作比如公文罕见比如说法律条文这些东西可能就没有那么创意的那种可能会被 AIA 的

标准城市标准模式给取代就可能这样子你说的这个点和小说情节又呼应了就像银河联盟他最想要的就是散落在宇宙各个角落里的新的想法然后 AI 可能未来一段时间最想要的是人们的独特的体验和想法

我觉得应该是这样的这个都是一致的因为我并且想过这些东西就是在这个《破晓之钟》里面有一个很经典的情节就是有一刻人类可能要灭绝了就编制了一串遗产信息是关于人类文明的记录的你在书里是这么描述的我们是人类曾于银河系玄弊太阳系第三行星居住被银河联盟毁灭我们知道四种基本力及 118 种由不同原子构成的元素

目前模式识别方式为多层非线性神经网络我们存在过进步过抗争过感谢你的收听然后这里面就是他其实都是讲的一些理工科的成果好像没有放什么文化艺术的东西就是如果可以放的话你会放什么我觉得是这样了首先第一个这个是个无亲之事我

我不觉得文化艺术是不重要的不过当然对于这样的一个信息来说我觉得比较重要的是如果真的我们人类要发出这样的信息一定是在信息的一开头给大家讲一些共通的知识比方说数学和科学技术那些是共通的假设物理定律是一样的话全宇宙都是有同样的信息那么发出这样的信息如果有其他的

生命接触到他们可能是更容易理解然而文学艺术那个是独一无二的那个信息所以这个信息呢应该说不那么容易被那个地外生命所理解吧所以我会将这种放在后面那我想补充问一下就是在你放的这些共通的信息里面我觉得对经常看科幻的人来说比如说描述地球在银河系的位置在宇宙的位置包括物理的四种力对吧什么强力弱力电磁力什么的

然后化学元素这些都比较常见这个模式识别方式为多层非线性神经网络这个显然是在说 AI 嘛就是你可以讲讲就是他为什么是这样去描述的因为这好像不是我们一般去说人工智能的描述的方式对我觉得我这么放的一个原因呢是因为这个其实是代表了就是人类对知识或者对于那个智慧对数据的一个那个工具的一个方式就是

我可以说比如说我们大家从信息的处理的这样一个方式出发对吧你有很多方式可以处理信息比如让人去处理信息然后让简单的模型去处理信息或者让比较复杂的深度瞬息网络来成就信息那么

根据人类处理的信息的一个方式其实可以大概判断出这个种子它大概处于什么样的状态所以这个可能是一个标志性的事件应该可以这么说对当然我也是 AI 从业者所以我会下一次把 AI 的地位拔高所以这个有一个自我的一个 BIOS 在上面

对于人类的认知能力是有很大的提高在多层非线性神经网络之前人类的模式识别方式是什么呀就哪些东西叫做模式识别那实际上是这样就是一般是就是在那个生物学习出来之前我们一般是这么做的我们先有一些人工写下来的那些特征比如说我知道今天天上有云

所以有可能会下雨这样的一个简单的一个逻辑推论那么对于人类来说就是在神经网上出现之前我先把天上有云这件事情作为一个事实写在数据里面然后我希望这个模型和天上有云直接联系到下雨这样的一个学习过程但是就是说对于这个学习过程来说首先需要有人把天上有云这件事情写下来

那么这部分其实是人类的知识人类知道天上有云这件事情跟下雨是有可能有关系的但关系有多大不知道但是我先写下来让机器去学所以那个时候呢机器学习相当于人类已经知道了大开的那个逻辑关系然后让机器学定量的关系但生物学习其实把这个过程给颠覆了就生物学习来说就是我其实并不用写天上有云这几次的色字

我拍一张比如说今天的照片然后这张照片用它来预测接下来会不会下雨那么生物学习在足够的样本情况下它可以自动的把这个照片里面那些可能的模式连接起来然后让它预测会不会下雨它比如说可能会把上面那些像素拼在一起然后拼在一起之后看起来像是个云的形状发现这个云的一个高层的概念跟最后的下雨结局是有关系的它因为这个原因所以它会自动学出来这个云的概念

而不是让人去告诉他就有云这个概念所以因为有这个能力所以他其实又在很多情况下其实他感现出一种比较超乎寻常的能力他会自动去学习概念自动去总结高层的经验规律然后用它去预测将来预测其他的一些数据

那么这个其实是一个飞跃那么越来越人其实并不需要那个花很多心思和代价去真的去帮机器去标注很多高层的概念然后去学最后的功力然后机器把整个过程都自己做了这个其实是应该说至少对我来说我觉得是生物学习在获得那么大成功的原因所在那我们目前能看到模式识别的下一个方式的苗头了吗就多层非线性旋径网络之后可能是什么现在应该说还没有完全看见吧对因为呃

我觉得还是现在目前还是在这个框架内在玩我觉得可能之后可能需要有办法能够找到更有效率的找到这样的模式的方法然后不用通过大量数据还有一种就是你怎么样去学更加高层的概念的组合比如说小学生其实都知道怎么算多位数加减乘除高度数据规则他马上可以知道任何两个数字乘起来应该怎么算画一个数式一个算那么只要小学生足够细心答案一定是对的

但是机器就是做大约模型对目前来说他还是没有办法学会这种高层的规则让他去做一个三位数乘三位数的乘法他能做对四位数也可以做对但是比如说你大到比如 12 位数乘 12 位数他就开始错了他有一个界限的然后在这个界限之外他就做不出来了所以他其实并没有学到真正的乘法的规则但是他是通过大量的模式匹配比如说他看到了最后两个位数是 25

那下面可能是 25 大概是这样一个逻辑结构吧或者这样一个经验规则他把这些经验规则全部拼起来之后呢大概能猜出来最后的答案是什么大概是这样子所以但是它并不是一个真正的那个逻辑规则去来计算多数乘法所以这个能力呢其实现在应该说很没有吧应该说这是一个很大的问题

但是怎么样去解决它然后怎么样能够让 AI 变得更聪明这个其实是我们现在研究院想要做的一个事情我有一个小的问题就是为什么把它翻译成宇宙都能听懂的共通性语言的时候你没有直接用人工智能而用的是模式识别因为人工智能这个名字实在过于

太大了对对所以我可能会更加想用工程性的或者说精确的一个描述去回答这样的问题吧对因为 AI 这个字就是可能是对大众来说可能是一个符号但是对业内人来说还是希望讲的更加细更加精确的会比较好一点吧

那最后一个问题就是关于如果你能在这个人类遗产的信心里面放下更多的文化内容的话比如说放三本可以进入人类遗产的科幻小说你会选哪三本呀我肯定要选三体三体我觉得三体应该是为数不多的小说我看完之后会觉得整个世界发生了变化的这种感觉因为就是说它给整个世界给了一个不同的解释嘛

对吧 或者说你会让你有一种感觉是我现在活这个世界是没有那么真实因为在后面还有一层深的真实在那里其实我看过那个感觉我可能连有几天有种感觉慢慢才会缓过来后劲特别大所以特别是第二部的结局应该说是比较

比较大的然后还有就是隔阂基地系列那这样子一些经典咱们也是应该说是能够放进去的其实那个刘思新也写过一个小说是关于虚拟世界还是去探索宇宙的选择的一个短篇小说就是不能共存的节日那个你可能应该也看过对它是一个二选一的选择然后我觉得就是破晓之中这个故事挺有意思的它其实是告诉了说在这个二选一之外是有另外一种可能的对

对我觉得可能是人类应该会找到自己的出口并不是说一旦进入虚拟世界之后大家就完蛋了我觉得现在之前的很多小说都这样子就是大家进入虚拟世界睡生梦死了然后就不再探索宇宙了但是真的这种事情发生了之后呢我觉得应该会有一个中间有很多中间状态这种状态其实会找到一些自己的出口然后让我们的人类的好奇心还继续能够流通下去吧我觉得应该是这样子的也没有那么极端你看没有那么极端嗯

好的那今天非常谢谢田元栋田老师来做客晚点聊分享了他创作《破晓之中》这本科幻小说的思路他想表达的主题以及这本书中涉及到的一些科技的想法和 AI 的思维那这本书的一个出发点就是想去写 AI 时代的和 AI 技术相应合的新的科幻的幻想然后这本书里确实也有很多这方面的巧思包括我们最开始提到的它某种意义上也和后面 AI 这几年的一些发展可以应征上

那欢迎大家有兴趣的话可以去看这本小说另外这本小说的第二部正在田边东老师的个人主页上连载大家有兴趣的话也可以去看那今天谢谢田老师做客非常感谢您的邀请拜拜拜拜

本期连点呈现分享两个和之前节目的呼应一是在聊破晓之中里的一些 AI 技术和思维时田元栋提到他在 20 年开始写这本书设计承载人类意识的立方体时具有部分影射音伟大书中外星文明对立方体设计了一个屏障式立方体之间的带宽有严格限制

这就是为了防止大量立方体的互联涌现出新智能。而我们看这之后几年的 GPU 和 AI 芯片系统的优化思路,就是互联更多的芯片。在 115 期与模型智能创始人徐林杰聊华为 4 月新发布的 Cloud Matrix 3840,我们详细讨论了这个趋势。除了华为之外,英伟达也推出了 NVL72,是他在 2024 年之后最重要的 AI 服务器方案。

那么树里的人类是怎么绕开带宽限制突破银河联盟的防线呢其实和后面的业界思路也很相似就是找到一个方式能在传输数据时尽量不损失信息但又降低对带宽的需求比如 DeepSync V3 在 H100 的带宽减配版 H800 上就是用了 FP8 这种低精度的数据格式降低了对通讯带宽的要求二是关于更强的 AI 到来之后社会和世界怎么变化这其实是我们在过往多期了 AI 时都会涉及的议题

在 AI 系列的第一期晚点聊 109 期中从个人的角度聊了普通人可以怎么应对和使用 AI 他说 AI 是一次放大个体能力的机会大家可以对 AI 多一点耐心不要试一下就放弃可以多摸索一下现在的 AI 的能力边界能做什么不能做什么

在 106 期与戴宇森真格聊 agent 时他则是从社会结构的角度提到了一种有可能比较惊悚的未来他的观察是强化学习进入的领域陆续遭遇离世时刻即 AI 超过人甚至强到人无法理解的时刻那么如果 AI 模型越来越强有钱就等于有算力就等于有生产力这会不会带来资金转化为生产力的 scaling law

让本身掌握资源的人有更多资源,让阶层流动和新公司的崛起变得更难。田园栋则用科幻故事的形式,更详细地描绘了他设想的未来。这里有虚拟世界中三流画家的空虚,有一边进入虚拟世界一边走出太阳系的可能。也有他对高级文明的需求的想象,他认为科技最终会发展到所见即所得的状态。这是一个已经非常高级的文明,会担心什么想要什么了?

他的答案是宇宙中独一无二的智慧和想法是其他的更优杰的可能这其实有点像大模型现在对我们的需求它需要更多数据而数据又是对人类想法与智慧的抽象我们产生新的优质数据的速度好像有点赶不上大模型的需求了不过这一定是一件坏事吗

本期节目就到这里欢迎收听如果你对今天聊的话题有观察好奇或疑问欢迎在评论区分享想法这也会成为我们节目的一部分让整个讨论更完整你也可以把我们的节目分享给对这个话题感兴趣的朋友欢迎推荐更多你想听的主题和嘉宾你可以从小宇宙苹果 podcast 等渠道关注晚点聊 Late Talk 也欢迎关注我们的公众号晚点 Late Post 下期再见