We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Vol. 132 科技快乐星球31: 7/12 Days of OpenAI

Vol. 132 科技快乐星球31: 7/12 Days of OpenAI

2024/12/18
logo of podcast 枫言枫语

枫言枫语

AI Deep Dive AI Insights AI Chapters Transcript
Topics
Justin Yan 和 自力 hzlzh 详细解读了 OpenAI 连续 12 天发布会中发布的多个新功能,包括完整版 o1 模型、ChatGPT Pro(月费 200 美元)、强化微调功能、Sora 视频生成服务、Canvas 功能、ChatGPT 集成 Apple Intelligence、ChatGPT 语音模式视频聊天功能以及 ChatGPT 项目管理功能等。他们分析了这些新功能的优缺点,并探讨了其对 AI 行业的影响。他们认为,o1 模型在逻辑推理能力上有所提升,解决了大语言模型产生幻觉的问题;强化微调功能降低了开发定制 AI 模型的成本;Sora 视频生成服务虽然发布后网站瘫痪,但开启了新的视频生成领域;Canvas 功能类似于 Cursor,提升了文档编辑效率;ChatGPT 集成 Apple Intelligence 虽然导致 OpenAI 服务短暂中断,但也标志着普通大众开始使用 AI 工具;ChatGPT 的语音助手新增视频聊天功能,但其实时性有待提高;ChatGPT 新增 Projects 功能,提升了用户与 AI 交互的效率。他们还讨论了 AI 行业的未来发展趋势,以及大语言模型的成本、应用场景等问题。 Justin Yan 和 自力 hzlzh 对于 OpenAI 连续 12 天发布会中发布的新功能,特别是价格上涨和新功能的实用性进行了深入的探讨。他们认为,200 美元的 ChatGPT Pro 价格大幅提高,引发了行业对 AI 服务定价的重新思考,其价值取决于功能的实际效用。他们还分析了强化微调功能对降低开发成本的意义,以及 Sora 视频生成服务、Canvas 功能、ChatGPT 集成 Apple Intelligence 等功能的实际应用场景和用户体验。此外,他们还讨论了 ChatGPT 语音模式视频聊天功能的实时性问题和隐私问题,以及 ChatGPT 项目管理功能对提高用户与 AI 交互效率的积极作用。他们认为,虽然 OpenAI 的新功能令人印象深刻,但仍存在一些挑战,例如成本、实时性、隐私等问题。

Deep Dive

Key Insights

为什么OpenAI的12天发布会引起了广泛关注?

OpenAI的12天发布会通过每天发布新功能和产品,吸引了科技圈的广泛关注。这些发布包括期货Sora、视频聊天功能、ChatGPT的Projects功能等,展示了OpenAI在AI领域的创新和进步。

OpenAI的ChatGPT Pro服务价格是多少?

OpenAI的ChatGPT Pro服务价格为每月200美元,相比之前的Plus版本(每月20美元),价格提升了10倍。

OpenAI的Reinforcement Fine-Tuning功能有什么应用场景?

Reinforcement Fine-Tuning功能可以用于罕见遗传病的研究,帮助在特定领域内对大模型进行微调,使其在专业领域内表现更精准。

Sora.com的发布表现如何?

Sora.com在发布后20分钟内就崩溃了,用户无法访问。尽管Sora.com的生成视频功能在演示中表现出色,但实际使用中效果不如预期,且与国内其他生成视频的AI工具相比,表现并不突出。

OpenAI的Canvas功能有什么特点?

Canvas功能类似于Cursor,允许用户在共享文档中与AI协作编辑,支持实时修改和插入内容,特别适合编码和文本编辑场景。

OpenAI与苹果的合作带来了哪些变化?

OpenAI与苹果的合作使得ChatGPT与Apple Intelligence集成,iOS 18.2正式版中支持了这一功能。然而,由于用户量过大,导致OpenAI的API和全线服务一度崩溃。

OpenAI的语音模式有哪些新功能?

OpenAI的语音模式现在支持视频聊天功能,用户可以通过摄像头与AI进行实时互动。尽管AI能够识别物体并进行简单交流,但实时性较差,且存在隐私和成本问题。

OpenAI的Projects功能有什么优势?

Projects功能允许用户创建项目,上传文件、代码、文章等,并与AI进行深度对话,保持上下文一致性,极大提高了与AI的交互效率。

Chapters
OpenAI 连续 12 天直播发布新产品和功能,引发科技圈关注。本期节目在 OpenAI 发布会的第 7 天录制,对前 7 天的发布内容进行回顾和点评,并讨论了 200 美元月费的 ChatGPT Pro 版本是否值得购买。
  • OpenAI 连续 12 天发布新产品和功能
  • ChatGPT Pro 月费 200 美元
  • 听友预言涨价

Shownotes Transcript

风言风语 听见科技与人文的声音大家好 我是 Justin 大家好 我是自立年底了 就快到圣诞节 OpenAI 整了一波大活科技圈搞事情

对结果最近的新闻特别多本来我们也在讨论 OpenAI 最近号称要每天发一个大新闻我们要不要追着去聊这个东西但看下来我们的时间精力是彻底不够用的所以要不算了

对然后各位小伙伴的这个催更我们也感受到了感谢大家关注我们这个节目我们会努力更新的在我们这个时间经历允许的前提下对我们当下录制刚好是在 OpenAI12 天发布会的第 7 天不确定我们最后在第 12 天之后会不会看到什么然后就去录一个专期但是这一期科技快乐星球肯定是满满当当是要有这些新闻的

对东西很多不知道会聊多久所以这期节目可能时长也许会比较长到时候剪出来就知道然后关于这个 OpenAI 它到底会不会出大招我们现在不知道所以可能等它全部发完了之后我们再来看然后再加上我们有时间精力的话可以去

考虑专门聊一下这个专题以及最近其实其他的一些新发布的产品啊其实还有一些去世其实还挺多的对这个有些就照顾不到了到时候再看吧嗯那我们开始吧好那我们

废话不多说就进入今天的节目首先还是来一波 AI 相关的尤其是 OpenAI 它这几天发布的各种各样的新东西首先是它宣布每个工作日发布一场然后今天是第七天那也就是它在下周等等它不是说每个工作日星期天它怎么还发布呢对啊不太对吧它说的是工作日但是

确实今天第七天发了这个新的 project 功能我没有太注意他的发布时间的他们对 day one 是九天前所以他其实周末是休息了的我们良心公司啊良心公司周末不加班啊周末还是有休息的那他 12 天不就得 stream 个两个礼拜加两天三个礼拜了啊

所以说他是赶着圣诞节的他最后一天可能就落在了圣诞节放假前是的他就卡着圣诞节来的而且他在视频里面 SAN 他们已经是穿上了一天就穿上了对已经开始要分为拉马下一周的五天过完再来两天就刚好圣诞节

对就是卡到圣诞节的前一天有点厉害人家其他公司都准备休假了他可是在加班你还记得这里面有一个就是商业上的套路就是敢在比如说周五去发这种大招新闻或者敢在圣诞节前发那么到了周末就没有人去测了就只能说你真牛逼这个技术怎么怎么样就是还没有来得及去测试就只能把新闻先发了媒体是这样的

媒体是这样但我觉得对于 OpenAI 来说有个问题就是它不得不加班你看那个 Sora 刚发布不就崩了吗就导致他们不得不去对各种各样的去兜底那如果到时候圣诞节那天发了个大招然后一上线就直接崩了卧槽大家的这个圣诞节不用玩是吧是的对啊所以这个不是个良心公司 OK 那就只有像苹果这种说我们圣诞节不审核 APP 你们要发就提前上传啊

比较良心大水果是这样的好那我们来看一下 OpenAI 最近都发了些啥首先第一天呢是发布了一个完整版的 OE 模型并且呢新增了一个月费 200 美元的这个 Chad GPT Pro 我们之前是 Pro 现在改成了 Plus 然后那个真正的 Pro 是 200 美元

对反正就是 Pro 才是他们未来要更贵的一个版本我现在 Plus 就显得有一点之前我觉得 20 刀挺贵的现在跟这个比起来我觉得还挺划算的我们在 OpenAI 是用价格毛点就是这样对前两天我们在上一期节目的时候有听友在评论区里面去留言说 OpenAI 一个月 20 刀是很便宜的然后我当时是说 20 刀还是有点贵因为订阅太多了嘛

那他觉得呢跟雇一个人比还是比较便宜的如果是长到 200 刀他也愿意结果就真来 200 刀我不愿意我就没有看

咱们的听友实力还是很强的这个要看吧要看他到底能实现什么因为他现在是不能够完全替代一个独立有民事责任的一个人类的所以 200 刀确实还是要犹豫一下但是呢 OpenAI 确实也是把 AI 的付费直接一步到位的提升了 10 倍哈

之前的付费到 20 刀其实推出的时候很多人都已经觉得 20 刀还是有点小贵虽然它不是那么贵但它有点小贵而且它锚定在 20 刀之后你看后面很多的其他的产品像什么 Cloud 什么 Windsurf 像 Groove 他们其实都去锚到 20 每到一个月的价格上面去了然后现在

他开辟了 200 美元的新的一个档次这个用户肯定是会少很多很多这个毋庸置疑 10 倍的这个价格差但是他真的会愿意花 200 美刀去买的这一批用户将成为真正的核心用户且离不开的用户因为之前我们用这个 plus 账号也是现在的 plus 账号里面的 O1 的时候每天是有这个限制的用超了之后就不能再用了

那这个 200 刀的版本就是无限可以使用 OE 这个深度推理相关的这些功能我现在用不上所以我完全没有开它的理由对之前的那个 OE 是个 preview 版本我们不能发文件不能发图它不能连网它什么都不行那现在就相当于说你在线网的这个 4O 版本上面

所有的能力他都有了然后给你换成了一个推理能力更强的 OE 模型这个我们之前在说 OE 出现的时候其实整个所谓的打引号的 AI 赛道他已经开始转向了以前是大力出击技对模型你模型越大你的能力就越强你能干的事情就越多现在反而是说我不需要你去做更多其他的东西了但我需要你在某个推理能力上

有一个专精的表现而 OE 呢我拿它测过就是有一些脑筋急转弯的题目 4O 做不出来但 OE 能你无论怎么 PUA4O 它永远是错的但 OE 就能给你推理出一个正确的答案这个东西我觉得在一些应用场景上是非常非常重要的因为以前我们会说

用一个大语言模型你担心它产生幻觉你担心它会给你错的结果而这种担心会使得你在某些领域里面完全不可应用这个大模型但现在它通过 OE 的这个转向算是某种程度上解决了这个问题使得人们可以放心大胆的使用 OE 在它的领域里面相当于是拓宽了某些特别专业领域的人群的需求

对这些人才会用 200 刀去买你这个 OE 的服务反正特别利好写论文的小伙伴们因为论文是一个严肃场景是一个要求很严格的你所有的引用都要有出处然后 4O 其实是会放飞的他还是会编这个东西然后 OE 的这个 API 之前我有去用过然后我发现他的文档里面是说他的 temperature 就是温度这个值只能是 1 就是

可能就发挥的空间不是那么大它的逻辑推理能力会更深会更严密一点另外之前咱们也用过它的时候会发现它思考速度很慢可能有的时候会进入深度思考要三分钟这种的但现在速度好像提升了然后有的网友就在那调侃说感觉它的偷懒怎么这么快就给了我一个答案我有点不敢用呢就这个很搞笑

你说这个用户体验确实对就快了吧我觉得你没有思考会让这个用户体验不好慢了吧我觉得你深思熟虑是的所以 Sam 听到了这个之后应该要推出一个 Sleep 十秒吧本来可能你花了大价钱所以他就把资源都给你的现在他一想不对啊我把资源都回收算了还能省点成本哈哈

anyways 这是开玩笑的现在你花了大价钱你有专用的机器或者专用的服务那你会快一点也是很正常的而且现在按照他们的发展的方式虽然已经转向了但是 OE 的推理速度在完整版变得更快应该也是可以预期内的是符合预期的只要你测试的结果是可信的那它就应该是可信的

它之前有时候实在太慢了我都觉得有点无语好几分钟才能给我结果对 4o 是比较方便的如果 O1 它能够确保准确度的前提下它还能变得更快其实它显然是更好用的 OK 这个是先发布了一个 O1 并且提高了整个 AI 行业付费的阶梯直接上了一个数量级牛逼我只能说真的牛逼

然后在第二天的时候他又推出了 reinforcement fine tuningfine tuning 就是之前我们去用大圆模型的时候你可以认为大模型它是一个基座它是一个啥都能干的一个东西但是它啥都不精然后你给它一些特定的数据集或者是给它一些魔法然后让它在某个领域里面也能够变成一个专精的

东西就是相当于大模型啥都能干但都不精然后你让他在某个领域变得更精了这就有点像是一个 fine tuning 的过程那之前怎么实现这一个方式呢非常非常的昂贵我之前试过一次

就是首先 OpenAI 是跟 Azure 去合作就微软的那个语音所以你首先要在 Azure 上面去开一个能够部署 OpenAI 大模型的那个服务然后找到一个节点能够 host 它的然后我发现美国已经全部被买完了

所以我只能买到去欧洲 欧洲还死贵然后把你的服务部署上去根据你模型的不同它收费又不一样然后你塞进去这个模型之后再把你训练好的数据集给它塞进去然后它就变成你要的东西了我可以告诉你这个东西能用来做什么就是它能够让你用比较低的技术成本去实现一个你自己想要的专属的 AI 模型

这样讲有点含糊之前我们的一个朋友 Chris 他是做了一个新的 APP 叫了然清单里面有一个自动分类的一个功能就是我记住一个 to do 一个 reminder 然后他根据我输入的文字自动帮我分类到某一个分类上实现这个功能有很多种办法

那比较简单的就是用一个传统的分类器但是它的效果往往不太好如果你去问 checkgbt 我今天早上八点起床请帮我分类那他可能就会帮我分类成这个是一个日常生活的一个分类项大语言是能做好的如果是属于我个人的一些分类那大语言他不知道那我就可以把我个人的分类提交给他他就能够给我做好所以我觉得用大语言模型去实现

基于自然语言的一个分类其实 4 欧已经能做得很好了我还测试过国内的豆包那些其实做的都不太行 4 欧是做得非常好的我觉得是可以信任它的只有可惜用 Azure 来实现的话成本太高了我 hold 不住所以同样的这个功能只能说等未来

我觉得可能有几种方式一种是自己部署的大模型像那个欧拉就是那个开源的那个 Facebook 开源的那个大语言模型那个东西能用得上那会好一点另外就是 Chad GPT 他们的大语言模型的那个价格彻底打下来就可以或者是等国内像豆包这种很便宜的大语言模型它的能力能上去

豆包的分类是真的不行我觉得还蛮神奇的我觉得像豆包啊还有那国内不是有什么文心一言啊还有 Kimi 啊对吧其实我印象中他们现在的效果应该非常好了但是他们跟 4 欧比还是会给我输出一些奇奇怪怪的分类这个是我觉得很奇怪这时候不就插入到另一条新闻了吗你记得那个苹果在大陆的这个跟文心一言的合作好像并没有那么顺利啊

像拆 GPT 现在在 18.2 里已经直接集成了 Apple Intelligence 但是 Apple Intelligence 在大陆的还遥遥无期在国内还是有点难搞但我觉得也不仅仅是模型质量的区别有点大可能这里面还有很多其他的考量我们就不知道了而且苹果保密又做的特别好只能知道他们现在很干但是不知道他们干到哪个方向只想知道我的手机什么时候可以用上大陆版的 Apple Intelligence

对但 anyway 现在 OpenAI 如果说新的能力能出来的话我觉得它是可以大大降低我们自己去做 fine tuning 的成本假设在 API 的那一个部分它也能够支持这个能力的话那么也就意味着我可以在调用 OpenAI 的 API 之前去对我当前的 API 对应的模型做一些 fine tuning 这个我觉得实现成本就会低很多了比起我们去

像我说的在 Asia 搞一台服务器然后自己部署那个应该是要好很多这个我觉得还是很有用的你发现没有现在很多 App 他们做着做着就会推出 AI feature 什么邮件客户端 Spark 也做了 Notion

是的很多 AI feature 它其实背后也就是掉一掉这些大公司提供模型的 API 而已但很多时候掉的我觉得也没啥意思就强行为了 AI 而 AI 但如果说我们能够在未来这些集成包括 Find Tuning 这些能力里面是有一个更低成本的介入的话我相信会诞生一些比较有意思的 AI 的产品像 Chris 他做的了然清单里面的自动分类我觉得算是一个非常契合的一个很好的自然场景

是的相当于降低用户的使用门槛是提效的一个部分我觉得是挺好的所以他第二天这个是一个强化微调计划他会让一些专业领域里面去训练这种或者是应用这种大模型场景变得更好但是目前对我们普通的 C 端用户对于每个月复了 20 刀的这种用户而言

第二天其实是水过去了我的感受是这样确实暂时没啥用对它只是个计划因为大部分人根本不会去用到这个功能是太专业了比如说一些医药领域对吧我觉得有一种可能就是现在 GPD 不是有 GPD Store 吗 GPTS 可能后面大家去做一些 GPTS 就是做了之后再分享出来的那些东西会比之前做的更精准更好用没错之前那些我觉得

就也挺水吧之前他 store 里面的那些东西还不如我们上次说那个什么 word 什么那个 AI 他做出来的那个好玩的就那个分析你的 twitter 然后吐槽你的那个那个是很好玩的但 gpt store 是没有出现这样的东西的对吧你就发现这里面嗯

说明他这个 store 做的还不够好但如果他这个能力也能用在 store 上面的话希望他能够出现一些真正好用的东西上 store 我觉得普通人不需要自己去亲自去做但是别人做了就分享给你你就能用上了这个还挺好你说到刚才那个我想到前段时间也有人在 TedVT 里面去用说根据我之前跟你聊天记录来描述你觉得我是一个什么样的人

然后上周好像马斯克的那个 Grok 就是推特里面的那个也玩起来了这个根据我的推特发言给我画一张自画像对就是 AI 眼中的自己对我倒是没拿他画过我的自画像但我问了他说你分析一下我的推然后说说我是一个什么样的人之类的那我觉得那个 Grok 还是比较的初级

对对对 是吧 我当时就那个感觉 还没有那么好玩对 没有那么好玩 那这条新闻是 The Verge 报道的 就是马斯克的 X 平台 Growk AI 聊天机器人现在是向免费用户开放了以前你是要买那个 Premium 的 就不仅仅是买小蓝沟啊 是要开那个 Premium 的账户你才能用的现在你如果直接登录 X 的话 你就可以看到左边有一个 Growk 的那个选项点了之后就可以在里面聊天了

效果跟你跟 Gemini 聊天差不多类型的都是聊天机器人现在的 Chatbot AI 没有什么差异化所以我觉得也没什么意思感觉回到 OpenAI 的发布会里面来在第三天的时候他终于推出了 soro.com 这个挤了大半年了是的而且问题就在于说 soro 出来之后首先我本人现在还登录不了 soro 你登录的了吗我也登录不了

OK 你也登陆不了但是根据报道来看 Sora 在跳票了这么久之后出来她并不是个王者跟其他现在我们国内已有的那些什么可林啊对吧豆包最近是不是也能够生成那个视频了我对吉梦然后腾讯的魂圆也都能够生成视频

我最近是拿一个什么东西好像是拿百度的文心一言还干嘛生成了一个打网球的一个视频我跟他说有个打网球的女孩在篮球场上用羽毛球拍拍了一颗羽毛球进了篮球框之后变成了一颗足球她用脚把它踢了起来然后呢

然后没有一个深层的是能够符合我这段描述的全部都是有一个人然后穿着网球的那种网球服拿那个网球拍站在篮球场上然后几秒钟基本上深层都是这样的就是不可用的你知道吧跟那些 Soro 的那个 demo 展示的是差太远了可灵我还没试过可灵可能效果会好一点可灵应该是可以的因为在外网的这个评价里面可灵都是说比较偏真实比 Soro 的那种要

更自然一些这个后面倒是可以去研究一下但是我说的这个我这个 prompt 本来就是很为难这个 AI 哈这个正常人都拍不出这样的大片但 anyways 我现在生成的两段视频都是不可用的就没有任何意义除了说有一个人在篮球场之外他没有给出任何实际意义上的这个行动然后呢 soro.com 在推出的 20 分钟还是一个小时内整个网站就瘫痪了完全没有办法用我也是当天就进去看了然后

一直显示说我当前的国家不支持之类的就是一种错误的信号然后到目前为止我应该还是打不开 SORA

好像也没什么好办法只能等到他能撑得住的时候了但我看 Marcus 就是 MKBHD YouTube channel 已经是在评价 Sora 产出的视频了然后我看他的意思好像也是跟当时 demo 出来的效果差不多就没有什么特别出彩没有什么特别亮点的地方

我觉得这个是比较可惜的就 sora 等了那么久其实也算不上是个王炸对等他慢慢迭代更新因为他毕竟开启了一个新的域名去做这件事情好这是 sora 然后来到第 4 天就是 canvasCanvas 的话我不是很理解因为 Canvas 不是之前一直就有吗 Canvas 它跟之前画图的还是不一样它就更像是 curso 的这种

基于一份已有的文档然后我们在这个区域里面跟 AI 去协作这份文档就是共享文档里面去编辑我觉得这个体验的话就是弥补了之前 OpenAI 没有 Cursor 这种体验的一个场景还挺好用的你是想说 Cursor 还是 CloudCursorCloud 本身右边有一个展开一个区域去给你写代码对吧但是它这个 Canvas 就是我们实时的去编辑一份共享文档

里面可以是代码然后你可以在第几行修改我在第几行插入

因为我看到这个新闻出来的时候我就去试了一下然后我体验下来感觉跟 Cloud 代码的那个界面差不太多后面我们就没再去深究了我进不去这个界面我现在是我自己的号 Canvas 状态激活之后回复依然是聊天我不知道为什么所以我是去看了其他 up 主的一个体验视频然后还有官方的这个发布会里的演示我觉得很强我觉得应该是对编码或者是文本编辑有很大的帮助

我不会反复去给他发那份文档了真的很烦那个过程 OK 我现在实施你试试你现在能进吗新增一个 canvas 试试对你点下面的工具了当然可以我进不去我激活不了那个状态这个体验跟我之前第一次体验的时候差不多对就同一份然后我可以把这一份再修改一遍 try to make ok

然后直接提要求他就直接在文档上改我觉得这个体验应该是很类似 Cursor 的对实时改也有一点像 Notion 但 Notion 那个有点太笨 Notion 那个我没有开你说像 Cursor 主要他这个做法他这个产品是为了面向大众的所以不是只是面向写代码我刚是让他写一篇博客然后他就帮我生成了一篇

然后我让他修改这篇博客他原地把刚才那篇博客给刷新了一遍他是这样的一个场景我觉得有好有坏吧如果他有历史记录的话会好一点版本回溯 Cloud 是每次重新生成一个有好有坏 token 消耗那肯定啊这个但我觉得这个 Canvas 是

比较实用的一个功能还挺不错的算是之前 OpenAI 的整个绘画和编辑能力其实没有那么丰富然后 Cloud 在这些功能丰富程度上是大于 OpenAI 的现在他把 Canvas 加进来之后我觉得是会好一点毕竟 Cloud 他虽然理解文本和输出文本的能力很强但是 Cloud 不能画图 Cloud 不能搜索不能给咱们的博客做封面可能画图

对能做封面而且画图的能力也在慢慢改进虽然没有密砖你那么强大但是勉强是够用的发布 Canvas 这个还是挺好的我觉得后面可以多用用但是现阶段写代码的话我觉得像我们上一次说过的用 cursor 加上 Cloud 来写

或者是后来我用 WinServe 去就新出的那个 WinServe 的那个编辑对 WinServe 怎么样我没用过它同样也是魔改的这个 VS Code 大家都是叔叔同归了未来肯定会被这个 VS Code 官方出的那个 GitHub Copilot 给替代然后呢 WinServe 它的做法和 Cursor 有一点不同在一些体验细节上是比 Cursor 好很多这个是我第一次用 WinServe 的时候我觉得很好

另外就是 Winsor 它会更舍得用 token 于是它会用大量的上下文去换取一个更精确的输出结果而 Cursor 的话呢你如果

不主动去选择多个文件不主动去选择高量且你的 prong 写的比较含糊他其实不会主动帮你去做上下文之间的关联然后你在去做代码提示的时候就有时候他找不着北所以你得多 prong 几次多聊几次我觉得反而是体验没那么好再加上 WinServe 有一次给我一个感觉挺惊艳的我问他怎么实现一个东西然后呢

他自己主动找到了两个相关的代码文件然后他会有个状态这个状态是说我在分析这两个文件第二个状态是我找到了一个写法第三个我输出这个写法第四个经常的来了他

他说我去验证这个写法合不合理然后他说这个写法不合理我 PUA 我自己把这个干掉了要是别的 GPG 就给你了他说我重新再生成一次所以我说他很舍得用 token 但是他这样成本还挺高的如果花的是你

自己的 token 的话就两两如果用的是他的 token 我怀疑他确实一直会亏钱因为他是包越套餐的话用的越多就赚的越少是的然后现在我这两个是交替在用我没有说一定要先用哪一个因为 WinServe 很快我把我的免费额度给用完了然后接下来就所以你又订阅了那你现在的 AI 月定有新的变化吗没有我之前是先订了 Cursor 然后 Cursor 快到期的时候 WinServe 送了

他要拉新嘛那他送了我就用他送的然后现在 Windows Cursor 都过期了短期内呢因为我还有些其他的事情要处理快过年了你知道忙成狗了所以我才说 OpenAI 的事情我们可以回头对所以这两天我就没再去尝试了但我相信他们这个卷法肯定还会卷出一些新东西来的 Cursor 应该也会越来越好

等到他们卷的差不多的时候 VS Code 就出来官方收割了你们都回来了场景被你们打好了那我官方下场你要知道 GitHub Copilot 一个月只要 10 块钱哦

说不定到时候就出 100 道的套餐了呢按照这个鸟心我觉得 GitHub 应该不会因为它得靠微软它不太需要 200 块的套餐来薅回什么它还是可以靠着微软去做用户量然后让整个开发者生态更加繁荣生态更好的话对 GitHub 应该是更有利的它很多时候不是纯盈利导向 OK 那这是 Canvas 我觉得还挺好第四天的发布还是很棒的对

好那来到了第五天第五天是发布了支持 Apple Intelligence 这个我觉得还挺无语的就是他整个 YouTube 视频一直在讲他们 Apple Intelligence with ChatGPT 还是 ChatGPT with Apple Intelligence 然后在演示这个东西怎么使用然后 iOS18.2 也正式推出了我终于可以升级到正式版了我这两天忙的都还没去升级你都不知道 iOS18.2 的 Beta 版有多少 bug 真的

我一路用过来了毫无语了真的是终于终于啊挤出来了我觉得最大的问题还是他即便我的手机是国航版他肯定也在后台默默跑了一堆为他 AI 做的东西他根本没有禁止掉那些任务你知道吧我手机掉电的速度是特别可怕的早上起来是满电的还没到公司呢他就已经快没电了然后我每天要充好几次你知道吧你会开 Siri 吗平时

如果你不用你把 Siri 关掉我就觉得那个店可能是从那偷掉的不一定他苹果是这样的他不允许你正常的开发者用各种各样的 agent 但是他自己起了一堆的 D 码和 agent 而且

随便一个小功能他就要开个 demo 随便一个小功能就开个 agent 然后他自己在后台开一大堆搞得你这个 iPhone 不停的在运作不停的在运作像他那些什么 photoiCloud backup 还有 Apple music 好多好多他都是在后台开一大堆的真的是挺无语的有时候你的手机用着用着 crash 不是你用的那个 app crash 是苹果自己的那个 agent 把你搞 crash 习惯了

所以这次他们其实打了一个配合就是配合了 ios18.2 真实版的发布然后我对于这天的发布没有什么可兴奋的因为我之前一直在用 Beta 版老早就因为要用 AI 苹果的 App Intelligence 去买了港版的手机所以它这里面的 Image Playground 这个 Jmoji 还有那写作工具的增强都是用过了的

但是它这个发布的影响确实非常大到了晚上全线的 OpenAI 和 API 全挂导致我的那些 API 的工具全都挂了这个世界没有 AI 可用的感觉当时就是这样的是因为苹果的用户量太大就是苹果的这个 iOS18 发布对然后涌入了非常多的用户去请求 ChatGPT 不管是订阅的也好还是免费的也好直接那边就当机了

OK 其实我还挺好奇他们这个东西到底是怎么谈的但是现在这个没有公开我们当时是说苹果和 OpenAI 之间签的这个协议应该理论上两家是互惠互利没有怎么所谓的赚钱的套路在里面但是你毕竟消耗了资源了

你消耗的这个资源到底是苹果扛还是 OpenAI 扛这个成本谁来扛最后不会微软默默在背后付出了这也太惨了吧就这个入口而言的话苹果是留了一个后手的就是如果自家的 AI 模型发展的够好它可以全面替代因为它把它当做一个第三方插件的扩展集成进来的

然后 OpenAI 这边也很强就是你的免费版本的我也能 cover 然后我们的订阅用户也可以在上面有更好的体验毕竟这款 APP 现在在销售增长榜里面一直都在霸榜的状态对吧 ChatGPT 本身卖的又贵 ChatGPT 本身这款 APP 在苹果的应用商店里的内购也是销量非常火爆所以很多的这种可能利益交换

是的短期内对于这两家公司来说当然算是一个互惠互利但是这里面不要忘了还有微软在后面虎视眈眈的所以其实 OpenAI 是在玩火要在各家大公司之间纠缠之前还有政府要调查他什么你这 AI 是不是作恶什么之类的但现在还好这方面的负面新闻好像少了一点

但是我觉得他如果说 iOS18.2 一涌进来他的服务就当机的话那么说明这股流量其实还挺大的能不能吃得下可能对 OpenAI 算是一个考验但如果吃得下的话有可能未来普通用户也会习惯这些所谓的 AGI 工具我相信现在能够至少在国内因为还有各种各样的原因很多人其实还用不上这个东西虽然说我们都

都用了挺久的但是这个可能也许某种程度上它算是一个比较潮的东西是的还没出现一个类似于当年 email 或者是后来的 iphone 时刻或者是 ipad 或者是一个通讯工具 facebook 之类的这种爆炸型的全民都在用的一个普通大众都可用得上的 AI 产品暂时来说还没有苹果可能算是比较接近了因为

在他的生态里面接触到的用户确实就是普通大众用户了用户量也够大他所给出的场景也是非常多用户会去用的包括在 iMessage 里面去集成包括那个 JMosi 对吧虽然国内用的人少但是美国用的人还非常非常多的这个东西但我看效果好像也没有那么好那个算花活吧深沉一些这种很个性化的这种表情对

可能就写作增强这一块会集成到 iOS 的各个 app 的各个角落吧对写作的这个我觉得会好很多之前我看他们评测的时候会说什么

把一句骂人的话变成了一个非常专业的骂人不带张字的话特别搞笑但我觉得这个算是普通大众全民能用上 AI 工具的一个前期算是一个曙光就是特别特别初期的一个时候

但也许按照这个趋势走下去的话未来确实是这种类型的 AI 会使得普通大众也能够提高效率只是我们现在还不知道到底是什么东西会出现而已你看现在国内在创业或者国外都一样的每一个去做这些 AI 提效工具的人都在做细分领域的赛道像那个编程的 Cursor 这也算是一个细分对 特别锤

像做 PPT 的国内有一家做 AIPPT 的你知道吧国外也有叫 GammaGamma.ai 之前也是帮你自动生成 AIPPT 的国内的 AIPPT 可能跟 Gamma 的做的又不太一样方向不太一样其实都是在帮助用户去提升效率但目前没看到一个一出来普罗大众全都能用的 iPhone Moment 暂时还没有期待未来会有这个是

第 5 天放上了苹果这个大腿现在还不知道谁是谁的大腿因为苹果自家的 Apple Intelligence 是没有能够做到特别好的一个程度

虽然他现在号称自己要成为 AI 的贫寒但是你看实际上也就他自家的一个在座在接入了一个 ChadGBT 那其他的 AI 也没说他们要进来其他的可能苹果也没谈好这种利益分配因为你卖的又不是很多用户也不多我觉得不好搞苹果用户很多苹果是一个超级大有量池这才能合作嘛

你说双方的用户都很多所以才能合作我觉得不是这样的就是苹果他走的路线是我苹果是有多少多少亿设备我是一个流量池你们来用我我把流量分配给你是走一个流量平台的一个路线那你 ChapGPT 能够跟着我合作应该是因为 ChapGP 的效果最好

而不是说你用户量最多我觉得是这样而且也不算一个直接的竞品因为它毕竟不能去用谷歌的 Gemina 你即便效果好竞争对手我也不能用你安卓阵营的也不是没谈过这不是当时还是谈过的吗可能最后没谈成可能 Google 不愿意来对除了 Google 还有 Facebook 确实这几家公司是有一些微妙的竞争关系在里面最后就退而求其次选了 OpenAI

所以到底会怎样还不确定不要忘了我们以前苹果上面的内置地图是 Google Map 不要忘了苹果以前浏览器里的默认搜索引擎也是 Google 呀虎但搜索引擎是 Google 给钱了的 Google 每年给很多钱给苹果买它默认引擎的站位的这个是真的互惠互利的就是没有永远的竞争对手也没有永远的利益朋友是的但这种签了合约给钱的这种我觉得还靠谱一点实打实给钱的

anyways 这个就看后面他们会怎么走了然后在这个期间 Google 也发布了 Gemini 2.0 号称是性能提升但 Gemini 我已经不怎么用了包括我们刚才说的 X 平台的 Groove 我有一种感觉像这些聊天机器人即便是国内说号称中文做的最好的 Kimi 其实当我想到要去做一件事情的时候

我如果不确定就是如果这是一个通用的事情我会优先选去 LGBT 对吧因为他啥都能干而且干的还挺好的 4 欧也很快还能联网

当我明确知道我要去写代码的时候我目前会选择 Cloud 因为它在写代码这块确实做的也比较好但是你现在有 Gemini 有 Growk 有 Facebook 的然后国内还有什么 Kimi 还有什么豆包等等乱七八糟一大堆对吧我确实不太会想得起来说当我要做一个什么任务的时候我去用其他的平台

就目前没有这样的一个习惯虽然说可能平台忠诚度也不高但是问题是这些平台他也好像也没给我提供比 GPT 和 Cloud 的额外价值所以我觉得这个可能 Google 是有点尴尬的 Google 这次就感觉是被狙击了就是在这个发布会期间感觉被狙击了当然 Gemini 2 是非常的划算的就是它的定价也好还有它的目前的能力也好价格是非常香的

然后比之前的而言是加量不加价习惯的这种套路做法然后 OpenAI 那边的 OE 目前是有人去做了那个叫门赛什么什么测那个 IQ 的智商的然后是拿到了第一名嘛基本断层第一所以基本上如果你要做这种很专业的处理逻辑推理的话我还是首选的 OE 然后 4O 我为什么平时不用这个 Gemina 就是因为 4O 有联网啊

就联网跟没联网完全是两个概念我又用的很习惯了当然 Gemina 那边也可以联网和谷歌那边的一些但是我觉得整体而言 4O 就是日常使用场景的封顶了能用它的话尽量就不用去考虑别的了是的

所以我觉得 gemini 现在是有点尴尬明明 google 其实可以做的特别好而且虽然说 gpt 是比他先手但是 google 其实他的积累以及技术实力一直都很强不应该太 work life balance 我记得是有一个比较出名的项目本来他就是在 google 内部在做但是可能做的大公司不愿意去花钱做这种项目了然后他们就离职出去做了就变成了一个明星产品

所以其实 Google 作为大公司它也是有一些问题在里面的但就做 AI 的这个方面理论上 Google 它有人有钱有资源对吧还有技术积累它没理由做的比别人差再加上它还有 Google 搜索引擎 Google 搜索引擎这个质量怎么着都应该比 Bing 要好一些的吧结果现在是被人家偷了先手而且 XGPC 的搜索真的很好用对吧界面也改了确实好用我还挺喜欢的对

以前就是 GPT Search 没出来之前会有点怀疑你这个信息的靠谱程度现在他把信息来源的网站的 logo 显示出来之后你就会觉得这个可靠性大大增加了因为跟我自己去 Google 也差不多对我说一个细节我最近是在高频的使用 GPT Search 我发现他会优先去用你当地语言的搜索引擎的这种叫什么来偏好

他会搜中文网站多一些我就很烦我就觉得他不准去搜所以我就说搜英文网站然后他出来的结果就会是都是英文网站的来源的东西对就是我发现了这样一个小技巧不然的话他真的会把自己圈在这嗯

对我前阵子也是居里夫人的一个励志故事然后我看了之后我内心存疑什么鬼居里夫人这不是小学的那些课本杜撰出来的故事吗我就让 GPT 去搜我说请帮我找到这个居里夫人故事的来源然后他就去查了给了我一个我百度能够给到的一样的来源我就说这个是简体中文才有的吗

能不能用英文给我搜出他的原始出处他说英文世界没有这个故事然后我就说那你帮我找出居里夫人在哪一年获得的什么什么皇家奖章然后他的女儿是几岁出生的然后他自己交叉验证了他告诉我说那如果这个故事是可靠的那么

它应该是在哪一年哪一年才有可能发生这个故事但是在英文世界没有那基本上就可以断定这个就是简体中文对它就分区了我感觉所以大家在用这个 GPT search 的时候一定要注意多写一个这种全局的这个 prompt 让他去搜英文网站的要搜靠谱的信息来源对的那这个是宣布了 Apple Intelligence 然后还有 Google Gemini

希望 Gemini 后面能找到一些差异点吧下一条我先把第六天的给提上来因为我想说的这个差异点 GPT 的语音助手现在是可以看人说话了就是之前在上半年的那个发布会里面有提到他能够用摄像头跟你聊天的那个功能正式都要发布了我也去用了

你知道 Gemini 在比较早期就已经发布了这个功能就谷歌 IO 上就演示了当时还有人记得我手机在桌子哪个角落对然后 GPT 的这个呢我去试了之后呢其实对我来说有超出预期的部分就是我拿手机去拍我房间或者桌上的一些东西它其实能识别出来而且识别的还特别精准我觉得基本上误差不会太大做一个普通交流是没问题的但是我觉得有一个我觉得可以改进的地方就是

他虽然能看到东西但他不会主动去看和分析对他得等我问他我不知道他是为了节省性能还是怎样因为他不可能实时的就是如果他一直不断的去分析这个视频的话可能他后面的成本会很高对所以他就只能等着我

去点他你现在该分析了然后他就分析一下可能是这个原因就现在这个实施性确实做的很差我有看就是别人的测评的这个过程按照我理想中的方式去测了他说我希望你能实时的告诉我你看到了什么从现在开始然后他就开始举手指一然后那时候我看到你举了一个手指一然后他又二三四五六都不再理他必须得说你看到了什么他说六就已经到六了但中间几个手指没了

没办法实施所以我觉得确实还是应该是成本的问题那么我们可以做一个畅想假设未来有可能大模型或者说我们手机的算力获得了质的飞跃这个不太可能大模型它少到可以放在手机里面这个也不太可能当然在这两个不太可能的情况下他不知道为什么十年后

它就出现了我们手机里面能够跑一个 2024 年的 GPD4O 一样的模型这个事情就可以实现了我就拿着个手机实时跟他聊天然后他就实时 response 因为他存本地就计算完了但我想说这两个不可能首先第一

手机的硬件发展大家也看到了这几年所有的厂商都在堆花活所有的厂商都在挤牙膏就没有一个是质的飞跃的说明这个硬件的这个摩尔定律已经失效了这个是很重要的一点手机已经不能像之前那样说我每年涨个 30%100%300%然后哪天我就能容纳一个那么巨大的大模型在手机里了量子计算机有没有可能是吧还是有一些期望的

是有可能但量子计算机这条新闻是在后面的当然说到飞跃了 Google 有一个 Quantum Chip 它推出了 Quantum Chip Willow 破解了 30 年重大难题 5 分钟时间完成超算 10 的 25 次方 10 年后假如这个呢量子计算机的原理和我们传统计算机的原理是不太一样的传统计算机是 0 和 1 是明确的量子计算机它有个量子叠加态

然后量子计算机在现在这个阶段虽然它破解了重大难题但是它依然还远远没有到可应用的阶段它跟我们日常用的个人计算机完全是两个领域的东西所以它现在只能解那种像什么并行预算量特别大的东西像之前用来破解

密码穷举破解密码这种他能做但他像你说跑在我们手机里面然后作为一个性能特别强大的现在还不是同一个方向然后这个东西呢短期内应该也没有办法那么快得到那么迅速的突破所以你说的这个是有可能作为一个变数但他目前来看不是一个特别靠谱的变数

所以手机性能提升有限然后量子计算机虽然是个变数但也好像也不是特别大的概念再加上大模型它现在已经有点到顶的状态了然后接下来它不是越来越膨胀它也不是越来越小我去试过微软那个超级小的 Five 3 那个 model 现在 Five 4 了非常不好用对它就是个滞胀你知道吧但它离线的呀是离线但它就是个离线的滞胀嘛那

你要用好它的话你只能是想尽一切办法给它一个前提你觉得准确的数据集对然后它在你给定的数据的领域能够帮你做一些自然语言的处理我觉得这个场景下也许能发挥一点作用但把它当做一个跟 GPT 这种通用模型

一样去类比的话它就是智障中的智障是一个超级不可用的东西所以不要指望在手机上面现在去跑一个大模型然后它就能干点什么这个是在现阶段是不现实的所以基于这两个的大前提咱们想要这种实时的对话还挺难的对实时跟机器人对话除非说还有一种可能就是不知道为什么这个云的成本突然间骤降突然 6G 来了 8G 来了是吧

反正就是这个通讯啊你说的是带宽成本带宽成本我觉得也不太可能因为 6G 其实早就在规划和实现中了那是另一回事我们之前有一期讲 5G 的 5G 其实并不能给我们这个手机行业带来一个质的飞跃它不像 4G 对 3G 或 3G 对 2G 的那种降维打击或者突然间到了一个新的高度 5G 还不行那就更不用谈 6G 了

但是呢如果云的成本它突然之间不知道为什么下降了比如说现在老黄在卷他的那个卡然后你知道各家都在推自己的卡对吧 Google 有自己的卡 Amazon 也有自己的卡 Adri 也在自研自己的卡他们虽然说当前的这个 AI 帝国是构建于 NVIDIA 之上的但是呢各家都不愿意就是受到 NVIDIA 的束缚对

对就美国人也不想被美国人卡脖子这个 NVIDIA 不是只卡中国人那假设有一种可能这时候不知道哪家公司他就把这个成本降的足够低那云的成本足够低是有可能他就可以变成一个实时的通话

对所以他第六天发的这个东西就是大家说的给 AI 安上了一双眼睛但我觉得眼睛很不确切其实是一个截图器我测下来感觉我就觉得说我只要说你看到了什么他就赶紧截个图我看到了什么差不多对吧他可能是几张图所以我们可以像那个微积分一样我们无限的把这个截图的密度增大就可以让它更实时但代价是 token 如流水对吧只能说你刚才说的那个

未来能把这个价格云端价格打低才有可能

但你现在说的这个 token 是指我们用来度量定价的那个说法它这中间还有带宽成本还有机器处理成本最终它都转换成 token 了之前它用 token 定价是因为我们给它的就是纯文本或者是转换成其他数据的东西它可以等价变成 token 那你现在传的这些图片当然也可以等价变成 token 那就是无时无刻都在消耗这到时候怎么算你什么都不说它就是不断的在消耗按小时卖吧到时候它就变成一个计时服务了

对它变成个计时服务了电费一样就像小时候玩网游你买了个点卡然后这个点卡还是计时间的你没走一步路你那角色砍一刀砍一个怪其实都在花钱是啊因为你连着呢你看现在我用 OpenAI 的 API 我冲了值之后我就看着那个数字往下掉你冲了十刀它就变成九点几九点几它一直往下掉以后你就是开的那个摄像头然后它就一路往下掉太离谱了

所以在现在的付费模式下要真正实时的去做视频的 AI 交互

还不行至少是现在的模式下不行但是呢这有一点像什么有一点像我们当年没有办法用 2G 网络或者电话线来做视频通话那是啥猫猫上网的时候 ADSL 对 Modern 上网对是带宽不值以支撑嘛当时是基建不够嘛那现在其实也有一点那个感觉就是它这个实时处理的能力的成本还 cover 不住所以我们现在还做不到

这个程度但未来确实有一天有可能那这个可发挥空间就比较大了那 AI 确实能看到你但我有另外一种感觉就是我在用的时候呢有几个担忧点第一隐私问题因为现在有这个视频出去了我不知道它会不会存起来存在是你的截图其实是有

一样的就相当于把你的这个隐私交给了 AI 了嘛那以前我们是交文本交个人资料交你吃饭里的文件对现在连照片视频实时在干嘛都要传给他了其实是隐私问题了第二一个就是他能看到我但我看不到他他其实是一个不对等的视频通话但他可以模拟成任何人这次不是搞了个花火吗把那个圣诞老人的语音搞进去了也就是你此时感觉他是个圣诞老人

对但他目前只做了语音对吧然后他那个语音是一个圆圈那圆圈会变他可以变成一个人那样的话我觉得心和力会好很多但我不确定他会不会往这个方向去做如果他能做得到的话可能会比电影更加合适如果这个助理功能出来了并且有一个选项叫他的形象可以是你自己你会觉得诡异吗啊

因为他看过你然后他也可以摸你的脸然后给你对话这个有点像命运十之门声音也是不仅会诡异这个是很可怕的一件事情但他就是你的一个克隆分身他帮你做事我们以前有一期节目也聊过这个对克隆的话我还活着克隆我不太好之前那个动画片命运十之门死掉的那个女主角她就被克隆进手机里面然后在下一季里面跟着男主角再度去解这个谜题他是一个时空穿越的剧然后也带有一点点的这个伪科学在里面

那克隆出来的这个人到底是不是原来那个人这个是一个永恒的话题就很多的这个作品都会带有这样的一个模糊的这个领域来使得这个文艺作品变得更好看那我相信这个技术一旦出现特斯拉的人形机器人他也可以在这上面做一些手脚那就会像以前老电影你知道以前很老的一部电影叫机器人管家吗

你有看过吗我可以大概描述一下它这个概念跟我们刚才描述的这个技术非常像就是这个机器人管家首先它是一个全身套壳的黄金的金属的机器人然后有一个小女孩他们家是买了这个机器人服务于是这个机器人就在他们家是做管家的他们家很大然后这个小女孩从小就跟着这个机器人一起长大的就很小的时候就跟着他一起长大所以跟他感情特别好这机器人呢

他后来就把自己改成了人类他变成了个人造人然后

然后这个机器人很喜欢这个小女孩这个小女孩也很喜欢这个机器人于是机器人他拥有了人的外观人的情感之后他能不能是一个人能不能够跟这个小女孩产生爱情然后后面能不能两个人走到一起整个电影讨论的就是这么一个东西然后这个机器人也在这个过程中学会怎么去做一个人

所以它其实是一个纯纯的机器人到一个学习怎么做人的一个过程这个也是我们过去的这个文艺作品里面比较喜欢去探讨的一个话题我觉得是挺好的那现在我们是站在了一个关口就是我们觉得好像这一切有一种可能是可行了对吧

而且对那个 XGBT 是主动封锁了这个功能封锁了语音克隆因为之前出了那个 CiDH1 的那件事情 HER 语音的事情他们现在不允许 AI 模仿某人的语调跟你讲话

自然也没有形象所以其实技术上是够的我觉得技术上要做好比较难但是可以勉强做好之前其实那个微信公众号出过一个功能就是可以把你的语音输入给他然后他就可以用你的语音去朗读你在微信公众号你自己写的文章这个功能看起来就比较的顺了因为文章是你写的

你可以选择用你本人的声音去把你的文章读出来它有个 TTS 就是文本转语音的一个能力现在微信公众号是有的所以在这个场景下它也不存在你刚才说的你的语音被别人拿走了然后他用来干点什么坏事的情况但我自己去测了之后我不知道是我的语音比较特别还是说语料不太够还是现在怎么样我觉得反正很奇怪出来那个效果

很机械 根本就不像我所以我也就没拿那个东西上线就我自己的就没上线别人用了有些人说效果还不错但我自己就是觉得 但你位多一些或者你的辨识度够高的情况下对我觉得还是有一点怪怪的就好像我们现在是在正在做的播客节目对吧我们其实是

纯语音出镜的语音和我们如何去讲话如何去现场献挂一些东西其实都是带有我们个人的个性在里面去的随机性很大但是如果说现在有一个 AI 纯用了我的声音去读稿我总觉得哪里不对劲的样子让他听完我们一百多期节目作为语料之后

再看效果吧我觉得不然光几句话的这种只能音色上有一个模拟确实很别扭不是啊即便他学会我过去讲话的那个套路但是我们每天接触的信息是一直在不断的更迭的除非他能够学会我们去学习新东西的那个模式但我觉得这个是不太可能因为这个模式每个人不一样

就是现在的这一波大语言模型它的那个做法不是这个路数堆过来的所以我觉得它不太可能做得到这种方式它不是把所有网上可能可以用来训练的语料全部都堆到一起吗大力出奇迹嘛对吧

我自己去吸收知识的时候我又不会把所有的东西都吸收过来而且我们有很多时候不知道的对吧我们是慢慢的一个逐步了解的过程是的而且我们会说错呀然后最近短视频平台经常出现一类视频那很奇怪的就是底下评论都是这就是为什么 AI 无法取代人类

就是两个人好好说的话然后突然之间被拍的那个人就开始跳舞了然后他跳舞跳着跳着之后就跟另外一个人打架了打着打着他就躺到地上了然后就变成另外一个东西这不就是 AI 生产的吗跳跃的东西

不是 AI 生成的因为它是怎么说呢看上去毫无逻辑可言看上去没有任何联系但是他们通过转场通过一句话通过一个梗接一个梗制造了笑点就是这个确实是会让人类笑起来的东西但是可能不是 AI 能做得到的东西

对这个是很有意思的然后包括前阵子那个什么模仿阿三哥拍电影的那个什么游王那个真的是太像这种东西 AI 可能学不出来他这辈子都想不到这个肯定阵地也不正确了那咖喱味太浓了

但是呢政治不正确好像还从来没有政治到印度那边去说不人家人家已经在举报了所以还好笑死啊已经在举报了啊但 anyways 这个跑偏了哈但是是这样子的哈我们从一个 AI 实时通话啊聊到了这个程度但期待吧期待未来真的出一个可以跟我聊天的又能够视频通话的一个真 AI

我发现我可以跟 GPT 去语音聊天聊一段时间但是聊过一段时间之后大概率它会出现两种情况一种是它发散到我们一开始聊天完全不同的主题上面去了

就一开始我可能跟他说了我们今天可以聊某个主题但他不知道跑到哪里去了另一种就是他有一点套路化他不像一个正常人正常人可能是假设我们不熟悉我们多聊两句然后我们互相熟悉了我抛弃问题你抛弃问题然后我给你点东西你给我点东西但 OpenAI 几乎不给我他的东西所以他不可能跟我说

是的因为你没办法了解他他自己也没有这样的一个设定你懂吧正常人聊天你会去了解对方是个什么样的人但是 openAI 你没有办法去了解他是一个什么样的 AI 这是一个非常大的问题没有对自我的这种表达于所以我觉得他除了说支持实时通讯之外还有模拟形象之外他还需要给自己一个人设才行

否则他没有办法做一个陪伴聊天机器人而且这个人设得极其丰富你这个提醒到我了我就想去试一下了我说你是一个比如现在不是这个 MBTI 很火吗你就给他灌一个这种进去你说你是一个什么 ENFP 的人然后你跟我聊天怎么怎么样是不是会比那我觉得这个可能会比他通用的那种要好一些至少有一个人设我不知道就是这种可能会比较浅可能多聊两句立马就露馅了

我猜的但根据我跟他聊天的经验来说应该是这样子的就是一开始你们说的好好的后面他可能就露馅了不是前段时间有一个那个卖言卖语的那个 AI 的模型吗就是模拟这个麦麦的说话的方式去 PV 你或者怎么怎么样你

对比较搞笑但他的语料太少了他的套路就那么几个聊多了就没了是啊如果你的面前是一个真正的麦林你们除了聊这种特别表面的东西你还可以去了解他到底是一个什么样的人你还可以问他为什么在综艺节目里面是这样的一个表现你私下是怎么样子的对吧你讲出来的话是真心话吗你们有脚本吗其实好多东西可以聊的但你发现你跟 openAI 是不能聊这个东西因为他没有也没有名字所以你这个话题是

永远没有办法真正的深入下去的但它倒是有个好处就是假设你根本对它毫无好奇然后你借助它来了解你自己这个方向倒是有可能可以一路往下走下去的因为你根本不想了解它但你可以让它反复不停的打破你的那个认知局限去了解你自己这个倒是有可能我记得好像是 OpenAI 的某一个分析师什么什么有说过说

未来 AI 语音助理可能会比我们自己更懂我们自己想要的是什么以及我们在这一刻的诉求可能是什么因为他太习惯你的你日积月累下来这种习惯他都数据化了可能这块是一个比较有希望做的我觉得不一定因为人类不知道自己想要什么是一个常态是一个很正常的状态 AI 是不是比自己更懂

我觉得按我现在对这些大语言模型的了解肯定不会就不是说这种很大的小小什么比如下午我想吃饭的时候我就问一下我想吃什么他可能比我知道这种小事情这种小事比较明确的具体的可以收敛的我觉得倒是有可能但是 AI 比我更懂我可能我觉得还真不一定算法可能比 AI 更懂我这个东西本身就很全妙了

对这东西很玄妙因为人类都无法去定义什么叫懂什么叫不懂我们既然都无法定义那就也就无法评判到底是不是真的懂了我是这么想的 OK 我们光聊这一坨就已经聊了一个小时出头了这样我们把第七天第七天的也聊了然后接下来就先收尾然后再另开一期去讲其他的好的好的好吧

OK 第 7 天也就今天发布的就 TrackGPD 终于有 Projects 了这个是有点离谱了他我这这 Cloud 都已经发布那么多那么久到 6 月份就有了他到现在才发布是啊 Projects 是很好用的就是我们

对你说文件夹是非常合理的他大概就是我们去跟 GPT 聊天的时候虽然他有 memory 会记得我曾经聊过什么但是呢有时候我跟他只是专注想聊一个事情那这个事情我们可以作为一个 project 这个 project 呢我可以给他传 pdf 可以传 tst 可以保存我们过去的聊天记录可以传我的代码可以传我正在写的 block 文章这些都可以作为我们这个 project 的

一个训练的语料然后在这个 project 里面我们去深入的聊天那我们的上下文是一直在的这个是非常非常好的我举个例子我之前跟 Cloud 在聊一个小项目的一个数据库设计然后我跟他建了一个 project 之后其实我就可以把很多相关的数据都给他了下一次我再跟他聊的时候他就会懂

你上一次设计过一个数据库的一个表结构是怎么样的那么接下来如果你想要实现一个新功能你可以基于这个设计再往前去做否则你要从头跟他再讨论一遍这个是很讨厌的一件事情对

你记不住那么多细节的关键是而且你对一个通用的没有细节的前提下去跟他讨论的话他总是会给你那些通用的没有什么意义的初级答案然后你再反复问他多几次他才会给你一个有用的东西所以其实 project 我觉得是大大提高了我们和聊天机器人之间的一个聊天效率今天这个更新是这次七天里面我觉得除了

前面的 Canvas 以外对我来说最有用的一个更新然后之前我跟他的对话里我经常会丢文件或者图片给他其实文件和图片分两类一类是绝对不会改的就是一些我要让他了解的这种文件另一类是我其实在请教他怎么去改的比如说一些小的脚本

那这两类东西前一类我就可以把它作为一个项目里面的固定文件传给他我传 Jason 给他然后 Jason 里面有很多的字段我就不用每次跟他解释解释这个字段是什么东西然后他另一个就是这个 project 的文件池右边不是有一个全局的 prompt 吗

这个也太好用了我现在把那言简意赅四个字就是我经常会跟 AI 说这四个字就丢在这的我说禁止杜撰不用强行给内容没有就不给逗号言简意赅然后放在这但我在这个 project 里面去新建所有聊天的时候 AI 都是被我调教过的

然后我还建了另外一个 project 也很好玩我给这个 project 叫 JSON project 我规定他跟我说的所有的话必须是 JSON 格式的只能够 JSON 对然后我跟他我往里面敲东西的时候他就知道我要干什么比如我敲苹果两个梨子三个然后出来的就直接是一个 JSON 然后 fruit 然后 apple 什么什么的

就不用再废话了真的很好用对所以你说的这个就是他 project 里面的那个 instruction 的那个功能相当于是一个全局的一个 prompt 我们就没有必要每一次都跟他再讲一遍他可以记住然后以后当做第一次的 prompt 自动的输入这个确实是相当于一个全局设定是一个非常好用的东西

所以这个是 Day 7 然后还有两条 AI 的新闻一个是说同意签问阿里的 QWQ 也是发布了号称 MAS 的测试是超过 OE 的号称看看就好其实之前不是我们看过很多家模型把自己的单向拿来跟 OpenAI 打然后大家合起来去站这样一个大魔头吗看看就好对

倒是反向可以看到我们国内的这个 AI 大模型依然大公司还是在卷大模型的然后虽然我自己的体感上还没有找到一个好用的能够跟 4 欧或者 Cloud 3.5 去比拼的这么一个模型但至少看到他们还在不断的去变好那就 OK 了那就等等看蹲一蹲对

但国内现在是另外一个市场它是因为其他的进不来所以它就自己卷自己现在已经开始打价格战了于是另一条新闻 36 克说的字节内部判断 AI 对话类产品天花板可能不高于是它要提升剪印的吉梦的优先级

之前剪映为了做 AI 的这个产品狂招 300 个 HC 然后后面那个降本真效又砍了一堆人这个不知道他们现在不是还出了一个是吧那个污染模型这个什么什么的事情吗那个是另一回事那个跟剪映倒没什么关系那个是字节大模型的一个实习生然后那个实习生还挺厉害的忘了是哪个学校好像清华之类的反正心高气傲的就反正各种各样的那个是一个花边新闻了

但是现在他们内部判断是对话类产品天花板不高这个我倒是觉得合理因为现在训练大模型的成本巨高无比也不是所有人都烧得起关键是你那些卡国内想买也买不到很多时候当然我们如果国内的大公司只跟国内大公司比的话这个还是问题不大的反正大家都买不到谁有钱谁能够买到最好的卡就好了

但是你这个东西确实不好落地就现在在国内至少还没看到一个特别好的一个落地场景但我们现在已经能看到深层视频的简英这边的创作者场景应该是很稳是的

是有一些可以出现有趣的内容的苗头了我最近有看到一些用 AI 生成的视频它就是一些比较搞笑的视频一眼 AI 一眼假但是它未来是不是有可能成为一种风格独特的内容也未可知因为你不一定要走一个纯现实路线你也可以是像那种小人偶或者微缩摄影的那种泥塑的定格摄影的那种风向

对你只要能把创作者他的内容表达出来就好了对创作者来说这个是一个工具我可以是一帧一帧去拍我也可以是用 AI 来帮我去把我本来想要表达的故事给说出来你这个让我想到了 Soro 发布的时候我对于他的成品其实没有那么满意但是他的编辑器很酷

你可以写这种导演一样的分镜了第一幕比如说有一个地上长出了一朵花然后花上来了一个蜜蜂这是两幕然后你可以规定第一幕的时间是两秒第二幕是两秒还是第一幕是一秒第二幕三秒你把这个轴拉好这个视频就出来了这个编辑感觉就让我想起了简易里面就是这样去剪视频的只不过我在剪之初我要做一个叫导入的操作但现在没有了

Solar 直接生成了 好屌啊对于创作者来说真的是非常好的大礼好而且再加上我看到他们现在已经是能够支持你给一张手图然后他根据这个手图去续着创作了所以我在想他现在不是每次生成的视频都很短 20 秒 他最多支持 20 秒好像 20 秒那已经挺长了以前是 3 到 5 秒那么短的一个有点像 gif 的一样一个图片我在想他支持了这个根据手图创作的技术之后只要他跑的不是太偏

加上你刚才说的那个交互它可以先生成三到五秒然后呢这第五秒我再写一个新的对然后它就往后拼往后拼往后拼这样它就能拼出一个一分钟的短视频还是能够表达一些作者要表达的东西的我觉得确实是有可能可以去尝试一下走一个不一样的赛道毕竟你看其他的 OpenAI 做的都贼好就是这个 Sora 现在感觉是

是有点辣你看可灵像皮卡他们做的都挺不错的我觉得是可以去尝试一下对于字节来说好像马斯克转了好几个这种 AI 创作的视频都是可灵做的中国的人可灵做他装然后还有一个这段时间不是你刚说很流行有一些 AI 的短视频吗我看到了一个挺有趣的就是他把你的卷发的样子给你弄出来很长的那种自来卷是一瞬间生成的第一刻是你然后后面

一头的卷发然后毫无违和感然后很多猫猫狗狗也可以做小鸟也可以做就这个还是能它是静态图片吗还是视频视频你拍一段视频然后这个视频里的那个人会长出自己的卷发而且那这种倒是可以作为一个

社交爆款就有点像之前那些什么把你的脸变老之类的那种就很适合剪映的场景因为创作者就是每天想要有一些内容出来然后有一个玩的 mode 玩法而且对于剪映这样的一个工具来说他背靠的是字节和抖音他根本就不 care 我这工具本身赚不赚钱你说你纯做一个工具的人那好歹还得想想别人怎么付费就像美图对吧

美图秀秀他搞了一些 AI Feature 的现在 AI Feature 可以帮你除了美颜还可以改表情啊什么变老啊变年轻啊之类的这些他是可以考虑工具付费的但剪映完全不用剪映只要让整个抖音生态变得更好就好好那么一个多小时了哈我们先把这一期结束了结果这一期基本上就变成了 OpenAI7 天的一个 review 了对然后

我们暂定是这一期还是个科技快乐星球不一定是这样了到时候我们准备要发之前我们再来重新想一想科技快乐星球也可以那这样我们可能就得连着出两期科技快乐星球上期和下次

对行那我们这一期就先到这里然后剩下内容我们会再录一期第二期好的 OK 那么以上就是我们本期节目的全部内容了如果你觉得我们的节目还不错的话呢请不要忘了给我们点赞转发收藏你们的关注就是我们更新的动力 OK 我们下一期节目再见下期见拜拜