We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Vol. 138 科技快乐星球34:WWDC25在即,吉卜力风席卷,AI协议加速

Vol. 138 科技快乐星球34:WWDC25在即,吉卜力风席卷,AI协议加速

2025/4/13
logo of podcast 枫言枫语

枫言枫语

AI Deep Dive Transcript
Topics
Justin Yan 和 自力 hzlzh:我们讨论了最近AI的快速发展,以及特朗普的关税政策对全球市场,特别是对苹果公司供应链的重大影响。苹果为了应对关税政策,紧急空运了大量的iPhone到美国。我们分析了这一事件对苹果公司以及全球经济的影响,并对未来走势进行了预测。同时,我们也关注到iOS 18.4的正式推送以及Apple Intelligence中文版的上线,但对Apple Intelligence实际效果表示担忧,并期待WWDC2025上苹果在软件方面的进展。我们认为,苹果在AI领域面临着巨大的挑战,需要在软件和硬件方面做出更多努力。

Deep Dive

Shownotes Transcript

风言风语 听见科技人文的声音 大家好 我是 Justin 大家好 我是自立科技快乐星球 最近我们的节目排的还挺节奏挺紧的 努力的给它录起来 努力的给它播起来听众朋友们可以期待一下我们接下来的节目大大地优

其实根本是安排不过来有几位嘉宾是约了但是还让嘉宾等了一段时间这个确实是不太好意思就我台今年的这个安排确实是有点怎么讲前几个月有点太放飞了前几个月太浪了结果浪着浪着现在不得不补救回来

好不管怎样最近三月后 AI 也是在月底就是在前阵子清明节期间发生了很多事情清明节前是这个 AI 有一波新的发展然后清明节期间特朗普又在搞事情搞出了一些特别大的事情

所以今天东西还是挺多的我们直接进入今天的科技快乐星球首先是特朗普在前两天就宣布对全球所有国家包括只有企鹅居住的什么什么岛也征收所谓的打引号的对等关税然后导致全球的这些

整个市场就被扰乱了起来了乌庸置疑就是股市也大震动震动相当震动简直就是烽火系诸侯当然我们是猴子我们也不是诸侯黑天鹅

是那这个苹果呢所谓的跨国企业尤其是利用了全球供应链的这些公司呢受影响是特别重大像苹果它现在在全球采购的所有的这些零件最后回到美国的时候其实都是要收一笔关税的这个就

问题很大所以苹果呢紧急连夜空运了 N 多这个 iPhone 我看有一条新闻说的是几千吨 iPhone 然后现在我们正在看的这条新闻是说 How Apple Threw 5 Flights Full of iPhonesFrom India and ChinaIn 3 DaysTo Beat Trump's Terrifics

等等这个词应该怎么念新政策新政策然后呢他是从印度和中国都运了一大波 iPhone 回到美国准备要去在美国囤一些货还记得不以前曾经库克这个去库存之王哈哈

他说库存是万恶之源在这个新政策的紧急阶段他库存不再是万恶之源了主要是这次这个调的幅度太大了基本上把硬件的这个利润挤压到没有了你如果以这种关税的方式去对

那你连夜租飞机这种事情我觉得还是划算的好像租的是波音的 73 级那种很大的客机来运 iPhone 就很过瘾这个咱就不懂这个细节了但是呢你说拿客运机来运 iPhone 这个好像有点有点魔幻但如果真的是属实被他逼成这样哈哈哈哈

只能说苹果行动力还是很强的对吧政策早上刚出立马就开始运 iPhone 这还是挺好的至少美国的消费者们在近期可以维持 iPhone 价格的平稳但是我们众所周知今年 WiFi 快开了秋天也快到了秋天到的时候苹果是要发新的 iPhone 新的 iPhone 可没有办法提前运回来

所以接下来这个世界会什么样的走势呢还是得看 Trump 他接下来到底是要搞成啥样对就是我们有没有可能见证史上最贵 iPhone 的诞生对吧不确定我觉得像苹果它如果真的要死扛的话它应该还是能扛个那个价格不要长得太离谱了

他是可以往上调一点那个价格但是可能对他这个利润空间就会被挤压的非常的离谱但是呢他这个我看分析说主要影响的还是美国人民在海外的话其实是不受这个东西的影响的所以川普出台的这个政策直接让美国人民成为待宰的羔羊这个是嗯

我在想啊不是以前十几年前经常买水货对吧买日本来的香港来的美国来的水货有没有可能美国人民接下来也得去搞搞水货了用国行他拿到了国行还是双卡双待说到国行下一条新闻是这个 iOS18.4 正式推送了 Apple Intelligence 支持中文版当然这个所谓的支持中文呢

其实还是得非中国大陆在售手机才能够使用的如果你有一台澳洲版的美国版的日本版的香港版的你就可以去使用到这个功能不够众所周知 Apple Intelligence 的代名词是 Silly 这个 Silly 就是还是那么的 Silly 然后显然是不好用的虽然说整个交互看起来很酷然后整个细节做得也很好但是 AI 的效果它就是不太行

这个好像一时半会也没有什么特别好的办法我们期待一下看这个 WWDC25 就是今年的 WDW 它到底能够在软件上面推出一些什么样的进展出来之前在 Vision Pro 上面它不是发了个期货吗就说明年我才出嘛

好歹 Vision Pro 是顺利出了但是 Apple Intelligence 到现在可以说还完全没有达到当时它在发布会上所说的那个预期反正我们看现在苹果它发出来的这个 Apple Intelligence 其实在去年它发布会题的时候呢

我是蛮惊讶的你还记得我们当时在他发布 Apple Intelligence 之前我们还在讨论说苹果入场已经太晚了而且他现在去做大模型肯定是赶不上的所以当时他们还在想是跟 OpenAI 合作还是跟 Google 合作对吧当时是这么说的结果最后他跑出来一个所谓的 Apple Intelligence 想要做平台

你们去竞争大冒险我不跟你然后就先跟 Chad Gpt 去合作了嘛然后国内跟谁合作一直都是一个谜嘛

然后前阵子就变成阿里合作其实我觉得它是两个部分一部分是缓兵之计你们先用着然后我自己去做我的我做好了就把你们吃掉另一个部分是他真想做平台这样的话他可以成为所有人的一个流量分发一个入口也是一门生意也是在这里面走出一个跟别人与众不同的道路这两个思路都挺好的可惜到现在已经 2025 年 4 月了

已经距离 DubDub 还有一个多月没有意义大水果感觉岌岌可危

还是期待一下是的再加上大水果最近因为关税的这个事情大家也可以看到这几天美股的这个股价过三车之后又过三车对吧对一下掉到低谷一下又回弹了一下这里面呢最近的这个动荡是极其的动荡然后苹果呢面对的这个挑战也是格外的严峻不知道 Cook 在这里面遇到这个危机是否能够顺利的去解决内忧外患真的是

太难了所以接下来一条是说苹果的 WWDC 2025 是宣布将在 6 月 9 号到 6 月 13 号举办就在 Apple Park

然后结合之前说苹果计划要进行历史上最大的 iOS 和 macOS 的重新设计就是更玻璃了我不知道今年的会不会宣布一个看起来更大的重新设计反正我们从官网露出来的 logo 来看应该是大量启用了这种就比较带颜色 colorful 的这种毛玻璃质感有点像 visionOS 里面的整个的 panel 然后

然后我也去看了别人的一些猜测和设计包括图标的圆角变成了纯圆的这种然后我觉得这个改动会更像我们之前看的包括像黑镜里面有一集我们看到那种卡片式的一个透明的手机里面呈现的那个操作系统会更接近我们可能概念中的这种未来科技的一个状态但真的好不好用看起来就是会不会接受不了这个还需要去实测

是很酷的但是呢这种由官方强行推的这个用户也没有办法说这就是 next generation 大家就给我用起来对你只能是不断地去骂他然后骂着骂着看他愿不愿意回去哈哈哈

对所以这个是苹果的 dubdub 以及接下来有可能有可能会出现一个重新设计但是这个还不太确定但我觉得整这种花活是不太能拯救苹果的股价或者说拯救回苹果的利润的接下来真的是内忧外患是比较麻烦接下来几个说法一个是苹果官方说 Apple Parts Marts

将支持无损音频和超低延迟的音频这个感觉它是直接软件更新完了之后就可以使用了然后这个东西到底好不好用呢这个咱也不知道呀咱也没买 AirPods Max 啊

我其实想买但是这台设备已经好老了它好几年不更新了我一直担心买了之后我就成为了冤大头所以我就一直没买我觉得这台设备是很适合出街的它的颜色还有它的时尚的造型然后戴在头上是很适合出街另外就是很适合在坐飞机的时候里面再放一个 airpods 外面再扛一个对吧 Max 为什么要做这种傻事就会更安静毫无必要

我直接买一个索尼或者买一个 boss 不就结束了吗也行我看他里面有个细节他说加入了超低延迟的音频也就是说我们此刻在录制节目的时候用的 AirPods 其实没有那么低延迟的音频对吧但是我其实没有那么强烈的感受可能要在一些特定的

场景下比如说其实是可以感受出来我们在那个 audition 里面去编辑的时候就已经非常明显对啊你要拿到那个英语里面看就可以看出来倒也不用看就是你自己去对时的话我其实也很久没剪了就对时的时候其实非常明显尤其是我连了一个 AirPods 我跟我的电脑已经有延迟了你跟你的电脑也有延迟然后我两个一叠加再加网络延迟其实还是挺恐怖的

这个实际上是挺大的这个起步就很适合我们主播去录节目的时候降低硬件上的延迟这个倒还好我觉得这个应用场景还不是在这里我猜测我也是拍脑袋猜测它因为支持了无损音频然后它需要一个更大的带宽更大带宽的话你看它是连了线之后可以有一个超低延迟音频我不太确定它是

怎么去做的他这里说游戏玩家和主播也可以受益那确实是跟主播有关但跟我们连线录节目可能还没有那么相关录节目其实要求没那么高对吧直播的那种直播主播如果你能够更低延迟的话效果会更好那确实子弹都出去了对吧但是一般来说这个直播到用户之间其实会有一个几秒钟的故意延迟所以我不太确定用来审核的是吗

但我觉得他这个延迟解决的应该还是主播在玩游戏的时候主播讲话和画面之间的如果是一个超高刷的然后又是那种什么 FPS 那种还是会有点用的

OK 但是主播拿 AirPods Max 来直播游戏好像很少见游戏主播不都应该是 RGB 吗花里胡哨的再配一个花里胡哨的椅子下面一条是内置摄像头款的 AirPods 或将于 2026 年量产然后另一条是说苹果正在研发带摄像头的智能手机推进 AI 可穿戴设备战略我感觉

这两头其实有点像的它在手表里面和在 AirPods 里面去装摄像头这里都在说什么可以通过增加了摄像头视觉信号然后就可以让 AI 就能够干嘛干嘛的我真的不太确定在这两个设备上面用摄像头

它的应用场景是否合适以及说以前我们知道那个 Human AI Pin 对在胸前的还有一系列的那些带有摄像头的东西其实它都会有一个隐私问题对吧现在我两只耳朵上面长了两只眼睛哈哈

还有一个性能问题耗电量就会直接上去前两天还看到有一个视频是两年前有一个坐地铁的小哥被人诬陷说他是在偷拍那个事情然后那个小哥打官司打了一年多快两年了到现在好像还没有结束然后那个事情反正给他的人生带来挺大的影响那以后如果我们每个人耳朵里面都有两个摄像头哇塞

坐地铁的风险大大的提高了再加上我手表上还有个摄像头 Oh my god 也就是说以后不止可以诬陷你脚上那个鞋子是摄像头直接把你的手表一抓你手表有摄像头把你耳机一摘你耳机有摄像头不得了

但 anyways 他们还是想尽一切办法在苹果的所有的硬件里面去跟 AI 做结合这个方向是很明确的而且 AI 现在已经不是说它是未来趋势了它就是当下的趋势了这已经非常明确了你看以前搞 Web3 的很多人已经回过来搞 AI 了我可以想到一个场景就是未来我拿到一个东西比如说我不知道这个东西是什么或者说我当前

的环境然后在户外温度是多少然后我对 AI 去发出 series 指令的时候我需要用我的耳朵去让他看你看他说我想要看到什么方面或者你用这个耳朵去给他看就会比用手机打开摄像头给他去看可能要方便

你说的这个那就跟 Human AI PIN 是类似的对就是它保持一个随时随地可以跟 AI 交流以及让 AI 长眼睛的这么一个功能但它又没那么刻意就 Human AI PIN 它是个纯额外多了一个第三方的设备就显得很刻意也不像说我平时手表本身就会在对

我认为像手表这种长时间佩戴的设备来做这样的辅助还是比较合适的但像 AirPods 的话其实戴久了的话耳朵会不舒服所以其实也不是所有人都长时间佩戴我相信佩戴的时间应该是远低于我们戴手表的

所以戴手表可能是更合适但戴手表的话就变成了我得把手举到某一个程度让摄像头来拍就跟接电话一样拿手表对某种程度上就可能还没有像 Humane AIP 那样那么的自然

但小米 AI PIN 它的问题也是非常致命的续航也不行 AI 也不行啥啥都不行出了个概念 anyways 就是我认为苹果它去在自家的所有成熟的硬件设备上面去往 AI 上靠的这个意图已经特别明显了

只是说现在泄露出来的这些就是加射像头对吧但也许他们内部正在实验一些其他的东西尤其我们知道苹果特别擅长在硬件里面去开发一些新的传感器对吧或者是应用一些其他人已经用的比较成熟的东西在他这里他能做到一个极致的体验所以可以期待一下未来苹果会在硬件这一个部分里面做出什么东西来

但如果是对如果真的是这么一个趋势的话那些正在做硬件创业的那些公司就要想一想就是正在做的这个项目如果苹果用它的用户量庞大的硬件包括 iPhoneApple WatchAirPods 还有 MacBook 来做那么你跟它的差异是什么

你能不能够在苹果的阴影之下长出自己的一棵小树对吧一方面要防止大模型的进化一方面还要防止苹果官方下场是吧

对对对但是我们这个除了大公司以外还有很多方面是可以去做的所以肯定也是有一些这种创新是苹果不屑一做然后还有很多小公司可以去满足用户需求的这个肯定是会有只是说不要去正面跟苹果刚了你看你现在如果去开发一款叫做 AI 智能手表

或者叫 AI 智能耳机就显得有点对吧你懂的没错就好像现在玉三家的游戏主机市场 PlayStationXbox 还有任天堂的 Switch 玉三家然后你现在跑出来说我凭空做一个主机就要跟他们硬钢是差不多这个感觉对吧是的

好下一个是 OPPO 它最近是发布了一台 Find X8 Ultra 这一台手机然后我也看到有不少的博主去对它进行评测不好的部分就是比如说它的整个手机从硬件到软件跟某个国外的手机几乎一模一样这个是不好的部分但好的部分是它的摄像头

巨大无比用的是一颗哈苏摄像头然后它的底是 APS-C 的底那就比 iPhone 还要大得多拍出来的手机画面那毋庸置疑你越大你的效果就会越好这个没有办法 iPhone 的底就是特别小的

可以很明显的看到像 OPPO 像小米都在出这种底特别大的手机那 iPhone 对吧它今年不是还得整活吗对啊 iPhone 一直觉得自己的摄像头是世界第一对吧虽然说 Google 老是说它自己比苹果好得多那今年 iPhone 是不是该整点活呢对吧对啊其实在摄像头这块 iPhone 拍出来的那个照片一直是说很引领这个

最前沿的调色还有各方面但是对于拍远还有夜间的模式我觉得真的不如很多特别国产手机什么山顶也是 VIP 这种我拿 iPhone 16 Pro Max 去拍夜间以及拍很远的东西的时候真的很糊真的比不上任何一台我随手拿过来的一个国产手机这点让我真的觉得很掉价

这个我觉得还是可以有提升空间的掉不掉价倒还好我比较关注的是手机本身就是当我想要拿它去拍照的时候它能不能够拍出我想要的那个画质还有画风对吧像你刚才说的那画风的话呢其实苹果的这个前置摄像头一直都是一个照妖镜哈

几乎所有的妹子都不会愿意使用苹果的自带的前置摄像头来自拍基本上都会装一个什么青岩相机啊或什么其他的相机来拍自拍啊苹果的原生相机前置摄像头就是很可怕的但是像 OPPO 啊或者是像 vivo 啊小米啊他们也会做一些轻度的美颜就主打自拍市场

那你说的这个长焦或者说拼这个底大不大其实也是其他 Android 的厂商在争夺的一块拍照进步的空间但是 iPhone 呢

它迟迟就像它那块祖传内存一样迟迟在这一块的升级没有那么的显著我倒是希望它今年能够出一些比较有意思的东西之前不是有一个 rumors 说 iPhone 想要出折叠屏吗对专利已经拿下了但我觉得这种东西它噱头大于实际

就是不排除有一部分用户他特别喜欢折叠屏我也觉得说怀旧以前那种日式的那种翻盖折叠什么摩托拉拉那种你会觉得挺有意思的但是有意思归有意思真正喜欢折叠屏的人数应该是不会说占到特别大的因为折叠屏它也是有代价的

你得在手机里装个铰链你的屏幕中间会有一个皱褶这些其实都是它的代价所以我觉得也不是说绝大部分人都会希望牺牲这个东西去换来一个折叠屏所以 iPhone 今年到底应该做些什么呢如果它不在拍照上面再去做进一步的提升的话我觉得是不太好的然后前阵子我出去玩出去玩的场景呢其实就你希望你手里这台 iPhone 啥都能拍既能拍白天也能拍晚上既能拍近景也能拍远景像你刚才说的

你就是会发现他确实啥都能干但是就是某些场景下他干的就是不行差强人意那个照片拍出来没法看的那照片拍出来没法看那这个事情就不太好了所以我就自己又买了一台相机我买了一台我以为是买的手机李光的 GR3X

就拿着这个东西用来补足 iPhone 的不足所以还有进步空间进步空间巨大所以我在看到 OPPO 的那台 Find X8 Ultra 的时候当时我看的是一个评测视频他就说你就可以把一台手机加一台相机放到你兜里了这个好像特别好但是其实我们现在是离不开 iPhone 这个生态的

所以在离不开 iPhone 生态的大前提下如果我还要去买一台 OPPO Find X8 这个就不合理了就变成了我还不是照样得拆两台设备

对吧既然我都得揣两台设备那我为什么不揣一台拍照更好的机器呢而是非要去揣一台我又不用它手机功能的一台拍照最好的手机没有必要嘛你还记得前段时间我好像在影视剧风海看到了一个 iPhone 的一个外设一个摄像头的扩展

对夹住之后就会变得很强你可以带着这个去又有 iPhone 的生态又有一颗好摄像头那个也没有意义就是你的镜头是解决拍摄的其中一个点但是始终你经过镜头了之后你的光是打在这个 CMOS 传感器上的那这个 iPhone 的这个 CMOS 它就是小那你相机的 CMOS 它就是大这个就没有办法大就是你还是配台相机吧是的

好那期待一下看今年 iPhone 到底能不能有一些新的进展我觉得手机这里面呢能卷的东西都卷的差不多了就是看镜头的这一块我看大家国内的都在卷镜头就苹果不卷还是希望它能够再进一步的可以可以好下一个部分来到 AI 了首先是这个吉卜力风格的 AI 图像生成就是 OpenAI 前阵子在上个月底的时候刚刚推出的这个功能

刚刚推出之后就掀起了一股风潮几乎所有的人都在用基图利生成的图片去发朋友圈这个非常明显的是首先基布利风格大家都喜欢宫崎骏大家都喜欢然后他又能够把一张平平无奇的照片变得特别的可爱变得特别的好看这个世界上绝大多数人都是普通人这个好看的可爱的

一定是少部分否则的话他也就不是好看和可爱了一旦我们所有的人都变得特别可爱变得特别好看那么依然还是只有一小部分人他是在这个特别可爱里的更加特别可爱这个一定是这样子的他一定是少数

所以你把它转成吉普利风格之后呢就是对于你原来的那个照片是一个巨大的提升于是大家就更愿意发这样的照片了对主要是这次吉普利风格带来的这个感受就是很多细节被保留了包括人物的神韵人物表情对应漫画化之后应该给哪个最合适 OpenAI 给到的这个答案非常的贴合就是让你觉得这就是我应该有的二次元的形态所以

太火了对他把很多细节都完美的还原了真的就跟宫崎骏在做动画的时候一样你看宫崎骏有很多动画他的实际场景就比如说那个什么天气之子对吧对他就到处飞到处飘那他天上的云和地上的景其实都是实拍的景然后直接照着画一遍的就那种感觉对吧

我们在用 OpenAI 新的 Ghibli 风格的时候往往就是有这样一种感觉以前的 AI 它往往会把字给乱写或者是把一些东西给瞎解饱生成但是这一次它给出的图像生成就基本上 90%能够 match 你的预期了你还记得有一个人他把指环王的分镜然后全部都做成了 Ghibli 的风格

一模一样就仿佛是本来就有这样一部 2D 动画一样的感觉所以这个太强像唯一的缺点就是配额太少了就每天用着用着就用不了了

用的用的用不了是的你刚才说的那个指环王那个动画确实是说明它生成了非常多张图片它是要截图然后一点一点的去生成然后最后合成一个动画的对另外就是你会发现以前也有人做这样的事情用 meet journey 之类的去生成但是它就是会风格突变但是在 openai 这个新的图像生成的功能里面几乎从头到尾风格都是一致的

保持住这个主角或者这个角色的这个一致性其实一致性一直是一个很大的难题对吧是的但是呢 OpenAI 解决的很好所以这个最后出来了之后呢也是深受用户喜爱同时呢也引发了各种各样的争议对引发了各种各样的争议就比如说像什么

宫崎骏老人家还在世呢人家还有版权呢然后你就这么去瞎搞人家对吧另外就是比如说像这个东西呢它虽然可以生成吉普利风格或者说宫崎骏风格但是它永远没有办法取代宫崎骏你得先有宫崎骏才有这个风格它永远没办法取代它不是个原创的东西另外就是

对另外就是像 OpenAI 它的生成图片的工具现在是集成到 4O 里面去但它单独的 API 是走 DALIDALI 的工具里面会说我不可以生成吉卜力风格的图片因为它是受版权保护的但是在 4O 里面它却生成了并且 Sam Altman 还自己生成了一个吉卜力风格的图片头像

他把那个 Twitter 的头像换成了这个吉布利风格的头像就相当的自相矛盾同一家公司出的不同的产品居然会给出完全不同的这个

结果以及像以前我用达里去生成什么苹果的 logo 啊 google logo 啊他都是拒绝的那如果现在我先拍一个苹果然后用吉布利生成这个是没问题的你单独生成苹果肯定可以但如果你用苹果 logo 去还是不行他还是有吃一些版权我有用那个影视片里面的局部去然后他都说不行然后我就不停的去矫正调整我那个照片直到最后他能生成为止他

它其实还是有一个版权检测的规则在里面其实还是有检测 OK 但是对于吉卜力风格来说这个东西它到底算不算版权保护呢对吧对这个就不好说了也不在这里讨论了然后最近我有关注它的那个 API 就是这个 create image 这个 API 大家也是都在关注说什么时候可以在 API 里去调用这样我就可以在我的 APP 里面去集成这样的东西了嘛

目前市面上很多的开发者其实用的是官网的这个逆向去做的这件事情其实就还用的 web 版所以我们很期待这个 create image 的 API 可以

迅速的用起来然后它就可以玩出很多的花火了嗯挺好的而且它其实基本例子是这是出圈的其中一种风格实际上它的这个 AI 图像生成能力反正就是比之前是又上了一个台阶以前我们生成这个播客封面有时候会生成一些播客封面哈

的时候你去跟他讲是没有办法讲过于赛国朋克了要求他但是现在他就可以知道说我想要把其中那个恐龙头上加一顶帽子这种东西他现在是能实现以前是不能的就挺难搞我现在用的最多的是给两张图就是说按照第一张图的风格去生成第二张图效果非常好就是你不管出什么样的这种风格仿照他给到的这个答复都是我想要的东西

对然后这个东西就可以用于出海电商的商品的转换然后就又干倒了一大波做这些的创业公司做皮圈图的这种运营团队对它可以现在来说可以代替 60% 70%的工作了但是如果你想要做一个正儿八经的

特别专业的工具那些锤类的工具依然还是有极强的生命力的就比如我刚才说出海电商的那个商品图他们很多时候会从国内进一批货比如说电动牙刷或者是衣服的那他可能出商品图的时候先找一个模特然后跟他说把模特身上的衣服换成我右边的这件商品然后他就得到了一个模特图

这种东西其实之前就已经有人创业在做这个项目了我觉得未来像 AI 创业这个东西如果你做的内容是我说的出海电商这种比较垂类的你解决的其实并不是说

生成图片这件事情而是你附带的解决了很多他在做出海电商的时候所要去解决的特别繁琐的那些功能生成图片只是他最后的一个结果但中间的你解决的所有的那些繁琐的步骤是这个项目能够活下去的特别重要的一个原因对吧 流程跑通了对 但如果这个项目

它跟 OpenAI 没啥区别它就是来了之后给两张图然后自动生成那这种东西就绝对会被 OpenAI 所替代所以一定不能够做那种特别通用的一定要做成一种锤类的特别是锤和砖的是的否则的话就这个生存空间确实是担忧你看这个各大厂商能力突飞猛进很多的小公司确实是应该要瑟瑟发抖的

下一条是 Google 推出了 A2A 开放协议然后就想到了之前是 GitHub 是推出了开源的 MCP 服务公开预览版然后 Answerping 是推出了那个 MCP 协议然后 OpenAI 是 adopt 了那个 Answerping 的 MCP 标准越来越多这个标准就出现了前段时间就是热火朝天的这个 MCP 的这个热潮就是基本上就

各种公司工具平台都在陆续支持和接入然后这样 MCP 服务相当于说来了一波给 AI 去访问和调用各种能力的一个浪潮然后现在 AI 越来越强了我又去看一下谷歌推的这个 A2A 的开放协议

然后他在他的官网上已经写了非常多集成他的比如说一些网盘 box the night 还有像一些云端服务器的这种服务商感觉后面 AI 的这个 AI agent 的这个能力会随着这个协议的推出会变得越来越多样性就是我们可以让他调用的工具链会越来越多这个是这个协议非常好的地方

对现在就是各家都在做自己的模型然后我们发现各家的 API 基本上跟 OpenAI 大差不差把域名一换就能直接复用现在有了 MCP 协议以后可能我们有一些更加标准化的东西可以去做了另外就是 Google 走 Agent 的路线 Agent 之间可以互相协作起来也是一种路线

这个阶段就有一点像还是比较早期的一个探索阶段然后各个大公司开始打引号的所谓的制定标准打出来的大旗是为了大家好其后面的目的大家心知肚明就像那个 Meta 发布的那个 Lama 是一个道理

但是总的来说对于 AI 接下来的发展它肯定是一个好事对吧各个不同的团队和各个不同的 agent 还有 model 还有各种各样的服务是可以去给它串联起来这个是挺好的要不然的话现在模型多起来然后 agent 多起来也是挺痛苦的尤其是没有 A2A 之前我记得各家都是自己做自己的 agent

好像没有什么是可以互通的如果一定要互通的话可能只能走私有协议但我对这块研究的不多我只是这么一个猜测既然有了开放的协议以后大家再去实现自己的 agent 去接入别人应该就会容易很多

虽然还没有到什么所谓的 TCP/IP 或者 HDP 协议这种这么牛逼的级别现在我们上网不都是用浏览器里面打一个 HDP 对吧就可以访问了这就是一种底层特别实用的网络协议虽然 A2A 这些还没到这个级别但希望未来应该会往这个方向去走没错

下一条是 Gemini 2.5 Pro 版深度研究功能上线大家都开始做深度研究功能了这个还挺好的我记得 Gemini 前段时间没多久发布了一个 Flash Experiment 然后它也是具备纹身图能力且

他的纹身图能力是跟 4 欧的那个新能力是相对接近我当时相对接近但是大家做的东西不一样被狙击了我想说对吧又石沉大海了被狙击了还行吧还行吧当时 Flash 那个 model 呢我去试了一下就是让他讲一个 story 是完全没问题的

当然现在 OpenAI 4.0 肯定也可以就是对你让他生成一个绘本或者生成一个连贯的故事四格漫画就像老夫子那样是完全没问题的然后你看现在大家都在做深度研究功能我最近一次去日本的时候我是让 OpenAI 的 chatGPT 点了一下 deep research

跟他说我想去日本然后现在有几个不同的线路你帮我看一下我出发城市我多少人准备去几天然后他就在那里咕咕咕咕咕在那里跑了好久大概跑了十来分钟他帮我查了机票查了酒店查了怎么玩查了飞多久几月几号什么然后线路怎么安排全部给我咕噜咕噜生成出来我觉得这个做的还是很不错的而且虽然现在给出的结果还不是很靠谱哈

你知道 OpenAI 从很早以前就开始 demo 旅行助手的能力到现在来说还是不靠谱但是我觉得随着 AI 大模型能力的升级未来应该会越来越靠谱而且你看 Deep Research 这个功能是 OpenAI 才出来没多久是在春节期间我记得是 DeepSick 先出了之后

然后 OpenAI 很快的就直播发出了一个 DeepResearch 然后现在 Google Gemini 也出了那相信今年应该会有更多家的厂商跟进都往这个方向去迭代不过谷歌是有它自己的优势在了搜索对吧自家的搜索引擎自家大量的这个数据库可以去用那它搜出来的这个 DeepResearch 的结果可能准度也好质量也好都会更高这个是我会想要选择它的一个原因吧嗯

是的所以我觉得后面这几个不同的大厂或者说这几个不同的大模型背后的公司他们应该是各有所长比到最后就是拼硬实力是吗拼老本

就各有所长各自解决各自的问题就好像那个 Anthropid 他的 Cloud 他就走写代码路线 GPT 确实写代码就是比不过 Anthropid 他就是写代码世界第一以后 GPT 如果说搜索不是世界第一那就干点别的世界第一你说到这个 Cloud 3.7 写代码这个事情我最近把 Cursor 里面的模型因为上次听图大鼎说他最近切到了那个 Gemina 2.5 然后我也切了

感觉还行我还在比较你可以试试我是还在用那个 3.7 代 Thinking 的然后如果开了 Max 的话那个钱就划拉拉的流了我开了一段时间受不了太贵了是有点贵但我觉得现在 3.7 是比较符合我的预期的 3.7 以外的我都还不是很想去用但是我觉得是要看那个任务的复杂程度最近不是流行一个词叫 Vibe Coding 吗

就是跟着你的感觉你就让 AI 去帮你写代码意识了解代码你想到什么就写什么然后完全不要去管代码质量这个代码写出来是不可维护的你也没有关系你全部就选 assign all 当你的代码出现 bug 的时候让 AI 去修 bug 它修不了那你就绕过这个或者你就不要这个功能了你换一个功能太佛系了这个 vibcoding

我一开始觉得这个概念出现的时候是有点像在开玩笑但我看有不少人都在跟进去模仿后面我就想确实其实有很多项目它

他真的不需要说你未来要有多么好的可维护性他很可能就是你做着玩的他的定位就是一个纯玩具或者就是一个完成一件特别简单的单一的功能你未来也不太可能给他迭代更多的东西那这种时候呢释放你的心情

享受用 AI 创造东西的乐趣就好了对黑盒编程就忽略掉里面 AI 给你到底写了多少冗余的代码但是就特别像有一些 Python 的脚本还有一些这种特别定向的工具你可能就用一两次

可能这个项目本身最重要的是这件事而不是实现的这个代码对吧对我觉得 5Coding 可能对于不怎么写代码的人来说接受程度会更容易一点像如果长期写代码然后对写代码又有点追求的话可能一开始是比较难以接受的代码一开始就处于比较难以接受嗯

对但是我刚才在录音之前我就在写一个比较小的脚本是用那个 browser 的那个 temper monkey 写一个简单的 script 想要去一些网页提取信息对那这种东西我也不可能维护它呀那我就能爬到就行是吗爬虫只要有结果能用就行代码怎么写我不管确实就非常适合好那

跳过中间这一大坨我们直接来到密尊你发布了 V7 模型架构全面革新文本理解显著提升会不会是对 4 欧的一个回应呢我不知道但是现在 V7 呢它的交互是更接近自然语言交互了也可以理解说给猫戴一个帽子是什么意思了而且画质有了更大的飞跃另外就是它整个的画风是更趋近于真实的画风以前其实密尊你经常产生一些特别魔幻的东西嘛

什么粉红色紫色的沙滩什么那种很梦幻的那种风格其实我是有点受不太了的然后整个审美转得更加真实了之后我觉得会比较符合我的审美但是 Midgeny 它以前比较不好的就是你得去想一些办法去写它的 prompt

密真你的 prompt 想写好是没那么容易的对吧对但是他 V7 发布了之后呢整个的 prompt 写作难度是大大降低了你只是写一段简单的描述他可以帮你扩写成一个比较专业的 prompt 对其实密真你他最大的竞争对手还是 Stable Diffusion 这样的

自建型的这种绘图服务然后它最大的问题还是一致性的问题就是你前后两次给到的东西然后出来的这个主角也好出来的物品也好它就是会有或多或少有些找茬就可以找到的找不同

这个其实一直他的一个硬伤所以他只能够生成单张好看的图片他生成不了连续多张不过他后来一直在解决这件事情就是对于一致性的这个事情上就是有点像这次吉普利的这个风格控制那在同样的风格的参数下同样的东西会得到同样的结果这样来保证这个一致性还是可以的对这个还蛮重要的我觉得特别重要这个特别重要

反正现在各种 AI 服务百花齐放跟我们前两年开始聊 AI 的时候相比这些已经是越来越成熟了越来越好用了我们日常也有点离不开它了有这种感觉另一个感觉就是有点用不过来了现在找几个成熟的就一直在用我最近还有用字节的吉梦

吉蒙也做的非常的强大里面有魔幻风格的有现实写实的有人物的不同的这种微调模型有点像那种 Lara 微调模型这种然后做出来的社区里面的图真的很不错他每天还送一些点数我当时就觉得说那对于没有办法去使用到 OpenAI 这种网页端服务的那也是一个很好的选择确实是太多了我觉得是这样的就是

现在都在做大模型的那些厂商他们的同质化是比较严重的大家的交互差不多要解决的问题差不多实现的效果差不多当然是有分梯队但是在单个梯队里面大家是有一点差不多的然后甚至价格都差不太多

但这种时候确实就是你习惯用哪个你就用哪个就好了如果你想要比价格也可以那你就选个便宜的去用也可以但我相信接下来的竞争应该慢慢的会变成毕竟这个东西是巨烧钱无比的一个服务来的你生成一张图你就得花好多好多资源

所以我相信接下来应该慢慢的就是有些竞争不过的就被淘汰了然后留下来的就是你还能活下来的你就会一直活下来对你还记得前段时间我们有一条新闻是 OpenAI 他们要把这个 Pro 啊 Plus 的费用进一步提升嘛提高嘛我现在就觉得说

目前这个 plus 就不太够我用因为我平时用的最多的就是拆 GIF 器了然后它那个图的配额就是不够用的我觉得我可以接受像 Cloud 一样单次去付费就比如说我此刻没有配额了你说我生成这张图要花比如 0.2 美元或者怎么样我是愿意直接用 API 去支付的对但没有目前还没有这个功能就是直接说你用不了了

他现在就是只有套餐没有说套餐外还给你叠加流量包但我有点感觉就是他现在量还是太大然后成本是 cover 不住的如果给你流量包他会亏得更厉害烧的投资人的钱烧的微软的钱可以行好下一个这个英伟达

英伟达的下一代芯片 Ruby 即将登场现在预计是 2026 年会暴赚 2370 亿美金

在现在这个时代呢英伟达这种无可替代的卡商确实他是有着无与伦比的优势但也不是说其他的卡就不行除了 Lubin 和 Blackwell 之外呢其实像英伟达的中极端卡卖的也不错然后这个 NVIDIA 的卡卖的也不错对吧 NVIDIA 还兼容了 CUDA

只能说在这个时代 AI 这种特别重要的弹药还是很好卖的不知道还能卖几年反正前阵子也在说 OpenAI 要投资新的核聚变能源现在能源也成了 AI 发展的一个瓶颈这个确实是万万没想到的

然后 DeepSeek 的优化是做得不错我在想硅谷有没有可能这些公司也有动力去做这部分的优化猜测应该还是有可能的不然他们的故事说不下去对之前的故事是说我需要很大量的资源所以我需要投资但现在 DeepSeek 的优化做得很好就忽然发现你并不需要那么多的硬件你应该可以优化一下的为什么不去做一些优化所以我想可能接下来

硅谷的这些大公司也应该会有一部分的精力花去做优化这件事情上 OK 好那前面讲了一堆都是关于 AI 生成图生成视频以及怎么商业化的这一些事情那 AI 其实呢还有一个新的突破就是 UC Berkeley 的那个分校这个研究团队开发出了革命性的 AI 系统

可把瘫痪患者的脑电波转换为自然语音而且是保留了他原来的那个声音的特征那我觉得保留原来声音特征这个应该还是比较好做因为现在有大量的那种模仿你声音的服务嘛对那他现在比较厉害的是把脑电波转化为自然语音

这个部分我好像记得之前我们在聊脑电波控制鼠标的时候有聊过就是现在的技术相对来说还是比较早期和初期大量采集你脑电波的信号然后去做一个类似近视的找规律深度学习对模拟

那这个东西呢其实 AI 基本上就是这样子的所以我觉得用 AI 去做这个事情是早晚的事情它就应该是这样去做而且马斯克去投资那家新兴打乒乓球的公司好像也就是因为他也是用了 AI 的技术去做所以现在 AI 的技术越来越好那我相信像这样的 AI 造福人类的突破应该要多点来才行

对像脑机接口这一块先在医疗行业然后后面可能慢慢的会到更多的到普通人都可以去享受这样的一种新的外置设备其实用意念在很多的影视剧包括动漫里面都想要用意念去控制一个东西而我们这个意念的东西现在通过 AI 的深度学习之后是可以被实体化成不同的任务拆解了比如说我想要往左往右还有以前演动仪这一块我觉得都可以利用 AI 这一波的能力

来进一步的发展在这个程度上 AI 解决的是一个算力问题就是我们生物信号其实它的计算量是远大于我们现在那个电脑的 0101 的那个计算它需要大量的这个计算资源同时呢它要需要占用很大的贷款

这个在以前是不可实现的但 AI 可以大大帮我们解决这个算力的问题然后现在是把脑电波转换为语音助力发声马斯克之前那个项目是脑电波转换为可以动的可以操控的这些其实都是助力于这些瘫痪患者这些都是非常不错的而且这个做得好的话未来它的应用场景就更大了一方面是造福 disability 的人士另一部分是

普通人也能带上这个东西获得超能力这个也是未来可以去扩展的东西以及最近不是黑镜第七季回归了吗咱就先不要剧透我还没看呢刚下载了没看

对还有很多人没看所以咱就不先剧透但是跟这个也是有点关系就是未来肯定他也会去聊 AI 黑镜绝对离不开 AI 但是黑镜会去做的是揭露这些所谓的最新科学技术前沿技术 AI 技术它给我们带来一些便利和给患者带来能力的回归的同时它会不会有什么的负面作用对

对伦理问题啊他关注的一直都是那个负面的就包括以前那个五星好评以前那个打五星好评那个都是一些负面的今年这个黑镜我是看了第一集我看了第一集之后我感觉还是不错的是吗期待期待很有一种当年第一次看黑镜的时候的那种感觉七季的还能有这样的感觉评价很高啊我觉得是因为我们当年第一次看黑镜的时候呢他讲的也是一个近未来

那个时候我记得有一季是讲脑袋里面植入个芯片然后眼前有一堆可操作的东西回溯你的一生第一季第二季那个东西现在 Vision Pro 实现了一半 Vision Pro 实现了一半其实很多东西就是在将发生未发生之际我们看起来会更过瘾我觉得黑镜其实它就应该往这方向去引发人的思考对这两年就是 AI 比较火所以它如果扣着 AI 这个题目来就会看得很爽

OK 安排下一条下一条是 SpaceX 将接回两名被困空间站美国宇航员 OK 终于出差出差完成对吧这出了个远差不是之前才说过那两个宇航员是坐着波音的飞船上天的上去了就下不来嘛然后就说有没有可能最后要马亦龙来接他还真就是马亦龙去接他哈哈

哎呀当然对这两位宇航员来说呢这个是他们的悲哀我们不应该笑我只是说这个事情有点讽刺波音强行搞了一波现在这种魔幻的事情太多了最后就被 SpaceX 借回去了

是 NASA 也是废了从此美国再也没有人能登上月球了还得看我大中国对吧等我们那个嫦娥几几号能登上月球拯救一下这个平静了多少年的人类宇航事业马斯克不是说他要登上火星并且宣布火星是美国的国土吗 OK 那看谁先登吧

好那最后还有一条最最后一条这个有点厉害 Nintendo Switch 2 号称是要在几月来着 5 月初就可以去 6 月 5 号是发售 5 月初是可以预购我记得好像是这样的

然后现在这个 Switch2 我看了宣传发布会发布会当天我是看了直播整个性能做了一些升级然后它的外观屏幕是大了一点点两个手柄也是跟之前的不太一样磁吸的方式去接入的然后两个肩键是又可以用来做开关诸如此类的等等还有一个 C 按钮之前 Rumors 录了半天的那个 C 按钮到底是个啥结果是个 Chat 就是说你按下去之后可以跟别人实时在线连线还可以语音

那这个基本上就是你只要不玩网络游戏那就是个废物了但它终于能够把性能升级这件事情还是挺好的老任他的硬件从来都不是最强现在掌机也是除了老任之外无出其右他这次用的还不是一个 OLED 屏幕是一个 LCD 的屏幕猜测可能他 Switch 中间升级一下可能又会换一个 OLED 但 LCD 是整个屏幕的寿命会更友好一些了

整个分辨率来到了惊人的 1080p 惊人太惊人了相当惊人我只能接电视刷新率好像是没有上去我记不太清我记得刷新率上去了我好像在那看是上去了对是其中一个好像是有高刷那

我记得在 Switch 的第一代开发布会的时候我看了那个发布会然后我当时觉得这个东西没啥用啊结果呢后面就爆卖了然后现在这个 Switch 2 呢看起来是挺有用的啊接下来估计还是会爆卖但是呢不确定它的成功是否可以复制哈因为按老任以前的

惯例就是一代好一代衰老任一直都是这样子的因为他喜欢整活他如果再可以跟着一起再发售一款新游对吧就会卖的更加大卖新游肯定是会有我不知道他有没有公布新的这个一般都是这样的套路游戏阵容之前那个老任 Switch 1 卖的时候是跟那个萨尔矿野之息是一起出的

但是我看那个发布会上的游戏是没有什么特别厉害的就除了马车马车都那么多年了之前还一直在玩马车吧东兴抗

还有一个打球的游戏这些看起来都不太行除了马车之外确实也拿不出手了我觉得就看他到底能搞出些什么花活来吧然后最近那个川普不是搞关税吗 Switch 提前运了几十万台去美国没有他提前运了几十万台去美国保证供货充足跟苹果一样造孽造孽

好的美国人民生活在水深火热之中 OK 那时间也差不多了这就是今天的科技快乐星球东西还挺多然后 AI 的趋势已经特别特别明显了我相信现在国内所有的大公司小公司创业公司都在往 AI 这个赛道上面去靠有那么一点像当年移动互联网互联网家对但是

但是我觉得还是不太一样的地方在于说移动互联网是发展了一拨新用户

它使得整个互联网的用户量是大大的提高了因为以前的 PC 互联网其实受益的人是没那么多的但移动互联网起来了之后深深的拉了一大波之前不怎么用互联网的人这个是一个巨大的增量但 AI 的话可能没有我觉得 AI 可能没有 AI 还是在我们现有的这些用户里面

开辟了一个新的服务内容所以跟之前的移动互联网浪潮还真不一定能够直接对比但是相信在 AI 技术的加持下应该会有更多精彩的服务和创意出现我们拭目以待黑镜里的生活会越来越照进现实的是的科技我指的是科技不是里面那些糟糕的伦理的事情行行行好

那么以上就是本期节目的全部内容了如果你们觉得我们的节目还不错的话请不要忘了给我们点赞转发收藏你们的关注就是我们更新的动力 OK 我们下期节目再见拜拜