cover of episode WTR | 吉卜力风格爆火 GPT-4o画图能力如何;任天堂直面会突袭;WWDC定档;

WTR | 吉卜力风格爆火 GPT-4o画图能力如何;任天堂直面会突袭;WWDC定档;

2025/4/1
logo of podcast 一周科技回顾 | WTR

一周科技回顾 | WTR

AI Deep Dive AI Chapters Transcript
People
彪彪
招招
Topics
招招:GPT-4O 的图像生成能力令人印象深刻,尤其吉卜利风格的图像生成在社交媒体上爆火。其生成的图像偏暖色调,但同时也存在被用于生成不当内容的风险。OpenAI 对其进行内容审查,但审查机制存在漏洞,可以被绕过。宫崎骏曾公开表达对AI滥用其作品风格的厌恶,这引发了人们对AI伦理的讨论。GPT-4O 可以生成多种艺术风格的图像,不仅仅局限于吉卜利风格,其强大的图像推理能力可以根据零件图生成组合后的图像,甚至可以根据游戏贴图生成游戏场景,这在一定程度上冲击了设计师的工作。 彪彪:GPT-4O 的图像生成可能使用了基于扩散的图像自编码器,而非基于单元的编码器,这提升了其性能。GPT-4O 和 Gemini 在图像原样输出方面的表现不同,GPT-4O 更像是重新绘制,而 Gemini 更像是模糊处理。 彪彪:DeepSeek V3 模型性能已能与GPT-4.5匹敌,但在幻觉问题上仍未得到有效解决。Sora对真实世界的理解能力有待提高。

Deep Dive

Chapters

Shownotes Transcript

科技大事

  • 00:30 GPT-4o 更新画图功能
  • 14:02 Sora 生成视频不限量
  • 17:44 马斯克的 xAI 买了马斯克的 X
  • 20:04 5090 Laptop 发布
  • 22:09 AriPods Max 即将支持无损音频与超低延迟音频
  • 25:08 WWDC 25 定档 6月10日
  • 26:23 任天堂突然开直面会

————本期剪辑:钊钊(PS:又是剪辑晚了的一期,发布时应该已经开完 Switch2 发布会了 QAQ)