back
WTR | 吉卜力风格爆火 GPT-4o画图能力如何;任天堂直面会突袭;WWDC定档;
44:00
Share
2025/4/1
一周科技回顾 | WTR
AI Deep Dive
AI Chapters
Transcript
People
彪
彪彪
招
招招
Topics
GPT-4O 的图像生成能力及相关争议
招招:GPT-4O 的图像生成能力令人印象深刻,尤其吉卜利风格的图像生成在社交媒体上爆火。其生成的图像偏暖色调,但同时也存在被用于生成不当内容的风险。OpenAI 对其进行内容审查,但审查机制存在漏洞,可以被绕过。宫崎骏曾公开表达对AI滥用其作品风格的厌恶,这引发了人们对AI伦理的讨论。GPT-4O 可以生成多种艺术风格的图像,不仅仅局限于吉卜利风格,其强大的图像推理能力可以根据零件图生成组合后的图像,甚至可以根据游戏贴图生成游戏场景,这在一定程度上冲击了设计师的工作。 彪彪:GPT-4O 的图像生成可能使用了基于扩散的图像自编码器,而非基于单元的编码器,这提升了其性能。GPT-4O 和 Gemini 在图像原样输出方面的表现不同,GPT-4O 更像是重新绘制,而 Gemini 更像是模糊处理。 彪彪:DeepSeek V3 模型性能已能与GPT-4.5匹敌,但在幻觉问题上仍未得到有效解决。Sora对真实世界的理解能力有待提高。
Deep Dive
科技硬件新品发布及更新
Chapters
GPT-4o 更新画图功能,吉卜力风格爆火?
Sora 生成视频不限量,这会带来哪些变化?
马斯克的 xAI 买了马斯克的 X,背后有何深意?
5090 Laptop 发布,性能如何?
AriPods Max 即将支持无损音频与超低延迟音频,体验如何?
WWDC 25 定档 6月10日,有哪些期待?
任天堂突然开直面会,带来了哪些惊喜?
Shownotes
Transcript
科技大事
00:30 GPT-4o 更新画图功能
14:02 Sora 生成视频不限量
17:44 马斯克的 xAI 买了马斯克的 X
20:04 5090 Laptop 发布
22:09 AriPods Max 即将支持无损音频与超低延迟音频
25:08 WWDC 25 定档 6月10日
26:23 任天堂突然开直面会
————本期剪辑:钊钊(PS:又是剪辑晚了的一期,发布时应该已经开完 Switch2 发布会了 QAQ)
Collapse