苹果的AI摘要生成功能被指新闻造假,例如将BBC报道的路易及曼吉奥内谋杀案错误总结为自杀,此前还曾错误报道内塔尼亚胡被逮捕。这些错误挑战了新闻的真实性,尽管苹果的初衷是帮助用户提炼重要信息,但深度语言理解能力不足导致问题频发。
OpenAI的O3模型在多个基准测试中表现优异,特别是在CodeForce测试中得分高达2727,超越大部分人类程序员。在ARCAGI测试中,O3得分87.5%,远超O1的25%。此外,在Epoch AI Frontier Map测试中,O3解决了25.2%的问题,而其他模型得分均未超过2%。
AI玩具市场规模巨大,众多公司如字节跳动和特斯拉已入局。未来,AI玩具将更加多样化,注重情感陪伴和互动性,并可能开发更多应用。然而,市场需求尚未完全打开,产品需要更懂用户情绪和功能价值。
国产视频生成模型在12月加速落地应用,如快手更新1.6模型,字节跳动发布豆包视频生成大模型。这些模型虽然语义理解能力有限,但底层模型架构相似,未来将依赖各公司的底层优化能力和数据训练结果。
苹果与英伟达合作,发布并开源了名为Drafter的推测解码技术,整合到英伟达的TensorRTLL中。该技术通过RNN草稿模型、动态注意力算法和知识蒸馏训练等关键技术,加速了大语言模型的推理过程,在NVIDIA 100 GPU上每秒生成的Token数量提高了2.7倍。
今天的节目将探讨苹果AI摘要错误如何挑战新闻真实性?OpenAI的最新模型o3表现如何重塑AI技术前沿?以及,随着AI技术的进步,未来AI玩具市场将如何影响我们的生活和互动?加上,国产视频生成模型的快速发展会带来哪些新的商业和技术机遇?接下来让我们来解锁这些商业科技动态吧。
00:00:46 苹果 AI 摘要生成功能出错引关注
00:02:09 AI 发展的现状与未来展望
00:03:30 12 月大模型应用加速,苹果英伟达合作
00:05:01 o3 模型发布与历史上的今天
本期主播: 西娅
后期: 西娅
收听平台: 小宇宙、喜马拉雅、Apple Podcast等。
如果喜欢我们的节目,欢迎点赞评论转发。