We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode DeepSeek 和 OpenAI 都没做到的技术,这群人先实现了

DeepSeek 和 OpenAI 都没做到的技术,这群人先实现了

2025/2/23
logo of podcast 编码人声

编码人声

AI Deep Dive Transcript
People
史业民
朱峰
创立并运营「津津乐道播客网络」,专注于科技和技术领域的播客内容创作和分享。
李忻玮
Topics
史业民:我认为当前AI交互方式存在用户等待成本高、用户体验差的问题。DeepSeek虽然推理速度很快,但用户仍需等待其自言自语,体验不佳。更好的方案是拥有一个对接用户的模型,它能够理解用户意图,将用户的需求转化为指令,交给类似DeepSeek这样的模型处理,再将结果反馈给用户。此外,现在DeepSeek是纯文本模型,而Google和OpenAI已经有了多模态模型,因此在端侧部署小型多模态模型也是一个需求。随着人们对AI期望值的提高,AI不仅要回答问题,更要主动发现问题并告知用户,这将是未来发展方向。 李忻玮:我目前主要研究全双工对话,这是一种更贴近人类真实对话的交互方式。它允许双方自由选择说话时机,更自然流畅。全双工对话有几个重要特征:主动静音,即AI可以根据需要选择不回应;避免在用户说话未完成时打断,保持对话节奏。这些特性在虚拟女友、虚拟医生等场景中非常实用。 朱峰:当前大语言模型和用户之间需要一层桥梁来优化用户体验。无论是用打字、语音还是其他方式交互,都需要这层桥梁来处理用户需求。DeepSeek的出现虽然推动了大模型的平民化,但用户界面层面的需求也在不断增长。

Deep Dive

Shownotes Transcript

目前,哪怕是 DeepSeek 或者 ChatGPT,都是人类说一句 AI 答一句。这种方式很「被动」,AI 只能等你来召唤它。

本期节目邀请到声网大语言模型实验室的李忻玮,和实时 AI 创业者史业民。围绕「更主动交互的 AI」的话题,分享包括语音、视频等多模态的主动交互,以及背后更具体的技术细节和路径。

如何让 AI 像自然对话那样,适时地主动说话、打断或是沉默?如何实现在你出门时候,AI 主动提醒你带伞?黄仁勋和李飞飞都在做的「世界模型」是什么?它将如何帮助 AI 理解和预测更真实的世界?期待本期节目对你有所启发。

【本期嘉宾和主播】

史业民:实时互动 AI 创业者,前智源研究院研究员。李忻玮:声网大语言模型实验室高级研究员,RTE 开发者社区布道师,《从零开始学扩散模型》作者,Hugging Face 中文社区成员。朱峰:「津津乐道播客网络」创始人,产品及技术专家。

线下活动推荐(含赠票活动)

Apple 生态爱好者们,LET’S VISION 2025 大会即将回归,将于「 2025 年 3 月 1 日至 2 日」在「上海浦东鲜花港」举行。本次大会将聚焦技术前沿、创意实践、资源共享和未来展望,为参与者提供与行业领袖深入交流的机会。通过 RTE 开发者社区专属优惠码「EDHls6n」或 URL 购票,享受 9 折优惠:https://hdxu.cn/xzes) RTE 开发者社区和 TEN Framework 也会在大会出现!欢迎报名工作坊(2 日下午):「『你好,贾维斯!』1 小时打造可语音操作电脑的 AI 助手」。 有奖互动:小宇宙留言区参与互动,赠送 2 张价值 699 元的工作坊门票(可同时参加展区和讲座)。 制作团队

后期 / 卷圈监制 / 姝琦产品统筹 / bobo联合制作 / RTE开发者社区

关于「编码人声」

「编码人声」是由「RTE开发者社区)」策划的一档播客节目,关注行业发展变革、开发者职涯发展、技术突破以及创业创新,由开发者来分享开发者眼中的工作与生活。录制嘉宾覆盖信通院 & 科委专家、国内外资深投资人、VR/AR & 虚拟人 & AIGC 等新兴技术领域头部创业者、一线网红 & 硬核开发者、跨界画家 & 作家 & 酿酒师等。

RTE 开发者社区)是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。社区于 2023 年底正式启动了「主理人+工作组」的运营机制,并确认了社区的 3 位联合主理人 ——· 零一万物 01.AI 开源负责人 @林旅强 Richard· FreeSWITCH 中文社区创始人 @杜金房· 库帕思 CTO @卢恒

本节目由津津乐道播客网络与 RTE 开发者社区)联合制作播出。