We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode The evolution of AI: from chatbots to conversational video

The evolution of AI: from chatbots to conversational video

2025/4/10
logo of podcast Lexicon by Interesting Engineering

Lexicon by Interesting Engineering

AI Deep Dive Transcript
People
H
Hassan Raza
Topics
Christopher McFadden: 本期节目讨论了AI驱动的视频代理的未来,以及人机交互的伦理问题。我们探讨了AI在医疗保健和政府等领域的应用,以及AI技术如何塑造未来的沟通方式。 Hassan Raza: 我是Tavus的联合创始人兼首席执行官。Tavus是一家AI研究公司,致力于构建人机交互的操作系统。我们构建的AI模型能够像人类一样学习沟通、感知和回应,目标是复制面对面交流的体验。我们认为,过去几十年中,从简单的聊天机器人到复杂的AI视频代理,会话式AI的发展实际上是对人类体验的一种倒退,因为它牺牲了人际互动中的“人性”来追求规模化。我们的重点是如何在不牺牲规模化的前提下,将人情味带回到人机交互中。我们认为会话式视频和AI人物形象可以实现这一目标,因为面对面的交流是人类进化的基础。未来五年,会话式AI将显著改变医疗保健、辅导、学习和教育等行业,因为这些行业目前受到人力资源的限制。 我们的AI视频代理不仅仅是给聊天机器人加了个脸,而是试图复制面对面交流的本质,包括情绪识别、环境感知和自然流畅的对话。我们的AI模型能够理解人类细微的情绪和情感,并将其与上下文联系起来,而不是简单地将情绪分类成几个标签。我们的模型能够通过学习大量数据来识别不同文化背景下细微的面部表情差异,并将其与上下文联系起来。我们的AI模型能够在训练过程中学习并记住与用户的互动,例如用户的沟通风格和个性特点,从而更好地进行互动。我们的目标是使AI视频代理更加逼真,并营造沉浸式的互动体验,同时确保透明地告知用户其为AI。 Tavus的技术独特之处在于其低延迟、高度集成、以及能够实时进行逼真面部表情渲染的先进模型。我们的AI系统能够以毫秒级的速度进行响应,并根据对话的上下文调整响应速度,避免打断用户。在开发AI视频代理的过程中,我们咨询了语言学和情感计算方面的专家,以确保AI能够进行自然流畅的对话。个性化AI视频技术能够实现大规模的互动,但同时也引发了关于真实性的担忧。我们需要在个性化和负责任的AI使用之间取得平衡。我们认为AI视频代理并非要取代人类,而是增强人类能力,让人们专注于更重要的事情。未来,AI驱动的视频和会话式AI领域一个被低估的突破是感知和视觉能力的提升,这将显著改善人机交互的自然性和信任度。 为了确保负责任的AI发展,我们需要制定一些必要的规章制度,例如信息披露和用户同意。开发AI视频代理过程中最大的技术挑战之一是延迟问题,我们通过优化模型架构和算法来解决这个问题。未来十年,某个政府部门可能会由AI模型来管理,尽管这并非一个好主意,但我认为这将会发生。

Deep Dive

Shownotes Transcript

In this episode of Lexicon, we’re joined by Hassaan Raza), CEO of Tavus), to explore the future of AI-driven video agents, conversational AI, and the ethics of human-AI interaction. 

From transforming healthcare to predicting AI in governance, Hassaan shares groundbreaking insights on where AI is headed next. Let’s dive in!

Also, don’t forget to subscribe to IE+) for premium insights and exclusive content!