We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Jon Noronha: How Gamma’s big bet on AI paid off

Jon Noronha: How Gamma’s big bet on AI paid off

2025/5/8
logo of podcast Generative Now | AI Builders on Creating the Future

Generative Now | AI Builders on Creating the Future

AI Deep Dive Transcript
People
J
Jon Noronha
M
Michael Mignano
Topics
Michael Mignano: Gamma公司通过在2023年大胆转向AI,获得了数百万新用户,取得了成功。这体现了AI应用层价值的巨大潜力。 Jon Noronha: Gamma公司最初并非AI原生公司,但在2022年年中,随着生成式AI技术的成熟,特别是Stable Diffusion模型的出现,我们意识到AI可以帮助我们解决产品市场匹配问题,提升用户体验。我们最初的目标是利用AI加速用户上手过程,但随后发现,AI生成演示文稿的功能非常受欢迎,这成为我们公司发展的转折点。ChatGPT的发布进一步推动了AI的普及,也为我们带来了大量的用户。 我们的成功并非仅仅依靠运气,更在于我们提前三年的产品、团队和技术积累。当机遇来临时,我们已经做好了充分的准备。 我们通过扩展产品功能,覆盖更多内容创作场景(如网站、文档、社交媒体素材),提升了用户粘性,也解决了投资者对单一产品类型的顾虑。 Gamma的成功并非完全依赖于AI功能,优秀的UX设计和产品体验同样重要。我们更注重用户体验,而非单纯的AI技术。我们团队中UX设计师占比很高,而ML工程师数量很少。我们通过提示词工程来优化AI应用效果,而非自主开发或微调模型。 我们的竞争优势在于我们构建的完整产品和用户体验,而非仅仅依赖于AI模型本身。用户使用Gamma并非因为其AI技术,而是因为其优秀的产品体验和工作流程的整合。 我们公司将保持敏捷性,以应对快速变化的AI技术环境,从而与大型竞争对手竞争。我们保持精简的团队规模,专注于产品主导型增长,暂时不优先考虑B2B业务。 未来,我们将探索更具代理性的AI交互界面,并扩展至视频内容创作领域。语音交互功能也将在我们的产品路线图中占据重要地位。 我们期待AI模型在图像文本生成和视频生成方面的改进,这将彻底改变我们产品的设计方式。我们也关注模型在多指令处理和事实准确性方面的提升。 公司快速增长给团队带来了巨大的挑战和机遇。我们正在适应这种变化,并努力在保持公司敏捷性的同时,建立更完善的组织结构。

Deep Dive

Shownotes Transcript

嘿,大家好,欢迎收听 Generative Now。我是 Michael Magnano,Lightspeed 的合伙人。

本周,我将与 John Nerona 谈谈。他是 Gamma 的联合创始人,Gamma 是一个 AI 驱动的平台,可帮助用户在几分钟内创建互动且引人入胜的演示文稿、网站和社交媒体素材。Gamma 成立于 2020 年,但在 2023 年大规模转向 AI。我们将讨论这一转变的过程,以及它是如何使公司迅速发展到全球数百万用户的。让我们开始吧。

你好,John。Mike,很高兴来到这里。感谢你的邀请。是的,感谢你来到这里。我真的很期待这次谈话。我认为 Gamma 是这些真正令人着迷的 AI 公司之一。你知道,在过去的十年,

无论多少年,两三年,人们对 AI 的模型层都充满了兴趣。发生了如此多的创新。但现在每个人都在谈论应用层,并试图弄清楚哪里有价值,哪些公司和伟大的产品将会出现。我认为 Gamma 就是其中一款产品。我知道你一开始并不是一家 AI 公司。所以

跟我们说说,你 2020 年的创业历程,以及你如何走到今天,这就像 ChatGPT 时刻一样。是的,完全正确。应用层确实迎来了它的时刻。但正如你所说,我们一开始并不是一家 AI 应用公司。我仍然不知道我们是否能真正称自己为 AI 原生,尽管我们一直在努力成为更 AI 原生的公司。

是的,我们在 2020 年从另一家公司 Optimizely 的“残骸”中创立了这家公司。这就是我和我的联合创始人以及我们许多创始团队的来源。Optimizely 在 2020 年被收购,这是一个尝试新事物的好机会。但这也是一个非常奇怪的时期,因为那是新冠疫情最严重的时期。整个世界都在变化,感觉非常动荡不安。

我们最初的设想是,我们一直将演示文稿作为我们的初始市场。我们认为 PowerPoint 正处于被颠覆的边缘。PowerPoint 即将迎来 40 岁生日。40 岁?它是在 1987 年创建的。是的,1987 年是第一个 PowerPoint 推出的年份。如果你想想这款产品在这段时间是如何变化的,它确实发生了一些重大变化。颜色是他们在 90 年代早期添加的一个功能,以及其他一些类似的功能。他们在某个时候推出了剪贴画。

但其基本模式一直没有改变,其他优秀的幻灯片工具也相继出现,但它们大多只是不同平台上的 PowerPoint。因此,Google Slides 是互联网上的 PowerPoint,Keynote 是 Mac 上的 PowerPoint,等等。我们看到了从根本上重新思考演示文稿的机会。所以不要只是试图制作一个更好的 PowerPoint 编辑器,而是尝试制作一种人们表达想法的新格式。这就是最初的设想。这是我们最初的种子轮融资的科技。我们正在构建反 PowerPoint。这就是整个想法。

我们认为新冠疫情为我们提供了这个绝佳的“时机”。如果你回想一下 2020 年,那时“未来工作”是一个非常热门的风投主题。事实上,像 Zoom、Loom、Slack 这样的公司都在疯狂增长,令人难以置信的增长是从无到有的。感觉大门终于向我们敞开了,可以重新审视所有这些标准的职场工具。因此,我们认为这是一个绝佳的时机,可以真正深入研究并着手处理演示文稿,

所以我们在头几年里,一直在重新思考远程工作的演示文稿,在这种工作方式下,人们并不都在同一个房间里,甚至可能并非所有人都同时了解内容。那么,为录制设计演示文稿意味着什么?我们的愿景实际上是创造一种混合演示文稿和文档的东西,你可以会议前发送出去,我们也可以在会议后发送所有信息,甚至可以捕捉讨论中的所有笔记。一个活生生的文档,它具有演示文稿丰富的视觉效果,但也具有演示文稿的

密度和真实信息。所以真的倾向于像你说的那样,新的格式。是的,真的倾向于新的格式,倾向于不同的,试图尽可能与众不同,而不是尽可能相似。我们稍后会再谈到这一点,因为这对我们来说既是好事,也是坏事。好的。这就是最初的设想。我认为我们在 2021 年进行了第一次测试版发布,在 2022 年在 Product Hunt 上进行了更大规模的发布。

我们在 2022 年左右最终陷入了产品市场匹配的“死区”。我相信你看到很多初创公司最终都处于这种状态,我们推出了一些产品,它拥有一些忠实的粉丝,但我们的活跃用户数量只有几千。如果我们真的要严格一点,也许只有几百。所以我们有一些充满热情的人,但它还不够。当然,它不足以获得风险投资规模的成果,不足以让我们能够进行 A 轮融资。所以我们

我们开始查看我们的资金消耗率,并发现如果我们不做出重大改变,我们可能在一年左右就会倒闭,只是因为资金即将耗尽。因此,我们必须做出选择:我们是应该改变公司方向,还是在我们当前的道路上再做一次大的赌注,也就是这种演示文稿的道路。

坦率地说,幸运的是,就在 2022 年年中左右,生成式 AI 终于即将变得优秀。是的。这些模型以某种形式存在了一段时间,但它们还不够好。我们甚至在早期也尝试过它们。但到了 2022 年,真正发生的关键时刻并不是 ChatGPT-4S,而是 Stable Diffusion。Stable Diffusion 是第一个真正流行的 AI 图像模型。

它在 Twitter 上爆火。我记得当时它可能还叫 Twitter。人们分享着他们创作的这些疯狂的图片。老实说,它们当时还不够好。它们都有奇怪的手指和含糊不清的文字,但人们为任何事物创作插图,这仍然有一些神奇之处。

因此,我们开始意识到,天哪,制作演示文稿有什么痛苦之处?其中很大一部分是格式化和装饰。你只是花了很多时间来制作剪贴画和漂亮的图片来填充空间。因此,我们认为这可能是真正押注 AI 的时刻。因此,我们在 2022 年夏天开始这样做。真的

真的投入其中,真正地测试大型语言模型能做什么。我认为我们甚至没有完全意识到这将成为我们公司前进的方向。我认为我们有一个狭隘的想法,那就是 AI 可以帮助我们解决产品中的冷启动问题。所以我们有这种新的格式。人们很难理解我们的激活率,也就是实际看到价值的新注册用户的百分比相当低。如果我们可以通过使用 AI 生成第一个演示文稿来加快整个使用产品的第一个步骤吗?

你知道,一个小时的使用时间变成五分钟。这就是我们最初狭隘的想法。所以我们真的押注于此。我们让整个团队都参与其中,提出了许多不同的想法,并非所有想法都奏效,包括生成演示文稿、生成图像、编辑演示文稿。从提示生成演示文稿的想法被证明是神奇的。我们基本上把所有东西都投入到发布这个功能中。

然后我们又幸运地赶上了另一个不可思议的时刻,那就是那年 11 月,ChatGPT 推出了。我们都知道接下来发生了什么,整个世界都为 AI 而疯狂,创造了对“我能用 AI 做什么”的难以满足的需求,人们在社交媒体上谈论 AI,分享他们制作的东西。

这也意味着,就在我们资金即将耗尽的时候,模型变得优秀了。因此,OpenAI 发布了其模型的新版本 GPT 3.5。因此,我们在 2023 年的头几个月推出了我们的 AI 生成器,这对我们来说是一个彻底的转折点。我们从产品市场匹配的这种中等状态,比如,我不知道这是否真的有意义,变成了,哦,我的天哪,人们恳求我们付费。他们恳求我们进行货币化。而且

从那以后,轨迹就完全不同了。太不可思议了。是的,很有趣。我认为你几次提到了“运气”这个词。你知道,我经常想到初创公司,而且在我成为投资者之前,在我创建公司的时候,我也觉得我们很幸运,我想退一步想想。这不仅仅是运气,而是时机,对吧?就像你让自己在某个时间点存在,让闪电击中你。听起来你做得很好,

让公司继续运转,并坚持足够长的时间来等待这些时刻的到来。谢谢。是的,我认为你完全正确。我总是听到的一个比喻,我非常喜欢,那就是初创公司的运气就像航海。所以你必须抓住合适的顺风,但你也必须调整好你的帆,把你的船放在正确的位置,才能乘风破浪。所以对我们来说,

是的,这是时机。事实上,当闪电来临时,我们必须在那里。但我们也必须为此提前三年做准备。打造产品、组建团队、构建技术基础,这样当它到来时,我们就能处于最佳状态来抓住这个机会。你可以快速构建一个利用顺风的产品。但如果它不够强大,基础设施不稳定,你无法扩展,这三年可能会最终成为……

在 ChatGPT 真正流行之前,对 Gamma 来说极其宝贵。完全正确。所以,你知道,我对 Gamma 感到非常有趣的一件事,甚至不仅仅是 Gamma,而是创意工具领域,你经常会发现,如果你回顾许多成功的公司,你会发现,如果你只坚持一种工作或一种格式,它最终不会成为

一个足够频繁的用例来真正支持公司。你已经超越了演示文稿。我想知道这是否与你超越演示文稿有关。你完全正确。这很有趣,因为当我们处于这种特别黑暗的时期,想知道我们作为一家公司是否有一条路时,阻碍我们前进的最大障碍之一是,很少有投资者愿意投资演示文稿公司。

很多人被埋葬在演示文稿中。

人们甚至没有为演示文稿产品付费。就像你永远无法克服这堵墙一样。是的,他们只是捆绑在一起。他们捆绑在一起。毫无疑问,与捆绑对抗是一件困难的事情。因此,实际上,早在我们进入 AI 之前,我们就已经在考虑扩大产品范围并广泛发展。我认为我们最好的灵感来源是 Canva,它真正展示了通过在不同资产上进行多元化发展来建立一个,比如……

爆款业务的能力,这既体现在制作不同的东西方面,也体现在在一周或一个月中的不同时间点赢得同一个客户方面。所以,将某人从每周活跃用户变成每日活跃用户,因为他们有五到六件不同的东西需要使用你的产品。所以我们非常采取了这种方法。演示文稿是我们的起点,它仍然是我们最大的吸引力

但我们现在已经添加了所有其他我们支持的格式。所以我们有一个文档构建器。当我们说文档时,想想比 Google Doc 更具视觉效果的东西。所以我们制作非常漂亮的 PDF、宣传册和电子书等等。网站是我们最大的一个。这听起来与演示文稿非常不同。我的天哪,网站本身就是一个完整的市场。但是

许多网站都相当简单,它们只是一种在线宣传册。如果你想想那些试图在网上展示自己的小企业主或教练之类的人,实际上他们的宣传册和他们的网站几乎是一样的东西,只是形状略有不同。因此,我们利用了 AI 真正增强了这种可塑性的想法。从演示文稿开始,将其转换为网站,将其转换为 PDF,你可以打印出来放在客户的网站上。

在过去的几个月里,我们又增加了一个,那就是社交媒体。所以基本上,当人们创建社交媒体图形时,比如 LinkedIn 轮播图,

我认为我们的目标是从这两种格式扩展到四种,甚至十种,将人们从每月活跃用户变成每周活跃用户,再变成每日活跃用户。到目前为止,你是否发现这些不同格式的用户是相同的?比如需要演示文稿的人与需要网站、需要社交媒体素材的人是同一个人,还是这些实际上带来了完全不同的客户?我们对不同产品线之间的惊人相似性感到惊讶。

以及横向发展的能力。这实际上是在融资过程中出现的另一件事,这太有趣了,许多投资者,尤其是在种子轮之前的早期阶段,不想听到你的横向产品。他们想听到你专注于垂直领域。所以,你知道,他们说,告诉我你正在赢得的一个人群。我理解这种建议的来源,因为如果你试图服务所有人,你就不会服务任何人。我认为大多数追求横向发展的人最终都会失败。事实上,我们差点就失败了。所以,我理解这一切的来源。

尽管如此,从一开始,当我们追求这个愿景时,我们对这个领域的横向性感到震惊。在 Gamma 的早期,我们做的第一件事,甚至在构建任何东西之前,就是用户研究。我们只是联系了我们自己的网络,我们基本上与一百个人进行了交谈,我们只是问他们,

告诉我你做的最后一个演示文稿。这些人来自不同的生活领域。可能是老师、学生、顾问或医生,无论是什么。事实证明,每个人都做过演示文稿,因为它在许多工作中都很常见。他们实际上都有同样的抱怨。所以这并不是说医生需要的功能与学生需要的功能非常不同。他们都难以对内容进行格式化。他们都难以被内容的视觉效果所评判。他们都难以保持注意力。这就像都是一样的事情。

现在我们已经扩展到更多格式,这一点就更加真实了。制作网站的人,现在设计师和开发者之间存在区别。显然,设计师和开发者非常关心细节。但 98% 的人都在“其他人”中,他们有同样的需求。我只是想获得一些专业外观的东西,而不用担心代码,也不需要花钱请别人维护我的网站或更改我的电话号码。

因此,我们对这种规律性感到惊讶,并且对我说,交叉程度感到惊讶。当 ChatGPT 推出时,显然你之前谈到了 Stable Diffusion,它为许多图像提供了动力,这显然对很多人来说都是神奇的。我认为它仍然很神奇。但是现在,在所有这些格式中,无论是演示文稿还是网站,你发现人们对

实际的 AI 的依赖程度有多高?还是仅仅是,嘿,Gamma 是一个漂亮的新格式,它使用起来很容易。我将选择它而不是 PowerPoint。不是因为 AI 功能,而是因为我喜欢 Gamma。现在是什么吸引着人们?是 AI 还是产品?AI 吸引了他们,但核心产品让他们留了下来。这是一种动态的,来体验 AI。AI 是驱动病毒式传播的东西。这是我们在注册后的前五分钟就能给您留下深刻印象的东西。它确实回答了这个问题,即这比以前好 10 倍吗?

你可以在两个小时内完成以前需要 20 个小时才能完成的事情。所以这仍然是承诺。但我认为这与你关于焦点如何从模型层转移到应用层的观点有关。我认为在应用层,关于 GPT 包装器的这个概念有很多争论。所以所有这些人只是围绕 GPT-3 或其他东西的包装器吗?我认为这种观点可能忽略了这样一个事实,即包装器通常比被包装的东西厚得多。所以

这就像你有一个神奇的珠宝或其他东西,你把它放在灭霸的手臂上,但你必须拥有所有其他东西。所以对我们来说,是的,这就是核心产品。坦率地说,我们在像高质量 PDF 导出这样的功能上花费的时间比让 AI 更智能的时间多得多。这可能是对 AI 应用层的误解。我认为一个特别的例子

当人们想到 AI 应用层时,他们会想到这些编码工具。他们会想到像 Cursor 这样的东西,它正在迅速发展,而实际上它的 UI 非常薄。它实际上只是一种尽可能快地将代码输入到你的代码库中的方法。没错。我们采取了不同的方法,演示文稿是一种高度依赖用户体验的产品。网站建设也是如此。我们的大部分工作实际上是在工程之前的 UX 设计。我们如何才能让这一切协同工作?

你实际上可以在我们团队的构成中看到这一点,我们的团队中有三分之一是 UX 设计师。哦,哇。零名机器学习工程师。这与典型的 AI 公司可能大相径庭,但可能更类似于你从消费软件公司看到的。这非常有趣。那么你如何看待……

你们是否正在进行任何研究或开发自己的模型,甚至微调自己的模型?还是真的只是全部现成的,然后用 UX 和设计人才来制作出色的产品?它是现成的,但进行了大量的提示工程。所以我们已经尝试过微调之类的事情,但我们实际上发现提示工程是许多真正强大功能的来源。挑战在于,大多数用户不知道如何提示,也不想学习如何提示。因此,任何只是一个提示框和输出的界面都不会非常成功。所以……

在用户输入到我们产品中的内容和 AI 模型看到的内容之间,有大量的内容,我认为我们的许多价值都来自这里。这就是提示工程,但提示工程几乎与用户体验密不可分。比如,我们选择公开哪些旋钮?

这也体现在我们的工作方式上,我们的 UX 设计师也是提示工程师,也是前端开发人员。我们有这些非常混乱的重叠角色,人们将多种技能结合起来,最终提供正确的体验。所以我们做了很多这样的工作。我们对 AI 的输出进行了大量的预处理和后处理,以使其感觉神奇且一致。一个简单的例子是,我们现在做了很多 AI 图像生成。实际上,我们几乎……

我们已经生成了近 10 亿张 AI 图像。所以我们做了大量的图像生成工作。但当我们这样做时,我们会做很多额外的工作来确保这些图像感觉连贯且一致。因此,当你制作一个包含 15 张图像的演示文稿时,我们会做很多工作来确保它们都具有相同的视觉风格,并且感觉它们都来自同一个地方,而不是一堆随机的提示被发送到 Dolly 或其他任何地方。这真的很酷。你做了很多很棒的提示工程。我

我感觉我一直在听到的一件事,我已经听到两年了,但我感觉声音越来越大,那就是如果你的防御能力是一个提示或系统提示或提示,那么你就完蛋了。模型很快就会弄清楚这一点。需要明确的是,我个人不同意这一点。我投资了应用层。所以……

你对此怎么看?你如何看待针对可以被重新创建和仅仅是一个提示的东西的防御能力?我想答案的一部分,不是为了替你回答,是 UX。但也许谈谈像 AI 之前的传统软件公司那样进行构建,因为感觉这就是这里可以防御的东西。就像一个伟大的产品。我认为如果你的产品所做的只是,例如,一个博客文章生成器,你输入一行文字,你就会得到,我不知道,一篇 10 段的博客文章。

那么我会倾向于同意你完蛋了。你所做的只是站在一个非常好的文本生成器和输出之间。但我认为当你谈论一个人们居住在其中以完成复杂工作的一个真正的应用程序时,情况就不同了。所以我会专注于我们的用例,尽管我认为这在应用层中更广泛地适用。

实际上生成演示文稿的文本并不是难事。事实上,ChatGPT 已经做得非常好了。模型就是这样做的。是的。但我们看到我们的所有价值都在于你如何使用这些文本。所以对我们来说,这包括一些我们使用 AI 来做的事情,但它非常特定于领域。所以实际上是在演示文稿中布局内容。这意味着将想法构建到多个幻灯片中,弄清楚内容在每个幻灯片中的位置,想出不同的可视化方法。所以不仅仅是……

样板 AI 图像,而是我们自己结构化的可视化,例如我们制作的非常 PowerPoint 风格的时间轴,抽象化所有这些内容,以便用户可以给出非常简单的提示。而且我认为对我们来说至关重要的一点是,最终它仍然需要人工可编辑。所以现在对所有这些网络应用程序构建器都非常疯狂,比如你的 Bolts 和你的 Loveables。我认为它们是很酷的产品,但它们通常帮助某人从想法到原型。

然后他们有了原型,就像,好吧,但我真的可以用它作为我的完整应用程序吗?然后就会出现脱节,因为它并不是一个完全可编辑的应用程序。事实上,为了使其成为一个完全可编辑的应用程序,你几乎需要一个像 Webflow 这样的界面,在那里你拥有这个完整的点击式无代码界面。

我们投入了大量资金来构建围绕它的无代码界面,你可以在其中操作内容,非常轻松快速地进行编辑,然后用它做很多事情。所以我们有演示模式,我们有 PowerPoint 导出,我们有将网站发布到真实的自定义域名。这些事情实际上是所有痛苦的来源。我看到我们团队每天都在做所有这些,比如

你知道,编码工作,所有拉取请求,其中 99% 都是这种事情。更不用说让整个应用程序扩展,以及当你必须让它在 100 个国家/地区运行时,在非常不同的用户类型和每天大量的请求下可能出现的所有问题。我是否正确地理解你,你不能只构建一个产品来获取模型中的内容,

并将其提供给用户。这只是一个包装器,对吧?包装器基本上只是让 ChatGBT 看起来有点不同。你所说的只是像 AI 时代之前一样,你必须通过组合工作流程来提供价值。这就是你正在做的。你正在构建一个产品

是的,当然。它从 AI 获取一些内容,但最终,这并不是人们使用它的原因。他们使用它是因为它是一个很棒的产品。绝对正确。该产品之所以出色,是因为它融入到他们的生活和工作流程中的方式。它

是因为你正在与用户建立信任关系,他们可以一次又一次地回来,并通过与你合作获得他们会满意的可预测结果。这很难,因为他们在幕后使用的是低效的技术。因此,大部分神奇之处在于弥合了 AI 可以做什么的差距,并以一种具有用户可以轻松抓住的干净把手的方式来展现它。他们使用它不是因为它使用了 AI。事实上,我认为客户甚至不在乎这一点。就像他们一样,没有人因为技术而使用产品。

对吧?绝对正确。我经常想到的一件事是,现在每家公司都想利用 AI,每家公司都想成为一家 AI 公司。因此,当你谈到使用演示文稿作为进入网站和社交媒体素材的方式时,所有这些都以 AI 作为切入点,正如你提到的那样,它推动了病毒式传播,你可以看到一个世界,在这个世界中,这个产品

看起来非常像 Canva 或我不知道,其他一些创意套件。但众所周知,这些公司也希望朝另一个方向发展。他们希望利用他们现有的套件,并希望在他们存在的每个地方注入 AI。

所以他们也能获得楔子的好处。所以,是的,你怎么看待这个问题?你现在是不是直接针对这些非常非常大的老牌公司?你如何看待与众不同?我认为不可避免的是,是的。你知道,你要么默默无闻地死去,要么活得足够长久去对抗大公司。所以我们希望活得足够长久去对抗大公司。

到目前为止,我想我们会做得很好。我认为这实际上归结为精简和灵活的优势。想象一下,如果人工智能发展完全暂停,所有能力都冻结在现在的时刻。我同意许多人的观点,他们认为即使我们已经获得的东西,仍然会有大量的AI创新可以被挖掘出来。

但我认为在这个世界里,你会看到的是,PowerPoints和Google Slides之类的产品将会有可预测性,能够进行投资和规划。但这不是我们所生活的这个世界。我们生活在一个能力变化非常剧烈且频繁的世界。所以每隔两个月,就会发生一些新的事情。

你必须重新思考产品的功能。我在大型组织工作过。我的职业生涯开始于微软。我只是知道大型组织没有那种紧密的决策循环,他们无法如此迅速地改变其核心产品。这有很多合理的理由。大多数PowerPoint用户不希望PowerPoint改变得那么快。PowerPoint的企业销售人员不希望他们销售的产品在他们脚下发生变化。这些公司面临许多合理的限制。而且

他们的买家真正购买的是可预测性,我只是想要2005年我在高中时学到的东西,或者其他什么东西。就像,这就是PowerPoint应该永远的样子。所以。

当技术发生变化时,它为新公司创造了一个很好的窗口,这些公司不受过去的束缚,并且可以就调整其产品做出非常迅速的决定。我认为这种情况会发生在我们身上。我认为我们的产品在未来一两年、三年内仍然会发生巨大的变化。如果它没有,我们就没做好我们的工作。这也确实影响了我们组建团队的方式。我们已经真正优化了成为一个小型团队。

所以我们现在大约有35人,而许多公司我认为拥有我们这样规模的用户收入已经达到数百人,甚至两三百人。但是移动一个30人的组织或300人的组织要容易得多,这比30000人容易得多。这就是我们在那儿采取的心态。这也是我们可能采取这种违反直觉的做法的原因,即纯粹专注于产品主导型增长,而没有真正追求B2B业务。

我们在这个位置上的许多公司都感受到内部和外部的压力,例如向大型企业销售。我们现在确实感受到了这种压力。我们感受到这种压力,因为这些公司正在敲我们的门,说:“嘿,我们想使用你的产品。”当然,我们自己也看到了进入企业市场的收入机会和留存机会。但是一旦你进入企业市场,一旦你真正建立了这些非常长期的合同和关系,

你开始优化更多的可预测性。我认为事情会平静下来,在那里可能会有意义。但是现在,我们认为对我们来说最重要的事情是保持领先地位并消除。这意味着要保持我们非常灵活的机会。你提到你不会对公司感到惊讶……

公司在未来几年随着技术的不断进步而进行更多调整或迭代调整。显然,如果你知道这些是什么,你可能会现在就去做。但是也许你认为这件事可能朝着哪些方向发展?你看到的一些即将发生的事情是什么?你会想,哇,我们必须对此做出反应。我们现在正在努力解决的一个大问题是,从基于工具的界面转向代理界面。我

我不太喜欢用“代理”这个词,因为它在不同的地方是一个毫无意义的流行词。但对我们来说,核心或我们面临的核心产品设计权衡是,Gamma应该在多大程度上具有对话性,即你与它交谈,就像你与ChatGPT交谈一样,以及它应该在多大程度上感觉更像是一个传统的软件工具,你只需按下一些按钮,然后输入,然后生成一些东西。

事实上,在我们的一生中,我们已经几次在这方面反复权衡了。我认为我们会继续反复权衡,因为它们各有优势。基于工具的方法的优势在于,对于那些不太关心人工智能并且不想成为提示工程师的人来说,它非常熟悉。他们只需指定他们想要什么,然后就能得到好的结果。但是

很多人说聊天界面已经死了,因为更多的人工智能会朝着这个方向发展。但我认为这并不正确。当然,这并没有被数据证实,ChatGPT是迄今为止最主要的消费者AI产品,可能比其他任何产品高出10倍。我认为它可能不正确的原因是,首先,模型本身正在真正优化这些对话性的事情。整个AI应用层都漂浮在这个模型本身发生的创新层之上,以及它们正在调整的目标。

第二个原因是,对话式方法让人们能够真正阐明他们的意图。所以当他们说,为我做一个关于X、Y、Z的演示文稿时,人工智能有机会说,当你想要一个关于这个的演示文稿时,你是想象一个更专业的重点,还是其他什么?你是想30张幻灯片还是15张?它让你提前提出这些问题。它还能够在之后进行更正。

所以你生成了这个东西,用户可以说,“这不太是我想要的。我实际上想修复它。”我们都在努力弄清楚如何支持这种类型的界面。编码工具已经完全转向了提供聊天界面,并使其调用100种不同的工具,并在你的代码库中尽情发挥。

我认为他们也会在他们前进的程度方面有所反复。这场辩论自一开始就一直在进行。我认为理所当然的是,我们一开始可能对聊天界面有所顾虑,并将其与,哦,你知道,我们一直都有终端进行比较。这就是为什么我们进化到拥有GUI,对吧?以及触觉按钮等等。我们为什么要倒退?我们为什么要与所有东西聊天?但我认为你提出了一个非常好的观点。而且,你知道,

几乎像一个动态界面,它基本上是根据用户输入到模型中的内容和模型吐出的内容实时演变的承诺,这可能比听起来要难得多,无论是在技术上还是在用户体验方面,对吧?最好的产品设计是那些

你知道,有很多清晰度,用户对事物的位置以及他们在世界中的方向有深刻的理解,我认为这很难实现。所以聊天界面,一种代理式的体验,你是对的。我的意思是,它,

我们都理解它。我们理解它,不仅是因为我们使用ChatGPT,而且我们每天都在iMessage、Slack和Discord等所有这些东西上互相发消息。所以我想知道这是否是人们将无限期地继续进行计算的方式。我认为,在应用层面上,有一个开放性的问题,即最终状态是什么?一个答案是,最终状态是……

这些超级精心设计的软件应用程序,例如想象一下Slack或Notion,它们确实在2010年代甚至更早之前就主导了应用程序层。我的意思是,2000年代和1990年代也是如此。这些非常丰富的图形应用程序成为了我们完成工作核心部分。

我认为另一个问题是,A应用层是否朝着为你工作的初级员工的方向发展,其中界面是你与他们交谈?你有一些软件产品,比如Devon,它只是你的初级员工,他们与你的整个界面就是你只是在Slack上给他们发消息。你有一些语音界面,你只需对着它说话并告诉它你想要什么。而且

你知道,我们不会点击我们的员工。我们给他们发电子邮件和打电话。这是一个关于我们去向的巨大开放性问题。这也产生了许多其他的相关问题。一个例子是定价。GUI软件应用程序按座位定价,但员工按小时定价。根据我们走哪条路,我们最终也可能采用不同的商业模式。

太对了。是的。你怎么看待语音?我的意思是,你认为这将是人们与代理和人工智能互动的一种方式吗?我的意思是,有一些显而易见的情况,但是,你知道,假设我正在与Gamma互动。就像,是否存在一个世界,在这个世界中我正在与Gamma交谈,而这实际上更高效?我认为是存在的。我认为这是我们路线图上很可能要做的事情。我认为如此的原因是,对话是一种非常自然的媒介。

说话通常比写作更容易。我们有一种心态,那就是我们正在努力打造你的AI设计合作伙伴。对于演示文稿来说,有一个非常明显的类比,那就是不是我们大多数人,而是CEO、高层管理人员通常不会制作自己的幻灯片。相反,他们有专门做这件事的人。他们有员工是这些非常擅长工作的演示文稿设计师。

他们只是给出非常模糊的意图。他们说,我想要一些展示我们正在推出的三个产品的东西,它需要感觉像史蒂夫·乔布斯的主题演讲。所以在那里添加一些动画,让它看起来像那样。可怜的人类必须想出,好吧,这是我认为你意思的三个想法。让我给你看一些。他们说,不,不,不,根本不像那样。顺便说一句,中间一个,发布被推迟了。所以重新制作整个东西。这就是界面的样子。我觉得与AI合作制作演示文稿将趋于非常相似的流程。

除了它不是一个人需要花一天半的时间才能获得结果,并且整个时间都感到压力重重,而是一个AI在几分钟内就能给你这三个选项并向你展示它们。当它不是三个选项时,它就像10个选项,因为当涉及到AI时,多样性是如此的自由。这些模型是多模式的事实使得它与与另一端的人类互动更加类似。

结束,对吧?就像,哦,我正在回答你的问题,但也要像,让我给你看这个东西。就像你说的,让我给你看10个想法。这些是实际的图像,对吧?哦,我还为你制作了实际的产品。这是软件。去试试吧。对。顺便说一句,我为你丢失了产品。是的,完全正确。是的,我的意思是,我真的,我认为你正在为它做一个令人信服的案例。我完全可以想象每个产品都会朝着这个方向发展。

我们在谈话中到达的方式是,你预料会遇到的一些事情,一些调整是什么?你已经计划好的事情呢?你知道Gamma需要做的事情,你愿意提前给我们一点味道的事情是什么?我们已经暗示了一点,那就是与AI合作的这种更具代理性的体验。对我们来说,这在具体的产出方面意味着

我们非常关注演示文稿的初始生成。所以你给我们你的笔记,我们把它转换成幻灯片的粗略初稿。这很好,但是粗略的初稿只是一个起点。你从那里去哪里?我们现在有一个令人失望的界面,我们给你那个初稿,但仍然取决于你自己来完成剩下的部分。

我们希望在编辑体验上投入更多,以便你能够以大型或小型方式使用AI进行重新编辑。不仅是AI,还有大量的工具。因此,其中的一些例子包括能够对生成的內容提供反馈并获得另一个调整你想要内容的版本。

但也能够进行高级更改。例如,我想让这个20页的演示文稿变成30页。或者我想让你减少对主题A的强调,而更多地强调主题B。或者想象一下,如果它在一个网站上。你有一个有五到六页的网站,你说,我认为我们应该将此部分拆分为网站上的一个单独页面。我们计划在整个编辑过程中做更多的事情。

我们还计划在我们的核心产品体验中做更多的事情。对我们来说,这意味着幻灯片都是关于视觉效果的。所以我们正在做更多的事情,例如可视化和使想法在视觉上栩栩如生。还有很多事情要做风格。让事物看起来非常独特并与你的品牌相匹配。我们已经在这一方面做了很多,但还有很多事情要做。

最后,我们有这四种主要格式。所以,你知道,网站、文档、社交演示文稿。我认为我们会看到更多。我不知道什么时候,但我们真正感兴趣的是视频作为一种新的输出格式。所以我们都在YouTube上花费大量时间,你在YouTube上找到的大部分内容

实际上是人们正在展示事物。是人们在谈论想法。有时字面意思是,它就像一个在Google的Lives演示文稿上的说话头像。但有时它甚至只是这些更细致的伪演示文稿,他们只是浏览几个想法,

而AI在这方面打开了如此多的可能性。非常简单的事情,例如,只是为我写下在视频中要说的话的笔记,但也有一些非常巧妙的事情,例如上传我的AI化身来为我呈现我的内容,但没有我实际呈现时会出现的那些“嗯”和“啊”。哇。

我不知道你是否曾经尝试过录制30分钟的演示文稿。你总是在第4张幻灯片中间搞砸,不得不重新开始,然后把它拼接在一起。这就像一个巨大的痛苦。因此,能够让这一切都非常无缝将是一件大事。这听起来真的很酷。感谢你分享这些。你谈到了公司成立于2020年,然后,你知道,在大约ChachiBT的时候,好吧,Stable Diffusion和ChachiBT,你很幸运。你得到了这个巨大的顺风,显然增长,

从那时起,增长一直令人难以置信。对团队和你们作为创始人的感受是什么?几年听起来我们真的很努力。现在只是爆炸性的增长。你如何与团队一起管理它?团队如何处理它?文化如何发展和适应?随着团队和收入的增长,你的不同流程如何发展和适应?告诉我们一些关于这方面的信息。你知道,这仍然很难,但这是一种完全不同类型的困难。这有助于真正理解产品市场契合度到底是什么。我实际上在Twitter上看到有人开玩笑说,没有产品市场契合度真的很有趣,因为存在着生存的恐惧,但你也可以随心所欲地做任何事情。你只是按照你感觉到的任何速度来构建你相信的东西。

一旦你踏上拥有大量客户需求你的产品的过山车,你就无法再以多种方式控制方向的速度。你正在以各种方式被市场所吸引。所以对我们来说,这种市场拉动看起来像

好吧,首先是扩展到,我认为我们最近宣布我们突破了5000万用户,哇,这比我们曾经想象的要多出多个数量级,所以很多系统都崩溃了,我们花费大量时间只是,你知道,跟上……

需求。还有一些事情,例如我们发现超过一半的5000万用户甚至不会说英语,也不在美国。因此,你必须改变你的优先级,并突然开始构建国际化,因为在某些时候这简直是显而易见的事情。这会损害你路线图上的其他事情。我认为我们的团队非常有韧性和适应性。有很多变化,但这也很令人兴奋。我认为我们都知道,在一个如此有趣的产品上工作,并且正在经历如此强烈的增长,是一种荣幸。这是我们所有人可能只会在职业生涯中经历几次的事情,如果有的话。所以我们都知道这是一场过山车。就对团队意味着什么而言,我们的一位工程师将其描述为Gamma正在经历的青春期。所以我们已经从基本的童年时期走过来了,但我们也不是大型成熟的公司。我们正在弄清楚负责任地发展以及如何建立我们以前可能没有的许多结构意味着什么。

但要真正保持这个灵活的公司,它仍然担心自己会消亡。你期待Gamma获得哪些大型模型创新?你真的希望……

Anthropic或ChatGPT或任何其他模型公司做什么?你希望他们构建什么?其中一个实际上刚刚发生,这是我们长期以来的圣杯,那就是带有文本的图像。事实上,我认为随着AI的发展速度,这已经发生了。我们会非常擅长制作带有文本的图像,但它总是感觉遥不可及。OpenAI的新GPT图像模型是第一个真正看起来像已经实现的模型。

它仍然不完美,而且速度很慢。所以我认为我们期待的是一个世界,在这个世界中,在几秒钟内制作带有文本的复杂图像几乎毫不费力。这对我们来说是一个范式转变的例子,因为在某种程度上,所有的幻灯片都是带有文本的图像,反之亦然。带有图像的文本。因此,根据技术的演变,它可能会重新调整我们处理产品路线图的方式。然后在其之上还有另一个创新,那就是获取这些带有文本的图像

然后将它们转换成视频。突然之间,像幻灯片动画这样的事情可以用完全不同的方式完成。它们可以完全程序化地生成。因此,我们也非常关注AI视频领域及其发展。但很有趣。那是很多闪闪发光、很酷的东西。还有一些基本的东西。我们是模型质量的学生,因为我们非常依赖它。我们将这种质量传递给我们的用户。有趣的是,对于所有关于,哦,我的天哪,AGI和世界将在2027年爆炸的讨论,

大型语言模型仍然在努力解决他们一直以来都在努力解决的许多相同的问题。对我们来说,这些能力实际上非常基本。它们就像,它能否同时遵循多条指令?

我们可以向它提供20页的内容,并确保它的输出不会编造任何原始内容中不存在的事实吗?它们在很大程度上尚未解决。与基础模型公司合作非常有趣,因为我们实际上有幸能够在多个基础模型之间进行选择。从我们在Optimizely的根源出发,我们有自己的评估,但我们也对它们进行了大量的A/B测试。所以我们不断地测试,这个新的anthropic模型是否比这个新的Gemini模型或这个新的OpenAI模型更好?

我们对基于用户偏好的模型能力变化有这种有趣的定量感觉。它们正在向前发展,但可能不像许多基础模型公司希望我们认为的那样剧烈。我相信这些模型在未来12个月内将发生巨大的变化。所以也许如果我们过一段时间再做一次这个,我们会对它们有多么不同感到惊讶,或者Gamma到那时会有多么不同。我想我们会看到的。是的,我很想。希望两者都能得到很大的改进。是的,当然。

好吧,Gamma做得很好,显然,所以我认为你没有什么好担心的。但是John,非常感谢你。这太不可思议了。非常感谢你的时间,并祝贺Gamma的一切。谢谢。我真的很感激,迈克,来到这里真是太棒了。

如果你喜欢这一集,请帮我们一个忙,在Spotify和Apple Podcasts上对节目进行评分和评论。这确实很有帮助。如果你想了解更多信息,请在YouTube、X、LinkedIn和其他所有地方关注Lightspeed at Lightspeed VP。Generative Now是由Lightspeed与Pod People合作制作的。我是Michael McDonough,我们下周将与另一位嘉宾进行对话。到时候见。