大家好,欢迎收听Generative Now,我是Michael Mignano,Lightspeed的合伙人。今天播客的嘉宾是Mikey Shulman,Suno的联合创始人兼首席执行官。对于不熟悉Suno的朋友,Suno是一家利用人工智能打造音乐未来的公司。在本期节目中,我向Mikey提了一系列关于他的公司以及过去一年发展历程的问题。
但我们也转向了X平台的观众,在时间线上询问了许多人的问题。因此,我们浏览了大约20或30个问题。我认为这是一次很棒的对话,我相信您也会喜欢。所以,请收听与Mikey Shulman的这次对话。
嘿,Mikey。嘿,你好吗?很好,很高兴来到这里。很高兴见到你。感谢你再次来到节目。是的,我的荣幸。是的,当我们第一次一起录制这个播客时,我几乎不认识你。我想我刚认识你。而现在,很明显,Lightspeed投资了你的公司。我们经常聊天。直播。
Suno发生了很多事情,所以我很高兴你再次来到播客,并向大家更新Suno世界正在发生的事情。我们有一个有趣的小环节要进行,但在进行之前,自我们上次在镜头前交谈以来,Suno世界有什么新鲜事吗?——是的,很高兴回来。我想大约一年了。增长了很多,接触到更多的人,这大概是我工作中最棒的部分。
只是把音乐的快乐带给越来越多的人。从那时起,我们发布了几款新模型,因此音乐质量更好,使用更有趣,控制更好,歌曲更长,而且还有一些新的功能。我想我最喜欢的仍然可能是翻唱。因此,您可以将一首Suno歌曲重新构想成一种新的风格。
这对我来说非常上瘾。另一种平台转变是,我们已经推出了一个移动应用程序。因此,很多人都在手机上使用Suno。无论他们走到哪里,它都与他们同在。当灵感来临时,他们可以抓住它。他们可以更快地表达自己,更多的是快速的快乐,这才是音乐应有的样子,它可以伴随你走到哪里。是的,这些模型非常棒。我认为我们一年前或某个时候在这里交谈时,我认为模型是2.0版。
从那时起,你已经做了3.0版,现在是4.0版,而4.0版简直令人难以置信。2.0版向人们展示了未来可能的样子,但这并不是一首你可以在广播中听到的歌曲。4.0版基本上听起来像是人声,这样说公平吗?很多时候是的,是的,这很有趣,但并非总是如此,你知道,有时会出现瑕疵或错误,这与你通过其他方式创作音乐时的情况一样,有时当我
弹钢琴或贝斯时,我会犯错。有时模型也会犯错。但是,总的来说,我会说它是广播级别的音乐。太疯狂了。然后是你提到的移动应用程序,它就像一个新的平台,新的,你知道,新的交互模型。
这感觉像是件大事,对吧?我的意思是,在Suno之前,创作音乐非常困难。你必须在录音棚里用乐器和昂贵的设备来创作。然后Suno让你可以直接从你的电脑上创作。然后是应用程序,就像你说的那样,你可以在任何地方的手机上创作。
我不知道,感觉这对于音乐来说是一种范式转变,如果它成功的话。——是的,我认为这是一个非常令人兴奋的转变。我们经常谈论音乐的未来,人们创作音乐的次数越来越多,这意味着无论他们在哪里,本质上这意味着你的手机,但你的手机也是一件令人难以置信的技术产品。
它不仅仅是你电脑的小型版本。它有摄像头,有触摸屏,有麦克风,并且利用所有这些优势,让人们以新的方式、有趣的方式表达自己,创作音乐,分享音乐。所以我认为我们仍然处于这段旅程的早期阶段。例如,我们并没有充分利用触摸屏,但我期待很快会有更新。人们在移动设备上进行输入和创作的方式与在台式机上有什么不同?我知道你可以使用照片输入,你可以
对着它唱歌。这是否会改变人们的创造力?当然。你知道,我认为虽然你可以在台式机上使用照片或
音频,但从手机上使用它更自然。你可以快速拿起你的手机,打开麦克风,唱点什么,哼点什么,敲打节奏,并以此作为灵感。例如,当你找到你的电脑,把它拿出来,连接到互联网时,
那一刻已经过去了,所以我们看到更多的是这种多模式输入,而不仅仅是你想看到的歌曲的文本描述是的,这超级超级酷。所以,我认为Suno可能是最受关注的人工智能公司之一,尤其是在消费者领域,感觉上只有很少的消费产品真正脱颖而出,并在普通大众文化中为人所知。Suno就是其中之一。很多人都在谈论Suno。所以我显然对这家公司了解很多。我们是投资者。我们事先谈过话,我们决定从一些使用类似模式的其他播客中获得一些灵感。有一个叫做Technology Brothers的播客一直在这样做,他们会访问时间线并提取
他们会从时间线上提取问题和帖子。鉴于人们对这家公司谈论得如此之多,让我们找出他们真正想知道什么,让我们吸引观众,让我们得到一些问题。所以,如果你愿意的话,让我们浏览一下这些问题。让我们开始吧。我很兴奋。我将在这里读一些。第一个问题来自Octavia Grout,她说,
他们有计划发布API吗?——我们可以花点时间谈谈你的打印机吗?——是的,对不起。——你那台黑白条纹的打印机。作为Lightspeed投资组合公司的一员,我很高兴你没有在打印机上花钱。——听着,听着,作为一个前创业公司创始人,实际上是现在的创业公司创始人,我想在花钱方面精打细算,所以我用我的家用打印机打印了这个,好吗,用我的家用打印机。——我印象深刻。——显然我们的墨水有些条纹,我得检查一下。
但与此同时,我们可以阅读文本。好的,没问题。是的,好的。你有什么计划发布API吗?目前没有计划。我经常收到这个问题。这是一个非常好的问题。我思考这个问题的方式是,不要把我们当成模型供应商公司。我认为我们正在努力为最终用户提供愉快的音乐体验。而API并没有真正让我们更接近这个目标。我们正在努力为人们打造美好的体验。所以
所以这看起来像是一个次要任务,你知道,在创业公司能够专注的范围内,这就是你获胜的方式。所以现在并没有考虑这个业务。你在这里基本上暗示的是,是的,你可以有一个API,这可能会进一步促进让更多人通过其他产品创作音乐的使命,但是这些其他产品可能无法达到
你试图为人们提供的创造力质量或门槛。你只能真正做到这一点,只能真正从你自己的经验中做到这一点。我认为这其中有很多原因。并不是说存在质量门槛。然后还有,你知道,我们正在努力构建音乐的未来。然后还有我们不想构建的音乐的未来。我们不一定想让别人这样做。例如,有人只是,你知道,使用我们的API来制作
无休止的、有点反社会的音乐流。你可能可以用我们的API想出如何做到这一点。我不想启用它。我试图启用更积极参与、更社交的版本。就像你可能永远不会看到Instagram或TikTok这样做,对吧?他们可能非常重视他们的工具及其产生的创造力。所以
为什么你要让它发生在其他地方,而不是像这种格式的最佳体验?——我认为这是一个很好的类比。——是的。——好的,酷。所以Octavia,希望这能回答你的问题。我们刚才谈到了模型。我们收到了Cody Baker的一个问题。
Cody问道,下一个模型会是什么样子?我们可以期待乐器和人声的真实性提高吗?音乐控制的极限是什么?在某些乐器的真实性、某些人声的真实性和一致性方面,仍然有一些空间需要提升,并且提高下限。你肯定会看到这些方面的提升。
但是,我们离控制的极限还差得很远。我思考这个问题。不同的人能够以不同的方式描述音乐。你和我可能会听同一首歌。我们可能有不同的看法,我们也可能以不同的方式描述它。在如何处理你脑海中模糊的概念,并反复迭代直到我们得到最终产品方面,我们还有很多工作要做。
所以,也许我们距离感知人声质量的极限只有一两个模型的距离,但也许我们距离真正良好地控制它还有十个模型的距离。所以我认为你可以在未来看到,我们将更加关注控制,当然与例如音质或音质相比。我经常在我的脑海中为这些模型做的一个类比,不仅仅是音乐模型,还有文本、视频。记住,我们小时候
至少在我们成长的时代,视频游戏机的图形质量总是有一个飞跃,对吧?它是8位,然后是16位,然后是32位。然后在某个时候,它就不再重要了。它就像达到了顶峰并趋于平稳。这是否也是现在音乐的情况,或者这就是你暗示的意思?我认为我们正接近那个点。这是一个非常好的类比。而且,你知道,获得更高的帧率只在一定程度上有所帮助。然后它就会消耗大量的电力和资源。但这并不意味着游戏中没有大量的创新,无论是场景、实际游戏还是你拥有的控制方式。再说一次,是的,我会看到
我们离极限还差得很远。我认为将我们试图达到某种人类门槛的说法,是一个有点错误的类比。我们试图做的实际上是推动现在人类门槛所在的位置,并在各个方面推动现有音乐的质量。当你这么说的时候,我想到的是,当我听Suno音乐,尤其是4.0模型时,我听到这些音乐类型,这些类型的混搭,我几乎感觉像
或者说是全新的。就像我以前从未听过一样。人类从未将这两样东西放在一起,比如萨尔萨舞曲和死亡金属。或者我不知道。我只是编造的。但这可能有点你所说的意思。就像人工智能实际上可以将事物推得比我们以前所做的更远一点。我认为不止是远一点,我认为是远得多。我认为,当你让人们更容易地概念化事物时,他们可以更快地思考概念。他们可以更快地迭代。这就是音乐将更快地发展,并发展到我认为比现在更酷的地方的方式。
好的,下一个问题来自Ronnie Brucknap先生。他询问他对人工智能音乐创作的愿景,以及它可能如何影响独立艺术家。自动化是有助于还是损害了创造力?我认为这是一个非常好的问题。这是一个长期的问题。
我会说,在创作音乐方面,你知道,技术已经成为创作音乐的一部分已经有几百年了。总的来说,所有发生的科技进步都使得创作音乐更容易,让更多人能够创作音乐,创作出更多音乐,并且实际上对音乐本身非常有益。我可以告诉你,我认识一个人,他是一位歌曲作者,他的创作力曾一度停滞不前,但在发现Suno之后,他从每年创作大约50首歌增加到每年创作500首歌。这些歌曲中的大多数可能不会面世,但这在创造力方面是一种突破。所以我认为总的来说,很明显所有这些技术都是好东西。关键在于你如何使用它们。我认为我坚信,总的来说,人工智能和大多数技术都是中性的。有好的用途也有坏的用途。所以我们专注于构建好的用途。这太迷人了。50到500这个数字让我想起了
许多作家如何从大型语言模型中获得价值,将其作为思想伙伴,对吧?例如,充实报告、论文或创意写作。就像你可以与之交流想法,对吧?并与之进行对话。
它存在于每个领域,说它是副驾驶有点老套,但你可以在从代码到各种领域看到这一点,你知道,工程师编写代码。现在你可以有一个副驾驶来帮助你做到这一点,这些副驾驶可以为你编写代码。他们可以为你检查代码。当你写电子邮件时,你可以有一些东西来写电子邮件、改写电子邮件或检查电子邮件。如果你正在为电影编写剧本,你可以在检查某些内容、改写某些内容或,好吧,我只是来这里,我被卡住了,我只需要看到一些奇怪的想法,然后……
我认为总的来说,增加现有奇怪内容的数量实际上对人类的创造力非常有益。这些东西在这方面非常出色。好的,我们收到了来自Lorenzo Bartolini的一个问题。Lorenzo想知道,对人工智能和音乐的版权适用性感到好奇。我相信他在这里想问的是,这些东西可以获得版权吗?当你用人工智能创作歌曲或用人工智能创作视频或写作时,是否
你可以获得版权吗?这是一个很好的问题。你是律师吗?让我先声明,我绝对不是律师。所以我将告诉你我对它的当前理解,它正在不断发展。实际上,就在几周前,美国版权局提供了更多指导,也就是说,如果你只是输入一个提示,然后出现一首歌曲,那么这首歌将不会拥有版权,你需要更多的人工输入才能使这首歌拥有版权。
例如,也许你必须带上你自己的歌词。也许你必须做其他事情,带上你自己的音频等等。我认为我会密切关注这种情况的快速发展。技术发展得非常快。而且我很高兴它没有被写入法律,因为法律的变化会慢得多。我不知道需要多少人工输入才能获得版权。但我知道我不想成为这方面的仲裁者。而且我很高兴世界上还有其他思想伙伴。我想。
如果这实际上,就像你说的那样,也许一件好事是它还没有被刻在石头上,因为我们可能只会看到人们创作音乐的方式发生如此巨大的变化,尤其是在人工智能方面,对吧?感觉人工智能有可能创造出这种混音和重新构想音乐的爆炸式增长,对吧?你创作一些东西,然后我重新构想,然后有人重新构想,然后
是的,我只是想知道版权是否会阻碍这种创造力水平。所以也许我们确实想看看事情是如何发展的。我认为在事情被写入法律之前,你想要你想要看看事情是如何发展的。但我还是要提醒你,版权法最初是为了增强和促进创造力,而不是扼杀创造力。这就像贯穿所有版权法的一条主线。
为了推动激励措施,比如给你创作东西的激励?是的,为了激励人们有创造力,而不是阻止人们有创造力。例如,之前的宽松指导是人工智能内容不能拥有版权。我很高兴这一点得到了细微的调整,因为这实际上并没有激励人们使用这些新工具进行创作。好的,我们来看Ansh.com。
B'shifta,提出了一个现在许多人在人工智能领域都在问的问题。我每天听到这个词大约10次。那就是“护城河”这个词。
他问道,你们的护城河是什么?哦,Suno的护城河是什么?护城河是一个四个字母的词,对吧?我不知道我们是否可以谈论这个。这是一个四个字母的词。是的,我,你知道,我很想知道你对此有何看法。这是,这是更接近你的日常工作,我想,而不是我的,但我不知道Suno是否有一种新型的护城河。我不确定人工智能是否会带来新型的护城河。我认为这个行业的护城河将与旧的护城河一样。也就是说,我们必须打造一款比竞争对手更优秀、更具粘性的产品,它具有一定的数据或网络
效应,否则我们将不会拥有护城河。是的,我认为这是对的。我实际上只是在谈论这个话题,不是关于Suno,而是关于某种防御能力和应用层,与我的一些合作伙伴前几天进行的对话。是的,我们得出的结论是,在人工智能时代存在的护城河可能与之前存在的护城河非常相似。它不在技术上。我实际上坚信,技术实际上并不可靠。它只是代码。代码可以被复制。代码可以被重写。多年来,我们已经多次看到这种情况,尤其是在消费者领域,有人构建了一些很棒的新格式或界面,然后砰的一声,猜猜怎么了?Meta复制了它,他们利用了他们的分销,你就完了。
所以我认为技术不是护城河。我认为护城河是像你说的那样,网络效应可能是最大的一个,某种数据护城河。我并不一定意味着为人工智能模型提供数据。我的意思是,如果你经常使用该产品,并且该产品拥有你所有的偏好、数据、播放列表以及其他所有内容,那么在你停止使用该产品之前,你会三思而后行,因为你将失去所有这些东西。
人工智能使得人们很容易构建产品,现在竞争更加激烈。竞争越激烈,这些东西就需要越强大,对吧?你的网络效应需要更强大。你的先发优势和分销需要更强大。所以这是一个竞争更加激烈的市场。但是,是的,我认为护城河大体相同。我会说两点。你知道,其中一点当然对我们来说。
我们没有这些需要花费数亿美元才能制作的巨型模型。所以这一点立即就被排除在外了。听到你说这些话,实际上让我想到,当我提到数据或网络效应时,它们实际上是一回事。数据优势就像你需要一些东西,你正在构建的产品的价值随着使用它的用户数量而增加。而数据只是达到目的的一种手段,基本上就是这样。是的,我认为这是完全正确的。好的。好的。
Adam McIsaac,Adam提出了一个非常有趣的问题,关于格莱美奖。Mikey认为在格莱美奖上看到人工智能作品之前需要具备哪些先决条件?Suno如何为这个未来做出贡献?这非常有趣。我觉得我们几年前在流媒体方面看到了这种情况,对吧?像流媒体电影在奥斯卡颁奖典礼上是不允许的。我不记得这是什么时候改变的,但是,在音乐界看到这种情况之前,会发生什么?我认为这是一个很好的问题。你知道,我认为我不想
只是那个不同意前提的人。但我知道有些制作人正在使用Suno,他们最终……Suno的一小部分最终会出现在热门歌曲中。所以,如果你只是想说,Suno的一小部分什么时候会出现在一首获得格莱美奖的歌曲中,也许它已经发生了。也许很快就会发生。它发生了?我不知道。格莱美奖不是……
格莱美奖最近才颁发,但我不知道具体是哪些歌曲使用了它。我只知道它存在。是的。我们必须找出答案。我们必须找出答案。我认为这些事情,总体态度会慢慢发生转变。我认为五年后,我们不会再谈论人工智能音乐或非人工智能音乐。所有的音乐都将包含人工智能的部分。就像今天所有的音乐都是数字制作的。或者包含样本。或者包含样本。再说一次,我并不是想
那个不同意问题前提的混蛋。但我认为这种情况会发生。但在那之前,这将不再是一个突出的问题,比如,一首Suno歌曲什么时候会成为格莱美奖得主?但我确实想知道版权问题是否需要解决,对吧?因为我的意思是,如果有人现在用Suno创作了一首完全由人工智能生成的歌曲,根据刚才的问题,他们无法获得版权。如果他们无法获得版权,我不知道。它能获得格莱美奖吗?我不知道他们的规则是什么,比如
将所有权归属于歌曲作者或母带权利。我不知道。我不知道所有的规则,但我确实知道,在事情明朗之前,如果有人这样做,他们永远不会承认Suno参与了这个过程。对。这对你来说一定很有挑战性,对吧?由于
版权问题,人们可能不愿意承认他们使用了该工具。这绝对具有挑战性。绝对让我们失去了一些合法性,因为我们无法谈论我们知道正在使用Suno的巨星。另一方面,我认为,你知道,我对遇到的绝大多数创意人士都会在私下承认他们使用Suno并且他们喜欢Suno感到非常乐观。所以我认为这是这些潮流发生转变的问题。我同意。
好的,下一个问题。Ondu询问他是否关注市场的两面,还是只关注创作者。如果不是,为什么不是?分销难道不 altrettanto 重要吗?你如何看待另一面,不仅仅是创作,还有消费和分销?很好的问题。分销绝对同样重要。我们经常思考这个问题。你知道,我思考这个问题的方式是,我们可以启用什么?
这在以前并不存在,这将成为音乐未来的重要组成部分。所以我们在创作方面做了很多以前不存在的事情,比如说几年前。但我认为在消费方面还有很多今天不存在的东西,我们可以帮助人们启用更具吸引力的音乐消费体验。然后是另一方面,你想给创作者提供一种表达自己的方式,让他们为自己的作品感到自豪,并能够
指出这些都是我在一个很好的连贯的地方创作的Suno歌曲。所以我认为你将开始看到更多关于有意义的消费体验的内容。上周我们发布了评论功能。这非常重要。你现在可以评论你喜欢的或不喜欢的歌曲。并且
我会说几件事。首先,它实际上非常积极。就像几乎不需要审核一样,这太棒了,考虑到你进入时的偏见或你进入时的先验概率可能是关于互联网上的所有内容。但这是一种让人们真正获得他们创作作品的外部认可的方式。收到有人评论你歌曲的通知感觉很棒,你会看到,你知道,他们只是做了很多火表情符号之类的东西,对吧?我认为这是一种基本的人类愿望,希望通过你创作的
东西来获得满足感。所以我认为你会看到我们在未来一年投入更多精力到这方面。是的。另一件事是你做得很好,让人们能够在现有的分销渠道、其他社交网络、X、TikTok、Instagram上分享这些东西。你有一些非常棒的共享资源。很明显,这些平台也具有反馈循环和反馈机制。所以
感觉你实际上在这方面做了很多分销工作。很明显,在您自己的平台上添加评论等方面还有更多工作要做。我的意思是,我认为你也会看到这一点。Suno上有一些歌曲的播放量达到数十万甚至数百万次。所以,你知道,这说明正在进行一定程度的分销。是的,完全正确。
好的。这个我会把它归类为错误报告,或者说是播客上的实时错误报告。来自Federico的消息说,我喜欢Suno,我已经使用它很长时间了。但是音频质量差的问题,也就是所谓的“闪光”,自从V4版本以来就变得越来越严重了。
你对“闪光”有什么看法?我不知道“闪光”是什么。你能解释一下吗?V4版本大幅提升了音频质量。我想我们现在已经发现了这个瑕疵,我只能把它描述成你会听到背景中的一些闪闪发光的聲音。这个问题已经得到修复,并且正在修复中。所以我们已经发布了一些修复程序,大大减少了这种现象。而我们知道的最后一点,你应该很快就会看到修复。它听起来像什么?为什么会发生这种情况?就像嘘……
它不像嘶嘶声。我不知道。我想我无法在现实生活中为你模拟这种“闪光”的声音。从技术上讲,在引擎盖下,是什么产生了这种声音?你是一个鼓手。想象一下,有人在你所有的钹上都装上了铆钉。就像那样。所以它就像是一种持续存在的闪光效果,而你并不想要它。你想要的是非常干的声音。但我我想说的是,模型或技术中的什么会产生这种声音?到底发生了什么?所以,你知道,我认为这类似于
如果你曾经听过波形文件,然后同一个波形文件经过MP3压缩,你会听到这些小的压缩瑕疵。我们对声音建模的方式,存在一个编解码器,它是一种压缩算法,用于将这个非常非常大的信号压缩成更容易处理的东西。我们构建这种算法的方式,有时会引入这种闪光效果。所以对于MP3,你知道,你会听到那种高频压缩。
嗯,对于Suno编解码器,有时你会听到一点闪光。有趣。好吧,听起来它正在被处理。我们正在努力解决这个问题。是的。感谢你的错误报告,Federico。是的,我的意思是,我会尝试把它添加到我所有的播客剧集中。Seth Miller,我相信Seth是另一家AI音乐公司Rap Chat的CEO。他说,
事实上,他提出的第一个问题我们已经解决了。是关于API的。但是他第二个问题是Mikey对像你一样开源的新模型DeepSeek的看法。为什么你在DeepSeek发布的那个疯狂的周末,另一家中国公司发布了这个UA模型,它实际上是一个深度
开源的Suno,如果你愿意这么称呼它的话。所以你可以输入歌词,你可以输入风格,然后就会产生音乐。也许它听起来像Suno的V1或V2版本。老实说,我希望它能很快变得更好。而我想到这一点,这是一项令人印象深刻的工作。像所有这些东西一样,它会变得更大,会变得更好。保持在技术前沿并不断创新是昂贵的。你知道,我是这样想的。当我们考虑
AI作为一种中性技术,它有好的用途,也有坏的用途。而这仅仅是使它民主化,并使人们更容易构建一些好的用途,但也包括一些坏的用途。而我对像这样的开源项目感到担忧的事情,并不是那家公司本身,而是有人利用他们的开源模型,例如,构建
艺术家克隆应用程序,你可以在没有他们的许可的情况下制作你最喜欢的艺术家的无数歌曲,或者构建那些对音乐有害的未来,这些未来只会将注意力从它应该去的地方转移开。因此,这项技术本身是有用的。而且,你知道,所以我对它被用于善事持乐观态度,但这并不是一件必然的事情。
像DeepSeek,你知道,有所有这些关于DeepSeek正在提取其他模型的传闻。我的意思是,你有什么理由相信这个模型像提取了Suno或类似的东西吗?这完全有可能。老实说,我们有比现在试图弄清楚这件事更重要的事情要做。但我们知道人们试图抓取我们的内容。是的。所以这不会让我感到惊讶。是的,我想关于这件事,它可以被用于善事,也可以被用于坏事,就像
我想到的是,猫已经跑出来了,马已经跑出了谷仓。你无法把精灵放回瓶子里。AI音乐已经出现了。它只会越来越大,越来越大,越来越大。而且希望有一些参与者和优秀的参与者正在用它做一些非常好的事情。这显然会使生态系统受益。嗯,
然后会有一些参与者做一些不太好的事情。所以,是的,希望好的参与者能够被赋能去做这件事。我希望如此。我认为我们可以从上一波音乐技术中吸取教训,那就是你不需要完全根除不好的解决方案,但你需要有好的解决方案,这些解决方案易于访问,方便人们使用。然后他们就会去使用它们。对。例如,
如果你在早期就关闭了Spotify和Apple Music,人们就会找到另一个Napster。- 我相信你已经听过关于Spotify的故事,并且听过Daniel X的一些采访,但是你知道,整个事情,最初Spotify的全部意义在于,让Napster和这些公司做得如此之好,以至于人们不介意为此付费,对吧?Napster很棒,因为它免费,但它是违法的。
所以你必须有一个比Napster更好的解决方案,才能让人们愿意为此付费。这就是Spotify。它就像字面意义上那么好。所以他们创造了一个很棒的产品。我唯一知道VPN的原因是,最初我想在Spotify在美国可用之前尝试一下。有人告诉我,哦,有一种叫做VPN的技术,然后你可以去尝试一下。所以我认为,是的,拥有令人惊叹的替代方案是正确的做法。是的。好的。Pouya问,Mikey最喜欢的AI工具是什么?
曲目?你知道,在我的心中仍然对Oliver McCann的《Stone》怀有特殊感情。很棒的歌。很棒的歌。它在Suno排行榜上名列前茅了一段时间。Oliver是一位伟大的创作者。我与我的孩子们一起创作的一些东西真的与我产生了强烈的共鸣。所以如果你能让我选择的话,那就是我的选择。好的,酷。
你已经谈到了一些,但也许你可以扩展一下。Hadrian Labs说他预计下一个版本Suno 4.5或5,以及他认为它将如何改进。好问题。正在努力开发中。初步进展非常好。
非常令人兴奋。更好的歌曲质量。你会看到更好的音质。我期待的是在控制方面,能够更富有表现力地使用各种描述。因此,你可以向你的音乐添加10个、12个或20个描述符,它会同时倾听所有这些描述符。这听起来像是一个不错的功能,但实际上它远不止是一个不错的功能,因为它意味着你能够更具实验性地表达自己,并且你可以进一步推动音乐的发展。
当你提到“控制”这个词时,你在我们的谈话中已经说过几次了。你到底是什么意思?就像当你当你提到像我想象中的旋钮和滑块一样,我应该想象的是那样吗?或者你只需要更多像描述符,还是我认为控制所有这些。它就像,是的,我是否给了你旋钮,让你更容易获得你想要的声音?但是,我只是听取了你给我的描述符吗?你知道,如果你要求一个铃鼓、一个萨克斯管和一个
木琴,所有这些乐器都出现了?现在当我添加一些情感关键词时,你知道,我可以说情感的,我可以说氛围的,我可以说悲伤的,我可以说快乐的,我可以说快节奏的,我可以说流畅的,你知道,所有这些东西。如果我只是把所有这些都给你,那么对音乐的解释应该真正倾听所有这些东西。所以我把控制非常广泛地理解为,我如何让人们
通过任何可能的方式尽可能快地迭代到他们脑海中的声音。可以是文本,可以是音频,可以是图片,可以是任何其他东西。我发现Suno的一个问题是,当我输入太多描述符时,你知道,嘿,我想做一个雷鬼、放克和死亡金属的流派混搭,无论什么,最终它只会变得
太混乱了,这几乎就像当你试图混合太多颜色时,它只会变成棕色一样,对吧?你是否看到,控制是否会产生递减的回报?也许吧,但我们还没有接近它。所以我希望你在下一个模型中看到的是,它能够很好地从每个流派中挑选出一些小片段,并创造出一些有趣且连贯的东西,而不是变成一团糟,或者只是忽略你所说的一半内容,这两种情况都不好玩。
好的。Wayne有一个问题。Mikey是如何考虑Suno产品的演变的?例如,用户人声、乐器交换、流派融合等等。简短的答案是所有这些。我认为,是的,
在某种程度上,音乐必须变得更好,但创作流程必须变得更直观、更容易和更有趣。所以我认为你将会看到上面提到的许多事情出现。然后我对更多多人游戏内容、更多社交内容最看好、最兴奋,让大家一起创作,让大家拥有这些合作体验,无论是
同时你和我一起在电脑上做不同的事情,还是异步地,例如,我可以创作一首歌曲,你可以重新混音,我们可以这样合作。昨晚,我们实际上进行了直播。所以我们与Timbaland进行了一场比赛,粉丝们可以重新混音他的歌曲之一。对我来说,这就像
音乐未来的一个令人难以置信的部分,在我看来,这是粉丝和艺术家之间互动最高的形式。这是最高形式的奉承。我觉得我可以和我最喜欢的艺术家一起创作音乐。我觉得自己是创作过程的一部分。所以我们昨晚进行了一场直播,播放了比赛的前五名获奖者。听到Tim喜欢这首歌还是那首歌,真的非常酷。所以他坐在那里,对这些歌做出反应。他已经听过所有这些歌了。有很多很多。
然后他已经选出了前五名。如果我们必须,如果我们必须同步地一起听所有这些歌,我们会待在那里一年,嗯,嗯,同步地一起。当这是你最喜欢的艺术家时,这很酷,但是,当这是你的朋友时,这也同样酷。所以,嗯,我认为这是音乐未来的一个巨大组成部分,你会看到我们做更多这样的事情。是的,我可以想象一些东西,比如
几乎像一个消息平台或邮件一样,比如我创作了一些东西,你会收到通知,这就像一个回合制游戏,对吧?比如我先走一步,然后你走一步。然后我走一步,然后你走一步。然后让我们看看10步之后我们会走到哪里,也许是50步之后,你知道,我们每周走一步,我们有一张50首歌的专辑,这是这首歌的迭代。它就像一个坏掉的电话游戏,它从
一个地方开始,最终到达一个完全不同、有趣的地方。这是一段只有两个人才能理解的音乐旅程。这很美妙。这真的很酷。我很想看到你们构建这样的东西。这是来自Scheltz的问题。
Shelts32TT,你对让人们上传他们的声音,然后AI可以润色它们并让他们演唱一首创作的歌曲有什么想法?我们会在某个时候着手进行这项工作。我认为非常重要的是要制定正确的控制措施,以防止人们克隆其他人的声音。但是,再说一次,我认为这就像一个- 对不起,你这是什么意思?克隆其他人的声音?
所以我不想让你用别人的声音创作歌曲。我只想让你用你自己的声音创作歌曲。而且,再说一次,其他人可能意味着你认识的不是你的人,也可能是名人。无论哪种情况,我们都不希望在我们的平台上出现这种情况。同样,这种想要创造一些美丽的东西并向人们展示的基本人类本能。如果技术可以成为实现这一目标的一种手段,创作一首听起来很美妙的歌曲,听起来像你,即使你现在没有最好的声音,那为什么不呢?
我们为什么不让大家这样做呢?那将非常酷。我是一个糟糕的歌手。所以如果我可以对着Suno唱歌,它可以让我听起来,我不知道,像,我不知道,一个声音好的人。不,一个声音好的你。这就是重点。对,对。好的,我明白你的意思了。我的意思是,
这只是自动调音吗?它不仅仅是自动调音。你知道,自动调音可以让你走一部分路,但它不仅仅是自动调音。另一件事是,你知道,如果你想使用自动调音,你必须自己演唱整首歌。根据经验,人们不想这样做。这里有一个羞耻的因素,你知道,我经常考虑这个问题,我的孩子还小,他们实际上没有
你知道,那种羞耻感。孩子们会无缘无故地唱歌。我认为这很美妙。不知何故,文化把这一点从我们身上剥夺了,那就是,无论你在哪里唱歌都没关系,我们可以把它带回来。沿着那些让人们唱歌,然后它就做到的思路。嗯,
有人问,你什么时候会代表人们的歌曲创作视频,对吧?就像,有没有音乐视频,你知道,你的孩子或某人只是尽情地唱歌,让他们的声音听起来很棒,然后砰的一声,就有一个音乐视频与之相配。是的,在某个时候,不是马上,这就是答案。我认为我们从产品方面考虑了很多这个问题,那就是……
这里的重点是提升音乐。所以它不是,我们不想达到这样的程度,让Suno歌曲成为某些视频的背景伴奏,而是要创造一种能够提升歌曲的视频体验。所以,你知道,这实际上就是90年代和2000年代的音乐视频,我相信你看了很多,我当然也看了,而且你很喜欢它们。而且
我们有点失去了这一点。它没有,它们不像以前那样有影响力了,但我认为我们可以把它带回来。对我来说,这并不是很明显的是长篇的。它可能是短篇的。你知道,我认为对歌曲的即兴发挥也是一种很好的方式。喜欢它或讨厌它,TikTok在这方面取得了一些非常有趣的进展,比如你可以加快歌曲速度并为它加上舞蹈。而这实际上,在许多方面,能够稍微提升歌曲。所以我认为后台有很多东西正在酝酿。现在还没有什么可以分享的。好的。Stephen Huang说,
了解活跃的Suno用户中专业音乐家与初学者的比例会很有趣。很难真正确定这些数字。因为中间也有很多,你知道,格莱美获奖制作人和完全新手。但是我们的绝大多数用户都是第一次接触音乐创作的人,他们在其他领域具有创造力,并且发现了这一点,这对他们来说是一个令人惊叹的出口。这是一个来自ProSense的问题。
艺术家什么时候可以一起用Suno即兴演奏?哦,我的天,我真的很想这样做。不幸的是,Prism,短期内不行。人耳对少量延迟非常敏感。因此,网络,即使只是通过网络和互联网连接也会太慢。这是我的梦想。我们会在某个时候解决这个问题。我只是不能保证。等等。这甚至不是其他平台上存在的东西。就像没有实时连接。
某种实时即兴演奏?它必须在你的电脑上运行,才能足够快,让你可以与之一起即兴演奏。除非你想做一些像用Suno剪辑一个伴奏,然后,你知道,在上面独奏之类的事情,事实上,很多人都在社交媒体上这样做。但是像一个真正互动的,一个副驾驶,那就是
和你我一起演奏和倾听彼此,并调整我们正在做的事情的方式。这超出了我们目前所能做的事情的范围。我想也许接下来最好的事情是我们之前讨论过的。这种回合制的想法,这种异步的,我先走一步,你走一步。事实上,我想知道你是否可以在其中加入挑战。比如我先走一步,我挑战你添加人声,对吧?就像,你挑战我给它加上新的主旋律。我不知道。我只是觉得这是未来。好的。下一个问题来自Insight。Insight Ment。
他们什么时候会扩展到更多模态输入?我认为这意味着不仅仅是文本,还有音频、视频和图片。我们现在已经有了。它有点粗糙。我认为你会看到围绕这一点的许多新功能,尤其是在音频方面。你知道,所有这些东西,真正意义上用图片或音频“提示”模型是什么意思?是扩展它吗?是将其以另一种方式融入歌曲中吗?比如,我会哼给你听主歌,然后围绕它创作一首完整的歌曲。所以我认为你会看到我们开始更多地使用你能够做的事情,例如,你哼到手机里的一小段音频,然后你可以真正地调整它,并将其变成一首完整的歌曲。- 效果如何?你有照片输入吗?你有语音输入吗?效果如何?- 是的,我认为对于照片,所有这些现在都存在。对于照片,我们已经有了一个不错的初始版本。如果说实话,这件事的真正潜力在于它能够比我们现在做得更好捕捉
时刻。我认为你会看到我们在不久的将来会进行一些产品更改,这将真正做到这一点。你知道,举个例子,我认为捕捉照片的灵感,嗯,
可能已经发生了,你应该例如去你的照片卷而不是打开你的相机,是的,你应该分享一些你本来会分享的东西,你可以用音乐来提升这种体验,而不是试图强迫分享一些你本来不会分享的东西。我想知道你是否可以自动做到这一点,对吧?如果Suno,如果你让Suno访问你的照片库,它就像在一天结束时,Suno查看你当天拍摄的所有照片,它就像嘿,这是
这是你一天的配乐。100%。你知道,苹果会这样做,例如。是的,完全正确。想象一下,当歌曲是相关的而不是某种俗气的音乐时,它会产生多大的影响。是的。也许歌词像与你的一天在海滩上联系起来。你知道,你的手机对你的了解如此之多。你知道,这取决于用户感觉舒适地给予什么访问权限,以真正,你知道,创作出真正个性化的音乐作品。我认为这种个性化是人们有点忽视的。它不仅仅是声音完全符合我的预期,流派完全符合我的预期,而是它实际上是关于我的。是关于今天发生在我身上的事情。我想知道你还可以将设备中的哪些其他上下文信息放入模型中,以实现这种个性化水平。比如
我不知道,像经纬度和GPS坐标,或者,你知道,你是否,你知道,加速度计,你是否在开车?比如,它知道你在开车吗?或者我正在锻炼音乐?是的,完全正确。是的,是的,完全正确。也许你戴着Apple Watch,然后我们知道你的心率有多高。完全正确。那将非常酷。我知道。我认为Spotify很久以前做过一个,像一个跑步功能,你跑步,然后音乐,他们只会选择与你的心率或你的速度或其他任何东西相匹配的歌曲。
使用音乐作为一种工具来提升事物,并比现在的平均音乐收听更具参与性。是的。这个问题是,Suno是否正在考虑将链上技术,如NFT集成到他们的平台中?
这回到了我们之前讨论的内容,你将对其他人的音乐进行很多即兴发挥。你将扩展它,翻唱它,重新混音它等等。音乐将更加社交化。你知道,社交或一些社会动态的另一个词是点对点,例如。所以我认为这里将会有很多进展。区块链实际上是一种尝试跟踪
这些编辑的自然方式。我认为虽然没有什么即将发生,但我认为这是音乐未来的一个巨大组成部分。为什么在链上做?只是为了,比如,问责制和信任?想象一下,我是一个艺术家,我想把一些东西放在那里,我想说,我想能够证明我可以从所有被重新混音的东西中获得一定比例的版税。所以去创作尽可能多的混音,并且
我想要某种版税。这听起来像一个智能合约,否则可能实际上非常非常难以做到。所以要么是荣誉制度,但有时你会想要一些可验证的东西。比如我是第一个创作这个内容的人。我是第一个创作所有其他内容都源于此内容的人。所以我认为区块链是这项技术的自然集合,这里非常非常早。我们通过整个NFT运动体验到了这一点。
对。我的意思是,整个运动有很多令人讨厌的地方。但是,你知道,有一些项目,人们创建了这些NFT。然后每次东西在任何地方交易时,原始创作者都会获得版税。对。就是这样。所以,是的,也许那里有一些东西。我认为那里有很多东西,以及开源,你知道,Justin Blatt刚刚开源了一段音乐,这非常有趣。他制作了他制作了一个GitHub。他制作了一个GitHub项目。
他将Ableton的项目文件放入该GitHub存储库中,并说:“这是免费重新混音的,如果你想提交一个带有重新混音的拉取请求,我会接受它。”- 这很酷。- 我认为人们对人们可以通过音乐互动的新方式考虑得还不够。- 是的。
你可能可以直接在平台上启用很多这样的功能,对吧?再次回到这个回合制的事情,你知道,也许Total Stranger会拿走我的歌并做一些重新混音,然后……
你知道,把它推送到我的存储库或其他什么地方。也许我们俩都会分享其中的奖励。百分之百。百分之百。我从产品的角度考虑这个问题。我们想让这些东西对人们来说非常容易。所以很多事情都必须在平台上发生,同时,我们不想阻止你做一些你可能想做的平台之外的事情。是的。是的。因为你想培养一种真正的所有权和创造力,音乐是为所有人准备的。是的。
好的。Camille Rosinski提出了一些有趣的问题。所以也许我会浏览其中几个。你如何培养AI的品味,尤其是在创作音乐方面?这个词“品味”,我觉得在关于AI的讨论中一直在出现。如果任何人都可以创造任何东西,那么你如何评价东西?哦,好吧,你必须有品味,对吧?是的。现在,显然,像每个人都说他们有品味,即使他们可能没有。所以是的,AI是如何培养一种
速度?这是一个很棒的问题。在我看来,它被严重低估了,你知道,这与人工智能领域发生的许多其他事情形成了对比,在那些事情中,会有一些客观且可验证的答案。因此,在许多基于推理的事情中,许多问答的事情,OpenAI、Anthropic和其他公司正在研究的许多事情中,都有一些可验证的东西。因此,更容易说“是”或“否”,并且模型做得很好或做得不好。而音乐完全是主观的。音乐是
我认为存在好音乐和坏音乐,但音乐,什么是好什么是坏对人们来说是不同的。你和我将听同一首歌,但会意见相左。你可能认为它非常好。我可能认为它非常糟糕。因此,如何将这些模型与人类的品味对齐,这完全没有得到充分的研究。我们有一些技巧。完全不明显的是,用于对齐推理模型的技术应该与用于对齐品味模型的技术相同。我们有一些技巧。
你知道,没有透露它们。我认为随着进步的取得,将来你会看到这里会有巨大的改进。你知道,再说一次,我只是认为音频总体上比文本落后一两年。所以想想一两年前文本模型的对齐情况。它还处于起步阶段。所以期待
模型拥有更好的品味。期待模型能够真正理解你并根据你的喜好个性化内容。期待模型能够拥有某些东西,比如两个人会喜欢而其他人不喜欢的东西。所以那里有很多唾手可得的成果。
你提到了推理。音乐是否有类似推理模型的东西?一些具有多步骤、你知道,链式思维推理的东西?你们考虑过这个问题吗?我们已经考虑了很多。你知道,所以再次强调,这里最根本的问题是,当你没有一个正式可验证的东西时,所有代理类型的行为都会变得非常非常困难。
因此,如果你要拥有能够执行多个步骤并根据其他模型进行自我校正的东西,而无需人类说“是”或“否”,那么你需要这个东西客观上是正确的或不正确的。你知道,这就像你做出了正确的决定或没有做出正确的决定。这在音乐中不存在,对吧?所以,你知道,一个人可以坐在那里说,你为我做出了正确的决定,或者你没有为我做正确的决定。然后你就会有一种相当不可扩展的对齐方式。
一个模型与某种人类品味。但我认为那里还有更多可能性。是的。我想知道,你能否拥有可能……
完美地训练于某种类型的音乐或某种特定的声乐风格的模型。也许那是某种提供推理层的其他模型,并说你做到了或你没有做到。那里有很多游戏可以玩。然后你如何使用,比如说,你的用户在那里提供的海量显式或隐式偏好数据。所以再次强调,我们还处于非常非常早期的阶段。我很高兴我们已经收集了关于这些东西的偏好数据
一段时间了。从一开始,对吧?是的,从一开始。所以这对我们来说是一笔巨大的财富。是的。好的。另一个来自Camille的问题。Camille说,我们如何让Suno的音乐更具社交性?音乐如我所愿。我认为仅仅将音乐放在自己身上并在后台收听并没有什么错,但还有更多可能性。我认为鼓励人们为他人创作音乐并分享音乐,寻找
特定的小群体可能会感兴趣而其他人不感兴趣的歌曲,就像Facebook群组类型的东西,所有这些东西再次被严重低估了,这只是关于去做它们,我认为当你创作一首歌曲并将其发送给你认为有良好品味的人,而他们喜欢它时,你会得到这种肯定,你会上瘾,你会想,哦,这太棒了,我想继续这样做,我想继续创作音乐,我想继续分享音乐,我想让音乐成为我生活中更重要的一部分,所以在某种意义上,我
让音乐更具社交性就像公司使命中最重要的事情,因为在我看来,这种社交方面正是让音乐比今天更有价值所缺少的东西。是的。他还问,
有什么提示技巧吗?哦,我不是最合适的人选。这是一个很好的问题。我不是最合适的人选。我认为,你知道,你之前提到过,不要有太多提示。有一种最佳长度,你知道,给出几个流派,你知道,也许三个流派和三个其他描述,诸如此类。我认为我能给你的最好的提示技巧是收听很多音乐
关于人们如何提示它,因为你会从一个庞大的人群中学习到比从我这里学习到更多的东西。我在提示中看到的一件事,这让我很震惊,我从未问过你这个问题,那就是有时在歌词中,他们会放入一些奇怪的字符。他们会放入连字符和漩涡以及
这是否会以任何方式影响模型?有时会,有时不会。有时这实际上是在事后编辑的,以试图更吸引眼球。所以这有点像用户在破解你的平台。我认为我们不知道的字符会被忽略。所以在没有实际查看的情况下,我很难说哪种说法正确。但同样,我认为在不久的将来,我们会看到关于……
如何用一种冗长而复杂的方式描述音乐并获得与你的描述相符的东西方面会有很大的改变。——歌词进展如何?我知道早期对这些大型语言模型的很多批评是它们……不够有创意。就像你试图强迫它们成为某种类型的创意,而它们总是想出一些令人尴尬、俗套的东西。
你们是如何处理这个问题的?歌词是否变得更好?如果是这样,怎么做到的?在V4中,我们在歌词质量方面取得了巨大飞跃。这只是大量辛勤工作的成果。顺便说一句,DeepSeek实际上比大型美国提供商更有创意。你问错人了,为什么,只是根据经验。它是……
我觉得它不那么僵硬,这就是我想说的。看起来他们可能没有像OpenAI和Anthropic那样努力地将其与他们的模型对齐,这就像非常事实性、非常直截了当。就像一个无聊的律师,你知道,对律师们没有冒犯的意思。我认为,再次强调,这是一个巨大的领域,有很多唾手可得的成果,可以使这些模型真正变得有意义。
更好的歌词。因此,我们做了一些技巧,包括提示和链式思维以及使用正确的模型等等。我会看到,我会期待我们不仅让歌词每次都能完美地出现,而且会期待更多协同驾驶或共同写作的体验,这样人类才能感觉拥有更多的所有权,因为它在你能够说“我喜欢这个,我不喜欢那个”的时候总是会更好。帮助我克服这段写作障碍等等等等。是的,也许它又回到了协同驾驶的比喻。
这正是你拥有这种像坐在你身边并和你一起研讨它并教你教学的歌曲创作助手,对吧?而且,你知道,很多事情都像其他事情一样。这是你通过练习和反复练习以及拥有老师才能做得更好、越来越好的事情,你知道,拥有老师的好处很多,只是坚持去做,不断改进,提升你的品味,提升你的品味。显然,老师可以做的不止这些。
但至少,这实际上会让你进步很多。是的,实际上,关于教学方面,另一个问题不是通过推文提交给我的,而是来自Anthony Delia,他问,你会不会采用Suno中产生的音乐,并启用一些功能来教人们如何去做真实的、去做人类版本的音乐?对。就像吐出吉他谱。
我们正在吐出乐谱,对吧?这是否是一个机会,就像几乎像Suno的这种教育角度?太棒了。是的,对吧?你知道,这就像这……让人想起作曲家过去常常创作练习曲,这些练习曲是为了练习而创作的,因为它们教你一些,你知道,用你的手掌握某种特定的技巧,某种特定的困难动作。所以就像,
是的,我们可以做到这一点,然后我们可以给你乐谱或乐谱或其他什么。我喜欢这个。不,不,这是我第一次听说。这是一个好主意。好吧,我的意思是,我可以看到你提到很多制作人使用这个,我们知道制作人经常使用Suno来获得灵感,然后他们经常采用这种音乐,然后他们可能会在录音棚中重新创作它,或者雇佣管弦乐队来演奏弦乐部分。就像也许Suno只是为管弦乐队吐出整首乐谱,然后他们直接把它带到录音棚里。我认为这将是惊人的。你知道,另一种说法是不要低估
人工智能的另一面,人工智能的非生成方面,你知道,那里还有很多好的工作要做。——是的。好的,最后一个来自Camille的问题。Suno的十年愿景是什么?2035年是什么样子,我们在做什么?——我们正在做更多音乐。音乐是你一天中更重要的一部分。它比今天更具社交性。你正在创作很多,你正在分享很多,你正在编辑很多,音乐对你来说比今天更有价值。
你可能不意味着你,你是一位音乐家,你是一位前Spotify员工,你是一位音频领域的创始人,但对大多数人来说,音乐对他们的价值还不够高。我认为如果我们在这里取得成功,这个产品将是一个平台,人们可以在这里获得更多更引人入胜和愉快的音乐体验。我认为在2035年,可能会有一个专门针对儿童的区域
音乐是儿童发展和教育的重要组成部分。所以我认为这里的天空是无限的。我认为许多人的想象力都失败了,他们只是认为音乐发展的唯一途径是我们应该继续创作……
每年有多少流行歌曲以及有多少流行歌曲,以及互动模式将保持不变。但是当你提到更有价值时,这是否意味着我为此支付更多费用?是的,你应该愿意为此支付更多费用。你知道,如果你想冷酷无情地计算一下,你愿意为某物支付的金额是其价值的衡量标准。如果我们做对了,人们将比今天更愿意为音乐支付更多费用。就像我和我,不是我,我,而是像
我的听歌习惯,它们会从我现在听音乐的地方转移,开始更多地转移到Suno吗?我的日常生活会有什么不同?你知道,当你提到它更具社交性时,这意味着什么?我认为你正在创作和分享比今天更多的音乐。也许你今天根本不创作和分享音乐,但我认为将来你会。我认为你会收听
更专注,可能是因为那里有更多短篇音乐,但不仅仅如此。我认为音乐将发展得更快。它将比今天发展得更快。因此,跟上所有有趣的声音和歌曲将非常
更引人入胜,但也需要更多时间。这将是一种更引人入胜的体验。让音乐更快地发展将需要更多时间来跟上它。跟上它也会更引人入胜。因此,将会有大量的有趣的东西,而我实际上希望人们开始享受奇怪的内容。我想听奇怪的。是的。我也总是想听奇怪的东西。是的。很难找到。
关于我在2025年创建人工智能初创公司的几个快速问题。再说一次,上次我们交谈时,Suno还处于早期阶段,团队规模也小得多。现在团队规模相当庞大。你们正在创造大量的收入。我的意思是,轨迹是什么样的?就像,
我不知道,只是快速回顾一下在过去18个月中担任人工智能公司首席执行官的感受。这很有趣。是的。我有一份非常酷的工作。我可以与优秀的人肩并肩工作。我可以做音乐。
作为我的日常工作,这真的很有趣。每一天都不一样。这也非常令人兴奋。你知道,我想知道一年后我会如何回顾它。但是,如果说实话,去年感觉就像是一场彻底的模糊。这很好。你知道,我认为自从上次我们交谈以来,我可能已经面试了……我不知道,200个人,你知道,所以我喜欢。我也尽力
在一定程度上保持对所有炒作的关注,也就是说可能低于普通人工智能人士。我认为这可能会分散注意力。有很多炒作。例如,当DeepSeek出现疯狂的时候,我大部分时间都没有关注它。我可以让它消化给我
你知道,两天后,在这种情况下不会发生坏事。诸如此类。现在还有什么被过度炒作的吗?人工智能肯定被过度炒作了。我可以在这个播客上这么说吗?人工智能总体上。人工智能,我认为人工智能总体上。当你提到人工智能时,你的意思是AGI或ASI的概念,或者未来的概念?我认为人工智能是未来的一个巨大组成部分。我甚至没有说投入其中的资金数量是不正确的,但我认为周围存在许多不需要的炒作和紧迫感。是的。
如果你从资本配置的角度考虑,我认为没有什么是不正常的。如果你从在Twitter上花费的时间来考虑,我认为可能有些事情是不正常的。现在有什么被低估的吗?品味总体上。我认为我知道每个人都喜欢认为自己有良好的品味,但实际上研究品味并拥有良好的品味。你知道,判断是品味的另一个词。我认为这被低估了,这有多么重要。我认为这将变得更加真实。
如果你没有创建Suno,你是否想创建其他人工智能初创公司?像现有的还是不同的?任何像,如果你想到了一些你可以用人工智能做的事情,你会想,哦,那将是一个我非常想追求的伟大的初创公司。也许这太刺激了,但我认为
我曾经是一位研究量子计算的物理学家,我认为人们可能仍然认为他们可以用量子计算机做更多的事情,而你可以用人工智能更容易地做到这一点,至少在一定程度上是这样。这是一个有趣的研究课题。举个例子。也许很多这些模拟类型的事情,比如实际的因式分解数字,我认为你做不到,但基本上其他所有事情你都可以想出如何去做。这非常吸引人。是的。所以,所以,但我喜欢我的工作。不要,不要。不,我没有,我没有试图诱惑你。别担心。是什么样的?
你知道,组建一个团队?你从未,你从未如此迅速地拥有如此庞大的团队。这感觉如何?以及,你如何围绕这个未来定位团队?这在某种程度上是未知的,对吧?这些模型一直在改进。因此,你实际上不知道你能用它们构建什么,直到它们存在。就像,你如何,你如何,你如何用团队来管理这个?我没有很多优点,但其中一个就是,我实际上喜欢面试人们,这让我,
我的工作似乎不那么乏味,因为我做了很多面试。整个努力中最好的部分是团队。这就是为什么我们建立一家面对面的公司,与你真正喜欢与之共事的人肩并肩工作。你如何让人们保持一致?这实际上在他们甚至被雇用之前就开始了。很多都是雇用那些真正对
音乐的未来以及技术如何创造更美好的未来充满热情的人。你知道,这里的流行语是目标导向。我认为在我不得不组建一个团队并确保这是一个非常重要的招聘原则之前,我并没有真正理解这意味着什么,就像我们主要招聘那些已经考虑过音乐的未来应该是什么以及技术如何创造更美好的未来的人,并且他们不是不可知论者或音乐减速器,如果你想使用一个奇怪的术语。但是这个模型的事情呢?就像,
如果你不知道模型最终将启用什么,你如何制定产品路线图和产品策略?你必须假装你可以做任何事情,然后,你知道,雇用能够构建任何东西的优秀人才。因此,从第一性原理出发,你知道,这不是它在早期运作的方式。早期,你只是
把它变成现实,你的模型就是你的整个产品。然后当你意识到,实际上我们可以构建任何东西。因此,让我们对我们构建的内容进行非常周到和有意的思考。对于一家公司来说,这是一个彻底的文化转变。就像,一切都是……我将使用一个不好的流行语或围绕你的模型的包装。然后,在你让它工作之后,正确的方法是,让我们考虑一下我能为用户提供的什么令人惊叹的体验,他们不会想放下它。然后我们必须
让我们的优秀机器学习团队想出如何真正实现这一点。——关于DeepSeek的话题,我们之前还谈到了人工智能初创公司的防御能力,在这个阶段,模型有多么有价值?模型对公司价值的核心程度如何?随着时间的推移,它的价值是否会下降?——很难知道,你知道,乍一看你可能会说它会下降,因为护城河将不是模型。——对,网络效应。——但另一种思考方式是模型现在是达到目的的一种手段。因此,如果有一种方法可以在没有模型的情况下为人们提供
呃,我们提供的愉快的体验,那么模型将一文不值,除非没有。而且我不知道有任何可能的方法可以考虑做任何事情,除非拥有一个非常强大的机器学习模型,能够生成任意音乐。是的。有点像先有鸡还是先有蛋。这是一个有点像先有鸡还是先有蛋的问题。而且,你知道,在某种意义上,这并不是我们花费时间思考的事情。我们花费时间思考的是
发布人们会喜欢的产品,除了音乐之外,你日常使用什么人工智能产品或模型或工具?我使用了很多ChatGPT,我是云计算人员,还是我可以同时说这两个?就像我使用,我使用这两个,我可以想象将来你可能会使用很多这些东西,你知道,并为所有这些付费,你就像有10个不同的AI订阅一样,不,我有这两个,我有这两个的订阅,你知道那可能是……
——真的吗?——你知道,我没有像我想的那样多地进行编码,所以我没有使用Cursor,但是公司里很多人都在使用Cursor。Granola。——你使用Granola。——Granola很好,是的。——不错。——这是一个人工智能产品。——向Granola致敬。——但这是一个产品。——是的,是的,是的。——那不是一个模型。——对。——那是一个产品。——好的,那么你还使用什么其他产品?
我的意思是,这就像这个AI,AI,你知道,正在渗透到一切中,对吧?就像进入Figma,进入Slack,进入Gmail,进入,你知道,我认为正确的方法是,像人工智能产品一样,用户几乎不应该知道它在那里,对吧?它就像,它应该在帮助我。是的。太棒了。Mikey,这太好了。非常感谢你这样做。很高兴来到这里。谢谢你的邀请。是的。直到下次。谢谢。
非常感谢收听Generative Now。如果你喜欢你听到的内容,请在Spotify、Apple Podcasts和YouTube上对该节目进行评分和评论。当然,还要订阅。所有这些东西确实非常有帮助。如果你想了解更多信息,请在X、YouTube或LinkedIn上关注Lightspeed at LightspeedVP。Generative Now由Lightspeed与Pod People合作制作。我是Michael McNano,我们下周再见。再见。♪