大家好,欢迎收听本期晚点聊,我是宇童这次是我和曼琪一起跟爱时科技聊他们的创业故事在上周 6 月 6 日,爱时科技的 AI 视频 APP 拍我 AI 在国内上线在此之前上线 6 个多月的海外版 APP
Pixworth 移动端月活已超过 1600 万爱视的全球用户已超 6000 万在去年下半年用户用独页特效模板生成的视频在全球观看量超过 10 亿次这比看过独页这个电影的人还要多现在点开拍我 AI 和 Pixworth 产品我们能看到很多好玩的特效把任何人物封装成一个小玩具平地入海
变成美人鱼让自家的猫跳科目三或体验一次绿巨人变身病毒是传播的产品的创始人是一位技术背景的 80 后另一位联合创始人是投资背景的 90 后这次晚点聊我们和爱时科技联合创始人谢旭章一起聊聊非产品背景的创始人怎么做出爆款产品怎么看待视频生成模型的新趋势以及怎么一次次在高压下做出选择
今天很高興邀請 Peace First 做客晚點聊我是曼琪和我在一起的還有晚點科技組的作者宇童
你可以先和我们的听友简单介绍一下自己我叫谢旭章然后应用名叫 Jayden 然后我现在在创业在做一个公司叫爱事科技然后我们的产品叫 Pixverse 我们主要的方向是做 AI 视频生成我们自己做我们的模型也做我们的应用目前来说我们的目前主要用户在海外我们国内最近也会正式发布然后我在创业之前我是原来在医事上我是原来医事上从业者原来在官员资本
我在那边负责他们的整个 TMT 包括 AI 这些方向因为你们之前主要的市场是海外然后最近少进中国所以我们可以先从最开始和现状
这两头来聊一聊就是可以给听友一个对 Pixverse 的比较快速的认知其实我们是这样因为我们公司长期人都比较少我们公司大概两年时间在 23 年的 4 月份成立了公司然后我们在前一年大概就只有二三十个人在去年大概可能我们现在整个公司大概五十人以上吧但整体的体量还是比较小所以我们整体因为人比较有限资源比较有限所以我们在做很多方向选择的时候我们会在早期的时候都会去做更多聚焦去做一些减法
然后所以这里面比如在选择市场的时候我们最早的时候可能这里边毕竟国内外它的那个市场还是不一样的所以我们当时鉴于这个人数的限制包括一些比如说我们这行业里面一些商业模式的一些考虑所以我们就先做了海外市场我们最早是在二三年的十一十二月份我们在 Discord
视频生成方向真正活起来其实是 2024 年 2 月春节就是 OpenAI 发了 Sorrow 之后然后你们是在差不多那之前十个月就成立了所以你们当时开始做的时候就为什么选这个方向包括当时视频生成是个什么状态以及你和王长虎怎么认识你们怎么组队的我先讲到前进题反正我个人是原来
我在创业之前我在官员资本我那边看 TMT 看 AI 因为原来可能我们的机构 TMT 里面我们这个互联网移动互联网我们其实做的还可以然后呢做了很多反正之前中国互联网上比较有名的一些 deal 然后也投了里面一些公司但是到了 22 年之后整个行业就有很大的这个变化
就感觉经过了整个移动互联网的黄昏所以那个时候我当时自己的体感就是说当时有很多公司它其实数据包括团队都非常非常好但如果它是做互联网的其实本身这里边不管是投资侧还是说业务侧都会有蛮大的阻力的所以那个时候对我来说
我在看有没有一些新的一些事情所以那时候我看到了整个美国当时在 22 年上半年的时候就有非常多做这个 AIGC 当时叫 AIGC 或者叫文生图的公司那个时候我最早一次接触到 MeJourney 或 Stable Diffusion 大概是在
就二年年中间左右然后那个时候我当时就大概沉迷了可能一个月或者几周这样我就每天都在那个 AI 生徒确实看出来投资行业不仅仅是投资对对我觉得当时其实你确实应该花更多时间去看看新的事情因为那时候可能在呃我觉得大家可能很多从业者在那个阶段都会去想哎有什么下一个大的事情或下一个大趋势是啥那个时候我
我可能当时看到深圳市 AI 然后那时候我觉得文生图这个事情很酷因为我是一个没有艺术细胞的人我画画很丑然后也不会画画然后也从来没有做过短视频但是当时我发现文生图可以让我比如说我当时最有震撼的一个东西是我把我的名字就谢旭章输到那个 MeJourney 里面
然后他出来一个很 fancy 的一个图这图里面呢构图很精美然后里面可能中间是一个一个人他看着一个圆形的一个天空然后天空感觉有点这个玉的形状跟我那个名字叫张我感觉有点关系然后呢我当时觉得哇这东西太牛了怎么这个技术性发展到这个程度那时候我就觉得对我非常震撼所以那时候
我当时玩了很久的文生图我当时还在光源当时我们的团队还大家做了很多文生图我们还写了一篇小文章什么的说我用 AI 帮我做了 100 张图我们把那什么艺术史图画史给看了一遍就我们在想那这个人工智能的技术在人的创造内容的这个时间流上面来说它属于一个什么样的一个工具那时候我们还写了一篇文章然后对那时候我觉得还挺有意思后来我发现就这里比较这个事情我们如果要去那个更深入去看的时候
我发现因为我不会写代码那这里边我想去改变的东西都很少我只能去基于已有的东西做事情所以那个时候我就想着那有没有可能我们去基于已经有很多开源模型了能不能基于它做一些调整我觉得那个时候那个时间点当时我就在网上去发帖我去找我的一些读 PSC 的一些高中同学初中同学帮我发帖
看有没有做 AI 的一些程序员或者一些学者有兴趣大家去探索一下比如说整个机器完成图能做什么样的应用所以那时候在 2022 年下半年的时候当时我找到了一些有兴趣参与的一些伙伴他们当时主要在杭州所以那个时候我有很长时间每个周末我就去杭州跟他们一块去
试着看在完成图里面能做一些怎么样的一些微调能做一些好玩的东西因为那时候我被在上海所以我当时就每个周末我就跑去杭州然后去在一个茶馆里面有点黑客松吧大家每天就去脑爆想能做什么事情那个时候比较有意思当时一个是当时有 Lanza 出来 Lanza 就是后来那个妙鸦其实是跟 Lanza 逻辑类似吧她妙鸦晚了一年但 Lanza 当时在美国
我记得当时上了就很火然后一个月已经有几千万美金的订阅收入了那时候还有一个技术有一个微调的技术一个是 ControlNet 一个是 Lora 都出来了所以这两个其实对于整个纹身图的可控性包括保持角色形象的一致性都有非常大的帮助所以那时候我们可能做一些探索比如说我们想能不能把 Lens 来中国当时我们做了一些微调但后来我们应用也没有上线但当时在过程中其实积累一些体感当时我自己的感觉是这个事情应该会很
但当时如果是一个 part-time 兴趣小组的形式应该还是会很难抓到那个最核心的机会的所以到了 2022 年年底的时候 Chad G.P.发布了发布之后其实中国在真正它资本上活起来其实是春节前后那个时候我自己当时因为已经玩这个模型玩了一段时间我觉得可能这个东西在中国也会不一样因为它美国已经非常非常火了
然后我就当时又去把中国所有的做生存式 AI 的公司基本能聊到我都聊了一遍然后我当时感觉就还是有机会因为大家可能还是会想的没那么清楚或者比如我会觉得我自己想的会比别人稍微清楚一点在那个时间点就是 XGBT 刚发布二年底的时候中国在做生存式 AI 的公司比较主要的有哪些那个时候其实像现在的六小虎大部分都还没出来都还没成立就可能只有
Mini Max 包括智普这两个成立了然后包括有一些做稍微逆时点比如像当时做文生图有一些公司然后当时有一些做 3D 做文生图的公司已经在成立然后视频当时我记得还没有聊到有哪些所以那时候我感觉就是整个这个事情在海外或者在我的逻辑里面这个事已经非常有意义非常有潜力但可能中国整个还没开始然后大家的反应稍微慢一点
所以那时候我觉得那是时候应该去 all in 了所以当时我记得春节后我就先去提了离职我就说但没想好做啥但反正肯定是视觉生成相关的事情然后我就准备去投人创业然后这个是我这部分的故事长虎那部分长虎他的经历是原来在微软在字节都有非常丰富的经验在字节他管整个字节的整个视频视觉相关的一些 AI 技术
所以那时候其实长虎因为原来我跟非常多字节出来的创业者有过合作所以那个时间点在我去找创业伙伴的时候长虎他也在找创业的合作伙伴所以那个时候我们经过一些字节的朋友介绍我们交流一段时间之后大家觉得很多大家的方向上是有共识的然后具体的开公司的一些比如说资本对外包括一些大方向上包括可能比如他在技术产品在一些前沿的科技理解上他是有优势的这里面我们觉得大家比较互补
所以我们就决定说那一块做这家公司所以在 23 年的春节后我们就去成立这家公司然后就开始了大概是这个状态那当时王昌虎一开始也是看到的是视频生成这个方向吗对因为他原来过去的 20 年或 20 年以上之间都在做计算机视觉做视频相关的技术那本身这里面对于所有这个行业的人工智能同学来说是巨大的一个机会就视觉生成用人工智能来辅助人类或人工智能去生成内容成为了可
对于我对于不管技术层面还是说未来潜在的在视频业务层面都会有很大的一些变化所以我觉得那个时候因为他的这个 context 他原来在字节参与过很多现在知名的国民企业产品的从零到一背后的很多技术是他主导来做的所以这里边他对于视频这块他也是有比较敏锐的一些嗅觉跟判断你们最开始是不是融资不顺利因为你们最开始成立那会儿好像大家
更关注的是大语言模型的创业视频生成那会儿不是那么热门我们其实第一轮融资还算比较顺利我们第一轮融资很快就我们可能出来融资了几天我们就敲定了当时有一个产业里面比较有名的投资人他就决定投资我们然后包括我原来老东家包括我们自己个人都在里面包括我们团队都放了些钱所以第一轮我们其实是相对比较顺利的
所以就是你们在 23 年的时候并没有那种所在的领域不是一个很火的感觉我觉得我们还是比较幸运的在那个时间点其实做整个视觉生成方向的创业公司没有那么多吧然后呢我们当时团队的一些 background 包括我们的一些想法在我们的股东看来还是比较有意思所以当时我们最早我觉得还是比较顺利的那就是开始嘛然后我们可以讲讲现在的情况就是你现在可以总结一下
因为你们成立差不多是两年多 24 个月就爱诗现在做到了什么比如说产品上收入上用户上你们现在大概是什么状态我们现在大概几个点先从模型讲我们模型都是自己训的我们大概在过去一年多时间里面训了七代模型我们把它叫做 V1 到最近是发了 V4.5 我们大概发了七代模型那模型我们的体感包括很多的评测包括一些主观客观盲测里边我们模型都排在全球比较靠前的位置的啊
然后这个是模型测然后我们在这个产品测我们目前的用户量应该是全球排在最前面的我们大概有 1000 多万接近 2000 万的月活月用户然后分布在我们的移动端跟网页端然后我们应该是全球最早能过千万月活的视频生成平台
吉梦现在是多少我觉得吉梦跟我们产品还会有一些不一样的地方因为吉梦的里面蛮大的一个比例还是在做那个文生图或者图相关的那个社区但我们的平台基本是视频为主我们其实没有提供那个生图的那个能力
为什么关注月火月火比日火更好在哪里这个指标因为我觉得这个行业比较早期了因为大家的这个产品形态坦白说现在还是一个工具或者一个付费工具的这个形态然后我觉得大家其实离这个所谓的社区或者离一个这种就每天
用的那种这个还是会有一些 gap 我觉得这里面对大家来说包括我们现在其实大量用户不付费是没有核心体验的所以这里边我觉得首先很多指标上面包括大家可能看的很多指标其实会以月的维度看更多但我们自己内部月跟日都会看了对
对你正好可以讲一讲就是你们的产品是一个什么样的形态因为不是所有人都用过 OK 因为之前主要在海外嘛而且你们的形态比较特别就它其实不是给专门做视频的人用的 OK 我觉得我们产品形态还蛮有意思的就是首先是最早这个行业我们先回到这行业最早的时候其实大家的产品最早是 runway 在做这个行业嘛
但 Runway 这个团队它的背景是更偏设计更偏专业饮食制作这个方向像我去年在美国跟 Runway 的一些朋友也有交流然后当时比较有我就问他们你们两三年内的 Vision 是啥他们说想拿 Oscar
然后我就表明就像他们希望说他们的训练模型他们做产品是服务于相对比较专业的影视行业的但因为他们在这个行业里面其实是先行者所以很多后面进来的人都会去参考他们的一些产品路径我们最早的时候当然像我们的网页端产品现在其实也是服务很多专业的一些影视创作者很多这种专业的 video creator 其实在用我们的这个网页端产品在创作我们的网页端的这个用户量应该也是全球前几名的
但这个 market 对我们来说就后来我们自己经历过过去一两年时间的一些探索之后我们觉得可能这个市场有机会但可能更大的机会其实在一个更偏移动端更偏 2C 的一个市场为什么呢就是包括像昨天我正好跟一个国内比较顶级的影视公司的一个高管我们在交流就现在我的体感或过去一年的自己感觉是大家所看到的这个所谓的 AI 视频大家可能看到很多这个微信视频号里面各种各样的这种所谓的 AI 视频
它本质上 AI 在里面的参与的程度可能只有 10%到 20%就比如说我们去想象一个视频作品它最核心的是什么它最核心其实是一个是剧本包括这里边这个剧情怎么去开展不同的片段之间怎么衔接这些其实都是人的目前的所有的视频都是人的工作现在 AI 其实还没法把不同片段不同的剧情的推进这个事给做好还是人去大量参与的现在 AI 能解决的是部分的视频素材的生成
但本身我们去看视频素材这个模态或者这个模块在一个视频作品里面它的重要性或者它的占比很重要但它并不是这个视频的全部视频是一个完整的一个视频作品现在 AI 视频能解决的是单一模态的素材生成问题不管是从逻辑比如语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型语言模型
声音配音配乐到可能多模态的结合这里边其实 AI 视频能做的事我觉得未来会有机会但目前是有限的所以在这行业里面最后的交付来说的话那么 AI 视频是没法在专业创作领域目前的技术发展没法实现真正断断断交付所以
它能够去 country build 的这个比例是相对有限的所以呢我们就会去思考说那在什么方向上它是有可能断断交付的包括什么样的市场可能是一个更大更有意义的一个市场那我们就去看
去看整个视频行业的发展虽然说现在的比如说电影院电视机这些渠道都还存在但是呢大家也都知道现在视频里边最大的用户量或者最大的一个被使用的这个渠道其实在移动端的这个短视频平台里面大量的人其实是在
看这个中短视频的这样的一个需求同时呢我们觉得说这样一个 AI 生成的新的技术当然它可以帮助原来的一些视频行业去做提效去做降本但是呢它更大的机会可能是怎么去把现在目前一个巨大蓬勃发展的短视频市场去能解决这里面的问题
那我们就去看短视频市场里面会有哪些可能还存在的问题那我们可能就会发现说在这个世界上每天有几十亿人看短视频但是呢我们就想想身边有多少人能够真正做一个病毒式的有热度的有人去看的短视频其实可能非常非常少可能是 5%10%不到的短视频的消费者有能力去创作的你这个应该说高了
肯定没有 5%到 10%对早期的时候可能像抖音跟快手投稿率应该最高是能到 10 个点以上现在我估计可能一个是头不集中第二是可能大量的常委创造者其实拿不到流量的分配但是同时我们去看这个行业的发展就整个视频又变成了人跟人之间或者说这个信息传播最重要的媒介特别对于年轻人来说大家其实现在看各种各样的东西都希望通过视频来获取信息获取内容
但这个情况下那么视频是一个很重要的传媒媒介但是呢只有很少的人有能力去创造或者说用视频来去讲述一些信息传递一些信息那我觉得这里面就有很大机会所以呢我们最老是想那怎么能让普通人用 AI 做出来第一个好玩的跟自己有关的跟自己身边的环境生活有关的视频并且发布
我们就想去解决这个问题所以大概我们在发布第三代模型的时候我们就出了很多这个叫模板的玩法当然最火的一个效果叫毒液变身当然可能有很多听众或者你们可能也在国内或者海外有看到过这个就叫 We Are Venom 就当时在那个毒液上映的时候那个月应该有选就几百万人玩过我们这个毒液变身的效果它的效果 basically 就是说让任何人可以把自己把身边的宠物朋友一键变成毒液变身
然后它的过程跟它的结果都是 AI 生成的都是有不确定性的就是很酷的一个效果然后那个月其实就是我觉得这样的一个模板化的玩法但是毒液的那个爆火其实充分验证了我们的一些想法吧我们觉得说这可能是全世界第一次 AI 视频生成模型被广泛的普通人去使用并且传播对
因为这个模板玩法你们应该是 24 年下半年上对所以你们就是在思考说从更专业的用户到这种赚钱的用户这个思考的时间是发生在 24 年年中我们其实很早就想去做 2C 当时可能我们也接受过一些访谈包括接触过一些对外也去讲过一些我们就是想做
这个 AI 视频怎么样能够去 2C 去服务广大的普通人但我觉得一个是技术发展它有不同的阶段在可能最早的那一代视频模型的时候它可能对普通人来说还没有太大的这个使用场景然后第二个是我们自己的思考也在迭代所以在我们第三代模型出来之前我们就感觉到哎
就图生视频或者说这个图生视频给普通人在手机上使用是一个非常大的一个机会所以那个时间点我们就去基于这个方向我们迭代了我们的模型也迭代了我们的这个产品然后最后来读页就集中了一个我们的一些思路的一些体现吧就可以说模板玩法是你们的
目前的一个表达的特点是的但模板它本质上是怎么能让普通人用很低的门槛来去使用视频模型做出来一个高质量的内容并且分享因为对普通人来说他其实根本不 care 是不是 AI 他 care 是怎么样能够简单的做出来有趣好玩能分享的东西
那么我们之前觉得说模板就是它最重要打掉两个东西一个是不需要去写提示词了因为写提示词对于用户来说非常非常难就 95%以上用户猜测应该都写不好提示词特别是长的提示词甚至它可能比拍照拍视频要更难另外一个是通过模板化的这个方式我们大大提高了抽卡率就它其实不需要抽卡了大概率我们都是能去 deliver 一个高质量结果的这里面我觉得其实是我觉得核心解决了一些问题对
你也可以讲你的收入情况因为有一次就是 24 年底我们不是聊过一次吗你当时有讲就是什么圣诞节的时候你们在拉美赚了很多钱你可以讲这个也是跟一些模板有关系的反正我们应该这段时间我了解应该是做这个 AI 的应用或者做 AI 模型应用的公司里边收入增速比较快的我们过去几个月我们收入可能翻了十倍吧单月的收入我们现在大概单月收入已经过了千万人民币了都是海外的这个订阅收入
而且收入质量还比较高我们这里面毛利是比较高的那你们一年的 AR 现在是多少现在订阅的话因为我自己个人觉得 AR 这个东西比较虚我自己不是很信 AR 这个概念因为就到底什么是 recurring 的我觉得我们的收入是比较可持续因为它都是大量的海量用户在付费然后他们也是有续费的
你刚说 AR 比较虚是为什么就是我之前跟很多美国的投资人或者从业的朋友或者国内朋友去探讨就说 AR 到底怎么算就因为我的概念里面的比如 SaaS 的 AR 它是要 recurring 它要比较能重复它是需要有计算的但我发现现在很多人算 AR 它其实是比如把一天收入乘以 365 或者 8
一个月的时候乘以 12 然后我感觉跟我概念里面的 recurring 会不太一样另外一个是我的概念里面其实因为我大家看 TMT 嘛就这个互联网行业其实 2C 产品没有什么 recurring 就比如说你说腾讯游戏怎么算 recurring 呢就庄荣耀他
不可 recurring 每个人都是单次充值它其实本身 recurring revenue 是一个那个我就是 SaaS 行业的一个概念但我觉得比如在我们其实在做的东西更偏 2C 一点虽然说也是订阅这个模式但我觉得本身对我们来说有意义的是去考虑比如说我们的收入比如说本身的这个增速以及我们收入是不是可持续的我这里面用多少人在付钱我的付费率 up 跟他的付购这些对我来说更有意义你们现在除了订阅之外没有别的收入方式
没有比的商业模式我们在探索整个 API 的这个收入因为确实有非常多找过来想去接我们 API 的一些合作伙伴就是 to 开发者和 tob 的收入我们也在做就国内外现在有蛮多的合作方迎接了我们的 API 在去做对我们来说也是通过合作方去服务好一些它中外用户的一个方式
就是从你二三年四月份开始创业算是正式你们公司开始运营吗对然后到现在中间发生的哪些事情是非常超出你的想象的给你带来觉得还挺不一样的体验我没有想过我们能一个月有一千多万人涌进来去玩我们的产品因为这个在互联网里面也是一个很夸张的数字是哪个月发生的呀就最近其实都在发生最近每个月都是一千多万人对因为你们最近是一千多万的月活吗会想想其实会觉得诶
我就想到以前在看互联网的时候好像也很少有创业公司能在产品发布的前几个月就有这么多的人会涌进来看而且特别是在整个互联网的流量红利已经结束的状态下所以我觉得本身 AI 还是代表了新的一个可能性你打开了不管技术还是说应用上的新的可能性才会有新的流量红利出来你们从产品发布到有 1000 万的月活是中间几个月
首先是这样我们网页端它其实跟我们最终产品还是有 gap 我们在移动端发布的时候第一个月就过千万月火了移动端正式发布是在 24 年的点底 11 月左右吧 11 月 2 月左右 12 月份我们 1 月份就已经过千万月火了
因为你们今年也上线了信息流的功能就是在你们自己的 APP 里面比如说我是一个用户我是可以发帖发到你自己的 APP 里的因为之前你的那个玩法因为我也在用嘛你的玩法是我生成一个视频之后我是可以一键转到什么 Instagram Slapshot 的这种地方然后现在你也可以发在自己的这个 APP 里就相当于它是
邮电向一个内容社区了这个功能上线之后你们观察到什么变化了吗我觉得首先是我们现在还做得很初期因为我自己的观点是整个 AI 行业的产品化都很早期所以我们可能很难拿移动互联网成熟的产品形态去看 AI 行业的产品因为比如举个例子就是移动互联网里面它不会让创作者去比如说抖音它不会让创作者去订阅的
它是鼓励大家创作可以创作者去分钱但是呢是因为 AI 行业它有推理成本啊包括行业发展比较早期所以现在其实很多这个创作的范式跟创作的模式跟互联网成熟产品是不太一样的所以我觉得很难拿这个传统的概念去套在 AI 行业里面但第二个呢对我们来说我们也许想去探索社区的可能性但我觉得要一步步来对我们来说最有意义的还是说怎么能去吸引
更多的这个没有做过短视频的用户第一次来我们这用 AI 做出来一个有意义的短视频并且发布这个是比较重要的然后同步呢我们也希望说有没有可能让他们里面有创意的一些人也能去做出来一些他们觉得好玩的模板然后分享给别人一件做同款这里面我觉得这两个事是我们会去探索的然后整个比如说内容消费社区我觉得这个事我们会一步步探索的来步子迈太大
对就你们现在有些模板并不是你们自己想出来和运营的是用户发上去的对它现在更多是通过这个投稿这些方式上还没有一个直接的一个发布链路但我们后续这块也会去考虑因为像我们线上有一些模板或者一些玩法其实用户自己探索出来的我们觉得其实用户的这个创造力跟创意是无穷无尽的
我们的创意是有限的我们希望说未来我们把这个整个架子当好让大家上来唱戏假如说我是一个用户我做了一个模板用户能不能来用的话那我可以在这个系统里面给我什么奖励吗能给我分点钱吗目前还没有我在思考但我觉得很多时候其实对用户来说就被人看见会被人去认可他的这个创意我觉得就是最重要的反应就影响力本身是一种机会对我觉得这个可能就在第一阶段都很重要了剪映的很多模板是不是就会给创作者分钱的
是的他们会有一个非常专业的做剪映里面特效这个创作者的生态对但我觉得就那个创作者跟用 AI 视频特效创作者还是会有一些差异化吧会不太一样因为我们的用户其实是一帮更普通的人他可能都没有做过事他可能都不知道怎么剪视频他可能都不知道怎么拍视频但这些人可能第一次做视频可能就用我们做的然后我觉得是一帮新的一帮 creator
对然后你刚才说的就是 API 的这个业务的探索以及你们 24 年年中的这个思考就是说视频生成其实在制作一个完整的视频里面它只占了一部分对那现在这件事情有变化吗因为其实现在会有一些产品它比如说是用你的或者用可灵的 minimax 的模型它自己主要是做应用的比如说今天刚上线的 medio 对还有刚才我们也讨论说跟 medio 很像的像那个 pipit
还有 Creatify 它都是接了很多不同的视频的模型语音的模型然后大元的模型可以给你在一个流程里面既生成视频又有语音又有配乐还有字幕就这种方向会是你们考虑的吗我觉得我们会考虑但同步我们也会去看因为这里面我觉得这个核心还是说它是一个多模态的生成问题
现在各个模态之间我觉得还是比较割裂的比如怎么去让视频跟声音声音里面又包括了音乐音效人声然后跟比如逻辑逻辑代表比如这个剧本怎么去推进推演这里面是多模态的生成我觉得是一个还没被很好解决的一个问题
如果每个模态都有一些问题的情况下你去把它组合起来它可能会有更大的问题所以这里面我觉得我们会跟很多同行一块去探索我们也很愿意给像去探索这块工作体育 API 让他们去做探索但我个人觉得目前来说我的机会很大但是各个模态的问题都还是存在的
对我觉得他那个可能就使用门槛会高一点就我刚刚描述的那种产品心态他是更面向专业的做视频的人对包括我觉得现在 AI 行业有很多概念很多那个 demo 但是实际上比如最后这个产品他到底想做什么其实最简单比如就看他进去之后第一品他主推那个 feature 是啥那个可能是最核心的别的 feature 可能更多是一些常识那我觉得这里边就是包括像你刚才讲的很多产品他们提供很多功能但最核心的那个需求或场景可能一开始不会有太多
那从就是最开始到现在的这 24 个月里面如果总结一下的话艾施做的几个比较关键的决策是什么我觉得最早的可能就是做视频生成这个是我觉得第一个重要决策然后第二个重要决策是
就是我们不要去过度花钱来去训练模型应该是用一个比较稳健的方式来去让大家接受资源有限的前提条件然后基于资源有限条件去提高每一单模型迭代效率
这个对我们我觉得也是比较重要的然后第三个我觉得是说整个产品化方向上去在整个 2C 上做更多探索然后包括去做整个低门槛模板化创作这个场景对一和三其实刚才讲过了第二个可以再展开再聊一下
你说的让大家接受不要花那么多资源去模型就大家指的是就我们更多是内部了就内部了就你们自己的研发团队是有过能够消耗过度挥霍资源的事吗对我们其实一直都还是储备着比较充裕的资金的
但我们一直还是用一个比较稳健的经营或者花钱策略在去训练我们的模型因为像回头来看我们大概训练出来目前这个模型可能做得还不错的这个模型我们用的资源或者用 GPU 的这个数量应该是很多同行的十分之一甚至可能二十分之一去年我们这个时候聊的时候王长虎说如果你们有更多钱能买更多卡的话你们会更早地训练出 Sora 现在回头看并不后悔了是吗
对当时首先是我们也没有十倍那么多的钱就是我们当时比如我们也不可能多十倍资源因为我们的钱虽然充裕但也没有那么多但另外一个是我们也希望说更多是把这个组织的效率给做上去而不是说比如砸钱因为毕竟我觉得 AI 创业公司在中国开始它不会像美国一样有那么充裕的资金支持大家需要更多提升效率从效率来去解决更长期的问题嗯
因为你把这个称之为一个决策那就说明另一种做法就是我花更多资源去模型在当时是一个选项对吧我觉得也是个选项对那这个选项比如说是行业里有什么其他的人在往这个方向做你们是看到其实它效果也不错是一个可参考的借鉴的方式吗可怜应该是花了蛮多资源具体我量级不知道但可怜应该比我们资源跟人数都要多蛮多然后她做的也蛮
但我觉得更多是一些可能不是正面的例子更多可能包括国内外的很多大厂在这个事儿上面是投入的资源也很多然后但可能目前的模型训练我觉得遇到一些瓶颈所以我觉得本身还是一个非常难的技术它不是说通过砸钱砸资源招足够多的人就能解决的它对于团队效率团队的一些认知团队的一些做事情的方式的要求还是非常非常高的
你觉得在全球范围内视频生成行业里面公认的比较头部或者说第一梯队的模型是哪几家公司做的就首先我觉得两个有一个模型的能力我觉得这个本身模型评估其实相对比较主观的当然我自己的概念里面比如海外 Google 做得很好然后国内的话我们同行像可林像海螺做得都很好我们自己觉得自己做得也不错从优惠浪来说这行业应该优惠浪最大的三个公司都是中国公司就刚才我讲的三个中国公司
就是可林、Millimax 和你们对你刚刚没有提 OpenAI 对所以大家认为 OpenAI 的视频生成已经不算第一梯队了吗对我们觉得 Sora 的最后 Deliver 的模型跟它当时 Demo 的差距非常非常大哈哈哈哈
差了十个 Pixvers 差了十个 PixversOK 所以他们这是属于有点抽钱宣传了对我觉得其实开了一个不太好的头就是导致 AI 行业其实从那个时候开始就非常多公司发一个 demo 然后说我做到了什么但实际上只是交付不了实际的模型跟产品但我觉得这里面本身其实现在去看 Sora 我之前看过好像外网有些人想用 Sora 现在的模型去复现它一年前 demo 效果好像没有人
能够成功所以这里边我觉得还是 demo 或者理论跟这个实践或者跟产品的 gap 还是会蛮大的嗯因为我们 24 年 11 月的时候聊过一次那会儿你刚从美国回来嗯你去了美国一段时间然后 25 年 2 月我们又聊过一次然后这两次我是明显感觉到你状态变化挺大的嗯
我不知道你还距离到反正 24 年 11 月我们见的时候感觉你是比较焦虑这样焦虑对比较焦虑对然后到 25 年的话就可能你们的数据然后什么都起来了状态就会好很多你觉得这个过程中间行业和你们自己发生些什么变化因为这个时间其实比较短就大概三四个月的时间对我觉得几个点吧第一个是我觉得整个我觉得国内的很多这个环境和舆论导向大家会默认说所有的 AI 领域或者美国比较前沿的技术会显著领先于中国比如在这个
大家去年很长时间里面大家都在尝试复现超越 SORA 的时候我觉得这个论调其实是比较大家会觉得好像差了很多 SORA 包括我记得去年有一些大厂的创始人会去讲说可能中国十年二十年做不出来 SORA 但我其实当时就觉得其实跟我们实际拿到的信息不太一样因为像当时其实我觉得可林其实对大家是很大的一个提振因为可林当时六七万开了个发布会然后当时他想请很多同行去给他捧场
最后好像只有我们去了然后发布会上面我们就一家夸可林说可林是在视频大模型或在很多基础模型领域里面第一次双模团队跑得比海外要更快这里面我觉得有一些逻辑或者有一些事实比如说
我们去看过去的几年的中国或者全世界视频行业的发展那么其实不管在技术还是产品层面其实中国的公司是跑得比较更快的过去几年最大的新的短视频平台像最早的快手像后面的抖音 TikTok
其实都是华人或者华人公司做出来的这背后除了产品之外它背后也培养了非常多的做视觉做视频做视频相关的技术这块的算法专家所以本身我们相信在这里边中国的公司和中国顶尖的工程师的储备是很充裕的
所以我觉得本身其实可林或者说我们或者说海罗能在这行业里面做得还不错我觉得他也是有一定的底层逻辑有一定人才储备的一些基础的所以这个变化就是在 24 年 12 月圣诞节的时候 OpenAI 终于把 Sour 放出来了大家看了觉得好像也没什么
然后后来春节的时候 DVC 和 YouTube 也火让大家信心更大了是吗对我觉得我朋友这个事情我觉得对这行业友好也不好吧就是本身他还是一个行业很多风向的引领者他做的比较拉胯那其实不一定是好事那另外一个确实我觉得也验证了我们一些想法就是确实可能这个技术就是很难那我们或者中国很多华人团队是能够做得很好的
那你觉得就是在今年 OpenAI 释放了 4 欧纹身图的功能然后他自己说是用智慧规做的对这件事情对你们有什么新的启发或者影响吗因为他也有可能接下来会把这个东西做到视频生成里面而且中国公司里也有赛纳 AI
在 4 月下旬的时候它发了视频生成的模型和产品他们就是用自回归的方式来做了明白我觉得 GP4O 的 imagegen 它做得非常非常好这里面它把可能很多可控的生成包括对一些复杂语义的理解都做得非常非常好包括这背后的 AR 相关技术路径我们其实一直也有在探索但我一个是我觉得 OpenAI 现在视频这块它等于也在尝试然后我们自己也在尝试我觉得我们不一定会比它慢我们也在这块做很多工作但即使有了
那接下来正好就是从你们的
产品选择可以聊到一个 AI 应用创业比较老生常谈的问题就是你们和大公司的竞争因为你们现在做的是一个 2-5C 的产品你刚才其实也提到就是奇梦和你们不是那么相似但是也有一些重合的部分因为它里面也有浮生视频的部分然后另外就是你们现在做的这个模板其实在抖音和快手里面它自己带的就有这个东西比如说你在抖音里点这个抖音加的部分就会有 AI 特效可以选
而且你们甚至都有些一样的特效比如说什么微波炉的那个我看你们也有对对就是这头跟你们在做一些相似的事你觉得你们跑出来的机会是什么我觉得首先是有几个层面的问题就首先是我们本身一个是这个模型它本身这个产品它背后的基础是整个视频的模型在模型的迭代上面我们对自己还是比较有信心的因为现在我们的迭代速度包括我们模型的一些效果包括比如模型的生成速度我们现在在全球都还是排在比较前面的
所以我们就技术上我们的效率能够保持下去然后这个是可能做产品化包括说产品迭代的一个很重要的基础这块我们对于团队的迭代还是有信心的然后第二个是我觉得我们在面临的这个市场这个视频行业它一直不是赢者同吃的行业就是不管在国内还是海外我们去看整个视频行业发展就是现在电视台电影院还存在
它也没有被这个优酷爱奇艺 Netflix 取代然后优酷爱奇艺 Netflix 它也还存在它也没有被这个抖音快手 TikTok 去取代我觉得这里面本身视频它是一个还在发展还在快速变大的一个行业现在有短视频有长视频有直播有各种各样的群平台本身视频是一个非常大的一个商业的生态了
就是视频它不是一个垂直赛道它是很大的一个行业然后我觉得我们在做的事情是我觉得更多从解决问题角度来想我们在解决的是这个行业里面依然有非常多的人没有做过视频我们看到过去视频行业的发展它一个很大的驱动因素就是随着有更大
的内容供给或更不一样的内容供给有更多的人参与到视频创作里面会带来新的产业的一些发展我们觉得 AI 视频生成也会有类似的作用但这个情况下我们觉得它是一个很大的一个增量的一个蛋糕它不存在说比如说一个大公司它就把所有事情干掉了而且现在我们想的还是比较清楚的我们觉得在海外市场包括国内市场还是有很大的一个新的机会的
因为你们已经在海外运营了一年多嘛就实际上海外的这些视频平台对你们压力大吗还是你们更多是合作的关系因为你可以分享到那些地方我感觉好像没有太大压力包括我们现在其实我们用不尽分享到 TikTok 或者 YouTube 或者 Instagram 很多人分享到 IM 里面分享到他的社交网络里面 IM 是社交网络他的那个通讯工具
就比如说那个 Telegram 就因为我们就想象比如很多用户他做出来的好玩的跟自己有关的内容可能也不一定就都适合发到那个公寓里面对很多人是愿意发群比如我自己我就天天在各种群里面给大家做那个视频然后大家都很喜欢所以我们观察到很多用户他其实也在他自己的圈子里面或者自己的群聊私聊里面朋友圈里面去做分享然后这个我觉得也是很重要的就是我觉得本身海外这个市场它的渠道分布用户的这个场景它就是更多元的
我们在这里边我觉得本身一个新的一个创作方式或者用视频来分享生活分享创意的方式我觉得就是有一个很有意思的一个新的一个市场对你说的这个场景前几天我们科技组的同事也都在用这个东西我们也都是在我们的小群里在传我们去看到比如说最近如果大家能去使用 TikTok 的话大家可以 TikTok 上比如去搜索 X-verse
我们能看到非常多的普通人就可能从来没有做过火的短视频的普通人他这辈子第一个可能一万十万一百万赞的视频就是用我们做出来的他可能对他来说就很简单他只需要把自己的宠物拍个照或者拍个视频让他跳个舞或者让他做些动作其实就会吸引来非常大的非常多正反馈
我觉得这个其实是让非常多普通人第一次拥有了自己的生活自己的创作被人看见的这个链路以前可能受限于创作的能力创作平台的这个流量分配的逻辑但现在我们是真正能让普通人第一次做出来高质量的视频而且每个都不一样每个都很好玩跟自己生活有关我觉得这个是我们看到的我觉得蛮令人兴奋的一个新的一个机会吧
你们为什么这个时间点要进国内的市场做中国的产品我觉得几个点我们本身最早就想做一个全球产品然后中国也是全球里面非常大一个市场然后我们一直还没有进入这个市场之前因为可能团队经历包括我们一些可能早年因为人太少了经历过不过来的原因还没有进
但我觉得现在的时间点其实蛮好的一个节点因为首先我觉得 AI 视频的一个场景已经被探索过了像去年我们在独页变身最火的时候其实当然中国也有非常多人在使用他们可能当时我记得那个月应该中国我猜测应该有个小几百万人来用过独页变身应该远远比看过独页电影的人要多同时当时我记得有很多人在闲鱼上会发帖
就找人去帮他去带做一个毒液变身的视频所以我觉得本身这里边其实中国用户的付费意愿或者使用意愿我觉得其实是一样的做一条多少钱我觉得当然最贵挂到 20 块钱做一条一般来说可能是几块钱做一条毒液变身又错失一个赚钱的机会对对对所以当时其实我们在闲云上看到很多人通过这个来去帮人做赚钱
所以我觉得本身视频它是一个很通用的一个媒介形态就比如在美国大家喜欢看的好玩的视频的玩法在欧洲好玩的玩法在中国是一样的就我觉得本身视频是一个更通用的这个传播媒介更普世的一个沟通方式所以我觉得这里边中国我觉得很多需求跟海外不会有太大的区别
另外一个是我们现在整个我觉得中国的市场我觉得之前独业变身也是我们有前期验证然后现在的时间点我们整个产品的开发包括模型的迭代包括我们这个团队的可能精力也更充裕了我们也觉得这个时间点是比较适合进入这个市场的一个节点
毒液变身这个事情它的这个门槛在或者说壁垒在什么地方比如说我今天我是另外一家想要做这个视频模板的我也去 copy 一个毒液的对比如说抖音快手他们也可以做 OK 我觉得几个点可以参考就首先我们可以去看一下第一个是责任得有一个很好的一个基础模型
你的基础模型得是一个很高质量的生产模型你才能让这个变身的过程跟变身的这个结果都比较符合用户预期这里面就涉及到非常多我们对我觉得一方面是技术上一方面是业务上我们一方面技术上我们需要有个模型并且我们需要把模型做一些微调包括我们需要可能在很多技术层面上做一些额外的工作然后另外一个是我们在业务上我们需要有一些用户洞察我们需要去
比如提前去大概做一些实验跟猜测说用户会大概喜欢啥然后包括可能独页它火了可能几周到一个月但是本身如果别的公司它想它可能要做也能做出来但可能一个月之后它已经不火了如果迭代速度不够快的话是很难去 follow 上我们的迭代效率的就是在持续有火的模板这件事情上你们是怎么去让它变有持续性这个其实有点像早年的抖音抖音之前 17 18 年的时候
但是他那会不是靠 AI 可能是靠一些内容运营就是他经常会有一些拍摄方式病毒式的传播一些模板然后大家都会去拍类似的东西对对我内部会有一些创意会不停的出来了但我觉得这里边还是比较重要的是基础模型对那基础模型得足够好如果你的基础模型不够好的话那你很多创意是没有办法能满足的
所以模型还是所有事情的基础然后在这之上的话我们作为内部的创意包括用户的投稿创意包括我们看整个市场的一些趋势这个都是很重要的一些输入和创业来源然后我觉得更进一步是我们希望说未来也让用户参与到创业的产生里面这个是我觉得更长期的一个我们的一些思路我们希望让用户
也能去贡献创意来去帮助到更多的普通人能去有更多元的创作你们之前在拉美还有欧洲就是反响很好的那个耶稣温暖礼就是在圣诞节前后上线的这种挺本土化的一些东西就是你们自己想的还是用户的一些 idea 启发了你首先这个 case 还蛮有意思的一个是用户他确实会有很多用户发现他们会想做很多宗教的内容
但综划内容本身因为都是千百年前的这个经典典籍它是文字嘛它是不可视化的因为比如没有人知道某个神长什么样子耶稣大家还是知道的吧但他具体长什么样大家其实不知道可能会有一个大概的形象轮廓或者一个大概的因为他有那个十字架上的
标准的样子吗对我发现说这里面好像大家对于宗教内容的可视化也是蛮多用户的需求那我们就想会不会有一些玩法它是能够去帮助到用户去比如说通过创作就获得一些温暖获得一些他想象中的一些场景的一些实现
所以当时大家就想那时候我们就做一个赛博耶稣让他可以拥抱他所有的信徒快上了这个模板当时我记得还挺火的其实在欧洲很多国家我记得德国西班牙意大利我们都上了他们 EPSO 总榜第一名那个时候应该他们可能全国有很多人都在玩这个模板他们也很喜欢这件事情在欧洲这些有宗教信仰的国家会引起一些讨论和争议吗就比如说你用 AI 来生成耶稣
对就是我觉得本身能用 AI 去做生成的用户他还是对很多新兴事务是有接受程度的包括当时比较有意思当时我还去联系了前任教皇的助理我跟他通过一些朋友去跟他方济各的助理对对当时去有一些我觉得共同朋友然后去沟通了一下然后我就给他讲一下说我们这个还不错然后会不会有一些合作可能性但至少我们
感觉其实整个就最严肃的那些中大机构他可能也没有对这个事情特别特别抵触我觉得本身还是说就是我觉得一个新媒体的方式让更多人去把自己的一些相信的东西想象的东西去做可视化并且让他得到一些这种温暖跟一些快乐你们就是马上要上了国内的这个版本它功能上和海外就是一模一样的吗还是它会有一些有区别的地方以及你们对这个产品的表现有什么预期吗
我们最早的版本还是会基本是一样的因为我觉得本身中国是全球市场里面的其中一个所以我们觉得本身这里面被验证的需求产品逻辑大部分应该是可以附用的后面我们会先发出来之后然后看一下引物反馈我们再去看要不要针对性做一些迭代跟升级就是你们正式发了国内产品之后你们有去预判一下就是说可能会给你们的比如说竞争或者说其他对手的动作会带来什么影响吗
我们的观点是中国是一个很重要的全球市场之一举例来说我们可能一个是大盘的事物很重要我们的中国是我们肯定是要去做的一个市场但同时我们现在还没有精力去把每一个那个市场做太精细的这个状态比如说可能现在海外还是更大的我们海外里边可能有更多的事情要做但中国我们目前来说我们会有一些冷启动的一些策略跟方法
我们会先上了之后看数据然后再迭代然后再去看怎么来做得更好我觉得目前来说可能还是一个这样的一个状态你们现在海外哪个市场最大因为我直接在你们的产品界面你看就是我会看到有很多英语的也有俄语的也有泰语的就好像还挺多元我觉得首先它的那个基础逻辑就是说整个视频是一个更通用的传播媒介所以一个好玩的模板或者好玩效果它在美国能火中国能火在巴西也能火在泰国也能火在欧洲也能火
所以本身我觉得它基础是因为视频的传播或视频的这个效果它是更通用的一个媒介吧所以我觉得更多对我们来说我们看到在全世界 80%的国家我们都在他们的这个榜单上排名是比较靠前过的就实际上对你们来说哪个市场是你们占比比较大就在你们的比例占比较大以及说收入贡献还是人口大国人口大国就是像美国巴西俄罗斯
包括整个欧洲这个市场对都是我们比较重要的市场这个是你们提前没有计划的什么就是放一个全球版然后它跑出来是谁可能就是谁对我们现在做的还没有那么精细化对因为为什么会有巴西了你们也没有多语言版本有啊我们有多语言巴西人比较爱玩吧但我们确实对巴西市场没有那么的多洞察对所以就是巴西是比较多的然后俄罗斯是比较多的可能这些有些不在你们最开始的预计里面是吗
我们的预计是这个东西是一个很普世的需求所以人口大国肯定都会爱玩所以我觉得它也在我们的逻辑里面那印尼不多印尼也多不是因为印尼不信耶稣我们现在模板的使用它分布已经比较均匀它开玩笑了对
印尼也蛮多的对因为印尼也是人口大国印尼应该是第四吧全球人口第四多的国家印度也是人口大国印度也是印度也时不时会有一些小的那个热度对它可能还和就是每个地区的比如移动互联网手机什么普及率有关对对这有关系
对 然后你们去年前说爱是这个目标客群是每天玩抖音 TikTok 的这些用户这个怎么理解是指你们想要和他们 PK 吗还是说你们是希望能帮用户明白我们可能类比说玩抖音 TikTok 的用户我们想说他代表普通人所有能看视频的人都是可以说我们用户能看视频的人他可能有一定概率都有通过视频来做表达的表达欲因为视频大家看的话
大家还是可能会不管是发到私聊发到群聊还是发到这个公寓里边我觉得很多人是会有表达欲的但表达欲没有被满足所以我们想通过 AI 创作方式来降低用视频来表达的很多的原来的一些门槛比如说每个人手机都有摄像头但是呢真的能拍好素材或者比如能去给他配好音做好剪辑包括拍出来不怕自己被嘲笑的人其实很少
我们希望说能用 AI 来帮助这些人迈出来第一步让他做出来一个好玩的跟自己有关的可以分享值得分享的一个视频不管他分享到公寓还是私域里边我们希望帮助很多人迈出第一步这个是我们想去做的事情所以我们之前讲说我们希望服务普通的人那关于就被用在什么地方上你们接下来可能的大的重点是什么呀
因为一方面你们是突犯 Z 的一方面我怎么感觉你和影视公司的人交流还挺多的因为还蛮有意思我觉得一个是从去年开始在 Sora 刚出来的时候因为当时中国只有我们这个模型是能用的当时 Sora 刚出来的时候很火但国内基本没有模型是可用的状态大家都很多人是后来才进入这个行业的那个时候我们还有一个
上一代模型是可用的所以那个时候就开始有很多影视剧公司或者专业的 creator 会找我们交流那个时候就有很多但其实最近这个交流少很多了因为大家可能就是我们在这块一方面一个是技术没有那么匹配第二是我觉得还需要发展可能才能匹配他们的需求回到刚才那问题更多是我们的选择更多是我们还是说刚才讲的就是普通人普通人就是你们聚焦的一个用处和方向对
怎么让普通人更容易的去体验 AI 创作乐趣并且做出来一个好玩值得分享的视频你觉得视频生成领域接下来的一个竞争点和赛点是什么就比如说谁先做到一件什么样的事情可能会给目前的竞争格局带来表大的变化
我觉得最基础还是整个模型跟技术的迭代我觉得现在的视频生成模型还是有很大的提升发展的空间不管是从各种维度物理规律包括运动幅度包括生成速度我觉得还是有很多的事情可以去探索所以这里面我觉得本身 Foundation Model 的升级还是这里面最基础最重要的事情然后在这个之上我觉得可能方向选择你的模型用来做什么
也很重要我这样会打比方说 AI 视频生成模型它不是全能的一个 AI 导演它是一个新的一个 AI Camera
那这个 camera 它被用在什么地方也会很重要那可能比如我们类比传统 camera 那传统 camera 摄像头有些是用在电影行业那可能就是一个大家伙他去拍电影有些用在比如短剧行业有些可能用在了短视频行业那它不同的使用场景它的这个摄像头能发挥的价值包括你怎么去让用户体验它的这个产品化路径是不一样的所以我觉得本身还是一个说模型迭代跟产品方向选择相辅相成互相促进的一个过程
所以我觉得这里边最重要的我觉得还是技术技术之上就是技术用来做什么你刚说的第一个点就是那个基础模型的提升对比如说你们刚提到物理规律是否那么真实还有它的时长还有生成的速度就你们现在普遍 PS Verse 的时长我感觉是 4 到 5 秒左右
比较多吧 5 到 8 秒 5 到 8 秒就比较多 OK 就 5 到 8 秒的话这个是你们受限于目前的模型能力它就是这么长还是因为你们发现用户需要这么长的东西我觉得很有意思我觉得行业里面有两个事情是反常识的伪需求一个是生成更长更好
一个是纹身视频是最大的场景首先深圳更长更好并不是真实的创作需求比如我们去任何比如说 B 站上开一个视频或者在电影院看一部电影我们去数一下就有多少镜头是长镜头一镜到底的镜头非常非常少我之前大概数可能 95%以上的镜头是 8 秒以内的就其实在传统不管专业还是说普通人创造场景里面比如说一分钟这么长的镜头都不是大家的
常用的镜头长度所以在线上我们也尝试过比如说更长时长的镜头其实我们发现用的用户非常少所以不是说我们技术有限制做不了更长更多是我们通过用户需求包括实际的创作的场景里面我们发现可能 10 秒或者 5 到 10 秒这个单元是一个比较有意义的一个创作单元包括像我前段时间跟另外一个影视公司的核心的人在去交流他们提了一个他们的一个痛点
他们说现在的视频单镜头好像太长了他们想要一两秒的镜头他们不想要五到八秒不想要十秒的他们想要一两秒的因为一两秒他们更可控更好去做这个镜头之间的组织所以我觉得本身这个是一个也不是反常是吧就他其实我觉得是之前 Sora 或者 Wayne 他给大家灌输了说一分钟生成很厉害但是呢实际上他并不是真实需求
而且它也没有做出来一分钟深层它也就是一个镜头之间的拼接这个是第一个另外一个纹身视频其实也不是一个很多人在用的用的小型专业用的普通人其实都不用纹身视频纹身视频就语意跟视觉之间的 gap 还是太大了你很难用通过语意的包括像我刚才讲普通人他会写 prompt
包括对很多专业创作人来说他其实他很难用语音控制好这个风格化很多风格化很多这个东西但是创作会用那个分镜嘛他其实自己也会画分镜对大部分的创作场景还是说不管普通人还是专用还是说图或者图加文字去生成视频这个还是最重要的一个场景
所以回到刚才问题就是说深圳市场不是那个基础选择更多是我们的一些判断那具体在基础模型怎么提升上你们比较看好的趋势是什么几个大方向首先一个是可能会有新的架构出来比如像 GPSO ImageGen 那块的 AR 路线我觉得是蛮有意思跟我们之前很多想法是类似的
我们现在的是 DIT 的架构我们现在有 DIT 模型但整个自回归结合 Diffusion 的这个生成的架构我们也在做很多积极的尝试在这块我们有信心吧我们应该也会在比较快的在可能全球前几个甚至最快的速度发出来一个可用的高质量的新架构的模型这个是有可能
但像我刚才讲的这个模型不一定就是普通人最喜欢玩可能对于专业创作者可能更有帮助然后第二个是我们觉得把生成速度压得更快是更有意义的因为我们现在的现场模型生成速度应该是全世界高质量模型里面最快的我们只需要 5 秒到 10 秒时间能够生成出来一个高质量的视频镜头对比同行的话大部分的模型闭圆开圆的高质量模型基本都需要至少 1 分钟到 2 分钟的时间才能生成出来一个高质量的镜头这里面我们觉得我们还会希望说
或者说在更好的模型的情况下保持这个生产速度我觉得这个也对用户体验是至关重要的对这个我可以安利一下因为我有自己在用你们的产品我体感还是觉得挺快的我觉得可能差不多十几秒到二十秒吧看不同分辨率吧如果是相对比较基础分辨率的话最快我们应该是五秒可以把一个五秒镜头生成出来对
它反而挺快的对五秒生成五秒那生成的时间已经它基本上已经实时了对等于它这个视频最后本身的时长了对我们这个不是 demo 这个是线上大家可以去体验就我们一月份就已经有这个模型比如说我用这种模板第一次用的时候可能会要等十几秒其实第二次用的时候哪怕是不同的照片可能也会快很多那应该没有那应该只是说正好可能
我排队的时间是比较短是吗理论每次都是如果没有排队的话应该是基本一样我有一个问题就是你刚才提到就是你们现在在做这个 2C 的产品之外你们也在探索 API 的这种收入的方式就是你们会觉得这样做会有点多吗会不够专注和聚焦吗我们觉得比如做一个很标准化的 API 的这个平台其实它对我们来说是一个新的商业模式我们觉得它是一个可以探索的事情
因为我觉得它可能会导致你模型优化的方向要不一样就像你说的你们可能会在全球作为第一个或者是第一批推出一个新架构的可用的高质量的视频圈圈模型但是你刚才也提到说这个模型有可能并不是就那种天天玩 TikTok 和快手抖音的普通人会用的它可能是跟片专业用户的那你相当于是再往两个方向去优化你的基础模型这么做不会分散你们的一些精力吗我觉得首先它的底层说这个模型我们在训的还是一个通用模型
就我们整体不管是 B2B 还是 B2B2C 还是说直接 2C 它其实都是解决各种各样的场景那这些场景它合起来就是一个通用的问题那这里面对我们来说很多比如说 API 的一些反馈对我们来说其实反而是有益的因为它代表的是一些因为可能个人客户他也会有很多 feedback 然后很多就比如企业客户或者说一些更大的一些组织他也会有一些他的一些 feedback 对我们来说本身对我们训练一个通用的模型来说都是有益的
视频生成领域的一些 2B 的业务里也会有定制化的做法吗就目前市场上这些公司当然了有非常多就比如说各种各样的我们了解到各种各样的同行他可能甚至有些人在做分销然后很多人在做这种解决方案对其实我刚才问这个是否足够聚焦和专注的问题也是跟下面有一 paar 问题我们想讨论一个话题有关的就是
模型和产品的关系以及你们的团队经历在这两个中间怎么来分配因为 23 年就是爱诗成立的那个时间点包括一大批六小龙也在那个时间成立当时行业的一个主流观点就是模型和应用是要双轮驱动对吧你得一起做然后之后可能大家的想法又有些变化觉得就是你现在那段去把产品做得特别好
可能并不是最重要的最重要的还是你的基础模型的能力要持续地去提升因为你模型能力提升之后你的产品又会有一个比较大的变化那具体到的就是你们的这个行业和你们现在自己在做的这个事的选择里面你们怎么去平衡这两个东西的关系因为我听起来它有些地方肯定是一致的就是你如果视频生成模型的
性能越好你的产品它也是会越好用对吧它的生成速度然后它的效果但另一方面因为你们现在这个 to fancy 的这种做法里面它其实有很多可能我做专业的影视内容所需要的能力在这个产品形态里我觉得是不用优化的甚至它可能有些地方是相反的嗯嗯
那这一部分的能力你是就是舍弃了还是说你为了我要做一个更好的模型我也会去做就你们现在怎么去看这个关系对所以我觉得这个 AI 行业大家一般讲的这个 AI 模型和应用的关系一般只是语言模型跟语言模型的应用的关系吧
大家语境里面一般只是这个然后我觉得首先视频生成或者说我们这行业跟原模型还是有很大的不一样的我们这行业像我刚才讲其实我们在做的事情打比方跟像一个 AI 的一个摄像头摄像头它本身是没法直接卖摄像头来赚钱
它摄像头还是需要说它到底放在什么样的场景里面去给到用户但本身研发这样的一个 AI 摄像头本身它有很多基础的东西或通用的能力是需要去解决不管说局地比如分辨率或者比如说符合物理规律或者比如清晰度或者说这个生成的速度这些是通用问题这个是无论如何都是要解决的在产品层面来说这里面确实在应用方向上我们把一个通用能力应用在一个具体场景里面可能在 2C 这块我们会有些取舍比如我们 APP 端它的功能就很简单
就比如说我们的 APP 端跟我们网页端其实是两个相对不一样的产品一个是更多服务普通人一个更多服务专业创作者那我们其实在 APP 端它的功能是相对比较少的我们把很多网页端的专业创作功能放 APP 端因为对普通人来说可能就是没用但不意味着我们通用能力上我们不会把它做迭代因为可能有一些 feature 可能对普通人来说就是很有意义的比如举个例子最近我们有一个功能它其实最早是专业用户用的一个功能
它在普通人这块也被用得很夸张那个功能是叫做手尾针手尾针最早是专业场景里面怎么帮助专业用户去做可能给他一个手针给他一个尾针去补针的这样的一个技术最近我们发现大量用户普通人在用我们的这个手尾针来做一个比如类似于让自己从小长大
他穿一个自己小时候他穿一个长大的照片就可以生成一个自己从小长大的一个这样的 video 但比如像这样的能力理论上最早我们没有在 app 端去上线但是呢普通人他用户去探索这个技术功能的一些可能性发现一个原来可能是专业最早我觉得这功能基梦做的最早基梦他做了这个 feature 后来大家其实都做了这个功能但后来这个功能它最后是在我们这可能被普通人广泛用来去做这个比如说这种首尾针普通人的玩法
你昨天在群里就是用宇童的微信头像然后就开始是他的头像后来变成了他去旅游的那个照片对也是类似的玩法就是这个因为这个其实内效果还挺好的我们说的这里面其实我觉得很多的因为我觉得还是说这个技术的发展会带来更多可能性我们很难用一个比如垂直行业或者用于一个我们目前认知去框这个以后技术发展会带来的一些可能性所以对我们来说我们还是很重视说模型是所有东西的基础我们来
把基础模型做得更好然后同时我们去做更多功能或者模型能力的一些边界探索一些新的边界然后自己跟我们用户去探索说基于这个更好的模型能有哪些好玩的玩法给到普通人或者专业的一些用户总体来说你觉得模型和产品在你们的竞争力或者说壁垒里的占比
分别都是不大的比重我们概念里面这两个东西都很重要就没有说哪个东西更重要就像你刚才讲的不同公司会有不同的观点比如有些人会觉得模型决定一切模型级产品有些人会觉得应用它最重要但我们的概念里面是这两个事都很重要因为如果没有基础模型的话
你任何应用想法都没法去实现但如果一个好的技术没有找到好的这个应用方向的话它的价值跟潜力也没法发挥出来所以我们的概念里面是我们希望说不管内部协作还是我们的这个公司的发展上我们都希望说我们要把这两块都要做好有一个我想补充问一下的就是你们现在做的这个方向其实是我觉得偏娱乐类可以这么说吧对
就你们的 APP 端只要是偏娱乐类的然后另一方面大部分做视频生成的不管是创业公司还是大公司比如说像快手可能这种它是偏生产力的是帮专业的影视制作者去提升效率的你总体上你怎么看这两大类选择
它的比如说切入的难易以及它未来的天花板因为之前我们跟有一些创始人或一些投资人聊可能他们就会认为生产力是一个这一次 AI 最大的出现认为这是空间最大的而娱乐陪伴类不是但那方面也有不少人认为可能娱乐陪伴是一个对创业公司来说更友好的地方 OK 我的理解是这样子就是首先我们也有生产力的产品
所以我们其实两边视角都有我觉得像我刚才前面比的例子就是说现在的生产力比如生产力出来的结果比如一个完整的 AI 的视听作品它里面到底有多少是被 AI 视频提升生产力的比如说这个作品里面 50% 90%以上是 AI 视频解决的我觉得应该这个 PMF 很好
但目前我现状是 AI 视频更多变成了一个宣传的噱头本身视频作品里面大量的还是人的经历 AI 视频里面在里面解决了很多素材的创作问题但本身你说这个 AI 视频的素材很多已经达到人的标准但很多可能还没达到所以这里面我觉得当然解决生产力很重要但解决生产力你要看解决了多少你解决问题的比如你解决了 10%生产力那它是不是就会打个折扣
但另外一个角度来说但当然这个市场我们现在的我们的网页的产品也在服务很多用户我们在生产力这块也有很多用户在用所以这块我觉得是主要是这个另外一个是我们去看普通人我觉得首先还是两个很不一样的定位跟方向我举个例子比如说 AdobeAdobe 它有 Photoshop 它也做了纹身图对吧那它很难在 Photoshop 里面把纹身图放在一个最重要的一个位置因为它的生产力的用户就是那些
用它这些非常复杂的设计编辑功能的用户它的最好的一个体验的一个地方那你让它原来这个巨大的一个创作者生态一个内容生态去适应一个新的更平权更低门槛生产方式这个事情大概率我觉得可能不 work 所以对很多这些生产力的产品来说它要去做普通人它可能不得不去做一个新的一个产品因为很难用一个产品来服务好两个人群
对就比如说视频里面可能看长视频的或做长视频的创作者他用的工具他用的产品跟普通看短视频的人用的创作工具跟产品还是两个不一样的产品逻辑所以我觉得这里面它其实是一个要去做选择的我觉得很难说难易因为我觉得本身其实整个专业创作场景里面首先文物模型也在做但这里面我觉得本身像这种多模态协同的生成问题
的解决它可能不仅是视频模态单一的就模态里面要解决问题可能涉及到多模态的问题这个我觉得是整个行业 AI 行业需要去努力的方向在普通人这块我觉得它更多是要想清楚想清楚你是不是要做这个事情要做这个事情的话你可能整个组织包括你的整个比如说产品化的这个方向你的
对
你们比较在意的竞争对手是谁全球范围我觉得在技术层面有非常多值得尊重的对手或者同行像最早发布这个市民生成的高质量市民生成的可林包括像海罗的 MiniMax 也做得很好像海外的 Google 然后包括像最早定义这个 Diffusion Transformer 的 Sora 我觉得都是技术上非常值得尊重的同行
我们也会很关注他们的迭代跟发展然后同时在产品侧目前跟我们做一样事情的公司视频侧做 2C 的公司好像还没有我们也希望说有更多的人能进入这行业因为我觉得如果这行业没有太多良性竞争也是不好的我们也想看到更多人一起来去探索这个事情其实抖音和快手内部的模板是不是某种就是有点重合它不完全一样吗
但是有点重合我觉得抖音或者机会为什么比如说像快手它要去做一个新的产品像做可灵也是因为像我刚才讲你很难在一个短视频专业创作工具里面又承载一个 AI 创作工具同样的比如说可灵这个专业的 AI 创作工具能不能承载一个 2C 的创作工具它我觉得也是一个要去思考的一个很重大的问题所以产品矩阵我觉得也可以但这里面就是精力分配跟团队的聚焦的问题
你和王长虎是怎么分工的因为总是早期的时候人很少所以就当时我们大家就可能在很长时间我们在研发模型然后长虎就把这个核心模型研发要去解决然后我可能更多把其他事情对外各种包括融资可能比较擅长的事情包括可能找一些关键人这些事情我会做蛮多但现在慢慢的觉得公司发展的变越大然后我们也会去比较灵活调整这个分工现在可能长虎他更多把这个核心的产业他顶好
产品是王商虎自己在管他现在更多经济的产品上面其实王商虎刚出来的时候有些投资人并不看好他的一个原因是觉得他做不好就是新一代的 AI 产品以及能让年轻人玩的产品但是我觉得其实最后这几个视频生成公司就目前的状态来看反而是爱识 Peaceverse 的用户可能是最年轻然后最 fancy 的一些玩法和人因为给专业视频用的那肯定都是更工作上的群体更专业的群体
所以你们就最后跑出来的结果我觉得跟最开始大家一些判断还是有反差的对这是靠什么实现是因为他本来就是一个心态比较年轻的人吗跟大家最开始想的不一样吗还是说这个过程中间你们相互交流很多大家相互有些学习我觉得首先还是说事在人为首先我觉得长虎他的上下文是足够的
比如它的输入是足够比如原来它在字节经历过这么多的大产品的发展它是有足够多的 context 就对比的可能比如说很多学术背景的一些同行对于互联网产品对互联网产品怎么从零到一它可能上下文是会跟常务比是有一些不足的另外一个是我们过去两年里面其实我们的概念里面一直是本身模型产品同样重要所以我们其实做了非常多产品探索然后我们
我在这里面我们这两年里面积累的认知跟我们的信息量我觉得也是很多同行他可能不具备的我们在比如我们去想在 23 年的时候做视频生成的公司可能也就没几个吧现在可能到 24 年其实也很多人是因为 SORA 火了之后才进来的嘛
所以这里面我们过去不管是创业之前还是说创业今天的经验我觉得对于长舞队或者整个团队来说我们对这块的探索都是有很大的一个帮助的然后另外一个是我觉得本身 AI 产品它就是一个新的东西我觉得可能很多比如说以前互联网里面也是大家可能去找那些
比如说大厂背景或大厂做过成功产品背景的人往往他可能不一定就能做得最好我觉得很多东西一个是可以被学习一个是可以去探索的而且特别我觉得在我们这个领域里面出版我们走的是一个无人区就现在没有走过这条路那很多东西是大家去蹚出来的比如说我有一个经验我就一定能把它做好的其实长虎之前在字节我觉得他还是偏就是研发岗位吧然后你之前其实也不是一个典型的产品背景他也不是一个典型的产品背景
你们创业之后就是没有想过说找一个产品的负责人甚至合伙人的这种角色的人吗是我们产品下有很好的同学在负责但反正我们公司那个比较扁平大家也不怎么讲什么 title 这个是第一个第二个是我举个例子很有意思比如说去年在那个 23 年的时候我们刚做 pixel 我们刚做内测的时候
我们当然要做 AI 产品的海外增长推广然后原来因为我看过很多互联网公司所以我就认识很多可能做增长比较厉害的一些专家我们就交流然后发现当时其实是个网页端产品然后包括我们最早在 Discord 在网页端都有做我们就去聊国内有谁在这块有经验没有人就没有人在那个时间点对于比如怎么在海外全球市场去把一个 Discord 或者一个这种网页端的 AI 生产者产品
做好的经验因为大量比如说移动端也好或者是传统互联网产品的经验它其实是没有那么适用的所以我觉得这里边它的这个 take away 就是说整个 AI 甚至是 AI 是一个新的一个领域有很多经验它能服用但有很多经验它根本没法服用所以我觉得首先它是个新事最后它这个事情是得大家去探索出来去做出来而不是说可能去找那个符合什么简历背景要求的人然后把它做出来我觉得这是我们的一些经验嗯
你们今年有什么大的目标吗我们今年我觉得还是说继续加速奔跑在模型上跟产品上我们希望到年底我们用户量能再有个至少两到三倍的增长至少两到三倍的增长
因为你们现在全球总共是 4000 万到年底的话我们现在 6000 多万现在 6000 多万那又比之前你们公布上一个 4000 多万的时候又多了两到三倍的增长那就是有差不多小两亿到年底的时候你们的目标对我们希望是亿级别的总共互量然后对因为我们觉得本身这个需求我们觉得还是一个很普世的需求它应该是可以让很多人都去用起来的那更长远来说你们想成为什么样的公司了
比如说三年五年之后三年五年之后我们希望说会成为有规模化用户量规模化的盈利能力的一个 AI 公司什么叫规模化的用户量什么叫规模化的盈利规模化的用户量可能就是我们能持续稳定的增长
我们能解决一些真正的需求然后有很多人每天在玩它会有很多自然的口碑传播就是它有个绝对数吗比如超过多少是规模化的用户数量我觉得千万日活以上吧千万日活以上可能就是大几千万到一级别的月活所以这些指标你们最关注的是哪里
就提到了很多日活月活收入然后注册用户我觉得对我们来说比较重要的是一个是活跃用户量可能日活月活都很重要另外一个是我们现在会比较多看商业化指标因为产品应该是一个比较强调付费的一个创作工具
现阶段我们还是会看很多商业化指标比如说有多少人付钱他们的付钱之后他有多少人会留下来这个是比较重要但我觉得本人产品也会迭代我们也会希望说以后能不能有更多元的商业模式进来比如说是不是能看几个广告就做个视频
这种那如果这样的话我们希望把这个使用模型的门槛进一步降低让更多不订阅我们也会拥有一些核心的一些体验那这样的话我们到那个阶段会更关注可能整个大盘的一些用户的流传啊包括长期的这个使用的一些行为对正好你可以介绍一下就是你们现在海外这个版本它的付费是哪几档然后你们在国内推国内版的时候你们大概付费会怎么设置目前来说我们海外大概三档
最便宜那档是 10 美金一个月然后第二档是 30 美金一个月然后最高那档 60 美金一个月就单月订阅的费用它大概跟使用量有关系就你的用量你的付的钱越多你的可以使用的用量越大单价会越便宜国内我们应该会附用一样的定价逻辑因为目前我们在国外所有国家也都是一样的定价逻辑但我们会等上完线之后我们看一下反馈我们再决定要不要去做一些调整
那巴西这个市场还真的挺出乎我的意料的其实巴西的经济状态也并没有那么好那他们敢花钱对就算花钱还花不少比如当时独业变身就很有意思当独业变身在国内火的时候我们发现说在抖音里面非常多用户在评论区里面说求求了六块钱帮我做一个就大家愿意职位单挑这种让他能够觉得有意思的创作体验去做付费的我觉得还是蛮有意思这三档里面实际上就是哪一个党付钱的人最多
我觉得我们的专业用户跟普通用户不太一样普通用户肯定还是更低的那档会付的更多一点专业用户它会平均更多元一点在所有用户里面的付费的用户占的比例这个方面透露吗
这个可能不太方便对比如说续费的就比如说我这个月定完了我下个月还会定我们的续费率我觉得比想象中要好很多就是我觉得最后可能不比专业的一些创作工具的续费率差现在就是图专业视频创作者这种视频生成工具一般再次复购的比例是多少
我觉得它有很多不同的口径就比如说专业到多专业比如企业级的还是说是个人的还是比如说我说的还是个人吧就最普遍的那种就个人做视频我觉得大概可能五成以上的或者说大几十的复购已经算是很好的视频了但很多可能都做不到
对刚刚说这个第一个点就是你们要想有那个规模化的用户然后你说三五年后还有个目标是规模化的收入对吧这个大概是在什么体量我觉得说收入体量是一个围状因为我希望自己能挣钱因为我觉得大部分的人工智能公司在早期发展或在发展很长时间里面都是会有比较大的亏损的你说要 break even 要盈利对我希望说我们在比如说你刚才讲的时间段我们能实现规模化的盈利因为我们觉得在视频的领域是有可能
因为视频是一个离真实的使用场景真实需求真实的流量真实的商业化更近的一个形态我们看到海外的 Meet Journey 它现在一年的订阅收入应该是个几亿美金的体量三亿多可能不止了它应该可能比 3 亿更高了我们了解到然后
我们相信视频的创作这种普世的视频创作视频的分享它应该是一个更大的一个用户量的一个需求然后这里边我们觉得还是会有一个很大的这个市场空间那同时我们也希望说我们把整个这个公司的效率我们把这个技术做到足够的平权能够让我们也在帮助用户去创作的同时我们也能够把钱挣回来
你们 1600 的月活差不多每个月消耗的这些算力的成分是多少我们还可以因为大部分的大模型公司可能它的推理都是算不过来账的我们还是在推理层面还是会有一些利润空间具体的比例可能不太方便说了明白
就说你不算你们模型研发的这个成本的话你们的模型服务 Serving 的这个成本我们是完全算你们的订阅费是可以给他覆盖掉的对最后一部分就是想聊一下你自己的一些职业选择因为你开始毕业之后到这一次创业之前你都是在光源对啊
对待了六年多快七年吧对然后其实就是你这一批进一级市场应该是 1617 年左右是吗 16 年进 16 年对 16 年左右我觉得就是这一批进一级市场的很多人其他可能不管你是做投资还是做投行 SA 这种业务可能都没有之前比如说早个五六年或者小十年来做这件事情的人发展的更顺利吗因为很多大的项目的机会在消失嗯
你可以讲讲你当时包括入行的选择到后来慢慢想创业你可以讲讲这个过程中间你的一些经历和思考对可能回到最早我在上学的时候当时因为我们学校或学院的创业氛围还相对比较浓厚在那个阶段你是一级的我是一级北大光华的那个时候我们的创业氛围还比较浓厚那会儿谁创业这个
没事讲就完了那个时候反正我的学长我的学弟们创业都还有一些声量在这个行业里面然后我觉得当时很有意思当时我刚上大学的时候那个时候我们同学里面大部分大家包括我的学长学姐大部分人想去做那个 consulting 或者做投行
那个时候可能是一个毕业之后平均收入最高的一个工作然后也确实是很好的一个职业路径所以当时我觉得蛮多人的主流的想法是去做这个当时我记得我大一的时候当然正好我们有一个访学团去一趟硅谷然后当时我正好是带队的同学你大一就有访学团去硅谷对 当时我大一组织了一个 study tour 去硅谷你自己组织的
当然是我们学生会主持人然后我主要负责整个美国行程所以你大一就在公华的学生会开始干活我是群众的参与很多工作那时候去美国一个是见了很多当时北大的校友另外一个是见了很多那时候在那边的高校包括斯坦福 伯克利的一些跟我们同龄的一些华人还有海外这些同学然后也跟很多当时的一些创业公司交流那时候其实整个万中创业在中国还不火大家对创业这个事情是怎么回事没有那么多概念在校园里面
我当时对我的冲击都很大因为当时我发现为什么大洋彼岸的那些同学们大家想的事情或者大家想去探索的职业方向就跟当时在国内我们当时可能算比较顶尖高校里面同学这个相当于不太一样所以我觉得大家当然讲了很多什么改变世界然后说我们要去创业要去做 startup 我觉得那个对我的冲击有点大所以当时觉得这个行业是啥所以我当时就在想哎
会不会比如说学商科那以后呢去参与到创新创业里边这个是一个令人有意义的一个机会所以我觉得当时在刚上大学的时候就有一些这样的一些种子埋下来了嗯
而且到大三大四的时候就 13 14 年那会儿其实是中国的一个就开始创业的高度我记得当时我在那个毕业之前一个是我当时在北大南门就南门走几步就到中央中央大街嘛我就经常去那个街上当然经常找了个实习就是他当然有一个那个专门做那个孵化器还是加速器的一个机构吧当然他有很多路演
我就帮他们打杂就去看当时的那个创业者怎么去露眼然后当时有很多那种类似于 speed dating 就很多创业者上去讲一下 idea 然后下面投资人都开始打钱我说哇这个太刺激了太牛了然后当时整个创业大街是非常非常热的一个地方
然后后来我职业选择当时我觉得比较巧当时正好在那个光源有光源当时很小当时可能就十个人左右吧里面正好有 20%的人是我的校友当时可能这个机构在当时也是一个在行业内有些名气但可能在公众来说大家并不知道光源是谁的一个这样的一个状态那时候我发现这个机构它
帮快手帮 PPT 融过资我觉得这两个产品我都知道而且都很厉害我想这样一个机构它既能去帮助创业者融资又能去指导很多最顶尖投资者来想什么那应该是一个蛮好的对我来说职业生涯的一个开始然后让我可能更接近创业的两端不管是做公司的人还是做投资的这个人
所以那个时候基于这样的一个比较朴素的想法就去了光源所以你当时去光源的时候你就是后面想创业的对 我其实在光源的几年里面我数次有冲动想创业哪几次弱潮会让你有这个想法
我有一年在看游戏我在看游戏因为我自己一个是还比较喜欢打游戏然后那一年整个也不是元宇宙吧更多是在元宇宙之前其实游戏行业就我觉得游戏其实是移动量非常好的一个赛道虽然它离资本化不近但本来游戏是一个非常好的一个商业它既贴合人性然后它又有很好的商业模式反正我觉得那时候对我来说
就是整个一直在参与到当时其实虽然说不是移动互联网最最黄金的那么几年但是那几年也有非常多的这个新的公司跑出来我觉得比较幸运吧在那个时候可能就光源发展比较快的阶段我也参与了并且有幸在里面做一些贡献
消费你没有想过创业吗消费吗对就有一段时间消费跟互联网还是会差距蛮大的因为我也看过一段时间消费但它跟互联网还是不相似互联网的链条或者它的产品化或者它的逻辑我觉得跟消费品还是很不一样的互联网它我觉得一个是更通用一点如果把一个问题定义好把一个需求定义好它是更容易 scale 的
消费者里面从供应链到这个渠道到各种环节吧它的链条是更复杂的我觉得跟看消费跟看互联网的逻辑还是蛮不一样的然后我其实从业阵营里面主要是在看互联网我觉得基本上可能国内那几年里面从 16 年到 23 年我离开这行业之前可能 50%以上的有百万日活的新的 APP 我应该都有聊过或者我有参与就不管是帮他融资还是说可能有部分我们也同光源基金做过一些投资
所以还是比较亲身经历了整个互联网最后那几年的发展但是从 16 年之后就是你说的这种有百万日货的 APP 里面它应该没有什么涨成中型都没有涨到对不对就别说大型的公司还是有的比如说不是我参与但我们可能整个团队参与了像这个德物德物德物是后来出来德物其实是德物成立很晚是吗德物成立蛮晚的
2015 年 7 月成立的对对这几年我就有个现象就是还是有很多新的公司百万级日活或者千万级日活公司还是有不少出现的但是呢这里面大部分公司都会比较低调因为不想被巨头看见大家会更低调所以那几年里面其实整个这个我觉得互联网在可能 16 到 21 年还是有一波这个高潮你看比如说在官员内部找来看当时还是官员最大的一个赛道
就每年不管从 GMV 还是说从我们自己投入那可能都是最大的一个赛道但这件事情在 22 年之后就不是这样了是吧对 我觉得 21 年年底到 22 年是一个拐点就是整个我觉得移动互联网确实到了我觉得一个跟中美包括美元基金的这些关系有关另外一个跟本身这个行业的也是我觉得到了一个发展到一个很成熟期它其实更多是进入了一个整合或者说巨头把很多流量的一些
空白的地方去做了填补包括像字节这样的公司其实非常非常强它可以把很多新的方向后来居上甚至去吞掉比如说像番茄小说像红果的这个短剧它其实都做到了很大的提升是的是的所以我觉得在整个这个包括其实字节不仅对创业公司它对于很多大型公司
大厂已有的业务也是巨大的一个冲击我觉得这里面其实到 2122 年从资本上从整个行业的格局上它就是到了一个成熟甚至可能行业去整合的一个阶段所以我觉得那个是一个时间点你觉得之前在光源的这六年多对你现在来做创业有一些什么样的影响和一些
你叫帮助也好或者说叫余静也好吧就影响你现在的一些决策那几年经历对我还是蛮宝贵的一个是我对也不能说多懂互联网但至少我的上下文我的 context 是足够的我看过足够多的公司从各种各样的内容平台从文字到图文到视频到直播到长视频到音乐到音频
到短距包括到社交社区到出海工具其实所有的评类的平台我都有一些了解也看了很多公司的发展所以对我来说我有一些输入另外一个是对我来说可能也是让我会更愿意去冒险因为我觉得本身很多事情是在人为就没有一些东西是被设计好的比如说怎么样的人才能创业或者怎么样的人他就不能创业或者说
符合什么履历的人他创业就一定会成功我觉得这行业是没有固定范式的反而是那些更愿意去冒险看到一些非共识的东西的人能够去把事情做出来所以那个时候我就对我来说 take away 就是说一个是看准了要敢赌第二是看准了就要赌的话要 all in 然后要轻松去参与所以我觉得这里面对我来说会有一些可能一些是从认知或者说一些信息量层面跟一些比如说思维思考事情方面上的都会有一些帮助
比如说在你接触比较多的公司和创始人里面什么人给了你比较深的印象和启发包括你刚才说的就是可能创业成功与否跟你是否是一个特定的背景并不是直接相关我觉得有两类 Founder 对我的影响非常非常大有一类 Founder 是那种就是特别有 Vision 他对于自己想做的事情特别热爱他会基于自己的事或者基于自己的一些独特的洞察即使所有人都不相信他也愿意去冒险去说服更多人来相信他
并且一直坚持基础在公司可能顺利不顺利的时候都能一直持之以恒去做探索我这类人对我的触动非常非常大因为我觉得这类人是真正的那种能推动行业进步能去持续去做创新的人那你和周围的就是以前跟你差不多时间入行的做一级的朋友你们现在有时候偶尔会交流吗你们会讨论什么还是交流蛮多就还蛮有意思的就是
我觉得这几年跟我交流很多同行有一半以上不是在聊我们这公司一半以上在聊以后他们能做什么我猜也是会聊这个就大家现在想什么了对我觉得很多人比如说就我觉得可能客观来说就是整个这个意义市场的环境跟我刚从业的时候有很大变化包括可能美元基金人民币基金都有很多的这个因为宏观形势各种原因导致这些变化
所以我的体感是非常多的原来同行他们会去想一些新的一些个人探索方向可能很多人会想自己创业会想加入创业公司或者可能有些人他也就彻底转型了我觉得这里面其实都有了但我觉得本身其实还是一帮很聪明的有很多经验的人他想去做一些大胆尝试的一个状态我觉得现在看起来很多同行也找到很不错的一些地方然后在做自己可能
下一步想做的事情然后现在我觉得很多人可能他就是跟你之前类似的一个情况他不是直接搞但他想加入这个新的机会他想跳到这个热潮里面就你对有这种考虑的人你会有什么建议吗我会觉得还是先沉下心来去了解就可能你不会写单码但你可以去了解这技术大概一些原理比如说它大概能解决什么样的问题
因为我觉得解决什么样的问题这个其实是一个可以被了解或者可以去分析或者去根据自己的独立判断去判断出来的事情然后本身我觉得很多的这个学术上概念你要去理解它现在有那么多 AI 工具那么多的教育课程它也没有那么难但我觉得更重要以我的经验来说我当时更多是我觉得当时我更多是因为我体验了足够长时间的这些
纹身图的这些产品或者视觉生成的产品以及我当时也去请了一些有代码能力的朋友来去跟我协作去做一些探索所以过程中我因为这些探索跟这些上手第一手的尝试让我有了可能跟我同一个时间的别的同行他没有自己的一些认知和判断
所以我才会有勇气会有一些决心说去那我看到一些可能大家没有看到的东西那我可以去赌一把然后把自己投进来一起去探索一些未知的事情在你 16 年到 23 年在光源的时候你不是说这种其实互联网的下半段都看过吗就各个类型的对就是能做到这个速度达到千万月活的有吗凤毛麟角
就还是有的还是有的比如说什么类型的产品比如说当时有很多做社交的公司它就在报的那一个月那肯定是很快就会到一个甚至一百万的日薪增我都是有看过的但基本上可能我从业内几年里面很少就可能加起来不到五个吧那这种会有留存就会持续吗大部分留存没有那么好但也有
有长期流程的公司它能够持续能稳定下来这是一个你觉得比较超出你预期的体验对因为它是一个比较可量化的东西然后就会让我去对比原来看的这些东西感觉还是会让人回头想想会觉得可能确实给很多用户创造了独特的一些价值还有什么吗还有比如我们在我们的发布独业之前那段模型我们在内测的时候我们能看到这个模型的图像视频的效果能这么好
这个也是在发布之前在我们训出来之前的一段时间还是一个超出预期的事情吧我们发现说应该已经能做一些让普通人能够玩起来
你们就是创业两年多以来有什么你觉得比较难或比较低谷的时候我觉得在 SORA 发布的之后的一段时间我们的模型还没有迅出来的时候我觉得也不能算低谷吧更多是我们在前行研发前行往前奔跑的状态那个时候应该是你们的下一代模型没有迅出来吧对我们
因为你们之前 DIT 这个模型还没进出来那个阶段我觉得更多是一个因为确实这个技术很难它需要一定时间周期那时候市场上会有各种各样的声音什么谁谁谁哪个月要发布什么模型然后 SORA 它有多厉害然后中国团队可能永远是用不出来有各种各样的声音都是噪音但对我们来说那时候更重要的是怎么
去把自己手上的事情做好因为它是一个无人区没有人把他这个事给漏汤出来了所以那个时候其实是一个对要相信自己跟能力跟自己选择的方向要面对非共识的一个阶段那个时候我觉得还是会挺不一样的
那个时候需要一些什么方法和手段来提升大家的士气和信心吗有些什么比较有效的方法吗很难说方法更多是我觉得还是说大家的整个组织内部大家的是不是思想一致大家对于这个大的我们在探索方向是不是有比较 common 的一个共识以及比如说就比如说对于我们自己的能力我们能做的事情大家是不是有信心我觉得这个是最基础的对因为你说到这个我想到就是在 DeepSeek 之后其实有一批大语言模型的公司
他好像也有点面临这种情况但我觉得还是不太一样是不太一样但有一点相似吧对我觉得还是不太一样我觉得那个时候 Sora 出来的时候是是大家都没做出来大家都没做出来 Sora 自己其实也没做出来然后 Deep Seek 那个阶段我觉得跟这个情况场景会区别还蛮大的那今天非常谢谢徐璋来做个晚点聊感谢大家的收听好多谢曼琪多谢宇童
然后也非常欢迎大家去体验我们的 Pixvers 产品然后我们在国内马上会发布你说一下国内产品的名字我们国内产品会叫拍我 AI 一个所谓拍我是 Pixvers 的谐音它有一点谐音另外一个是我们觉得每个人都可以成为自己生活的导演那么我们希望说
拍节和 AI 生成同时拍自己跟自己身边的环境会成为一个新的人去创作短视频内容的新的一个范式我们也希望去通过我们的努力推广这个新的创作方式能让更多的有视频表达欲的普通人能够第一次做出来一个好玩的视频可以发给自己的朋友发给自己的父母家人去看并且得到非常多的正反馈这个是我们想做的事情然后也欢迎大家来体验也给我们反馈
OKOK 那六月初这个产品拍我在中国正式上线之后大家可以去试那今天就就到这儿大家再见拜拜拜拜谢谢
下期再见