We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S6E47|年终总结3:AIGC可能改变人类未来,但它知道自己的未来在哪里吗?

S6E47|年终总结3:AIGC可能改变人类未来,但它知道自己的未来在哪里吗?

2023/1/12
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
B
Bill Xing
徐卓(Josh)
Topics
徐卓(Josh):从业者角度,AIGC技术发展符合预期,过去两年百花齐放,未来几年将颠覆内容创作模式,尤其在视频生成领域。ChatGPT是GPT-3的延伸,其突破在于引导模型输出更符合人类预期的答案。未来AI产业将分为两层:底层模型服务提供商和AI产品应用公司,OpenAI等公司将专注于底层模型开发。生成式AI产品领域机会在于将技术与场景结合,创造新的用户体验,未来生成式AI将突破视频领域,实现跨模态创作体验。 Bill Xing:投资人角度,AIGC的快速发展受益于Transformer架构的进步和科研工程的协作,工程速度和效果超出预期。ChatGPT通过强化学习和人工参与,更好地理解人类意图,提升了输出结果的质量,但其局限性在于对专业领域知识的掌握不足和推理能力的限制,需要后续改进。未来AI产业格局可能呈现三种模式:云服务模式、操作系统模式和超级应用模式。生成式AI领域创业公司机会主要在应用层,底层模型开发门槛高,竞争激烈。2023年期待To C端出现基于AI的社区或社交产品,以及B端出现颠覆现有软件形态的新软件。 Diane:作为主持人,对ChatGPT和AIGC的热潮进行梳理和总结,并引导嘉宾就相关问题展开讨论,例如ChatGPT的技术原理、发展现状、未来前景、商业化模式以及创业机会等。

Deep Dive

Chapters
本期节目探讨了 ChatGPT 和 AIGC 的火爆程度是否符合行业预期。嘉宾们认为,ChatGPT 的突破主要在于工程上的速度和效果上的惊喜,得益于 Transformer 架构的规模效应和多年来的协作。虽然在技术上已经取得突破,但在产品形态和商业路径上仍需探索。
  • ChatGPT 的爆火程度与行业预期相符
  • Transformer 架构的规模效应和协作是 ChatGPT 成功的重要因素
  • 技术突破已实现,但产品形态和商业路径仍不明朗

Shownotes Transcript

用 声音。

碰撞。

世界 生动活泼。 Hello 大家好, 我是 丁丁, 欢迎 收听 全 新一集 what next 科技 早知道。 Hello, 大家好, 欢迎来到 我们 今天 的 科技 早知道。 今天 是 我们 最后的 一个 年终总结 节目 了, 我们 就 想来 聊 一下 最近 的 当红 炸子鸡 ChatGPT, 以及 背后 的 AIGC。

今年 的 AIGC 有点 像是 去年 年底 的 这个 web 3, 各种 AIGC 的 产品 横空出世, 让人 非常 的 惊讶。 我们 其实 在 跟 很多 的 这种 AIGC, 就是 generative A I 的 从业者 和 投资人 交流 过 之后, 我们 发现 其实 ChatGPT 没有 超出 很多 行业 大家 的 预期 太多。 那 ChatGPT 的 突破点 到底 在哪里? 然后 没有 超出 大家 的 预期, 没有 超出 行业 的 预期 的 原因 是什么? 从 技术 到 商业化, 我们 是不是 对 ChatGPT 和 generative A I 过于 于 乐观? 从业者 和 投资人 如何 看待 当下 的 这个 赛道 的 火爆? 未来 在 这个 领域 我们 还有 哪 一些 的 想象 空间? 我们 都会 在 今天 这次 节目 来 跟 大家一起来 聊 一 聊。 今天 做客 我们 节目 的 是 两位 嘉宾, 一位 是 徐 卓 josh 徐, 然后 另外 一位 是 bo 行, 我 先 想 请 两位 来 分别 介绍 一下 自己。 我 先请 赵氏 来吧。

大家好, 对我 名字 叫 josh。 我 早期 之前 在 卡内基 美隆 大学毕业 之后, 我 14年 就 加入 了 snapp。 然后 我在 snapper 大概 从 14年到20年底, 有 六七年 的 时间。 我 之前 从事 的 工作 主要是 这个 推荐 系统、 广告 系统, 还有 这个 generation model 的 一些 工作。 然后 在 20年底 的 时候, 我们 出来 创业, 创立 了 surreal 视 云 科技 这家 公司。 我们 主要 从事 的 这个 工作 也是 通过 A I 去 生成 内容, 尤其是 视频 内容 的 生成。

好的, 谢谢 bill.

大家好, 我是 五元 资本 的 bill。 最早 是在 之前 在 北大 读 的 计算机。 然后 毕业 之后 从 17年 开始 就 一直 在 做 投资 相关 的 工作。 最早 是在 字节 跳动 当时 做 战略投资, 后来 的话 就 一直 开始 去做, 专注 于 财务 投资。 我 一直 在 关注 软件, 还有 像 A I 相关 的 这些 底层 技术 领域 的 投资 了。

好的, 谢谢。 周 老师 我想 先 请问 一下 你, 其实 你 很 早就 在 做 这个 generated AI 这 样子 的 工作, 你 觉得 现在 这样的 一个 热潮 是 怎么样 起来 的? 它是 符合 现在 的 行业 的 这样的 一个 预期 吗?

我们 最早 在, 首先 可能 大家 都 知道 snapshot 是 可能 是 当时 世界上 第一批 公司 真正 把 这个 generation model, 当然 今天 我们 更多 成为 A I G C 的 技术 用 在 camera 上面 的。 所以 最 早期 snapshot 有 发布 过 基于 camera 实施 的, 把 一个 用户 的 形象 变成 一个 小孩子 或者 一个 卡通 形象。 其实 当时 就是 我们 看到 业界 最早 的 这个 AIGC 在 产品 和 工业界 上 的 一些 应用。 对 当然 之前 我们 还有 很多 工作, 尤其是 我 这边是 把 这个 模型 应用 能力 放在 这个 拍照 技术 上。

然后 当我们 其实 出来, 我记得 20年底 出来 创业 的 时候, 整一个 其实 还没有 所谓 我们 今天 看到 的 这个 A I G C 的 这个 概念。 但是 冥冥之中 我们 能 感觉到 的 一个点 是, 这个 生成式 的 AI 其实 在 很多 程度 和 很多 层面 上 在 颠覆 我们的 这个 内容 创作, 尤其是 当时 比较 成熟 的 可能 是 这个 test 的 generation, 无论是 bert, 还有 后面 出现 的 这个 GPT。 包括 当时 其实 已经 开始 有 image generation 的 技术 了, 只是当时 做 的 没有 这么好。 但 其实 在 我们 过去 的 六个月, 能 看见 像 比如说 stable diffusion 的 技术 的 飞速发展。 然后 再 整一个, 因为我 其实 在 很 早就 在 从事 这个 领域, 在 我们 看到 的这 一个 技术 发展趋势 里面, 其实 是 符合 我们 当时 对 这个 技术 的 一个 想象 的。

当然了, 其实 随着 这个 技术 浪潮, 还有 尤其是 这个 大 模型 技术 的 发展, 我们会 可以 开始 看到, 无论 在 文字 图片, 甚至 在 接下来 可能 1到2年 内, 我们 能 开始 看到 视频 生成 的 这种 突破。 对 总体 来说 这个 领域 算是 一个 在 过去 的, 尤其 的 两年 里面 百花齐放。 同时 在 接下来 的 这么 一个 几年 的 时间, 可能 我们的 一个 感觉 是 它 会 颠覆 从 很 底层 开始 去 颠覆 很多 这种 内容 创作 的 这种 模式 和 方式。

那那 bill? Bill 是从 什么时候 关注 到 这个 AIGC 的?

应该 也 差不多 是 两年 多 前, 从 bert 开始, 那个 时候 就是 突然 大家 开始 去 关注 transformer 的 这个 模型。 而且 最 开始 也是 说是 文本 的 一些 分析 和 简单 的 生成。 我 觉得 这次 不管 是 去年 的 整个 generate V I 还是 ChatGPT 的 吸引 大家 的 眼球, 核心 还是 说 很 得益于 这个 transformer 架构 在 过去 几年 的 一个 飞速发展。 而且 我 觉得 这 可能 是 人类 历史上 至少 是 软件 领域 最大 的 一次 科研 工程 上 的 协作。 大家 把 这个 数据集, 把 这个 模型 都 开源 起来, 然后 有 非常 多 的 科研机构, 然后 有 这个 非盈利 组织, 还有 大 的 公司 一起来 去 这 里面 做 突破。 我 觉得 像 OpenAI 还是 里面 的 头部 的 大厂, 还是 创业 公司, 其实 也 得益于 这样的 一个 非常 有 规模 效应 的 合作 的 效果。

我 觉得 很多人 说 这个 领域 的 进展 超过 预期 也好, 不 超过 预期 也好。 但是 我们 跟 行业 里 的 人 交流, 观察 下来, 就是 大家 可能 最 让 大家 惊艳 的 还是 一个 是 工程 上 的 速度。 因为 得益于 这个 模型 架构 的 规模 效应 和 之前 几年 的 协作, 大家 很多 人是 没有 料到 像 open I 等 公司, 其实 他们 不一定 在 科研 上 比 demand fair 有 很强 的 优势。 但是 对于 工程 的 这个 务实 的 程度, 使得 说 他们 模型 叠 代 的 进展 的 速度, 其实 是 高于 我们 之前 一两年 大家 的 预期 和 展望。 然后 第二 在 效果 上, 我 觉得 这个 有点 类似 于 干, 只是 说 我们 人类 自己 是一个 判别 器。

就是 回到 比如说 两年 前, 我们 去 想象 未来 这个 更大 的 模型, 然后 更好 的 生成 或者 分析 的 结果, 是 什么样 的 一个 我们 能 人类 能 评估 的 效果。 其实 那个 时候 大家 是 很难 在 结果 出来 之前 来 去做 这个 定论 的。 我是 觉得 说 过去 这一年 的 这些 商业 领域 的 一些 突破, 还是 给 了 大家 一些 小小的 惊喜 的。

其实 我们 说到 transformer 其实 已经 有 几年 的 时间 了。 我不知道 要不要 我们 先 给 大家 简单 的 说 一下 这个 是 什么样 的 一个 定义 好吗?

Transformer 我们 基本上 可以 理解 成 它是 一个 更 powerful 的 这么 一个 模型 的 一个 算法。 其实 在 整一个 A I 领域, 我们 其实 在 完成 一个 A I 的 任务 的 时候, 其实 不外乎 就是 有 三种 因素。 一个 就是 数据, 一个 就是 模型 的 算法, 一个 就是 它的 算 力 在 支撑 说 他 能否 更好 的 完成 这个 任务。 Transformer 相当于 是在 模型 算法 领域 做了 一个 很大 的 创新 和 突破。 以至于 说 哪怕 只是 用 以前 一样的 数据 和 一样的 算 力。 但是 当我 有 这个 更 powers 的 算法 之后, 其实我 能 更好 的 完成 这种 任务, 可以 这么 去去 理解 他的 一个 角色, 还有 影响力。

所以 我们 其实 之前 没有 太多 的 聊到 大 模型 的 这样的 一个 词汇。 之前 的 这个 如果 跟 大 模型 相对 的 有 其他 的 什么样 这样的 一些 模型, 或者 是 什么样 的 一些 算法 呢?

我 觉得 这个 点 我们 可以 这么 去 理解。 其实 大 模型 也是 在 我 刚才 讲 的 这个 三个 模块 里面, 尤其是 在 算法 还有 数据 这 两个 领域, 当然 还有 一些 算 力 的 领域 的 一个 突破。 我们 举 个 例子, 在远古 时候 可能 这个 模型 还 很小, 对 吧? 此时 你 给 它 喂 很多很多 的 数据 进去, 其实 这个 模型 的 capacity 可能 是 没有 办法 理解 这么 多 数据 的那 也就是说 其实 我们 并不需要 这么 多 算 力 去 消化 这么 多 数据。 因为 这个 模型 体量 本身 就 很小, 就 有点 像是 我们 可能 不是 特别 恰当 的 例子。 是 刚出生 的 一个 小朋友 的 一个 大脑, 它的 容量 其实 没有 这么 大。 你 给他 看 很多很多 书, 其实 他 并 不能 很 好的 去 消化。 在 算 力 层面 他 可能 也就 不需要 花 这么 多 时间 去 看 这个 书 了。

但是 大 模型 的 你 可 我们 可以 这么 理解, 大 模型 尤其是 可以 刻画 的 一种 一个 维度, 其实 是 它的 这个 参 数量, 尤其是 比如说 我们 看到 GPT, 所以 这个 参 数量 是在 1700 多亿 的 这个 参数 上, 我们 可以 理解 成 他 就 从 一个 小孩子 的 一个 大脑 变 一个 成年人 的 大脑。 那 这个 时候, 他 就可以 消化 更多 的 知识 和和 材料。 这些 知识 的 材料 在 machine 的 领域 就可以 把 它 理解 成 这个 数据。 当 这个 模型 变大 了 之后, 它 自然而然 的 可以 去 接触 和 消化 更多 的 数据。 背后 其实 它 也 需要 同样 的, 比如说 一个 大脑 需要 花 更多 的 时间 去 学习 和 阅读, 这就是 背后 的 这么 一个 算 力。

而 大 模型 和 数据 还有 算 力, 其实 三者 是 相辅相成 的 一起 在 发展 的。 当你 有 更多 的 数据 的 时候, 其实 你 就 需要 一个 更大 的 模型 去 消化 它。 但是 当你 有 更多 的 数据 以及 更大 的 模型 之后, 其实 被迫 的 你 可能 又 需要 更多 的 算 力。 尤其是 刚才 bill 有 提到 说, 你 如何 让 几几 千张 G P U 的 机器 一起 协同 去做 训练, 在 短时间 之内 可以 把 这个 东西 给 训练 出来。 所以 可能 这 大 模型 在 这个 里面 是 这么样 的 一个 角色。

对我 我 可能 我们 这边 观察 最大 的 区别 就是 比如说 在 10年 之前, 当时 不管 是 李 飞飞 还是 各种, 我们 看 的 这个 商汤 旷 视 在 做 这个 alex net。 然后 后面 到 renee t 做 这个 图像识别 的 时候, 那个 时候 做 的 很 典型。 就是说 大家 通过 卷积 神经网络 这样的 架构 来 去做 人脸 的 识别, 视频 的 识别。 但是 大家 真的 去 把 这个 东西 用到 商业 落地 之后 会 发现 这样的 一个 模型 架构, 它 其实 是 没有 特别 强 的 规模 效应 的。 它 针对 于 不同 的, 比如说 识别 的 类型, 然后 不同 的 识别 场景。 其实 最好的 办法 就是 针对 场景 来 去做 针对 的 这个 模型 参数 的 调 优。 来 满足 比如说 不管 是 互联网 还是 安防 相关 的 需求。

后面 其实我 我们 看到 transformer 最大 的 突破 就是 因为 它 引入 了 这个 attention, 还有 其他 的 它 跟 转接 神经网络 最大 的 区别 就是 它是 更加 这个 架构 其实 是 度 来讲 是 更加 符合 这个 scaling law。 它 最早 其实 是 解决 要 识别 分 些 大量 的 N L P 的 文本 的 问题。 这个 问题 的 提出, 其实 使得 这个 模型 的 架构 是 参数 越多, 这个 模型 的 容量 越大。 其实 他的 能力 其实 是 跟 他的 这个 规模 是 比较 成 线性 的 增长 的。 而且 这个 衍生 能力 不是 解决 一些 专用 的 问题, 而是 规模 越大。 其实 它的 通过 迁移 学习, 其实 解决 了 很多 通用型 的 这些 问题 和 任务。 使得 说 大家 在 开发 这些 大 模型 的 时候, 我可以 不断 的 去 针对 同样 一个 模型 架构 沉淀 数据, 沉淀 功耗, 然后 沉淀 工程 经验。 使得 说 我公司 开发 A I 能力 的 效率, 其实 也是 有 很强 的 飞轮 效应 在 里面 的。

我 能不能 这么 理解, 其实 整个 是在 transformer, 它 在 N L P 的 这个 理解 文本, 然后 理解 我们的 这样的 普通人 的 语言 的 这样的 一个 过程 当中, 他 其实 是 更 能够 比较 好的 处理 我们 这样的 request。 所以 才有 了 这 一波 的 AIGC 和 这个 ChatGPT 它的 这样的 一个 可能, 让 我们 普通人 有一点 体感 的 这样的 一个 新的 突破。

对的, 我 理解 最早 这个 模型 架构 想 解决 的 问题 就是 我要 A I 来 识别 一篇 比如说 上千 字 的 这个 文章。 那 可能 我 这个 文章 的 第一行 字 和 比如说 里面 的 最后 一行 字, 甚至 是 中间 的 某 一行 字, 可能 会 产生 很强 的 逻辑 关联性。 但是 如果 我 用 传统 的 这个 C N N 的 网络, 其实 是 很难 去 识别。 比如说 这种 跨行, 跨 段落 的 这些 背后 的 相关关系 的那 其实 transformer 最早 就是 解决 这个 问题, 但是 这个 架构 被 提出 之后, 大家 很 惊喜 的 发现, 其实 他 这样的 这种 模型 架构, 不仅 可以 解决 文字 的 问题, 然后 他 后来后来。 比如说 大家 做 的 这个 V I T transformer, 用来 做 或 图像识别, 然后 甚至 多 模态 的 识别 生成, 它 都 会有 很 好的 效果。

那 本质 上 还是 说 我自己 理解 还是 这个 倒是 可以 补充。 就是说 我自己 理解 就是 大家 目前 发现 了 一个 比较 好的 工程 上 可实现 的 一个 通用 的 统计学 模型 架构。 它 可以 很 好的 去 分析 各种 模态 的 数据 的 这种 相关关系。 其实 我们 不管 是 跟 他 去 聊天, 还是 做 这个 图片 生成, 其实 他 都是 基于 大量 的 数据 的 统计学 的 概率学 的 分布, 来 给 我们 产出 最有 可能 满足 我们 想 预期 结果 的 这个 内容。

我 觉得 另外一个 角度, 其实 大 模型 和 以前 的 传统 的 A I 模型, 它 in 的 一个 两个 场景。 在 以前 来说, 它 可能 是 他 specific 就是 当你 要 去 解决 一个 识别 的 任务, 或者说 一个 分类 的 任务, 然后 你 专门 去 需要 有一个 专门 的 模型。 但 这个 可能 不是 一个 大 模型, 去 给 它 为 特殊 的 场景 当中 的 一个 数据。 但是 当我们 开始 看到 有些 大 模型, 比如说 像 GPT three 这样的 大 模型 之后, 其实 你 不需要 去 给 它 专门 为 某 一个 场景 的 数据。 你 其实 basically 就是 把 世界上 所有的 数据 给他, 然后 他 就可以 完成 不同 的 任务。 然后 在 我们 看到 的 工业 落地, 还有 商业 落地 上, 其实 就 带来 了 一个 scalability 的 一个 很大 的 提升 和 突破。

其实 本质 上 我们 可以 这么 理解, 就是 在 整一个 A I 和 machine learning 的 发展 当中, 所有的 这 一切 其实 都 不断 的 再去 更 精细 的 模拟 我们 人的 大脑。 比如说 在 早期 的 传统 的 M L 他 可能 是在 说 我们 有一个人 对 吧? 然后 给 你看 很多 不同 的 类型, 你 给我 1个小时 之后 告诉我 这个 新的 东西 是 属于 哪个 类型, 它是 这么 一个 简单 的 任务。 但是 实际上 我们 真实的 人脑, 他 其实 每天 是在 摄取 不同 各样 的 这种 信息 和 内容 的。 然后 最终 他 其实 develop 的 一种 对 事物 的 认知 和 事物 的 一个 判断 的 么 一个 能力。 所以 其实 本质 上 来说, 包括 我们 说 这个 transformer 它 引入 的 attention, 有 更多 的 这种 参数 来 模拟 我们 人脑 里面 的 这个 神经 的 突出。 其实 本质 上都 是在 更更 真实的 模拟 我们的 人的 大脑 这么 一个 过程。

Open I 的 这个 ChatGPT, 它的 核心 的 这个 pad 我看 它 其实 是 写 的, 它 大概 分成 三步, 从 不同 的 collect data, 然后 train 它 这个 reward model。 然后 我不知道 这块 能不能 请 两位 谁 帮 我们 来 大概 的 讲一讲 它的 这个 步骤 是 怎么样 的。

我可以 先 说 一下, 我 觉得 可能 大家 会 比较 关注 的 一个点 就在于 说 GPT three 和 ChatGPT 它的 一个 主要 的 区别 是什么? 可能 从 这 里面 我们 可以 了解到 这个 ChatGPT 在 一些 特点 上, 还有 它的 这个 表现 上 会有 什么 优势。 其实 本质 上 来说, 它的 参 数量 是一个 差不多 的 一个 状态。

但是 最 核心 的 一个 区别 在于 chat B T 其实 用了 更好 的 这种 监督 型 的 数据。 比如说 他在 训练 的 过程 当中 引入 了 这个 强势 pervious 的 数据, 让 这个 模型 的 产出 更 符合 我们 人类 的 预期 和 标准, 这是 一块。 然后 另外 一块, 就是 刚才 我说 的 这个 supervise 的 数据, 其实 是 人工 的 一个 数据 标签 的 一个 过程。 然后 在 之后 当 他 产出 数据 来 之后, 他在 针对 这个 数据 的 答案 得到了 答案, 去 做了 一个 ranking。 比如说 我 你 你 有 十个 答案, 我告诉你 这个 答案 更好, 另外一个 答案 其实 没 这么好。 然后 通过 这 两种 方式 去 对 这个 已有 的 全 GPT3 的 这种 模型 进行 一个 翻转 和 监督。 以至于 他 我 我们 刚才 提到 的 这个 rework model, 还有 或者说 我们 说 的 reinforcement learning, 在 这个 里面 其实 相当于 是 让 已有 的 这个 GPT3 的 这个 模型 变得 更加 powerful, 输出 的 结果 更加 精准。

这个 bill 有什么 需要 加 的 吗?

我自己 觉得 通俗 的 理解 就是说, 原来 我 又 训练 了 一个 大 的 迁移 参数 的 transformer model。 然后 其实 它 里面 其实 已经 蕴含 了 很多 知识, 因为 它 训练 的 数量 非常 大。 比如说 我们 需要 的 一些, 比如说 文本 之间 的 这些 分布 关系, 其实 已经 蕴含 在 模型 里面 的。 包括 一些 生成 的 能力, 其实 也都 包含 在 model 里面 了。 但是 这 里面 有一个 gap, 就是说 其实 这个 model 并不知道, 因为他 无法 像 人类 一样 观测 外部世界, 所以 他 不能 理解 人的 这个 真实的 意图。 然后 包括 人 说 的 这个 自然语言, 他 也不 能够 像, 他 也没有 拿到 现在 人类 的 能力 去 真正 理解。

比如说 我问 他的 问题 背后 的 这个 implication 是什么? 所以 最早 的 时候 其实 大家 解决 这个 问题是 用于 叫我 的这 能力。 就是我 已经 经 我 已经 做了 非常 大 数据量 的 训练工作。 但是 我 针对 特定 的 任务 需求, 我会 给他 一些 有 监督 的 标注 过 的 一些 小 数据 来去 对他 做 提示。 比如说 我会 给他 一些 问题 和 我希望 回答 的 一些 事例。 然后 通过 这种 小 样本 的 训练 来 引导 它 输出 我希望 达到 的 一些 特定 的 目的 的 需求。 但 这个 是因为 数量 很小, 而且 人为 在 这 里面 扮演 的 工作 也 不是 很大。 所以 他们 通常 是 解决 某个 行业 或者 某个 特定 需求 有用。

但 比如说 这次 ChatGPT, 其实 它 其实 真的 是 用 强化 学习 的 方式, 然后 加上 了 更 大规模 更大 比例 的 人为 的 参与。 他们 也 说 叫 human in the loop。 就是 它 第一步 其实 是 让 更多 的 人 其实 做了 更多 的 这个 样本 给他 去做 提示。 第二步 就是说 他 回答 的 很多 的 问题, 人 来去 打分, 然后 来 让人 看看 这个 是不是 人类 想要的 结果。 然后 第三步 就是 他 自己 基于 人的 打分 训练 出了 一个 rewarding 的 model, 然后 就 这个 模型 会 更加 自动化 的 去 评判 它 输出 的 结果 是不是 人类 想要的。 这样的话 其实 是一个 更加 高阶 的 一个 function 的 形式。 达到 的 效果 就是 其实 他 能够 更好地 理解 人的 意图。

我也是 跟 行业 里 的 一些 A I 的 一些 朋友啊, 然后 产业 里 的 这些 专家 交流。 大家 很多 的 一个 感觉 就是说 在 ChatGPT 出来 之前, 像 他 训练 的 最新 的 GPT3.5, 包括 这个 codex 这个 model, 很 可能 已经 完全 包含 了 拆 GPT 的 能力 了。 只是 A I 模型 并不知道 你 想要 我 做什么, 所以 需要 一些 很 古怪 的 prom 的 提示 来 生成 结果。 但是 经过 这次 强化 学习 的 训练 之后, 其实 他 能 更好地 理解 人的 意图。 使得 说 我 给他 一些 很 通俗 的 自然语言, 他 就能 把 他 这个 能力 激活 释放出来, 这是我 一个 比较 通俗 的 理解 了。

其实 这一次 在 推特 上面 大家 也 看到 像 sam 奥特曼, 他 其实 对 自己的 这个 模型 ChatGPT, 他 还 觉得 还是 比较 还没有 特别 完善, 然后 好像 也是 比较 保守。 然后 大家 还说 就是这样 是一个 C E O 说 的话 吗? 还在 下面 给他 回复。 我不知道 作为 行业 内 的 人士 来说 的话, 其实 ChatGPT 能 做到 现在 这样的 程度, 是 符合 大家 这个 预期 吗? 还是 大家 其实 觉得 刚刚 像是 被 讲 的, 其实 已经 感觉 好像 是 挺快 的 了。 OpenAI 它 整个 的 内部 的 工程量 的, 然后 它的 速度 其实 是 觉得 还 不错。

我 觉得 总体 来说, H T P T 的 发展 这个 进程 其实 还是 算 比较 快 的。 但是 我 觉得 有 另外一个 角度, 就是说 当我们 谈到 我们的 预期 的 时候, 因为我 personally 是对 这个 G F A I 有一个 极强 的 一个 信仰, 以及 对 他的 未来 是 十分 乐观 的 一个 感觉。 因为 理论上 所有 我 认为 所有的 数据, 只要 是 可以在 计算机 里面 被 编码 成 零 和一 的 这种 状态 的 数据, 它 都是 可以 被 生成 和 generate 出来 的那 的确 就是 所有的 这 一切 可能 在我看来 它 都是 应该 发生, 并且 哪怕 现在没有 发生, 未来 都是 会 发生 的。

而 当我们 去 看 ChatGPT 的 时候, 它 更多 的 是 像 GPT3 的 这么 一个 延伸。 我 觉得 更大 的 突破点 其实 本身 在于 GPT3 这个 模型 本身。 因为他 已经 具备 了 一个 极大 的 capacity 去 消化 互联网 上 几乎 所有的 内容 的 这么 一个 能力。 然后 就像 我们 刚才 提到 了, 其实 Chat GPT1个 最大 的 突破点 或者说 一个 提升 在于 说 你 学到 了 很多 知识 之后, 我 怎么样 去 引导 你, 让 你的 这个 输出 更 符合 人类 所 想 的 这个 答案 的 这么 一个 过程。 所以 我会 把 它 理解 成 更多 像是 一个 前面 有 ChatGPT, 更 像是 last mile。 让 这个 GPT3更 接近 我们 人类 所 想象 的 这个 答案 的 一种 落地 的 一种 提升。

我 觉得 这个 工程 速度 我 还是 很快 的, 只是 说 这 里面 可能 没有 magic, 没有 什么 奇迹 在 隐含 在 里面。 因为 大家 对于 这个 ChatGPT 没有 比如说 突破 某些 人的 预期。 其实我 觉得 核心 还是 两个 问题, 一个 是 工程 突破点, 就是 工程 问题。 其实 就是说 很多人 说 用 x GPT, 其实 问 一些 行业 专业 领域 的 问题, 其实 他的 回答 可能 是 不精细 的, 错误 的, 甚至 是 有 误导性 的。 这个 核心 还是 说 以 目前 他们 这个 训练 拆 GPT 的 这个 方式, 它 还是 没有 办法 去 获得 很多 行业 特别 前沿 的 专业 领域 的 一些 精确 数据 的那 这个 其实 是 需要 后续 open I 和 各个领域 的 公司 合作, 然后 构建 他 自己的 这个 数据 生态。

第二个 问题 可能 是一个 就 叫做 科学 问题。 就是 很多人 比如说 包括 像 这个 拉 昆 也是 一直 在 吐槽。 比如说 像 现在 的 这个 模型 结构 还是 没有 办法 做 特别 好的。 比如说 深度 的 推理, 特别 好的 这些 reasoning 的 function。 所以 我 觉得 有可能 比如说 现有 的 这个 模型 架构 还没有 办法 去 实现 真的 像 人类 一样 去 感知, 然后 思考 推理 的 这种 方式。 这 可能 是 有待于 未来 工程 上 的 创新, 就 底层 研发 技术 上 的 创新 的。

不过 我 觉得 可能 还是 让 我 比较 惊讶 的。 就是说 我 看到 很多人 去 分析 这个 open I 其实 把 人类 的 这个 代码 做了 全方位 的 训练 之后, 实际上 有可能 是 帮助 他 增加 了 他 对 自然语言 的 推理 能力 的。 因为 代码 里面 有 非常 多 的 长距离 的 依赖。 其实 对于 比如说 对于 文章 的, 人类 自然语言 的 文章 的 一些 推理 分析 的 效果, 他们 发现 比 最初的 GPT 还是 有 很强 的 提升 的。 所以 我 觉得 可能 一方面 是 底层 的 模型 架构 的 创新。 另外 的话 未来 如果 open I 从 工程 上 把 各种 模态 的 数据 都 吸收 进去 的话, 也许 还会 产生 一些 意想不到 的 能力 维度 的 上升。

那 我们 其实 如果 要 看 我们 下一步 我们 期待 的这 一个 领域, 它的 这个 科技 的 进展 是 怎么 样子 的 呢? 你 觉得 比如说 是 可能 明年 或者 是 再再 往后, 我们 再看 一下 会 是 怎么样 的 一个 可能 跟 现在 拆 GPT 不一样的 地方, 或者 拆 GPT 它 能够 学到 一些 什么 新的 一些 技能, 然后 让 它 变得 跟 现在 不太 一样。

如果我们 单纯 从 技术 角度 的 发展 上 来看, 它是 一个 已有 的 一个 很好 状态 的 一个 延伸 和 进展 的 提升, 对 吧? 但是 我 觉得 这 里面 在 业界 的 一个 影响 上, 或者说 在 这个 工业 落地 和 商业化 的 影响 上, 有 个 重大 的 点 在于 大家 开始 慢慢的 感觉到 chat B T 可能 不仅仅是 一个 语言 的 模型, 而是 一个 很有可能 可以 模拟 人的 大脑 的 这么 一个 general 的 一个 A I 的 一个 能力。 这 里面 其实 就是 一个 很大 的 一个 不一样。 因为 之前 我们 可能 更多 的 是用 这种 大 的 这种 N L P 的 模型 来 去做 很多 文本 的 一些 预测 或者 处理。 但是 貌似 我们 现在 可以 看到, 好像 因为 文字 本身 就是 人类 交流 和 学习 的 最 基本 的 这么 一些 信息 的 元素。 貌似 我们 可以 看到 这个 语言 模型 本身 也 具备 了 一个 大脑 的 能力。

然后 包括 我们 在 后面 提到 了 很多 在 硅谷 可能 大家 有 提到 model s service, 我 能 想象 到 的 一些 未来 的 可能 的 一个 破。 一方面 技术 本身 它 一定 会 更加 的 完善 了, 包括 大家 也 在 说 GPT4 可能 已经 可以 突破 这个 图灵测试 了。 但是 另外 一个点 在于, 除了 这个 文本 模型 和 语言 模型 本身 的 这么 一个 应用 以外, 貌似 我们 可能 可以 发现 和 开始 探索 一些 更 general 的 这种 A I 的 落地。 比方说 之前 一直 有 个 例子 就是说 其实 所有的 SaaS 工具 本质 上 来说, 它 好像 都 有可能 可以 被 这个 model service 去做 替代。

举 个 例子, 可能 我们 之前 是 做了 一个 财务管理 的 软件, 对 吧? 我们 有些 U I U X 去 输入 一些 我们 财务 记账 的 这么 一些 数据。 但是 现在 好像 你可以 去 直接 把 这些 通过 对话 的 方式 告诉他, 我 这笔 消费 是 这么 多, 我 这笔 报销 是 这么 多。 用来 做 什么什么 用途。

然后 如果说 这个 文本 模型 它 本身 具备 一个 记忆, 还有 信息处理 的 类似 人类 这种 能力 的话。 其实 这 一块 本质 上 有可能 我们 当时 是用 用 一个 sas 软件 替代 了 一个 财务 的 人员。 那 未来 可能 是啊 我们 用了 一个 类似 于 这种 ChatGPT 的 模型, 替代 了 这么 一个 财务 的 软件。 而 同时 它 更 powerful 的 地方, 它 不仅 可以 做 财务, 他 还 可以 可能 做 H R 的 管理, 做 这种 其他 的 这种 比如说 是 automation 的 工具 等等等等。 我 觉得 在 这 一块 可能 是一个 未来 我们 很 值得关注 的 一个 一些 场景 上 的 应用。 所以 我 也会 觉得 说 总结 一下, 可能 是 它 不仅仅是 在 文本 模型 上 的 一个 突破。 很有可能 是在 我们 真正 的 已经 开始 迈向 了 这个 general A I 的 这么 一种 的 模式。

通用型 人工智能。 对, 是的。 所以 我们 可能 认知 的 现在 的 sas, 刚刚 就现在 所有的 这个 互联网, 它的 未来 的 interface, 它 这个 界面 就 完全 可能 就 变得 不一样 了。

对, 是的, 对我 也 非常 认同 赵氏 的 这个 说法。 然后 我自己 感觉 就是说 今年 来看 的话, 二三年 24年 首先 就是 文本 能力, 我 觉得 还没有 完全 被 释放出来。 就 除了 照着 说 的, 比如说 他 可能 会 颠覆 人和 软件 的 这种 交互 形式。 然后 大家 也可以 也 在 展望 说 这 是不是 叫做 这个 software 3.0, 或者 这样的 说法。

另外 的话 我们 也 感觉到, 比如说 在 其他 的 比如 to c 的 领域, 比如说 像 这个 教育, 不管 是 少儿 还是 成人 global 里 的话, 其实 学生 都会 问 非常 多 的 问题。 而 目前 的 ChatGPT 也好, 还是 大 的 语言 模型, 其实 都是 非常 擅长 去 回答 很多 的 结构化 的 内容。 而且 也 并不需要 答案 非常 的 精确 和 鲁棒。 所以 这 也很 可能 是一个 比较 好的 落地 的 空间。 此外 的话 就是 其实 模型 的 进展 还是 依赖于 这个 数据 的 丰富 程度。 所以 哪里 数据 最 丰富, 其实 模型 就会 往 这个 模态 来去 走。

可能 现在 是 文本, 我们 也 非常 期待 展望。 其实 在 未来 两年, 他在 这个 图片、 视频 相关 的 综合 的 性能 的 提升, 其实 这个 事情 赵 是 也 在 做了。 比如说 现在 大家 只是 说 我说 一个 prompt 来 生成 一个 图片。 我 非常 期待 说, 比如说 今年 明年 能不能 我 直接 就 去 跟 达芬奇 对话。 我说 我要 办 一个 自己的 小的 营销 展览, 我希望 借用 你的 一个 什么样 的 风格, 你看 怎么 画 跟 我 好。 可能 达芬奇 就 直接 会 输出 一些 图片 也好, 甚至 多 模态 的 一些 艺术 的 效果。 然后 我会 跟 他 去 讨论 怎么 去做 这个 细节 上 的 修改。 我 觉得 这个 可能 都 需要 文本、 图片, 还有 其他 的 相关 的 模态 综合 上来 去做 工程 的 优化。 这个 事情 其实 我们 也 看到 数据 的 积累 越来越 多了, 可能 从 商业 落地 的 这个 时间点 上 可能 也会 越来越近 了。

对我 还想 补充 一个点, 是 关于 我们 看 这个 未来 的 它的 这种 可能性。 我 觉得 有有 个 十分 有意思 的 视频。 我忘了 是在 多少 年前 了, sam 说 的。 就 当时 大家 问 他 一个 问题, 说 OpenAI 未来 你们是 怎么 去做 这个 商业化, 对 吧? 他 当时 的 一个 答案 就是说, 我们 现在 have no idea。 然后 我们 现在 并且 我们 现在 其实 没有 这个 商业化 的 plan。

当然 那是 很多年 前 的 一个 状态, 但是 很 有意思 的, 当时 他 提到 一个点, 我 觉得 是 说 他 当时 讲 他说 maybe 这个 AI 会 帮 我们 figure 我们 应该 怎么 去 商业化。 当然 这 是一个 十分 aggressive 的 一种 prediction。 但是 我 觉得 本质 上 来说, 今天 我们 看到 的 无论是 chat P T 还是 GPT3.5, 实际上 它 本质 的 一个 能力, 还是 基于 它 已有 的 信息 的 一个 学习, 更 powerful 的 一个 检索 的 一个 能力。 就是我 学到 了 什么, 那 我 就会 告诉 你是 有什么。

但是 如果 当 这个 模型 或者 一个 general AI 真的 可以 模拟 人的 大脑 的 时候, 他 其实 就可以 去 创造 一些 东西。 比如说 有可能 他是 在 某个 医学 领域, 他是 可以 研究 出新 的 理论 的 一些 突破 的那 甚至 在 这个 商业 领域, 它是 可以 真的 是 帮你 figure out 说, 你 这个 公司 的 商业化 应该 是 怎么做 的那 这个 时候 我 觉得 是对 这种 general 的 A I 的 一个 更大 的 一个 更 高层次 的 一个 prediction, 是 说 他 真的 是 可以 真的 模拟 人的 大脑。 不仅 做出 已有 信息 的 检索 和 回答, 还有 更 重要 的 是 他 可以 做出 真正 的 创造性 的 这种 答案 和 创新。

如果我们 可能 从 底层 的 这样的 一些 技术, 然后 我们 回归 到 我们 将来 的 这个 产品, 其实 我们 还 并没有 看到 更多 的 open I 它的 一个 prod market for。 我不知道 他 现在 所有的 模型 就 model as a service, 应该 不会 说是 有 很多 的 付费 的 客户。 大家 如果 要 猜想 的话, 未来 open I 它 会 是 什么样 的 一个 方向, 他 会 自己 来做 产品 吗? 还是 他 完全 是 可能 license 到 自己的 这个 model 出去。 其实 谷歌 的 lambda 我们 之前 其实 也 做 过 关于 他的 这个 节目。 其实 他们的 这个 技术 应该 不会 说是 差 的 特别 远。 我不知道 朱 老师 作为 行业 内 的 人士 是 会 怎么看, 然后 可能 bill 在 这个 商业化 这块 又是 怎么看 的。 我们 还是 赵 世 先 来说。

我 认为 未来 的 这个 状态, 我们会 分成 两个 layer。 一个 就是我 称 它 为 叫 A I infrastructure, 或者说 我们 说 的 model was service 的 这种 layer。 它 更多 的 是 像 比如说 像 OpenAI 或者 stability A I 这样的 公司 去 开发 一些 十分 底层 的 大 模型, 并且 做 一些 理论 的 和 创新 上 的 一些 突破。 然后 另外 一类, 其实 我会 称 它 为 A I product layer 产品 层面 的 一种 公司, 或者 一些 落地。 比如说 一个 很 好的 例子, 就是 我们 今天 看到 的 这个 jasper ai, 其实 它 本质 上 一个 逻辑关系 就是 jasper 在 调用 OpenAI 的 这个 A P I 对 吧? 但是 它 真正 的 是 把 这个 能力 落地 到 的 这种 copywriting 的 marketing 的 这种 场景 当中。 我 认为 这 一种 状态 其实 会 持续, 并且 它 会 从 这个 文字 领域 拓展 到 更 广泛 的 领域。

无论是 图片 还是 视频, 还是 说 我们 更 我们 刚才 讲 的 可能 是 这种 model service 的 领域, 为什么 会 是 这 样子 呢? 因为 从 我们 之前 的 这个 对于 整个 行业 的 观察 来看。 当你 有了 技术 之后, 在 这个 行业 里面 去做 一个 落地, 还是 一个 很 大量, 而且 是一个 很 重要 的 工作。 比如说 你 要 理解 这个 用户 的 需求, 并且 根据 他的 需求 设计 出 合理 的 产品 形态, 找到 这个 P M F。 所以 这 一块 其实我 是 觉得 他 没有 办法 避开 的。 哪怕 你 这个 模型 再 powerful, 它 其实 都是 需要 很多 domain specific 的 一些 内容 的。 这种 我 无论是 refine 也好, 还是 产品 的 这个 last mile 的 落 也好, 其实 是 需要 很多 这样 方面 的 工作 的。 而 我 认为 说 OpenAI 或者说 这个 A I info 层面 的 layer 的 公司, 他们 更多 的 其实 是在 给 所有的 这种 A I 产品 或者 场景 提供 一个 general 的 底层 的 一个 架构 和 一个 底层 的 服务。

至于 怎么 落地, 打个比方 说, 我们 现在 要 做 一个 在 法律 领域 一个 针对 法律 条款 的 这么 一个 文案 的 修改 的 一个 能力, 对 吧。 那 这个 时候 其实 你是 需要 让 这个 模型 在 十分 sensitive 的 或者说 十分 严谨 的 法律 领域 的 内容 上 做 很多 的 调整 和 find 的那 这个 时候 其实 你 很难 用 一个 single model 去 完全 的 去 解决 这种 问题。 并且, 可能 在 法律 领域 可能 会有 很多 监管。 那 这个 时候 其实 都是 需要 靠 产品 形态 和 产品 落地 的 这种 方式 去 满足 这些 场景 的 需求 的那 其实 最早 其实。

像是 google 或者 是 facebook, 他 找到 广告 这样的 模式, 其实 也 花了 蛮 长 一段时间。 可能 OpenAI 在 这 一块儿。 我不知道 他们 会有 这样的 一个 核心 的 能力 能够 做出 产品, 还是 你 觉得 他 会 坚持, 可能 会 走 自己 这样的 一个 中间 的 技术 提供商 的 这样的 一个 role。

如果你 有 技术 的 创新 和 突破 的话, 我相信 它 一定 是 会有 一种 办法 可以 找到 它 商业化 落地 的 这么 一个 方式 的。 然后 就像 我们 其实 当 搜索引擎 出来 的 时候, 其实 也没有 人 会 预测 到, 搜索引擎 其实 是 靠 广告 可以 去 赚钱 和 盈利 的。 但是 我 觉得 在 open a 领域 来说, 更 重要 的 是你 在 给 用户 提供 的 这个 价值 是不是 真实 和 有用的。 只要 这个 事情 是 没 sense 的, 比方说 他 哪怕 是 通过 这种 最 基本 的 A P I 的 形式 提供 给 类似 于 jasper 这样的 公司。 其实 它 也可以 做到 很大 的 这么 一个 商业化 的 一个 拓展。

另外 其实 我们 可以 开始 看到, 尤其 今天我 好像 也 看到 一个 新闻 是 说, microsoft 已经 开始 要把 这个 ChatGPT 或者 G P3 的 这个 能力 integrate 到 它 office 的 软件 的 数据 面, 无 email 还是 word 文档 里面。 其实 这 也就是 我们 所 看到 的, 像 microsoft 的 email 或者说 word 文档, 就是我 我 刚才 描述 的 这种 A I 产品 领域。 但是 微软 可能 就 直接去 使用 了 OpenAI, 提供了 这个 底层 的 服务 能力。

Bill 这边 在 可能 在 商业 应用 上面, 你 觉得 可能 就 未来 还是 一个 大厂 的 它的 这样的 一个 play。 因为 像是 microsoft, 它 其实 也是 open a 很大 的 投资人 之一。 还是 你 觉得 可能 他 更 激起 了 可能 新一代 的 互联网 的 整个 一个 创业 潮。

其实我 我 现在 觉得 有 三类 格局 的 设想。 就是 第一类 格局, 我 可能 把 它 称之为 叫 云 服务 格局。 像 open I 它 在 开发 这个 foundation model, 然后 对外 卖 A P I, 其实 它 核心 还是 人才 和 资源 的 垄断。 那 这个 时候 像 google, 甚至 未来 的 meta 和 这个 stage maker 的 亚马逊 的 fish maker 也会 去 跟进。 如果说 中泰 是 大家 其实 都 提供了 这个 foundation model, 然后 谁 也没有 在 数据 和 应用 上去 实现 比较 大 的 垄断 的话, 那 又 回归 到了 谁的 人才 多, 算 力 多, 然后 大家 也都 有 常 强 的 这个 商业 生态。 原有 的 这个 客户 渠道 来去 支持, 那就 变成 像 云 服务 的 格局 了。

第二类 的 格局, 其实我 可以 把 它 称为 叫 O S 格局。 不管 是 现在 OpenAI 和 微软 的 这个 强 合作, 还是 它 未来 的 规划, 它 有没有 办法 把 应用 真正 的 分层。 它 能够 建 一个 类似 于 不管 是 安卓 的 底层 的 G S M 的 系统, 还是 像 更 像 O S 这样的 一个 封闭 的 生态。 使得 说 它 通过 一些 商业 的 手段, 能 让 各个领域 的 应用 开发者 把 自己的 这个 开发 习惯、 开发 标准 以及 很多 的 行业 抖 命 的 数据, 以 这种 闭源 的 形式 沉淀 在 他 自己的 这个 生态 里。 那 使得 说 比如说 外部 即使 是 google 技术 很强, 但是 由于 它的 先发 的 商业 优势, 使得 说 越来越多 的 用户 我在 他的 领域 开发。 因为 之前 的 数据 沉淀 开发 的 这个 接口标准, 使得 我的 这个 编辑 成本 是 最低 的那 这个 生态 可能 就会 更加 垄断, 很很 可能 未来 可能 就会 是 一家 两家。 结果 我也是 觉得 目前 他 可能 是, 不管 是 sam atman 还是 公司 管理层, 猜测 有可能 会 往 这个 方面 来去 走。 包括 他 现在 也是 通过 投资 的 形式 布局 了 非常 多 的 生态 合作 的 企业。

第三类 愿景 可能 就 更加 crazy 一点, 就是我 可能 觉得 这个 可能 是 叫 super APP 格局。 就是 不管 是 open I A I 自己 还是 未来 的 某个 新 企业 玩家。 如果说 一个 团队 其实 基于 现有 的 A I 技术 找到了 非常 好的 商业 的 落地 点。 举 个 例子, 比如说 突然 做出 了 一个 比如说 几年 之内 做出 了 一个 上亿 D A U 的 产品。 虽然 说 我们 大家 都 不知道 这个 产品 是什么, 但是 可以 由此 可以 想象, 如果 有一个 公司 有 这么 大 的 用户量, 那 他 很 可能 也 不会 再 用 三方 的 任何 的 底层 的 基础设施。 因为他 自己 掌握 的 数据 和 生态, 有 有点像 自己的 推荐 一样, 完全 有 能力 去 培养 自己的 这个 A I 能力, 那 这个 就 有待于 说, 一方面 是 open a 有没有 意愿, 有没有 动机, 有没有 组织上 的 能力, 自己 去做 下场 去做 super APP。 另外 就是 如果说 未来 大家 看到, 比如说 一个 三方 的 团队, 哪怕 不是 这些 大 的 巨头, 有 能力 找到 特别 好的 有 网络 效应 的 商业 的 点 的话, 那 这个 事情 也会 发生。 但是 我 觉得 可能 是一个 大家 在 bat 的 一个 小概率事件。

我不知道 从 可能 专业 的 技术 的 角度 来讲 的话, ChatGPT 它的 技术 门槛 它 到底 高 不高。 就 比如说 是 可能 google 的 这个 lambda 它 看到 现在 大家 的 这样的 一个 趋势 之后, 他 可能 会 更加 的 人力 财力, 他 肯定 都会 比 open I 可能 会要 更强 一些。 所以 他 这个 double down 或者 triple down 让 他 会不会 可能 会有 后发优势 会 更强 一点。

我 觉得 这个 门槛 还是 很高 的, 至少 我们 今天 能 看见 的 这个 业界, 对 吧? 这个 能 做出 这个 事情 的 公司 其实 只有 opener 一个。 其实 这个 GBT3 出来 之后 已经 有 一段时间 了, 但 实际上 也没有 任何 的 另外 一家 公司 可以在 这个 领域 做到 相 抗衡 的 这个 态势。 但是 的确, 我 觉得 有 个 很 重要 的 点 在于, 当 大家 看到 chat B T 的 这种 爆火, 还有 它 未来 可能 带来 的 这种 potential 的 影响力 之后, 这些 大公司 一定 会 开始 去 double 资源 去做 这件 事情。 我 不能说 会有 更 强烈 的 后发优势, 但是 我的 预测 是 说, 未来 可能 不会 只有 OpenAI 一家 公司 能 做 这件 事情。 因为 a stones 这个 business 是 make sense, 那 一定 会有 更大 的 capital 或者说 更大 的 这种 公司 的 资源 投入到 这 当中。

我我我 自己的 预测, 可能 这个 领域 里面 会有 可能 3到4个 或者 3到5个 这样的 很大 的 公司 在 互相 抗衡。 就 有点像 其实 我们 今天 看到 stability A I 已经 在 这个 文字 生成 图片 领域 对 吧? Stable division 是在 跟 大力 所 抗衡 的那 其实 大家 都能 看见 这个 技术 未来 的 颠覆性, 所以 会有 更多 的 玩家 进来。

我不知道 这个 bill 你 觉得 可能 在 general A I 这个 赛道, 创业 公司 可能 会 在哪 一些 方向 会有 一些 机会。

对, 我们 看到 其实 是 两类 创业 玩家 了, 其实 跟 刚才 说 的 这个 门槛 都是 有关系 的。 因为 训练 底层 的 model 的 这个 门槛 是 非常 综合 的。 就是我 得 有一个 自己 或者 外包 的 这个 数据 团队 来去 获取 高质量 的 数据。 可能 甚至 是要 百 人的 这样的 团队 规模。

同时 的话 其实我 觉得 这 里面 跟 过去 最大 的 区别 就是 人才 的 门槛 其实 也 变 高了。 因为 有 真正 的 在 这个 实 操 下去 做 过 千亿 参数 训练 的 工程化 的 人才, 其实 就在 这 几家 大厂 里面。 在 学校 其实 也 掏 不 起 百万美元 的 钱 来 去做 工程 实践, 所以 大厂 也 垄断 了 大概 小 几年 的 核心 人才 的 窗口。 同时 的话 就是 还有 很多 更加 多 的 一些 综合 的 工程 的 能耗, 这个 可能 很多 创业 公司 也 拿 不到。 所以 我们 看到 就是 还有 少数 的, 比如说 尤其是 在 美国 的 创业 公司, 他们是 来自 比如 google 拉姆达, 来自 open a 然后 他们 能够 还 融 到 钱, 拉 起 一个 团队 做 这个 底层 的 创业。 但是 他们 面对 的 很多 核心 挑战 就是说 他们 怎么 再去 跟 open I 差异化。 我 觉得 这个 留给 他们的 时间 窗口 已经 可能 越来越 短 了。 他们 必须 得 想到 更好 的 商业 策略, 或者说 他们 有 底层 的 模型 能力, 去做 更加 有 爆发性 的 to c 的 产品, 可能 最终 他们 在 底层 的 积累 才 会有 价值。

然后 第二类 就是 可能 这个 也 之前 也 提到 比较 多 的, 不管 是 jasper 还是 made journey, 还有 很多 玩家。 我可以 基于 现有 的 不管 是 开源 还是 这个 open I 闭源 的 A P I 来 去做 这个 应用 的 创新。 我们 现在 其实 从 关注, 比如说 像 v journey jasper 的 这个 火爆 半年 下来, 我 觉得 现在 又 进入 了 一个 创新 的 一个 真空 期。 就是 之前 大家 不管 是 做 营销 的 文本 生成, 还是 图片 营销 的 艺术 图片 的 生成, 其实 已经 获得 了 不少 的 商业 的 收入 订单。 但是 怎么 再去 把 这个 产品 从 工具 迭代 到 平台 型 的 产品, 我 觉得 现在 又 开始了 一轮 新的 探讨。 其实 还没有 出现 一个 能 看到 护城河 的 产品 真正 去去 诞生 了。 这个 也是 我 觉得 肯定 也是 需要 时间 的。 我们 其实 也是 一直 在 非常 紧密 的 来去 观察 这 里面 的 变化。

那 可能 是不是 在 应用 层次 的 这边 的 机会 还是 有 一些。 如果我们 要 看 2023年 的 这样的 一些 投资机会 的话, 那那 叫 什么? 来说 一下 你的 产品 是 做 哪个 方向。

我们 产品 叫 movie, 我们是 一个 A I 视频 的 生产工具。 像 刚才 毕 炜 提到, 其实 除了 这个 底层 技术 的 创新 以外, 其实 在产品 领域 它 其实 是 有 很多 机会 的。 就像 我 刚才 提到, 在产品 领域 它 其实 是 a different problem。 在我看来 其实 它 更 重要 的 是 说, 你 如何 把 这个 技术 应用 到 这个 场景 当中, 并且 去 enable 提供 最后的 完成 last mile 的 产品 落地, 去 最终 给 用户 提供 价值。

我 觉得 在产品 领域, 我的 一个 观点 是 说, 我们 可以 看 两个 例子。 就是 比如说 像 apple 对 吧? 做出 iphone 的 时候, 其实 有 很多很多 的 技术, 它 都 不一定 是 这个 世界上 第一个 做出来 的。 比如说 像 这种 触摸屏, 或者说 很多 这种 手机 上 的 交互。 但是 它是 第一个 公司, 真正 把 所有的 这些 技术 融合 到 一起, 变成 一个 iphone 的 公司。 然后 他 取得了 最大 的 成功。 因为我 之前 一直 在 snapp 在 工作。

然后 我们 一个 观察 是 说, 我们 对 一个 尤其是 对 to c 的 产品 领域 来说, 其实 更 重要 的 尤其 在 社交 领域。 其实 这个 技术 可能 不是 最 关键 的, 更 关键 的 是你 是否 能 捕捉 住 用户 心理 上 的 心理学 上 的 一些 诉求, 对 吧? 然后 像 前段时间 比较 火爆 的 be will 他的 这么 一个 技术, 其实 可能 是 五年 前 都 有了, 就是 拍 张 照片 而已。 但是 他 真正 的 是在 这个 产品 价值 上 有 很大 的 一个 创新。

然后 其实 在 这些 领域 我会 认为 说, 当然 我 觉得 这 里面 很 核心 的 一点 在于 说, 当 你的 底层 技术 发生 巨大 的 变化 的 时候, 可能 你的 这种 产品 的 交互 和 形态 会 很 不一样。 这时候 一定 会有 新的 玩家 出现。 就像 我们 看 十年 前 这个, 移动 互联网 和 手机 开始 普遍 的 时候, 于是乎 出现了 snap 的 这种 新的 这种 社交 的 形式。 然后 在 未来 maybe 我们 可能 可以 看见 的 是 这个 底层 技术 是 general A I 的 一个 巨大 的 变化。 可能 我们 今天 在 消费 信息, 看啊 视频 的 时候 的 这种 体验 都是 不一样的。 它 可能 是一个 新的 产品 形态 去来 承载。

如果我们 可能 要 对 2023年 有 一些 期待 的话, 大家 觉得 generated A I 在 今年 可能 大家 会 看到 一些 什么样 的 新技术 或者 新产品。

我 因为 我们 也是 在 从事 这个 领域 了, 然后 我 觉得 有一个 很很 有意思 的 点 在于 说, 其实 我们 今天 看 整个 generative A I 的 landscape。 实际上 在 过去 的 一年 到 半年 时间, 我们 可以 看到, 有 其中 一个 领域 就是 文本 生成 领域, 有 巨大 的 突破 和 落地 的 这种 展现。 比如说 像 jasper 或者说 copy AI 这样的 公司 出现, 包括 在 图片 领域, 其实 会 发现 有 Midjourney。 然后 stable diffusion 这样的 一个 开源 的 生态 enable 了 很多 这样的 application。 然后 我们 自己的 一个 观点 是 说, 其实 在 视频 领域 或者 在 未来 的 这种 三 弟 内容 的 领域, 其实 会有 类似的 技术 的 突破 和 爆发。 当 这个 技术 发生 突破 之后, 它 一定 会 底层 改变 很多 我们 以前 不一样的 一些 形态 本身。 那 会 出现 开始 有 这种 通过 A I 可以 生成 一个 视频, 通过 A I 可以 生成 一个 3D的 模型。 这也是 可能 我们 今天 墨菲 正在 做 的 一件 事情, 然后 我 觉得 这 是一个 很 重要 的 一个点。

然后 第二个 点, 其实 是 我 认为 说 因为 其实 像 我们 看到 文字、 图片, 未来 的 这种 视频, 它 都 可以 被 生成 的话, 这 就会 enable 一种 新的 体验, 就是 一个 跨 模态 和 多 模态 的 一种 的 创作 和 生产 的 体验。 Maybe 此时 你 可能 就是 可以 通过 输入 一段 prom, 本来 你是 在 jasper 或者 copy 获得 一段 文字 的 答案, 对 吧? 但 其实 你 可能 可以 根据 你的 prom 获得 一个 你想要的 一个 视频, 或者说 你想要的 这个 P P T 等等 类似的 这种 跨 模态 的 这种 生成 的 一个 体验。 也会 在 这个 工业界 里面, 在 未来 的 1到2年 以内, 我 觉得 会有 很多很多 的 这种 落地 和 发生。

Bill bill 这边 有没有 什么?

对我 今年 主要 还是 非常 期待 这个 应用层 的 两个 事情。 一个 事情 就是说 在 to c 端 有没有 基于 A I 就是 人和 这个 A I 交互, 人和 人 交 户, 然后 形成了 一个 非常 好的 有 网络 效应 的, 不管 是 to c 的 社区 也好, 社交 产品 也好, 真正 能够 诞生 出来, 我 觉得 这个 如果 真的有 很多 雏形 的话, 还是 很 让人 兴奋 的那 第二块 就是 在 B 端 的话, 有没有 一些 软件 的 类目, 它 真正 开始 去 改变 人和 这个 软件 的 交互方式, 使得 说 会 诞生 一些 全新 的 软件 形态, 来去 颠覆 现有 的 这些, 上市 的 这些 软件巨头。 我 觉得 这 两个 如果 有 人 真的 能够 想到 不错 的 idea 并且 落地 的话, 还是会 非常 让 我 兴奋 的。 对我 就 觉得 其实 在。

去年 的 整体 的 这样的 一个 经济 下行 的 这个 环境 里面, 然后 除了 这个 ChatGPT I G C 的 这样的 一些 让 我们 能够 看到 新的 兴奋点 的 地方, 我 觉得 还是 特别 让人 感觉到 意外 的对。 然后 我 觉得 可能 我们在 未来 等于 像是 好像 我们 重新 开启 了 一个 新新 的 互联网 的 这样的 一个 新的 技术 的 方向。 我 觉得 这个 可能 是 最后 我们 年终总结 的 这样的 一个 节目。 其实我 也 觉得 可以 让 大家 对 今年 有 更多 的 一个 期望。 然后 可能 在 我们 经历 了 特别 不好 的 2022年 之后, 我 觉得 这个 是一个 特别 好的 一个 ending。

非常 希望 今年 是 A I 真正 的 商业 产品 落地 的 一年。 我们 五元 这边 也会 花 非常 多 的 时间 来去 探寻 里面 的 投资机会。

2022年 一个 巨大 的 一个 A I 的 领域 的 突破, 其实 突变 生成 了 这个 突破 以及 他的 商业 的 应用。 我们 对 这个 二三年 的 一个 展望, 可能 是 这个 呃 视频 内容 生成 的 这么 一个 突破。 然后 更多 的 这种 跨 模态, 刚才 提到 了 这种 体验 的 诞生, 然后 让 用户 可以 更 低 门槛 的, 更 高效 的 去 创作 这种 各种各样 的 这种 内容。

好的, 我也 非常 期待, 可能 我们 今年 2023年, 这个 肯定 不会 是 唯一 一期 讲 generative A I 的 一期 节目。 我们 也 希望 到时候 能够 call back 两位 来 继续 帮 我们 来 分析 generate A I 这个 领域 的 新的 公司 的 动态。 好的, 非常感谢 两位, 今天 的 节目 就 到 这里 了。

谢谢。

这 期 what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G, 艾特 升点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼, 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。

如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是在 公众 号 文章 中 扫 码 添加, 或者 是 公众 号 后台 回复 科技 早知道, 即可 获取 邀请码。 期待 你的 加入, 我们 下期 见。