大家好, 欢迎来到 脑 放 电波。 脑 放 电波 是 一档 关注 科技前沿 品牌营销 和 个人成长 的 谈话 类节目。 每期 带给 您 一个 有趣 的 话题, 帮 您 在 信息 严重 过载 的 现代 世界 小幅 自我 迭代。 我是 托马斯。
我是 nixon。 大家好, 欢迎来到 南方 联播。 在 过去 的 一周 之内, 我 OpenAI 这家 非常 明星 的 机构, 他 举行 了 自己的 第一次 开发者 大会。 我们 也 想起 来说, 我们 好像 有 一段时间 没有 跟 大家 更新 AI 这个 行业 最新 的 一个 进展 了, 对 吧?
是的, 已经 有 听 友 在 催 更 了。
我们 就 来 一期 关于 A I 的 节目。 我们在 准备 资料 的 时候, 我们 发现 open I 的 这个 大会, 它是 一个 开发者 大会。 事实上 它 不是 一个 面向 消费者 的 一个 发布会, 就像 苹果 的 发布会 那样的。 所以说 这 期 节目 我们 虽然 是以 open A V 的 发布会 为 契机 来讲, 但是 事实上 我们会 跟 大家 来过 一下, 包括 ChatGPT, 甚至 是 包括 百度 的 文心 一言 之类 的 主流 的 大 模型 工具。 他们 在 过去 几个 月 发生 的 一些 主要 的 进展。 相信你 能 用 这些 新的 技术 来 去做 一些 新的 事情, 我们 希望 把 这些 事情 跟 你们 说 清楚。
很多 听 友 在 听 我们 节目 催 我们 讲 A I 的 内容 的 时候, 我相信 大家 除了 要 关注 科技前沿 之外, 可能 也要 看一下 到底 我们 自己 能够 上手 用 的 东西, 这些 马上 就要 发生 的 事情 会 发生 什么 变化, 对 吧? 因为 其实 很多 流行 的 自媒体, 它 会 更多 的 聚焦 在 马上 世界 要 被 改变 了, 什么 人类 都要 下岗 了, 然后 会说 更多 宏大 的 叙事, 但是 我们 可能 会 具体 的 讲一讲, 大家 马上 就能 上 手玩 到 的 东西 又 发生 了 哪些 变化。 我们 先 讲 一下 OpenAI 它的 第一场 开发者 大会 大概 讲 了 哪些 内容。 我 先 给 大家 过 一下。 这场 会上 最 重要 的 发布 是 sam altman 发布 了 GPT4 turbo, 相当于 是 GPT4 的 一个 新的 迭代 的 版本。 这个 版本 有 几个 重要 的 地方, 首先 它的 性能 提升 了, 应该 是 跟 大家 关系 最大 的。 就是 它的 文本 上线 处理 达到 了 128K 过去 文本 上 现在 应该 是 8K对 吧?
现在 就 相当于 你 能够 丢 300页书 的 P D F 给他, 过往 你 只能 丢 16分之1, 这个 确实 是一个 好消息。 就是我 有的 时候 可能 需要 看 一些 论文, 或者 是看 一些 英文 的 长 文档 的 时候, 你 一个 一个 去 让 他 翻译 或者 是 怎么样 还是 很 麻烦。 然后 你 丢 个 GPT, 你 就 发现 他 就会 告诉 你说 我 没办法 读完, 太 长了, 超出 我的 上下限 了。 那 现在 来说 好 很多 了, 应该 300页的话, 意味着 绝大部分 的 论文 都是 可以 直接 丢 给他, 然后 让 他 直接 帮你 读 了。
实际上 在 过去 的 几个 月 里面, 我自己 用 ChatGPT 来 读 这种 长 文档 的 事情 就 越来越少 了。 就是 因为 刚才 说到 的 限制, 甚至 有的 时候 你 贴 一篇 纽约时报 的 文章 进去, 你 都要 分好 几段 才能 把 它 贴完。 所以 后面 我们 有 一段时间 用 cloudy 用 的 多一些。 现在 如果 它 回到 了 128K 因为 我们 知道 从 模型 能力 来讲, G P4 肯定 还是 翘楚。 所以 我们 看到 了 这个 升级 实际上 是 跟 大家 关系 最大 的 一个。 与此同时 GPT4 的 这个 turbo 准确率 达到 了 创纪录 的 87%, 而 GPT4 与 之 对比 只有 52%。
这个 准确率 的 意思 就是 它的 幻觉 的 比例。 也就是说 GPT4 turbo 图 给你的 消息 的 准确率, 你 更 可以 采信 一些。 相比之下 我们 其实 玩 一些 其他 的 模型 或者 是 玩 GPT4 的 时候, 我们会 遇到 很多 准确率 的 问题。 他 告诉 你的 东西 你 要 再 double check 才 敢 用。 但是 我们 看到 87% 其实 不是 百分之百。 所以 其实 大家 在 使用 ChatGPT 来 工作 或者 是 搜集 资料 的 时候, 可能 还是 要 再 留个心眼, 再 check 一下。
然后 它 非常 大 的 一个 变化 是 推出 了 G P T S, 有点 类似 我们 之前 跟 大家 讲 过 的 A I agent 这种 功能。 等一下 会 再 讲到 这个 A I agent 这个 环节, 跟 大家 分享 一下, 我们 用 它 都 做了 哪些 事情。 然后 现在 其实 已经 有 各种各样 的 每个人 自己 做 的 GPT s 在 网上 就 这几天 的 时间 就 非常 多 各种各样 的 内容, 也是 很 有意思 的。 被 认为是 OpenAI 推出 插件 功能 以后, 现在 最受 期待 的 一个 新的 功能。 只要你 买 了 ChatGPT 的 plus 版本, 就可以 马上 玩 到 的 GPT .
s 它 就是 相当于 说, 比如说 以往 有人 他 通过 这种 很 精妙 的 提示 词, 它 能够 让 这个 GPT 完成 某些 比如说 生成 特例 的 文章, 它 生成 的 很好, 或者说 分析 特定 的 内容, 他 很 像是 一个 专业人士。 但是 现在 那个人 他 可以 把 自己的 这套 提示 词, 或者 是 这套 专业 的 代码 吧, 他 可以 把 它 分享 出来。 未来 你可以 去 GPT s 商店, 有点 类似 于 应用 商店 或者 小 程序 商店 的 这么个 概念 里, 你 就可以 用到 这个 东西。 相当于 说 你 就 不用 自己 再去 记 那些 很 专业 的 提示 词 和 去 学习 那些 东西 了。 你 在 市场 能够 找到 大量 的 非常 专业 的 人, 直接 用 他的 机器人 来 给你 提供 服务。 GPT s 大概是 一个 这样的 一个 东西。 其实 你 想一想 就会 发现, 它 从 产品 形态 上 它 很 像 应用 商店, 它 从 经济 上 来说 它 也很 像是 open I 它 开始 分发 这个 chatbot, 开始 分发 不同 专业 帮你 解决 不同 问题 的 这种 聊天机器人。 科技 媒体 是 还是 很 激动 的。
这件 事情 对 等一下, 我们会 跟 大家 详细 介绍。
刚才 我们 也 提到 说 这 一期 节目 其实 我们 不 希望 只 讲 开发者 这一天 发布 哪些 东西。 我们 还是 希望 把 最近 所有的 能够 找到 的 一些 不错 的 东西 都 跟 大家 讲 一下, 回顾 从 三月 到 11月, 这 中间 会有 一个 重要 的 一个 节点。 这个 节点 过后, 不管 是 GPT 还是 包括 百度 的 文心 一言 这个 模型, 它的 能力 都有 巨大 的 增强。 它 叫做 插件, 英文 叫做 plug e 这个 功能 目前 不管 是 百度 的 用户 还是 GPT 的 用户, 你 都能 去 使用 到 的 这么 一个 状态。 ChatGPT 插件 商店 里面, 应该 是 有 两三百 个 插件。 百度 的 文心 一言 他 自己 也 做了 6到7个。 所谓 插件 的 意思 就是说 能够 调用 一些 第三方 方 的 程序, 帮你 完成 了 一些 不是 纯粹 的 一个 聊天机器人 能够 完成 的 事儿。 比如说 在 ChatGPT 的 login 商店 里面, 其实 就能 看到 它 有一个 视频 生成 的 插件, 它是 由 字节 跳动 这个 剪 映 做 的。 我 就 跟 他说 了 一句话, 你 根据 今天 北 的 天气 给我 生成 一段 视频, 这个 就是 他 生成 的 视频, 我 就 简单 播 一下。
Today, asian experiences of clouds and sunshine. The morning starts with a cool breeze, with temperatures around eight degrees. Sales us.
这 段 视频 里面, 它 就是 通过 图片 和 语音 解释 了 说 北京 今天 的 天气 是 多少度, 早上 是 怎么样, 中午 是 怎么样, 空气质量 质量 是 怎么样, 这些 信息 都在 里面 说 了 这 一切 起源 都很 简单, 就 只是 我 给 他说 了 一句话, 这个 功能 确实 是 非常 的 强大。
这块 我 其实 可以 简单 跟 大家 讲 一下 它的 原理, 大家 可能 就 理解 插件 是 怎么 工作 的, 它的 起点 就是 nixon 给他 下了 一句 prompt, 根据 北京 的 今天 的 天气 帮 我 生成 一只 视频。 然后 ChatGPT 在 里面 主要 做 的 事情 是 根据 这 句 话, 首先 去 读取 今天 北京 的 天气, 要 通过 它的 联网 功能 去 调用 北京 今天 到底是什么 天气。 然后 根据 这些 天气 信息, 它 把 它 生成 了 一段 视频 的 旁白 脚本, 今天 什么 天气 大概是 什么 样子, 对不对? 接着 他 就 把 这个 脚本 输出 到 剪 映, 然后 后续 由 文字 生成 视频 的 这个 工作, 实际上 是 由 剪 映 来完成 的。
所以 这 一系列 的 工作, 原本 你 需要 好几步 的 操作, 跨 了 好几个 不同 的 软件, 甚至 需要 联网 的 能力。 但是 现在 通过 插件 这样的 一个 功能, 你可以 一站式 的 在 ChatGPT 来完成 这个 视频 的 制作 全过程。 所以 它 其实 就是 一个 典型 的 插件 的 应用, 他是 干什么 的, 以及 他是 怎么 工作 的那 这就是 调用 了 ChatGPT 对于 自然语言 指令 的 识别, 它 生成 脚本 的 这个 能力。 然后 再 结合 剪 映 的 他 自己的 一套 人工智能, 通过 你的 脚本 来 搭配 视频 跟 图片 跟 文字 旁白 的 这种 能力。 最后 出来 了 这么 一个 综合 的 一个 产 软件 的 应用。
第二个 案例 是因为 我 最近 在 控制 体重, 我 今天 就 跟 他说 说 我 接下来 十天 我 都要 吃 素食。 但是 我希望 每天 都 吃豆腐, 希望 每天 吃 到 的 豆腐 的 滋味 是 不一样的我 需要你 做 两件 事情。 第一件 事情 是 能 给我 一个 豆腐 的 食谱, 能把 这个 食谱 列成 一个 表, 告诉我 每天 要 吃 什么, 列成 一个 表格。 第二件 事情 是 我希望 把 这个 食谱 里面 要 买的 所有的 东西 添加 在 一个 网站 的 购物车 里, 我 就 直接去 下单 就 好了。
这里 就 调用 了 两个 插件。 第一个 插件 就是 生成 表格 的 一个 插件。 第二个 插件, 它 接入 了 一家 美国 的 公司, 叫做 inter card。 有 一种 类似 于 中国 的 美团, 它 就是 中国 的 美团 的 这么 一家 公司。 GPT 收到 这个 指令 之后, 他 就 先 用 第一个 插件 帮 我 把 这个 表格 生成 出来。 然后 接着 他 就 联系 美团 的那 家 网站, 把 所有的 食谱 里面 所有的 东西 全都 给我 添加 到 购物车 进去。 我 就 点 开 那个 网页, 我 只用 一键 去 付款 就 完 事儿 了。
这个 其实 就是 上一次 OpenAI 的 发布会 里面, 它的 那个 副总裁 演示 的 一个 典型 的 场景, 就是我 要 吃 什么。 给我 添加 到 购物车 的 这个 链接 里面 去。 它 也是 插件 能力 的 一个 展现。
所以 现在 大家 能 理解 插件 它的 核心 就是 借用 一些 外部 的 A P P。 原本 你 可能 是 需要 GPT 给你 输出 信息 之后, 你 需要 做 一些 操作。 那 现在 GPT 给你 一些 信息 之后, 这些 操作 你 就 不用 再 找 别人 了, 你可以 自己 做了。
像 文心 一言 的话, 他 自己 就 做了 几个 插件, 我 觉得 还 蛮 有 特色 的。 比如说。 他 也有 这种 一键 生成 视频 的 这种 插件, 但是 文心 也 可能 就 稍 微弱 一点。 我 让 文星 也 根据 今天 的 天气 给我 生成 一段 视频, 他 就 没有 直接 给我 视频, 他 先 给我 录 个 脚本, 告诉我 说 你 给 我的 东西 太短 了, 我 没办法 直接 生成 视频。 然后 文心 一言 还有 一些 功能, 比如说 他 直接 帮你 生成 树状 图, 直接 生成 思维导图。 或者 是 说 你 要 查询 某 一家 公司, 类似 于 叫做 天眼 查 那样的 应用, 他 就 直接 帮 这家 公司 的 主要 的 C E O 是谁, 控股 人是谁, 他 就 把 这种 商业信息 就 直接 查 给你 了。
这样的 一些 插件, 不管 你是 原来 用 GPT 的 用户, 还是 比如说 类似 百度 文心 一言 的 用户, 其实 现在 你 都 可以 用 上去。 它 能 帮你 解决 一些 聊天 之外 的 问题。 比如说 帮你 处理 一个 文档, 帮你 生成 一段 视频, 帮你 生成 一个 图画, 对 吧? 比较简单 的 一些 东西 都 可以 帮你 直接 做 掉。 是的。
插件 从 五月份 上线 到 现在 应该 是 有 接近 半年 的 时间, 包括 他 刚刚 上线 的 时候, 我们的 节目 里面, 其实 我们 对 他的 这个 期待, 包括 当时 整个 A I 圈子 对 插件 的 期待值 是 很高 的。 我们 大家 甚至 把 它 称为 是 P P T 的 APP store。 对比 成 苹果 推出 APP store, 其实 代表 了 对 这个 插件 非常 高 的 期望值。 但是 坦白讲, 六个月 过去了, 大家 其实 总体 来讲 对 插件 的 这个 体验 是 不及 预期 的。 比如说 到 现在 ChatGPT 的 插件 商店 里 仍然 只有 200到300个 插件 的 数量, 它是 远远低于 预期 的。 因为 等一下 会 讲到 GPT s, GPT s 应该 现在 各种 第三方 的 普通人 和 开发者 开发 出来 的。 GPT s 的 这种 agent 的 数量, 我相信 在 量级 上 已经 远远超过 半年 时间 插件 的 这个 量级 了。
24个小时 之内 出现了 超过 2000个。
说 回 插件, 我自己 的 体验 其实 也是 稍微 低于 预期 的, 就是 很多 看上去很美 的 应用, 比如说 刚才 ny kon 提到 把 它 加 到 购物车 等等, 包括 刚才 nixon 生成 的那 一支 天气 的 视频。 实际上 如果你 体验 一下 当然 是 没问题。 但 如果你 想 把 这个 视频 作为 一个 工具 流, 或者 是你 要 生产 出来 的 内容 的 时候, 它 往往 就 不够 用了。 这就是 可能 插件 面临 的 问题。 就是 他 玩 一 玩 是 可以 的, 但是 你 让 它 作为 你的 生产力 工具, 恐怕 还 稍微 欠 一点 火候。
但 确实 对比 以往, 可能 大部分 人都 还在 用 这种 聊天 的 一些 形式 的 一些 东西, 但 确实 是 已经 进了 一大步 了。 我们 就 往后 说 新的 一些 进步。 时间 进展 到 9月份, GPT 发布 了 两个 重要 的 东西。 第一个 叫做 视觉 版本, 第二个 叫做 语音 交互。 视觉 版本 说 的 简单 一点, 就是 GPT4V, 可以 你 去 读图 的, 丢 给他 一张 图, 它 可以 识别 这 张 图片 里面 是 什么东西。 语音 版本 的话, 其实 就是说 如果你 用 A P P 的话, 就 直接 跟 他 语音, 跟 他 说话。 最有 亮点 的 就 还是 这个 视觉 版本。 因为 视觉 版本 最 开始 在 出来 的 时候, 大家 一开始 以为 说 它 只是 一个 识别 图片 的 一个 东西。 但 后来 有 一些 use case 看完 之后 觉得 还是 很 惊艳。 比如说 给他 拍 一张 冰箱 的 照片, 就 把 冰箱 打开, 你 给他 拍 一张照片, 然后 你 问 他说 我 接下来 一周 我想 吃 哪几个 菜, 再问 他 我 今天 应该 去 超市 买 什么东西, 他 就能 直接 识别 出来 哪些 东西 冰箱 里 有 哪些 没有, 直接 给你 一个 食谱。
还有一个 更好 的 一个 场景 是什么 呢? 就是 有人 要 修理 家里的 一个 类似 于 下水管道 的 一个 的 东西, 按照 网上 的 教程 买 了 一个 那种 水龙头 阀门 这样的 东西。 他 买回来 之后, 他 就 把 水龙头 阀门 和 那个 工具 摆在 一起, 拍 了 张 照片 丢 给 GPT, 问 他说 我 是不是 所有 该 买的 东西 都 已经 买到 了。 GPT 就 告诉 他说, 哪几个 东西 还没有 买, 如果你 要 买, 我 推荐 你 去 哪些 网站 上 搜 哪些 关键词。
视觉 的 这个 东西 出来 之后, 一下子把 整个 交互 的 门槛 降低 了 一大截。 因为 我们 所谓 说 的 这个 多 模态 交互? 这个 概念 视觉 其实 是人 交互 最 重要 的 一个 信息 来源, 就 人的 五感, 其实 人 一天 用 的 最多 的 是 视觉。 我们 今天 阅读 文字, 阅读 表格 都 是因为 我们 先 用 眼睛 去 处理 这个 图像 信息。
对, 我们 实际上 在 今年 的 三月份 专门 聊过 一 多 模态 对于 A I 的 这个 重大意义。 然后 现在 是 11月, 我们 看到 的 是 九月份, GPT 就 已经 把 它的 这个 视频 版本 推出 来了。 其实 我们 当时 就 很 期待 这个 多 模态 带来 的 在 用户体验 上 的 巨大 的 提升。
其实很简单, 就是 有的 时候 比如说 我们 过去 在 用 GPT 的 时候, 我们 经常 会给 他 读 一篇 东西, 对 吧? 请你 模仿 这 篇文章, 或者 是你 学习 这 篇文章, 然后 我 再 跟 你 对话。 但是 往往 互联网 上 的 大部分 的 文章, 它 不会 只有 文字 的, 它 很多 时候 它 中间 会有 一个 图表。 图表 尤其是 那些 大 的 一些 网站, 它 都会 做成 一张 很 精美 的 图。 这个 图 里面 可能 是一个 柱状图, 可能 是一个 曲线图。 人类 当然 是 很 直观 的 读取, 事实上 这些 可视化 的 数据 都是 为了 让 你 更好 的 读取。 但是 反过来, 当时 的 ChatGPT 没有 这种 多 模态 的 能力。 所以 其实 你 这个 文章 给 他的 时候, 他 反而 读 起来 困难 了。
但是 今天 有了 GPT4 视觉 的 版本 之后, 实际上 对于 A I 的 感知 能力 来讲 是一个 巨大 的 跨越, 相当于 他 一个 瞎子 睁开 了 眼睛。 如果我们 科幻 一点 讲, 他 就是 成为 A G I 的 一个 必经之路, 对 吧? 他 能 看见 这个世界 了。
对。
大家 还记得 流浪地球 二 里面 那个 无处不在 的 摄像头 代表 mos 监控 着 你的 那个 感觉 吗? 科幻 一点 讲, 那 GPT4 某种程度 上 就 已经 具备 了 这种 能力。 我们 具体 讲 一下 几个 基础 的 东西。 第一 就是 他 能够 看 懂 图 对 吧? 他 能够 做 光学 字符 的 识别, 它 能 做 基本 的 O C R, 但 其实 这个 相对 是 简单 的, 然后 它 可以 解决 数学 问题, 他 可以 看 懂 数学。
里面 的 这些 函数 的 符号 方程 对。
整个 计算 的 过程。 它 能 识别 图像 中的 物体, 甚至 是 物体 的 坐标, 这个 就 很 厉害 了。 因为 现在 看起来 我们是 给 它 发 一张 图片, 对 吧? 它 去 识别 这个 图片 里 有 什么东西, 然后 它的 位置 在哪里。 但是 如果你 想象 他是 被 装载 在 一个 机器人 里面 的 时候, 它 在 识别 它 面前 的 东西 的 时候, 它 就 完全 可以 去做 空间 的 感知 了。 他 知道 它的 物体 的 位置 和 它的 坐标。 其实 某种程度 上 这就是 特斯拉 基于 视觉识别 的 自动驾驶 的 能力。
就是说 今天 的 这个 自动驾驶 的 摄像头, 它 在 你的 电脑 上, 对它 在 你的 手机 上, 不是 在 那个 汽车 上。 但 这么说 还是 有点 太 抽象, 我 觉得 可以 上 几个 实际 的 例子。 因为 正好 跟 这次 开发者 大会 也有 关系。 之前 的 这个 视觉 的 能力, 他 只是 在 GPT 自己的 chatbot 上用, 只能 在 GPT 自己的 那个 网页 和 A P P 上 有。 但是 因为他 这次 开发者 大会 把 视觉 的 A P I 给 开放 出来 了。 他 就 相当于 是 说 开发者 可以 用了。 对, 相当于 开发者 就可以 用了。 所以 在 24个小时 之内 就 看到 了 特别 多 非常 有 想象力 的 东西。
比如说 刚才 托马斯 提到 他 可以 理解 图片 当中 是什么, 就有 开发者 去 做了 一个 什么东西 呢? 做了 一个 瑜伽 教练, 我 把 电脑 的 摄像头 打开。 因为 大家 都 知道 摄像头 它 之所以 能 拍摄 视频, 是因为 每秒钟 它 有 几十 幅 图像, 对 吧? 他 就 把 那 几十 幅 图像 丢 给 GPT, 然后 GPT 就 知道 你 那个 瑜伽 的 动作, 对不对? 这是 第一个 应用 场景, 很快 就 出来 了。 它 就 等于 识别, 你是不是 膝盖 抬高 了, 你 有没有 正确 的 翘 屁股。
智能 瑜伽 教练 对 吧?
对, 智能 瑜伽 教练。 第二个 东西, 我 觉得 这个 对于 大学生 学习 简直 是 福音。 有人 做了 一个 工具, 就是你 在 看 任何 的 论文 和 任何 的 教科书 的 时候, 你 就在 屏幕 上截 个 图。 这个 GPT 会 同时 去 读 这个 屏幕 上 的 东西 和 截图 的 东西。 然后 他 就会 根据, 比如说 你 读 一篇 论文 或者 你 在学 高等数学, 他 就会 回答 你说 这个 符号 它是 什么 意思? 你 就 省去 那个 时间 说 以往 你 读 到 一个 东西, 读 到 一半 读不懂。 那 现在 你 需要 去 百度, 你 需要 去 谷歌, 那 现在 就 不需要 了。 你 也 不需要 问 GPT, 你 就 用 这个 GPT 视觉 的 这个 能力, 他 就会 识别 到 这个 东西 了, 他 就会 帮你 读出来。
做 程序开发 的 人 也很 有 影响力。 有人 也是 在 github 上 开发 了 一个 项目, 他 自己 画 了 一个 草图 给 GPT。 GPT 就 把 建议 的 网页 的 代码 吐 给你, 中间 还 不断 的 去 帮你 调试, 你 就可以 很快 的 去 完成 网站 的 开发。
这 里面 最大 的 变化 就是 他 能读懂 你的 草图 了。 因为 过去 其实 你 只能 文字描述 我需要 一个 什么样 的 网站, 也能 做到 不断 调试 做出 一个 网站 来。 因为 G P4 其实 代码 能力 很强, 但是 今天 开放 了 这个 之后, 我 不用 讲 了, 我 就 画 出来 就 好了。 而且 画的 是一个 非常 简陋 的 草图。
它 也能 识别。 但是 传播 的 最 广 的 还是 接下来 要 讲 的 这个 case。 有人 用 GPT 的 视觉 版本, 他 做了 一个 A I 的 体育 解说员, 丢 给他 了 一段 视频。 是 梅西 大概是 连 过 五 人 还是 连 过 八 人的 一段 经典 的 视频。 他 就 自动 的 识别 出来 梅西 从 中场 带球 从 边线 穿 到 正中间, 他是 怎么样 去 跨过 了 123四五个 竞争对手, 然后 最后 把 球 踢进 了 球门 的 这个 视频。
因为我 也 刷 到了 流传 非常 广, 一个 听起来 就 很 机器人 的 一个 声音, 在 尽可能 激情 的 解说 还是 非常 厉害 的。 因为 在我看来 这 是个 视频, 它 其实 需要 一帧 一帧 的 处理, 在 针对 对的 时间点 输出 旁白 的 文件。 然后 这个 旁边 文件 再 通过 A I 语音 生成 的 能力 去 把 它 变成 一个 解说。 我的 理解 他 现在 应该 是 做不到 实时 的, 否则 这 也 太 吓人 了。 它的 这个 运算量 是 很大 的。 其实 所以 它 应该 是 针对 一段 视频 回放 的, 可能 需要 一段时间 运算 的。 但是 能 输出 这样的 一个 结果, 如果 未来 随着 GPT 的 性能 越来越 强, 随着 我们的 端 测 的 算 力 越来越 强我 觉得 甚至 有可能 它 就 变成 一个 实时 的 解说 了。 Yes, absolutely glorious.
The stadium explodes. Joy, this is football magic at its finest. Only messy, only messy.
我 觉得 他的 缺憾 还是 声音 太 机械 了。 但是 我们 其实 最近 大家 在 抖 音 上 应该 能 刷 到 各种各样 的 声线。 我 觉得 他 其实 完全 可以 接入 一个 比如说 孙悟空 的 口音, 或者 就是 我们 经常 听到 的 那个 甄嬛传 里面 的 一些 口音 来做 这种 解说。 所以 未来 我们会 听到 各种各样 更 夸张 的。 因为我 觉得 语音 的 迭代 是 非常 快 的, 会 非常 的 有意思。
这个 案例 其实 已经 把 我们 要说 的 就 GPT 最近 的 这个 版本 的 一个 重大 的 迭代 也 涉及 到了 语音 的 这个 能力, 它的 整个 语音 合成 的 能力 也 已经 非常 强 了。
ChatGPT 的 这个 A P P 版本, 它 在 过去 几个 月 里面 有 一次 迭代 之后, 它 就 支持 了 语音 的 对话。 我 觉得 大家 应该 已经 在 各种 抖 音、 短 视频 平台 刷 到了 很多 有意思 的。 大家 录下来 的 ChatGPT 的 一个 浑厚 的 男生 在 跟 你说 各种各样 有意思 的 对话 的 内容, 我 觉得 相对 是 简单 的, 我 觉得 大家 也能 理解, 这块 我们 就 不 展开。
对, 但是 他 那个 略带 新加坡 或者 是 香港 口音 的 普通话 还是 挺 有意思。
的对 对 对对对, 就是 听着 还 挺 高级 的, 某种程度 上 你 会 觉得 挺 高级 的对。
这里 还有一个 比较 高级 的 东西, 是 来自 深圳 的 一家 公司, 叫做 hagen。 他 就是 很 完美的 实现 了 把 一个人 的 语音 克隆 到 另外一个 语言 里面 去, 音色 保留。 我 简单 的 放 一段, 你 应该 马上 就能 回忆 起来 这 段 视频。 Hand also turned around and headed towards the large road in the north, proceed north walk for approximately twenty miles IT. 快。
大家 听到 他们 说出 一口 流利 的 英文, 这个 确实 是 非常 有意思 的 功能。 我也 看到 一些 大家 觉得 很 可怕 的 地方, 因为 它 可以 很短 的 时间 里 就 复制 一个人 的 声音, 它 就 使得 这种 互联网 欺诈 变得 更加 容易 了。 所以 大家 接下来 的 一段时间 里面, 开始 接到 一些 自己 亲人 的 电话。 然后 让 你 转钱 的 时候, 甭管 多 亲, 我 建议 还是 留个心眼, 多 确认 一下 再 打钱。 因为 不好 这种 新型 的 诈骗 快要 出现了, 因为 这个 在技术上 已经 是 没有 什么 障碍 了。 好, 接下来 就是 要 聊 GPT s 了。
GPT s 这个 东西 是什么? 我 觉得 还是 让 大家 有一个 直观 的 理解。 它 有的 一些 功能 我们 可以 简单 的 看一下。 比如说 有一个 GPT s 叫做 视频 查找 器, 你 输入 一段话 他 就 去 抖 音、 tiktok 然后 youtube、 哔哩哔哩 先 网上 找, 就 符合 你 这个 要求 的 视频 都有 哪些。 我 把 这个 视频 的 链接 吐 给你 其他 一个 搜索引擎 的 功能。 如果 你是 做 金融交易, 它 就有 这种 GPT s 我 把 各国 央行 的 实时 汇率, 不同 的 公司 的 实时 的 市盈率, 我 就 实时 的 给 播报 给你。
如果 你是 想要 去 娱乐 的话, 比如说 我们 看到 一个 应用, 它 就是说 今天 海边 的 这个 天气, 你 可能 住在 深圳。 那 今天 深圳 附近 的 海边, 哪个 地方 是 适合 冲浪 的 天气, 哪个 地方 不 适合 冲浪 的, 就 每天 就 把 最新 的 天气情况 给你。 所以 你可以 想象 一下, 你 进入 到 一个 网页, 然后 这个 网页 里面 有 各种各样 的 所谓 的 GPT s 然后 他 都是 帮你 完成 一个 特定 的 工作 和 任务 的 这么 一个 东西。
我 觉得 GPT s 最 有魅力 的 地方 可能 还 不是 去 用 一个 G P S。 他 最 厉害 的 地方 反而 是你 自己 可以 创造 一个。 昨天 开始 开放 的, 然后 今天 我们 就 都试 了 一下, 我 就 尝试 了 一下 创建 一个 GPT s 的 agent 到底 有 多难。 我 发现 非常简单, 在 界面 上 直接 有一个 创建 的 这个 按钮。 按 完 之后, 它 有 两个 选择, 第一个 叫 create, 第二个 叫 conflict。 那 create 它 就 直接 就会 问 你, 你 想要 我们 做什么, 你 就可以 直接 用 语言 的 方式, 我们 之前 在 聊 插件 的 时候, 其实 ChatGPT 就 承诺 说 他 可以 用 语言 的 方式 来 创作 创建 插件。 但是 我 感觉 插件 的 功能 并没有 完全 开放 给 每一个 普通人 去 创建。 它 应该 是 只 给 开发者 对 开放 了 插件 的 这个 功能。
对, 做 插件 现在 还是 得 写 代码。 对, 但是 做 GPT s 你会不会 写 代码 都 可以。
对 GPT s 它 就 变成 了 所有的 plus 用户, 你 都 可以 自己 创建。 我 接着 讲, 在 create 里面 它 其实 有 一段 英文 说 i will help you build a new GPT。 You can say something like make a creative who helps generate visuals for new products, or make a software engineer who help for my my code.
What would you like to make? 他 就 告诉 你说, 我可以 帮助 你 建立 一个 新的 GPT 助手, 那 你可以 直接 告诉我 what would you like to make。 就是我 做了 一个 评测 小编, 我要 做 一个 帮 我 挑 手机 的 GPT。 然后 他 就会 继续 问我 一些 问题, 比如说 我 现在 实际 测 一下, 我要 做 一个 手机 评测 的 GPT, 在 我 提出 问题 之后, 它 实际上 就会 显示 它 正在 updating。 接下来 会 问我 下一个 问题, 稍等一下, 我们 稍微 再做 个 几步, 让 大家 知道 是 怎么 回事儿。 然后 当我 说 了 我要 做 一个 手机 评测 的 P P T 之后, 他 就 回 我说, 那 我们 就可以 建 一个 帮你 去 选择 智能手机 的 评测 的 这么 一个 P T。 甚至 就 只是 根据 我 这样 简单 的 一句话, 他 就 给出 了 他 能够 做什么, 他 能够 告诉你 detail insights。
在 不同 的 这个 smart home 里面 focusing 关注 规格 性能 和 设计, 同时 还要 看 它的 性价比 等等。 他 就会 问 你, 我们 现在 给 这个 GPT 起个名字, how about phone insight? 他 帮 他 直接 起了 一个 名字, 就是 很 像 一个 评测 编辑 的 感觉。 如果 你喜欢 这个 名字, 他 就 问 do you like I like this name, or have another in mind? 它 其实 就是 通过 这种 对话 的 形式, 一步一步 的 引导 你 去 产生 一个 prompt。 然后 这个 prompt 会 被 存在 你 这个 bot 里面, 你 这个 GPT s 里面, 下一次 你 直接 调用 就 好了。
我 不跟 大家 一步一步 走下去 了, 我们 可以 看一下 这个 config。 因为我 第一次 见 这个 G P D S 的 时候, 我以为 就 直接 要在 config 里面 做。 它 实际上 咖啡 里面 就 会有 几个 大 的 框架。 第一个 就是 名字, 你 这个 GPT 叫 什么? 第二个 是 description, 它是 干什么 的? 然后 第三个 是 instruction, 这个 比较 重要, 它 就 会有 非常 详细 的 prompt。 在 这个 位置 就 会有 一 长 段。 根据 你 在 前面 跟 他 聊 的 内容, 把 它 变成 一个 prompt, 变成 一个 提示 词, 放在 这个 instruction 这个 部分。
然后 再往下, 它 可以 让 你 upload files, 这个 其实 是 非常重要 的 功能。 也就是说 这个 chatbot, 这个 agent 它 不光是 耍 耍嘴皮子, 或者 是 通过 prompt 来 调用 现有 的 GPT4 的 能力。 它 实际上 是 可以 为你 的 私有 的 需求 服务 的那 举 个 例子, 我们 可以在 这 上面 upload 我们 所有的 过去 的 所有的 节目 的 音频 信息, 或者 是 我们 转成 文字 的 信息。 其实 这个 bot 它 就有 了 关于 脑 放 电波 过去 所有 节目 的 总和 的 信息。 这个 信息量 对于 一个 bot 来讲, 它 就可以 非常 好的 知道 我们 这个 节目 是什么 节目, 我们的 风格 是 怎样 的, 我们 过去 有 哪些 集, 我们 讲 过 哪些 内容。 然后 这个 时候 比如说 我们 要把 它 做成 一个 脑 放 电波 百科, 它 实际上 就 具备 了 通过 问答 的 方式 检索 我们 整个 脑 房 殿 波 过去 节目 的 能力。 同时 它 还有 几个 可以 打勾 的 选择 的 能力, 叫 capabilities, 里面 包括 wet browser, 就是 能够 联网。 这个 现在 变成 了 GPT 的 标配。 我们 遥想 ChatGPT 刚刚 上线 的 时候, 那个 时候 还是 不 联网 的。
然后 他 不断 的 在 重复 我 给你的 不是 最新 信息, 对我 的 知识 截止 于 2021年, 那个 时候 还是。
挺 烦恼 的对, 现在 的 知识 已经 是 截止 2023年 4月了, 这是 GPT4 的 数据库 的 最新 的 版本。 与此同时, 它 还 能够 web browser 通过 必应 来 访问 整个 网络。 第二个 勾 就是 deal e image generation, 这个 就是 生成 图片 用 的 一个 功能, 显然 也是 很 重要 的。 它的 多 模态 不 光光 是 我们 输入 它 能够 看到。 同时 现在 在 GPT 里面 你 也可以 直接 收获 一个多 模态 的 回答, 它 可以 直接 返 图 给你, 然后 同时 它 还有 第三个 可以 选择 的 就是 代码 解释器。 这个 应该 是 程序员 用 的 更多 的 一些 功能 了。 它 可以 读取 代码, 可以 帮你 纠错, 帮你 debug, 帮你 测试 等等。 最后 还有一个 action, 这个 部分 就 需要 代码 了。
作为 一个 我们 这种 没有 代码 能力 的 一个 普通人 来讲, 我们 第一次 有一个 想法 在 脑子里。 然后 通过 一点点 的 对话 就可以 完成 一个 某种程度 上 有 一定 生产力 的 这么 一个 聊天机器人 的 定制。 我 觉得 这件 事情 还是 非常 开创性 的 一件 事情, 它 未来 会有 很大 的 改变, 可能 今天 我们 等一下 会 聊到 通过 代码 写 出来 的 GPT s 可能 还是 要 更好, 在 此时此刻 仍然 是 这样。 但是 我相信 在 不远 的 将来, 可能 我 用 嘴巴 说 出来 的 一个 程序 跟 你 用 代码 写 的 可能 差距 会越来越 小。 甚至于 未来 更多 比拼 的 是 大家 的 想法。 而 不是 谁的 代码 能力 更强 了, 那 这件 事情 就 完成 了。 我们在 很早以前 聊 的 有 一期 内容 里面 提到 的 程序员 和 普通人 的 平权, 可能 就 最终 将 到来 了。
但 这个 过程 会 很长, 但 这个 事情 的 好处 其实 是 这样的。 很多 写 代码 的 他 愿意 生成 一些 GPT s, 愿意 做 一些 专业 的 chat board 给你。 然后 你 就会 发现 你的 ChatGPT 就会 好用 非常 多, 他 就能 解决 非常 多 问题。
然后 如果你 是一个 ChatGPT 玩家 或者说 一个 使用者, 你 原来 要 完成 某个 功能, 比如说 你 起 一个 小红 书 标题, 或者说 你 要 分析 一个 excel 对 吧? 原来你 可能 是 需要 自己 去 网上 扒 一些 很 专业 的 提示 词, 自己 去 调试 一些 东西。 现在 就是 有人 在 背后 运营 那个 东西, 去 迭代 那个 东西, 给你 现成 的 整个 的 使用 的 便利性 一下子 就 大大的 一个 提升 了, 甚至 还 哺育 出 一个 创作者 生态。 如果 你的 提示 词 是 很 有 创意 的, 或者 是 说 你 能够 基于 ChatGPT 的 这些 能力 去 给 别人 做 一些 很 好的 服务。 你 甚至 可以 依靠 这个 东西 来 赚 到 钱。 你看 现在 像 我 用 的 那个 P O E 的 那个 chat board, 他在 上个月 他 就 给我 推 了 一个 功能。 就是说 如果你 把 这个 机器人 分享 出去, 别人 用了, 然后 别人 就 订阅 了 我们的, 就是 付钱 订阅 了 我们的 平台, 那你 就可以 获得 收益。 我 就要 连 你的 那个 支付宝 的 账号, 类似 于 这样的 一些 功能。
然后 我 看到 很多人 做 的 G P S, 它 其实 就是 人格化 的 聊天机器人。 它 可以 有 穆罕默德, 有 上帝, 其实 你可以 很 容易 的 去 建立 那些 过去 有 足够 语料 的 这些 历史人物 的 chat board。 甚至 可以 比如 elon musk 老子、 孔子 等等, 你可以 跟 他 对话。
这件 事情 其实 更 早就 发生 了, 就是 我们 之前 其实 聊过 的 一个 叫 character 点 A I 的 一个 网站, 它 其实 粘性 甚至 在 一度 超过 了 ChatGPT。 但 我 觉得 GPT s 这个 功能 出来 之后, 其实 对 character 点 A I 的 冲击 应该 是 巨大 的。 因为 我不需要 离开 我的 熟悉 的 平台, 我 就在 ChatGPT 里面, 我想 跟 谁 了, 我 就 搜 一下 或者 找 一下。 未来 会 上线 这个 GPT s 的 官方 商城。 那 现在 第三方 也 已经 有了 一些 商城, 帮助 你 很 好的 去 找到 你 想 找到 的 那些 GPT s。 这边 顺便 说 一下, 就是 GPT s 你 在 建立 的 时候, 你可以 选择 这个 GPT s 是一个 私有 的, 就是 only me 只有 你可以 访问 的, 还是 你 和 拥有 链接 的 人 可以 访问 的。 第三个 就是 public, 那个 就是 它。
未来 会 开放 的 一个。 所以 这里 其实 可以 总结 一下, 随着 GPT4有 很 好的 视觉 和 语音 能力, 它 把 整个 交互 的 门槛 降 得 非常低 了。 再加上 说有 各种各样 的 开发者 和 爱好者 进来, 过去 24小时 是 2000个。 我不知道 你 听到 这 期 节目 的 时候, 他 可能 会不会 破 万个, 是一个 成千 到 上万 量级 的 应用 商店 的 这么 一个 东西。
如果你 是一个 正常 的 白领, 你的 工作 是以 获取信息、 分析 信息、 创造 内容。 那 在 这 三件 事情 上, 这些 工作 其实 今天 绝对 是一个 效率 的 里程碑。 是的, 任何 一个人 今天 看一看, 如果你 今天 的 工作 是以 P P T、 powerpoint 和 excel, 你是 以 这 三个 东西 作为 基础 的那 基本上 今天 是一个 里程碑。
我 觉得 发布会 上 还 讲 了 一个 东西, 就是 他 能不能 帮 我 完成 一些 软件 的 操作。 这次 发布会 上 也 涉及到 这个 东西, 他 跟 一家 美国 的 一家 软件平台 叫做 Z E P I er 合作。 它 就是 类似 于 说 能够 让 这个 平台 他 去 读 你的 日历, 帮助 你 完成 一些 操作。 比如说 发邮件 和 发短信 给 对应 的 人, 或者 是 说 你 读 一个 文档 记录, 然后 自动 的 把 这个 文档 记录 里面 一些 结构化 的 东西 给 它 表格 梳理 出来。 他 就 试图 去做 这样的 事儿。 在 发布会 上 也 讲 了 这个 故事, 我 觉得 这个 是 更进一步 的。 这个 GPT 不 只是 在帮 你 获取 分析 信息 和 创造 内容 了, 他 已经 开始 帮你 完成 一些 工作 里 的 操作 了。
但是 事实上 这个 事情 我 今天 去 尝试 了 一下, 我 觉得 这个 事情 还没有 那么 好用。 比如说 我 今天 想 尝试 一个 事情, 我 给 了 他 大概是 我 原来 写 过 的 文章 里面 的 一些 记录。 然后 这个 文章 里面 可能 列举 到 123四五个人 的 情况, 纯文字 的 形式。 我 就是说 这 五个 人的 情况, 我 关注 哪几个 点? 你 能不能 把 这 五个 人 作为 数列, 把 我 关注 的 点 作为 横列。 你 给我 做 一个 表格 出来, 放在 我的 谷歌 的那 文档 里。 结果 这个 Z P L 我 就 发现 做 的 时候 很 麻烦, 他 要 不断 的 需要 你的 授权。 我 能不能 在 你的 文件夹 里面 生成 一个 文档, 我 能不能 在 你的 文档 里面 写入 一些 信息, 而且 写入 的 那个 过程 会 很慢。
所以 就是说 我 觉得 OpenAI 今天 讲 了 一个 很 好的故事, 接下来 ChatGPT 应该 是 能够 借助 它的 这种 plug in 和 这种 GPT s 的 能力, 它 能够 帮助 你 完成 一些 自动化 的 一些 工作 流程。 他 其实 不是 在 替 白领 提高效率 的, 他 开始 替 程序员 提高效率 了, 对 吧? 但是 事实上 这个 事情 今天 还 比较 难 做, 它 涉及到 不同 软件 之间 的 这种 打通 和 互联互通, 它的 这个 操作 还是 比较慢。
但是 大家 可以 想象 一下, 我们 今天 在 国内 所有人 用 的 都是 一些 叫做 什么 all in one 的 一些 办公 平台, 大 概率 逃不过 飞 书钉 钉 和 企业 微信 这 三个 平台。 当你 所有的 文档 和 所有的 日历, 包括 你 所有的 信息 都 是在 这个 平台 上。 这样的 时候 这个 平台 如果 他 推出 一个 A I 那个 时候 他 就 不 涉及 平台 和 平台 之间 的 互相 授权 了, 那 这个 软件 的 操作 就会 简单 很多。 所以说 我们会 看到 open I 现场 演示 的 一个 东西。 他 就 去 问 那个 chat board, 我 今天 哪几个 日程 是 有 冲突 的? 就 同一个 时间 我有两个 会, 他 会 跟 那个 chatbot 说, 我要 跟 哪个 会 的 主持人 说, 我 几点 几分, 我要 提前 走发 一个 邮件 给 他他 现场 就 演示 这个 东西。
这样的 体验, 我 觉得 未来 一旦 是 这种 集成化 的 办公 软件, 或者 是 操作系统, 或者 是 手机, 或者 电脑 的 操作系统 开始 接入 GPT, 那你 就可以 体验 到 这种 东西。 我 觉得 这个 是一个 非常 可以 期待 的 一个 未来。 你 会有 不同 的 agent 在 你的 电脑和手机 软件 里面 来 帮你 完成 这件 事情。 不是说 这个 GPT, 它 只是 帮你 完成 信息 和 内容 创作 的 这件 事情。
是的, 而且 这件 事情 真的 不会 太远 了。 在 过去 的 几个 月 里面, 我们 其实 看到 了 除了 OpenAI 以外 的 A I 的 生态 也是 在 爆发 的 状态。 不管 在 国内 还是 在 海外, 不管 是 做大 模型 的 创业 公司, 还是 刚才 nixon 提到 的 平台 级 的 软件公司, 钉 钉、 飞书、 字节、 阿里 等等, 他们 都在 做自己 的 大 模型 的 或者 是 应用, 或者 是 底层 各种各样 方面 的 突破。 甚至 是 硬件 厂商, 其实 也 不遗余力 的 在 A I 这个 领域 狂奔。
我们 看到 其实 高通 在 一个月 前 开 了 一场 高通 峰会。 在 夏威夷 它 里面 其实 就 不断 的 在 提到 他们的 新的 这些 芯片 在 端 侧 运行 大 模型 的 能力。 我们 刚才 其实 讲 的 很多 都是 包括 OpenAI, 它 其实 更多 的 是 云 测 的 能力, 就是 一个 超大 的 模型 在云端 能够 给你 提供 什么样 的 应用。 但是 我们 知道 很多 应用 需要 更 快速 的 反应, 更 安全 的 数据 保存。 所以 在 端 侧 能够 跑 一个 大 模型 这件 事情 就 变得 非常重要。 从 高通 的 峰会 上 他们 发布 的 这个 产品 的 节奏 来看, 其实 我们 未来 我们的 手机 或者 是 电脑 在 上面 跑 一个 70亿左右 参数 的 一个 大 模型 已经 是 现实 了。 大家 如果 买 这 一代 骁龙 8 je 3 je 3的第三代 的 骁龙 8的处理器 的话, 它 其实 就 已经 支持 端 侧 大 模型 的 计算 的 能力 了。
我们 也 看到 一个 rumor 说 苹果 在下 一年 2024年, 它 就会 把 siri 整合 进 一个 大 模型 的 能力 进去。 当然 根据 彭博社 的 mark 哥们 他说 的 说法, 到底 这个 是 端 测 还是 云 测, 还是 两个 结合, 目前 还没有 定论。 但是 我们 可以 看到 的 就是 未来 我们在 工作 生活 应用 在 各个领域 里面, 用到 大 模型, 用到 A I 能力, 几乎 是一个 确定性 的 事件 了, 而且 很 乐观。 因为 我们 看到 OpenAI 在 前面 跑 得 很快, 他 给 我们 展现 了 应用 的 场景 跟 可能性, 其他 的 厂商 可以 以 这个 作为 目标, 快速 的 跟进, 缩小差距。 我们 未来 就可以 用到 越来越多 的 各种 定制 化 的, 让 你可以 好好 提升 生产力 的 东西。
所以 可以 想象 这里 给 几个 实际 的 例子, 明年 所有的 各家 的 手机 的 相册 和 拍照 会 特别强调。 然后 他 一定 会有 一个 能力 是你 随便 跟 他说 一句话, 马上 就 帮你 换 一个 滤镜 和 换 一个 背景, 而且 是 定制 化 的。 几个 月前 高通 就 做了 一个 demo, 就是 他在 80毫秒 之内 你 给他 一张 图片, 他 就 利用 这种 stable diffusion 的 能力, 他 就 马上 把 你 这个 背景, 比如说 你 本来 是 面对 一面 墙, 马上 把 那 面墙 全都 换成 星星, 然后 这 一切 你的 数据, 你的 那个 手机 是 不需要 联网 的。
最 开始 先 使用 的 可能 还是 美颜, 对 吧? 可能 还是 各家 手机 的 这种 高端 的 拍摄 的 功能。 但是 接下来 就 会有 不同 的 开发者 让 这些 应用 做出 更 好玩的 东西 出来。
我 上个星期 周末 知道 有 一家 做大 模型 应用 的 公司, 在家 附近 开 发布会 叫 猴子 无线。 我 就 跳过去 听 了 一下, 我 发现 他们 做 的 东西 蛮有意思, 他们 就是 把 那个 大 模型 怎么样 融入 你的 工作流 这件 事情, 他们 做了 一个 平台。 然后 他们 就 在那 里面 做什么 事情 呢? 比如说 你是 一家 广告 营销 公司 对 吧? 你 要 生成 100张图片, 但是 你那 一百张 图片 你 又 要求 又 比较高。 比如说 你每 一个 图片 的 那个 logo, 我要 放在 同一个 位置 比较 准确, 他 就 通过 那个 纹身 图 的 模型, 再加上 一些 简单 的 类似 于 拖 积木 一样的 代码, 你 在 那个 软件 里 就可以 把 这个 东西 做出来。
然后 他们 还有一个 例子 也 让 我 印象 很 深刻, 就是 他们 跟 一家 医药公司 合作, 让 那 家 医药公司 去 非常 方便 的 去 分析 自己的 疫苗 的 数据。 所以 你 就 想象 就是说 以往 可能 这些 疫苗 的 数据 是 需要 一些 专业 的 医疗 的 研发 的 人员, 或者 是 一些 程序员, 对 吧? 他 写 一些 这种 代码 去 分析 去 整理。 现在 就是你 有 大 模型 去 读 了 那个 原始 的 实验 记录, 他 就 知道 怎么样 给你 输出 一个 表格, 或者 怎么样 帮你 整理 这些 数据, 这个 效率 就 很高 了。 他们 就 专门 做 这样的 A 镜头, 我 觉得 还是 蛮有意思 的。
总结 一下 就是说 接下来 其实 大家 可以 期待 的 就是 各种各样 的 agent。 它 不 只是 帮你 完成 信息 和 内容 的 创作 了, 还能 帮你 完成 一些 更加 具体 的 操作。 或者 是 说 原来 需要 开发 成 软件 功能 的 一些 操作, 都 会有 一些 平台 来 体现, 来 帮你 去做 这个 事情。
关于 这次 dave day 来说, 我 觉得 还有 几个 信息 需要 补充 哈那 我 觉得 也是 跟 这个 大 的 趋势 比较 相关 的。 比如说 这一次 ChatGPT 的 整个 A P I 进行了 大规模 的 降价, 直接 降到 原来的 3分之1。 或者 一 这个 降价 来说 的话, 就 意味着 原有 的 开发者 调用 这个 A P I 它的 成本 就 更 低 了。
所以说 这个 其实 也是 大家 除了 直接 用 ChatGPT 之外, 在 其他 的 一些 地方, 比如说 像 我 就 半年 之前 我 就买 了 两个 东西。 一个 是 每天 帮 我 读 微信 的 文章, 因为我 微信 文章 太多 了, 我 就 直接 丢 给 他他 帮 我 去 summary。 第二个 就是我 听到 所有的 博客 和 看 的 所有 视频, 我 都 可以 多 一个 链接 给他, 它 就会 自动 帮 我 去 总结, 然后 我在 中间 找 我需要 的 东西。 这 两个 服务 大概 花了 我 总共 一年 400块钱。 但是 接下来 随着 ChatGPT A P I 的 降价, 这 两个 服务 一定 会 长期 来看 一定 是 会 降价 的。 所以说 这个 对于 大家 越来越低 门槛 的 用到 这些 东西 一定 是 会有 好处 的。 是的。
第二件 事情 就是 open I 这一次 开放 了 一个 A P I 叫做 assistant A P I 就 助理 A P I 现场 演示 了 一个 类似 于 携程 一样的 旅游 网站。 那个 网站 接入 了 OpenAI 之后, 你 跟 他说 一句话, 说 我要 去 巴黎, 他 就 马上 告诉你 巴黎 的 十个 景点 是 怎么样, 第一天 去 哪 玩, 订 哪个 酒店, 门票 是 怎么样, 中间 的 车程 怎么样, 你 要不要 买 什么东西, 马上 就 一股脑 的 给你 推荐 过来 了。 这样的 A P I 显然 就是 为 携程 去 拿 美团、 大众点评, 他 显然 就是 为 这样的 一些 公司 准备 的。 所以说 接下来 很快 也有 可以 期待 大家 能够 用到 这些 智能 A I 的 地方。 它 不 只是 文心 一言 这样的 A P P。 未来 这些 A P P 会 出现 在 美团 里面, 会 出现 在 大众点评 里面, 会 出现 在 滴滴 打车 里面。 你的 生活 会 因此 而 带来 非常 多 的 便利。 这个 也是 这一次 的 开发者 大会, 没有 直接 的 秀出 demo, 但 我 觉得 会对 接下来 大家 的 工作 和 生活 会有 影响 的 东西。
所以 这就是 我们 针对 最近 半年 A I 的 一些 进度 的 一个 总结, 然后 刚好 也 赶上 这个 open head 的 def day, 所以 大家 听 完 这 期 节目, 希望 可以 经过 半年 之后, 大家 又 可以 catch up 一下 A I 到底 发展 成 什么样 了。 如果 大家 还没有 开始 上手 使用 A I 的 一些 能力 的话, 我 建议 大家 这个 时候 还是 要 尽快 开始了。 因为 现在 其实 有 很多 免费 的 途径, 包括 文心 一言 也 全量 开放 体验 了。 大家 如果 不 方便 玩 ChatGPT, 其实 文心 一言 也是 应该 是 目前 国产 大 模型 里面 品质 最好的 一个, 功能 最好。
功能 最多 的。 然后 阿里 的 那个 叫 通义 千 问 也 不错, 现在 也 支持 图片 的 识别。
在 这么 明确 的 趋势 下, 我 建议 还是 把 行动 力 做 起来, 我们 去 体验 一下 好不好?
对 阿里 的 那个 平台 是不是 前段时间 把 我们的 博客 拿 过去, 然后 就是 我们的 博客 在 阿里 那个 通义 听 悟 平台 上 现在 有一个 版本, 它 就是 找到 我们的 节目。 他 那 期 节目 它 就 自动 又有 音频, 又有 思维导图 全给你 了。
节目 的 最后, 因为 在 听 友 群 里面 大家 也 经常 讨论 说, 是不是 应该 读一读 这个 听 友 评论? 我们 上 一期 节目 是 聊 长寿 革命 这个 主题, 就 聊 如何 以 更 健康 的 状态 活 得 更 久 的 这样的 一个 话题。 那 期 节目 我们 收获 了 历史上 最多 的 评论, 然后 也有 很多 非常 精彩 的 内容, 我 觉得 正好 借 这个 机会, 我们在 这里 读 一些 听 友 的 评论, 我们 也 一起来 感受一下 大家 在 长寿 这件 事情 上 的 一些 想法。
来自 黑龙江 的 Angel 安琪 小精灵, 你 一生的故事 就是 在 不断 的 破除 你 小时候 对于 年龄 和 衰老 的 旧 看法。 这个 确实 也是 我们 这 一期 播客 最 想 让 大家 听到 的 内容。 我们 其实 是在 破除 大家 对于 衰老, 对于 死亡 的 一些 恐惧。 听 完 这 期 节目 你 就 会对 未来 你的 老年 生活 可能 会 产生 一些 不一样的 看法。
然后 一位 来自 新疆 的 菲 洛尔, 他是 学医 的 专业人士, 他说 今年 27岁, 我 本来 的 预期 是 能 活 90岁, 因为我 自己 学医。 肿瘤学 里面 有一个 观点 叫做 人 只要 活 得 足够 久, 100% 得了 癌症。 但 他 听 完 之后, 他 觉得 更有 信心 了, 觉得 能 活 更长 的 时间。 非常感谢 来自 医学 从业者 的 认可, 我 觉得 这个 特别 有 分量。
而且 他说 他 想 继续 做 终身 学习者, 投身 临床教学 和 各种 新鲜 事物 接触, 这个 也 非常 的 好, 这 也 符合 我们 一贯 的 宗旨。
终身 学习者 有 一位 听 友 叫做 棒糖 C, 来自 陕西, 我 印象 特别 深刻。 他说 我 今年 49岁, 是 一位 社科类 大学老师。 我希望 55退休 之后 申请 海外 留学。 他 想 去 日本 九州 学 日语, 太酷 了。 然后 他 觉得 说 80岁之后 我 就 可能 结束 学习 生涯, 学习 一些 园艺, 搞搞 什么 皮革 制作, 特别 正能量 特别 正能量。
来自 广东 的 林大 竣 他说 抱着 助 眠 的 目的 点 开, 结果 越听越 兴奋。 妈呀, 人均 寿命 120 的 日子, 那可真 是 太酷 了。 我想 我会 成为 初吻 里 苏菲玛索 外婆 那样的 老太太, 我们 也 希望 你可以 实现 你 这个 目标。
关于 本期 的 内容, 我们 也 希望 大家 可以在 评论 区 跟 我们 互动。 你 还想 听到 哪些 跟 A I 相关 的 话题, 或者 是 自己 在 最近 有没有 体验 一些 A I 有意思 的 产品, 也可以 跟 我们一起 互动 起来。 另外 我们 节目 有 很多 听 友 是在 苹果 播客 客户端 收听 我们的 节目。 好的, 如果你听到 这里 还没有 关闭, 希望 您 可以在 苹果 客户端 帮 我们 点 赞 评论 一下, 帮 我 打 一个 五星 好评。 因为 苹果 播客 相对 互动 没有 那么 方便, 所以 我们 也 看不到 太多 的 反馈。 然后 我们 回头 去 看一下 这 一期 节目 有 多少 个 好评 增加 进来, 谢谢 大家 的 支持。 好, 谢谢。 好的, 本期 节目 就 到 这里, 再见, 拜拜。
感谢 收听 脑 放 电波, 欢迎 在 苹果 播客、 小宇宙、 喜马拉雅 等 播客 客户端 搜索 脑 放 电波, 找到 并 关注 我们。 如果你 觉得 这 期 内容 对你 有所 帮助, 欢迎 你 在 评论 区 留下 反馈, 这 对 我们 非常重要。