用 声音。
碰撞。
世界 生动活泼。 Hello, 大家好, 欢迎来到 我们 今天 的 what's next 科技 早知道。 今天 的这 一期 有 一点点 不太 一样, 算是 我的 一个 小小的 尝试。 大家 都 知道 我们 上 一期 跳票 了, 其实 背后 一个 原因 是我 确实 是 生病 了。 然后 另外一个 原因 是 我在 为 这 一期 的 节目 做 准备, 准备 的 难度 比 我 预想 的 要 高了 不少。 好吧, 我 还是 蛮 期待 大家 听 完 这 一期 节目 的 一个 反馈 的那 希望 大家 能够 多多 给我 一些 建议。
好了, 下面 就是 我们 今天 的这 一期 节目。 最近 深度 伪造 名人 的 声音 视频 已经 被 玩坏 了, 不知道 大家 有没有 刷 到 过 这些 视频。 最近 我去了 很多 地方, heller swift 霉 霉 流利 的 在 讲 中文。 我 和 日本。 以及 郭德纲 和 赵本山 在 流利 的 说 英文 是 thank .
C C T V for this event。
在 选题 会上 大家 也 给我 抛出 了 非常 多 相关 的 一些 选题。 比如说 是 A I 诈骗 的 真实度, 现在 到底 是 什么样 的 一个 程度 了, 有 多 容易 能够 深度 伪造 一个人。 在 ChatGPT 出来 的 将近 一年 多 的 时间 里面, 人工智能 领域 其实 是 有了 爆发式 的 发展。 细数 这 把 双刃剑 的 另一面, 其实 也 在 蓬勃 的 发展。 不管 是在 国内 还是 海外, 一艘 A I 诈骗 就会 出来 非常 多 耸人听闻 的 信息。 A I 诈骗 成功率 接近 百分之百。 微软 发布 的 A I 声音 生成 工具, 只需 3秒钟 即可 模仿 人 说话, 十分钟 被 A I 换脸 骗走 435元。 You really example of how criminals can use technology to manipulate your own voice, or someone you love to pray on your worst fears.
对于 我自己 来说, 我 是不是 也要 给 家人 打个招呼 了? 毕竟 我 已经 录 了 百 来 期 播客, 我的声音 真的 是 到处 都有。 那 克隆 一个人 的 声音 和 视频 到底 有 多 容易? 成本 又是 什么 样子 的? 所以 我 还 真的 就和 我们的 后期 负责人 迪卡 一起 实验 了 几个 在 市场上 现在 免费 并且 公开的 产品。 这 几个 产品 分别 需要 我 提供 半个 小时 的 语音 素材, 以及 另外 一款 产品 是 英文 的。 他 让 我 读 了 对方 提供 的 大概 有 七十多个 句子, 大家 可以 听 下 这个 真实 程度。
您好, 为了 更好 的 爱护 您 的 车辆, 请 您 在 1到2个月 内 或 3000公里 左右 来电 进行 车辆 首 保 性 服务。 原本 很 简单, 拥有 一份 淡泊 兴致, 观 天空 云卷云舒, 品人生 起起落落。 Hi, i'm 对 welcome towards next podcast。 Today, let's talk about generating audio.
我在 办公室 拿出来, 也 同样 的 放给 了 我们的 团队 小伙伴 们 听。 大家 觉得 可以 打 个 70分, 他们 感觉 其实 蛮 像 我的。 但是 如果 真要 接到 这样的 电话, 他们 其实 并 不会 相信 是我 直接 打 给 他们的。 Today we're going to create an avatar that looks and moves like me.
华尔街日报 的 记者 joana stern 也 去 做了 一个 类似的 挑战。 他 先 去了 深度 伪造 公司 森 西亚 公司 在 纽约 的 一个 studio, 在 绿幕 前面 采集 了 自己 全身 多角度 的 形象 的 视频, 又 去了 一家 叫做 eleven labs 的 音频 深度 伪造 的 公司, 录制 了 大概 超过 一个多 小时 的 声音 的 音频。 但 在 完成 训练 之后, 他 挑战 24小时 之内 用 A I 克隆 的 自己 和 同事 以及 家人 交流。 I called her about her d 的, i just heard about w 那 结论 是 A I 女生 的 电话 成功 骗过 了 朋友 和 家人, 甚至 他 当时 用了 A I 的 声音 跟 采访 的 对象 也是 S N A P C A T C E O evan speer。 Hey.
do you know .
that A I 在 表露 了 自己是 A I 的 语音 之后, 艾文 speak 只是 表示 说 我 还 以为 你 今天 是 特别的 严肃。 朱安娜 的 语音 也 同时 骗过 了 她的 银行, 顺利 的 通过 语音识别 的 环节 进入 了 下一步 mAiling address。 Joana 但是 在 最后 一步, 他 失败 了。 他在 用 A I 虚拟 形象 跟 团队 进行 视频会议 的 时候, 因为 说话的 逻辑 跟不上, 无法 做 身体 的 动作 或者 是 手势, 所以 很快 的 就 被 识别 出来 了。 这个 成功率 已经 非常 的 令人 惊讶 了。 但是 对于 网 传 的 3秒钟 的 克隆 语音, 或者 是 只要 一张照片 就能 换脸 的 技术, 到底 真实度 有 多 高?
OK generally recording and I send you. 带着 这些 问题。
我 采访 了 我的朋友 A I 领域 的 科学家 Adrian keller 博士, 他 也是 在 A I 领域 的 连续 创业者。 另外 为了 方便 大家 的 收听, 我们 也 把 英文 采访 进行了 中文 的 翻译 与 配音。
If you wanted to do in an 首先 得 承认。
用 A I 来 生成 类似 于 真实 人声 的 声音 其实 挺 难 的。 因为你 需要 获得 某个 人的 声音 样本 之后, 才能 使用 技术 来进行 处理。 这个 过程 通常 需要 大量 的 声音 样本 才能 达到 真实的 合成 效果。 所以 仅仅 依靠 一小段 的 音频, 比如 你 在 社交 媒体 上 发布 的 语音, 想要 进行 真实的 复制 其实 是 不太可能 的。 但是 前一段 微软 团队 曾经 开发 过 一个 相当 高质量 的 语音 合成 示例, 所以 在 这种 研究 领域, 而 不是 大众 的 产品 领域, 你 确实 可以 发现 一些 A I 的 技术 能 从 相当 短 的 样品 中 合成 一段 相当 不错 的 音频。 如果 这个 声音 样本 越 独特, 那 复制 起来 也就 越 容易。 所以 假如 你 想 克隆 兔八哥 这样 著名 卡通人物 的 声音 就 相当 容易 了。 那 相比之下, 复制 一个 普通人 的 声音 就 没那么简单 了, 因为 普通 的 人生 几乎 没有 像 卡通人物 那样 具有 极容易 辨别 的 特征。
我 觉得 对于 那些 还。
在在 学术 研发 中的 A I 算法 来说, 几秒钟 的 样本 做出来 的 合成 语音 其实 已经 能 让人 信服 了。 但 这 也 取决于 你 想要 说服 谁 了。 假如 有人 自称 是你的 亲人 或者 是你 身边 的 朋友, 只要你 有 理由 怀疑 对方 的 身份, 那 被 A I 复制 出来 的 声音 大 概率 就 骗 不 找 你。 当然了 还有 在 一些 场景 中, 你 会 很难 确认 对方 是谁。 比如 在 电话 里 A I 的 合成 技术 其实 是 能 模拟 那种 声音 失 真的 效果, 这会 让 你 感觉 更 真实。 其实 在 未来 的 2到3年 里, 合唱 这种 高 仿真度 的 音频 差不多 可以 成为 每个 人都 可以 触手可及 的 事情 了。
那 当我们 接到 了 不太 确信 的 电话 时候, 有什么 方法 能够 快速 的 验证 呢?
Again, if you are something of the next 打个比方。
如果你 怀疑 正在 和 你 对话 的 是 A I 语音, 那么 你可以 引导 他 说出 一些 特定 的话, 从而 帮助 你 进行 真伪 的 判断。 同样 需要 引起 注意 的 是, 如果 没有 足够 的 声音 样本, A I 就 无法 准确 的 捕捉到 说话 者 的 个人 特质。 也就是说 一个人 其实 是 有 多种 的 表达方式 来 表达 相同 的 意思 的。 所以 其实 在 几秒钟 的 语音 片段 里, 那些 你的声音、 腔调、 嗓音, 甚至 是你的 生理 结构特征, 其实 在 某种程度 上 是 比较 好 被 模仿 的。 但是 要 准确 还原 一个人 说话的 习惯 和 方式, 就 需要 A I 进行 大量 的 样本 了。
What are talking about?
不过 说实话, 在 不远 的 未来, A I 在 这方面 会 做得 更 出色, 它 会 变得 更 擅长 像 人类 一样 自然 的 表达 自己。
市场上 像是 指 维纳 使用 的 深度 伪造 的 公司。 Synthesia 在 六月份 宣布 完成 了 由 assad 领 投 的 9000万美元 的 C 轮 融资, 公司 的 总 估值 达到 了 10亿美元。 节目 开头 让 Taylor swift 开始 说 中文 的 这个 公司 叫做 H Y Y J A N, 是 由 华人 创始人 创建 的, 也是 拿到 了 来自 I D G、 红杉 中国、 真格 基金 累计 近 千万元 的 投资。 但 在 深度 伪造 技术 快速 发展 的 同时, 其实 也有 不少 公司 竞相 开发 人工智能。
深度 伪造 的 探测器 有 一款 广泛 被 应用 的 工具 叫做 GPT zero, 号称 有 100万的 用户。 并且 他们 能够 快速 的 检测 文本 是 由 open N I 的 拆 GPTGPT3 或者 是 4, 或者 是 还是 谷歌 的 伴儿 生成 的那 据 纽约时报 的 报道说, 来自 哈佛大学、 耶鲁大学 和 罗德岛 大学 大概 有 六千多 名 的 教师 使用 了 这样的 一款 工具, 检测 学生 的 作业 到底 是不是 A I 生成 的那 对于 这些 探测 工具 我也 充满 了 好奇, 到底 它的 准确率 能有 多 高? 这个 问题 A 是 这么 回答 的。
i don't know this is a kind of useless.
因为 它 就像 在 玩 猫捉老鼠 的 游戏 一样。 因为 每种 工具 都在 不断 的 发展, 最终 都 希望能够 超越 另一种 工具。 如果 你的 孩子 在 这样的 学校 里, 我 强烈建议 你 让 他们 赶快 去 换 一个 学校。 因为 假如 一间 学校 让 你的 孩子 去 避免 接触 正在 发展 的 这些 A I 技术, 那 简直 就是 在 教育 他们 如何 在 劳动力 的 市场 上去 彻底 的 失败。 每 所 学校 特别是 大学 都 应该 竭尽所能 的 让 学生 们 去 及时 的 了解 和 掌握 这些 技术。 我 觉得 学校 可以 做 的 反而 是 提高 论文 写作 的 标准, 并且 告诉 学生 们 要 充分利用 A I ChatGPT 或者 任何 你们 能 获得 的 A I 工具, 去 完成 一篇 你 能力 范围内 最出色 的 论文。
虽然 agent 没有 正面 的 回答我 的 问题, 但 从 侧面 表达 了 他 认为 这样的 工具 现在 还是 比较 鸡肋 的那 我们 就 真的 对 A I 和 深度 伪造 创作 出来 的 不良 内容 没有 办法 了 吗? 所以 我 就 又 采访 了 一位 在 平台 工作 的 A I 算法 科学家 linder。
嗨 大家 你好。
如果 是从 我们 现在 的 这种 普通人 的 角度, 我们 怎么样 能够 分辨 出 不管 是 一篇 文章, 或者 是一个 图片, 或者 一个 声音, 他 到底 是 人工智能 生成 的, 还是 是 真人 在 后面 说实话。
我 觉得 这个 很 困难。 因为 我们 从 A I 的 这个 成熟度 来说, 文字 的 A I 你 让 A I 给你 写邮件, 或者说 你 写 一个 东西, 让 A I 给你 润色 一下, A I 的 能力 已经 比 80% 人 要 好了, 这是我 自己的 感受。 然后 你 会 发现 A I 写 出来 的 东西 很 有 礼貌, 对 吧? 他的 逻辑 很 顺畅 的, 它 很 标准。 我们 可以 说 这种 文本 是 比 80% 的 人 写 的 英文 要好, 但是 不 代表 他 写 的 这个 行为 逻辑, 他 这个 风格 是 坏 的。 所以 你 怎么 一眼 看出 他是 机器人 或者 人 写 的。 如果你 觉得 他 特别 礼貌, 比如说 他 不是 一个 土生土长 的 美国人, 他 可能 只有 六个月 的 英语 经验, 但是 他 他的 写 的 特别 好, 那 很有可能 是 机器 写 的。
当然 是 我们 现在 是 讨论 是 现在 的 这个 A I 技术。 我不知道 如果 让 你 展望 一下, 再 过 个 三年、 五年, 会不会 可能 这个 人眼 和 生殖 机器 我们 也 难以 分辨 了。
我 觉得 会 是 这样的, 计算机 上面 我们 存储 这个 信息, 我们是 用 最少 的 这个 bits 来 存储 文字 对 吧? 那 比较 多一点 的 就是 图像, 再到 视频。 对于 A I 来说 也是 一样的, 它 首先 是从 文字 开始 来解决 这个 问题。 好 他的 A I 已经 比 80% 也好 了, 那 到 图像, 图像 是不是 也会 比 80% 也好 呢? 我 觉得 已经 快 到了。 到 视频 可能 两年、 三年, 它 可能 也会 比 80% 的 要好。 它 一旦 过了 那个 80% 的 点 之后, 我 觉得 对于 一个 普通人 来说, 它 能不能 识别 就 已经 是 很 困难 的 事情 了。
因为我 觉得 之前 有 个 非常 有名 的 心理学 的 测试, 是 说 你 觉得 自己 比 全世界 的 人 长 得 好看 吗? 平均水平 来说, 但是 6%到60% 到 70人都 会说 我自己 比 50% 的 人 好看, 但 这是 不合理 的, 跟 A I 也是 一样的。 他 可能 会 觉得 说 我的 写作 是 80%。 但是 其实 如果 真正 有一个 量化 来说, 其实 你 并没有, 那你 已经 被 AI 打败 了。 你 在 被 A I 打败 的 情况下, 你是 不可能 去 识别 A I 的。
因为 它 比 你 更好。 现在 有 一些 工具, 我们在 现在 这个 阶段 是 可以 用 的 吗?
其实 是 有的, 不管 是在 工业界 还是 学术界, 大家 都在 做 这方面 研究。 我 觉得 现在 大部分 的 研究 还是 基于 文本 的 这个 测试。 比如说 像 之前 的 一些 测试 集 是 或者 一些 算法, 它是 做 一个 叫 我们 叫 binary classification, 就是 零 或者 一。 就是 我给你 一篇 文章, 你 来说 它 整篇 是 机器 生成 的, 还 是不是 机器 生成 的对 吧? 就是 或者 全部 是 人工, 或者 全部 是 机器, 那是 有 这样的 数据集。 但是 很快 之后 大家 发现 了 真正 的 A I 在 生活 用上, 或者 在 真正 的 用途 上, 它 不是 这样的 一个 行为 模式。 大家 会 用 它 怎么说呢? 会 是一个 文章生成 出来, 它 可能 是 一半 人工 一半 机器, 或者说 我人 写 一个 开头, 机器 给我 生成, 中间 我 再 写 个 结尾。
2022年 也会 有 一些 新的 基准 测试 集 出来 叫 real or fake 对 吧? 他 就是 做了 这样的 一个 事情, 他是 我 挑 一个 样本 出来, 然后 这个 样本 可能 有 十句话, 然后 第一句 话 是 人工 的, 从 第二句 到 第十 句 之间, 我 可能 在 某 一个点 是 机器 生成 的, 然后 往后 都是 机器 生成 的。 然后 你 会 用 这个 算法 去来 detect 或者 叫 鉴别 我们 在哪 一个点 上 这个 是 机器 生成 的。
但是 到 现在 为止, 我 觉得 大家 在 这个 数据集 上 的 表现 还 不是我 觉得 不能说 是一个 可用 的 状态, 还是 有 很多 的 错误 在。 因为他 太 像 了, 他在 很多 情况下 实在是 太 像 了。 所以 你 导致 魔法 打败 魔法 也是 一个 很 困难 的 道路。
所以 未来 这个 成功率 有可能 会 提高 吗?
我 觉得 是 会 的, 而且 还 大家 还是 需要 做 很多很多 的 研究。 像 我说 的 用 魔法 打败 魔法, 你 用 什么样 的 数据 去去 训练 这个 魔法? 因为 第一个 魔法 是 大 看 了 全网 的 数据 训练 出来 的那 你 想要 鉴别 全网 的 数据 和 真实的 人, 那你 就 需要 有你 要 给他 指示, 你 要 告诉他 怎么 去 鉴别 这个 事情。 我 觉得 还是 有 一些 路 要 走。 但是 我 看到 了 大家 其实 的 这个 表现 也是 在 不断 提升 的。 比如说 最 一开始 的 时候, 大家 可能 在 这 几个 测试 上 只能 做到 可能 20%、 30%。 然后 慢慢的 也会 变 来 变了 50%、 60% 对 吧? 那 大家 也会 慢慢的 提升。
但是 依然 给 到 我的 是一个 蛮 相反 的 结论。 他 觉得 比如 在 图像 生成 的 领域, 基本上 已经 很难 辨别 出 是人 做 的 还是 A I 做 的 了。
It's a little hard to say, right? These things are coming.
这个 很难说, 这些 技术 发展 的 太快 了。 如果说 是 静态 图像 而言, 我们 已经 做到 了, 实际上 并 没有想象 中的 复杂。 我 刚才 还 和 一些 朋友 辩论 网络 中的 某 张 图片 到底 是真的 还是 A I 合成 的。 我 觉得 在 这个 讨论 中, 似乎 没有人 能 说服 其他人 去 相信自己 的 观点, 所以 我 认为 像 Midjourney 这种 图像 生成 的 模型, 在 合适 的 情况下 可以 生成 与 现实 世界 那种 原始 照片。
几乎 没有 什么 区别 的 图像。
如果我们 指望 不上 各种 探测 A I 内容 的 工具, 那大 公司 特别是 平台, 大家 是否 有 技术 和 政策 去 发现 并且 禁止 不良 的 AI 内容 呢?
AI 不仅 帮助 很多 普通 的 创 或者说 我 更快 的 创造 更多更好 的 内容, 他 同时 也 帮助 了 一些 这些 我们 叫 sister 叫 abuser, 或者 去 分发 这些 不好 信息 的 人, 他 也 更快 的 去 制作 和 分发 这些 内容 了。 比如 像 他 以前 他 肯定 要 雇人 说 我要 捏造 一些 虚假 消息, 比如说 说 拿来 打仗 了, 但 其实 没有 打仗。 然后 他 要 去 雇人 去做 这个 消息, 然后 去 分发 这 一些, 这些 确实 很贵。 但是 现在 来说, 对 大家 来说, 它 可能 用 一个 GPT 或者 用 一些 图像 生成 的, 它 就可以 把 一些 人脸 合 过去, 或者 把 一些 打仗 的 照片 传过去。
对对对, 这次 这个 巴 以 冲突 其实 是 还 蛮 明显 的, 然后 还有 乌克兰 战争。
对的。 一方面 它是 可以 大量 的 生成 这些 不好 的 内容。 第二个 是 他的 这个 做 坏事 的 逻辑, 它 迭代 速度 也 变快 了, 你可以 把 它 想象 成 平台 和 这些 人 之间 的 关系, 是一个 警察 抓 坏人 或者 警察 抓 黑帮 的 这么 一个 逻辑, 对 吧? 那 大家 都在 迭代, 以前 的 时候 他 迭代 速度 可能 是 你 往前走 1米, 我 往前走 1米, 你 往前走 1米, 往前走 1米, 可能 是 一天 走 一步 对 吧? 那 现在 有了 A I 之后, 他 可能 一天 之内 走了 100步。 对于 平台 来说, 你 也 需要 在 一天 之内 走 100步去 抓住 他 这些 东西。
这个 东西 其实 是 永无止境 的。 因为 除非 有一天 达到 一个 程度, 说是 他 发现 他 没有 办法 轻易 的 去 制造 这些 消息。 或者说 他 制造 这些 消息 的 成本 要 远远 大于 他 制造 这些 消息 获得 的 收益, 他 才会 停止。 但是 总会 有人 去 要 去 找 平台 漏洞 去做 这些 事情。
因为我 跟 另外一个 朋友 聊, 他 觉得 现在 就是 他的 平台 抓住 他的 机制 有点 像是 catching game。 还是 现在 A I 的 创作 了 这些 可能 scheme 的 这样的 一些 内容, 它的 效率 和 它的 成本 是 非常 快 和 非常低 的。 所以 可能 现在 平台 还是 在在 往 上 在 赶。 对, 是 这 样子 的 一个 情况 是吗?
对的, 因为 对于 平台 来说, 他 需要 抓住 这些 scheme。 按照 传统 的 他 这 一套 逻辑, 他是 要 做什么 事情 呢? 比如说 这些 scheme 发生 了, 然后 你 就会 看到 一些 scheme 相关 的 指标, 就是你 平台 内 每天 都会 追踪 这 指标, 你的 这个 指标 就会 嗖嗖 嗖 往 上涨。 那 往 上涨 你 就会 去 发现 它是 为什么 网站 你 会 发现 原来是 这里 的 内容。 然后 这 一类 内容 就会 经过 人工 的 标注, 证明 它是 哪一类, 哪一类 违反 了 哪 类 的 规则, 或者说 可能 是 一些 新的 规则。 然后 你 需要 从 legal 的 角度 去 创造 这些 规则, 然后 让 人工 去 标注, 标注 的 数据 再 返回 给 机器 去 学习, 然后 机器 才能 抓住 这些 pattern。
这个 其实 是 需要 花时间 的, 包括 甚至 可能 有些 新的 pattern 出现 之后, 你的 legal 需要 active 力 的 去 制定 一些 新的 policy, 对不对? 因为你 制定 任何 的 policy, 对于 大 的 平台 来说, 你 不可能 说 我 制定 一个 policy, 我 限制 你 这些 部分 内容 的 分发, 然后 我在 内部 消化 就 完了。 你 制定 policy 你 可能 还需要 对外 去 沟通。 除非 是 一些 特别 紧急 的 情况, 比如说 跟 儿童 安全 相关 的, 或者 像 这次 以色列 巴勒斯坦 战争 相关 的, 可能 特别 紧急 的 或者 美国 大选 之类 的, 他 可能 会 move 的 更 快一点, 但是 总是 有一个 时间差。
明白, 我看 其实 像是 information 这样的 一些 媒体 渠道, 他 也 在 做 一些 猜想。 下 一轮 的 美国 大选 其实 也就是 一年 多 的 时间 了。 然后 平台 其实 在上 一个 周期 的 时候, 是 有 很多 的 没有 想到 的 事情 发生。 我不知道 这个 新的 一轮 的 这样的 一个 style 平, 他 现在 在 想 些 什么。 就 从 你 现在 可能 观察 到 的。
选举 这个 事情, 其实我 觉得 所有的 这个 社交 平台, 大家 都是 还是 挺 敏感 的。 因为 它是 很 政治化 的 一个 事情, 尤其是 在 上一次 或者 上次 总统大选 的 时候, 大家 发现 了 大量 的 虚假 信息 的 宣传。 然后 一些 有 组织 的 黑客 行动, 可能 会 导致 一些 选票 情况 的 不 均衡, 或者 是 一些 不公平 的 情况 发现。
我 觉得 几个 角度。 第一个, 现在 的 社交 平台, 大家 一般 都 会有 一个 专门 的 叫 news team。 他们 专门 负责 跟 新闻 相关 的 内容 在 这个 平台 上 的 分发, 这个 内容 的 收集, 这些 内容 的 标注, 它 会 来 控制 这个 news 的 quality。 然后 第二个 是 大家 现在 做 的 越来越多 的 是 就是 我们 要 鼓励 更多 的 可信赖 的 信息 源头。 比如 像 一些 认证 过 的 一些 新闻 的 频道, 比如说 华尔街日报, 纽约时报, 或者 一些 当地 比较 有 知名度 的 一些 报纸 或者 社交 媒体。 这些 可信赖 的 新型 拳头, 它 就会 可以 这么说, 在 内部 它 打分 会 更高 一点。
然后 第三个 是 我们 之前 在 之前 的 一轮 的 或者 两轮 选举 之间, 我们 发现 像 这种 假新闻 在 大规模 的 情况 下都 是 有 组织 的。 其实 你是 可以 通过 这个 社交 媒体 的, 我们 叫 social network。 对, 就是 你可以 通过 图 网络 来进行 追溯 的。 一般来说 像 这些 埃 批 之间 或者 这些 账号 之间, 它是 有 一定 的 联系 的。 比如 它 会 互相 转发, 他 会 点 赞, 然后 他 会 在 某个 时间 有 一些 行为 模式 的 相似性。 那 这些 通过 这些 social network 的 这些 tracking, 我们 也是 可以 把 它们 做 一个 聚类, 然后 进行 一个。
整体 的 打击 的。 其实 今年 各 大 平台 官方 确实 出台 了 一系列 的 措施。 比如说 是 欧盟 通过 了 人工智能 法案。 在 今年 的 三月 tiktok 更新 了 社区 指南, 强制 要求 创作者 在 任何 逼真 的 场景 中 公开 A I 的 使用 情况。 到了 七月份, meta、 微软、 google、 OpenAI 和 亚马逊 在内 的 七家 领先 的 科技 公司, 都 向 白宫 自愿 承诺 对 A I 生成 的 内容 进行 标记。 九月份 google 宣布 从 11月 中 开始, 政治 广告 中 使用 的 任何 人工智能 生成 的 内容 都 要在 平台 上 做出 声明。 平台 虽然 出台 了 这么 多 的 政策 来 监管, 但 为什么 没有 说 我们 统一 一起来 制定 一个 A I 生成 的 标准, 或者 是 类似 水印 一样的 探测 机制, 这样 生成 的 内容 就 更容易 被 检测 出来 呢?
我的 理解 是 现在 行业 内 可能 大家 没有 一个 统一 的 说 所有人 联合 起来, 我们 要 做 这个 事情。 因为 现在 大家 所有人 的 目的, 首先 是 还是 需要 增长, 就是 大家 推广 自己的 A I 的, 大家 还是 在 攻城略地 的 状态。 所以 一般 在 这种 求 增长 的 阶段, 大家 不太会 说 我 坐下 来 谈一谈 这个 安全 的 问题, 或者说 我们 坐下 来 搞 一个 协议。 那个 时候 一般 是在 战争 结束 之后 说, 你的 地盘 我也 抢 不动 了, 我的地盘 你 也 抢 不动 了。 好, 大家 再来 聊 一 聊 做 一个 联盟。
这个 太 大实话 了。 大 平台 寻求 增长 可以 理解, 那 普通 的 A I 创业者, 他们的 逻辑 又是 什么样 的 呢?
我 觉得 这是 硅谷。
的 一个 特点。 在 科技领域 里, 我 可能 和 其他 的 技术 爱好者 一样, 会 被 认为 是一个 坏人。 但是 硅谷 的 文化 就是 坚持 的 越多, 优秀 的 技术 越好 这样 一个 态度。 其实 你的 产品 可能 会 以 某种 负面 的 方式 被 用到, 但 如果 他 也能 展示出 有 价值 或者 是 有 积极 一面 的话, 那么 就 应该 继续 被 发展 下去, 并 努力 通过 寻找 其他 的 方式 来 抑制 它的 消极影响, 而 不仅仅是 去 回避 这项 技术。 因此 在 硅谷 我们 非常重视 创造力, 对 创造力 和 技术创新 的 热爱, 无论 对错 都 远远超过 了 其他 的 顾虑。
这里 又 回到 了 技术 工具 论, 我们 可以 用 技术 做好事, 也可以 用 技术 做 坏事。 再 回到 我们 做 这 期 节目 的 初衷, 我们 普通人 怎样才能 保护自己 呢? 特别是 像 我 这样 在 互联网 上 有 很多 自己 音视频 的 个体。
我 觉得 可能 对于 公众人物 来说, 这个 是 不可避免 的。 因为我 去 搜 linked in, 我 可能 会 搜 到 你的 照片, 我会 收到 你的 历史记录, 这 是你 自愿 公开的。 就算 李英 不让 我 去 下载 你的 数据, 我 也可以 把 你 领 英 的 数据 截图 下来, 或者 我在 电脑 上, 拿 鼠标 过去 把 这个 数据 copy 下来。
这也是 不可避免 的。 可能 没有 A I 这个 事情 也是 可以 的, 只不过 现在 这个 更容易 了 而已。
对, 或者说 其实 有 像 之前 就算 没有 A I 它 也可以 大规模 的 下载 你的声音。 比如说 它 可以 写 一个 数据 爬虫, 然后 他在 youtube 上, 在 podcast 上 跟 你的名字 答案 相关 的, 然后 跟 生动活泼 相关 的, 我 都 下载 下来, 然后 他 自己 在 人工 过滤 一遍, 或者 是 他 都 可以 做。
确实 是的, 我 以及 身边 不管 是 海外 还是 国内 的 朋友, 每天 几乎 能 接到 几十个 未知 号码 的 骚扰电话, 邮件 更是 不计其数 了。 AI 也 只是 让 他们 成本 降低 了, 那 可能 提高 每个人, 特别是 年长 的 家人 对 新的 技术 的 认知 和 警觉, 才是 我们 能够 做 的。 对于 音频视频 的 诈骗, 我们 现在 要 做到 完全 的 实时 的 沟通, 其实 还是 漏洞百出 的。 只要 沉着 冷静 的 应对, 其实 就 能够 发现 破绽。
通常 来说, 如果我们 想 渲染 一句话, 那 渲染 的 时间 会 比 这 句 话 的 总长度 要 长 10到100倍 的 时间。 举 个 例子, 如果你 想 渲染 2秒钟 的 A I 音频, 那么 你 至少 需要 20秒的 时间 能 达到 一个 相对 差强人意 的 效果。 但是 你 需要 200秒的 时间 才能 达到 一个 相对 高 的 质量。 所以 目前 这种 实时 交互 的 A I 语音 还是。
很难 实现 的。 Hundred times faster if you want to get high quality results.
好了, 今天 的 节目 就 到 这里 了。 最后 我 用 agent 的 一段话 来做 今天 节目 的 结尾。
这 句 话 不是我 写 的。
是 我在 网上 看到 的。 它是 关于未来 的 真实世界 和 虚拟现实 完全 混淆 在一起 的 一段 内容。 他是 这么说 的。
The year is twenty thirty dickery art is so realistic, literally anything could be cake. The uncertainty has grip the world in fear. I go to hood my wife for comfort. SHE is cake.
It's brilliant.
节目 最后, 我们 正在 为 关注 工作 机会 的 伙伴们 同步 一则 招聘 信息, 生动活泼 最近 开放 了 节目 营销 和 商业化 项目管理 的 全职 岗位, 详情 可以在 节目单 集 介绍 中 查阅。 同时 我们 也 继续 欢迎 有意 成为 节目 监制 或者 制作 人的 伙伴 加入。 如果你 对 商业 科技 内容 创作 感兴趣 和 有 经验 的话, 想 在 声音 领域 有 更多 的 探索, 就 快 来 通过 H R F 升 F M 到 C N 与 我们 联系。
这 期 what nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G at 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。
如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是在 公众 号 文章 中 扫 码 添加, 或者 是 公众 号 后台 回复 科技 早知道, 即可 获取 邀请码。 期待 你的 加入, 我们 下期 见。