We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode S6E44 | 大企业为什么都在聊绿色计算?

S6E44 | 大企业为什么都在聊绿色计算?

2022/12/30
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
何征宇
顾荣
Topics
Diane: 云计算和大数据的高速发展导致能源消耗急剧增加,大型数据中心能耗占全球电力消耗的1%,碳排放的2%,且大部分耗电被无效消耗。大厂纷纷推行绿色计算,旨在通过提升软件和硬件效率来减少排放、降低成本。 何征宇:绿色计算涵盖数据中心选址、硬件设计和软件技术等多个方面。从能源产生到最终算力利用,存在多环节损耗,中国数据中心算力利用率仅为6%-12%,大量能源被浪费。通过软件优化,可以大幅提升算力利用率,例如从10%提升到40%甚至60%以上。Google通过完整的软件栈、良好的基础架构和团队协作文化实现了高算力利用率。绿色计算的核心是追求更低能耗、更高效率,以支撑未来科技发展。国内公司在软件层面优化方面有很大空间,但需要管理层重视和具备相应的技术能力。 顾荣:社会全面数字化导致对计算设备和数据中心的需求激增,能源消耗快速增长,节能减排和绿色计算技术变得迫在眉睫。服务器即使空闲也需要耗电维持基本状态,导致算力利用率低。软件层面优化可以通过弹性计算和资源匹配等技术手段实现,例如云原生分时调度技术。中小企业由于优先级不高和技术门槛等原因,在绿色计算方面的参与度较低,需要加强人才培养和技术推广,并提供更易于接受的解决方案。 何征宇:算力构成正在发生变化,未来将向服务化、AI大模型和硬件创新方向发展。弹性计算技术是未来值得关注的技术趋势,它能够快速感知和响应资源需求,提高资源利用率。绿色计算相关的节约成本的商业模式更容易被中小企业接受。未来绿色计算领域可能出现新的创业机会,例如对企业进行绿色评估。

Deep Dive

Chapters
绿色计算是提升软件和硬件工作效率,从而减少排放、降低成本并提高效率的环保型模式。由于云计算、大数据快速普及,能源消耗惊人,且算力利用率低,绿色计算成为迫切需求。
  • 全球云计算市场规模增长迅速,能源消耗和碳排放量也随之增加
  • 大型数据中心能耗占全球电力消耗的1%,碳排放的2%
  • 中国数据中心2022年耗电量达2000亿千瓦时
  • 算力利用率低,仅为6%-12%
  • 数字化转型和疫情加速了对算力的需求,导致能源消耗快速增长

Shownotes Transcript

用 声音。

碰撞。

世界 生动活泼。

Hello 大家好, 我是 丁丁, 欢迎 收听 全 新一集 what next 科技 早知道。

Hello 大家好, 我是 科技 早知道 的 刘灿。 在 2022年 的 最后一周, 我们 选择 再加 更 一期, 然后 跟 大家 聊 一 聊 一个 非常 硬核 的 领域 是 云计算 和 大 数据。 但是 这一次 的 视角 会 比较 特别, 我们 想 聊聊 如何 改善 算 力 能耗 这样 一个 问题。

根据 I D C 的 报告, 在 过去 的 15年, 全球 云计算 的 市场 规模 是从 零增长 到了 2021年 的 7050亿美元。 那 到了 2025年, 这个 数据 就会 超过 1.3万亿。 随着 云计算 大 数据 的 普及 速度 加快, 它们 所 对应 的 电力 消耗 其实 是在 惊人 的 增长。 现在 大型 数据中心 的 能耗 可以 占 到 全球 电力 消耗 的 1%, 还有 全球 碳 排放 的 2%。

所以 某种程度 上 来说, 这些 跟 数据 密切相关 的 行业, 其实 都 可以 算作 是 能源消耗 型 行业。 在 上个月 爱尔兰 还 出了 一个 非常 有意思 的 新闻。 他说 当地 的 数据中心 的 电力 消耗 其实 已经超过 了 爱尔兰 所有 农村 地区 的 电力 消耗 总和。 而 这 里面 最 麻烦 的 问题是, 这些 耗电 的 数据 其实 大部分 是 被 无效 消耗掉 的。 所以 最近 几年 大厂 像 蚂蚁、 华为, 或者 是 海外 的 英伟 达、 谷歌、 微软、 英特尔、 苹果, 他们 几乎 都在 推 绿色 计算。 所谓 的 绿色 计算 对 这些 企业 来说, 其实 就是 通过 提升 他们 软件 和 硬件 的 工作效率, 来 实现 减少 排放, 还有 降本增效 这样的 双重 目标。 这样 可以 一步一步 的 去 解决, 他们 现在 高算 力 等于 高功耗 的 这样 一个 问题。

前几年 海外 的 企业 它 都是 围绕 着 硬件 来做 的。 就 比如说 像 微软 的 matic 项目, 他们 在 2018年 就 到 苏格兰 的 海底 去 建 自己的 数据中心。 而 谷歌 之前 也是 许下 一个 承诺, 说 要在 2030年 之前 去 实现 它 数据中心 百分之百 无 碳 运作 的 这样 一个 目标。

国内 的 大厂, 这几年 他们的 思路 是 围绕 着 软件 来 推进 的。 在 2022年 度 的 中国计算机大会 C N C C 绿色 计算 论坛 上, 我们 就 看到 了 蚂蚁 集团 所 分享 的 绿色 计算 大赛 它的 比赛结果。 这个 参赛 人员 里面 其实 有 来自 华为、 字节 跳动、 阿里巴巴 这些 大厂 的 人。 他们 很多人都 从 软件 的 角度 出发, 给出 了 当下 应该 如何 去 解决 国内 目前 这个 算 力 利用率 过低 的 问题, 有 什么样 的 解决 方法。 而 中国 信通 院 之前 是 有一个 测算, 到了 2030年, 中国 数据中心 的 耗电量 会 超过 3800亿度。 国内 的 很多 大企业 其实 现在 都在 思考, 我们 有没有 一个 方法, 即便 算 力 它 会 随着 互联网 与 A I 普及 到 社会 的 各个 角落, 这些 企业 也 能够 做到 让 电力 的 规模化 消耗 是 可控 的那 这 期 节目 导演 他 就 邀请 到了 蚂蚁 集团 绿色 计算 的 负责人 何 征 宇 和 博, 还有 这场 比赛 的 评委, 也是 南京大学 的 副研究员 顾荣。 一起来 聊 一 聊 当下 的 这些 海内外 的 大企业, 都是 怎么 在 做自己 的 绿色 计算。 欢迎 收听。

为什么 可能 在 这 两年 绿色 计算 在 科技领域 其实 是 被 提 上 日程 了。 我想 首先 这个 问题 还是 请 顾 荣顾 老师, 先 帮 我们 来 讲解 一下, 来 帮 我们 来 聊 一 聊。

这个 我 觉得 其实 有一个 背后 的 一个 逻辑 是 这样, 其实 我们 也可以 看到 水 的 大概 到 2010年 往后, 过去 这个 十年 里面, 咱们 很多 也 在 数字化, 咱们 整个 社会 全面 的 数字化。 比如说 这个 智能手机 的 产生, 我们 多了 很多 A P P, 或者 我们 上面 的 应用 越来越 丰富。 这个 时候 我们 人类 的 社会 很多 行为, 也 很多 数字化 的那 疫情 也 倒逼 我们 很多 事情 必须 要 放到 线上。 这个 事儿 就会 使得 我们 对 这个 计算 设备, 特别 对 数据中心 的 这些 是 使用 需求 更大。 增大 之后, 使得 我们 对 能源 的 消耗 也 非常 的 在在 快速 的 增长。 也有 一些 公开的 数据 可以 看到, 比如说 中国 的 数据中心 的话, 是 公开出来 数据 是 2000亿千瓦时, 就是 去年, 所以 这个 还是 很 增长 很快 的那 这个 时候, 我们 去做 一些 节能减排, 另外 一些 绿色 计算技术 已经 变得 非常 迫在眉睫 了。 我们 认为, 当然 这个 在在 全世界 范围 也是 一样的。

我想 先 从 两位 的 背景 我们 来 讲一讲, 大家 都是 什么时候开始 关注 到 这个 绿色 计算 的。 我不知道 这个 蒸 云, 因为 一直 是在 这个 行业 里面。 之前 我记得 您 跟 我 讲 过, 您 是在 湾区 的 google, 然后 我不知道 您 是 什么时候 关注 到 这个 绿色 计算 的 这样的 一个 事项 的?

我 觉得 我 关注 还是 比较 晚 的, 因为 是 回国 之后, 然后 就 回国 加入 蚂蚁。 我 18年 回国 加入 蚂蚁, 19年 可能 开始 关注 这个 事情, 但是 那个 时候 就 恍然大悟, 其实 当时 在 google 我是 在 内核 组, 然后 当时 我 加入 的 时候, 我 实习 在那 就 11年 的 时候, 其实 我在 google 实习 的 时候 就有 个 realization 的 一个 项目, 还 拿了 一个 公司 内部 的 大奖。 你 今天 回想起来, 那个 时候 其实 跟 绿色 计算 是 非常 相关 的。 因为 那 后面 几年 google 就 宣布 这个 碳 中和 目标 等等等等, 我 后来 才 反映 到, 原来 碳 中和 目标 原来 跟 计算机 这个 操 系统 内核 也有 关系。 但 最终 我们我们 说 绿色 计算 这个 词 可能 是 比较 晚 的。 但是 事情 我 估计 从 那个年代 开始, 从 十年 前 开始 其实 就有 了。

好像 顾 老师 是 更 早 一些 就 关注 到了 这个 绿色 计算。

是的, 我们 因为 在 学术界 做 一些 研究, 我 最早 其实 是 从事 大 数据系统 相关 研究 的。 就是 可能 很多 朋友 也 听 过 像 hadoop bag 这些 非常重要 的 大数 处理 技术。 最早 的 时候 我们 主要 用 它 是因为 当时 很多 问题 没法 解决。 就是 它 hadoop, 特别是 hadoop 主要是 把 这样 一些 大口 海量 数据处理 的 问题, 把 它 从 没法 做 变得 可以 做。

然后 到 8个阶段, 咱们 很多人 关注 的 是 怎么样 做 的 更快。 紧接着 其实 我们 也 关注, 因为 同样 这是 有一个 我 感觉 有点 对我 的 一个 问题, 一个 是 兄弟 问题, 算是 怎么样 能够 做 的 更 高效、 更 节能 等等。 这个 时候 大概是 在 1415年 左右。 其实 我们 当时 还没有 特别 提到 说 节能, 而是 怎么样 讲到 一些 扫描 一些 资源, 能够 达到 一样的 效果, 少 一些 节点, 少 一些 内存 什么的。 对, 所以 这个 是在 这个 上面 技术 上面 的话 是 有些 挂钩。

我 觉得 是不是 咱们 先 给 大家 先 科普 一下, 我们在 讲 绿色 计算, 它 其实 包括 一些 什么东西, 它 下面 又 细分 一些 什么 方向 的 一些 科技 或者 技术。

日式 计算 其实我 觉得 它是 一个 很大 的 一个 范畴 和 理念, 也可以 具体 描绘 到 一些 很小 的 技术细节。 然后 大 的 方向 的话, 因为 我们 经常 现在 目前 说 预测 计算。 就是说 广义 上 来看 的话, 其实 很多, 而且 不 限于 咱们 这个 数据中心。 甚至 我们的 这个 个人电脑 上 也会 强调 怎么样 节能, 怎么样 的 屏幕 亮度 等等, 这样 低碳 等等。 我们 现在 主要 关注 的 大家 提到 预测 计算, 还是 指的 数据中心 云 计算中心 的 事儿。 因为 它的 那个 数 流量 耗电量 也是 最 也是 也是 目前 来看 是 最大 的。 在 这个 I T 这个 里面 来, 涉及到 这个 有 几块, 我 观察 到 有 三块 可能 不完全 全面。

第一块 就是 因为 我们 数据中心 很大 的 一块 的 电能 电量 的 消耗 是在 这个 智能 方面。 因为 计算机 它 运转 起来 会有 很多 这个 也 需要 散热。 首先 一个 比如说 机房 的 建设, 我 机房 怎么样 建设 的 更 合理、 更好、 更 通风? 甚至 我要 把 一些 地方 把 它 放到 通风 性, 或者 有有 自然 气冷 的 山洞 里面, 或者 草原上 等等 这种 通风 性 更好 的 地方 啊不要 放 那种 热岛 城市, 这个 是 选址 的 这些 建设。

第二个 就是我 觉得 硬件 层面 的 设计。 这 整个 机架, 整个 机柜, 或者 一个 单 我 一个 刀片 的 服务器 里面 的 怎么 设置 的 更 合理。 就是 前面 有 一些 开源 的 联合 的 项目 叫 open computer, 而且 也是 很 关注 这 一块, 这个 是 硬件 的。 我 觉得 一些 设计 和 概念, 它 其实 每一款 处理器, 每一款 自己 做 内存条 的 这些 厂商, 他们 也很 关注 这 一块 它的 东西 的 功耗。

最后 一块, 也是 近些年 兴起 的 比较, 我 觉得 发展 的 刚刚 应该 是 很多人都 把 目光 投上去 了, 而且 正在 发展 如火如荼 的这 也是 跟 咱们 这次 大赛 还是 有点 关系 的。 就是 相关 的 软件技术。 那就是说 如果说 我 这个 机房 已经 定 好了, 对 吧? 我 这个 硬件 已经 架构 什么的 也 已经 确定 了, 这个 我 个人 比较 看好 第三块。 因为 第一个 是什么 呢? 就是说 它 跟 原来是 正交 的对 吧? 他 不 不要 不需要 伤筋动骨。 第二个, 现在 我们 已经 有 很多 存量 的 这个 数据中心 了, 可能 也 没法 动。 第三块 我 觉得 也 比较 重要, 所以 蚂蚁 这次 出 这个 题目, 我 觉得 也 还是 蛮 好的。 我就是 比较 概括 的 说 一下, 何 博士 可以 看 多 补充, 谢谢。

对 郭 老师 我 觉得 讲 的 那个 跟 我们 其实 思路 是 一致 的, 就是 我们 内部 也 系统 的 分析 过, 比如说 算 力 是 怎么 产生 的, 我们 说 算 力 怎么 产生 的, 其实 上 还要 从 能源 的 角度 来讲。 因为 说 绿色, 其实 大家 也都 知道, 肯定 是 跟 我们 这个 地球 上 有限 的 能源 是 相关 的。 知道 的 就是说 我们 可能 有 各种, 比如说 火电, 或者说 水电 等等, 还有 就是 新能源, 或者 就是 要 可 再生能源。 国家 也 在 使劲 的 大力发展 这块, 包括 各种 政策、 标准 等等。 这个 地方 其实 上 就是 几个 环节, 就是说 从 能源 产生 电力, 然后 电力 到 硬件 产生 算 力, 包括 加上 软件, 一部分 长成 这个 算 力, 那不 看 不知道, 一看 吓一跳。 就 是从 能源 到 电力, 大家 也都 知道 我们 一直 讲 这个 发电, 用 火电 等等, 不 环保。

这 里面 其实 是 有 很大 的 一个点, 其实 是 有 损耗 的。 就是 比如说 百分之百 的 能源 能 产生 多少? 能 真正 的 去 产生 最后的 电力 的 瓦 数 跟 消耗 能源 到底 什么 比例? 我们 看 了 一下, 其实 行业 里面 就是 这个 损耗 可能 最多 的 可以 达 70%。 然后 你 又 再 通过 电网 的 传输, 可能 又 再 损耗 10%。

然后 电力 到了 刚才 那个 顾 教授 讲 的 这个 数据中心 这块, 数据中心 这 肯定 是 我们 最终 从 算 力 角度 来说 是 大头, 从 整个 社会 的 角度。 那 这 里面 其实 是 通过 冷却, 通过 供电, 配电系统, 然后 最终 到达 服务器 的。 真的 是在 计算 那个 单元 上 的 整个 的 损耗 下来, 可能 能 损耗 掉 80%。

导致 后面 的 80%, 就是 100分的 能源。 到了 这块 其实 就 只有 1%、 2% 了, 就是 到 硬件 这块。 然后 不幸 的 是, 这 1%、 2%, 其实 从 中国 国内 的 情况 来讲 的话, 其实 大致 大部分 的 这个 计算资源 其实 是 闲置 的。 就 真正 利用率, 从 利用率 的 角度 来讲 的话, 硬件 的 利用率 可能 只有 6到12。

就是 前段时间 我 和 全员 是在 中国 算 力 大会 上 披露 的 一些 数据 意味着 其实 我们 大量 的 能源 其实 是在 数据中心, 或者说 在 算 力 供给 的这 条 链路 上 是 被 浪费 掉 的。 我 觉得 这是 我们 一个 行业 或者 是一个 社会 的 一个 大 的 问题, 刚才 郭 教授 前面 也 举 了 个 例子。 但是 实际上 来讲, 我们 今天 讲 中国 的 这个 双 碳 战略, 讲 这个 碳 中和、 碳 达峰 的 这个 问题。 那 本质 上 这个 问题是 我们在 要 发展 的 过程中, 怎么样 极力 的 要 降低 我们的 能源消耗, 而 现在 我们 其实 上 我们 说 我们 要 数字 经济, 对 吧? 数字 经济 离不开 我们 刚才 讲 的 这些 算 力 的 问题, 对 吧? 硬件 软件 算 力 这个 问题, 我们 现在 还没有 完全 数字化 没有 完全 数字化, 已经 整个 I C T 产业 高层 的 报告 是 说 整个 I C T 产业 其实 已经 占 到 全球 碳 排放 的 3.5% 了, 我们 还在 一个 快速 的 增长期 两年 前 是 2%, 这几年 就 翻 了 一倍 了 快。 所以 这个 数字 是 比较 吓人 的, 所以 这也是 这个 问题, 也就是 证实 绿色 计算 要 去 解决 的 问题。

顾 老师 其实 我们 之前 在 钱财 的 时候, 其实 聊到 为什么 只有 10% 的 这样的 一个 利用率。 其实 是 现在 就 刚刚 郑宇 也 讲, 其实 是 我们 国家 大概是 6% 到 12%, 对 吧? 其实 可能 很多 是在 10% 的 这样的 一个 数字。 就是 为什么 是 这个 10% 的 这样的 一个 数字? 它它 在 行业 里面 或者 在 整个 在 云计算 里面, 它是 一个 什么样 的 一个 状态? 就 为什么 只是 这么 一点点, 我们 为什么 提 不 上去?

其实 你 刚刚 说到 的 可能 是 说 后面 一段, 对 吧? 就 更多 的 就是 我们在 一个 计算机 这个 里面, 服务器 里面, 我们 运行 我们 处理 我们 这个 事儿 的 时候, 而 我们 可能 能够 比较 满满 负载 的 去 运行 一些 算 一些 东西, 我们 C P U 设备, 然后 和 我们 不做 任何 事。 其实 并没有 增加 百分之百 的 这么 一个 电能 效率, 可能 只 增加 了 12% 左右。 这个 也是 是 上次 就 刚刚 何 博士 说 了 一个 中国 算 力 大会 上, 吴克群 院士 也 说到 这里。

在 其他 地方 我们 也 听 过 其他 类似的 报告, 也都 有的 不太熟悉 计算机 的 模型 的 同学 可能 听起来 有点 奇怪, 对 吧? 按 道理 来说, 我 觉得 应该 是 就像 我 去 买 什么东西 一样。 我不 做什么 事 我应该 不 花钱, 我 做事 我要 买 什么东西 我 才 花钱, 我 不买 我不 花钱。

但 在 计算机 的 模型, 它 不完全 就是这样 的。 因为 我们 服务器 开始 里边, 它 正常 它 就要 去 耗电 的。 比如 它 得 维持 那个 内存 要 通电, 对 吧? 这样 你 随时 来 访问, 包括 我们 C P U 它 一直 要 保持 的 一个 状态, 虽然 它 不要 这个 百分之百 的 赚 满。 还有 就是 我们 其他 的 硬盘 也 在 转 的 等等等等。 这些 东西 其实 都是 耗电 的。

打 一个 比方, 打 个 例子, 就像 这 相当于 就是 我们 一个人 一样, 我们 一个人 比 我们 现在 在那边 坐坐 着, 对 吧? 然后 不管 我们 今天上午 或者 一天 晚上, 我们 到底 有没有 在 做 很多 工作, 但 我们 到 时间点 基本上 还要 吃饭。 为什么? 因为 即使 没有 在 做 工作, 那 我要 维持 这个 状态, 我 比较 维持 我的 呼吸, 我 等等我 正常 的 这个 运转, 我 都 是要 耗电 的。 这一点 可能。

就 对 基础 就是 在 对对对 技术。

但是 对 这个 对 我们 确实 比较 就 比较 尴尬 的? 因为 这 事儿 我也 不能 让 他 没有 这种 技术 代谢, 因为他 随时 可能 要有 任务 要 来完成, 好吧, 这 是个 简单 的 例子, 希望能够 解释。

对对对, 我 觉得 郭 老师 这个 例子 特别 好啊, 就是我 我 当时 脑子里 想 的 就是 要 不就 像 三体人 一样, 对 吧? 干脆 你 先 脱水 了, 兄弟 先 脱水。 对对对, 但是 现实 中 人类 不太可能, 计算机 可能 也 比较 难。 事实上 就是说 计算机 其实 是 有可能 这么 去做 的, 其实 上 我们 过去 几年 发展 的 技术, 其实 也是 按需 供应。 但是 为什么 之前 没有 去 这么 做?

其实我 我 觉得 这里 可能 有 几个 大 的 原因。 第一个 就是说 回到 20年 前 来看 的话, 其实 或者 就 十年 前 我在 oogly 的 时候, 就是 在 公司 里面 听到 我们 这个 机器 量 的 增长 有 多 快。 我们 这个 季度 包圆 了 某 一家 硬件 厂商 的 整个 的 硬盘 的 销量 等等等等 我 觉得 是 十年 前 的 时候, 其实 整个 互联网, 包括 数字 经济 是 飞速 的 发展期。 非洲 发展期 有 几个 特征, 第一个 就是 红利 巨大。 第二个 就是 因为你 这个 还 小, 所以 大家 不会 过于 关注。 这 背后 的 这个 能耗, 就是你 要 看 这个 O I O I 吧? 你 当 只有 慈禧太后 能 开车 的 时候, 中国 肯定 不会 有 交通 的 问题, 对 吧? 但是 你 如果 像 现在 每个 中国家庭 都有 一辆车 的 时候, 你 就 会有 交通 的 问题, 就 会有 能源 的 问题 等等等等。

今天 到 这个 数字 经济, 我们 要 继续 往前 推进, 对 吧? 到 整个 互联网 的 普及, 我们 每个人 其实 消耗 的 算 力 都在 大幅度 的 增长。 以前 我们 可能 上网 发 个 邮件, 看看新闻 就 差不多 了。 现在 是 玩游戏 的对 吧?

看 短 视频 的 等等等等。 其实 在 这个 背后, 其实 是 人均 的 算 力 的 消耗 的 特别是 这个 增长 速率 是 相当 快 的。 所以 到 现在 来看, 肯定 是 有一个 影响 这个 社会 的 问题, 正在 慢慢的 出现, 又又 叠加 上 刚才 讲 的 整个 数字化 的 或者 数字 经济 的 红利, 或者 叫 这个 暴利 期, 可能 也 在 慢慢的 告一段落。 所以, 从 行业 角度, 从 公司 角度, 从 社会 角度, 开始 关注 这个 问题, 我 觉得 也是 一个 非常 自然 的 一个 事情。

对, 刚刚 您 讲到, 其实 每年 它的 数据中心 的 耗电量, 还是 碳 排放量 都 是在 不断 的 增长。 虽然 可能 是从 二 涨 到了 3.5, 但是 它 每年 都 是在 持续的 在 增长。 然后 我 包括 我 之前 看到 的 一个 数据 是 2021年 总 耗电量 是 两座 三峡大坝 的 年发电量, 然后 碳 排放量 是 311万亩 森林 的 这样的 一个 年 吸收量, 是 这样的 一个 数据。 也 确实 印证 这个 为什么 可能 我们 现在 要 关注 绿色 的 话题, 它是 一个 迫在眉睫 的 问题。 然后 我们 又 回到 刚刚 我 提出 的 问题是 大概是 这个 C P U 的 10% 的 这样的 一个 利用率, 他 能够 被 通过 计算 或者 是 通过 更好 的 算法, 我们 能够 到达 一个 什么样 的 一个 高度, 我们 能够 减排 多少 呢?

因为我 知道 是从 我 待 过 的 两家 公司 来看 的, 因为 google 其实 在 19年 时候 就 发 过 一个 paper, 就是 那个 bug 的 它的 整体 的 集群 调度 的 那个 paper。 它 里面 其实 我们 引用 了 几个 数据, 这个 关键 的 数据 就是 一个 google 的 非常 经典 的 一个 数据中心 里面 他 把 所有的 那个 workload, 就 它的 负载 什么东西 全部 拖出来 了。 当然 那个 paper 更 多是 学术 的 价值。 但是 他 其实 也 讲清楚 了 一个 事儿, 就是说 在 google 的 数据中心 里面, 其实 平均 的 这个 整体 的 利用率 是 可以 高达 百分之五六十 的那 回到 蚂蚁 来看, 我们 今天 自己的 看到 数据 就是 我们 自己 通过 几年 的 努力 蚂蚁 最 开始 也是 跟 这个 行业 水平 差不多, 就是 8%到15% 左右。 今天 其实 上 我们, 整体 的 这个, 利用率 可以 到 35、 40左右, 就 高 的 时候 高峰期 可以 到 百分之六七十, 大概是 这个 水平, 就是 这个 东西 验证 是什么 呢? 就是 在 只要 公司 或者说 这种 我们 能够 努力, 就是 关注 这个 方面, 这个 空间 是 非常 大 的。 就 是从 10%几 提高到 40% 甚至 五六十, 我 觉得 是 完全 有可能 的。

我 觉得 这块 我们 再 展开 聊 一下, google 他是 在 哪一方面 做出 了 他的 一些 优势, 然后 他 其实 能 是 做到 百分之五六十, 然后 我们 其实 是在 哪些方面 还有 更长 的 一段路 要 走。

这里 有 很多 技术性 的 东西, 但是 这个 我 觉得 可以 先 讲 一些 宏观 的 东西。 因为 在 google 其实 有一个 大 的 点, 就是 因为 全 google 的 整个 google 的 这个 软件 栈 是 完全 支持 的。 Google 基本上 没有 太多 的 三方 软件 都 自己 写 的。 然后 google 的 整体 的 基础架构 是 控制 的 比较 好的, 虽然 这个 几百万 台 服务器 的 量, 但是 它的 调度系统 就是 控制 资源 的 这个 系统, 你 可能 想象 几百万 台 的 计算机 是一个 大 的 系统调度 系统 来 控制 的, 这个 大家 应该 都 知道 叫叫 bog。 然后 他 其实 就是 要 为 整个 公司 的 这个 集群 的 利用率 负责 的。 然后 在 这 之上 长 出来 的 所有的 基础 软件, 特别是 基础 软件 这 一层, 都 是要 follow 一些 相应 的 标准 的。 Google 里面 其实 有 一些 相应 的 这种 文化, 就是说 一定 是 maximum 这个 team 的 productivity, 而 不是 这个 individual.

一个 好 要 最大化, 不是 个人 的对。

对对对 对对对 对对对 对他 要 团队 的 这个 效能 最大化。 团队 效能 最大化 就是说 我是 要 整体 集群 的 利用率 最大化, 而 不是说 我 单个 软件 优化 的 很好 就行了。 但是 我们 回到 行业 里面 来看 的话, 就 比如说 我们 做 数据库 的 公司, 他 可能 只会 关注 于 数据库 本身。 那 我 做 这个 大 数据 的 可能 就 关注 大 数据。 我 做 这个 比如 中间件 的 就 关 中间件, 但是 你 要把 这 几个 东西 加在一起 看 的 时候, 你 其实 发现, 原来 我们的 资源 是 浪费 的。 因为 我们在 集群 计算 集群, 特别 面向 互联网 的 这种 服务 的 这种 集群 里面, 其实 任何 一个 软件 它 都是 有 高峰期, 有 低峰 期 的, 但是 我们的 资源 只能 按 高峰 来 准备。 其实 是 需要 各种各样 的 任务, 或者 这样 各种各样 的 资源 的 这种 负载 去做 一些 消 峰 填补, 就是 所谓 调度 的 这种 东西 的。

这个 里面, 但是 又 牵扯 到 非常 多 的 软件 的 架构, 或者说 本身 的 软件 质量 的 一些 问题, 包括 比如说 两个 问 两个 任务, 他 消 峰 填 谷, 你 真正 不要 资源 的 时候, 你 能把 资源 放 出来, 真正 要 的 时候 能够 拿到。 这就 回到 我们的 软件 的 这个 高质量 发展 的 问题, 对 吧? 国家 也 在 讲 这个 软件 的 高质量 发展。 就是说 我们在 蚂蚁 的 时间 也 发现, 就是说 我 真真正正 这个 绿色 计算 最后 对 软件 的 这个 需求, 其实 是 打比方, 就 你 做 的 数据库, 我 做 的 数据库 有什么 区别?

就是 如果 是一个 高质量 的 数据库 的话, 我是 不需要 消耗 那么 多 资源 来 支撑 同样 的 服务 量 的。 或者说 我 当我 服务 的 这个 弹性, 当我 没有 那么 多 服务 的 时候, 我是 可以 把 咨询 资源 释放 出去 的。 刚才 讲 的 更 多是 软件 的 部分, 我 觉得 goole 其实 前面 讲 了 它的 整个 的 软件 栈, 其实 现在 也 延伸 到 整个 的 硬件 核心, 像 T P U 这些 东西。

那 我们 怎么看 这个 问题 呢? 其实 就是说 一块 G P U 包括 我们 最新 的 这个 部署 H 100, 就是 A 100v lian 的 A 100, 它 一张 G P U 的卡, 如果 是 16浮点 的话, 它 有 三百多 T 的 计算能力。 Flops 就 相当于 其实 有 好 几百块 C P U 了。 好 几百块 C P U 的 能耗 跟 这个 G P U 肯定 是 没法 比 的, 这 是一个 巨大 的 我们 觉得 是一个 能耗 的 降低。

说 R Y 的 增加 从 能耗 的 角度 来讲, 但是 google 在 这个 角度 上, 它 并没有 只是 满足 G P U 的 算 能 本身。 因为 G P U 还是 一个 通用 计算, 它 当然 最 主要 算 A I 这块, 他 可以 去 做什么 视频 编解码 等等等等。 但 google 为什么 做 T P U? 其实 是因为 整个 google 的 这个 资源 用量 太大 了。 T P U 的 算 能 其实 比 G P U 整个 I O I 上 又 提高 了 好几倍。

前段时间 不是 google 发布 那个 智能 套餐 的 那个 帮 A I 套餐, 那个 东西 我们 看 了 有用 了 这个 4000这个 T P U 月, 4000块 T P U 月, 大概是 这么个 东西。 那 现在 可能 发展到 就是 4000块 T P U, 可能 你 要 几万块 这个 G P U, 甚至 更多 才能 算下来。 对于 google 来说, 他 可以 去做 这个 事情 是因为 他 已经 有了 这个 技术。 现在 我们 看起来 是一个 可能 高不可攀, 就是 非常 庞大 的 一个 数字, 但是 他用 一个 更 低能 能耗 的 一个 方式, 其实 就可以 满足 了。

从 我 看来 就是说 刚才 讲 的 这个 硬件 的 发展, 就是 跟 软件 发展 其实 一样的。 就是说 他 一定 会 追求 更 低能耗。 就 相同 的 事情, 最低 更 低 的 能耗, 更 低 的 消耗, 更快 的 速度, 更高 的 效率, 那 这个 东西 我 觉得 也 跟 绿色 计算 其实 是 相关 的。 其实 绿色 计算 不是 简单 的 看到 我们 最终 的 结果 是 减排 了 多少 碳 或者 什么。 但是 最 核心 是 说 我们在 未来 就是 科技 发展到 下一个 阶段 的 时候, 我们 有没有 足够 的 硬件 和 软件 的 能力 去 支撑 到 我们 产生 更 先进 的 技术, 这个 部分 我 觉得 也是 绿色 技 需要 关注 的。

但 好像 我们 现在 其实 国内 我们 更加 把 软件 的 这种 战略 的 方向 是 更。

优先 的对 硬件 因为 这个 干扰 了 硬件 当然 国家 一直 在 抓抓 的 也 比较 紧。 但是 从 我们 国家 的 现实 发展 角度 来看 的话。 第一 我们的 软件工程师 的 数量 肯定 是 大于 硬件工程师 的。 第二个, 软件 的 迭代 速度 其实 也 远大于 这个 硬件。 第三个 就是 刚才 讲 的 硬件 其实 发展 过程中 客观 也 遇到 了 一些 问题 但是 我 觉得 从 计算机系统 来讲 的话, 软硬 其实 是 不太 分家 的, 是 一体 的。 软件 其实 某种意义上 来说, 如果 发展 的 好 的话, 其实 可以 弥补 一些 硬件 带来 的 不足 了。

现在 咱们 的 一份 电力 对应 的 算 力 的 这样的 一个 比例, 国家 是 有一个 标准 是 吧?

你是 说 P U E 那个 值 吗?

是 吧? 对对对, 是的。

对对对, P U E 是 有啊, 是 国家 有 一些 指导 意见, 也就是说 标准, 基本上 是 集中 在 这个 对 数据中心 的 描述 的。 就是我 一份 电力 到了 数据中心 到底 几份 能够 真正 产生 这个 或者 叫 到 服务器。 因为 就 数据中心 里面 有 很多 供电 配电系统, 智能 系统 等等等等, 现在 反正 最 先进 的 可能 就是 1.1, 就是 10% 的 电力 要 被 浪费。

刚刚 我们 讲 了 蛮 多 的 硬件 方向, 我知道 郭 老师 其实 是 一直 是在 研究 软件 方向, 特别是 可能 在 弹性 计算 或者 边缘 计算 这 一边。 对, 我不知道 咱们 在 这 一块 现在 是 有 哪 一些 方式 方法, 我们是 在 不断 的 在 节能减排, 然后 在 往 绿色 的 方向 在 前进 的。

我 观察 到 的 了解到 的 是 这样 做 软件 方面 还有 优势 是什么 呢? 首先 这是 两个 不 冲突, 这 两个 反正 是 早上 虽然 也 说 软硬 结合, 但是 从 技术 点 上 他们 两个 是 正交 的 做好 说是 一起 发展 的。 还有一个 用 软件 来, 我 觉得 还有一个 优势, 因为 咱们 现在 确实 还是 有 很大 的 存量 的 市场, 也就是说 全 对于 存量 的 这些, 机房 这些 已经 设计 好, 已经 在 运行, 咱们 已经 投入使用 了 这些 数据中心 的 设备。 这个 上面, 其实 是 说 还有 大量 的 可以 软件 层面 可以 优化 的 空间, 这个 应该 是我 觉得 是一个 蓝海。

现在 来看, 那么 具体 怎么做 呢? 就 软件 上面 咱们 可以 做些什么 事 呢? 从 两个 维度 上 来看, 其实 这个 就是 一个 供 和 需 的 关系。 所以 供 就 刚刚 咱们 都 已经 说到 算 力 这 一块 了, 对 吧? 那 我 就要 考虑 把 这个 算 力 我要 供给 给 一些 有 需求 的 人, 或者 有 需求 的 应用, 对 吧?

这个 情况 但是 在 那个 供需 计算机 里面 这个 算 力 这个 事, 他 还 跟 我们 像 我们 平时 说 的 这个 物品 还 不太 一样。 因为 这个 东西 你的 切分, 刚刚 何 博士 提 的 你的 切分, 包括 你 增加 减少, 它 都是 比 英文 叫 ln travel 都 不是 那么 travel 的。 那么 显而易见 可以 这样 做 的, 那 如果 不做 不好 的话, 就 经常 会 带来 一些 在 我们 计算机 里面 经常 会 带来 供 大于 需 这么 一个 问题。 这样 就 浪费 了 资源 了, 对 吧? 对于 我们 这个 算 力 就 浪费 了。 我们好不容易 前面 通过 各种 方式 把 它 算 力 送上来 了, 但 算 力 没用 好 或者 浪费 掉了, 这个 就 不行。

这个 问题 存在 两个 层面, 一个 层面 是什么 呢? 我们 往往 一个 我们的 算 力 的 供应, 它 因为 不是 面对 一个 应用, 而是 面对 多个 应用。 现在 我要 给 很多人 发, 很多人 发 的话, 这个 事儿 的 时候 就 存在 一些, 每个 人的 需求 不一样。 算 力 其实 刚刚 我们 说 的 这个 事儿, 说 的 比较 笼统 的 是 算 力 其实 在 我们 计算机 这个 里面, 它 包括 几类。 这个 类型 还 包括 正儿八经 的 C P U 给你 算 的 这个 是 你 这个 需求 有 多少。 第二个 就是说 你 对 内存 多大 需求, 对 内存 其实 也是 一种, 我 认为 也是 一种 算 力。 因为 它 也是 一样, 计算机 要 供给 给你 提供 这么 一个, 你 为了 辅助 你 更好 的 把 这个 任务 完成 了, 他 要 消耗 的 资源 也 涉及到 店里, 当然 还有 就是说 你 对 I O 的 需求, 你 对 网络 的 需求。 每个 人像 每个人 上来 之后 他的 需求, 他是 一个 画像 一样, 每个 人都 不一样。

对 我们 一个 系统 的话, 我们 就要 综合 考虑。 刚刚 后续 提到 过 就是 google 的 一个 系统。 那 现在 开源 的 有一个 版本, 但 不是 完全 对应。 但是 按 这个 理念 去 设计 的, 就是 那个 moens, 这个 云 原生 这个 交流 系统, 设计 的 叫 编排 系统, 容器 编排 系统 也就 在 干 这个 事儿 了, 就是 对于 多个 应用 而言。

那 对于 单个 应用 而言 的话, 就是说 它 也 存在 供需 关系。 但 在 云 这个 时代, 在 咱们 这个 数字化 的 时代, 也 不是 那么 拿 衣服 的。 就是说 你 第一个 系统 我 就可以 很 好的 给你 供应 你的 专利, 不 浪费 了。

为什么呢? 因为 对于 单个 系统 而 单个 应用 而言, 你 在 同一 时刻 是 确定 的 你 对 你的 对 资源 的 需求量, 但是 你 在 一个 时间线 上 你是 变化 的。 而且 比如说 我们 常常 说 的 现在 大家 打开 微信, 我 明显 都 知道 它 有 潮汐 现象, 对 吧? 就是 会 就在 上班 的 路上 大家 都 用 的 比较 频繁, 下班 的 时候 的 频繁, 中间 可能 用 的 少一点。 还有 一些 比如说 我们 有 一些 抢红包 的 活动, 或者 一些 做 一些 促销 活动, 都 准点 开始 抢。 那 他 对于 这个 应用 而言, 它 在 不同 时刻 他 也是 不一样的。 所以 如果说 我们 没有 能够 在 软件 层面 很 好的 处理, 做 一些 资源 的 供给 的 一个 把握 的话, 那 就会 造成 一个 就是说 你 给 的 太少。 给 太少 会 导致 它的 性能 运行 不 起来, 会 经常 出问题。 这个 基本上 目前 来看 的话, 我们 看 的 比较 少, 为什么呢?

因为 这个 直接 跟 revenue 包括 业务 体验 直接 相关, 基本上 没有 哪个 公司 或 哪个 用户 可以 容忍。 那 从 为了 保 防止 它 供应 过少 导致 没法 运行, 往往 会 走向 另外一个 极端。 我 尽量 多 开 一点, 尽量 多 要 一点。 这个 时候 分配 不合理, 就会 导致 很多 资源 浪费。 这个 是 软件 层面 上 可以 做 的。 所以 我 总结 一下, 我 觉得 软件 他们 两个 事儿, 一个 就是说 多个 应用 的话, 我 怎么样 合理 的 去 给你 分配, 在 同一 时刻 合理 的 分配。 对于 单个 应用 而言, 我 怎么样 在 一个 时间线 上 又 能够 很 合理 的 很 自信 的 去 分配。 但 那个 背后 就是 刚刚 您 提到 的 一个 弹性 资源分配 的 技术, 还有 这个 等等 削 峰 填填 谷 等等 这种 资源 匹配 的 方式, 这个 应该 包含 了 很多很多 的 技术 内容。

咱们 这次 蚂蚁 这个 大赛, 也很 高兴 看到 有 这样的 一些 题目, 而且 设计 的 还很 合理。 比如说 这个 营业 生的 分时 调度, 还有 我们 那个 数据中心 里面 流量 的 预测 分析。 其实 背后 都 是在 找 了 一些 我 觉得 比较 好的 视角 去 看 能不能 有 一些 好的 方案。

刚刚 其实 您 大概 帮 我们 讲 了 弹性 计算 的这 样子 的 一个 两个 方向 的 做法。 然后 这一次 您 说 您 刚刚 看到 了 有 一些 在 这次 比赛 当中 的 一些 好的 具体 的 一些 我知道 您 是 评委, 然后 看到 一些 好的 一些 想法 和 这个 创意 的 角度。 我不知道 能不能 给 我们 列举 一两个 项目。

我 这次 做 的 评委 参赛 是因为 每个 老师 是 做 一个 赛 题 的, 这个 评委 也就 说到 最后。 就是我 这次 参加 的 是 这个 云 原生 分时 调度, 这 也 确实 也是 我的 一个 研究 方向, 做 这 一块 的, 那 这个 里面 就是 要 考虑 一个 什么 问题 呢? 就是说 我 这么 多 应用 一起来 了, 每个人 需要 的 资源 不太 一样, 对 吧? 各个 维度 也 不太 一样。 你 怎么做 一个 合理 的 组合, 能够 使得 我 这个 用 的 比较 好 一点。

这 里面 其实 有 个 点, 就是 这个 点 在 什么 呢? 就是 它 同一 时刻 对 C P U 要 多少, 内存 要 多少 网络 要 多少钱。 那 我们 往往 可能 会 存在 一种 互补 关系, 对 吧? 你知道 用 这个, 我说 用 那个, 这样 也 挺好的。 就说 您 咱们 正好 互补 起来 了。 如果说 我们 不能 互补, 又要 满足, 我们 就要 开 两台 服务器 了, 这样 就会 多用 一台 服务器, 就 更 耗电, 更 耗 资源。

这 里面 有 很多 作品, 我 很多 作者 我 觉得 都有 非常 天才 的 一些 想法, 就是 做 的 都 非常 好。 我 把 以前 的 传统 的 这些 运筹学, 调度 学 的 这些 东西, 像 我们 调度 公路 调度 其他 的 一样的 这个 制度, 把 它 放到 这 里面 来做。 然后 我 个人 觉得 我也 比较 喜欢 的 一个, 这 可能 也是 我 做 research 的 一个 style。 其实我 觉得 还是 能有 一些 更好 的 一些 牵引, 一些 灵感 的 一些 展现。 其实我 看到 有一个 队伍, 他 这么 想 的 一个 问题, 这个 问题 我 觉得 他 这个 想法 很 贴切。 其实 我们 并 不难 做到 说 在 同一 时刻 也是 一样的, 我 去 帮你 做 匹配。 他 比较 难 做到 的 是 说 我 这一次 弄完 之后, 我 是不是 有 更多 的 空间, 使得 下一次 我 再有 任务 来 的 时候, 我 还能 放 得 进来。 每次 放进来 之后, 还会 为 未来 优化, 未来 进 多次 host 更多 的 这个 应用 留出 了 空间。

他们 几个 就 想到 了 一个 事, 想 让 他们 玩 了 一款 game, 一款 游戏, 就是 俄罗斯方块。 它 像 每一个, 如果说 我的 计算机 是一个 空中 的 这么 一个 尺子 的话, 对 吧? 我的 每个 应用 就是我 一个 有 罗斯 方 从 上面 掉下来 的 一个 形状, 每个 形状 都 不一样, 有 正方形 的, 有 L 型 的对 吧? 有 这种 梯形 的, 各种各样 的。 他 这 表示 他 对 资源 的 需求。

它 它的 这个 条件 是一个 它的 形状, 每个 它 都是 被 它 分成 了 一个个 小的 块儿。

Yes 是 这样。 然后 完了 之后 是 这 每一个 就 h piece 掉下来 之后, 他 要 考虑 我 怎么 放 能够 互相 互补, 或者 削 峰 填 谷 等等等等。 我爱 俄罗斯方块, 他 讲 的 时候 我 觉得 我们 最难 的 它 不是 在 这 一个 你 怎么 放 是 吧? 他 最难 的 是你 这个 放完 之后, 你 下一个 你 得 考虑 好 你 怎么 放。 如果说 一些 高手 说 你 能 考虑到 下午 不怎么 放, 你 这个 闪 转 腾挪 的 空间 就 更大。

而且 为什么 我说 这个 比较 像 呢? 因为 确实 我们 用 我们 那个 一个 应用, 像 我们 放 那个 blog 放在 那边, 他用 一段时间 他 就 他 可能 就 消失了。 因为他 这个 叫 就是 他他 不会 一直 在 弄。 有的 时候 因为 这个 比较 浅显, 比较 容易。

你 讲 这个 道理, 当然 背后 怎么做, 怎么 去 算, 怎么 去 评估 这个 事儿, 是 那个 的 这个 就是我 说 一个 技术 也很 简单 来说 的话, 我 个人 认为 现在 一直 比较 困难 的 一个 事情 就是说 怎么 去 评估 这个 状态。 我说 的 状态 或者 叫 态势, 这个 为什么 就是说 我们 说 下 那个 国际象棋, 比 像 那个 围棋 要 容易 一点, 就 围棋 更难, 我们 国际 上 早就 被 A I 淘汰 掉了 围棋。 你 去 评估 这个 时候, 比如说 我 你是 黑子, 这时候 对 你是 有利 还是 没利 很难说 的。 因为你 只有 评估 出来, 你 才 好去 说 怎么 去 进一步 优化 他们。

张宇 这边 还有 一些 其他 你 看到 觉得 特别 好的 一些 参赛 的 案例 和 团队 吗?

我 觉得 郭 老师 刚才 举 的 那个 例子, 我也 比较 喜欢, 充分体现 了 这个 大赛 其实 这个 玩 的 感觉。 就 完 螺蛳粉 快。

对, 一 晚上 就 就算 完了 就 完了, 就 跟 那个 俄罗斯方块 完了 就 消掉, 所以 这个 太妙了。

这个 比喻。 是的, 我也 补充 一下, 我 看到 有 一些 点 也 比较 有意思, 我 觉得 这些 参赛选手 还是 有 很 天才 的 部分 的, 因为 我们 不 还有一个 赛道 是 遥感 图像识别。 这个 case 其实 也 跟 大家 讲 一下, 也 其实 挺挺 有意思 的。 其实 就是 蚂蚁 的 那个 真实的 例子, 就是 蚂蚁 的 那个 蚂蚁 森林。 大家 知道 抢 能量 的 那个 功能, 就是 天天 早上 有 很多人 起来 抢 能量。 然后 你 抢 能量 是 为了 种树, 你 其实 每 在 支付宝 上种 一棵 所谓 虚拟 的 树, 其实 蚂蚁 都会 种 一棵 真树, 在 沙漠 里面 种 一棵 真树。 但是 种树 现在 种 的 很多 了, 然后 我们 现在 也 你 还得 去 盘 这个 树 是 种 了 死 了 还是 活 了, 对 吧?

是不是 长 得 怎么样, 很多很多 这种 东西, 然后 我们 现在 也 用了 一些 遥感 的 技术, 在 做 这些 东西。 其实 我们 那个 赛道 二 其实 就是 怎么 从 遥感 图像 里面 提取 出来 这个 数目, 就是 识别 这个 数目 数量 不用 你 护理员 或者说 人工 去 数。 因为 这些 地方 其实 都 挺 艰苦 的, 用 卫星 图像, 用 遥感 图像 去 算, 然后 我们 就 把 这道题 拿出来 了。 然后 拿出来 了 其实 有 很多 我 觉得 是 天才 选手 们 也 在 想 了 很多 不同 的 方法。 因为 要 识别 准确, 因为 有的 树 还 很小, 然后 那个 地貌 其实 也 比较复杂, 就 是不是 那么 容易。 当然了 我 觉得 有 很多 选手 想 了 很多 好的 办法 去 识别, 提高 这个 准确率。 但是 我 觉得 有 一个点, 我 觉得 比较 喜欢 的 是什么 呢? 就是说 他们 在 做 这个 东西 还是 没有 忘记 我们 出 这个 题, 绿色 计算 也好, 或者 蚂蚁 诊疗 的 这个 初心, 他们 提 了 用 那个 脉冲 神经网络, 能耗 非常低 的 这个 算法 模型, 它 其实 是 有点像 模仿 人的 这个 神经系统。

你是 其实 比如说 你 紧张 的 时候, 你 这个 基础代谢率, 就 刚才 讲 的 那个 代谢 的 问题, 就是 人的 这个 代谢率 肯定 是 更高 的。 你的 这个 神经网络, 你 你 自 你 脑子 里面 这个 神经网络, 其实 不是 在 每一次 这个 活动 中都 会 被 激活 的。 你 就在 比如说 你 要 考试 的 时候, 你 要 什么 你 很 激动 的 时候, 你的 神经元 都很 激活 了, 对 吧? 这是 生物 的 本能, 但 这个 时候 其实 能耗 是 非常 高 的。

新一代 这个 就是 刚才 讲 的 脉冲 神经网络 这个 东西, 其实 上 它是 它 也是 属于 深度 学习 那么 一个 子集, 但是 它是 模仿 这个 生物 的 这个 能力, 就是 它 这个 动态 神经网络 里面, 它的 神经元 不是 在 每一次 迭代 传播 中都 被 激活, 达到 一定 阈值 达到 一定 阈值 才会 被 激活。 神经网络 的 这个 角度 来讲 的话, 我不需要 去 维持 一个 刚才 讲 了 我可以 降低 这个 计算 系统 的 基础代谢率。 用 这个 比方 可能 来讲, 可能 对对对, 可能 比较简单。 是的, 这个 技术 还 比较 新, 没有 名次 不是太好。

但是 我 觉得 他 对 这个 绿色 计算 的 思考, 包括 怎么 真正 的 我们 本质 想要的 这个 东西 是 非常 了解 的, 就是我 觉得 是 十分 值得 鼓励 和 学习 的。 他们 知道 我们在 算 这个 东西 的 同时, 其实 我们 也 在 想要 进一步 的 突破 这个 绿色。 你说 我 花了 很多 的 算 力, 消耗 很多 能源, 最后 去 算 这个 东西 其实 也 划不来 的。

这次 参加 这次 蚂蚁 比赛 的 人, 大家 其实 是 更多 的 关心 哪 一些 问题? 因为我 刚刚 听起来 好像 蛮 多 不同 的 这个 题目 的, 有没有 一些 是 可能 更加 受到 大家 关注, 或者 是 更加 有 挑战性 的。

其实我 我 手里 没有 特别的 数据, 我们 这次 赛制 是 这样的, 就是说 因为 所有的 这个 队伍, 其实 我们 有 三个 赛道, 这个 原生 调度 对 吧? 有 这个 遥感 的 识别, 也有 这个 持续 流量, 预测, 有 这个 数据库。 因为 我们 分了 预赛、 决赛, 然后 还有 新的 优化 等等, 就 非常 杂的 这个 东西。 但是 我们 这次 其实 是什么 呢? 就是说 初赛 的 三个 赛道 是 不 限制 的, 到 大部分 选手 选择 了 两个 以上 的 赛道, 数据 上 是 持续 流量 和 云 原生 调度 是 比较 受欢迎 的。 然后 决赛 中的 这个 两个 题, 就是 新 系统 的 性能优化 和 图像识别 是 两个 必答题。 至少 这个 在 决赛 和 预赛, 其实 题 的 方向 是 换掉。 你是 做 原生 调度 的, 你 最后 决赛 可能 还得 做 个 图像识别。

大概 这个 逻辑 对 还是 比较 综合性 的 一次 比赛。

就 刚刚 何 博士 讲 了, 我 觉得 就现在 很多 启发, 就是 因为 我们 经常 是 说 你 去 解决 这个 问题, 但 带来 代价 更 大对 吧? 就 看 代价 是什么。 另外 一点 就是说 我 从 参赛 人 上面 来说, 就是我 也 看 了 一下, 就是说 参赛 人员 里面 有 我们 国内 一些 顶尖 学校 的, 像 北大、 浙大, 包括 他们 南大 等等等等 很多 同学, 还有 企业 的这 说明 一个 什么 道理 呢?

这个 绿色 计算技术 是 大家 共同关注 的 问 话题。 但是 我 觉得 是 有点 小的 一个 不仅 是 比赛, 而是 一个 小的 一个 技术 的 一个 生态 的 这么 一个 感觉 了。 我看 了 甚至 有点 感动, 大家 都在 这个, 因为 这个 比赛 时间 还 挺 仓促 的, 好像 也就是 一个多月 时间吧。 每个人 不管 对于 学生 而言, 还是 公司 里面, 他们 对于 工程师 而言, 其实 每个人 平时 都有 自己的 工作。 他们 也 不是 专职 说 我就是 从事 预测 计算 的, 他们 也都 据 我 了解 好像 不全是 这样。 这个 层面 说明 咱们 蚂蚁 做 的 这个 题目 还 蛮 好的。 对于 他们。 就是说 不能说 上 手快, 就是说 能够 很 直接 的 一下 就 去 面对 到 这个 问题, 不需要 去 考虑 周边 这些 很 复杂 的 一些 周周 边缘 的 事。 这个 从 用户端 我 看到 的 大概 这样, 大概 学生 和 这个 是 2比1 的 感觉。 我我我 参加 的 这个 样本 大概 这样 还是 比较 有意义 的。

对 我我我 了解 其实 更加 像是 蚂蚁 发起 的 这个 事情。 然后 其实 也是 吸引 更多 的 其他 的 一些 公司 一起来 关注 绿色 话题。 并不是 我 可能 自己 搞 自己的 是 这样的 一个 平台。

看得出来。 对, 是的, 我 觉得 主持人 刚才 讲 的 这个 特别 对。 其实 我们 从 蚂蚁 的 角度, 虽然 我 现在 是 站在 蚂蚁 的 角度 去 讲 这个, 但是 我们 觉得 这 是一个 行业性 的 问题, 它 并不是 一个 蚂蚁 的 一个 问题。 我们 搞 这次 比赛, 其实 上 本质 上 确实 是 把 蚂蚁 的 一些 case 精炼 出来 了, 变成 了 赛 题。 比如说 我 刚才 举例 的 这个 蚂蚁 森林 的 真实的 这个 案例, 刚才 顾 老师 讲 的 那个 原生 调度 也是 我们 其实 是 我们 数据中心 里面 真实的 这个 trace, 所有 这些 东西 其实 是 蚂蚁 把 我们的 场景 先 开放 出来, 我们 实际上 是 希望 包括 跟 顾 老师 一起, 跟 学术界, 各个 公司, 甚至 一些 个人, 然后 社区 一起 合作。 首先 一起 看到 这个 问题, 当 大家 意识到 这个 问题 的 时候, 其实 上 会有 更多 的 关注, 有 更多 的 关注, 会有 更多 的 思路, 或者说 更多 的 办法。

其实 我们 刚刚 讲 了 蛮 多, 最早 google 他们是 怎么样 来做 他们的 绿色 计算, 能够 达到 可能 50% 甚至 是 以上 这 样子 的 一个 C P U 的 这样的 一个 能力。 它 还有 自己的 其实 优势 还 蛮 多 的, 因为他 硬件 软件 其实 都 掌握 在 手里。 我不知道 可能 对 很多 其他 的 公司, 不管 是 海外 还是 在 我们 国内 的 市场 上面。 其实 绿色 计算 现在 目前 最大 的 一个 困难 点 或者 是 挑战 它是 什么?

从 蚂蚁 的 实践 的 角度 来讲 的话, 就是 管理层 认 不 认为 这 是个 问题, 对 吧? 从 社会 责任 也好, 从 公司 本身 的 这个 经营, 就是你 对 整个 趋势 的 判断。 如果 有 这个 mindset, 必须 要 解决 这个 算 力 的 问题, 这个 算 力 的 问题 也是 必须 要 解决 这个 算 力 是否 高效 的 问题。 那么 在 这个 的 大 的 方向 如果 被 确定 之后, 实际上 剩下 的 包括 这个 技术性 的 一些 问题, 我 觉得 国内 的 公司 就 很多 绿色 计算 相关 的 一些 实践。 就 是从 蚂蚁 的 角度 来讲, 很多 的 实践 其实 依赖于 我们 对 软件 和 硬件 有 一些 掌控 能力 的, 这个 掌控 其实 就 不是说 我 所有 东西 都 要自 研, 但是 必须 有 自己的 一些 你可以 修改 这个 能力。

蚂蚁 是 因为 发展 十几年来, 其实 积累 了 一些 这种 东西, 包括 比如说 刚才 讲 的 这个 数据库。 数据库 大家 都 知道 其实 弹性 是 很难 做 的, 但是 也 得益于 蚂蚁 不是 ocean base 这个 可能 蚂蚁 比较 出名 的 一个 技术 产品, option base 这个 数据库 分布 数据库 其实 从 day one 开始 就是 自 研 的。 然后 它 一直 在 围绕 着 蚂蚁 的 这个 场景, 在 做 一些 深入 的 技术 的 探索 和 研究。 在 我们 从 蚂蚁 的 角度 来讲, 就是 在 他 确实 是 帮助 历史 计算 节省 了 很多 协商 的 资源。 因为 它 那个 弹性 是 比较 重要 的。 因为 从 我们的 现实 数据 来讲 的话, 我们 计算 和 存储 其实 是 一半一半, 存储 就是 大部分 就是 ocean base 的 一个 数据库。

国内 的 公司 其实 很多, 其实 如果 软件 都是 外 采, 甚至 自己 也没有 不 具备 软件 的 研发 能力 的话, 可能 更多 的 依赖于 像 云计算 等等 这些 I T 厂商 去做 弹性, 或者说 做 能源 的 减号。 就是说 你你你 可能 要把 算 力 这件 事情 完全 外包 给 一家 公司 去 做了。 但是 你 传统 的 那些 那种 外 采 软件, 然后 在 你 自己 机房 里面 去 运行 这种 模式, 这种 传统 的 I T 架构 上 是 比较 难 做 的。

国内外 公司 都有 一些 不同 的 做法, 可能 蚂蚁 的 做法 类似 于 google 的 做法, 就是 有点像 甲方 公司。 因为 我们 支持 的 所有的 软件 都是 为 蚂蚁 自身 的 这个 业务 服务 的。 这些 我们的 优化 目标 肯定 是 更 多是 为 蚂蚁 这 本身 的 这个 东西。 当然 我们 也会 去 开源, 或者说 做 学术交流, 交换 一些 技术。 这个 行业 里面 包括 美国 其实 也 存在, 比如说 像 I B M 这种 公司, 它 其实 更多 的 是 帮助 其他 行业 里面 的 公司, 去做 计算机系统, 或者 相当 相关 的 解决方案, 也有 可以 做 的 更好 的。

就是我 之前 有一个 我的 一个 下属 从 I B M 来 的, 他们 当时 就是 在 做 I B M 的 那个 私有 的 大 数据 集群, 他们的 利用率 可以 做到 非常 高 的, 因为 I B M 也是 有 自有 的 硬件 和 软件, 然后 他们 可以 做到 90% 多, 将近 百分之百 的 这种 利用率。 但是 他 这个 东西 他 更多 只是 局限 在 他 比如说 大 数据 的 这个 场景 下, 很多 公司 就是 买一台 I B M 的 这种 机器 或者 解决方案, 这个 利用率 是 足够 高 的。 但是 他 从 甲方 的 视角 来看 的话, 我 还有 很多 利用率 可能 不是 很高 的 东西。 比如说 像 一些 在线 的 服务 什么东西, 因为 大 数据 很 容易 提上去, 在线 服务 不好 提, 但是 他 也 没办法 把 I B M 的 这个 机器 给 拆 了, 或者 软件 给 拆 了, 然后 去 填 他 在线 服务 的 那个 空。 但是 从 刚才 讲 的 甲方 公司 视角, google, 蚂蚁 的 这种 视角 的话, 那 我需要 去 把 这种 大 数据 的 软件 去 解构 开, 够 开 以后 才能 去 填满 我 在线 任务。 因为 在线 任务 没办法, 它是 根据 这个, 它是 必须 要 满足 需求 的, 而且 就是 按 得 按 峰值 准备 的。 所以说 必须 要把 这些 大 数据 或者 A I 的 应用 把 它 拆开, 才能 去 满足 我 全 公司 来讲 的 这个 低碳、 环保 或者 绿色。 所以 这是 几个 不同 的 思路。

硬件 其实 你 像 ovidian video 我 觉得 也 本身 他 做 G P U 这个 事情 最 出名。 做 G P U 这个 事情 前面 讲到 这个 C P U, G P U 的 整个 算 下 的 差距 还是 蛮 大 的, 特别 在 这种 计算 密集型 任务 上。 所以 我 觉得 他 本身 做 的 这个 事情, 其实 也 属于 绿色 计算 范畴。 因为 它 对 我们 整个 社会 来讲, 就是 用 更 少 的 资源 做了 更多 的 事。

好的, 那 郭 老师 这边 还有什么 加 的 吗? 就 您 看到 的 现在 的 行业 的 挑战。

我 其实我 观察 了, 我也 跟 别人 聊, 何 博士 说 的 很多 都是 大公司 这个 情况。 其实 我们 很大 范围 的 是 这种 中型 的 或者 小型 的 这些 公司, 他们的 数量 很多, 他们 单位 公司 可能 体量 没 那么 大。 其实我 看到 两个 点, 这个 问题 上面 第一个 点 是什么 呢? 当我 跟 别人 说 我们 去 聊 一些 日 计算技术 的 时候, 作为 公司 的 负责人 等等 而言, 他 这个 事情 的 priority 坦白 来 有的 时候 不是 特别 高。 因为 我们 讲, 因为 当然 它的 priority 是要 提升 revenue 对 吧?

这个 利润 前 理论 有 两种 方法, 一个 是 开源, 第二 是 节流。 节流 的话 我们 知道 我们 运输 技术 上 就 属于 节流 的 技术, 怎么 把 成本 帮你 降 得 更 低 一点。 但是 如果说 你的 开源 部分 就是 做 的 足够 多, 而且 是从 从 商业 的 模式 来看 的话, 你 这边 如果 有一个 非常 好的 一个 曲线, 对 吧? 那 可能 他 觉得 开源 的 意义 可能 就 增加收入 的 这个 事儿 可能 意义 更 大从 战略 上 合同, 从 他 资金 上面 就 往往 就会 比较 有有 一定 的 阻力 了。

第二个 事情 什么 呢? 就是 我们 现在 说 的 这些 预测 计算技术, 目前 来说 还是 数据中心 级别 比较 大 的。 而且 其实 应用 你 肯定 不是 一个 你 指的 是 上万个 更多 甚至 几十万个 又 很 复杂 的 这种 场景。 当然 诚然 这种 场景 下 确实 是 我们 很 重要 的 是 解决 的 一些 情况。 但是 其实 还有 像 这种 他 没有 那么 多, 可能 就 十几个。 我的 机器 可能 就 100台左右, 然后 几十台, 我们 其实 挤 一 挤 也是 能够 提升 的 利润率 的。 但是 这 100个机器 可能 有 我们 有 100个公司, 它 放在 不同 的 公司 里面, 每个人 之间 也是 孤岛, 互不 关联 的。 但是 对于 这 一类 小 公司, 相对 小规模 的 公司, 他们 还 几乎 还没有 很少 的 引进 这个 绿色 计算技术, 或者 主动 的 去 引进 这个 技术。

就像 何博 刚刚 说 的, 很多 可能 就是 以 甲方 他们 以 甲方 公司 的 思维 去 采购 一些 其他 的 像 I B M 等等 提供 的 这些 设备, 这些 软件 等等。 但是 并不是 所有的 硬件 供应商, 我 觉得 还是 特别 考虑到 这一点 了。 因为 对于 硬件 供应商 而言 的话, 他的 客户 可能 也没有 特别 跟 他 提 这一点。 我们的 指标 里面, 我们 因为 我们 采购 的 时候 通常 就是 这些, 你 C P U 不能 少于 多少, 你 内存容量 不能 低于 多少, 算 力 峰值 可能 不能 低于 多少。 没有 说 你 这个 要 低碳 或者 你 这个 要 电能 电量 你 利用率 什么的。 但 这些 这 都 是我 觉得 是非 技术 问题, 因为我 可能 接触 的 还 中小型 公司 也 不少。 补充 一点, 他 和 我 这个 除了 大公司 之外 的 一些 情况。

对我 比较 同意 顾 老师 刚才 讲 的对 我们我们 因为 一直 在 大公司 里面 可以 会 陷入 这个 误区。 其实我 觉得 大量 的 计算资源, 特别是 那些 利用率 比较 低 的 卷 资源, 其实 是在 小 公司 手里 的, 而且 这个 量 非常 大对, 因为 它 累积 效应 比较 大, 仓位 对。

那 未来 我们 需要 做 一些 什么样 的 努力 才能 改变 这一点? 是 可能 先 要把 我们的 这种 教育 宣传 到位, 还是 可能 通过 技术 来解决?

发现 我们在 国内 包括 国外 每次 有 开 这种 日式 计算 相关 的 课程, 其实我 觉得 还 蛮 有 必要 的。 就是 咱们 得先 有人。 因为 我们 大部分 硕士 或者 博士 毕业 同学 去 industry 工作, 对 吧? 他们 在 学校 都 没 听 过 预测 计算, 都 不太懂 这个 像 Spark 好多 包括 tender flow A I 起来 之后, 还是 得益于 说有 一批 人才 起来 了 是 吧? 在 学校 的 培养 这里 有一个 很 好的 把 这个 技术 引入 进去, 我 觉得 这一点 可能 也是 蛮 有意义 的 一个点。 我 觉得 我 个人 在 因为我 可能 我在 学术界, 我 因为 本身 也是 也 也是 教授, 也要 教书 上课 的。 所以 我是 觉得 这一点, 包括 我们 也 我 看过 有些 slide 里面 也会 讲 一些 计算, 但是 都 非常 古老, 都 还 停留 在 这个 芯片 的 设计, 这个 的 很 古老, 没有 像 现在 的 这些 新型 的 这些 技术, 这是 一个点。 第二点, 就是我 又 回到 头 了, 就是 为什么 我 比较 关注 软件 人设 计算技术。 就 坦白 来说 这些 像 刚刚 那些 我说 的 这些 公司, 或者 是 包括 这些 大学 的 这些 创新 中心, 你 让 人家 去 把 硬件 换掉 或者 重。

改 重 弄 不太 现实。

对, 但是 我 跟 你说, 就 像你 你 这个 东西 比较 卡 是 吧? 我 这个 或者 比较 那个 我给你 更好 的 软件 一 换, 它 自然而然 就 预测 计算 了, 这个 可能 会 比较 好 一点 我 就举 个 例子, 就是说 你 原来 这个 播放器 是 吧, 你 原来 那个 播放器 可能 就是 很 不太 合理, 压缩 各方面 反正 解码 都 很很 耗电。 我 换 个 播放器 给你, 你 只要 右击 打开方式 换 我的 其他 一模一样, 甚至 还 更 流畅, 但 就是 省电 了。 这个 可能 是 比较 好的, 而且 它 这个 传播 起来 也 很快 了, 你 人 也 不要 去 直接 复制 下去, 大家 去 都 可以 下载。

现在 我们 肯定 是 先 要在 学生 里面, 我们 对 他们 进行 一些 可能 宣讲 教育, 包括 这次 比赛 其实 也是 这样的 目的。 我 觉得 另一方面 可能 就是 对于 中小企业 的话, 我们 可能 需要 从 这种 降本增效 的, 然后 实际 的 经济利益 上面, 可能 对 他们 进行 一些 与 宣传 和 引导。 所以 大家 可能 才会 更加 关注 绿色, 它 并不是 仅仅只是 这个 政治 正确 的 一个 问题。 两位 其实我 不知道 有没有 一些 可能 新的 技术 的 趋势 或者 是 创业 的 趋势, 大家 看到 的 还是 让 两位 觉得 比较 兴奋 的。

我说 两块, 一个 是 技术 趋势 对 吧? 还有一个 就是 就 产业 创业 趋势 方面。 技术 趋势 这 一块 的话, 我 个人 还是 比较 看好 弹性 计算。 这个 确实 是我 觉得 也 比较 level 的。

以前 其实 咱们 说到底 咱们 那个 就 是不是 说 不想 给他 供给 供 做了 平衡, 然后 我们会 导致 供过于求。 这 不是说 我们 不想 把 这 问题 解决, 而是 说 以前 那种 分配 的 技术, 它 确实 分配 一次 调度 一次 都很 花时间, 而且 分配 力度 比较 粗。 那 这个 时候 你 分配 的 粗呢, 就是说 原来 比如说 我给你 分水, 你 需要 200毫升, 但 我 都是 500毫升 的 瓶子, 我 分 至少 给 你就是 500毫升, 那你 肯定 会 浪费 对 吧? 第二个 什么 呢? 就是我 这种 分水 的 速度 也 很慢, 我 到 这个 河里 去 把 水 挑 上了, 然后 再 弄 送给你, 这 中间 都有 延时, 那 我 肯定 尽量 一次 给你 多分 一点 是 吧? 不要 来 拿 的 时候, 你 等 在 这边 是不是?

现在 弹性 计算技术, 像 这个 有 很多, 像 这个 比如说 像 云 原生 的这 套 技术 是一种 对 吧? 还有 更多 的 他 就是说 你 能 很快 的 感知 他的 状态, 你可以 快速 的 实现, 叫 技巧 也要 有的 这种 就 快速 的 弹性。 那 怎么 做到 呢? 就是你 这个 资源 的 封装 要 非常 轻量化。 大家 都 知道 分配 很 轻量化 之后, 你 弹起来 当然 也 快, 是 吧? 所以 有 像 solid, 甚至 我可以 以 函数 这个 方式 来 增加, 而 不是 以 机器 的 方式 增加。 我们 分配 一个 函数 的 太快 了, 对 吧?

这个 资源 一点 就是说 我 为什么 比较 看好 这个 呢? 最近 因为 也是 看 世界杯, 也是 球迷, 最近 世界杯 几次 点球大战 大家 都 看到 对 吧? 比如说 阿根廷 门将 马丁内斯 扑 了 三个 进球 出去, 那 为什么 我 就 肯定 扑 不到 三个 点球? 我 一般人 碰 不到 他 有一个 很 重要 的 点, 我们 能 就是 有的 时候 因为我 不去, 因为 这个 球 数 他 太快 了。

对 一个 文件 而言, 你 如果 等 他 踢出来 你 再去 动, 等 资源 来了 你 再去。 还有 是 需要 什么? 那个 踢球 的 方向 我 认为 就是 一种 他 对 资源 的 一个 需求, 等 他 资源 需求 出来 了, 你 再 来不及 了。 对, 那 我 只能 说 我 尽量 我 找 一动, 我 先 铺 到 那边, 但 有可能 你 要 铺 到 那边, 我给你 增加 这么 多 资源, 可能 你 不要 我 方向 错了, 这样 就 浪费 了, 我 就 失败 了。 但 如果我 这个 调度 器 像 那个 门将 一样, 我 足够 的 这个 shop 我 足够 的 快, 是 吧? 就是说 我 就可以 等你 踢, 你 先 踢, 等你 出来 踢 了 一半 的 球, 在空中 我 都 来得及 跳过去, 非常灵活, 这样 我的我 扑 到 的 概率 就 更大 了。

换 到 这个 问题 上 来看, 今天 一样 就是我 可以 不要 先 预先 分配 的 资源 给你, 但是 你 一旦 有 需要, 我 立马 就能 给你 很多。 我 反应 够快。 这是 弹性 计算技术 追求 的 这么 一个 目标 之一。 但 这个 是 怎么做 的? 这个 对 软件设计 各方面 都有 很多 挑战, 而 这个 挑战 会有 很多 的 直接 的 红利。

第二点 快速 的 我说 一句, 创业 这块 我 不太懂。 但是 我 看到 的 一个点 就是说 可能 这个 很大 的 一个 红 蓝海。 通常 我们 不 卖 个 东西 给 别人, 你是 个 采购 方, 我 采购 你的 东西 通常 是 说 我 采购 你的 这个 下面 我的 成本, 我的 这个 原料, 我要 把 它 加工 成 我的 产品, 我要 再 把 我的 产品 从 用户 那边 卖出去, 然后 从 用户 那边 把 我的 这个 收益 收回来。 然后 按 道理 以后 我 有 收益 我 再 把 钱 给你。 当然 我 如果 不 这个 时候 给 你我 要 提前 垫 部分 钱 给你, 本 收回来 有 个 很长 的 周期, 对 吧?

但 预测 阶段 就 不一样, 预设 计算 它是 你的 cost。 也就是说 其实我 觉得 一家 软件公司 或 一家 公司, 如果你 每年 有 500万的 电力 计算, 如果你 用 那种 采购 这个 预设 计算 这些 技术 产品, 你 其实 就 相当于 说 帮你 省电。 那你 只要 直接 从 你 这个 电力 预算 里面 抛 一份 出来 也可以 了。 比如说 你 每年 500万这个 电力 的 预算 了, 这样 这个 预算 阶段 就是 帮你 把 电费 从 500万省 到了 300万, 你 再 付 100万。 对 单独 说明 的 事情, 这是 双赢 的 事情 对 吧? 他 不需要 等你 把 你 东西 卖出去, 你 赚的钱, 这个 是 节约 成本 的 一个 事儿。 我 觉得 而且 一般 的 公司, 如果 这个 商业 逻辑 都是 容易接受 的。 因为 对他 而言, 他 没有 及时 通 到 预算 里面 增加 新的 东西, 对 吧? 就 采购 这个 事情。

我 觉得 郭 老师 已经 非常 精辟 了。 我 觉得 从 趋势 上 来讲, 反正 有 第一个 就是说 整个 算 力 在 shift, 就是 整个 互联网 的 算 力 构成 正在 发生 一些 大 的 变化。 就是 过去 实际上 是以 服务 驱动 的 这个 互联网 模式。 可能 从 蚂蚁 的 时间 来讲, 大部分 算 力 是 被 在线 应用, 数据库 等等 这些 提供 服务 的 这些 计算 系统 占 大头 的, 也 慢慢 shift 到 以 A I, 大 数据 等等, 甚至 现在 可能 慢慢 大家 也 看见了 新 起 的 这些 视频 编解码, 这种 算 力 密集型 的 这种 任 任务。 所以说 在 这个 大方向 上, 所有的 一些 技术 上 的 变化, 其实 就会 围绕 这个 大 的 趋势 来。 郭 老师 提到 的 原生 的 弹性 调度, 这 里面 的 大 的 趋势 就是说 我们 要 走 service less 这个 方向。 就是 对于 大部分 的 这种 在线 服务 应用 来说, 他 要 能够 把 整个 数据中心 或者说 整个 云计算 当做 一台 计算机 来 provision, 事先 部署 它的 这个 资源。

然后 第二个, 就是说 在 这个 大 数据 A I 的 这个 方向。 然后 我们 现在 也 整个 学界 和 包括 工业界 也 在 讨论, 比如说 A I 大 模型 的 真的 效应 的 问题, 所以说 蚂蚁 其实 也有 相应 的 绿色 A I 的 工作 方向, 就是 大 模型 是不是真的 有 不用 对 吧? 他 是不是 在 堆砌 无用 的 算 力 来 获得 那么 一点点 的 效果, 当然 我们的 理解 也会 有 一些 不一样, 就是说 因为 大 模型 本身, 因为 我们 整个 A I 领域 的话 会有 很多, 因为 A I 本质 上 是从 大量 的 数据 里面 去 提取 知识。 但是 你 训练 一个 模型, 我也 训练 一个 模型, 最终 就是 在 同样 的 数据 里面 在 重复 的 提取 知识。 我们我们 给他 取 了 一个 比较 难听 的 名字, 叫做 重复 智能。

当然 我 觉得 这个 大 的 趋势 是 大家 会 从 A I 的 发展 角度 来讲, 会 慢慢的 收拢 到 这个 大 模型 的 这个 领域。 大家 不要 去 重复 的 提取 知识 了, 对 吧? 有人 提取 一遍, 你 就可以 少 提取 一次, 对 吧? 你可以 在 这个 大 模型 的 这个 基础上, 就 foundation model 的 这个 基础上, 去 retrain, 或者说 fine tune 下 加 一下 你 这些 数据。 所以 这 肯定 也是 一个 大 的 方向, 我 觉得 这也是 跟 绿色 计算 的 这个 大 的 精神 其实 是 吻合 的。

然后 最后 刚才 讲 的 数据 也好, A I 也好, 还有 音视频 也好, 我 觉得 还有一个 大 的 方向, 其实 就是 硬件 的 创新。 因为 硬件 的 处理器 我们 现在 用 通用 的 处理器 对 吧? 从 C P U 到 G P U, 刚才 举 的 例子, 还有 google 的 这种 A I 的 专用 的 这种 T P U, 我们 也 看到 这个。 很多 音视频 的 这种 专业 的 这种 asic 就是 专门 的 这种 处理器。 其实 也 能够 大幅 的 降低 同一个 任务 下 的 能耗 的。 我们 觉得 硬件 的 创新 也会 加速。

过去 来看 硬件 的 创新 实际上 是 比较慢 的。 但是 我 觉得 整体 这 两年 看, 不管 是在 国内 还是 国外, 整个 的 硬件 创新 是 比较 快速 的。 所以 我们 觉得 这个 方向 上 其实 也是 大有可为 的。

然后 你 最后 问 到 什么 创业 方向, 我 觉得 我 前段时间 听到 一个 比较 好的, 挺 有意思 的 创业 方向, 可能 跟 技术 没什么 关系, 有人 在 做 对 企业 的 这个 评估, 就是 刚才 讲 到了 怎么 去 推动 绿色 计算 的 发展, 这是我 当时 没 回答 这个 问题。 但是 有一点 就是 我记得 在 当时 在 美国 的 时候, 有一点 就是 其实 大公司 会 出 一些 采购 的 一些 指南。 比如说 应该 还是 有 一些 regulation 的。 比如说 从 美国联邦政府 的 角度 来讲, 比如说 你 必须 要 碳 中和, 然后 你 才能 进 我的 供应商 名单 等等等等 当然 这 是从 供应链 的 这个 角度 来 政府 侧 或者 从 大公司 车 入手, 去 牵引 整个 行业 的 小 公司 去 关注 这个 事情。

但是 其实 还有一个, 方向, 就是说 看到 一个 创业 公司 是在 对 整个 公司 做 绿色 纸。 包括 在在 esg 的 大 框架 下, 现在 很多人 讲 esg 讲 的 比较 多, 在 一次 G 的 这种 大方向 下去 评估 这个 公司 对 环境 所 产生 的 影响。 然后 这个 东西 会 影响 公司 的 整个 信贷, 融资 等等等等 的, 我 觉得 这个 方向 比较 有意思, 也 可能 因为他 也 跟 技术 非常 相关, 跟 法律, 跟 技术 非常 相关, 属于 一个 交叉 领域。

觉得 可能 到时候 我们的 耗能, 我们的 这种 云计算, 然后 我们的 这种 算 力 的 耗能 越来越 提高, 然后 占 的 比例 越来越高 之后, 我 觉得 这些 可能 都会 全部 提 上 日程 了。

对对对, 因为 现在 企业 的 发展, 你们 大家 也都 感受到。 就是 100年 前 可能 公司 就是 看 个 财务 就行了, 后面 就 开始 要 看 员工福利, 然后 现在 大家 要 看看 这个 对 社会 的 影响, 对 吧? 所谓 可持续发展 是 说 我公司 其实 已经 不能 是 只是 一个 只是 为 这个 财报 而 奋斗 的 这个 实体 了。 就是我 我们 要有 社会 责任 部 对 吧? 要 为 员工 着想, 要 为 这个 环境 等等等等 一系列 的 事情 所 负责任。 就 所谓 这个 能力 越大 责任 越大。

对 吧?

好了, 我们在 节目 最后 再次 感谢 两位 嘉宾 今天 做客 我们的 节目。 然后 也 欢迎 大家 一起 去 关心 绿色 计算, 以及 蚂蚁 这一次 举办 的 绿色 计算 的 大赛。 好的, 我们 今天 的 节目 就 到 这里 了。 这 期 what's nex 科技 早知道 就 到 这里 了。 听 完 之后 如果你 有 任何 的 想法, 欢迎 在 评论 区 里面 给 我们 留言, 我们 每 一条 都会 认真 的 看。 如果 你喜欢 我们的 节目, 请 记得 给 我们 五星 或者 好评, 分享 给 更多 的 朋友, 也会 对 我们 非常 有 帮助。 你 也可以 单独 写邮件 给我, 邮箱地址 是 听 T I N G 艾特 声 点 F M, 我 都会 一一 回复。 同时 公众 号 和 微博 也可以 搜索 生动活泼 声 是 声音 的 声, 节目 相关 的 更多 信息 会 在 公众 号 里 出现, 微博 和 公众 号 都 会有 不定期 的 福利 给 到 大家。

如果你 想要 跟 我们 更加 紧密 的 讨论 和 分享, 或者 是 想要 认识 和你一样 有 求知欲 的 新 朋友, 可以 加入 我们的 微信 群。 进入 听众 群 的 方法 是在 公众 号 文章 中 扫 码 添加, 或者 是 公众 号 后台 回复 科技 早知道, 即可 获取 邀请码。 期待 你的 加入, 我们 下期 见。