084. 铁轨、插座与暴力读屏：从蒸汽机时代到AI时代的标准制定

2025/5/9

迷因电波

AI Deep Dive Transcript

People

范

范米扬

Topics

我从荣耀手机AI助手"悠悠智能体"的"暴力读屏"事件谈起，认为这种通过屏幕截图获取信息的方式侵犯用户隐私，并对软件生态造成损害。虽然该技术最初是为了帮助无障碍用户，但大范围应用存在巨大风险。我认为AI技术的发展不应以牺牲用户隐私为代价，我们需要探索新的发展路径，构建一个多方互利共赢的AI生态系统。借鉴工业史经验，我认为AI标准化至关重要，这需要设定规则和接口，明确每个参与者的边界，从而建立一个健康的生态系统，就像电网系统一样。目前，AI Agent技术通过API接口而非"暴力读屏"来实现复杂功能，这体现了接口在AI标准化中的重要性。Manus等AI Agent的出现，预示着未来AI可能取代很多现有软件，AI与AI之间的对接也需要标准化。谷歌开源的A2A协议和MCP标准都是AI标准化方面的倡议，旨在建立AI模型与外部软件的标准接口，提高效率，保障安全。 AI标准的制定需要遵循一些原则，例如包容现有技术，平衡不同利益相关者，并充分考虑安全性和合规性，防止数据泄露。历史上的例子，例如"马力"单位和铁路轨道的宽度，都体现了技术推广的滞后性和新旧技术并存的现实。AI标准的建立需要一个过程，需要国家层面的法规和法律支持，以及行业组织和企业间的共同努力。最后，AI的设计应该"以人为尺度"，服务于人的尊严。AI技术应该在提高效率的同时，保护用户隐私，尊重用户意愿。只有这样，才能构建一个安全、高效、共赢的AI生态系统。

Deep Dive

Shownotes Transcript

那你说你这个信息加密了半天啊手机直接给你截图截走了这个确实是非常荒诞的最高端的黑客只需要最简单的技术所以瓦特就想到了一个主意就是说他要把这个蒸汽机的具体的拉力转化成这个酒厂老板能听得懂的语言所以说瓦特就开始观察这个马匹就说马匹这个力量到底有多大

好的听众朋友们大家好欢迎收听今天的谜音电播节目我是大家的老朋友范米扬本期节目的灵感来自于前两天我看公众号的时候看到的一篇文章这篇文章对于 AI 技术是提出了一些批评然后这个文章它引起了我的一个思考然后我就突然想到说可以做一期节目出来

我们都知道我们现代社会是一个标准化的社会现代生产方式的一个特点就是批量化和标准化大家知道这个标准化这个词其实是非常核心的也就是说只有标准化的产品才能真正的被大规模的推广和应用

任何我们今天社会的产品你只有被标准化之后它才能大规模的应用然后问题就来了就是我们今天面临 AI 这种技术我们应该怎么去实现这种 AI 的技术的标准化呢这个是我想聊的那么这个批评我想先从手机 AI 开始说起大家都知道就是说这两年手机厂商都开始发

发力这个 AI 了比如苹果它已经把这个 ChatGPT 它已经继承到它的系统当中了好像是这个 iOS18 然后三星它说 2024 年是手机 AI 的元年大家知道这个李在荣现在是有点着急因为在这个新的科技赛道上三星有点落后了另外还有小米我记得雷军之前接受访谈他不就说吗当初他没有做汽车的话他可能就缩哈 AI 赛道了

另外他前段时间不是还发了一个 DeepSeek 的这个人才吗然后网上也有各种评论啊然后这个文章批评的这个事情呢就是荣耀手机啊荣耀是有一款叫 Magic 7Magic 7 手机他说这个手机上面呢有一个叫做悠悠智能体的 AI 助手这个 AI 助手就是刚才我说的 AI 的工具嘛它的用法大概就类似于这个 Siri 或者说小爱同学但是它里面搭载了一些 AI 的功能这 AI 的功能呢

它有复杂有简单简单的比如说就是 AI 修图或者换脸检测之类的现在有很多换脸的那种图片另外还有一些更加复杂的操作比如说它可以跨软件来自动的执行一些任务在这个手机的发布会上当时荣耀手机的 CEO 赵明他让 AI 执行了一个操作就是他直接让手机自己

点了 2000 杯咖啡 AI 自己点外卖就是说它是自己识别出这个外卖软件然后输入了说 2000 杯咖啡我觉得很莫名其妙为什么要买 2000 杯是吧你买两杯不行吗我不知道大家听完这个是什么感受就是我看这个视频的时候我自己还是觉得挺神奇的然后我看那个弹幕里面就很多人觉得说这个功能还是挺厉害

但是呢这篇文章他就批评这个荣耀手机他大概的意思是说就是说这个功能挺先进的但是它的实现的方式其实非常不体别也就是说它是基于一种叫做屏幕视觉识别的途径实现的啊他在这个文章里说这叫暴力读评这是什么意思呢

手机之所以知道这个外卖软件怎么用从技术层面来讲是因为它是给手机不断的截屏实现的就是它截了很多屏幕然后才知道这是哪个软件这是哪个功能然后用这个 OCR 技术 OCR 就是扫描识别的识别截图里面的这个文字和图像分析你屏幕上的软件的各个功能比如说哪个是点单哪个是搜索哪个是你的地址哪个是付款最后按照这些功能来操作

然后这篇文章是说他说这个截图的方法它本身就是对人的隐私的一种侵犯因为截图这种东西它是没有边界的大家知道手机这个东西是我们现在可以说最敏感的一个东西因为它有特别多的重要的信息我觉得冯小刚这手机的这部电影

是准确的预演了多少情侣啊多少夫妻是因为看手机而引发的冲突最后可能分手离婚什么的他有很多重要的信息包括我们的什么支付的软件啊密码啊还有聊天记录啊或者我们病历的信息啊财务的信息身份证什么的他说也许你只是想让手机帮你点一杯奶茶

但是最后他可能会把你的这个支付密码呀什么银行账单什么都给你接到你可能请他发条微信最后他把你的这个微信的聊天记录给接到特别多上传上去

他说从技术层面来讲这个技术本身也不是太新鲜就是在更早的时候这个方法其实是给无障碍群体准备的一个技术路线比如说盲人用户因为盲人他看不到手机屏幕他就只能是手机不断的截屏然后给他读出来就是说这个手机上有什么信息但是客观来说这个也是一个不得已的情况因为这种权限它相当于是接近系统的一个最高的权限它适合在没有办法的情况下

对吧就是无障碍嘛小范围的使用但是如果大面积使用的话这个东西一旦遭到这个恶意的调用那么用户的数据和安全隐私就没办法得到保障了然后还有另外一个层面是说这个截屏对于手机的 APP 啊就整个软件的生态也是一种伤害啊

但是这个道理其实很简单因为你想如果你是一个软件运营方你是一个开发者的话你肯定不希望自己的软件里的什么信息都被他直接劫走支付宝他肯定不希望他用户的财务信息直接被截图出去那携程肯定也不希望说你的什么用户订酒店的信息直接被截出去

因为这个东西都是高度隐私的甚至我们可以说像这一类的软件他们自己肯定也会对于这种用户隐私是有保护机制的比如我们常说的什么聊天软件端到端加密你想这个端到端的意思其实就是一种高级别的隐私保护比如连美国什么国务院副总统什么的制定战争计划都得用聊天软件来制定

可以想见这个隐私保护是有多么的奇倍啊只不过是混入了一个记者记者们截图出来了所以这个大众都知道了万思还有什么国防部长什么的都在里面开会这个隐私保护级别还是挺高的但是唯一的缺陷就是怕被截图

开玩笑的但是我们如果这个消息从端到端接受的这个过程中这个就只有通信的双方才能够解密这个信息啊中间任何的第三方包括服务器包括这个软件甚至不是第三方就是包括你这个软件运营方本身你都没有办法明文访问这个数据那你说你这个信息加密了半天啊手机直接给你截图截走了这个确实是非常荒诞的最高端的黑客只需要最简单的技术

那么读到这篇文章呢我还是挺震惊的其实也不是震惊就是我首先觉得有点怪啊因为在我心中呢就是 AI 它确实是一个非常前沿的科技但是读平这个听起来好像就不太高科技了是吧就有种很原始的那种刀根火重的那种气质啊

那么首先就我来说呢我是理解他们对于读评技术的这种批评对于隐私的担心嘛这确实是一个现实感很强的一个命题但是它也同时让我这么一个是吧这个科技乐观主义者陷入了思考就我也很想针对这篇文章的内容就问一下这个作者这么一个问题那如果是你说的这样的话那我们的 AI 技术难道就不发展了吗就是难道我们就是说为了这个不截图我们就不发展了吗

或者说如果要发展的话我们应该怎么样去发展因为我们知道这个技术本身它肯定是中性的实际上我觉得任何新技术出现的时候它都是会给人造成各种的震惊但是后面它在发展过程中它需要能做到一个多方互利共赢的一个状态你只有这样才可能普及起来

所以下面呢我想结合一下我对于工业史的这个了解就说一下我们到底应该怎么看待和怎么规避啊 AI 带来的各种问题以及还有一个关键词就是标准化啊我想聊一聊就是我们如何构建这个 AI 时代的一个标准化

那么我第一个关键词呢叫做接口我首先想问的一个问题是是不是目前所有的 AI 技术方向都必须把读评作为一个必须的手段这里我想先从前段时间很火的一个国产的 AI 智能体开始说起啊我不知道大家有没有关注当时有个新闻就是在上个月吧国产的一个 AI agent 就是这个 Manas

那么首先先说一下这个 AI Agent 是什么意思大家知道现在的这个 AI 软件呢我们用的什么 Jet GPT 之类的啊这个都是被动响应的但是 AI Agent 它的意思相当于是说它可以主动而且独立的帮你完成很多复杂的任务 Manus 这个发布的演示视频里面

他可以自己操作你的电脑上的网页和软件主动完成一系列的任务比如他可以帮助这个 HR 筛选简历啊他可以自己打开简历软件然后分析求职者的信息和数据把这些信息制作成表格呀视频啊就是各种数据分析啊给你分析他们到底谁合适甚至我们也可以合理想象一下甚至他还可以给求职者主动打电话了解情况啊甚至他可以自己设计问题去考核他们

然后再综合判断这么说的话 HR 不就失业了吗不知道 HR 有没有意识到这个问题说实话当时我看到这个 Manus 的这个视频我是真的还挺吃惊的我当时第一感觉就是打工人不存在了打工人不存在就他搞得我好像就没有价值了因为他在很大程度上可以替代可能 90%如果他是真能实现的话替代 90%的这个办公室的工作

包括做播客都不用我了对吧他自己做的都比我好所以我今天要批判 AI 嘛当然我也有朋友说呢他说他目前来说 Mannus 这个效果并不好完成度呢还不高就远远没有达到也是视频里面的这种智能化的程度他出来可能就是为了拉融资嘛

硅谷的风投领头了他的这个新一轮的融资然后融资总额达到了 7500 万美元然后使得这个 Mainless 这个估值达到了 5 亿美元相当于人民币接近于 40 亿左右这个是估值还是挺高的他毕竟是还没有任何发布的这个产品呢虽然说他目前还不成熟但我还是非常乐观的觉得就是他在不远的未来应该就可以实现我们就上面说的各种复杂的功能

自己帮你比如设计一个大型的游戏出来给你设计一个 GTA7 出来其中的游戏规划设计编程都可以自己完成你这些全程都不用自己动手因为像 AI 现在来说写故事编程绘画创作视频创作音乐这些本身就已经实现了

那么你把它组合到一起那你肯定也能实现然后我就查了一些资料我想看看 Manus 它用的什么技术路线然后这些资料里面有些介绍比如它使用的技术包括了多代理架构也就集合了现有的 AI 模型然后网络浏览工具集成然后使用代码执行它可以实现文件的管理以及云端的异步操作那么这个技术细节我就不一一说了因为我说了大家也听不懂

因为我就没听懂我就没听懂但是 minus 它的实现它不是通过截屏来实现的那它是通过什么来实现的呢那么这里我就提到了刚才说的关键词接口

我不知道大家有没有观察过就是我们今天的这个时代里面有很多接口的存在那接口的背后就是标准化的东西大家你可以看一下你的周围比如你房间里面你就预留的各种接口比如说电力的接口电插口网络的光纤接口以前还有电话的接口

有的地方还保留着什么有线电视的接口另外实体的比如说天然气的自来水的水龙头北方的还有地暖的开关我们现代人可能已经习惯了这些接口大家可能不觉得有什么其实你可以以一种外星人的眼光来看一下这件事你很可能觉得说这些接口实际上是很神奇的比如你就拿插座来说你只要开通了这个权限那么你的房子就会跟整个国家的电网系统联系起来

你想你用到了电但是你自己既不需要说我自己买个发电机发电我也不需要去跟发电厂谈合作大家知道因为电网的背后它其实是很多家发电厂在发电其实发电厂是独立于电网存在的不一定都是说国家电网或者南方电网拥有的

他们有风电有水电有火电有核电但是这些各种类型的电厂他们都可以连接到这个国家电网由电网统一把这些电给出售出去然后电网又通过这个接口把它装到每个人的家里你需要做的就只是开通就好

那么开通之后在另外一端你家里的所有的电器手机电脑也好空调冰箱也好无论是海尔的无论是海信的无论是美的的无论是格力的它都会适应到这个插口的标准也就是国标的这个 220 伏交流电你不会说我买了一个电器我需要重新的调整这个电压和电流或者说我必须要跟电厂联系必须提供基于我买的这个电水壶的电压去调整一下

我不需要因为我的这个所有的电器也需要标准化而且这个标准化的标准是跟电网是对接的那么像这种标准化的参数限定了这个每个游戏玩家的自由发挥但是另一方面呢它明确好了这种框架和边界遵守共同的游戏规则所以在这种游戏规则之下呢就建立起了一个丰富的电网的一个生态我们可以说我们整个人类的现代文明都是构建在这个标准化的基础之上的

回到这个 Manus 它的这种复杂功能的实现我们可以说其实也是通过接口来实现的它不是通过暴力毒品实现的那么什么接口呢就是一个词 APIAPI 就是 Application Programming Interface

应用程序接口的意思如果我们从这个角度来思考的话这个 API 其实它本身就是软件生态里面的标准化的接口这个我不知道大家了解多少比如说如果说我是一个程序员我要开发一个软件但是我这软件里面比如说涉及到有这个导航的功能还有这个收费支付的这个功能那么你想

我需要从头开始为了导航编写一个地图软件吗或者说编写一个支付软件出来吗这个完全不需要的因为我可以自己调用一些现有的平台上的成熟的这个软件的数据帮我实现这个功能那么这个时候呢你可能就会用到 API 比如说 minus 如果给你订机票的话

他必然会用到携程和支付宝那么他肯定不是直接去截图这些软件他需要做的是调用这个携程和支付宝的 API 来完成这个操作找餐厅的时候呢他可能会用到谷歌的 API 如果你要分析股票的话你可能会用到一些金融数据平台的 API

当然这个大平台自己本身也会开放出很多 API 来让别人用比如说可能滴滴软件我举个例子我记得是滴滴打车软件的导航它可能用的是高德的地图那么它就调用了高德的 API 比如高德地图这个软件它可能会给很多软件提供导航服务然后珠宝肯定也会给很多软件提供付费服务

大家用手机会把某些功能发到朋友圈那么这个微信也会开放出这个朋友圈的这个相应的 API 来供大家使用那么这个又是一个生态这个 minus 很多功能它不是自己从头开发的你说我要实现后头功能我要自己开发一个 chatGPT4O 的这个软件的水平这个小团队肯定是完成不了的它

它本身就是需要就整合了其他的大模型的这个支持比如它可能本身就会用到这个 Cloud 3.5 或者说阿里巴巴的这个千万大模型就这个同样是需要标准化的这个 API 接口去对接的就说白了我们可以说无论是电网的标准化还是 AI 的标准化我们都是设定一些规则和接口明确了总体的游戏规则明确了每个参与者的边界然后在这个边界之内大家去共同构建一个生态系统的这个思维啊

就实际上这个问题 AI 的这个标准化的这个东西在他们这个技术的圈子里面其实也有这种倡议虽然目前还没有完全成型比如我举两个例子一个是这个 MCP 标准一个是上个月也是四月份谷歌刚刚发布的一个叫 A2A 的

A2A 的那个标准倡议就这两个倡议就刚好就是一个是针对 AI 对接软件的另外是一个是 A2A 嘛就是 agent 对应 agent 或者你可以理解为就是 AI 对 AI 的所谓这个 MCP 呢模型上下文协议如果我们用一句人话来说就是

他就是想打造这个 AI 模型跟外部软件的一个标准的接口因为我们刚才说 Manus 这类的人他会用到比如跟携程跟珠宝对接当然这个倡议本身是由几个 OpenAI 的前员工创立的因为他们对于 OpenAI 现在的这个发展理念非常不满大家知道这个 AI 界里面其实有一派吧我觉得甚至我觉得可能主流派别就是这样包括马斯克

他们都担心 AI 的发展会冲击到人类社会尤其是安全和伦理方面会有问题所以他们选择离开了 OpenAI 自己成立了一个公司然后提出了标准的一个倡议就是他想让开发者以一种比较一致的方式将各种软件数据库或者说各种功能它连接到 AI 模型之中如果你把具体的 AI 工具比作一个个电厂的话

各种软件比作一个个电器的话那么实际上这个 MCP 标准其实就是它想倡导建立一种标准化的电网平台就像这个 220V 的这个插口一样的那 AI 模型和工具软件双方都可以遵守这个标准实现对接因为现状来说你想这个 AI 工具和软件的对接有点像是各种不同的电厂和各种不同的电器设备之间的对接它的效率是非常低的是有些混乱的

这个是我们现状另外其实我不知道大家有没有想就还有一点就是如果我们今天的 AI 进一步发展它在很大程度上可以取代相当多现有的软件比如最近微软的这个 CEO 纳德拉他不是说过吗他说未来可能软件软件可能就不存在了因为未来是一个 AI agent 来主导的一个世界这个趋势其实我们自己也能看出来举个例子比如现在 AI 修图这个事 AI 修图是又快又好

以前我们需要 Photoshop 上面或者 ElaTrader 上面操作两个小时的各种复杂功能 AI 一秒钟就给你搞好了我以前关注了很多比如说 PS 教学的那一类的抖音号小红书什么的它操作了一小时告诉你这个功能怎么实现然后下面评论里面当然他们也是有点贱就是用 AI 用豆包什么的就是一秒钟就给你批好了而且比 PS 批的还好

所以我们可以合理的想象就是未来设计这个事情它就不用 Photoshop 来做了甚至它可能就不用设计师来做了所以当 AI 强大到一定程度之后后面就是 AI 和 AI 之间的对接了如果这两个对接的话它也是需要制定标准前几天谷歌在 Google Cloud Next

大会上开源了一个叫做标准智能体交互协议的东西这个是简称 A2A 也就是说 agent to agent 那么根据谷歌的说法就是这个协议它是为 AI agent 之间提供了一种标准的交互方式如果大家都加入这个 A2A 协议的话企业平台完全可以自由的同时安全的交互这个数据

那么当然呢这两个只是一种倡议啊我并不是说这两个协议就一定会大家都使用它的协议或者这个就变成主流咱们只是通过这个举例子来说一说就是说在 AI 标准化里面的一些问题和尝试总体而言他们的一个价值取向就是说在 AI 时代大家可以实现互利共赢而不是说单方面已经麻了但是

但是这些标准需要遵从什么原则呢一个他们应该需要具备哪些特点我想下面来聊一聊我以一些工业时代的案例来聊一聊

那么这方面我想先从一个大家都听过但是不完全知道什么意思的词来讲起就是马力马力啊不是沈腾马力就是那个马匹的马力量的力嘛大家看那个之前小米苏 7Ultra 这个宣传的时候我们会发现他说我们有一千五百匹的马力

最近呢小米这个车又限制了马力因为老是发生这个事故嘛所以他把那个马力从最大 1000WP 还是说限制到了 800 匹还是多少啊只能去赛道里面解锁 1000WP 那么这里其实引起我思考的是马力这个词本身啊我不知道大家有没有觉得这个词其实在今天听起来是有点奇怪的马力是马的力啊但是我们现在根本就不用马车了

为什么大家还在用这个词呢但实际上呢马力的这个概念其实并不是马车时代的人发明的也不是汽车时代的人发明的而是蒸汽时代的人发明的这个概念的发明者正是蒸汽机时代的推动者詹姆斯·马特马特为什么要发明这个词呢是 1750 年的时候啊伦敦有一位啤酒制造商那么这个制造商呢就他

就他手下有全英国最大的啤酒酿造厂而且也是英国第一家大规模生产啤酒的酿造厂啊他叫塞缪尔惠特布雷德惠特布雷德呢他用马匹是用来拉磨来磨这个麦芽的啊那当时来说呢马匹就是效率最高的动力来源老板的这厂子里有 20 匹马这是初代牛马他

它也是拉磨嘛就是大家看过一个驴围着一个磨拉磨的那个表情包嘛对吧这个驴的眼睛被一块蒙住了蒙住了双眼蒙住了天是吧然后就整天说好日子还在后头呢就是这么一个表情包那么其实马的那个拉磨的场景跟这个类似的但是跟今天的牛马不一样的是当时这些马它们每天工作最多八个小时就只有四到八个小时因为马匹是会累的对吧它的耐力不如

人类这是当时他的一个工厂的一个状态啊然后当时这个瓦特不是改良了这个蒸汽机吗就是他要推销这个东西啊但是蒸汽机这个东西对于酿酒厂的老板来说是非常陌生的就是你这个东西能产生多大的作用啊也不好描述是吧就是我这个

劲很大但是有多大呢你很难描述所以瓦特就想到了一个主意就是说他要把这个蒸汽机的具体的拉力啊转化成这个酒厂老板能听得懂的语言所以说瓦特就开始观察这个马匹就说马匹这个力量到底有多大过来之后他发现他说这个马匹每小时绕着 24 英尺直径的末方走 144 圈他每匹马拉动浮条的动力大概是 180

然后通过这个观察马特就算出一匹马它一分钟能干的活干的活就相当于推动大约 33000 磅的重量一英尺这个拉力他就把这个数据定义为一马力这是一马力

然后通过这个数字呢他就得出了结论啊他结论是说他说我的蒸汽机是 200 马力然后他就跟这个酒厂老板沟通他说我这个一台能顶得上你这个 200 匹马的劳动量然后老板就瞬间概念到这个概念的意思啊就是开始用上了这个蒸汽机

这是比较早期使用蒸汽机的案例然后后来大家知道人类进入了蒸汽时代包括什么各种矿山各种纺织都用上了蒸汽机那么蒸汽机之所以能顺利推广瓦特发明这概念其实起了比较大的一个作用它能够对接到两个时代后来到了汽车时代

一是这个词还是能用而且甚至它用在汽车上比用在蒸汽机上更加形象一些因为马以前就是拉车的那你汽车的话你的马力就是更加形象了而且直到今天我们还在延续这个概念那么实际上说马车时代的东西影响到今天的就不只是这个概念其实马车时代的很多东西对我们今天都有影响比如我举另外一个案例就是现代铁路的标准的轨道的宽度是 1435 毫米

那么这个 1435 毫米是怎么回事呢这个其实就是中世纪马车的轨道的一个宽度当然这个也有说法是说这个更早的话可以追溯到古罗马的时代但是不管追溯到什么时代它都是一个马车的一个轨道的一个距离那么火车轨道之所以用这个距离其实它一开始也是为了能够适应更早期的这种马车轨道的一个设计因为轨道的存在它是要早于火车的存在的就马车时代已经有轨道了

就大家想到了用马车在轨道上拉车嘛让子弹飞里面不是有马拉列车吗大家觉得这个很荒诞啊但其实实际上这个东西确实是存在过的就是马车在轨道上拉货然后把轨道设置成马车的宽度实际上也就是为了包容这个马车时代的标准

当然马车时代对我们影响也不仅限于这个我们之前在节目中提到过一个通用汽车的创始人威廉·杜兰特就是马车商他说亨利福特汽车流水线的思路灵感来源之一就借鉴了当时马车生产的流水线另外我记得上期节目说过 LV 和爱马仕在一开始的时候它其实都是在马车时代的然后爱马仕它是生产马具的 LV 它生产马车时代的行李箱

所以其实我们可以看出来无论是马力的概念还是马车的轨道它其实都是为了衔接两个不同的时代因为即使新技术已经出现了但是不意味着社会上所有的系统大家立刻百分百全转向新技术

这方面在经济学家菲利普·阿基翁有一本书这本书我前段时间看的叫《创造性破坏的力量》这本书里面他有一个观点就是从非常学术的一个角度说过技术的推广是有滞后性的新技术出现并不会立刻完全瞬间改变原来所有的事情它是有滞后性被接受是需要一个时间的

比如他举了一个电力时代的案例他说尽管电力工程师们他们早就看到了电力的巨大革新潜力但是直到 1899 年的时候美国企业仍然很少采用电力还是在用原来的什么蒸汽动力水动力之类的然后作者说他说电力在 19 世纪末的低效应用与计算机技术在

20 世纪末的情形很相似虽然计算机刚一出来它能立刻实现数据处理的各种电子化但事实上传统的这种纸质的方式仍然是主流到 20 世纪 80 年代末的时候它几乎未带来生产率的进步这里面作者还提到了一个非常有趣的案例就是键盘

他说我们今天使用的这个键盘啊并不是一个最优的布局而且不光是不是最高效的其实他还是为了让你不那么高效因为就是打字机在 16 世纪被发明出来的时候他的工作原理啊让这个按键呢很容易卡住啊什么意思就是你这个键你按下去

它弹起来需要一定的时间就很容易卡住这个不就是苹果键盘吗所以设计者呢就故意让一些常用的英语字母保持一定的距离因为它按的不能太快啊所以它设计的远一些让这个按键有时间把它回弹过来这是当时的一个设计的原理但是我们现在的键盘你想一想它其实并不容易存在它除了什么苹果什么什么迭世键盘它并不存在容易卡住的问题

但是他还是沿用了以前的这个习惯那到了 1936 年的时候呢有一位工程师叫做奥古斯特德沃夏克他当时想重新设计一种基于人体工学的高效键盘我把这个按键设计的保持最高效的一个状态他说这个键盘肯定会取代原来的键盘而且他被这个推广投入了很多精力和金钱但实际上我们知道这种取代并没有发生我们今天运用的还是打字机时代的这个键盘的

作者说他说新技术的普及总是存在滞后性而且很多时候是多种技术并存的实际上我们想象人类社会的这个技术的发展它并不是好像是说一层层的石板一样或者一层层的年轮一样的就是非常界限明确的落在一起的

它其实更像是一种你中有我我中有你的这么一种发展因为我们就拿听播客这件事情来举例你听到这个声音其实它就包含了不同时代的不同层面的各种技术标准比如说你听到这个声音现在一般就是 AAC 的一个标准然后你手机上的文字显示你依赖这个 unicode 这个标准

那你的网络标准比如 http 协议和 html 标准都是 90 年代出现的那计算机的话你又分为这个 x86 或者 arm 架构这种架构标准又规范了处理器的指令集这个就是也是出现上世纪出现的然后你连接 wifi

以及 WiFi 背后的这个网络的光纤的传播电磁波的信号传播它又是更底层的一个标准然后你手机和路由器供电的电能这个背后就是电力时代的标准了这个可能是 100 年前的了那么这些所有都是被标准化过而且目前它是同时在生态中存在的而且我们进一步说我们甚至可以说我们整个时间和空间都是经过标准化操作的

我觉得格林尼日天文台就是可以算是这个地球时空的一个标准化的一个锚点就它这个地方确定了本初子午线的位置也就是零度经线它把地球划分为了东西经度然后再加上纬度从这之后呢地球上每个地理位置都有一个标准化的参数而且这个标准是统一的

你报上你的经纬度地址我把导弹发过去就是这个意思然后根据经度全球又划分为了 24 个时区这样时间就标准化了我们全球虽然不是用的统一的时间但是它是统一的标准可以非常方便的换算的

实际上这里我都是就是这个时间的标准化并不是必然出现的我记得在 1870 年左右就是火车刚出现的时候美国当时全国之内有 8000 多个时间的标准因为他的火车的那个站点非常多有 8000 多个标准大家标准都是不一样的那火车协调就经常出现混乱后来到了 1880 年之后美国应该是有一个什么协会就铁路协会之类的他把这个统一之后统一成了四个市区

统一了时间的标准才恢复正常的你不要觉得这个是理所应当的因为我们今天的整个的时间观念都是建立在这种交通标准化工业标准化之上的我之前聊那个日本的不是说了我说日本的那个人的时间观念墙很大原因就是因为他们这种开放国本的时候正好是欧美铁路大发展的时候所以他们把这个东西引入进来那么铁路的地铁的电车的这种时间的标准对他们的整个

生活观念的塑造是非常大的其实如果你观察一下如果不是现代人或者不是从事现代生产方式的话你会发现他们的时间标准或者他们的时间观念是跟现代人是不一样的所以我说这个甚至什么意思呢就是我们在各种的商业故事里面我们很容易接受一种叙事就是新技术瞬间取代旧技术但是在真实的世界里面这些事情并没有那么简单

就无论是时空的这种系统电力的系统还是网络的系统它们本身都是超级复杂的而这些标准化的系统它们之间就是相互支撑层层嵌套的时空的标准化是一切标准化的基础而电力的系统又是电气的系统网络的系统交通系统的一个基础然后电气和网络交通本身又是相互影响的它们都是一个健康复杂而又健康的生态

就每一种系统你都不能影响原有的系统也不能破坏其他的系统那么在这个标准的基础之上啊你又可以涌现出新的标准化的系统比如常说的这个小米的所谓的这个人车家智能家居系统那么这个系统又是建立在我们整个底层的系统之上的包括我们现在的这个新能源汽车呀以及大家说无人驾驶也好机器人也好以及 AI 技术啊

我们今天聊到的 AI 技术也好它都是建立在以前的这个标准化的之上的就是新的技术出现的时候你要制定标准的话你必然是要包容到已有的标准囊括不同时代的东西以及需要平衡不同的利益相关者照顾不同的这个 stakeholders 如果说按照这种标准来看的话实际上谷歌的这种 A2A 的这种倡议吧它

它其实就是符合这个原则的因为它是充分考虑的现有技术基础就是它在协议的介绍中是这么说的它说 A2A 协议是基于现有的流行的标准构建的包括 HTTP 包括服务器端事件就是 SSE 还有 JSON RPC 等等

就这个意味着它容易于就是现有的日常已经使用的这些标准进行集成那 HTTP 我们刚才说了就是超文本传输协议这个是我们今天互联网最基础的通讯协议然后这个 JSON RPC 的话这个叫做

Jason 远程过程调用同样是我们今天互联网上最常用到的协议啊就是你的客户端跟服务器他们之间的交互只要实现这种功能它都有可能用到谷歌的这标准还支持了不同的平台比如说 AI 的开发平台包括已有的自然语言处理模型还有数据库平台企业管理平台云存储平台之类的吧

然后谷歌自己还说呢他说这个 A2A 支持企业级的认证和授权接入者可以快速通过身份验证安全的获取数据保障数据传输的安全性和合规性防止数据泄露的风险这个其实就是刚才提到了我

开头那个文章里说的这种隐私和安全的问题就是说这个标准它是分为有边界和没有边界的有边界的就是你自己想开放哪些我在 API 的这个标准里面都可以去设置都可以去规定但是如果是单方面入侵式的这种就容易破坏生态其实这个我在做这期节目的时候我本来是想说就是你比如说像是我们今天这个新能源车很多加速度过快引起一些交通事故大家都说这个问题实际上这个就有点相当于说

它是单方面的对于现有的交通生态的一种入侵就是我们今天的交通标准是为我们已有的主要是燃油车时代的以及我们的行人和电瓶车不同的地方来博弈来互动出来来协调出来那你如果你是一个单方面的高性能车进入的话你是相当于是一种入侵者所以说这方面我相信很快它也会出现新的国家层面的制定一些标准啊

然后目前 AI 层面呢我觉得谷歌的这个思路算是给大家提醒吧相当于不一定最终大家这个协议就会胜出可能明天又会出现一个新的得到大家进一步的认可但实际上呢我相信它背后的一些原则是一样的

最后一个方面呢 AI 的标准还需要怎么制定呢我想先从一个也是最近的一个新闻说起这个新闻就是机器人马拉松它的官方名字是叫做人形机器人半程马拉松比赛这个是大家知道在北京益庄举办的我相信很多人都刷到过这个比赛的视频不是有个亮点就是那个松岩动力的机器人对吧它是获得了第二名这个机器人突然火

我当时刷了特别多另外呢就是语术科技是原本是为大家寄予厚望但是它的表现却非常不尽如人意啊那么这里其实就有一个很有意思的问题啊就是为什么这些机器人一定要使用人形的大家有没有想过这个问题你想机器人可以是各种形式啊比如我们已有的扫地机器人对吧送餐机器人这个都不是人形的

而且说白了就是如果造成人形反而不利于它的一个功能的一个发挥啊这其实也是我的一个疑问啊而且当时这个问题在一些微信群里引起了讨论啊然后我在微信群里看到有一个群友的一个观点我觉得这个观点还是挺令我有所思考吧他是这么说的他说

之所以这些人要造成人形的是因为人形更容易适应人类社会如果不考虑人形的话你当然可以想造什么形态都可以但是这些形态未必适应不同的场景

但是如果你模仿人形你就你可以让机器人最低成本去适应人类现有的这个社会他说特型机器人比如送餐的什么的他在某个场景下可能是最优但是你换个场景就不行了我们人类社会现在的各种标准都是适应人类开发的你造出人形机器人出来之后就是这些工具立刻就可以拿来使用吸尘器啊开火做饭啊这些工具都是为人类设计的

而如果机械人模仿人形的话就可以解决适配问题就是可以立刻融入到现有的这个标准当中它不排除未来发现更好的标准但是在初期的话肯定是模仿人形是最容易的也就是最容易适应人类现有的标准的那么看完他说的这段话呢我觉得挺有启发的而且我想到一句话叫做人是万物的尺度啊人是万物尺度当然这句话本身是一个略带有文艺色彩的一句话

但是实际上通过这种解读我觉得它具有了不一样的一个意思也就是我们确实是我们所处的整个世界一切人造物的存在一切的设计一些建筑设计都是为人服务的它所有的设计标准都是向人看齐的而且这个向人看齐你可以层次很丰富的去理解比如说如果用现代主义如果用功能主义那种就是说它就是为了满足人的纯功能的需求

如果你用这个人际工学的这个角度的话它是可以更加健康的更加舒服的去适应人类其实我觉得也很重要的甚至更重要的就是人的心理状态人的精神需求甚至我觉得最高标准就是人的尊严就是无论如何人自身才是最终的评价标准那么我们还是拿这个 AI 手机来说如果说他自己替用户点咖啡这个事情啊

它快了几分钟在功能角度它是适应的但是另一层面如果说我默认说它可以看到人的各种信息或者破坏软件的整个生态那么这个是一个矛盾的就是它提高了用户的效率但是它同时又伤害了人的隐私甚至说可以说伤害了人的尊严

最近我看到福布斯上面有一篇文章报道啊他是说国内的有一些 AI 助手存在着各种隐私缺陷的他里面举了一些例子看完这个我发现也不只是柔耀手机的这个问题这篇文章里面是说他说目前硅谷的一些 AI 的技术呢

都在讨论技术基准和 API 的整合但是国内的有些手机厂商他在搞屏幕感知的技术流派这个屏幕感知就刚才说的读屏识别的他说通过开启电脑上的无障碍的功能去发展 AI 他举的例子包括好几个国产手机品牌不一一说了好像把所有品牌都说一遍莫名其妙然后他还举了豆包的一个例子

他说豆包最近推出了一个屏幕共享通话的功能在这个功能启动之后呢豆包能看到你的微信的聊天的内容也包括它识别你电脑上的各种应用程序可以说你桌面上就是已经打开的一切的软件和界面他都能看到

那么这个方面呢我们可以理解就是 AI 的这种做法显然是越界了对吧你作为一个人工智能你只是为了解决我某个问题啊我只是问你这个李白的经验词是怎么写的然后你就把我所有的文件都看一遍好像说我求助你问个路我说这个

洗手间怎么走然后你就把这个我身上所有东西包括我的身份证什么都抄了一遍这个显然是不合适的在这篇文章的最后呢他提出了一些建议一些注意事项比如他应该是通过正式的 API 清晰的边界明确的行动范围

以及进行沙盒化的操作还有一定要用直白易懂的语言来让用户知道就是说请求他们的允许是否真的同意这么做还是说用户什么都不理解这些术语是什么意思搞得特别厚色难懂让你同意我只能点个同意这个就是一种说实话就比较强势的一些做法了

当然还有对于数据的保护和处理需要去重视当然它这个是一些原则性的描述啊而且在目前的这种初期的 AI 发展阶段我们也很难说最后的这个 AI 的生态系统能建立到什么程度我们只能说这个给出了一些原则方向啊当然我认为啊这个行业的差别肯定不是说中国和外国的区别说中国的一定清算是银子这个不是的这个肯定不是的因为无论是哪个国家的用户

对于隐私和罪严的需求都是一样的国内的话我们也有对于这种 AI 标准建立 AI 隐私保护方面的提议福布斯主编文章里面他就说他说雷军曾经呼吁过为这个 AI 建立标准包括建立分级体系包括隐私保护框架这个我还专门搜了一搜这个观点是今年三月份应该是就是雷军把海尔的 CEO 周云杰带火那次

他在两会上说的他这个提案叫做关于加快推进人工智能终端产业高质量发展的建议他说应该强化人工智能终端产业协作构建应用协同生态由行业组织牵头联合

终端厂商应用厂商大模型厂商等等加快构建统一的终端设备与智能应用之间的接口规范与数据格式这个设备厂商其实指的就是手机嘛包括小米手机华为手机什么的大模型就不用说了啊然后应用就是手机软件应用嘛它的意思就是建立一个健康的生态啊

然后他说力争到 2030 年之前形成两至三类相对统一国际领先的智能终端操作系统平台促进百亿级终端应用的跨界无缝互通建成开放共赢的人工智能终端创新大生态这是比较高屋见领的一个建议我觉得它是展现出了雷军对于 AI 产业发展的一个很深刻的洞察

它是提出了一种要构建创新的一个生态包括接口规范包括数据格式数据隐私那么实际上如果我们根据我们历史上这些标准化的经验来看它也是历史上各种技术标准化成功的一个重要的一个点就是你需要平衡各方的利益如果你是单方面推行的话肯定是无法服众的这个是很现实的

所以说如果我们展望一下的话我相信啊就是说我们从国家层面上也会通过系统性的这种法规法律啊逐步建立 AI 发展的这个标准回顾过去工业化时代的电网接口统一了电力传输标准让电灯照亮千家万户

结尾这几句其实也是 AI 写的怪不得这么赞美 AI 呢

好吧这个就是我们今天的迷因电波节目我们今天主要还是说通过对于手机的灵感以及最近麦德斯的一些新闻吧来聊一聊我们今天的这个 AI 时代这个标准如何制定因为我个人来说我其实一直对于这种接口类的标准化的东西其实挺着迷的比如我们前买笔记本的话你会发现笔记本上面有各种接口

音频的视频的接投影仪的接电视机的都有但是今天我们就只有一个 Type-C 接口这个就是展现了一种时代的变迁其实也展现出计算机从家用电器中的一环对吧中间变成一个中枢这个是它的一个改变另外呢本期节目我本来还是想聊一聊这个小米苏 7 以及道路交通法规以及汽车发展史上一些东西但是我们这个案例有点太多了我们有时间可以继续跟大家聊一聊

感谢大家收听欢迎大家在小红书微博即刻上搜索范敏扬关注我欢迎大家在我们节目评论区里面进行交流我们下期再见今天的谜音电播节目就到这里感谢大家收听我们的背景音乐是来自于青岛的乐队格楼演奏班那也欢迎各位朋友们在小宇宙喜马拉雅网易云音乐等不同的平台上关注我们的节目关注谜音电播再次感谢大家我们下期见

084. 铁轨、插座与暴力读屏：从蒸汽机时代到AI时代的标准制定 44:45 Share

迷因电波

Deep Dive

Shownotes Transcript

084. 铁轨、插座与暴力读屏：从蒸汽机时代到AI时代的标准制定