We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 总第043期:信息技术边角料

总第043期:信息技术边角料

2024/6/30
logo of podcast 读报teleread

读报teleread

AI Deep Dive AI Chapters Transcript
#artificial intelligence and machine learning#literature and publishing#ai and public perception#art and technology#agi discussion People
主播
以丰富的内容和互动方式帮助学习者提高中文能力的播客主播。
Topics
@主播 :本文主要探讨了信息技术领域的几个重要议题,包括AI模型的数据获取方式、版权纠纷、能源危机对技术发展的影响以及对AGI的未来发展趋势的担忧。Perplexity AI绕过反爬虫机制获取内容,引发版权争议,其辩解为信息聚合而非模型公司,但这种做法损害了媒体声誉。大型唱片公司起诉AI音乐生成器侵犯版权,反映了版权问题日益突出。此外,文章还分析了信息图“Calculating Empires”中展现的信息技术发展与能源、政治、经济、社会文化等方面之间的复杂关系,以及摩尔定律的局限性。最后,文章表达了对AGI潜在风险的警惕,并通过对《Harper’s》杂志文章《The Gods of Logic》和短篇小说《The Approach of a Dangerous Fate》的解读,展现了对技术发展背后伦理和哲学层面的思考。

Deep Dive

Chapters
WIRED and Forbes accused Perplexity AI of bypassing anti-scraping mechanisms to collect content, then delivering low-quality or fabricated responses. Perplexity AI's defense is that it's an information aggregator, not a model creator, but this is seen as a deflection. The episode discusses the ethical and practical implications of this behavior, comparing it to the function of a QR code that leads to other information sources.
  • Perplexity AI accused of content theft and fabrication
  • Use of undisclosed IP addresses to bypass anti-scraping measures
  • Low-quality responses despite extensive data collection
  • Comparison to a QR code: a gateway to other information sources

Shownotes Transcript

欢迎收听独报这是一档杂志文章的阅读分享节目我们的目标是希望借助外文报道看到更多的人和故事我们相信总有人对外面的世界有所兴趣与好奇

他用這個橫縱畫出一個現象之後排布了非常非常多的東西上去然後是一個非常有趣然後又信息量極大的一個卷子

大家好,欢迎收听读报,这是我们的第 43 期这一期节目呢,会有一个新的栏目吧,有一个新的栏目会放在后面 As always,栏目的详情也是会在后面一起介绍所以希望大家可以听到最后以及第一篇主文开始之前,有一个新刊我想快速说一下,就是大西洋月刊的新刊七八月何刊

呃算是气候变化专题封面故事来自 George Packer 这是夏城年代的作者我们在三年前也就是 02 或是 03 期的时候报过他的另一篇文章呃

这一次它的主角是凤凰城,这是一个常年与炎热跟缺水斗争的美国城市,它觉得这个地方面对气候问题的态度很能代表整个美国的基本困境和权力斗争。

我为什么快速说呢是因为这篇文章实在是太长了真的太长太长了 George Packer 又是那种我会尽量努力看原文的作者所以我真的很努力但是也还没有看完但是没办法细讲然后这一次的新刊也非常非常的厚实一共 124 页

所以还是有很多相当不错的内容的我预感这一集应该也是一个相当不错的封面故事而且是比较典型的特稿写作有兴趣而且也有耐力的朋友们欢迎自己去看一看这期还有另外一篇也算是重磅来自美国前传染病研究所所长福西新出版的自传这是一篇节选写了他在 COVID

降临美国的头三个月时他在政府内阁的一些见闻视角和 George Packard 那篇文章有一点类似也是在写一个大的公共事件但是想要关注的重点是这个背后政客的或是各种不同的权力方之间斗争给整体带来的影响所以我觉得也是蛮值得看的一篇这篇相比之下没有那么长

整个大西洋的新刊都还蛮有意思的就是阅读的工作量会比较大啊所以我只能快速讲一下好今天第一篇主任是来自 y 这个事情还是在外网引起了一些讨论的 populist is a machine

很长一段时间 Publicity 不管融资的时候还是这个产品出来的时候已经算是声势浩大了完全算得上是个明星公司且我就前两周吧最开始是福布斯指控 Publicity 绕开了反爬虫机制提取福布斯的网站内容随后 Wire 也发现同样的事情出现在了自己的身上而且 Wire 的母公司 Containers 旗下其他的刊司也同样被 Publicity 窃取内容

Pipelacity 曾经是公开过他们爬虫工具的 IP 地址列表的虽然我想主要是为了摆一摆姿态透明化嘛公开透明化但 Wire 这次的发现是至少有一个没有公开的 IP 地址在绕过反爬程序继续访问和提取内容

还有一种情况是那些公开了的 IP 地址从来没有在 Wire 的服务器日志中留下任何可以识别跟追溯的痕迹这个让人非常疑惑他们究竟是怎么展开工作的所以 Wire 就针对 Property 本身的这个工作流程先是展开了测试投喂了几十篇他们网站上的报道文章然后写 Prompt 提问相关的内容

有时候这个 chapel 是能仔细的检索到相关的报道相关的故事而且回答出来但有时候没有那么准确也不会注明来源

当然了现在的 AI Treble 基本上都有误差都有幻觉这个也非常正常大家也都知道可是呢 Wire 仔细检查之后发现呢 Publicity 是在根据原文的超链接地址里面的一些关键字还有一些搜索引擎里面的碎片信息结合一些摘录结合一些 metadata 重新编排出一个内容再返送给用户

in other words the magic trick that made publicity with 10 figuresappears to be that it's both doing what it says it isn'tand not doing what it says it is 它确实是有所为有所不为但是是反过来的跟他们明面上的这个自我标榜是反过来的这是一个非常非常有意思的东西然后我觉得这个事儿也有一个非常微妙的界限如果强行突破反扒程序提取内容然后再发布在

比如说自己的网站上面吧这个叫做窃取就是直接拿了别人的东西

但是如果先拿人家的内容再拼拼凑凑缝缝补补组合成一篇新的东西给到用户这种行为在我们中文里面有个更专业的词叫洗稿还有什么容梗我们就先不回到老生常谈那一套去说啊这个抄袭洗稿模仿容梗之间的区别是什么这个要扯的话是另外一个话题

但这个问题是在于或说 Wire 的主要意图是想要指出 Publicity 在绕过 Wire 自己设计的反扒程序而这套反扒程序恰恰是根据他们曾经公开的 IP 地址列表来设计的这就是一种暗度陈仓

我觉得有一些吊诡的地方是什么呢就是如果那么费尽心思搞来的内容并没有提高生成答案的准确度和可靠性就是他给出的总结依然是有误差依然是有幻觉的甚至还会凭空造出不存在的内容来那这个 Pepharsity Bell 的模型抓了那么多的信息抓那么多的数据到底是为什么呢它的意义体现在哪里呢

而且从媒体的角度来看跟这些大模型公司合作也是希望自己的内容能够被妥善地解读分析然后分发送到真正有需求的读者面前如果模型只是胡编乱造受损害的恰恰是原发媒体的声誉所以我也把这个话说得非常明白 Publicity 这样的做法是 A process is something likedescribing a meal by tasting scrapsand chimneys fished out of garbage can

垃圾桶里找饭吃很毒的一张嘴 Priplicity 的辩护是咱不是一个做模型的公司模型是来自 OpenAIMetaEntropy 这些地方相比之下 Priplicity 只是一个信息聚合器 Aggregated Information

这个其实是有点转移焦点的因为也没有直接解释他们到底有没有借助某些手段来做信息抓取是不是足够的透明公开就他的这个回答他的这个回复并不是 Vaya 所指控的内容但是我看到这里的时候我突然其实想起来很久的一个一个闪念我当时没有细想只是一个念头

也是因为一个什么新闻这题我忘了我当时有一个揣测就是 chapot 像 publicity 这种基于问答的 chapot 最后起到的效果会跟二维码有一点像用户会通过它进入下一个地方扫一个二维码会让你跳转到某一个 app 某一个网站

或者就是 whatever it is 总之你会通过它去到下一个地方然后目前的 Tripod 也有类似的功能而且它是让我更明确地知道接下来要去哪一个网站看哪一篇文章去哪一个地方核实和继续深挖相关的资料

因为毕竟就算是 GBT 我也是要核查跟确认信息的嘛或是通过它提供了一些线索继续查下去那二维码可以打开更多的门而且所有的形态的内容都可以被浓缩在这些黑白方块上可以带你去到任何地方但是归根到底你不会停留在一个二维码上你只是经由它去掉下一个目的地我觉得这个跟 Chapel 目前在我这其他的作用非常非常相似

像这一次 Wire 爆出来的这个事件也进一步的体现出这样的角色和功能 Publicity 只是一个中转站你当然可以说它是信息聚合器但是它也更多的像是一个中转站它会带你去到更多的地方可是你不会在这上面有过多的停留那我也理解从产品方的角度来讲这是一个蛮让人焦虑的事情毕竟用户的活跃数是一方面用户的停留时长是另外一方面

版权纠纷其实只会越来越多上周 6 月 25 号吧 NYT 报了包括索尼、环球、华纳在内的大型唱片公司集体起诉 Video 和 SUNO 指控他们使用自己的版权内容来训练大模型认为他们侵犯了版权并要求赔偿另外也还有 NYT 自己起诉微软和 OpenAI 等案例

唱片公司的这个案子应该是得到了美国唱片协会的支持唱片工业协会 Recording Industry Association of America 他们的主席 Mitch Glacier 上 Hufford 播客接受采访讲了一下这个案子讲得非常好

就是包括为什么要打这个官司那个必要性跟理由跟动机在哪里 SUNO 和 YOLO 目前发出来的一些辩护和声明有哪些问题在法律上有什么漏洞以及纠结版权到底是不是拖了这个技术发展的后腿是不是在阻碍技术发展他都讲了一些不错的见解相关的链接我都放在 SUNO 里大家有兴趣的话可以看一下

今天第二篇第二篇其实不算是一个文章我觉得是一个我称之为信息技术考古百科大全图它

它其实是一个 infograph,但是是一个信息量非常非常庞大的 infograph,一个也可以做交互的互动内容,calculating empires,我首先说一下它的问题啊,这个互动内容最大的问题有两个,一个是它太大了。

实在是太大了每次在它是一个你进入网页之后你可以看到它的整张图次第出现但是你每当想要进入某一个具体的小的板块的时候需要拖拽或者放大的时候都需要重新加载

都要等个大概半秒或者一秒左右等它完全加载出来加载的时候就是黑屏这个是一个挺影响体验的问题那你要等了半秒一秒的黑屏也还挺难受的

另外一个问题是基本上只能在电脑屏幕上看我一开始是用手机看的手机你只能看到一个非常小的角落它没有办法缩到那么小虽然手机上你用手指移来移去很爽但是没有那种非常全局化的观看感受而这个全局视角就是这个整个所有信息铺开来的观感是这个卷轴最宝贵的地方

如果你用电脑看的话,一定要先去右上角,右上角有一个 Audio Tool,要先听完这个说明,我是跟完了这个 Audio Tool 之后才发现这是如此丰富的一个内容。一开始我还以为它只是在讲信息和能源之间的关系,Power 嘛。

我觉得这是一个马上要被热烈讨论的议题就很多人都知道摩尔定律对技术发展的意义但是摩尔定律再往后它还有更多更深层次的因素而能源就是其中之一所以一开始我以为它是讲信息技术发展和能源之间的这个关系后来我才发现这个 power 不仅是 intensive energy

它也是 rhetorical 的是 in terms of ideology 的是那些包含了政治经济社会文化层面的 power 权力这一切跟信息技术发展之间的关系

都可以在这个卷轴里面找到比如说 1950 年代新自由主义在政治经济层面飞速发展的时候相对应的就出现了一些自动化的产品比如什么机械币这些都是比较初步的人开始尝试对自然力量对人工的力量进行一些 automization 这是其中一步那一开始是在工业生产的场景一路一路细化逐步发展到今天机器视觉的方向

再往下走需要更多的数据那就牵扯到对人的行为数据的获取识别和使用那就是 biometric 那这部分你可以看到它是 neoliberalism 和 robotism 这两个板块再往左拖一点点同步于整个 automization 在发生的还有进入 21 世纪之后不断时有出现的能源危机

从图片上可以看到有代表石油、煤矿、天然气的三个竖条,进入 21 世纪之后都是越来越粗的,但是 crisis 也出现的越来越频繁,这个竖条就代表了不仅能够开采的资源越来越多,也代表了需求越来越大。

那这个时候就在能源这一块你纵向上下拉就能看到过去 1500 年以来能源开采和使用的历史的演变所以横轴是不同的板块纵轴是时间历史线他用这个

横纵画出一个现象之后排布了非常非常多的东西上去然后是一个非常有趣然后又信息量极大的一个卷轴几乎像一个百科全书一样的存在但是是用交互的方式去呈现的

我觉得它跟文字的百科全书最不一样的地方是翻书的逻辑是线性的你要么往前翻一页 往后翻一页这个基本上是线性的但在这个卷轴上你的交互是非常直觉性的然后你能看到每个板块之间有那种千丝万缕的联系因为它有那么多的线条它在暗示各个板块之间工业

互相交错的那种意义上面的联系所以有很多的留空你就可以自己再去挖掘和深入探索呢我非常推荐大家去研究一下这个内容也很杀时间就在里面这里看看那里看看查一查这个词是什么意思查一查那个人物是谁一不留神一两个小时就过去了

无独有偶啊同样也是讲技术话题的 Happos 七月刊的主题是 Resisting Artificial Intelligence 在 AI 相关技术相关包括什么数字媒体社交媒体相关的话题上很多时候我选的文章也好我的自己的评论也好大部分听上去是以批评居多的

但是我可以说在底子上并没有是否定技术的意思也没有主张过说要砸烂机器然后所有人退回石器时代包括这些媒体作者在内没有人是这样的主张但是这一次 The Harpist 这一刊尤其是它的这个主文我看完之后封面故事我看完之后

心里是有一点犯嘀咕的就是说这个作者好像真的没有那么的没有那么的 found of 这个新的人工智能技术可是他又写得很好在他的论述上又很有说服力这篇文章是 The Gods of Logic Before and After Artificial Intelligence

让我比较意外的是它是从沙丘开始写起的当然不是电影啊是沙丘的原著从里面的圣战开始其实 Herbert 没有详细写圣战到底是什么它只是用来作为整个沙丘故事的一个前提但圣战代表了一种相对很早期的人们对于技术失控之后的恐惧沙丘是上世纪 60 年代的作品嘛然后圣战之后人类就进入了一个

既原始又先进的新的荒野地带这篇文章是由沙丘开始的然后又跳到了 19 世纪中叶的数学家乔治·布尔计算机语言中那个逻辑运算布尔运算还有它的那个结果布尔值就是来自于他的发明跟发现

我认为人类是一个在智能的改变中的过去阶段

你不能直接進行電子智慧發展它需要太多能量和太多小心的製造你需要生物智慧發展所以它可以創造電子智慧電子智慧可以將人們寫的一切都吸收得很慢這就是 CHAT-GBT 所做的但它可以開始得到世界的直接體驗並且學習得更快

可能會讓我們一直在運作的電子工程車站運作但之後可能不會了所以好消息是我們想了解如何建造無人物這些電子智能器在一塊硬體死去的時候它們就不會死如果你有重量的重量存在你能找到另一塊硬體可以運作同樣的指示你就可以再次把它們重新生存

整体上这篇文章算是一个相当强烈的警惕的态度吧而且它的警惕更多是针对我觉得是针对 AGI 而且是针对 AGI 极有可能跟人太像了这一点

在我们现在都还没完全想明白 AGI 是什么的情况下一个已经足以超越人类的智能体直接就出现了那是很需要紧张的我觉得这个是这篇文章的一个基础态度但它的 audit 是非常非常不一样的

argument 分为两种吧一种是说理 讲道理这种呢通常有比较明确的指向对象比如某一个事件某一桩新闻某一个具体的争议等等这是说理还有一种 argument 重点在于表达自己底层的理念

比如说我个人对大圆模型的态度一直以来都还算比较正面的我是觉得语料作为基础构建这个点在我这里 make sense

但是我认识另外一位就是极客商人大 V 我跟他交流他认为他的观点是语言是抽象的语言不是实质的具体我有点忘了他能论述得非常详细但是详细的东西我已经记不得了但他的 argue 并不在于我的观点正确与否而是他的主张是什么以及他的主张背后有一个怎样的逻辑架构

这种是基于底层理念的 argument 所以这篇文章其实是后者它是在表达自己整体对于人工智能这件事以及人工智能背后的几个关键主要逻辑架构的主张跟想法只是如果你看它的色彩的话确实是比较警惕而且有点高度怀疑的

除此之外剩下的东西我觉得有点难总结就它具体的论述的那个逻辑线条比较难总结因为其实如果你去读原文的话你会发现不难懂也不难跟上只是比较难总结真的就是比较难总结这种基于表达自己底层理念的 argument

就是比较难总结的而且从写作风格上来看也比较的春秋笔法它不是那种论点一二三然后论据一二三就全部摆出来加加减减然后就得到结论像一个几何推导一样它不是这样的然后也不是像

上面 WIRE 的那种调查报道的写法也不是相比之下这篇就是典型的 asset writing 先发散出去然后又收束回来它最后的落点依然是落在沙丘和它的这个圣战上面的

我其实非常喜欢这种 asset 的写法尤其是用来写技术选题的时候这种写法在写比如说电影评论是比较常见的或是写一些文化艺术评论是蛮常见的然后用来写技术选题的时候

会有一种不一样的碰撞而且它有一种素养在里面一种非常恰到好处的娴熟的驾驭春秋笔法这个东西在国内被人批评的体无完肤了但你真的要写好不是那么简单的它是非常非常关注你对素材的理解跟挑选的

所以这篇文章就类似你能看到它有一种暗搓搓的劲儿它默认你了解了大部分的关键概念关键角色所以不会过多地去解释背景信息它不会去纠结相农是谁而只是蜻蜓点水地摘出最重要的几点挑出自己认为最有效的素材放

放进去然后就继续自己的论述了你也可以说这是一种卖弄你也可以说它是一种装逼但我个人 take it as 言简意赅这个里面就隐藏了作者的选择和倾向而这种选择和倾向实际上是一种审美的体现

而且这种心停点水流出了很多空间我可以自己回过头去研究它并没有试图用干货把你塞到窒息而是流了非常多的空间是一个比较疏松的结构我是挺喜欢这种方式的我很推荐大家去看这篇文章就这么说吧你可以看到一篇用写影评的方式来写技术选题的 essay 好最后终于要介绍新的新的东西了

如果说这过去以来那么多的新闻媒体里面有哪些内容总是在被我错过的话那就是虚构写作不管是纽约客大西洋 WireHoppers 再到纽约书评巴黎评论这一些媒体其实一直以来都会留一席之地给小说给诗歌总而言之都是纯虚构写作都是 fiction

纽约科是最典型的可是我一直都没怎么放过这部分内容可能会念一下可能很有限会挑一些我觉得有趣的书评有趣的小说的东西没怎么放是因为不太知道怎么放比较好直到前段时间把巴黎评论的播客拿出来听我之前记忆里巴黎评论和他们的播客就只是做一些作者的访谈或者分享一些新书

后来也可能他们改版吧之类的我发现他们其实是在用有声剧的做法来分享摘录他们跟 Carrie 的某一些故事国内的话他们的做法其实是化到有声剧这个品类里面的不是有声书是有声剧

我意识到它确实是一种非常合适的方式虽然也是一个非常费力气的方式今天就暂时不多说啊今天就先不讲有机会可以再讲一讲制作层面的这东西非常有意思

今天的故事呢是来自 Helps 也是同一刊子 Resistant of Artificial Intelligence 这个里面有一篇短篇 Approach of a Dangerous Fate 我只摘了靠近结尾的这一段来做声音剧场几百字而已几百字的工作量已经非常致命了非常可怕了然后这个故事大概是一个失忆者的故事一个处处不得志的中年男人逐渐丧失对一切的希望

三段式的结构,然后最后一段他遇到了一匹发狂的马是图安福这匹痛苦的马整体上像一个预言,又像一个原叙之总之是一个非常适合用有声剧的方式来分享的一个故事 Hope you enjoy itThe Approach of a Dangerous Fate by Kevin BarryHe lost his faith in God around half four in the morning

那是一只…是甚麼?

我今天是很累的他嘗試站在他的腿上但被它摔倒了然後把某些金色的衣服摔到他的臀部上了耶穌基督,冷氣會通過你這幾天我到底在想什麼?狗狗偷懶了自己,然後把他穿上了錯誤的衣服,然後牠被綁起來了那裡有一個痛苦的地方

他爬起来,踩着狗腿。他像是被一名狗狗的手机执行。他把手放在马上。她轻轻地摔倒,然后回来,但只有几步跳舞。他和她在一起。她再次向下蹲下,他把手放在她面前,他感觉到狗狗的热烈呼吸在他的嘴巴上,然后他往前踩着狗狗狗的嘴巴。他无论如何都开始唱。

他走出了那里,说了一句话。"Paramita, Paramita, 生命是我的一切。甜蜜的 Paramita, 无论如何,无论如何,我都会为你生命。"当时,马上就在她的腿上,在她的旁边,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上,在她的腿上

pain was no more or at least not so he could feel itwell, peace in youhe said 以上是今天的全部内容我推荐你关注并订阅独报的 Telegram 频道那里有更多的阅读手机和个人化协作感谢你对节目的收听并欢迎分享我们相信总有人对外面的世界有所兴趣与好奇

We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

Export Podcast Subscriptions