We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode Breaking the internet

Breaking the internet

2025/2/19
logo of podcast Today, Explained

Today, Explained

AI Deep Dive AI Chapters Transcript
People
A
Addie Robertson
M
Mark Graham
S
Sean Rameswaram
Topics
Sean Rameswaram: 我关注到特朗普政府正在清除政府网站,这正在加速数字内容的衰败,并且危及了我们对自身的记录。政府网页正在消失,这属于一个更大的在线问题,即数字内容的衰败或链接腐烂。我们的互联网正在消失,我们需要了解其重要性以及我们可以做些什么。 Addie Robertson: 特朗普签署的行政命令导致政府在种族平等、跨性别者等方面的信息被大量删减。特朗普政府正在清除政府网站上的信息,包括气候变化和种族平等方面的内容。在恢复数据时,会在网站上添加声明,表示其反对这些信息。虽然历届政府都会更改数据以适应其优先事项,但特朗普政府的数据清除规模空前,甚至影响到人们工作所需的信息。特朗普政府的数据清除规模前所未有,尤其是在记录和科学研究方面。非营利组织和记者正在努力保存这些信息,互联网档案和回溯机器也扮演着重要角色。互联网面临着链接腐烂或数字衰败的问题,导致网页消失或难以查找。一项哈佛研究发现,最高法院案例中一半以上的超链接已失效。网页消失的原因有很多,包括网站关闭、URL更改等。链接腐烂是一个长期存在的问题,但近年来由于一些特殊情况而加剧。搜索引擎优化导致一些网站为了提高搜索排名而删除旧文章,造成信息丢失。互联网商业化和赢利导向导致一些旧网站被复活,但内容被AI生成的新文章取代,或链接被劫持。丢失的网络信息有时包含统计数据或证据,也具有文化价值。 Mark Graham: 互联网档案的回溯机器一直在持续地保存网络信息,即使网站关闭也能找到之前的信息。互联网档案的回溯机器每天都会存档数百万个URL和网页,并通过链接不断扩展存档范围。互联网档案的回溯机器会对存档的资料进行索引,并提供给用户查询。虽然美国国家档案馆和记录管理局也进行存档工作,但互联网档案的回溯机器是存档公共网络(包括美国政府网站)的主要参与者之一。政府网站的变更在一定程度上是正常的,但目前政府网站的消失、恢复和不可靠性程度不同寻常。目前政府网站下线的情况与以往不同,数量似乎更多。互联网档案的回溯机器主要依靠捐款,能否充分存档互联网取决于主观定义,但其努力的目标是成为最好的图书馆。丢失的网页,即使是短暂存在的,也代表着对历史记录和信息完整性的缺失。

Deep Dive

Shownotes Transcript

唐纳德·特朗普总统已经回到办公室一个月了。这一年发生了很多事情。我们在过去一个月里报道了很多关于特朗普的新闻,从赦免到行政命令,从格陵兰到关塔那摩,从关税到马哈,到埃隆,埃隆,甚至更多的埃隆。但今天我们要谈谈网站。DEI毁了我们的国家,现在它死了。

我认为人工智能已经死了,所以如果他们想清除网站,我同意。政府网页正在消失。有时它们会回来,有时不会,这是我们在网上遇到的一个更大问题的一部分。有些人称之为数字衰变,另一些人称之为链接腐烂。无论你称它为什么,我们的互联网正在消失,我们今天将在节目中帮助你了解它为什么重要以及我们可以做些什么。

无论你在度假中寻找什么,你都可以在弗吉尼亚海滩找到。当你到达那里时,你将能够享受世界上一些最好的文化景点、活动和烹饪体验。你可以漫步在世界上最长的休闲海滩上,它绵延数英里。

或者你可以参加他们的年度节日、音乐会和滨水餐厅。如果你想吃晚餐,一定要尝尝他们新鲜的当地海鲜和农场到餐桌的食材。这是一次全家人都终生难忘的旅行。访问visitvirginiabeach.com了解更多信息。

好的,商业领袖们,你们是来玩的,还是来赢的?如果你想赢,那就认识一下你的下一个MVP吧。甲骨文公司的NetSuite。NetSuite是您在一个方便的套件中拥有的完整的业务管理系统。使用NetSuite,您可以通过在线仪表板运行您的会计、财务、人力资源、电子商务等等。升级您的策略,切换到NetSuite,排名第一的云ERP。在netsuite.com/vox获取首席财务官的AI和机器学习指南。

netsuite.com/vox。

Sean Ramos在这里与The Verge的高级编辑Addie Robertson一起,来告诉我们关于网站的事情。政府的网站怎么了?所以特朗普签署了几项行政命令,其中一项正式定义了只有两种性别,男性和女性。另一项命令终止了政府中所谓的“多样性、公平与包容性”。

我们将建立一个没有种族歧视、以能力为基础的社会。因此,结果是,在政府中或多或少地,除了我们在第一届特朗普政府中看到的那种情况,其中包括清除有关气候变化的信息,

以及其他一些与气候相关的一般性问题,我们已经看到对任何涉及种族平等、跨性别者或任何共和党文化战争主题的大量削减。

疾病控制与预防中心目前正在清除其网站上的信息,以遵守最近的一项行政命令。以下是一些已关闭的页面。- 特朗普政府已从联邦网站上删除了ReproductiveRights.gov。他们还清除了联邦网站上的任何搜索

最初很多事情都发生得很悄无声息。

记者们注意到了这一点。使用这些网站上信息的人,包括疾病控制与预防中心的数据甚至交通统计数据,他们最终发现了许多这样的情况。从那时起,特朗普政府主要通过回应诉讼来处理此事,声称他们不当删除了这些数据。法院命令要求他们将其恢复。

他们通过添加一个大横幅来回应,上面写着:“我们拒绝这些信息。我们被迫将其保留在线。”但这违反了例如我们关于只有两种性别的规定。因此,我们认为它不科学,或者我们认为它违反了我们的政策。本页上任何宣传性别意识形态的信息都是极其不准确的,并且与存在两种性别(男性和女性)这一不变的生物学现实脱节。

是否有总统先例发生过这样的事情?或者唐纳德·特朗普、狗狗币和埃隆·马斯克以及他的同伙是第一个上任就着手拆除网站的政府吗?

首先,为了说明情况,每次新总统上任时,数据都会根据他们的优先事项发生变化。有一些新的项目或旧的项目会被淘汰。因此,有些事情发生变化并非一定令人惊讶。但是,作为其中的一部分,我们已经看到了真正前所未有的巨大变化。

信息的删除,包括人们在白宫以外完成工作所需的信息。所以现在这是一个非常重要的问题。

我认为我们从未见过这种规模的数据清除,特别是记录和科学研究的数据。显然,第一届特朗普政府以看似非常意识形态的方式删除了一些数据,旨在压制有关气候变化的信息。白宫和其他联邦机构也在改进其网站,例如,删除对气候变化的提及。

特朗普受到了猛烈抨击。显然,在任期结束时,有些页面消失了,但这往往更多地与监督有关。这往往更多的是因为换了人,他们真的不知道所有东西在哪里。所以有些网站消失了。有些网站消失了又回来了。有些网站仍然存在。有没有人完全掌握到底有哪些东西永远消失了?是的。

有一些非营利组织和记者正在努力保存这些信息。在特朗普上任之前,就已经有一些团体,例如环境数据和治理倡议,我们在特朗普的上一任期中看到了一些这样的情况。因此,这项工作是预先保存信息,这不仅包括网页,还包括来自疾病控制与预防中心等团体的各种数据,

所以所有这些,并非一定是支离破碎的,而是个体和私人的努力。而这里真正重要的机构之一是互联网档案馆和Wayback Machine,它一直维护着这个项目,在每个任期结束时存档数据,但现在已经成为一个你可以去检查和查看哪些内容消失了的地方,并且已经……

成为识别和尝试恢复数据过程的一部分。除了美国人民可能需要访问这些信息之外,除了许多机构需要访问这些信息之外,它还指出了我们现在互联网上存在的更大问题,对吧?一些叫做链接腐烂的东西?链接腐烂或数字衰变。

这是一种普遍现象,网页要么消失,要么以更难以找到的方式移动。因此,互联网是一系列指向信息的链接,最终会留下所有这些细小的悬空端、死链接以及你再也找不到某人提到的信息或根本找不到其记录的地方。

例如,2013年哈佛大学的一项研究发现,最高法院案件中一半以上的超链接(今天的脚注等效物)都已损坏,这种现象被称为链接腐烂。

为什么网页会消失?最明显的情况是网页被删除了,也许有时是因为整个网站倒闭了,也许有时是因为他们认为该网页不再有价值了。政府机构删除文件,公司倒闭,以及它们托管的网站。想想GeoCities、雅虎视频,以及最近的新闻网站Gawker。还有一些事件,只是它的URL,指向该信息的链接

发生了变化,因此更难找到。因此,如果你以前从另一个网页链接到它,那么它就不会再去了。令人惊奇的是,它非常非常简单。任何人都可以在他们的电脑上设置一个网络服务器,并将其提供给全世界。不幸的是,它太简单了。它很脆弱。如果该设备、该网站发生故障,就会瞬间消失。所以你一直在报道这个问题,Addie,超过10年了。

在线链接腐烂的情况是否越来越严重,或者它是否在持续进行?链接腐烂一直是一个人们从互联网诞生之初就以某种方式识别出来的问题。但至少十年来,相当一部分网页和链接都无法正常工作了。我认为最新的研究结果是大约

2013年存在的38%的网页现在已无法访问。我认为,这并非突然恶化的一个问题,但我认为我们现在看到的一些独特情况加剧了这个问题。

其中之一是搜索引擎优化之类的东西,谷歌奖励定期刷新或似乎提供新信息的页面,或者至少人们认为它奖励这样的页面。因此,例如,CNET(一家非常古老的技术出版物)删除了其许多较旧的文章,因为它希望在谷歌搜索结果中排名更高。

更高。因此,人们认为,好吧,这使得人们更有可能找到当前的文章,但也让大量的资料消失了。对。我的意思是,我认为我们都可以为2003年我们GeoCities主页的消失而哀悼。雅虎!雅虎!

但当,比如,我不知道,某个亿万富翁收购了一家另类报纸,然后有一天决定关闭其网站时,情况就糟糕得多了。有时是亿万富翁收购了东西然后关闭它。我还有一些更阴险的现象我认为——

真正反映了互联网的商业化以及任何可以转化为利润的东西的蚕食。因此,您拥有旧网站,例如拥有人们认识的名称,然后它们被复活,但它们不再拥有旧信息。它们已经被人工智能生成的新的文章所填满,这些文章可以利用这个旧名称作为僵尸网站。或者

或者您遇到链接失效的情况,有人试图劫持该链接,他们要么联系网站管理员,要么找到其他方法让它指向一个新页面,然后建立自己的信誉,但不会提供原始信息。因此,在所有这些情况下,档案都让位于利润。

这些信息有时很有用,因为它提供了统计数据或证据。例如,如果您查看维基百科,并且有一个死链接不再提供它过去提供的信息。有时仅仅是因为这些东西是宝贵的记录。

互联网过去的样子以及人们的生活方式。很多东西曾经写在纸上或其他某种介质上,那是一份硬文档,人们可以回顾它。但在这一点上,我们的大量文化都在互联网上发生,而互联网是一个非常脆弱的地方。

TheVerge.com的读者Addie Robertson。在《今日解释》回归时,我们将前往Wayback Machine,听取那些试图一次一个网页地存档整个互联网的人的意见。♪

本节目的支持来自Robinhood。有了Robinhood Gold,您现在可以享受贵宾待遇,在退休金缴款上获得3%的IRA匹配。特权不再是特权的专属。有了Robinhood Gold,您的年度IRA缴款将增加3%。此外,您还可以在您的现金和非退休账户上获得4%的APY。这超过了全国储蓄平均水平的八倍。

高净值人士的特权现在可供任何净值人士使用。新的黄金标准已经到来,那就是Robinhood Gold。要获得年度IRA缴款的3%奖励,请在robinhood.com/gold注册。投资有风险,利率可能会发生变化。3%的匹配需要每月5美元的Robinhood Gold,持续一年,从第一次匹配开始。必须将资金存入IRA五年。

访问Robinhood.com/boost。超过全国平均储蓄账户利率八倍的说法是基于截至2024年11月18日FDIC的数据。Robinhood Financial LLC,SIPC成员。Gold会员资格由Robinhood Gold LLC提供。

《今日解释》的支持来自Hydro。也许你强势地开始了这一周,星期一去健身房,并打算完成本周剩余的锻炼。但后来生活发生了,你知道的,你的朋友叫你过去,有一场比赛,有一部电影。

新闻很糟糕,你需要回家在楼上躺一会儿。无论如何,关于锻炼的心理来回反复比锻炼本身更令人筋疲力尽。有了Hydro Rower,他们说你只需20分钟就能完成全身锻炼。无需过度思考。你可以坚持计划,一夜之间完成全身锻炼。

所有这些都可以在家里的Hydro上完成。访问hydro.com,使用代码EXPLAINED,即可节省高达475美元的Hydro Pro Rower费用。网址是H-Y-D-R-O-W.com。代码EXPLAINED,节省高达475美元。Hydro.com。代码EXPLAINED。本节目的支持来自甲骨文。

即使你认为它有点被夸大了,人工智能突然出现在各处。从自动驾驶汽车到分子医学再到业务效率。如果它还没有进入你的行业,它很快就会到来。很快。但人工智能需要大量的速度和计算能力。那么,如何在不使成本螺旋式上升的情况下竞争呢?是时候升级到下一代云了。甲骨文云基础设施,或OCI。

OCI是一个快速且安全的平台,用于您的基础设施、数据库、应用程序开发以及所有AI和机器学习工作负载。OCI的计算成本降低了50%,网络成本降低了80%,因此您可以节省大量资金。包括沃达丰、汤森路透和Suno AI在内的数千家企业已经升级到OCI。

这是《今日解释》。

那么,让我们先让你说出你的名字和你所做的事情。当然。是的,你好。我的名字是马克·格雷厄姆,我是互联网档案馆Wayback Machine的主任。这是一个非营利组织,自1996年以来一直在保存网络。记者一直都在使用它。但对于那些不了解的人,我请马克带我们参观互联网档案馆。

我从哪里开始呢?这就像走进一个非常大的图书馆,然后说,给我看看你最喜欢的书。好吧,例如,去年,MTV新闻被关闭是一个大新闻。MTV新闻的创始编辑在LinkedIn上写了关于这件事的文章。还有很多其他编辑也在谈论这件事。就像,哦,我的上帝,我们所有的文章都没了。它们不见了。我只是随意地,你知道……

参与到谈话中,说,嗨,看看这里,Wayback Machine。他们就像,哦,我的上帝,你们……

得到了所有东西,几乎都得到了,是的。他们说,好吧,人们会说,你做了什么?当它关闭时你做了什么?我说,当它关闭时我们什么也没做,因为我们一直在做我们的工作。我们一直在努力存档公开发布的网络,这是一个持续不断的过程。

所以,如果我们必须在某些东西关闭后才开始关注它,这意味着我们搞砸了。因此,以MTV新闻为例,让我们了解一下你们在该网站关闭之前做了什么,以确保人们能够找到,你知道的,我不知道,Everlast在2004年唱的是什么。你好,Jancy Dunn在这里,现在加入我的是前House of Pain成员Everlast。欢迎,Everlast。谢谢你。

因此,由于数千个原因中的任何一个原因,我们每天都会派出我们的网络爬虫和存档软件执行任务,以识别和下载网页以及相关的基于网络的资源。我们每天都会引入数百万个URL,这些URL是向我们发出的信号,是关于网络上正在发布新材料的信号。

我们确保我们存档所有这些URL,以及与这些URL关联的所有网页。然后我们查看这些页面,并识别指向其他页面的链接。然后我们转到这些页面并存档它们,等等,等等。这就是你得到这种像蜘蛛一样在整个网络中爬行的隐喻的地方。最终结果是,我们每天都会向Wayback Machine添加超过10亿个已存档的URL。

这些资料在添加到Wayback Machine后,会被编入索引,并且会立即提供给访问web.archive.org、输入URL的人,然后他们能够看到我们在任何给定时间从URL获得的网页的存档历史记录。

我现在想谈谈政府网站,因为这是我们今天进行这次谈话的原因。我认为大多数人可能认为政府会负责存档政府网站。但我们现在迎来了一个新的政府,网站正在消失,又重新上线,人们感到担忧。当您,一位互联网档案管理员,看到政府网站在线时,

消失,重新上线,变得不可靠。你对此有何反应?这比非政府的常规网站下线更好还是更糟?好吧,作为一个美国人,我的税款帮助支付了其中一些东西。然后其中很多可能对人们有益。当然,我的第一反应是,嗯,这可能不是一件好事。我想强调一下,确实存在国家档案馆和记录管理局计划。

它也确实进行存档。但由于某种原因,我们似乎是尝试存档大部分公共网络(包括现在尤其重要的美国政府网站)并将这些档案实时提供的主要参与者之一。当您看到新政府时,您是否措手不及——

删除网页,删除网站?这在某些方面是很正常的。这是正常且预期的,坦率地说,在我们开展这项工作期间,每个政府都发生过这种情况。我的意思是,看,它在新的管理之下,对吧?例如,你不会期望任何新总统政府的白宫.gov网站与之前的相同。

因此,我们尽力去预测应该存档网页的频率,以便我们有很大的机会获得这些更改。你说,你知道,白宫.gov网站显然会随着政府而变化。我认为在某种程度上。

人们理解这一点,乔·拜登政府可能在一年前不会在他们的Instagram账户上发布关于移民的滑稽情人节信息。但我们在这里看到的是……

是人们需要的网站,记录公共卫生信息的网站下线了,短暂地,永久地,等等。不,那是真的。这与我们过去看到的抹去历史记录或篡改历史记录的程度有何不同?我不知道。

它不同。就数量而言,它肯定有所不同。我的意思是,我们仍然处于这个政府的早期阶段。但是,是的,我认为从表面上看,你是对的。从历史上看,我们没有见过像我们对美国国际开发署那样,主要的美国政府网站下线。但是……

我将把这种分析留给其他人,而只是专注于尝试存档资料。

Wayback Machine,互联网档案馆,主要通过捐款、人们的慷慨、机构甚至政府的资助。这是否足以存档互联网,以至于后代想要看到和需要看到?足够是一个非常主观的术语。好吧,作为一个档案管理员……

对我来说,永远都不够,因为你不知道。没有人知道将来,甚至明天不久的将来,更不用说非常遥远的将来了,什么东西会有用、有价值、很重要。

由于每天有数百万人使用我们的网站,我们收到了很多他们的反馈。这激励了我们,但也帮助我们指导我们,并激励我们不断努力成为最好的图书馆。上帝保佑。就是这样。让我问你最后一个问题,马克。

你们已经做了将近三十年了。当然,你们保存了很多东西,当然也有一些东西被遗漏了。我想知道,有没有什么东西从裂缝中溜走了,你可以告诉我们,这可能会向我们的观众暗示,当我们无法按我们想要或需要的程度存档时,会失去什么?

好吧,这个问题让我有点措手不及。我只想说,我现在不知道。我不能说那件事。天哪,我希望。好吧,我有一个。我的意思是,这只是最近的历史。显然,上周疾病控制与预防中心的网站上有一个关于禽流感的页面。它显然只存在了几分钟,没有人得到它。嗯。

通过丢失那个转瞬即逝的网页,那个,你知道的,也许很小,也许很大的关于疾病控制与预防中心网站上禽流感的网页,我们失去了什么?好吧,我们失去了一部分故事,对吧?我们失去了一部分对 arguably a significant health crisis 的演变的理解。

我们不知道这将走向何方。我不知道。我想这就是另一个重点,对吧?我的意思是,你未必现在就知道哪些东西在近期或更长时期内会非常重要。在马丁·路德时代,一场激烈的辩论正在进行。这场辩论的很大一部分采取了写在小册子上的形式。当时的小册子被认为是书籍。

是的。

我的意思是,你是在某种程度上将疾病控制与预防中心的网站与宗教改革进行比较。但我想你是认真的,对吧?我是认真的,因为我不知道。如果没有长远的历史视角,就没有人能知道。而我们今天无法获得这种视角。为什么?因为我们没有真正的时光机。

哦,还有……

今天是《今日解释》的七岁生日。你给我们准备了什么?也许在评论、评分和评论中表达一些爱意。他们说这有帮助。感谢你们收听,无论你们收听了多久。如果您是新听众,请随意浏览档案。

现在在麦当劳获取Angel Reef特价套餐。让我们分解一下。我最喜欢的烧烤酱、美国奶酪、脆培根、泡菜、洋葱,当然还有芝麻面包。别忘了薯条和饮料。听起来不错吗?巴达巴达巴达。参与活动的餐厅,限时供应。

在西南偏南节探索新的领域,这是全球创意人士的首选目的地。与业内专业人士建立联系,参加鼓舞人心的会议,查看最新的科技创新,并在2025年西南偏南节会议和节日上探索更多内容。

3月7日至15日,在德克萨斯州奥斯汀举行。当勇敢的人们和想法走到一起时,就会发生最伟大的发现,这就是西南偏南节。使用代码Vox10在SXSW.com上节省10%的白金徽章费用。