We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

2025-06-07 | Eleven v3 发布！AI 语音合成再进化，可唱歌会对话！TTS 新王者诞生

2025/6/7

Hacker News

AI Deep Dive AI Chapters Transcript

People

Jeff Geerling

Mozilla Foundation

作

作者

老

老板阿美

Topics

Jeff Geerling: 我感到非常困惑，因为我介绍如何在 Raspberry Pi 上使用 LibreELEC 自建媒体服务器的视频被 YouTube 以“危险或有害内容”为由下架了。我的视频内容完全合法，只是分享了如何管理自己的媒体库，并没有涉及任何盗版或非法资源。我多年来一直购买正版光盘，并将内容存储在 NAS 上，自建媒体库是为了更便捷地欣赏自己购买的内容。现在YouTube 越来越像带着锁链的金手铐，平台利用 AI 抓取博主内容，却又限制我们的创作自由。

Deep Dive

Shownotes Transcript

大家好欢迎收听黑客新闻中文日报今天的节目里我们将带来几则让人深思的前沿动态首先人工智能领域迎来重磅升级 Google 最新的 Gemini 2.5 Pro 以更强推理能力和多模态输入挑战业界大模型标杆与此同时关于 AI 用户隐私的话题愈演愈烈 Medicine 上线的 Discover Feed 引发了用户数据是否会被意外公开地广泛争议 Mazilla 基金会公开质疑其隐私政策

再来说说 Android 的变化,Google 正在新加坡试点更严的 Sideloding 限制,这对于防范诈骗固然利好,但也引发了开发者和用户对开放与安全边界争论的又一轮升级。精彩内容马上开始,和我们一起关注世界科技热点。YouTube 最近以危险或有害内容,唯有下架了 Jeff Geerling 一则介绍如何在 Raspberry Pi 5 上用 LibreLEC 自建多媒体库的视频,理由是他涉嫌宣传如何获得未经授权的内容。

其实他的视频里只讲了自建和管理媒体库的方法,完全没掩饰任何破解工具,也没有教人如何非法获取资源。Jeff 说他多年来都是购买正版光盘,把内容存在家里的 NAS 上,网上流媒体又贵又分散,广告也多,自建其实是为了便捷合法地欣赏自己买的内容。他对自己的申诉被据很疑惑,因为类似的视频之前在频道放了一年多都没问题,而且早就有百万播放。

这次他最后把视频传到了 Internet Archive,供大家免费访问。Jeff 还提到,虽然 YouTube 有巨大的影响力和广告收益,但最近 Google 频繁用 Gemini 之类的 AI 工具自动总结并抓取博主的内容,感觉平台变得越来越像一副带着锁链的金手铐。

评论区不少网友也表达了无奈,有的说平台的内容审核完全跟不上现实,经常误伤,但又对真正的问题内容视而不见。还有人感叹对于普通创作者来说缺乏可行的替代方案,也有人建议应该多平台分发,或探索 peertube,internet,archive 等自托管和去中心化的新路。Meta 近期推出了一款新的 AI 应用,用户可以在里面浏览其他人在和 AI 的互动内容,也就是所谓的 Discover Feed。

Mozilla Foundation 对此发起了一项公开呼吁,他们认为 Meta 正在悄悄地把用户本来以为是私密的 AI 聊天内容变成了公开的信息,而不少用户其实并不知情。

Mazilla 针对这一做法提出了几项要求第一 Meta 应该在有真正隐私保护措施之前先关闭 Discover Feed 第二所有 AI 互动都应该默认是私密的除非用户明确同意并且知情第三要对多少用户物分享了隐私数据进行透明披露第四应该让用户可以轻松选择不让自己的数据被用于 AI 训练第五对于可能被公开的用户内容 Meta 应及时通知并给用户删除的权利

关于这件事,不少网友评论说,实际上在 Meta 的 AI 应用里,只有主动点击分享才会公开内容,而且界面也会有提示,有人觉得 Mozilla 这次的表述带有误导性。不过也有评论认为,把分享按钮实质做成公开,确实存在让人误会的可能。整体来说,关于隐私保护和用户知情权的争议,在新一代 AI 产品里还是很有代表性的话题。

Google 近期在新加坡试点上线了新的 Android sideloading 限制措施,简单来说,就是如果你通过网页、聊天工具或者文件管理器下载某些请求敏感权限,比如短信访问或者辅助功能权限的应用,就会被系统直接拦截,没法安装。

这个政策是和新加坡网络安全机构一起制定的,主要目的是防止因为 Sideloding 带来的金融诈骗和恶意软件问题,同时 Google 还在推广 Play Integrity API,开发者可以用这个接口限制 Sidelog 过来的应用的一些功能,变相地推动大家只在 Google Play Store 安装 App。

虽然这样做提升了普通用户的安全性,但也有不少开发者和用户觉得,Google 越来越多地收紧生态权限,这在一定程度上削弱了用户自由权利,也让 Android 趋向像 iOS 一样的封闭。而在网友的讨论里,有人指出这项限制其实只在新加坡,针对少数权限,经常用 ADB 之类的高级操作还是能绕过,影响最大的还是不会折腾安卓系统的普通用户。

还有网友补充,类似的措施确实拦住了一大批利用 Sideloding 骗取银行账号的恶意软件,但也让那些需要 Sidelode 的正版应用变得更难装,关于开放和安全的平衡,大家看法依然不一。Gemina 2.5 Pro 最新预览版已经上线,这是 Google DeepMind 目前最强大的大语言模型,主要面向复杂推理、编程和多模态任务。

这一版本重点升级了推理能力,特别是新加入的 DeepThink 模式,让模型在处理复杂问题时思路更清晰,准确性也更强。Gemina 2.5 Pro 支持文本、音频、图片和视频等多种输入形式,最长可以处理 100 万个 Token,同时还能用原生音频以更自然的方式对话。

在各类公开榜单上,这一版本在科学、数学、事实核查、多语言等多个维度的数据中都取得了领先成绩,比如在 GPQA 科学推理测试中达到 86.4%的通过率,AIM-2025 数学竞赛测试也表现出色。模型还能直接生成动画,游戏甚至复杂的数据可视化代码,开发者可以通过 Google AI Studio 和 Gemini API 进行体验和集成。

社区用户评价非常热烈,有人认为 Gemini 在榜单上的优势明显,但实际日常代码协作中,Cloud Opus 4 依然更胜一筹。还有用户反馈在变量命名和代码输出细节上 Gemini 有待提升,但对推理能力和多模态支持表示肯定。另外,因为 Gemini Pro 接口还没有遇到限流,一些用户准备考虑取消 ChatGPT Plus 订阅。

GitLab 最近对备份系统做出了一项重大改进,把大型仓库的备份时间从原来的 48 小时缩短到了 41 分钟团队发现瓶颈其实出在 Git 中一个已经运行了 15 年的函数,这个函数在处理大量引用时是 ON 平方的复杂度,所以一旦仓库里的分支、标签等引用变多,备份就会变得异常缓慢

为了解决这个问题,GitLab 工程师把原来通过循环去重的写法换成了用 MAP 数据结构直接处理重复引用,这样写后,服务器资源消耗大幅下降,备份操作的性能实现了质的提升,像 Git Bundle Create 这种需要对所有引用进行操作的命令,速度都有了大幅提升。

目前最大仓库的备份时间只需要原来的 1.4%既节省了运维成本也让企业可以更灵活地安排备份计划提高了业务连续性降低了数据丢失风险这一优化已经被提交到 Git 的主线项目未来将汇集整个 Git 社区评论区里有网友表示只要消除了 N 平方的算法几乎每个项目的性能都会立刻提升大家对 GitLab 把这个改变贡献给上游社区感到非常认可

还有很多人也讨论了做代码备份其实不仅仅是实现功能还必须考虑底层的数据结构和算法优化限制性能瓶颈的往往都不是代码语言本身而是算法设计作者分享了自己几乎不记的人生中的具体事件也无法在脑海中形成画面或声音的特殊体验还解释了这种状态其实属于一种叫 SDAM 的记忆特征全称是 Severely Deficient Autobiographical Memory 自转体记忆极其缺失

作者举例说,在被问到大学时期如何解决难题时总是答不上来,因为他的记忆就像没有标签的柜子,里面的经历无法靠关键词检索,需要很具体的线索或他人的提醒才能想起。虽然细节和某些场景记不清,但对于事实、道理和空间布局,比如房子的结构或者街道地图,作者记得非常清楚,也能用这些空间或语义信息触发部分回忆。

在情感上,他认为这种记忆缺陷更多影响的是对过去的怀念,而不是实际生活和学习作者也提到,这样的记忆方式让他更专注于当下和总结经验,而不是反复回忆细节评论区里有很多网友共鸣自己的类似经历,有人觉得这会影响自我介绍或回忆亲密关系也有人反而觉得这种方式让自己更容易原谅别人还有网友补充说工程师群体里这样的人其实不少

Eleven Labs 推出了最新的 Eleven V3 语音合成模型这一代号称是目前最具表现力的文本转语音产品通过简单的文本输入用户可以在 70 多种语言之间生成极为自然富有情感的语音内容包括多角色对话情感变化插入笑声或环境音等音效用户还可以在输出中通过标签灵活控制情绪语气高低甚至对话节奏生成更加真实的多角色互动场景

Eleven V3 目前提供 80%折扣用户可以直接通过网页界面体验 API 也准备上线开发团队原本就很重视人声细节最新版本支持更丰富的音色切换和情感模拟真人配音的效果可以达到 99%难以分辨

有网友表示,这个模型甚至能根据歌词标签自动生成合唱或无伴奏歌声,但对于某些笑声插入,体验还不够自然。另外有一些评论给出建议,比如对英式口音的支持还需加强,不同语言的表现力还没达到英文那么高水平。但整体来看,大多数体验者都认为 11V3 无论在情感丰富度还是自然度上都已经超过了很多竞品。

OpenAI 近日回应了纽约时报提出的数据保全要求表示自己始终把信任和用户隐私放在首位这次纽约时报在针对 OpenAI 的诉讼中要求公司无限期保留所有 ChatGPT 和 API 用户的数据包括普通订阅用户和没有零数据留存协议的 API 客户但有企业级的 ChatGPT Enterprise、ChatGPT EDU 用户以及签署了 Zero Data Retention 协议的 API 用户并不会受到影响

OpenAI 称这个要求不仅脱离了行业隐私惯例,也违背了他们对用户的承诺,目前公司已经提出上诉,希望法院重新考虑这一命令。被命令保留的数据将被单独加密存储,只允许审批后的法律与安全团队出于履行法律义务的目的访问,不会自动共享给纽约时报等原告方。如果用户使用零数据留存功能,OpenAI 不会保存任何数据。

这一官司目前还没有明确期限,公司会定期通报最新进展评论区有网友认为,OpenAI 应该为所有用户默认提供零数据留存而不只是部分企业客户,也有人质疑,用户即使表面上可以选择数据处理方式,实际操作起来却不透明还有用户提醒,和浏览器历史泄露相比,如果 LLM 聊天记录被泄露,个人隐私可能暴露得更彻底

费城西区有一家新开的 Beans Store,也叫 Amazing Beans,开业后在街区引发了不少关注。这个店面原本是一家文青风格的二手服装店,空置将近一年,后来换成了这种以杂货堆放,按天定价的新零售形式。

每周五这里是刚刚补货,商品全部 10 美元一件,之后每天便宜 2 块钱,到了周三只要 1 美元。店里堆满了各类商品,大多还是全新的,有从 Target、Amazon 等大公司退货或过剩库存而来,包括厨房家电、衣服、玩具,甚至还有奇怪的小玩意儿和一些节日装饰品。库存来源主要靠所谓反向物流,把这些电商、零售商仓库里清出来的东西集中,再低价卖出来。

老板阿美说,很多顾客其实会来这里淘宝,把店里的商品买走再转手在 eBay,Amazon 或 Facebook Marketplace 再卖,通常一天就能回本。这样的模式让原本可能被扔到垃圾填埋场的商品多了一次被利用的机会。店里最受欢迎的是家用电器和同类高价值产品,大家都盼着低价捡到漏。

门口经常排队,便宜的价格和开盲盒的感觉,让店里生意一直不错。当然,店里也有很多顾客觉得,淘到的其实大多都只是过剩的无用之物,有人甚至说是买垃圾,还不如直接扔进大海。有网友评论说这种 bin store 现在美国到处都是,也有人吐槽大部分货架都是清理不了的垃圾,不过也有人觉得这样至少省了钱,还能减缓浪费。

整体来看,二手轻仓型门店风潮很明显,但随着库存压力增加和同行竞争,生意其实也没以前那么好做了。Jepson 团队最近对 Tiger Beetle 0.16.1 这个专为金融交易设计的分布式 OLTP 数据库做了全面测试,发现了客户端和服务器端一共 7 处崩溃,包括在服务器升级时出现的 panic 和客户端关闭时的断错误。

同时,单节点故障会导致系统延迟大幅增加,请求也会无休止地重试,这给错误处理带来挑战。不过在测试中,安全性相关的严重问题其实很少,只发现两处,一是多条件查询时会丢失结果,二是 Java 客户端某个调试接口返回了错误的时间戳。

更值得注意的是,Tiger Beetle 在应对磁盘损坏时,表现出了极强的容错性,哪怕每个副本的数据都被破坏,也很难导致数据真正丢失,但目前还缺乏彻底损坏单个节点数据时的恢复机制。到 0.16.30 版本时,Tiger Beetle 基本满足了 Strong Serializability 这种极强一致性要求,后续的几个版本修复了几乎所有发现的问题,仅剩下请求一直重试的问题等待优化。

Jepson 还特别强调,Tiger Beetle 的工程团队在测试发现问题后,迅速扩充了自己的内部测试体系来防止类似 bug 再次出现,这种严谨的工程方法让人很有信心。网友们普遍认为,这份长报告很有干货,不少人在看了之后对 Tiger Beetle 的严谨和可靠有了更深印象。

有网友评论说,这样持续提升工程质量的态度,将来有望让 Tiger Beetle 成为金融领域像 Postgraze 一样的数据库默认选择,也有人点赞 UFO 的深度测试,让整个生态受益。感谢您收听今天的黑客新闻中文日报,希望这些精选的科技资讯能为你带来新的启发。

不论是人工智能的浪潮还是信息安全和用户隐私的博弈科技世界每天都在变化喜欢我们的话欢迎订阅并分享给朋友让更多人一起参与思考与讨论祝你愉快我们下期节目再见

2025-06-07 | Eleven v3 发布 ！AI 语音合成再进化，可唱歌会对话！TTS 新王者诞生 14:51 Share

Hacker News

Deep Dive

Shownotes Transcript

2025-06-07 | Eleven v3 发布！AI 语音合成再进化，可唱歌会对话！TTS 新王者诞生