欢迎来到黑客新闻中文日报,在这个播客中,我们将为您带来最前沿的人工智能动态和深度分析。今天,我们将探讨 OpenAI 完成史上最大规模 400 亿美元融资的重大突破,分析山姆,奥尔特曼宣布推出开源全重语言模型的战略意义,以及对比 Gemini 2.5 Pro 与 Cloud 3.7 Sunit 在编程能力上的激烈较量。
我们还将讨论 AI 项目应优先考虑稳定性而非复杂功能的行业趋势以及为何 LLM 不应直接执行业务逻辑的实践经验加入我们一起深入了解 AI 领域的最新进展 OpenAI 完成了有史以来规模最大的科技公司私募融资金额高达 400 亿美元使其估值达到 3000 亿美元成为全球第三大独角兽企业仅次于 SpaceX 与字节跳动并列
日本软银以 300 亿美元领头微软等投资者也参与其中这笔资金将用于推动 AI 研究和扩展算力基础设施约 180 亿美元将投入星际之门项目不过融资附带条件若 OpenAI 未能在年底前完成盈利性实体转型软银投资可能大幅削减
OpenAI 已宣布 ChatGPT 周活跃用户达 5 亿,CEO 奥特曼透露,过去一小时内增加了 100 万用户,公司预计今年营收将翻番至 127 亿美元。与此同时,OpenAI 刚完成高管分工调整,奥特曼将减少日常运营参与,更专注研究与产品开发。
随着生成式 AI 市场预计 10 年内突破万亿美元规模从谷歌亚马逊到各类 AI 创业公司的竞争已进入白热化阶段 OpenAI 正凭借这笔创纪录融资巩固其行业领导地位 OpenAI CEO 山姆奥尔特曼宣布公司将在未来几个月内发布一个具备推理能力的强大开源权重语言模型这被外媒分析认为部分是为了应对中国公司 DeepSeek R1 模型的迅速崛起和 Metalama 系列模型的持续热度
开源权重 AI 模型通过仅共享神经网络的预训练参数,同时保密关键开发细节,在开源和专有系统之间提供了一个中间地带,使开发者可以使用模型进行推理和微调,但无法访问训练代码、原始数据及或模型架构细节。
这一战略转向与奥尔特曼今年早些时候的表态一致,当 DeepSeek 的 R1 模型发布后不久,他曾表示 OpenAI 可能站在了历史的错误一边。此外,OpenAI 可能希望展示其能够以较低成本训练新模型,因 DeepSeek 的 R1 模型据称训练成本远低于大多数大型 AI 模型。
在安全方面,OpenAI 研究员强调将进行严格测试以确保模型不被滥用,遵循安全防备框架,不会发布可能带来灾难性风险的模型。Oracle 尝试向客户隐瞒重大的网络安全事件引发了讨论火热,一篇发布于 DoublePost 上的文章揭露了 Oracle 在其 SaaS 服务中发生的严重网络安全问题,并试图对此事进行掩盖。
3 月 21 日,Bleeping Computer 报道指出,一名名为 Rose87168 的威胁行为者,声称已经入侵了新号 OracleCloud.com 下的一些 Oracle 服务。
Oracle 回应称没有 Oracle Cloud 的数据泄露,所谓的泄露凭证并非针对 Oracle Cloud,也就是说没有 Oracle Cloud 客户经历数据泄露或数据丢失。然而,威胁行为者后来提供了一个显示,他们能够写入 logins2oraclecloud.com 由 Oracle Access Manager 使用的服务的 archive.org 链接。
评论区的反响一片哗然,有的网友认为,如果你已经是 Worko 的客户,这件事可能对你来说并不会有太大影响,因为选择 Worko 并非因为它的产品好或公司有良好的声誉,而是更多的商业考量。另一位网友指出,安全事件在最近几年变得极为常见,如果 Worko 坦白承认,这件事很可能很快就会被忽略,但现在它却变成了一个越来越深的麻烦。
还有网友表示,各地的法律虽然要求公司在发生安全漏洞时通知客户,但执行力度不够,这类事件经常被忽视。著名的 Chrome 扩展程序 Honey 在其背后的一些不光彩做法曝光后,现在已经损失了大约 400 万名用户。Honey 依靠广告和承诺为各种在线商店找到优惠券代码,吸引了数百万用户。然而,去年 12 月,一个由 Megalab 频道发布的视频揭示了 Honey 的两个问题。
首先是 Honey 如何利用会员代码,这种做法包括把在线创作者和网站的会员代码换成自己的,即使 Honey 没有提供任何优惠券或返现。此外,该程序还与商家背后合作,控制向 Honey 用户显示的代码,实际上直接违背了其寻找最佳优惠券代码的承诺。由于这些原因,自视频爆红以来,Honey 在 Chrome 上的用户数量从 2000 万降至了 1600 万。
评论区的网友对这一情况展开了广泛讨论,有的人感觉震惊,没想到 Honey 的行为如此猖獗,还有的人指出这对于零售商来说也是一个问题,他们为什么还要和 Honey 合作?还有网友表示绝不会信任 PayPal,而有些人早在几年前就因为 Honey 几乎从未提供有效的代码而放弃使用。
总体来说,网友们对 Honey 的这一举动表示失望,认为整个联盟营销和引流领域充满了欺诈和隐瞒,每个环节都有中间人从中获利,导致所有人都在为这种营销形式付出更多成本。Chrome 135 版本正式支持通过 CSS 自定义 Select 元素,这一特性让网页开发者和设计师们终于可以在 Web 上使用可访问的、标准化的且可通过 CSS 样式化的 Select 元素。
这一变革的到来凝聚了多年的努力数小时的工程开发和协作规范工作其结果是一个功能丰富强大而不会在旧浏览器中损坏的组件这一变化背后的技术细节包含了一种名为 appearance 被 select 的新 css 属性它将 select 元素置于一种新的可配置和可样式化的状态
与之同时,这种改变也意味着一些功能和行为的丧失,例如 Select 不再渲染浏览器窗格之外,不会触发内置的移动操作系统组件,且 Select 不再取最长选项的宽度。不过,关注点在于,一个 Select 现在可以包含-HTML 内容,这对于需要显示的信息量更大的选择元素来说是一个巨大进步。
评论区的反馈普遍积极,开发者们对这一特性的发布表示异常兴奋,认为这是长久以来的期待终于成真有评论担心这一改变可能会影响到元素在移动端的表现和可靠性,也有声音觉得某些空间保持默认样式可能更好总的来说,社区对这一改变持开放态度,期待这一特性能够推动 Web 开发的进步
在最新的技术比较中,Google 刚刚推出的 Gemini 2.5 Pro 与 Cloud 3.7 Sanon 进行了一番激烈的较量,主要围绕编程能力进行对比 Gemini 2.5 Pro 以其惊人的 100 万 Token 上下文窗口和免费使用的优势,成为了此次比拼的赢家尽管 Cloud 3.7 Sanon 在某些方面表现依然出色,但在直接对比中似乎捎迅一筹
Gemina 2.5 Pro 不仅在编程方面大放异彩,还在理性思考、数学和科学解题上表现出色,证明了自己是一款全能型模型。该模型在 Swaybench 上的准确率达到了 63.8%,超过了 Cloud 3.7 Senate 的 62.3%,再变成更为复杂的代码题目。如 Rubik's Cube Solver 时,Gemina 2.5 Pro 一次性就完成了挑战,显示了其强大的编程能力。
而 Cloud 3.7 Sunet 在处理相同问题时遇到了一些困难表现不尽如人意从 Gemina 2.5 Pro 的免费获取和超大上下文窗口两大优点来看这款模型的确值得大家尝试和使用
从社区评论来看,不少用户对于 Gemini 2.5 Pro 的表现表示赞赏,但也有人对目前大型语言模型 LLM 的发展提出了质疑,认为尽管 Gemini 在一些方面领先,但整体上仍需进一步的创新和改进,特别是在工具支持和技术债务方面,众多用户仍在寻找最适合自己项目的模型。提出来挑战现有的 Web 开发模式,宣称其应用的整体大小甚至比一个 React 按钮还要轻。
在这次发布的内容里,能展示了如何将 HTML、CSS 和 JS 的现代标准发挥到极致,让整个应用异常清亮。特别引人注目的是,嗯,还在其应用中融入了 REST 计算引擎和事件源处理方式,即便是在处理超过 15 万条记录的场景下,也能保持性能不受影响。
嗯,不仅在 HMR 和构建速度上破纪录,还为 Rust、Go 和 JS 工程师提供了一个摆脱 React 习惯性模式束缚的新选择,强调模型优先、模块化设计、简化函数测试、最小化依赖,旨在为系统开发人员、设计工程师和用户体验工程师还原 Web 开发的乐趣。
评论区的意见则各有千秋,有的人对 Nund 的轻量化表示支持和期待,认为这可能是摆脱现有繁重框架的一个好方向。然而,也有观点认为,尽管 Nund 提出了一种新的可能,但要在实际应用中取代 React 以及其他成熟框架,还需时间验证其性能和便利性。总的来说,Nund 出现无疑给前端开发带来了新的思考,但是否能成为主流还需市场的检验。
随着 AI 技术的不断进化 市场上出现了越来越多以提升能力为卖点的 AI 代理但实际上 很多用户更加期望这些技术能够提供稳定且可靠的服务体验例如 虽然 AI 助理预定机票听起来技术含量高实际上很多人却因为担忧一旦出错 就要面对繁琐的客服问题而退缩正因如此 用户往往更倾向于简单可靠的服务比如 Google Flights 所提供的透明 可预测 且易于操作的用户体验
在大多数情况下,用户宁愿选择准确率较为普通但稳定的 AI 服务,也不愿意冒险使用那些虽然偶尔能展现惊人能力但不稳定的服务。事实上,面对这种情况,AI 项目的竞争目标应当是专注于几个能够出色执行的任务并且不断迭代改进,而不是追求复杂系统带来的微小增益。
评论区的网友们也有类似看法有人分享了使用 Cursor 工作时受到的困扰体现了可靠性相较于其他任何功能都更为重要的观点此外 有网友提到在构建 AI 解决方案时应当优先考虑将任务定义为工作流这样做不仅能提升预测性和控制性还能简化操作流程总而言之随着 AI 技术的快速发展和应用为用户提供稳定可靠的服务体验仍然是众多开发团队的首要任务
在网上发现了一篇文章,讨论了你在奶酪上看到的白色物质并不是霉菌,而是乳酸钙结晶。原文来源是 The PH Cheeses 网站,发表于 2018 年。这篇文章解释说,当你咬进熟成的荷兰高达奶酪、切达奶酪或帕尔玛干酪时,那种满足感的酥脆声就是来自这些结晶。
文章还区分了奶酪中的两大类结晶无机结晶和有机结晶前者主要是在奶酪制作过程中为溶解的盐分形成的而后者则是奶酪成熟过程中氨基酸分解形成的特别的文章提到乳酸钙结晶常见于无皮切打奶酪外部是奶酪长期熟成的标志评论区里大家分享了自己对奶酪结晶的经历和喜爱有人赞叹荷兰高达奶酪中的酥脆口感也有人对这些结晶的口感表示不喜
一个有趣的观点是,有人好奇奶酪制造商是否会开始添加这种酥脆的结晶,以假乱真的提升奶酪质量的外观而不是实际质量。勾优化指南是一系列旨在帮助开发者编写更快、更高效构、应用程序的技术文章集合。这个系列提供了实用的模式、真实世界的用力和低级性能见解,以指导你的优化努力。
尽管勾与 C++或 REST 相比没有暴露出太多性能条优的旋钮但它仍然提供了许多机会来显著提高应用程序的速度从内存重用和分配控制到高效网络疾病发模式勾为编写高性能代码提供了一套实用工具
我们专注于具体技巧与可测量影响你可以立即应用涵盖从核心语言特性到高级网络策略的所有内容评论区的网友们对文章提供的优化技巧特别感兴趣比如有效使用 SyncPool 避免不必要的分配结构布局和内存对齐都引发了热烈的讨论有些网友特别强调了避免长时间存活的分配对于减少 GC 时间的重要性而另一些则对如何在实际应用中实施这些优化策略表达了好奇
根据最新的詹姆斯维博太空望远镜 James Webb Space Telescope 研究首次发现大多数星系以顺时针方向旋转这项研究激发了对宇宙基本物理性质的新讨论并可能对我们理解宇宙的起源和演变产生影响研究人员通过分析 263 个星系的数据发现其中约三分之二的星系是以顺时针方向旋转这一结果与长期以来的期望相悖即星系旋转方向应该是随机且均匀分布的
这一发现挑战了我们对宇宙同质性和各项同性的基本假设,引发了学术界对于星系旋转偏好成因的深入探讨。评论区中,网友们针对这一结果展开了热烈的讨论。
一部分人对于这一发现表示怀疑,认为样本数量相对于宇宙中星系的总数而言仍然非常少,质疑其统计学意义另一部分人则更加关注这一发现背后可能隐藏的宇宙学意义,比如它是否暗示了宇宙在大尺度上存在某种位被发现的结构性偏差同时也有评论者提出,这个现象可能是由于我们观测角度的偏差造成的,需要更多的数据来验证这一发现的普遍性
在科技领域,一篇关于不应让 LLM 执行业务逻辑和做决策的文章引起了广泛讨论文章作者通过实践经验强调,尽管 LLM 在处理特定场景时表现出色例如在线游戏中创建非玩家角色,但在应用程序的核心逻辑中直接使用 LLM 将面临许多问题例如,使用 LLM 维持棋盘状态和下棋,虽然理论上可行,实际上却远不如专门的棋盘引擎
文章进一步解释了依赖 LLM 进行决策的缺点,如执行性能差、调试和调整难度大、测试 LLM、输出笔单元测试以至代码路径困难等。
因此,作者建议在大多数应用中,LLM 应仅作为用户和应用程序逻辑之间的界面层。在评论区,网友们提出了各种见解,有些认同作者的观点,强调 LLM 最好作为一个更大系统中的小部件以提升效率,有些则分享了在不同场景下,如教育游戏开发,如何有效利用 LLM 的经验。还有评论指出,对于逻辑、优化和约束编程等任务,应该采用专门的机器智能技术,而不是 LLM。
这一讨论强调了在实际应用中理解并合理利用 LLM 的重要性同时提醒开发者在设计系统时需谨慎权衡 LLM 的使用感谢您收听今天的黑客新闻中文日报希望我们的分享能够让您对科技世界的最新动态有更深的理解和思考如果您喜欢我们的内容请不要忘记订阅并和您的朋友分享祝您拥有美好的一天我们明天再见