We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

2024-01-02 | Deepseek：中国 AI 竞赛中的沉默巨人

2025/1/1

Hacker News

AI Deep Dive AI Insights AI Chapters Transcript

People

主

主持人

专注于电动车和能源领域的播客主持人和内容创作者。

文

文章作者 (Adam Bender)

文

文章作者 (Alan Peck)

文

文章作者 (CaseBus)

文

文章评论者

Topics

主持人: 本期节目主要关注2024年大语言模型的最新进展，其中包括Gemini 1.5 Pro和Claude 3.5等模型的突破性创新；中国AI创业公司DeepSeek如何通过其R1模型和开源战略引领中国的AI竞赛；以及一个关于AI在实时股市交易中的独特尝试，该项目展示了AI如何解读和响应市场动态。主持人: 2024年大语言模型领域取得了显著进展，多个组织开发出超越GPT-4的模型，例如谷歌的Gemini 1.5 Pro，展现了LLM领域的快速进步。Anthropic的Claude 3系列，特别是Claude 3.5版本，在准确性和新功能方面表现出色，一些模型甚至可以在个人笔记本电脑上运行。LLM的成本因竞争和效率提升而急剧下降，模型的多模态能力也得到增强。主持人: 对Gemini 1.5 Pro和Claude 3.5的积极评价表明它们在提升用户体验和扩展LLM应用场景方面发挥了重要作用，但对代理人概念的实际应用和效果仍存在质疑。主持人: Darktable 5.0.0版本发布，带来显著的UI/UX改进和更强大的功能，增加了对500多种相机型号的支持，并提升了启动速度。主持人: 美国陆军士兵Cameron John Wagenius因参与针对AT&T和Verizon的勒索案被捕，该事件凸显了网络安全的重要性。主持人: 三个AI模型（GPT-4o、Gemini 1.5 Pro和Claude 3 Sonnet）进行实时股票交易实验，旨在研究AI如何解读金融数据并做出决策。主持人: 魔术师泰勒的魔术表演揭示了“时间”在创造“魔法”中的关键作用，强调了长时间投入和努力的重要性。主持人: 现代web技术发展使得原生应用变得多余，许多应用可以通过网站实现，但向网络应用的转型也面临挑战。文章作者 (Adam Bender): 静态搜索树比二分查找快40倍，通过代码优化和批处理提高搜索速度，Rust成为算法和低级内容的首选语言。文章评论者: DeepSeek的开源策略可能使其技术创新被其他公司复制，但其以较少资源与OpenAI和Claude达到性能对等令人赞叹；Darktable 5.0.0虽然存在学习曲线，但用户对其更新表示积极反馈；实时股票交易实验可以检验AI是否能在股市交易中胜过随机选择；‘魔法’的背后是长时间的沉淀和投入，没有捷径可走；将应用从原生转移到网络上存在挑战，例如跨浏览器和跨平台的适配问题以及对PWA支持不佳。 DeepSeek相关人士（推测）: DeepSeek专注于构建基础技术而非商业应用，并承诺开源所有模型，引发了中国AI领域的价格战。 Dreamcast GTA III移植项目相关人士（推测）: Dreamcast GTA III移植项目通过GitLab提供详细的开发过程和下载方式，展现了Dreamcast的潜力和玩家社区的热情。文章作者 (CaseBus): 许多看似简单的系统设计理念在实际应用中难以实现，问题在于过度简化的期望，‘再次抽象化’、‘异步化处理’、‘稍后添加访问控制’等理念看似简单，但实施起来充满挑战。文章作者 (Alan Peck): ‘魔法’的背后往往是长时间的投入和努力，魔术师泰勒的魔术表演揭示了‘时间’在创造‘魔法’中的关键作用。

Deep Dive

Key Insights

2024 年大语言模型（LLMs）有哪些重大进展？

2024 年，大语言模型取得了显著进展，18 个组织开发出了超越 GPT-4 的模型。Google 的 Gemini 1.5 Pro 不仅能处理高达 100 万甚至 200 万的令牌输入长度，还支持视频内容输入。Anthropic 的 Cloud 3.5 在准确率和功能上表现出色，部分模型甚至能在个人笔记本电脑上运行，显著降低了成本和提高了可访问性。多模态能力也得到增强，几乎所有主要模型都支持图像、音视频等多种数据类型。

DeepSeek 如何在中国 AI 竞赛中脱颖而出？

DeepSeek 是一家中国 AI 创业公司，凭借其 R1 模型在多项推理基准上表现出色。该公司由高飞换方完全资助，专注于基础技术而非商业应用，并承诺将所有模型开源。通过提供极具竞争力的 API 价格，DeepSeek 单枪匹马地启动了中国 AI 市场的价格战。尽管面临 GPU 限制和贸易战等挑战，DeepSeek 展示了更优算法和方法在机器学习中的重要性。

静态搜索树相比二分查找有哪些优势？

静态搜索树通过优化代码和引入批处理，显著提高了搜索速度，比二分查找快 40 倍。通过减少缓存未命中和优化内存布局，如使用 Eytzinger 布局，进一步提升了性能。批处理查询和完美的最小哈希函数也简化了查找操作，展示了在高吞吐量排序数据搜索中的突破性表现。

GTA III 的 Dreamcast 移植版为何引发热议？

GTA III 的 Dreamcast 移植版由开发者 Funes 制作，展示了 Dreamcast 的技术潜力。该项目通过 GitLab 提供了详细的开发过程和下载方式，吸引了玩家和开发社区的关注。评论中，玩家们对 Dreamcast 的短暂市场辉煌和硬件先进性表示怀念，同时也强调了社区对经典游戏机的持续热情和开发新软件的重要性。

为什么许多系统设计理念听起来不错但难以实现？

许多系统设计理念如“加个 API”或“再次抽象化”听起来简单，但实际实施起来非常复杂。问题往往在于过度简化的期望，而非理念本身。评论中有人指出，在特定技术或工具的支持下，这些理念可以成功，但大多数情况下，实施过程中会遇到诸多挑战，提示工程师们在采用新想法时需要更加谨慎。

Darktable 5.0.0 有哪些新功能和改进？

Darktable 5.0.0 新增了对超过 500 种相机模型的特定样式支持，更接近出厂 JPEG 效果。新增的 Lua 脚本可在导入时自动应用风格，并手动应用到先前导入的图像集合上。为了提高启动速度，加入了显示启动进度的可选启动屏幕，OpenCL 对色彩均衡器的实现也大幅提高了图像操作速度。新用户可通过几何波形默认视图获取更详细的图像颜色和色调信息。

美国陆军士兵 Cameron John Wagenius 因何被捕？

Cameron John Wagenius 是一名 20 岁的美国陆军士兵，因涉嫌出售和泄露从 AT&T 和 Verizon 窃取的敏感客户通话记录而被捕。他被指控非法转移保密电话记录，并在韩国服役期间参与了此次网络犯罪。此事件引发了关于网络安全和军队纪律的广泛讨论。

AI 在实时股市交易中的表现如何？

在实时股市交易实验中，GPT-4O、Gemini 1.5 Pro 和 Claude 3 Sonnet 三个大语言模型每天分析市场新闻并自动执行交易。该项目旨在研究不同模型如何解读财经数据并做出实际决策。尽管有评论认为实际交易并非必须，但这一尝试为 AI 在金融领域的应用提供了新视角，并挑战了传统投资理念。

魔术师泰勒的魔术表演揭示了什么道理？

魔术师泰勒的表演揭示了看似超自然的技巧背后往往是长时间的沉淀和投入。他提前埋下多个盒子，每个盒子对应可能被选中的牌，等待几个月草地自然覆盖盒子后才进行表演。这一过程展示了无论是魔术还是其他手艺，真正的成功往往需要付出比常人预期更多的时间和努力。

为什么现代网络技术使得原生应用变得多余？

现代网络技术的发展，如 WebAssembly 和 WebGPU，使得许多应用可以通过网站实现，而不必开发繁重的原生应用。这不仅减少了开发者的维护负担，也降低了用户的存储压力。尽管原生应用在性能和本地文件处理上占优，但浏览器的强大功能使得许多应用在网络上也能达到接近原生应用的性能水平。

Chapters

2024 年大语言模型领域取得了显著进展，多个组织推出了超越 GPT-4 的模型，例如 Google 的 Gemini 1.5 Pro 和 Anthropic 的 Claude 3.5。这些模型不仅性能出色，而且在成本和可访问性方面也得到了极大改善。

18 个组织开发出超过 GPT-4 的模型
Gemini 1.5 Pro 可处理百万 token 输入
Claude 3.5 在准确性和新功能方面表现出色
LLM 价格下降，应用范围扩大

Shownotes Transcript

大家好欢迎来到黑客新闻中文日报在今天的节目中我们会带您一起探索 AI 新闻的前沿首先我们将深入了解 2024 年大语言模型 LLM 的最新进展其中包括 Gemina 1.5 Pro 和 Cloud 3.5 这两个模型的革命性创新接着我们会看看一家中国 AI 创业公司 DeepSeek 如何以其二一模型引领中国的 AI 竞赛以及它为什么选择开源作为其发展策略

最后我们还会聊聊一个关于 AI 在实时股市交易中的独特尝试,这个项目通过三个不同的大语言模型展示了 AI 如何解读和响应市场动态。准备好了吗?一起来看看这些令人兴奋的科技突破吧!在 2024 年关于大语言模型 LLM 的探索中,我们见证了许多重大发现和变化。

一个值得注意的亮点是,过去一年里,共有 18 个组织开发出了超过原 OpenAI,2023 年 3 月发布的 GPT-4 模型的性能。这展示了整个领域的飞速进步和技术突破,尤其是 Google 的 Gemini 1.5 Pro 模型不仅达到了 GPT-4 级别的输出,还增加了一些新功能,例如能够处理高达 100 万,甚至后来 200 万的令牌输入长度和对视频内容的输入能力。

Anthropic 的 Cloud 3 系列也大放异彩,尤其是 Cloud 3.5 版本,因其在准确率和新功能方面的表现,成了许多用户的心宠不仅如此,这些模型中有些甚至能够在个人笔记本电脑上运行,这打破了以往认为高性能模型需要高价数据中心服务器才能运行的观念这一发展不仅使 LLM 变得更加普及,也标志着成本和可访问性的重大改进

同时,LLM 的价格因为竞争和效率的提高而急剧下降,这为更广泛的应用提供了可能。值得一提的是,模型的多模态能力也得到了极大的增强,现在几乎每个主要模型提供者都推出了支持图像、音视频等多种数据类型的模型。

在评论区中,许多用户对这些进步表示赞赏,尤其是对于 Gemina 1.5 Pro 和 Cloud 3.5 的提及频繁,说明了这些模型在提升用户体验和扩展 LLM 应用场景方面所发挥的重要作用。

然而,也有用户对于代理人概念的实际使用和效果表示质疑,认为这一概念仍然模糊且有待明确。此外,对于 LLM 价格的下降和模型运行成本的讨论也引起了广泛关注,部分用户担忧这可能对市场造成的潜在影响。总的来说,尽管对于 LLM 的发展和应用存在不同观点,但广泛认为 LLM 技术在 2024 年取得了显著进展,为未来的发展奠定了坚实的基础。

在这篇关于静态搜索数的文章中,作者介绍了一种相比二分搜索快 40 倍的静态搜索数 S 加数。文章来源于 Curious Coding NL,由 Adam Bender 发表,得到了 450 的评分。通过对现有算法的改进和优化,例如利用 P 处理和预取来提高搜索数据的吞吐量,以及使用剧业减少对 TLB 转指旁路缓冲的压力,这个搜索数能够更高效地处理排序数据的高吞吐量查询。

此外,文章还探讨了通过改变内存布局,如使用逆序存储或完整布局可能进一步提高性能,虽然实验结果显示这些方法并未带来性能提升评论区的一些观点表明,读者对于 RUS 默认成为算法和低级内容的首选语言感到兴奋同时也有提议在此类研究中考虑批量划分查询和利用完美的最小哈希函数简化查找操作

此外,有评论者认为使用 Eitzinger 数可以在不增加额外存储指针的情况下优化见值存储,以及如何通过批处理进一步提升性能总的来说,这篇文章展示了通过对搜索数的优化如何显著提升搜索效率,尽管还有一些潜在的优化空间尚未探究 DeepSeek,一家中国 AI 创业公司,以低调但强劲的姿态引领着中国的 AI 竞赛,它的 R1 模型在多项推理基准上表现出色

DeepSeek 由高飞换方完全资助高飞是一家估值达 80 亿美元的中国前四大量化对冲基金而且 DeepSeek 没有进行资金募集的打算该公司专注于构建基础技术而非商业应用并承诺将其所有模型开源

他还通过提供非常实惠的 API 价格单枪匹马的启动了中国的价格战不过根据评论区的反馈有些网友提出了对 DeepSeek 以及其他中国 AI 发展的不同见解例如 GPU 限制促进了中国开发者的创新能力同时有人担心由于美中贸易战和中国的审查制度 DeepSeek 在计算资源获取和数据使用方面可能会遇到劣势

还有评论提到 DeepSeek 的开源策略可能使得其技术创新能被其他公司复制从而影响其独特性尽管如此有评论者对 DeepSeek 能以显著更少的资源与 OE 和 Cloud 达成性能对等表示赞叹展示了更优算法和方法在机器学习下一阶段的重要性梦幻游戏机 Dreamcast 迎来了 GTA3 的移植版本这是由一位名为 Funes 的开发者用 Libre 和 Re3 为基础制作的

这个项目不仅在技术上展示了 Dreamcast 的潜力,而且通过 GitLab 的页面提供了详细的开发过程和下载方式,玩家和同好们可以直接访问 GitLab 上的 SKMP DCA SunGame 来获取原代码和相关文件。这个移植版提醒我们,尽管 Dreamcast 的生命周期相对较短,但其仍然拥有坚实的追随者和开发社区,他们致力于为这台经典游戏机带来新生。

评论区里有趣的互动也反映了玩家社区对这次移植项目的兴奋和对 Dreamcast 未曾实现潜力的怀念一位用户建议保留一份原代码副本以防版权问题而另一位则回忆了 Dreamcast 在硬件上对 PS2 的先进性及其市场的短暂辉煌此外还有评论提到了制作团队以及玩家社区对旧游戏机的持续热情和开发新软件的重要性展现出对过去技术与创造力的深刻敬意

在最近一篇由 CaseBus 发布在硬核软件博客上的文章中探讨了那些听起来很不错但实际上很少成功的系统思想文章指出经常听到的侏儒我们只需要加个 API 这样的提案实际上远比人们初步想象的要复杂得多许多人认为只要在现有架构上简单添加新的实现或功能就能自动地为用户带来改进或新的能力然而事实证明几乎没有什么是简单的插件式就能正常工作的

此外,文章还提到了其他几个常见的想法,例如再次抽象化,异步化处理以及稍后添加访问控制等,都指出这些思路看似简单,但实施起来充满挑战。

评论区的网友们对此有着各种见解有人指出问题并非出在这些想法本身而是出在过于简化这些想法的实施过程有人提到在特定的情况下比如使用了特定的技术或工具这些想法是可以成功的还有人则分享了自己成功实施这类想法的经历强调实际操作中的复杂性和功能性带来的价值

整体上,虽然这些系统思想听起来不错,很多人都尝试过,但成功的例子并不多,这提示了在采用这些思想时要更加谨慎,并且提醒了工程师们在实施新想法前需要从多个角度综合考虑。Darktable 5.0.0 版本正式发布,这是一个备受欢迎的开源照片编辑软件,新增功能和改进使用户体验得到了显著提升。

此次更新增加了对超过 500 种相机模型的特定样式支持,以更接近出厂 JPEG 的效果,同时增添了 Lua 脚本,可在导入时自动应用适当的风格,并手动应用到先前导入的图像集合上。此外,为了提高启动速度,加入了显示启动进度的可选启动屏幕,包含在扫描更新旁边文件时的预计剩余时间,大大减少了从启动 Dark Table 到屏幕上显示内容的时间。

这些 UI UX 改进,加上 OpenCL 对色彩均衡器的实现,大幅提高了大量图像操作的速度。值得一提的是,新用户现在能通过几何波形默认视图获取关于图像颜色和色调的更详细信息,这对于照片后期处理来说是一个重要的进步。

评论区的网友们对于新版本有着积极的反馈,尽管有些用户表示对于软件的复杂性和学习曲线感到略有挑战,但大多数人都对 Darktable 团队的这次更新表示祝贺和赞赏。特别是对于那些寻求开源替代 Adobe Lightroom 软件的用户来说,Darktable 5.0.0 提供了一个功能丰富且免费的选择。

联邦当局近日逮捕并起诉了一名 20 岁的美国陆军士兵怀疑他就是 Kyberfan Lingam 这位网络罪犯今年早些时候被指控出售和泄露从 AT&T 和 Verizon 窃取的敏感客户通话记录据 Krabs on Security 上个月首次报道被控的通信专家最近在韩国服役涉案士兵 Cameron John V. Genius 在德克萨斯州胡德堡军基地附近被捕被指控非法转移保密电话记录两项罪名

KyberFund 0M 声称通过至少入侵 15 家电信公司,包括 AT&T 和 Verizon,来实现此次泄露。在这个案例中,有评论认为这表明执法在追踪和逮捕境内网络罪犯方面变得更加迅速有效。另有评论指出,这起事件向那些认为自己不会被抓到的网络罪犯发出了明确的警告。

同时一些网络安全研究者面临的骚扰和暴力威胁问题也被提到了讨论中凸显了网络罪犯对法律与道德底线的轻视今天我们要谈的是一个既刺激又前沿的话题三款 AI 在实时股市交易中的竞争

这项活动通过网站 trading,snagger.com,向我们展示了 GPT-4O,Gemina 1.5 Pro,以及 Cloud Sansanit 这三个大语言模型如何分析最新的市场新闻,并基于每日早上凌晨 5 点 45 分 PST 的分析,结果自动执行交易,每次投资 5 美元。这个项目旨在研究不同的大语言模型如何解读财经数据,并做出具有实际后果的决策。

尽管有评论指出,若单纯为了研究 LMS 如何解读财经数据,实际交易并不是必须的,但也有观点认为,实际操作可以让我们检验 AI 是否能在股市交易中胜过随机选择,这是一种无需羞愧的探索。

还有意见建议增加一个完全随机的机器人作为对照组或者是模拟猴子进行选择无论如何这种创新尝试给我们提供了思考 AI 在财经领域应用前景的新视角并挑战了传统投资的理念在 Alan Peck 的文章 An Unreasonable Amount of Time 中他分享了一个关于魔术的例子揭示了一个深刻的道理有时候魔法不过是有人愿意在某件事上花费比常人预期更多的时间

多年前,魔术师泰勒表演了一个让人难以置信的魔术,他让观众抽一张牌,假装失败了,然后带着观众到附近的公园,似乎被灵感所引,开始挖掘,竟然挖出了一个盒子,盒子里面装的,正是观众所选的那张牌。这个魔术的秘密在于,泰勒提前埋下了许多盒子,每个盒子对应可能被选中的牌,然后等待几个月,直到草地自然覆盖盒子,这个时候才能表演这个看似不可能的魔术。

Taylor 的故事向我们展示了,无论是魔术还是任何一种手艺,看似超自然的技巧背后,往往是长时间的沉淀和投入。网友们在评论中也分享了自己的感受,有的人提到这让他们想起了修行的过程,是一个缓慢而稳定的前进,没有捷径可走。还有的人谈到了在大型活动策划中巨大的准备工作,以及那些看似不费力的快乐背后,其实付出了巨大的努力。

这些评论进一步强调了,不论是在技术艺术还是个人成长方面,都需要坚持和耐心,真正值得拥有的东西,都不会轻易到手。

智能手机的兴起彻底改变了一切突然之间应用遍布人们的生活中连接人群解决问题和提供娱乐但随着时间的推移这些原本被视为福音的应用开始感觉更像是一种负担在今天以网络为先的世界里绝大多数原生应用似乎已变得多余无端增加了手机的负担考虑到现代网络技术的发展我们确实需要重新思考是否真的需要这些原生应用

评论区网友对此也有热烈的讨论,有人表示对于复杂应用在跨浏览器和跨平台的适配问题感到痛苦,尤其是在 iOS 上对 PWA 的支持不佳,甚至无法实现通过蓝牙连接的需求,这让开发者的工作变得非常艰难。另一些人讨论了将应用从原生转移到网络上可能会遇到的挑战,例如医疗领域的应用,哪里谷歌应用商店的发布就像一场卡夫卡式的发热梦。

同时,也有观点认为现代浏览器的强大功能使得网络游戏能够接近甚至达到原生应用的性能水平,但仍有长路要走。通过这些评论,我们可以看到虽然向网络应用的转型充满挑战,但其潜力和优势也正吸引着越来越多的开发者和用户的关注。感谢您收听今天的黑客新闻中文日报。

希望今天关于 AI 新进展和科技发展的讨论可以让您对这个快速发展的世界有更深的了解和思考我们致力于为您提供最新最有深度的科技资讯如果您喜欢我们的内容别忘了订阅我们的播客并与朋友分享期待您的再次收听祝您有一个技术满满的一天明天见

2024-01-02 | Deepseek：中国 AI 竞赛中的沉默巨人 14:00 Share