We're sunsetting PodQuest on 2025-07-28. Thank you for your support!

2024-01-02 | Deepseek：中国 AI 竞赛中的沉默巨人

2025/1/1

Hacker News

AI Deep Dive AI Insights AI Chapters Transcript

People

主

主持人

专注于电动车和能源领域的播客主持人和内容创作者。

Topics

主持人: 2024年大语言模型领域取得显著进展，多个模型超越GPT-4，例如Gemini 1.5 Pro能够处理百万级token的输入，且部分模型可在个人电脑上运行，成本也大幅下降。这不仅提升了用户体验，也扩展了LLM的应用场景。然而，也存在一些质疑，例如对代理人概念的实际应用和效果的质疑，以及对LLM价格下降和模型运行成本的担忧。主持人: 静态搜索树技术取得突破，速度比二分查找快40倍，通过优化算法和内存布局，显著提升了搜索效率。Eytzinger树的应用进一步优化了性能。主持人: 中国AI初创公司DeepSeek凭借其R1模型和开源策略，在AI竞赛中表现出色，引发了价格战。但其开源策略也可能导致技术被复制，同时面临GPU限制和地缘政治因素的影响。主持人: Dreamcast平台的GTA III移植项目成功，展现了老游戏机的新生和玩家社区的活力。主持人: Darktable 5.0.0版本发布，带来了UI/UX改进和功能增强，提升了用户体验和性能，但同时也存在一定的学习曲线。主持人: 一名美国陆军士兵因参与针对AT&T和Verizon的勒索案而被捕，凸显了网络安全的重要性。主持人: 三个AI模型参与实时股票交易实验，旨在研究AI如何解读和响应市场动态，为AI在金融领域的应用提供了新的视角。主持人: "不合理的时间投入"是创造奇迹的关键，时间是魔法的要素，无论是魔术还是其他领域，都需要长时间的积累和努力才能取得成功。主持人: 现代web技术发展使得原生应用变得多余，许多应用可以通过网站实现，但将应用从原生转移到网络上也存在挑战，例如跨浏览器和跨平台的适配问题。

Deep Dive

Key Insights

为什么 DeepSeek 被称为中国 AI 竞赛中的沉默巨人？

DeepSeek 是一家中国 AI 创业公司，以其低调但强劲的姿态引领中国 AI 竞赛。其 R1 模型在多项推理基准上表现出色，并通过提供极具竞争力的 API 价格单枪匹马地启动了中国 AI 市场的价格战。DeepSeek 专注于基础技术而非商业应用，并承诺将所有模型开源，这种策略使其在技术创新和市场影响力上脱颖而出。

2024 年大语言模型（LLM）领域有哪些重大进展？

2024 年，大语言模型领域取得了显著进展。Google 的 Gemini 1.5 Pro 和 Anthropic 的 Cloud 3.5 等模型超越了 GPT-4 的性能，能够处理高达 100 万甚至 200 万的令牌输入长度，并支持多模态数据（如图像、音视频）。此外，许多模型现在可以在个人笔记本电脑上运行，显著降低了成本和可访问性，推动了 LLM 的普及。

DeepSeek 的开源策略对其发展有何影响？

DeepSeek 的开源策略使其技术创新能够被其他公司复制，这可能会影响其独特性。然而，这种策略也推动了全球 AI 技术的进步，并展示了更优算法和方法在机器学习中的重要性。尽管面临 GPU 限制和中美贸易战的挑战，DeepSeek 仍以显著更少的资源与 OpenAI 和 Anthropic 等公司达成性能对等，展示了其技术实力。

静态搜索树相比二分查找有哪些优势？

静态搜索树通过优化代码和引入批处理，显著提高了搜索速度，比传统二分查找快 40 倍。它利用预取和批处理减少缓存未命中，并通过 Eytzinger 布局优化内存访问，进一步提升了性能。这种技术在高吞吐量排序数据搜索中表现出色，展示了算法优化的巨大潜力。

GTA III 的 Dreamcast 移植版为何引发热议？

GTA III 的 Dreamcast 移植版展示了 Dreamcast 的技术潜力，并唤起了玩家对这台经典游戏机的怀念。该项目由开发者 Funes 基于 Libre 和 Re3 制作，详细记录了开发过程并提供了源代码下载。玩家社区对这一移植版充满热情，认为它是对 Dreamcast 未实现潜力的一种致敬。

为什么许多系统设计理念听起来不错但难以实现？

许多系统设计理念（如“只需添加一个 API”）看似简单，但实际实施时往往复杂且充满挑战。问题通常在于过度简化了实施过程，忽略了实际架构的复杂性和功能性需求。尽管在某些特定情况下这些理念可能成功，但大多数情况下需要从多个角度综合考虑，才能避免失败。

Darktable 5.0.0 版本有哪些重要更新？

Darktable 5.0.0 版本新增了对 500 多种相机模型的特定样式支持，使照片编辑更接近出厂 JPEG 效果。它还引入了 Lua 脚本，可自动应用风格，并优化了启动速度，减少了从启动到显示内容的时间。这些改进显著提升了用户体验，使其成为 Adobe Lightroom 的开源替代选择。

美国陆军士兵 Cameron John Wagenius 因何被捕？

Cameron John Wagenius 是一名 20 岁的美国陆军士兵，因涉嫌出售和泄露从 AT&T 和 Verizon 窃取的客户通话记录而被捕。他驻扎在韩国，被指控非法转移保密电话记录。此事件引发了关于网络安全和军队纪律的广泛讨论，并展示了执法部门在追踪网络犯罪方面的效率。

AI 在实时股市交易中的表现如何？

在实时股市交易实验中，GPT-4o、Gemini 1.5 Pro 和 Claude 3 Sonnet 三个大语言模型每天分析市场新闻并自动执行交易。该项目旨在研究 AI 如何解读财经数据并做出实际决策。尽管有评论认为实际交易并非必要，但这一尝试为 AI 在金融领域的应用提供了新的视角，并挑战了传统投资理念。

为什么现代 web 技术使得原生应用变得多余？

现代 web 技术（如 WebAssembly 和 WebGPU）的崛起使得许多应用可以通过网站实现，而无需开发繁重的原生应用。这不仅减少了开发者的维护负担，也降低了用户的存储压力。尽管原生应用在性能和本地文件处理上仍有优势，但浏览器的强大功能使得许多应用完全可以在网页上运行，推动了向网络应用的转型。

Chapters

2024年大语言模型领域取得显著进展，多个组织推出超越GPT-4的模型，例如Google的Gemini 1.5 Pro和Anthropic的Claude 3.5。这些模型不仅性能卓越，还具备处理百万token输入、支持多模态数据等能力，并且可以在普通设备上运行，极大降低了成本和使用门槛。

18个组织开发出超越GPT-4的模型
Gemini 1.5 Pro可处理百万token输入，支持视频输入
Claude 3.5在准确性和新功能方面表现出色
LLM可在普通设备上运行，成本大幅下降

Shownotes Transcript

大家好欢迎来到黑客新闻中文日报在今天的节目中我们会带您一起探索 AI 新闻的前沿首先我们将深入了解 2024 年大语言模型 LLM 的最新进展其中包括 Gemina 1.5 Pro 和 Cloud 3.5 这两个模型的革命性创新接着我们会看看一家中国 AI 创业公司 DeepSeek 如何以其二一模型引领中国的 AI 竞赛以及它为什么选择开源作为其发展策略

最后我们还会聊聊一个关于 AI 在实时股市交易中的独特尝试,这个项目通过三个不同的大语言模型展示了 AI 如何解读和响应市场动态。准备好了吗?一起来看看这些令人兴奋的科技突破吧!在 2024 年关于大语言模型 LLM 的探索中,我们见证了许多重大发现和变化。

一个值得注意的亮点是,过去一年里,共有 18 个组织开发出了超过原 OpenAI,2023 年 3 月发布的 GPT-4 模型的性能。这展示了整个领域的飞速进步和技术突破,尤其是 Google 的 Gemini 1.5 Pro 模型不仅达到了 GPT-4 级别的输出,还增加了一些新功能,例如能够处理高达 100 万,甚至后来 200 万的令牌输入长度和对视频内容的输入能力。

Anthropic 的 Cloud 3 系列也大放异彩,尤其是 Cloud 3.5 版本,因其在准确率和新功能方面的表现,成了许多用户的心宠不仅如此,这些模型中有些甚至能够在个人笔记本电脑上运行,这打破了以往认为高性能模型需要高价数据中心服务器才能运行的观念这一发展不仅使 LLM 变得更加普及,也标志着成本和可访问性的重大改进

同时,LLM 的价格因为竞争和效率的提高而急剧下降,这为更广泛的应用提供了可能。值得一提的是,模型的多模态能力也得到了极大的增强,现在几乎每个主要模型提供者都推出了支持图像、音视频等多种数据类型的模型。

在评论区中,许多用户对这些进步表示赞赏,尤其是对于 Gemina 1.5 Pro 和 Cloud 3.5 的提及频繁,说明了这些模型在提升用户体验和扩展 LLM 应用场景方面所发挥的重要作用。

然而,也有用户对于代理人概念的实际使用和效果表示质疑,认为这一概念仍然模糊且有待明确。此外,对于 LLM 价格的下降和模型运行成本的讨论也引起了广泛关注,部分用户担忧这可能对市场造成的潜在影响。总的来说,尽管对于 LLM 的发展和应用存在不同观点,但广泛认为 LLM 技术在 2024 年取得了显著进展,为未来的发展奠定了坚实的基础。

在这篇关于静态搜索数的文章中,作者介绍了一种相比二分搜索快 40 倍的静态搜索数 S 加数。文章来源于 Curious Coding NL,由 Adam Bender 发表,得到了 450 的评分。通过对现有算法的改进和优化,例如利用 P 处理和预取来提高搜索数据的吞吐量,以及使用剧业减少对 TLB 转指旁路缓冲的压力,这个搜索数能够更高效地处理排序数据的高吞吐量查询。

此外,文章还探讨了通过改变内存布局,如使用逆序存储或完整布局可能进一步提高性能,虽然实验结果显示这些方法并未带来性能提升评论区的一些观点表明,读者对于 RUS 默认成为算法和低级内容的首选语言感到兴奋同时也有提议在此类研究中考虑批量划分查询和利用完美的最小哈希函数简化查找操作

此外,有评论者认为使用 Eitzinger 数可以在不增加额外存储指针的情况下优化见值存储,以及如何通过批处理进一步提升性能总的来说,这篇文章展示了通过对搜索数的优化如何显著提升搜索效率,尽管还有一些潜在的优化空间尚未探究 DeepSeek,一家中国 AI 创业公司,以低调但强劲的姿态引领着中国的 AI 竞赛,它的 R1 模型在多项推理基准上表现出色

DeepSeek 由高飞换方完全资助高飞是一家估值达 80 亿美元的中国前四大量化对冲基金而且 DeepSeek 没有进行资金募集的打算该公司专注于构建基础技术而非商业应用并承诺将其所有模型开源

他还通过提供非常实惠的 API 价格单枪匹马的启动了中国的价格战不过根据评论区的反馈有些网友提出了对 DeepSeek 以及其他中国 AI 发展的不同见解例如 GPU 限制促进了中国开发者的创新能力同时有人担心由于美中贸易战和中国的审查制度 DeepSeek 在计算资源获取和数据使用方面可能会遇到劣势

还有评论提到 DeepSeek 的开源策略可能使得其技术创新能被其他公司复制从而影响其独特性尽管如此有评论者对 DeepSeek 能以显著更少的资源与 OE 和 Cloud 达成性能对等表示赞叹展示了更优算法和方法在机器学习下一阶段的重要性梦幻游戏机 Dreamcast 迎来了 GTA3 的移植版本这是由一位名为 Funes 的开发者用 Libre 和 Re3 为基础制作的

这个项目不仅在技术上展示了 Dreamcast 的潜力,而且通过 GitLab 的页面提供了详细的开发过程和下载方式,玩家和同好们可以直接访问 GitLab 上的 SKMP DCA SunGame 来获取原代码和相关文件。这个移植版提醒我们,尽管 Dreamcast 的生命周期相对较短,但其仍然拥有坚实的追随者和开发社区,他们致力于为这台经典游戏机带来新生。

评论区里有趣的互动也反映了玩家社区对这次移植项目的兴奋和对 Dreamcast 未曾实现潜力的怀念一位用户建议保留一份原代码副本以防版权问题而另一位则回忆了 Dreamcast 在硬件上对 PS2 的先进性及其市场的短暂辉煌此外还有评论提到了制作团队以及玩家社区对旧游戏机的持续热情和开发新软件的重要性展现出对过去技术与创造力的深刻敬意

在最近一篇由 CaseBus 发布在硬核软件博客上的文章中探讨了那些听起来很不错但实际上很少成功的系统思想文章指出经常听到的侏儒我们只需要加个 API 这样的提案实际上远比人们初步想象的要复杂得多许多人认为只要在现有架构上简单添加新的实现或功能就能自动地为用户带来改进或新的能力然而事实证明几乎没有什么是简单的插件式就能正常工作的

此外,文章还提到了其他几个常见的想法,例如再次抽象化,异步化处理以及稍后添加访问控制等,都指出这些思路看似简单,但实施起来充满挑战。

评论区的网友们对此有着各种见解有人指出问题并非出在这些想法本身而是出在过于简化这些想法的实施过程有人提到在特定的情况下比如使用了特定的技术或工具这些想法是可以成功的还有人则分享了自己成功实施这类想法的经历强调实际操作中的复杂性和功能性带来的价值

整体上,虽然这些系统思想听起来不错,很多人都尝试过,但成功的例子并不多,这提示了在采用这些思想时要更加谨慎,并且提醒了工程师们在实施新想法前需要从多个角度综合考虑。Darktable 5.0.0 版本正式发布,这是一个备受欢迎的开源照片编辑软件,新增功能和改进使用户体验得到了显著提升。

此次更新增加了对超过 500 种相机模型的特定样式支持,以更接近出厂 JPEG 的效果,同时增添了 Lua 脚本,可在导入时自动应用适当的风格,并手动应用到先前导入的图像集合上。此外,为了提高启动速度,加入了显示启动进度的可选启动屏幕,包含在扫描更新旁边文件时的预计剩余时间,大大减少了从启动 Dark Table 到屏幕上显示内容的时间。

这些 UI UX 改进,加上 OpenCL 对色彩均衡器的实现,大幅提高了大量图像操作的速度。值得一提的是,新用户现在能通过几何波形默认视图获取关于图像颜色和色调的更详细信息,这对于照片后期处理来说是一个重要的进步。

评论区的网友们对于新版本有着积极的反馈,尽管有些用户表示对于软件的复杂性和学习曲线感到略有挑战,但大多数人都对 Darktable 团队的这次更新表示祝贺和赞赏。特别是对于那些寻求开源替代 Adobe Lightroom 软件的用户来说,Darktable 5.0.0 提供了一个功能丰富且免费的选择。

联邦当局近日逮捕并起诉了一名 20 岁的美国陆军士兵怀疑他就是 Kyberfan Lingam 这位网络罪犯今年早些时候被指控出售和泄露从 AT&T 和 Verizon 窃取的敏感客户通话记录据 Krabs on Security 上个月首次报道被控的通信专家最近在韩国服役涉案士兵 Cameron John V. Genius 在德克萨斯州胡德堡军基地附近被捕被指控非法转移保密电话记录两项罪名

KyberFund 0M 声称通过至少入侵 15 家电信公司,包括 AT&T 和 Verizon,来实现此次泄露。在这个案例中,有评论认为这表明执法在追踪和逮捕境内网络罪犯方面变得更加迅速有效。另有评论指出,这起事件向那些认为自己不会被抓到的网络罪犯发出了明确的警告。

同时一些网络安全研究者面临的骚扰和暴力威胁问题也被提到了讨论中凸显了网络罪犯对法律与道德底线的轻视今天我们要谈的是一个既刺激又前沿的话题三款 AI 在实时股市交易中的竞争

这项活动通过网站 trading,snagger.com,向我们展示了 GPT-4O,Gemina 1.5 Pro,以及 Cloud Sansanit 这三个大语言模型如何分析最新的市场新闻,并基于每日早上凌晨 5 点 45 分 PST 的分析,结果自动执行交易,每次投资 5 美元。这个项目旨在研究不同的大语言模型如何解读财经数据,并做出具有实际后果的决策。

尽管有评论指出,若单纯为了研究 LMS 如何解读财经数据,实际交易并不是必须的,但也有观点认为,实际操作可以让我们检验 AI 是否能在股市交易中胜过随机选择,这是一种无需羞愧的探索。

还有意见建议增加一个完全随机的机器人作为对照组或者是模拟猴子进行选择无论如何这种创新尝试给我们提供了思考 AI 在财经领域应用前景的新视角并挑战了传统投资的理念在 Alan Peck 的文章 An Unreasonable Amount of Time 中他分享了一个关于魔术的例子揭示了一个深刻的道理有时候魔法不过是有人愿意在某件事上花费比常人预期更多的时间

多年前,魔术师泰勒表演了一个让人难以置信的魔术,他让观众抽一张牌,假装失败了,然后带着观众到附近的公园,似乎被灵感所引,开始挖掘,竟然挖出了一个盒子,盒子里面装的,正是观众所选的那张牌。这个魔术的秘密在于,泰勒提前埋下了许多盒子,每个盒子对应可能被选中的牌,然后等待几个月,直到草地自然覆盖盒子,这个时候才能表演这个看似不可能的魔术。

Taylor 的故事向我们展示了,无论是魔术还是任何一种手艺,看似超自然的技巧背后,往往是长时间的沉淀和投入。网友们在评论中也分享了自己的感受,有的人提到这让他们想起了修行的过程,是一个缓慢而稳定的前进,没有捷径可走。还有的人谈到了在大型活动策划中巨大的准备工作,以及那些看似不费力的快乐背后,其实付出了巨大的努力。

这些评论进一步强调了,不论是在技术艺术还是个人成长方面,都需要坚持和耐心,真正值得拥有的东西,都不会轻易到手。

智能手机的兴起彻底改变了一切突然之间应用遍布人们的生活中连接人群解决问题和提供娱乐但随着时间的推移这些原本被视为福音的应用开始感觉更像是一种负担在今天以网络为先的世界里绝大多数原生应用似乎已变得多余无端增加了手机的负担考虑到现代网络技术的发展我们确实需要重新思考是否真的需要这些原生应用

评论区网友对此也有热烈的讨论,有人表示对于复杂应用在跨浏览器和跨平台的适配问题感到痛苦,尤其是在 iOS 上对 PWA 的支持不佳,甚至无法实现通过蓝牙连接的需求,这让开发者的工作变得非常艰难。另一些人讨论了将应用从原生转移到网络上可能会遇到的挑战,例如医疗领域的应用,哪里谷歌应用商店的发布就像一场卡夫卡式的发热梦。

同时,也有观点认为现代浏览器的强大功能使得网络游戏能够接近甚至达到原生应用的性能水平,但仍有长路要走。通过这些评论,我们可以看到虽然向网络应用的转型充满挑战,但其潜力和优势也正吸引着越来越多的开发者和用户的关注。感谢您收听今天的黑客新闻中文日报。

希望今天关于 AI 新进展和科技发展的讨论可以让您对这个快速发展的世界有更深的了解和思考我们致力于为您提供最新最有深度的科技资讯如果您喜欢我们的内容别忘了订阅我们的播客并与朋友分享期待您的再次收听祝您有一个技术满满的一天明天见

2024-01-02 | Deepseek：中国 AI 竞赛中的沉默巨人 14:00 Share