欢迎大家收听黑客新闻中文日报今天的节目我们聚焦一款由 Google 刚刚开源的终端 AI 工具不仅能帮开发者省心省力还有着让人惊喜的免费额度接下来我们来聊聊一场企业及 AI 助手的暗战微软主推的 Copilot 却被大公司用户持续弃用 OpenAI 的 ChatGPT 成为更受欢迎的新宠这背后究竟发生了什么
而在人工智能基础技术领域,Tokenization 的老路正在被新思路挑战,全新结构让大模型的语言理解能力再度升级,引发了整个社区的热议。欢迎和我们一起关注科技创新最前沿。Google 推出了 Gemini CLI,这是一个免费的开源 AI Agent,让开发者可以直接在终端里体验到 Gemini 的强大能力。
Gemini CLI 支持代码理解、文件操作、命令执行和智能故障排查等多种功能,不但适合日常编码,还能助力写作、内容生成、深度研究和任务管理。个人用户只需用 Google 个人账号登录,就可以免费获得 Gemini Code Assist 的授权,获取 Gemini 2.5 Pro 高达 100 万 Token 的上下文和业界领先的免费额度,包括每分钟 60 次和每天 1000 次模型调用。
Gemini CLI 除了开箱即用,还支持通过扩展和 MCP 协议进行能力拓展,并能接入 Google Search,获取实时网络信息,个性化配置和脚本化调用也都很方便。这个项目开源,代码完全透明,社区可以自由检查、贡献和定制。
评论区里有开发者反馈 Gemini CLI 在大型代码库处理上比 Cloud 更容易跑通完整项目也有人表示对它的数据隐私有担忧毕竟所有交互内容都会上传到 Google 还有用户吐槽希望 Gemini CLI 能兼容更多开发者常用的企业账号和简化依赖环境免去额外安装 Node 或其他运行时的麻烦整体来看 Gemini CLI 在开源和免费额度方面带来了新体验但社区期待后续继续提升稳定性和易用性
PNG 图片格式在时隔 20 多年后迎来了全新的规范更新,这次带来了包括对 HDR 高动态范围色彩的正式支持,让图片的色彩表现更加丰富,同时还能兼容未来的需求。另一个重要变化是 APNG 动画格式终于被官方规范认可,意味着 PNG 图片可以直接实现更流畅的动画效果。
此外,最新规范还增加了对 Exif 数据的支持,方便记录版权,相机信息,以及照片拍摄位置等详细参数。技术细节上,这一轮更新还做了大量错误修正和条款细化。W3C 牵头联合了 Adobe、Apple、Google 和 BBC 等多个重量级机构共同推动,行业巨头的加入让 PNG 格式焕发了新活力。
目前 Chrome、Safari、Firefox 这些主流浏览器和 Photoshop 等软件已经支持了新版 PNG 部分视频编辑工具和硬件也在积极跟进适配接下来 PNG 规范还会继续更新比如提升压缩效率以及支持并行编码解码等新特性
网友普遍认为这次规范修订及时而且务实有人高兴终于等到了官方版 APNG 也有人讨论现代硬件带来的新可能还有不少开发者提出对压缩率和兼容性的更多期待 Fitcoins 由 Theodore Nichols 推出这是一种比普通五分镊币更厚实的新硬币其因是有一天小偷闯进了他的车库他试图用装着普通镊币的袋子下推窃贼结果不仅没有成功反而被嘲笑连镊币和心爱的推扫轴也都被偷走
这次经历让他下定决心,要打造真正有分量的 sneakers,既能让人感觉扎实满意,又多少能起到防身作用。CEO 还特意把车库改成了专门的铸币工厂,和合作伙伴一起开放了限量首批预定,并且提到 flyer 印刷和分发依然有效,比社交媒体更直接。页面还幽默地展示了普通镊币和 sneaker 的厚度对比,强调产品的独特手感。
很多网友都称赞这种怀旧又有趣的个人项目觉得像回到了 90 年代早期互联网时代也有人主动参与分享 flyer 表示愿意支持还有评论调侃现在能够看到用 frontpage98 制作的网页实在难得这份老派情怀让人怀念过去的互联网风格
PasticList 网站公布了食品中塑料化学物质的检测数据,对几百种常见食物进行了采样测试,结果显示有 86%的食品样本里都能检测到不同种类的塑化剂,比如 DEHP,DBP,BPA 等,这些数据只是原始的测试结果,并不代表着相关食品就一定有健康问题。
Plastic List 也在免责声明中强调测试样本数量有限每种数据都有不确定性并且不同的检测方法会导致结果存在差异所以这些结果只能作为了解现状的一个参考而不能据此下结论
网友在评论区讨论了一些生活中也可能存在的塑料来源比如一次性塑料胡椒研磨器的塑胶碎屑食品加工设备长期运转产生的塑料威力还有人关注检测到的数值到底是不是超出了安全上限也有人反映比起塑料糖分或者酒精对健康的风险可能更高整体来看大家对于食品含素的危害持有不同观点既有人担忧风险也有声音认为需要更严谨的科学研究
OpenAI 的音频转录按分钟计费,所以如果要节省开销和转录时间,一个有效方法就是直接把音频加速,比如用 Fumpag 把音频处理成两倍速或三倍速,然后再上传转录,这样不仅可以加快处理效率,还能压缩整体成本。比如一段 40 分钟的讲座音频,如果用三倍速处理后,长度会降到 13 分钟左右,实际转录费用能节省 30%以上。
如果超过了 OpenAI 的 25 分钟上传限制也可以通过加速的办法把音频缩短避免手动剪辑实测在两倍速或三倍速情况下转录准确率影响不大超过四倍速就会出现识别错误很多讨论区网友提到其实这种方案和图片压缩有点类似人和 AI 大脑都有一定的容错和补全能力还有人建议对于自己本地处理的音频可以用 Whisper 模型就不用担心 API 成本
也有人反馈,这个方法应用在实际批量处理项目中确实能节省大量费用和等待时间。美国马里兰州的 College Park 国家档案馆将从 2025 年 7 月 7 日起成为限制访问的联邦设施,届时只有拥有合法业务需求的访客才能进入,普通公众将无法自由进入。
所有研究者需要提前申请并出示研究者卡,工作人员将加强身份核查。如果有人滥用研究者注册视图绕开规定,可能会被永久禁止访问所有 NARA 设施。此次调整引发了研究者和学术圈的担忧,有人表示这些档案馆本以人手紧张且重视安保措施,是许多学者跨国使用的重要学术资源。
评论区里有网友认为这项措施对安全有一定帮助,也有人觉得美国国家档案馆应该增加资金投入,提升公共获取和数字化的能力。还有人提到在英国等地,对档案访问本就有类似的门槛,但美国公众对于透明度有更高的期待。诺贝尔奖得主 Richard Feynman 写给一位前学生的信里,分享了他对科学问题选择的独特见解。
信中提到,这位学生在研究电磁波通过湍流大气传播的理论时,觉得自己的课题过于平凡,翻门鼓励他说,真正有价值的问题,是那些你能够参与解决,能做出实际贡献的问题,而不一定非要宏大或高深。
他举例自己曾经也处理过很多看似普通的小问题比如研究光滑表面之间的摩擦系数金属和塑料的结合以及儿童玩具 Flex seconds 的数学理论等有些问题甚至没有完全解决但每一次的小小成功都很有意义 Fanman 还提醒学生不要因为自己的理想或者别人的标准否定那些切实能带来成长和成就感的课题他强调即使看起来微不足道的挑战只要能解决就是值得努力的目标
在评论区,网友认为这封信展现了 Fan 们独特的人文关怀和朴素智慧,也有人结合自己的工作经历,表达了对如何找到值得做的事的共鸣。还有人感慨不管成就大小,只要带来实际改变,就是有意义的探索。彭博社最新报道显示,尽管微软去年成功向安静公司推广了 Copilot AI 助手,并一度成为微软重点宣传的大客户,但目前安静的员工却已经开始转向使用 OpenAI 的 ChatGPT。
在企业用户中,越来越多的人更喜欢直接用 ChatGPT,而不是微软旗下的 Copilot。这一趋势让微软在企业及生成式人工智能市场的布局面临挑战,尤其是两家公司本身又是合作伙伴和投资方的特殊关系。有网友评论说,Copilot 虽然整合了不少功能,但实际体验却不如预期,经常让用户感到困惑。
同时,大家也提到微软在 Copilot 的品牌策略和产品定位上存在混乱,让企业和用户都感到不便。还有人认为,微软错失了先发优势,没有把握好与 OpenAI 合作带来的机会。
最近有一篇讨论大语言模型领域 Tokenization 苦涩教训的文章引发了不少关注文章回顾了文本处理领域常用的 BytePair EncodingBPE 等分词方法他们通过将频繁出现的字节组合为更大的 Token 以便更高效地压缩文本和减少计算资源消耗但这些方法本身并不是 Transformer 必须的仅仅是一种工程折衷
实际上分词方案可能会引入很多问题比如编码奇怪的字符导致数字识别困难以及因合并策略不理想造成效率损失近期研究者提出了一种新结构 BLTBite Latent Transformer 试图用端到端的 Bite 级方法替换掉以往的分词机制 BLT 通过对字节序列动态分组形成 Patch 利用局部和全局 Transformer 在不同力度信息上分别建模提高了大模型对语言本身的感知能力
实验数据显示,BLT 在用相同推理资源下,在多个下游任务中对比 Lama2,Lama3 以及典型 BPE Tokenizer 模型表现更优,特别是在字符级和细腻度任务有明显提升。讨论区网友普遍认为,Tokenization 的局限对模型算术和逻辑推理能力影响较大,不同的分词方式可能严重限制大模型表达概率分布的自由度,也有声音支持全面用原始字节建模或尝试多种分词混合方案。
部分网友还提到正是依赖传统分词方法才掩盖了模型架构潜在的更多创新空间有开发者最近尝试用 X11 平台实现屏幕内容的精确缩放比如在不同尺寸和分辨率的显示器上始终绘制出两英寸大小的圆形作者通过 OpenGL 和 XRender 扩展读取每个屏幕的物理宽度和像素宽度然后用简单的数学计算确保无论窗口拖到哪一台显示器圆形的尺寸始终保持一致
在测试过程中他还发现,虽然在各种显示器间实现了理想的缩放,但实际测量时,因为电视的标称尺寸和实际尺寸有些偏差,导致显示效果略有差异。值得一提的是,这段程序甚至可以远程运行,比如作者的程序实际上是在另一台路由器上运行,通过 MIT Magic Cookie 一认证实现了远程图形输出。
评论区有网友提到,这种基于分辨率和 DPI 直接渲染的方式,比现在流行的 VLAN 平台常用的先放大再缩小的缩放方式效果要好,能够避免模糊和性能损失。也有人表示,X11 层面其实不缺技术,很多应用货库本身对缩放不够敏感才是主要的问题。还有人吐槽在 Linux 上自定义分辨率和缩放依然没有 Windows 平台来得简单。感谢您的收听,这就是今天的黑客新闻中文日报。
如果这些科技动态让您思考,也欢迎订阅、留言或分享给朋友。我们与您一同见证科技浪潮的每一次变革。明天见!