Ed: 我認為英國要求蘋果公司為iCloud設置後門,並將其應用於全球用戶,這一行為是荒謬且不可接受的。英國似乎存在一條法例,可以要求公司不論用戶身處何地,都必須接受英國的監控,這令人擔憂。
Patrick: 我對A100和H100在FP8下的訓練速度差異以及LLM訓練中不同模型的優劣勢缺乏確切的答案。我使用過Distilled版本的LLM,但對其能力和與R1模型的比較結果並不確定。關於構建用於運行大型語言模型的設備,我建議考慮使用雲端GPU或等待NVIDIA推出的小型設備,因為構建本地設備成本高昂且技術更新迅速。
Deep Dive