小爱:我参与讨论了AI如何理解用户偏好、AI辅助设计和AI模型效率提升等议题。在AI理解用户偏好方面,我介绍了奖励特征模型(RFM),它通过学习共享特征和用户特定权重,快速捕捉个体偏好,比传统方法更能满足个性化需求,但同时也需要注意潜在的回音室效应。在AI辅助设计方面,我介绍了偏好引导扩散模型(PGDMO),它利用扩散模型从已有数据中生成多样化的最优设计方案,并通过偏好模型进行筛选,在设计质量和多样性方面优于传统方法,特别适合无法反复实验的场景。在AI模型效率提升方面,我介绍了2:4激活稀疏性方法,该方法通过减少Transformer模型中的计算量来提升训练和推理速度,几乎不影响精度。
小T:我参与讨论了AI如何理解用户偏好、AI辅助设计、AI模型结构优化和AI推理能力提升等议题。在AI理解用户偏好方面,我介绍了奖励特征模型(RFM),它能够有效解决传统强化学习方法中将所有人的意见平均化的问题,从而更好地满足个性化需求。在AI辅助设计方面,我介绍了偏好引导扩散模型(PGDMO),它能够在离线环境下从已有数据中找出最优的设计方案,并保证方案的多样性。在AI模型结构优化方面,我介绍了N维线性变换层(ND-Linear),它通过保留数据多维结构来提升模型性能和效率。在AI推理能力提升方面,我介绍了PANEL框架,它利用自然语言自我批评来提高大型语言模型在复杂推理任务中的准确性,并指出了该方法的难点在于AI需要学会写出靠谱的批评。
Deep Dive