小T:在传统的AI文本生成方法中,AI会一步步预测下一个词,并从中挑选一个作为输出。但这种方法只使用挑选出的词作为下一步的输入,忽略了其他概率信息,造成信息损失。为了解决这个问题,我介绍了一种名为“混合输入”(MOR)的方法。MOR不是直接使用选出的词,而是将选出的词和之前算出的概率分布结合起来,形成一个更丰富的输入。这种方法利用贝叶斯估计来决定如何混合,使得AI能够根据不同情况灵活调整。实验结果表明,在数学推理和代码生成等任务上,MOR能够显著提升性能,且计算成本几乎没有增加。研究还发现,混合的程度需要根据任务进行调整,例如数学推理任务需要更多的分布信息以保持灵活性。
Deep Dive