李鑫:我长期从事自然语言处理工作,见证了人工智能技术从计算智能到感知智能,再到如今大模型时代的飞速发展。我参与了讯飞输入法、讯飞超脑等项目的研发,深刻理解了数据和互联网对模型迭代的重要性。在感知智能阶段,语音识别和语音合成技术已经取得显著进展,并广泛应用于各个领域,例如虚拟人、作文批改等。然而,认知智能仍然面临诸多挑战,例如自然语言处理中的一词多义、中文分词等问题,以及对常识和逻辑的理解。ChatGPT 等大语言模型的出现,标志着人工智能进入了一个新的阶段,其核心技术是预测下一个单词,准确性取决于上下文信息。大模型的参数量大、数据量大,能够处理更长的文本,但同时也存在一些缺陷,例如难以更新新知识和容易出现事实性错误。为了解决这些问题,我们需要将知识和逻辑分离,并采用检索增强技术。我们研发了星火大模型,采用“1+N”架构,即一个通用大模型加多个垂直行业模型。星火大模型不仅可以进行图像理解、解答高考题等任务,还可以应用于学术领域,例如科技文献的阅读和综述撰写。未来,我希望大模型能够成为科学家的助手,甚至同事,并选择合成科学作为大模型应用的突破方向。通过大模型结合实验机器人,可以实现实验流程自动化,提高科研效率。总而言之,人工智能将人类从繁重的脑力劳动中解放出来,并将成为促进国家经济增长的新的引擎。
Deep Dive