9月27日下午,中国人民大学87周年校庆学术周活动-“大模型前沿研究进展”报告会举办。本次学术会议由中国人民大学高瓴人工智能学院主办,由准聘副教授刘勇担任主持。高瓴人工智能学院执行院长文继荣出席会议并致辞,教授赵鑫、长聘副教授许洪腾、刘勇、准聘副教授陈旭和准聘助理教授林衍凯作主旨报告,共同分享大模型前沿研究进展,会议吸引了多位校内外人员参会。
文继荣表示,以大模型为代表的新一代人工智能技术掀起了全球人工智能发展的新浪潮,未来已来,新的超级工具即将出现,新的研究方式已在眼前。希望各位师生积极拥抱大模型、学习人工智能知识,将挑战转变为机遇。
赵鑫作题为“面向大模型训练的数据工程方法”的主旨报告。他聚焦于预训练与继续预训练过程的基本技术路线,针对其中涉及的数据工程方法展开讨论,介绍了如何高效利用已有数据以及大规模合成数据在继续预训练中的应用方法,并以Llama 3为例,介绍了继续预训练所涉及的数据工程方法。
许洪腾作题为“算法驱动的高效模型架构设计与适配技术”的报告。他介绍了研究的初衷以及代表性工作,希望挖掘传统算法在人工智能时代的作用,证明其在模型架构设计和适配方面的重要性。
刘勇作题为“大模型基础理论最新进展”的报告。他介绍了研究大模型基础理论的动机和重要性,以及其所在课题组在大模型基础理论方向上的几个最新研究成果。
陈旭作题为“基于大语言模型智能体的通用社会模拟平台”的报告。他着眼于社会科学和自然科学的区别和联系,提出社会科学在研究过程中“以真人为基础”的实验范式的局限性。他介绍了大语言模型智能体对缓解这些局限性可能提供的机遇,并介绍了其课题组构建的通用社会模拟平台。
林衍凯作题为“大模型自主智能体”的报告,面向大模型智能体的工具使用问题,介绍了基于模仿学习和工具学习的两种典型工具学习方法、大模型自主的后面安全性与工具对齐技术,并从实际应用的角度探讨了大模型自主智能体的模糊意图理解技术、主动式智能体以及自动化流程技术等前沿性技术。
在自由讨论环节,参会人员就大模型研究领域的多个问题进行了深入交流探讨。