9月27-28日,“人工智能价值对齐的理论与实践”专题学术研讨会召开。来自哲学、法学、心理学、计算机科学、政治学、管理学等多个学科,中国人民大学、北京大学、清华大学、北京师范大学、浙江大学、中国科学院心理学研究所、中国科学院自动化研究所、微软亚洲研究院等十余所高校和科研机构的二十余位学者参加研讨会,从多个角度共同探讨人工智能的价值对齐问题。

中国人民大学人工智能治理研究院院长、哲学院教授刘玮首先介绍了人工智能治理研究院的核心理念与建设目标,以交叉学科的方式探讨人工智能价值对齐问题的理论与现实意义。

第一场讨论中,中国科学院自动化研究所研究员、人工智能伦理与治理研究中心主任、北京前瞻人工智能安全与治理研究院院长曾毅,中国人民大学哲学院教授刘永谋,北京师范大学法学院教授、数字法学研究中心主任汪庆华分别以《超级协同对齐,共赴共生社会》《AI价值对齐的限度》《生成式人工智能的责任机制和伦理对齐》为题作报告,从计算机科学与伦理学的交叉视角、技术哲学、法律等角度对人工智能的价值对齐进行探讨。中国人民大学法学院教授、未来法治研究院执行院长张吉豫主持。

第二场讨论中,北京师范大学心理学部认知神经科学与学习国家重点实验室暨IDG/麦戈文脑科学研究院教授汪寅、清华大学计算机科学与技术系教授黄民烈、北京大学哲学系教授周程分别以《人类共识之基:跨越古今中外的道德概念表征空间》《大语言模型的超级对齐》《价值对齐需要明确对象:关于“算法”语义膨胀的粗浅思考》为题作报告,从人类道德概念的心理表征、人工智能价值对齐的技术实现路径与伦理挑战、“算法”概念的语义辨析等方面,对人工智能价值对齐这一议题进行探讨。中国人民大学高瓴人工智能学院教授窦志成主持。

第三场讨论中,浙江大学哲学学院教授李恒威、中国科学院心理研究所研究员古若雷、中国人民大学哲学院教授王小伟、清华大学心理与认知科学系副教授伍珍分别以《情感机器的构建与价值对齐——基于“以生命为核心”的意识理论》《群际偏见、共情、人智社会》《从技术到伦理:情感陪伴类人工智能的价值对齐挑战》《大语言模型的亲社会行为:价值对齐与情绪机制》为题作报告,北京师范大学心理学部认知神经科学与学习国家重点实验室暨IDG/麦戈文脑科学研究院教授刘超主持。

第四场讨论中,微软亚洲研究院研究员姚菁、中国人民大学国际关系学院讲师张扬和博士生刘冠宏、对外经济贸易大学法学院教授张欣分别以《文化价值观对齐》《AI会按下核按钮吗?威慑理论再审视》《算法公平的类型构建与制度实现》为题作报告,中国人民大学信息资源管理学院教授闫慧主持。

第五场讨论中,闫慧,张吉豫,中国人民大学高瓴人工智能学院副教授王希廷,刘超分别以《论“四有”AGI的修养》《企业人工智能科技伦理治理挑战及制度建设》《大模型对齐:探索基本价值观对齐与精准神经元控制》《从见义勇为的人类到向善的AI——利他行为的心理与脑机制研究及其在人工智能价值对齐中的应用》为题作报告,中国人民大学哲学院教授张霄主持。

圆桌讨论环节由刘玮主持,与会学者与媒体代表共同交流讨论。张吉豫表示,人工智能治理需要法治的“硬支撑”,也应注重与其他治理路径的协同,推动“以人为本、智能向善”的制度落地。刘超强调心理学在AI价值对齐中发挥“人性锚点”作用,推动“利他”“共情”等人类独特价值嵌入AI系统。李恒威提出,AI是一面镜子,映照出人类文明升级的紧迫性,价值对齐的终极对象不是机器,而是人类自身。姚菁从技术角度分析了人工智能价值对齐的未来,展望人机共生的未来社会。张扬表示,AI价值对齐已不仅是伦理议题,更是国际竞争与制度博弈的新场域,需警惕算法殖民与文化霸权风险。王希廷肯定了跨学科交流和合作对于人工智能治理研究的重要意义。王小伟提出人性的复杂性对于人工智能价值对齐工程的挑战,强调哲学参与人工智能治理研究的重要意义。
刘玮在总结中表示,本次研讨会聚焦人工智能价值对齐的核心议题,涵盖哲学、法律、技术、心理、政治、管理等多个维度,体现了人工智能治理研究的交叉性与前瞻性,推动了跨学科合作与理论实践的深度融合。今后,中国人民大学人工智能治理研究院将继续致力于搭建高水平学术交流平台,推动人工智能治理体系与治理能力现代化。
本次活动由中国人民大学人工智能治理研究院主办,中国人民大学交叉科学研究院、未来法治研究院、高瓴人工智能学院,北京师范大学心理学部认知神经科学与学习国家重点实验室暨IDG/麦戈文脑科学研究院协办,是中国人民大学88周年校庆学术月的活动之一。