9月4日下午,复旦大学数学科学学院第四十期院士论坛在邯郸校区光华楼东主楼2201室举行。欧洲科学院院士,ICM报告人Enrique ZUAZUA为大家带来了题目为《机器学习:数学家的视角》的专题报告。本次报告由数学科学学院院长沈维孝院士主持。
报告开始,Zuazua院士首先忆及复旦数院与欧洲学界一直以来保持的密切联系。谈到今天的报告主题,Zuazua院士指出,机器学习,特别是大语言模型如ChatGPT, DeepSeek等,已经对人们的日常生活,甚至于对最前沿的科学研究领域产生了巨大影响。机器学习的历史可以追溯到Aristotle对自动化机械的构想,从那时起,人类对自动化机械的创造发展就一直离不开控制理论。直到今日,各方面的数学领域如概率统计、逼近论、微分方程、控制论等都协同起来发展AI,数学与AI之间已经架起了学科交叉的桥梁。

在报告的第一部分,Zuazua院士带领我们从控制论的角度去理解各种机器学习范式。他首先将抽象的监督学习(Supervised Learning)范式与形象的牧羊控制模型相对比,让大家更好地理解神经网络模型对样本的控制、聚类过程。监督学习最早源于数学家Gauss提出的最小二乘法,这一方法并非追求严格插值所有散乱数据,而是从简单的线性、二次函数等空间中,找到最优拟合函数。随着人们考虑的模型越发复杂,神经网络的参数数量逐渐膨胀到了如今大语言模型的百亿级别。Zuazua指出,对这些大数据与大模型的处理遇到了两个主要的挑战:维数灾难(Curse of Dimensionality)使模型难以在高维空间中找到合适的控制路径;非凸诅咒(Devil of Non-Convexity)使模型优化陷入损失函数的局部最小值中。Zuazua院士紧接着介绍非监督学习(Unsupervised Learning)范式,他以 Lloyd 算法为例展示了非监督学习模型如何将数据点进行聚类。Zuazua院士还介绍了大语言模型的基础:下一词元预测(Next-Token Prediction)范式,指出了这一范式与人类思考方式的相似之处。这一部分的最后,Zuazua院士还以人类学习使用电脑的例子介绍了强化学习(Reinforcement Learning)的交互性特点。

在第二部分,Zuazua院士使用更深入的数学工具来解释机器学习的有效性。首先,他从逼近论的角度指出神经网络具有万有逼近(Universal Approximation)性质,他介绍了N. Wiener与G. Cybenko分别对Gauss型、Sigmoid型与ReLU激活函数建立的相关理论成果。然后,Zuazua院士从控制论与动力系统的角度,将残差网络(Residual Neural Network)与常微分方程联系起来,引出了NODE(Neural ODE)模型。Zuazua介绍了关于NODE模型的重要性质:同时可控性(Simultaneous Controllability),表现为NODE模型可以将空间中的离散数据点连续地运输到指定的位置。为了证明这一点,Zuazua院士使用魔方作为生动的类比,将NODE的每一步操作分解为对空间的超平面切割,对一半空间的冻结,还有对另一半空间的压缩、扩张或平移。最后,Zuazua院士播放了基于这一分解的演示视频,展示了NODE模型对样本进行分类的过程。

报告最后,Zuazua院士总结道,基础的数学理论可以在很大程度上解释机器学习的成功,而这仍然是一个新兴的研究方向,他鼓励大家持续在这一交叉领域上学习知识、做出成果。

在报告后的提问环节,Zuazua院士分别回答了同学们关于元学习(Meta-Learning)与机器学习未来发展的问题。他以Euler在复数领域做出的巨大贡献为例,鼓励大家打破思维惯性,探索机器学习的新范式。他还认为AI的发展或许会达到饱和,遇到瓶颈,但相信新的突破将会发轫于AI落地应用,提升全人类的生活品质。最后,Zuazua院士希望我们像1968年的科幻小说作家I. Asimov一样,畅想50年内会发生的10件事,他鼓励我们发挥想象力,并保持对未来的乐观。