导航
学术报告|
当前位置:首页  科学研究  学术报告
报告题目: 深度神经网络的低维猜想
报 告 人: 黄晓霖 教授
报告人所在单位: 上海交通大学
报告日期: 2021-11-03
报告时间: 10:30-11:30
报告地点: 腾讯会议ID:277587965 , 密码:200433
   
报告摘要:

深度神经网络的参数量极大,造成训练时间成本高、训练样本量要求高。大家普遍认识到神经网络中具有很多的冗余,因此找到有效的低维结构、有效地去除冗余一直是学者们努力的方向。通过分析神经网络的动态特性,我们发展了一种新的降维方法,能够在很低维的空间中对神经网络进行有效的训练。实验结果表明,对于 CIFAR 级别的任务,在40维的空间进行训练;对于 ImageNet 级别的任务,在 200 维空间进行训练,就足以达到或接近于标准训练的效果。神经网络训练动态中低维结构的发现,对于节省训练时间、减少调参工作量、提升对抗训练效果、提升小样本学习效率等方面都有所裨益。

11-03海报.pdf

   
本年度学院报告总序号: 274

Copyright © |2012 复旦大学数学科学学院版权所有 沪ICP备042465