近日,瑞士苏黎世联邦理工学院李亚伟博士应邀访问软件学院,为软件学院师生作了题为“On the Compression and Design of Foundation Models”的学术报告。
在此次报告中,李亚伟博士重点讨论了基础大模型 (Foundation Models) 在计算机视觉和自然语言处理领域的蓬勃发展,以及大模型在实际应用中面临的数据稀缺和模型复杂性两大挑战。李亚伟博士介绍了一种物理启发的数据模拟管道 (data simulation pipeline),该管道专门用于合成生物信号的原始频率超声信号,为开发生物医学等专业领域的基础大模型提供了解决思路。此外,李亚伟博士还提出了一种新颖的大语言模型 (Large Language Models) 量化方法,这种混合精度量化方法为LLMs确定权重的最佳位宽以及量化器,并关注模型显著权重位置从而最小化量化误差。
李亚伟博士在苏黎世联邦理工学院 (ETH Zurich) 获得博士学位,他的研究涉及计算机视觉、机器学习和人工智能算法的交叉领域。研究方向涵盖了高效人工智能神经网络、算法、硬件和系统的设计。研究成果已发表在多个顶级计算机视觉会议和期刊上,包括CVPR、ICCV、ECCV和T-PAMI,现为瑞士苏黎世联邦理工学院讲师。
(文/图:卢宪凯 责任编辑:戴鸿君)