4月16日下午,我院2010届校友、澳大利亚阿德莱德大学副教授吴琦受邀重返母校,在闻厅二楼报告厅作题为《从视觉到语言:我的人工智能科研之路》的学术讲座。吴琦通过回顾自身科研历程,带领现场师生穿越视觉语言导航与大语言模型结合的融合边界,展现了人工智能领域最前沿的探索图景。院长于明州在致辞中表示,校友吴琦的成长轨迹展现了计量人追求卓越的学术精神,其前沿研究成果也为学院学科建设提供了重要参考方向。

跨越十载的量大学子蜕变
作为视觉语言导航领域的开创者之一,吴琦在报告中回顾了自己的科研历程。他在2010年本科毕业于中国计量大学理学院信息与计算科学专业,后赴英国巴斯大学深造,相继获得硕士及博士学位。2019年荣获澳大利亚科学院颁发的J G Russell奖,现任澳大利亚机器学习研究所视觉与语言领域主任,其研究涵盖图像描述生成、视觉问答等方向,成果广泛应用于智能机器人、自动驾驶等领域。
回忆大学所选专业时,吴琦表示起初他不知情报考的信息与计算科学专业主要学习和数学有关的课程。大二时他也曾考虑过转专业,但权衡过后选择留下。大三时,吴琦得到了选择课程学习的机会,出于自身兴趣,吴琦选了计算机图形学这门课程。在中国计量大学学习计算机图形学的经历为他硕士期间选择计算机图形方向研究埋下伏笔,计量四年的生活,成为吴琦漫漫科研路的一盏明灯。

解码视觉语言交互密码
讲座现场,吴琦围绕计算机视觉与自然语言处理的交叉领域展开,重点介绍了视觉语言导航(VLN)与大语言模型(LLM)结合的最新突破。他以通俗易懂的语言解析了如何通过LLM的语义理解与逻辑推理能力,推动导航任务从基础路径规划向高层智能决策演进,并对VLN与具身智能的未来发展方向提出前瞻性思考。报告为多模态交互与通用机器人导航研究提供了创新思路,现场师生反响热烈。
目前,吴琦团队探索的课题围绕计算机视觉与更高层次的人工智能应用结合展开,他希望将算法与各类硬件结合以适应更多场景,例如将具有多模态能力的大语言模型应用至机器人上,使其有能力理解和输出视频、图像、声音和文字信息,以主人公的视角去自主感知物理世界,达到具身智能的形态。
寄语学子共话智能未来
在互动环节中,吴琦与在场师生就“语言导航与大语言模型”等话题展开深入探讨,与会师生纷纷表示,报告内容兼具理论深度与实践价值,为人工智能跨模态研究开拓了全新视野。在讲座最后,吴琦为在场的学子们送上了诚恳的建议与真挚的祝福。他认为打好专业基础相当重要,在掌握扎实的专业知识的同时,需要对未来生涯进行规划。此外,他还特别强调了科研、竞赛项目的重要性。

此次讲座作为理学院“理享讲堂”系列活动的重要组成,不仅搭建了国际学术交流平台,更以杰出校友的榜样力量激励青年学子勇攀科研高峰,有效激发了学子们探索学术科研之路的热情。未来,学院将持续搭建校友-学子对话平台,为培养新时代理学人才注入新动能。