报告题目:大模型时代下的开放场景视觉感知与理解
报 告 人:尹军辉 北京邮电大学人工智能学院博士后
主 持 人:李蕾 教授
报告时间:2024年12月11日16:00-17:00
腾讯会议:744-3448-1313
报告摘要:
在当前人工智能领域,大语言模型因其高度通用化和智能化的表现受到社会广泛关注,并逐渐发展成为机器学习领域重要的研究方向。相比于语言模型的快速发展,视觉大模型的研究相对滞后。尽管预训练的视觉大模型借助语言模型的知识表征能力取得了良好的零样本泛化,但在实际模型推理过程中,并不会提供确切的对象类别名称。因此,如何将预训练知识高效快速的迁移到下游各种开放式场景至关重要。本报告聚焦开放场景下视觉大模型提示生成技术的发展现状与趋势,探讨如何构建高效、可解释、泛化能力强的视觉大模型实际应用技术。
专家简介:
尹军辉,北京邮电大学人工智能学院博士后、新加坡管理大学访问博士后。长期从事多模态学习、视觉感知识别等方向的研究,研究成果在IEEE TIP、PR等国际期刊和会议上发表,主持国家自然科学基金青年项目,曾参与国家杰出青年科学基金、国家优秀青年科学基金、国家重点研发计划等项目。获国家资助博士后研究人员计划,被评为北京邮电大学优秀博士毕业生。