为进一步提升学院学术氛围,扩展广大同学的专业视野,7月12日上午10:00,人工智能学院于创新楼211和腾讯会议同步举办人工智能论坛第38期“音频和文本的跨模态生成”,主讲人为英国萨里大学王文武教授,报告由人工智能学院李雅副教授主持。
报告伊始,李雅老师介绍了本次报告的主题、英国萨里大学王文武教授的个人简介、学术成就和研究领域等。随后,王老师声音识别以为切入点,介绍了场景识别、音频标注、声音事件检测、自然语言处理和语音信号处理等。接着,王老师讲解了音频-文本的跨模态生成,并强调理解音频剪辑中的音频事件和场景以及解释自然语言中呈现的文本信息是必要的。然后,王老师论述了音频和文本的跨模态生成领域的研究进展和未来可能的研究方向,包括问题描述、核心技术进展、潜在应用、数据集、开放挑战等。最后,王老师对此次报告做了简单总结和展望,并热心回答了师生们的疑问。
本次报告内容丰富,通过英国萨里大学王文武老师的讲解,与会师生对音频和文本的跨模态生成有了深入了解。后续,人工智能学院将持续开展人工智能论坛活动,为丰富学院学术氛围,促进学术交流提供平台。
人工智能学院
2023年7月13日