中心博士生李罡论文获ICME 2020最佳论文最佳学生论文候选
来自国家多媒体软件工程技术研究中心2017级博士生李罡的论文《适用于电话语音可懂度增强的基于LSTM网络和BGMM的普通至Lombard语音转换》获ICME 2020最佳论文/最佳学生论文候选。该会议是中国计算机学会推荐的B类会议。ICME 2020将在2020年7月6-10日于伦敦召开线上会议,决出最终奖项。来自国家多媒体软件工程技术研究中心的学生最近一次在该会议上获奖还需要追溯到2009年,博士生陈水仙获得ICME 2009 “Student Travel Award”奖项。
如何在噪声环境中提高电话语音通信质量是当前语音通信中一个亟待解决的问题。噪声的侵袭主要来自于语音采集阶段(说话阶段)和语音播放阶段(接听阶段),语音采集过程中的抗噪技术已经经历了上百年的技术研究,而针对语音播放阶段的抗噪技术发展却缓慢得多。李罡博士的论文着眼于语音播放阶段的抗噪技术——语音可懂度增强(Speech Intelligibility Enhancement)技术,适用于手机等终端设备在噪声环境中播放语音的场景,其研究成果可令失真减少10%以上。
李罡博士于2015年进入国家多媒体软件工程技术研究中心进行1+4硕博连读,主要研究方向为语音感知与可懂度增强。在导师胡瑞敏教授的指导下,以第一作者身份在ICME,MTA,MMM等多项中国计算机学会推荐的国际知名多媒体会议期刊上累计发表学术论文5篇。曾获得第三届中国“互联网+”大学生创新创业大赛创意组湖北省赛区铜奖。
ICME全称为IEEE International Conference on Multimedia and Expo,由四个IEEE协会资助,自2000年首次召开以来,至今已举办20届,每年吸引超过1000份投稿和500名参与者,是多媒体技术领域的旗舰会议和多媒体领域知识传播的主要论坛之一。