王晓晨副教授
个人简介:
王晓晨,1981年出生,博士,讲师,IEEE会员。2003年获武汉大学地图学与地理信息系统专业工学学士学位,2004年起在武汉大学遥感学院攻读通信与信息系统专业硕士,2011年在国家多媒体软件工程技术研究中心获工学博士学位。2009年选留武汉大学。研究方向为音视频信号处理,重点关注量化和立体声编码技术。2011年起,申请者开始研究3D音视频处理技术,从3D音视频信号空间信息提取与表达、信号编码等多个方面开展研究。2012年以来,王晓晨作为主要技术负责人之一参与了国家自科基金重点项目“三维音频基础理论与关键技术研究”、“移动音频编解码基础理论与关键技术”和国家863计划项目“移动终端三维声场技术”等一系列国家级重点重大科研项目,并主持国家青年基金和武汉晨光计划项目,研究成果在AES、ICASSP等多个音频领域顶级会议和Eurasip J.等国内外期刊上发表,共发表论文21篇,其中SCI索引3篇,EI索引11篇。共申请国家发明专利37项,其中已授权16项,均集中在音频编解码、3D音频相关领域,其中在3D音频领域申请和授权的专利数全国第一。在标准化工作方面,王晓晨从2005年开始参与国家数字视音频编解码技术工作组AVS音频标准的制订工作,共参加AVS标准工作会议近40次,作为主要负责人员在武汉大学成功主办AVS音频标准会议6次,参与主持制订了音频编解码相关的国家标准“GB/T 20090.10-200Y 先进音视频编码第10部分:移动语音与音频编码”和“GB/T 20090.3-200Y先进音视频编码第3部分:音频”,目前已完成国家技术标准文档3项,国际技术标准文档1项,正在制定国家技术标准一项,已提交的国家标准提案超过50项,提出的AVS-P10 S框架、AVS2第三部分:音频-高效语音编码技术框架等提案构成了AVS标准的重要支撑,是AVS音频标准的主要贡献者之一。作为音频联合组长、AVS-P10代码组负责人,具有国家承认的标准文档编辑资格,全程全面参与标准的需求分析、框架确定、提案征集、技术研究、算法优化、性能测试、符合性测试、送审报批等工作,并且与北京大学、中科院、清华大学、中国传媒大学、华为公司、华阳通用(国内最大车机生产企业)、电子技术标准化研究所、三星公司、新加坡资讯通信研究院、美国GMU大学等国内外一流高新技术企业、科研机构、高等院校建立了良好的科研合作关系,在音频编解码领域展开广泛合作。学术兼职:国家数字视音频编解码技术标准工作组总体组专家国家数字视音频编解码技术标准工作组音频联合组长IEEE SA 1857WG 国际标准工作组编辑深圳3D多媒体信息与数据分析处理重点实验室专家
主持及参与的项目:
近五年负责和参与科研项目清单:1. 2009至2012年,作为技术骨干参与国家自然科学基金重点项目“移动音频编解码基础理论与关键技术”(60832002,200万)研究。该项目主要研究面向移动网络环境的音频编解码技术,主要研究内容包括频谱扩展技术、空间音频编码技术、格型矢量量化技术以及可分级编码技术。负责和参与了其中空间音频编码和格型矢量量化技术的研究工作。2. 2011至2012年,主持了武汉市青年科技晨光计划“移动音频编解码基础理论与关键技术”(201150431104,14万)。采用自适应心理生理测量方法,在全频带和对耳间强度差线索ILD的临界可感知差异JND进行测量;在分析ILD线索的JND变化规律的基础上,提出了针对5.1声道信号的ILD参数量化方法,提升了传统多声道编码的编码效果。3. 2013年至今,申请者作为技术负责人参与国家自然科学基金重点项目“三维音频基础理论与关键技术研究”(61231015,315万),项目针对精简三维音频系统缺乏距离表达能力、三维音频系统扬声器组精简方法停留在经验阶段、海量数据存储与传输资源需求倍增等挑战开展三维音频信息高效表达与重建的关键技术开展研究。4. 2013年起,主持国家自然科学基金青年项目“三维音频中空间方位信息感知编码关键技术研究”(61201169,25万),项目针对现有多声道编码技术缺少对声音空间信息感知特性的考虑,在追求压缩率时空间信息感知失真过大的问题,在已有空间听觉实验的基础上,将传统感知熵理论拓展到空间可感知信息量的计算,建立可感知空间信息度量模型最终构建基于感知的空间信息编码框架,为解决当前3D音频编码的性能瓶颈提供技术支撑。5. 2015年起,申请者作为子课题负责人参与国家863计划项目 “移动终端三维声场技术” (SQ2014GX02D01144,280万),项目将开展面向移动终端的三维音频制播关键技术研究,重点研究三维声场感知机理,突破空间信息高效感知压缩技术瓶颈,解决移动网络下三维音频压缩难题;探索个性化HRTF 构建和优化选择方法,提升三维音频重建效果;研究适于资源受限的移动终端的三维音频实时处理技术,最终提升现有移动终端听觉体验,为我国移动多媒体产业提供自主创新的关键技术支撑。
获奖情况:
2011、2012连续两年获得国家数字视音频编解码技术标准工作年度贡献奖
主要论文:
1. Wang, Xiaochen; Wang, Ying; Hang, Bo,Application of AVS-P10 mobile speech and audio coding in social multimedia ,5th International Conference on Internet Multimedia Computing and Service, ICIMCS 2013, 2013/8/17-2013/8/19, 2013/7/1.2. Wang Xiaochen; Zhang Yong; Hu Ruimin; Du Xi,An Immittance Spectral Frequency parameters quantization Algorithm based on Gaussian Mixture Model ,1st International Conference on Multimedia Information Networking and Security (MINES 2009), 2009/11/17-2009/11/20, pp 324-328, Hubei, PEOPLES R CHINA, 2009/10. 3. Shanshan Yang, Xiaochen Wang, Dengshi Li, Ruimin; Weiping Tu,Reduction of Multichannel Sound System Based on Spherical Harmonics ,IEEE International Conference on Pacific-Rim Conference on Multimedia, 2014/12/2-2014/12/44. *Jiang, Lin; Hu, Ruimin; Wang, Xiaochen; Zhang, Maoshen; Wang, Zhongyuan,AVS2 speech and audio coding scheme for high quality at low bitrates ,2014 IEEE International Conference on Multimedia and Expo Workshops, ICMEW 2014, 2014/7/14-2014/7/18, Chengdu, China, 2014/7/18.5. Dong, Shi; *Hu, Ruimin; Wang, Xiaochen; Yang, Yuhong; Tu, Weiping,Expanded three-channel mid/side coding for three-dimensional multichannel audio systems ,EURASIP Journal on Audio Speech and Music Processing, 2014/3/24.6. Li, Dengshi; *Hu, Ruimin; Wang, Xiaochen; Tu, Weiping; Yang, Shanshan,Automatic multichannel simplification with low impacts on sound pressure at ears,15th Pacific-Rim Conference on Multimedia, PCM 2014, 2014/12/1-2014/12/4, pp 363-372, Kuching, Malaysia, 20147. 王晓晨;姜林,一种基于高斯混合模型的导谱频率参数量化算法,电视技术, 15期, pp 185-188, 2014/8/2.8. 胡瑞敏;王晓晨;张茂胜;李登实;王松;高丽;杨乘;杨玉红,三维音频技术综述,数据采集与处理, 05期, pp 661-676, 2014/9/159. 胡瑞敏;王晓晨;涂卫平,AVS-P10移动音频编解码标准与关键技术,电视技术, 34(10), 2010.10. 姜林;王晓晨;张茂胜;文彬,面向移动应用的语音编解码开环基音搜索方法,智能计算机与应用, 01期, pp 75-77+82, 2014
著作教材:
[1] AVS技术创新报告(2002-2010),数字音视频编解码技术标准工作组,人民邮电出版社,2011
研究生情况:
协助指导博士研究生10名,硕士研究生12名。