怀进鹏院士一行莅临中心调研指导工作
8月24日下午,中国科协党组书记、常务副主席、中国科学院院士怀进鹏到访工程中心进行调研。省委常委、省委统战部部长尔肯江·吐拉洪、校党委书记韩进、副校长李建成、省科协副主席叶贤林、秘书长孙击翔参加调研。
中心主任杜博教授首先向怀院士一行汇报了工程中心的学科领域、科研方向,以及近年来取得的科研成果。国家多媒体软件工程技术研究中心是多媒体软件技术领域第一个国家级研究机构,在音视频编码共性技术、多媒体数字安防技术、多媒体大数据分析技术方向拥有多项自主核心技术和专利。会上着重介绍展示了中心的智能化CT影像新冠肺炎诊断系统、三维音频处理系统和城域监控视频压缩平台采用的自主核心技术和特色功能。
中心主任杜博教授介绍中心科研情况
智能化CT影像新冠肺炎诊断系统是武汉大学计算机学院智能感知与机器学习小组SIGMA AI(Sensing IntelliGence and MAchine learing group)为抗击新冠病毒,采用人工智能、机器学习、计算机视觉技术和自有专利技术,夜以继日完成的一项重大科研成果。在杜博教授的牵头下,研发的新冠肺炎CT影像智能诊断系统从CT影像数据中分析患者疾病信息。在武汉大学人民医院投运后,系统 仅需1.33秒即可完成一次CT影像数据分析,辅助新冠肺炎诊断,极大提升了诊断效率和精度,极大减轻了医生对劳动强度。自2020年3月在武汉大学人民医院投入应用后,至今已累计协助诊断病例超过8000例,其中新冠病人2000多例,为抗击新冠肺炎做出了巨大贡献。
COVID-19智能化CT影像新冠肺炎诊断系统界面
三维音频处理是音频行业的领先技术。在国家自科基金重点项目、863计划项目以及国家重点研发计划的支持下,工程中心研制了移动三维音频与多声道三维音频录播系统,可利用仿生录音设备进行三维音频的采集和处理,并存储于云端,通过部署在云端的三维音频服务器,用户可以在手机、平板、VR设备、家庭影院等各种不同的设备上实现3D音频的制作和播放。项目成果相关技术应用于华为、华阳通用等多家公司的产品上,助力多款移动终端产品和多媒体车机实现听觉体验的提升。
工程中心主任杜博教授介绍3D音频科研成果
怀进鹏院士体验基于耳机的三维音频成果
城域监控视频压缩平台服务于智慧城市建设。随着城市监控视频的布设数量激增,以及视频分辨率从低清、高清到超高清的逐步提升,监控视频存储数据量直线攀升到ZB级别,视频数据存储面临巨大压力。平台挖掘城市监控视频特征,着眼于运动目标,去除多个视频中因重复目标导致的视频间冗余,从而降低海量数据存储量。相对于现有的编码标准,平台对运动目标的编码码率下降50%左右,大幅提升压缩效率。