中兴通讯斩获全球计算机视觉顶级会议CVPR2021多项荣誉

2021-08-12 11:40:00 网络阅读量:11643   
imgad2

提到视频,我们都不陌生,今天的我们正被各种形式的视频内容所包围,感受着超清视界带来的感官冲击。可以说,与视频技术相关的每一次微小进步都有可能改变未来的视频格局,这些凝聚着工程师们智慧心血的成果最终也将融入、改变我们的生活。

近日,全球计算机视觉顶级会议IEEE CVPR(Conference on Computer Vision and Pattern Recognition)落下帷幕,来自中兴通讯的视频算法团队参加了大会的三项核心赛事并分获第一、第二和第三的好成绩!其中,视频超分辨率的论文还被IEEE CVPR 2021 workshop收录。

获奖项目介绍

1、视频超分辨率挑战

简单理解,超分辨率(Super-Resolution)就是通过硬件或软件的方法提高原有图像的分辨率,即实现从低分辨率低质量图像中恢复高分辨率高质量图像,同时还要兼顾性能和效率。

视频超分辨率技术在5G医疗、5G监控、远程诊断等领域将发挥越来越大的应用价值。随着移动设备人工智能的成熟发展,采用视频超分辨率技术可以直接在移动设备上实现从低分辨率低质量图像到高分辨率高质量图像的超解析,减少了传输高分辨率高质量图像的环节,降低了传输成本、简化了传输流程,可极大助力5G行业新业务的开展,支撑社会各行各业的数字化转型。

中兴通讯首次参加超分辨率类比赛,凭借着长期在AI方面的技术积累以及多年的参赛经验,一路过关斩将,将320times;180超解析到1280times;720的效率大幅提升,达到11.3 ms/f。最终,以第一的效率指标和优秀的图像质量,与另外一只队伍并列,荣获冠军。

2、视频压缩挑战

顾名思义,视频压缩就是通过技术手段减少视频文件的大小,同时要注意保持画面的清晰度。

视频压缩技术是5G大视频的基础技术,是云端、边缘、终端均需使用的重要技术,采用该技术可定制超低延时的编码算法,从而改善用户进行视频、娱乐交互时的体验,解锁更多强交互的应用场景。

视频压缩技术也是5G+MEC行业应用的关键技术,将极大发挥端到端的5G低延时能力,更好地支撑如远程手术、重工企业/港口码头的远程操控、智能工厂的视频分拣、无人机巡检等行业新业务的开展。

中兴通讯视频算法团队参加了视频压缩赛道的比拼,最终以视频质量客观指标MS-SSIM(多尺度结构相似性)第二、PSNR(峰值信噪比)第一的优异成绩脱颖而出,荣获亚军,展现了团队扎实的编解码技术功底,位居国际一流水平。

3、视频人像抠图挑战

人像抠图是指通过技术手段识别人体轮廓边界,与图像背景分离。

通过视频人像抠图技术能实时、准确地分离人物背景,为用户提供AI抠图等创意玩法。该技术也可用于设置视频会议、视频通话、视频直播时的虚拟背景,对各类视频应用场景起到推广作用,赋能公司5G行业新应用、新模式。

中兴通讯视频算法团队高效地完成了比赛,并最终进入该赛事的国际前三,荣获视频人像抠图挑战赛季军!

5G大视频正日益蓬勃发展,同时疫情带来了高清视频会议需求的爆发性增长,视频超分辨率、视频压缩和视频人像抠图三大关键基础技术将从根本上改变人们远程工作、视频会议等应用场景的体验。