由济南超级计算技术研究院和北京大学视频与视觉技术国家工程研究中心联合筹办,聚焦多媒体领域最新发展方向,结合人工智能与高效传输技术,研发智能多媒体关键技术和平台,形成自主架构的知识产权体系,致力于推广多媒体产品智能化、高效化、交互丰富化。
研究高并发的智能媒体处理架构,搭建国产芯片处理体系,针对跨媒体信息实现不同媒体任务的高效协同。
研究全神经网络编码模型,通过全局优化模型参数,学习最优的率失真表示模型,解决传统算法编码框架所存在的局部优化约束性问题。
研究基于双线性卷积神经网络的端到端特征提取与识别技术,通过对两个特征提取器获取到的输出进行外积相乘进行特征表示,提升细粒度识别任务上的性能。
探索基于人工智能的多媒体安全处理技术,在信息隐藏、隐秘分析、水印保护、数字媒体取证、生物认证等领域寻求突破。
探索对三维数据、人工智能特征数据及超高清视频数据等大量信息进行协同传输的技术与算法,集成AVS3、AV1、H266、H265、G-Pcc等优秀的编解码标准,实现国产音视频以及深度处理技术的优化革新。
探索对图像、视频、文本、音频、点云等不同媒体数据进行语义分析、关联分析和多模态识别的方式,模拟类人脑感知计算的多感官信息协同处理能力。
针对直播、体育赛事等场景,研发以虚拟视点合成算法为核心的自由视角音视频直播系统,系统包括标定、虚拟视角合成、自由旋转切换等功能。
鲁公网安备 37011202001894号