随着人工智能技术的飞速发展,数字人作为新兴的技术应用形式,正在逐步渗透到各个行业领域,成为推动产业数字化转型的重要力量。然而,当前数字人技术在音唇同步、画面真实度与清晰度、生成速度、智能交互以及与行业深度融合应用等方面仍存在诸多挑战。为了解决这些问题,满足市场对高质量数字人技术的迫切需求,我们提出了基于深度学习超道真数字人生成平台的联合研发需求。该项目旨在通过技术创新,提升数字人的关键要素渲染、数字孪生、视觉识别、语音识别等技术水平,为用户提供智能化、自动化的数字资产构建能力,助力我国数字人产业的蓬勃发展及产业数字化转型的深入推进。
通过本项目的联合研发,我们期望实现以下效果:
通过该项目的研发,实现数字人关键要素渲染、数字李生、视觉识别、语意识别等技术的提升及突破,为用户提供智能化、自动化的数字资产构建能力,为我国的数字人产业发展及产业数字化转型提供技术支撑。 (1)解决数字人的音唇同步问题:声音驱动口型同步率高;高率不卡帧; (2)解决画面的真实度与清晰度问题:数字人高度拟真:数字人高度清晰:声音文本能够驱动表情肢体动作自然协调同步率高; (3)解决数字人的生成速度问题:低算力消耗下实现数字人的快速生成; (4)解决数字人智能交互问题:包括图文交互、视觉交互、手势交互、音频交互等; (5)解决数字人与行业的深度融合应用问题:通过数字人+大模型,实现数字人在千行百业的深度融合应用。
