基于深度学习超道真数字人生成平台的联合研发

关注

联系合作

机器人

数字政务

人工智能

新一代信息技术

技术领域：信息通信

预算金额：50 万

合作方式：技术服务

发布日期：20241201

截止日期：-

需求发布单位：南京硅基智能科技集团股份有限公司

关键词：数字人生成音唇同步画面渲染智能交互行业应用数字孪生视觉识别语意识别低算力生成深度融合

小果解读

需求的背景和应用场景

随着人工智能技术的飞速发展，数字人作为新兴的技术应用形式，正在逐步渗透到各个行业领域，成为推动产业数字化转型的重要力量。然而，当前数字人技术在音唇同步、画面真实度与清晰度、生成速度、智能交互以及与行业深度融合应用等方面仍存在诸多挑战。为了解决这些问题，满足市场对高质量数字人技术的迫切需求，我们提出了基于深度学习超道真数字人生成平台的联合研发需求。该项目旨在通过技术创新，提升数字人的关键要素渲染、数字孪生、视觉识别、语音识别等技术水平，为用户提供智能化、自动化的数字资产构建能力，助力我国数字人产业的蓬勃发展及产业数字化转型的深入推进。

要解决的关键技术问题

音唇同步问题：研发高效的声音驱动算法，确保数字人口型与声音的高度同步，同时保证在高帧率下不卡帧，提升用户体验。
画面真实度与清晰度问题：利用深度学习技术，提高数字人的渲染精度和细节表现，实现数字人的高度拟真和高清显示。同时，研发声音文本驱动的表情和肢体动作生成技术，确保动作自然协调且同步率高。
数字人生成速度问题：优化算法模型，降低算力消耗，实现低算力环境下的数字人快速生成，提高生产效率。
智能交互问题：研发图文交互、视觉交互、手势交互、音频交互等多种交互方式，提升数字人的智能交互能力，使其能够更自然地与用户进行互动。
与行业深度融合应用问题：结合数字人技术与大模型，探索数字人在教育、医疗、娱乐、金融等千行百业中的深度融合应用，推动数字人技术的广泛应用和产业升级。

效果要求

通过本项目的联合研发，我们期望实现以下效果：

技术突破：在音唇同步、画面真实度与清晰度、生成速度、智能交互以及行业应用等方面取得显著技术突破，提升我国数字人技术的整体竞争力。
高效生产：降低数字人的生成成本和时间，提高生产效率，满足市场对大规模、高质量数字人资产的需求。
智能交互体验：提供丰富多样的智能交互方式，提升用户体验，使数字人成为更加自然、智能的交互载体。
行业应用拓展：推动数字人技术在各行业领域的深度融合应用，助力产业数字化转型，催生新的商业模式和经济增长点。
创新性：形成具有自主知识产权的核心技术，为我国数字人产业的持续发展奠定坚实基础，提升国际竞争力。

需求描述

通过该项目的研发，实现数字人关键要素渲染、数字李生、视觉识别、语意识别等技术的提升及突破，为用户提供智能化、自动化的数字资产构建能力，为我国的数字人产业发展及产业数字化转型提供技术支撑。（1）解决数字人的音唇同步问题：声音驱动口型同步率高；高率不卡帧；（2）解决画面的真实度与清晰度问题：数字人高度拟真：数字人高度清晰：声音文本能够驱动表情肢体动作自然协调同步率高；（3）解决数字人的生成速度问题：低算力消耗下实现数字人的快速生成；（4）解决数字人智能交互问题：包括图文交互、视觉交互、手势交互、音频交互等；（5）解决数字人与行业的深度融合应用问题：通过数字人+大模型，实现数字人在千行百业的深度融合应用。