基于深度学习超道真数字人生成平台的联合研发

联系合作
机器人
数字政务
人工智能
新一代信息技术
技术领域:信息通信
榜单金额:50 万
合作方式:技术服务
发布日期:20241201
截止日期:-
需求发布单位: 南京硅基智能科技集团股份有限公司
关键词: 数字人生成  音唇同步  画面渲染  智能交互  行业应用  数字孪生  视觉识别  语意识别  低算力生成  深度融合 

需求的背景和应用场景

随着人工智能技术的飞速发展,数字人作为新兴的技术应用形式,正在逐步渗透到各个行业领域,成为推动产业数字化转型的重要力量。然而,当前数字人技术在音唇同步、画面真实度与清晰度、生成速度、智能交互以及与行业深度融合应用等方面仍存在诸多挑战。为了解决这些问题,满足市场对高质量数字人技术的迫切需求,我们提出了基于深度学习超道真数字人生成平台的联合研发需求。该项目旨在通过技术创新,提升数字人的关键要素渲染、数字孪生、视觉识别、语音识别等技术水平,为用户提供智能化、自动化的数字资产构建能力,助力我国数字人产业的蓬勃发展及产业数字化转型的深入推进。

要解决的关键技术问题

  1. 音唇同步问题:研发高效的声音驱动算法,确保数字人口型与声音的高度同步,同时保证在高帧率下不卡帧,提升用户体验。
  2. 画面真实度与清晰度问题:利用深度学习技术,提高数字人的渲染精度和细节表现,实现数字人的高度拟真和高清显示。同时,研发声音文本驱动的表情和肢体动作生成技术,确保动作自然协调且同步率高。
  3. 数字人生成速度问题:优化算法模型,降低算力消耗,实现低算力环境下的数字人快速生成,提高生产效率。
  4. 智能交互问题:研发图文交互、视觉交互、手势交互、音频交互等多种交互方式,提升数字人的智能交互能力,使其能够更自然地与用户进行互动。
  5. 与行业深度融合应用问题:结合数字人技术与大模型,探索数字人在教育、医疗、娱乐、金融等千行百业中的深度融合应用,推动数字人技术的广泛应用和产业升级。

效果要求

通过本项目的联合研发,我们期望实现以下效果:

  • 技术突破:在音唇同步、画面真实度与清晰度、生成速度、智能交互以及行业应用等方面取得显著技术突破,提升我国数字人技术的整体竞争力。
  • 高效生产:降低数字人的生成成本和时间,提高生产效率,满足市场对大规模、高质量数字人资产的需求。
  • 智能交互体验:提供丰富多样的智能交互方式,提升用户体验,使数字人成为更加自然、智能的交互载体。
  • 行业应用拓展:推动数字人技术在各行业领域的深度融合应用,助力产业数字化转型,催生新的商业模式和经济增长点。
  • 创新性:形成具有自主知识产权的核心技术,为我国数字人产业的持续发展奠定坚实基础,提升国际竞争力。

通过该项目的研发,实现数字人关键要素渲染、数字李生、视觉识别、语意识别等技术的提升及突破,为用户提供智能化、自动化的数字资产构建能力,为我国的数字人产业发展及产业数字化转型提供技术支撑。 (1)解决数字人的音唇同步问题:声音驱动口型同步率高;高率不卡帧; (2)解决画面的真实度与清晰度问题:数字人高度拟真:数字人高度清晰:声音文本能够驱动表情肢体动作自然协调同步率高; (3)解决数字人的生成速度问题:低算力消耗下实现数字人的快速生成; (4)解决数字人智能交互问题:包括图文交互、视觉交互、手势交互、音频交互等; (5)解决数字人与行业的深度融合应用问题:通过数字人+大模型,实现数字人在千行百业的深度融合应用。

试试对话AI技术经理人
WENJINGZHUAN
问小果
目前哪些机构有相似的技术需求?
该需求的技术路线?
为该需求推荐相关的科技成果?
哪些机构或团队可能解决该技术需求?