NVIDIA推出AI虚拟形象生成平台
11 月 9 日消息,NVIDIA 宣布推出用于创建 AI虚拟形象的平台NVIDIA Omniverse Avatar,此前,NVIDIA的元宇宙概念在业内广为流传。此次推出的AI 虚拟形象,从产品看与元宇宙概念中的虚拟形象有所关联。
Omniverse Avatar是一个用于生成交互式 AI 虚拟形象的技术平台。连接了语音 AI、计算机视觉、自然语言理解、推荐引擎和模拟技术方面的技术。在平台中创建的头像是具有光线追踪 3D 图形的交互式角色,可以看到、说话、理解语言等。
Omniverse Avatar 将为创建人工智能助手打开了大门,这些助手可以为任何行业轻松定制。这些可以帮助处理数十亿的日常客户服务互动。例如,餐厅订单、银行交易、个人约会和预订等等。
Omniverse Avatar 是NVIDIA Omniverse的一部分,NVIDIA Omniverse是一个用于 3D 工作流程的虚拟世界模拟和协作平台,目前处于公开测试阶段,拥有超过 70,000 名用户。在NVIDIA GTC的主题演讲中,分享了Omniverse Avatar的3种示例:
用于客户支持的 Project Tokkio
用于车辆智能服务的NVIDIA DRIVE Concierge
用于视频会议的Project Maxine
Project Tokkio演示中,展示了与一个复制品的虚拟形象进行实时对话和餐厅售货的客户服务化身。在DRIVE Concierge AI演示中,仪表板中央屏幕上的数字助理帮助驾驶员选择最佳驾驶模式以准时到达目的地。Project Maxine展示了在嘈杂的咖啡馆中视频通话,讲话者的声音保持使用与她相同的声音和语调,并在没有背景噪音的情况下清晰地听到、转录并翻译成其他语言。
Omniverse Avatar使用来自语音 AI、计算机视觉、自然语言理解、推荐引擎、面部动画和图形的元素是以下述技术为支持:
语音识别基于NVIDIA Riva,这是一种软件开发工具包,可识别多种语言的语音。Riva 还用于将文本生成类似人类的语音响应。其自然语言理解基于威震530B大型语言模型,能够识别、理解和生成人类语言。Megatron 530B 是一个预训练模型,它可以在很少或根本没有训练的情况下完成句子,回答大量主题领域的问题,总结长而复杂的故事,翻译成其他语言,并处理许多未经专门训练的领域.
推荐引擎由NVIDIA Merlin提供,该框架允许企业构建能够处理大量数据以提出更明智建议的深度学习推荐系统。
感知能力由NVIDIA Metropolis启用,这是一种用于视频分析的计算机视觉框架。
头像动画由 NVIDIA Video2Face 和Audio2Face、2D 和 3D 人工智能驱动的面部动画和渲染技术提供支持。
最后以上这些技术被组合成一个应用程序,并使用 NVIDIA统一计算框架进行实时处理。这些技能打包为可扩展、可定制的微服务,可以通过NVIDIA Fleet Command在多个位置安全地部署、管理和编排。
Scan QR code with WeChat