Douglas – 基于人工智能,数字王国展示可实时操控的自主虚拟人
2020年11月19日
将照片写实级数字替身作为人机交互的载体,迈入多元消费级路径
2020年11月19日,洛杉矶——以制作创新视觉特效及全球最大虚拟现实(Virtual Reality,VR)体验服务供应商之一的数字王国集团有限公司(“数字王国”或“公司”,股票代码:547)在近期上线的“Intel’s AI Podcast”中首次展示了其进阶虚拟人——“Douglas”。处于完善阶段的Douglas被誉为世界上最逼真的自主数字替身,旨在突破虚拟变革下尚存的人机交互壁垒,促使两者之间的沟通向简易化和实时化倾斜。Douglas拥有与真实人类无异的面部特征,更具备变色龙般转换外形的能力,这一优势为其在2021年迈入消费级路径赋予了广泛且灵活的可能性。
数字王国虚拟人部门主管Darren Hendler先生表示:“迅猛迭代的数字化手段催生了愈发普及的虚拟助手、聊天机器人和人工智能(Artificial Intelligence, AI)驱动的人机交互体验。区别于纯语音的牵引模式,数字王国选择将照片写实级数字替身作为人机交互的载体,Douglas便是这一突破性尝试的成果。”
Douglas由基于数字王国软件研发部门高级主管Doug Roble博士打造的数字替身演化而来。此前,相关技术已在构建可实时操控的虚拟人,以及融入人工智能的面部捕捉范畴取得了诸多成就。Douglas成为数字王国推动虚拟人不断贴近现实主义的基石,其问世预示着这一技术将撬动更为多元的感官体验。
为了创建Douglas,Doug Roble进行了上百小时的表演捕捉,包括朗读书籍以记录表情与声音。数字王国随后利用多种光照条件下拍摄的人像照片来训练神经渲染工具——依托捕获的数据,该工具现能够达成过往传统技术无法达成的逼真水平;与此同时,使得操控数字替身的过程越发迅速,甚至仅借助极少的表情与声音(例如时长为10分钟左右的视频或30分钟左右的音频),便可精确地模仿另一个人的行为举止。
运用机器学习解决方案和数字王国自主研发的技术,Douglas足以重现真实人类的举动;结合语言处理、神情雕琢及视觉跟踪,该数字替身的技能涵盖了识别真实人类,并主导与之对话。Douglas匹配和智能语音助手“Alexa”及“Siri”旗鼓相当的回应率,这有效消除了真实人类与虚拟人交流时可能伴随的长时间停顿,实现了流畅又自然的沟通。
除了要求数字替身面部写实的特殊形态,Douglas尤其适用于重复型任务组成的应用场景,例如需要多次处理同一问题的客户服务领域等。当下版本的Douglas可连接至任意虚拟助手或聊天机器人系统,从而为实时情境下的人机交互提供虚拟面孔和情感层面的智能响应。及至目前,数字王国正围绕虚拟人,不断革新人脸和语音识别等控制方式。完善后的Douglas预计将支持全球范围内在线会议平台的部署。
数字王国CEO谢安先生表示:“Douglas的诞生极具开创意义,这标志着前所未有的自主虚拟人即将拥抱容量巨大且亟待释放的消费级人机交互赛道。来自数字王国的艺术家和科学家持续投身于面部捕捉和自主行为操控的拓展,加速虚拟人面向消费者群体的商业化进程。”
###