Douglas – 基於人工智能,數字王國推出可實時操控的自主虛擬人
2020年11月19日
將照片寫實級數碼替身作為人機交互的載體,邁入多元消費級路徑
2020年11月19日,洛杉磯——以製作創新視覺特效及全球最大虛擬實境(Virtual Reality,VR)體驗服務供應商之一的數字王國集團有限公司(「數字王國」或「公司」,股份代號:547)在近期上線的「Intel’s AI Podcast」中首次展示了其進階虛擬人——「Douglas」。處於完善階段的Douglas被譽為世界上最逼真的自主數碼替身,旨在突破虛擬變革下尚存的人機交互壁壘,促使兩者之間的溝通向簡易化和實時化傾斜。Douglas擁有與真實人類無異的面部特徵,更具備變色龍般轉換外形能力,這一優勢為其在2021年邁入消費級路徑賦予了廣泛且靈活的可能性。
數字王國虛擬人部門主管Darren Hendler先生表示:「迅猛迭代的數碼化手段催生了愈發普及的虛擬助手、聊天機器人和人工智能(Artificial Intelligence, AI)驅動的人機交互體驗。區別於純語音的牽引模式,數字王國選擇將照片寫實級數碼替身作為人機交互的載體,Douglas便是這一突破性嘗試的成果。」
Douglas由基於數字王國軟件研發部門高級主管Doug Roble博士打造的數碼替身演化而來。此前,相關技術已在構建可實時操控的虛擬人,以及融入人工智能的面部捕捉範疇取得了諸多成就。Douglas成為數字王國推動虛擬人不斷貼近現實主義的基石,其問世預示著這一技術將撬動更為多元的感官體驗。
為了創建Douglas,Doug Roble進行了上百小時的表演捕捉,包括朗讀書籍以記錄表情與聲音。數字王國隨後利用多種光照條件下拍攝的人像照片來訓練神經渲染工具——依託捕獲的數據,該工具現能夠提供過往傳統技術無法達成的逼真水平;與此同時,使得操控數碼替身的過程越發迅速,甚至僅借助極少的表情與聲音(例如時長為10分鐘左右的視頻或30分鐘左右的音頻),便可精確地模仿另一個人的行為舉止。
運用機器學習解決方案和數字王國自主研發的技術,Douglas足以重現真實人類的舉動;結合語言處理、神情雕琢及視覺跟蹤,該數碼替身的技能涵蓋了識別真實人類,並主導與之對話。Douglas匹配和智能語音助手「Alexa」及「Siri」旗鼓相當的回應率,這有效消除了真實人類與虛擬人交流時可能伴隨的長時間停頓,實現了流暢又自然的溝通。
除了要求數碼替身面部寫實的特殊形態,Douglas尤其適用於重複型任務組成的應用場景,例如需要多次處理同一問題的客戶服務領域等。當下版本的Douglas可連接至任意虛擬助手或聊天機器人系統,從而為實時情境下的人機交互提供虛擬面孔和情感層面的智能響應。及至目前,數字王國正圍繞虛擬人,不斷革新人臉和語音識別等控制方式。完善後的Douglas預計將支持全球範圍內在線會議平台的部署。
數字王國行政總裁謝安先生表示:「Douglas的誕生極具開創意義,這標誌著前所未有的自主虛擬人即將擁抱容量巨大且亟待釋放的消費級人機交互賽道。來自數字王國的藝術家和科學家持續投身於面部捕捉和自主行為操控的拓展,加速虛擬人面向消費者群體的商業化進程。」
###