文/羊城晚報全媒體特派記者 王莉 柴智 付怡 郝浩宇
虛擬現實和人工智能技術的發展和應用日新月異,如今已成為全球關注的焦點。隨著北京冬奧會的正式開幕,有一項基于這兩項技術的新服務正式亮相,即采用我國首個超大規模智能信息模型和虛擬數字人技術,為聽障人士打造的“冬奧手語播報數字人”,助力科技冬奧。
日前,羊城晚報全媒體記者來到“冬奧手語播報數字人”的研發企業之一智譜AI,探秘這位“AI靚女”背后的科技力量。
“AI靚女”冬奧手語播報數字人
據了解,“冬奧手語播報數字人”由北京市科委、中關村管委會支持,智譜AI、凌云光和北京廣播電視臺聯合打造,清華大學賈珈教授團隊和中科院計算所陳益強研究員團隊也積極參與了相關關鍵技術的研究和開發,還得到了北京市殘疾人聯合會和市殘聯聾人協會的幫助和支持。
冬奧會期間,“冬奧手語播報數字人”每日會在北京衛視《北京您早》節目中對“冬奧賽事集錦”和“一起看冬奧”進行手語播報,便捷聽障人士收看賽事專題報道,提升他們的社會參與度和幸福感。
“冬奧手語播報數字人”在節目的應用
據相關負責人介紹,為了推廣和普及國家通用手語,“冬奧手語播報數字人”系統完成了《國家通用手語詞典》收錄的8214條通用手語的采集和錄制,并且語法都以聽障群體習慣打法為準,以確保手語播報成果的準確性和專業度,更好地服務聽障人群。
由于當前國內缺少較完善的手語語料數據,研發人員邀請超過40余位聾人老師及手語專家進行手語文本轉寫和技術指導,并進行大范圍聽障群體評測,最終構建了符合國家通用手語規范的國內最大規模多模態手語語料庫,詞匯及語句總規模超10萬。
為實現高精度、高自然度的人物形象和手語動作姿態,研發團隊還自主搭建了多模態肢體動作、表情、手指同步采集系統。通過采集多模態動作捕捉數據,運用跨模態擬人生成算法對超寫實數字人進行自然、流暢的驅動和渲染,實現對文本內容的手語播報。其中,通過肌肉綁定技術驅動實現面部采集,結合業內領先的語音識別及高清視頻合成等技術,呈現給聽障人群親切自然的冬奧手語播報服務。
多模態動作捕捉數據的采集現場
智譜AI的首席技術官張鵬表示,“冬奧手語播報數字人”的應用不僅使聽障人士能快捷獲取冬奧賽事資訊,還將無障礙環境的理念傳遞到數億人群中。與此同時,推動國家通用手語的推廣落地及標準普及,為殘疾人平等參與社會生活創造無障礙環境,讓科技更有溫度,實現科技和人文的完美結合。(更多新聞資訊,請關注羊城派 pai.ycwb.com)
來源 | 羊城晚報 羊城派
圖片 | 受訪者提供
責編 | 劉毅