语音识别、机器翻译等人工智能技术,构建了一套复杂而精确的手语翻译引擎,可实现由文字及音视频内容到手语的翻译,再通过专门为手语优化研发的自然动作引擎,进行虚拟形象的驱动。这些技术使得AI手语主播具备高可懂度的手语表达能力和精准连贯的手语呈现效果。
令人翘首期盼的2022年北京冬奥会即将举行。在关注冬奥会的人群中,有一个特殊的群体,他们虽然听不到赛场的声音,但也希望能了解比赛动态,渴望感受比赛的激情。据统计,全球约有4.3亿人患中度及以上程度的听力障碍,根据全国第二次残疾人抽样调查数据,中国约有听障人士2780万人。
“我们用技术跨越声音的障碍。”11月24日,央视新闻联合百度智能云推出的央视总台首个AI手语主播正式亮相——她有着真人般的皮肤、头发、眼睛,形象亲切自然,气质优雅独特。从北京冬奥会开始,她将全年无休用AI智慧为听障用户提供手语服务,让他们快捷的获取比赛资讯。
可提供专业、准确的手语解说
据悉,9月24日,曾在2021中关村论坛上亮相的冬奥手语播报数字人系统是由北京市科委、北京市残联发起,科技冬奥专项支持,北京智谱AI、凌云光与北京广播电视台联合打造。项目还得到了北京市残联聋人协会的大力支持。系统依托智谱AI打造的数据与知识双轮驱动的智能平台,旨在实现冬奥会期间赛事新闻的实时手语翻译播报。
而此次央视新闻与百度智能云联合打造的央视总台首个AI手语主播,从表情、口型、毛发、服饰身形五大维度打造3D高精超写实的数字人AI模型,让AI驱动的数字人表情则更加亲切自然。
据介绍,百度智能云采用语音识别、机器翻译等人工智能技术,构建了一套复杂而精确的手语翻译引擎,可实现由文字及音视频内容到手语的翻译,再通过专门为手语优化研发的自然动作引擎,进行虚拟形象的驱动。这些技术使得AI手语主播具备高可懂度的手语表达能力和精准连贯的手语呈现效果。
冬奥AI手语主播掌握的手语词汇规范都来自《国家通用手语词典》,经过长时间的智能学习,能够为观众提供专业、准确的手语解说。
AI手语主播的工作空间或将更大
据介绍,百度智能云的数字明星运营平台为AI手语主播提供了技术支持和服务。
目前,数字明星运营平台支持二次元、2D、3D高精多种数字人风格;同时,在内容生产维度支持真人驱动、AI驱动、融合驱动等多种直播方式;基于领先的跨模态技术,口型合成准确性达98.5%。
“随着AI技术的更迭和进化,3D虚拟场景不断拓展,冬奥AI手语主播的工作空间会更大。也许不久AI主播会走出演播室,在不同场景中更好地满足新闻呈现多样化的需求。”相关项目负责人表示。
这个冬奥会,也将通过冬奥AI手语主播,让更多的残障人士酣畅淋漓地感受冰雪运动的激情与荣耀。
来源:科技日报