当前位置:首页 > 新闻中心 > 详细内容

揭秘全球首个站立式AI合成主播“逼真”之谜

今年2月19日,搜狗公司与新华社新媒体中心联合发布了全球首个站立式AI合成主播,新的AI合成主播将从过去的“坐着播新闻”升级成结合肢体动作的“站立式播报”。3月3日,全球首个AI合成女主播“新小萌”正式上岗新华社,而她的第一个工作任务,便参与到十三届全国人大二次会议报道中。随后,包括“今日俄罗斯”电视台网站、英国Daily Mail、美国Futurism等多家海外媒体对此进行了大幅报道,并称“近年来,中国已成为全球领先的人工智能发展中心之一”。

作为第一个登上两会的AI合成女主播,人们在惊叹和称赞之余,对于其背后由搜狗所开发的人工智能技术都无比好奇:这个在镜头前播报新闻的“新小萌”,为什么会如此像真人?背后都应用了哪些“黑科技”?

为什么这个AI合成主播如此像真人?

2018年互联网大会期间,搜狗与新华社联合发布的全球首个AI合成主播初次亮相,引起了全球传媒业和人工智能领域的极大关注。三个月来,首批入职新华社的一中一英两位AI合成主播,已生产3400余条新闻报道,累计时长达一万多分钟,参与了包括第五届世界互联网大会、首届进博会、2019春运、春节等若干重要报道,成为中国人工智能与传媒业大胆融合并付诸规模化应用的典型案例。

据记者了解,初代AI合成主播由“搜狗分身”技术打造,这项技术让机器首次做到逼真的模拟人类说话时的声音、嘴唇动作和表情,并且将三者自然匹配,创造出人类的AI分身,进而帮助人类提高信息表达和传递的效率。

而首个入职新华社的全球首个站立式AI合成主播,在声音、嘴唇动作和表情之外,利用“搜狗分身”技术继续赋予AI合成主播肢体语言的能力,让AI合成主播更加智能逼真。

3月初加入两会报道的AI合成主播进一步采用了“搜狗分身”最新的wavernn波形建模技术,可以实现逼真的语音合成效果,让AI的声音更具有真实情感和表现力。而在图像生成方面,新版的AI合成主播实现了更加逼真的表情生成、自然的肢体动作以及嘴唇动作预测等能力,完成了站立并可以做出肢体动作的主播形象,进一步提升了合成主播的表现力。

AI合成人类背后更多的“黑科技”

两会期间AI合成女主播的首次登场亮相,所带来的冲击感是非同凡响的。和真人主播相比,通过“搜狗分身”技术打造的AI合成主播能够不知疲倦地工作24小时,同时还掌握多国语言,大大提升了效率、降低了成本,宛如科幻大片成真的即视感。

据搜狗公司透露,随着“搜狗分身”技术能力的不断提高,AI合成主播的定制周期也大为降低,合成效果和稳定性也有着显著提升。仅靠少量用户真实音视频数据,即可快速定制出高逼真度的分身模型,帮助媒体在融媒体转型、新闻时效性、跨语种传播能力等领域升级。此次发布会同时发布的全球首个AI合成女主播,正是“搜狗分身”技术持续复制不同类型、不同特点AI合成主播能力的一个体现。

根据搜狗和新华社达成的战略合作协议,未来双方还将在AI合成主播领域展开长期合作,更多的AI合成主播将不断涌现,而这些主播播报的新闻也将会通过新华社客户端、新华社微信公众号、CNC等平台与观众见面。可以预见,AI合成主播注定会成为AI时代信息资讯传播链条最重要的一环。

搜狗CEO王小川介绍说,作为AI合成主播的技术核心,“搜狗分身”技术未来还将应用于娱乐、医疗、健康、教育、法律、金融等多个领域,通过提供个性化的行业解决方案,为不同职业赋能,从而提升整个社会的信息生产力,用AI科技来让人类生活变得更加美好。

来源:新快报