5月20日, 2018年中国图灵大会(ACM TURC 2018)在上海举行,国内外学界、业界的重磅嘉宾汇聚一堂,分享人工智能领域的尖端技术与行业应用。快手创始人兼CEO宿华出席大会,发表主题演讲“AI如何提升幸福感”,分享快手在人工智能领域的探索与应用。
记录能产生幸福感 AI让每一个人被关注
宿华首先分享了一个洞察,即记录是可以提升幸福感的。在快手,用户可以看到广阔的世界,比如城市的孩子可以通过快手了解到马铃薯是如何种植的,最远只去过隔壁镇的老人,可以在快手欣赏土耳其满天热气球的浪漫景象。同时,用户也可以被广阔的世界看到,非洲的小朋友可以与中国人交朋友,日本的女留学生分享自己的日常。每个人心中都有一个渴望,希望自己的状态、情感、灵感,能够被更多的人看见,被更多的人理解,记录就是其中最关键的一环,是能够使得每个人幸福感都得到提升的可能的方案。快手希望能够用科技的力量去提升每一个人的幸福感。
如今快手上的视频总数超过50亿,并且几乎都是不重复的生活记录,这在历史上是前所未有的。如何让这50亿视频与观看视频的用户进行匹配则是一个巨大的挑战。过去业内常见的做法是运营好长尾曲线中头部的“爆款”视频即可,但快手希望尾部视频同样能被感兴趣的被观看,真能够让每一个人都得到一些关注。超过50亿的视频,是无法单凭人工去标注分发,或者像传统媒体按照版块进行分发的。十几年前,宿华尚在谷歌工作时就研究过这一问题,依靠人工智能,依靠机器学习无疑是有效的方式,这也正是快手如今的做法。
从记录到分发,快手构建整套以AI为核心的基础设施
宿华介绍,在快手,AI技术已经应用于从记录到分发的各个环节。首先是记录生产环节,通过AI技术让记录的玩法更丰富;第二是视频理解,让机器高效地看懂海量视频;然后是用户理解,让机器对用户有深度的认知。最后则是基于视频、用户理解,实现智能的视频分发。
在内容生产环节,宿华展示了在快手上广受欢迎的“变老”魔法表情、肢体识别舞蹈游戏,以及AR模型特效。这些丰富有趣的特效背后,涵盖了人脸关键点、背景分割、人体姿态估计、视觉惯性里程计等人工智能技术。为了支撑这些技术,快手自主研发了3D引擎及YCNN深度学习推理引擎,通过这些原创技术与平台,即使使用低配置的手机,算法与模型依然可以高效快速运转,让更多用户的记录过程体验更加丰富有趣的玩法。
在视频理解环节,快手研发了多媒体内容理解算法及平台,能够理解视频中多重维度的信息,例如视频中有几个人,其性别、年龄、人种、表情甚至人与人之间的关系等信息;除了对人的识别,快手还做了大量图像识别方面的研发,推动场景识别、车辆识别等技术在视频理解中的应用。由于视频中很多信息是包含在音频中的,语音识别是快手不断探索的方向。
快手实时在线学习系统 陪你一起探索兴趣边界
快手会通过大数据去理解每一位用户的兴趣偏好,同时,得益于快手是一个分享社区,快手的用户理解不仅基于内容,还基于行为数据。每天有上亿的用户在进行“数据标注”,包括点击点赞、关注转发、播放时长、用户关系等,交织成了网状的关系,帮助快手来更好的理解用户,除了用户兴趣偏好,更理解用户潜在的兴趣,帮助用户挖掘探索更大的未知领域。
在内容分发环节,快手构建了实时在线学习系统,一方面通过在线推荐引擎实现视频与用户的精准匹配,另一方面能够将用户实时行为秒级更新至模型, 进行线下挖掘、训练,处理万亿级特征大数据。在分发过程中,快手的社区机制起到非常重要的作用。宿华介绍,在一个社区中,会有一些跟你比较相似但不完全一样的用户,那么他们喜欢的内容,你也有可能会感兴趣,这样就不是用户自己一个人去探索,而是成千上万相似但不同的人在一起探索。基于这个逻辑的分发系统,可以真正顾及到长尾视频,让更多的人被看见。
未来快手在AI领域还有非常多的探索方向,例如通过多模态信息融合的视频理解器能够像人类一样理解一个视频,理解人类复杂的情绪。最后,宿华总结道,快手构建的是一整套以AI技术为核心的基础设施,能够用科技的力量提升每一个人独特的幸福感觉,能够让每一个人更多更好的感受这个世界,也能够更好的被这个世界所感受到,这是快手最想做的事情。
来源: 中国网