当前位置:官网首页 > 热点新闻 > 公司新闻 >

公司新闻

快手科技多媒体内容理解部李岩:AI技术贯穿于快手的产品骨髓之中

时间:2019-11-19 02:27 | 来源: | 

“AI技能贯穿于整个快手产品的骨髓之中,经过AI技能进行多维赋能,让更多人有时机被国际看见,也能看到更宽广的国际。”5月25日,在2019全球人工智能技能大会上,快手科技多媒体内容了解部负责人李岩如是表明。

大会在南京举办,李岩在“人工智能与媒体交融前沿论坛”作了讲演。李岩作为快手科技的代表,叙述了快手怎么用AI技能去赋能每一个一般用户,让每一个人的记载方法更丰厚、风趣、高质量。

李岩说,快手在AI技能上的深耕,下降了短视频的创造门槛,使用户尽可能地挨近专业水准。而在了解内容、了解用户中完成视频和用户的精准匹配,让每位用户取得更大的展现空间,一起看到了更大的国际。

他以为,经过短视频完成的记载,让人与人以及人与国际衔接起来,是很有含义的,从全体来看,提高了网民之间的信赖。

以下为讲演内容实录:

十分高兴有时机介绍在快手这样一个短视频社区,AI是怎么使用的,具领会发生什么样好玩的AI使用。

我的共享分为三部分。榜首部分简略介绍一下快手;第二部分介绍AI技能怎么协助用户提高视频创造质量,下降创造门槛;第三部分介绍AI技能怎么了解视频,了解用户,并做好分发。

快手是什么

快手把自己定位成一般人记载日子和共享日子的社区型产品,经过短视频、相片以及直播的方法,协助人们记载自己的日子,使每一个人都有时机被国际看到,也能看到更宽广的国际。

快手在2011年诞生,本年树立8周年,现在DAU已达到2亿。2011年,GIF快手是做动图的东西,2013年移动互联网鼓起,咱们看到了短视频的重要影响和效果,2013年7月,东西型产品转型为短视频社区。转型短视频社区之后,快手的数据完成了指数级增加,2015年1月,快手日活用户逾越1000万,截止到现在,快手的日活现已抵达2亿。在我国的互联网商场,日活2亿量级的APP十分少。凭仗数亿用户几年的堆集,现在有逾越100亿条短视频记载在咱们的社区里,并以每天新增1500万条短视频的速度增加,4年前这个数字只要几十万。

在快手里,用户记载了大千国际里的方方面面,在这儿咱们能够看到很多种实在有力气的日子,有些画面是咱们在群众媒体看不到的。比方这个视频,鸭绿江的放排人在运送木材,把高山上的木材顺着水流运到山下,这种陈旧的水运方法现已很少被人知晓,在快手这群人被数百万人重视到。还有这个视频,这是城市工地上的“水鬼”,这个作业很小众,但一二线城市的每一座高楼大厦都需求他们,在用建高楼大厦打地基的时分,需求用电钻挖几十米的深坑,电钻头掉了需求他们潜到几十米深的污浊泥水中,把电钻康复原位。

一般用户记载的日子,包含的内容逾越了之前的记者或许专业人士记载、调研的规模。有数亿人在快手记载自己的日子,这儿有今世的百工图,有全球各地的郊野习俗,还有用户记载的林林总总的游览日子,也有清华、人大等高校教授解说常识进行常识传达,这些画面集合起来便是一幅咱们今世日子的清明上河图。

AI协助用户用更低本钱创造出更高水平的视频

接下来,我要点讲一下AI技能怎么协助这款短视频产品做得更好。我期望协助各位媒体的朋友们了解到,AI技能其实是贯穿于快手的产品骨髓之中,使用在视频出产、视频了解、用户了解到视频引荐的整个环节。

视频创造环节,咱们期望每个人都能成为自己日子的导演,用手机去记载日子,而且生成相对较高质量的视频。怎么协助每个人成为自己的导演呢?在视频创造环节快手广泛使用了AI技能,用科技去赋能一般用户,使他们尽可能挨近专业制造视频的水准。

咱们期望让用户用更低的本钱创造出更高水平的视频,这就需求让AI助力于内容出产。

比方,快手之前上线的一款魔法表情叫“快手韶光机”,用户能够在几十秒钟内看到自己容颜变老的进程。一个人拍自己的视频是很庸俗的,咱们期望用户能够体会到自己变老今后的姿势。

又比方,把AR技能使用在用户拍照视频的环节,给实际日子的画面参加一些虚拟的元素,这归于增强实际,使虚拟国际和实际国际更好的互动,使人们在记载自己日子的时分有更多的别致的体会。

再比方,咱们会运用图画相关的算法,协助用户去纠正拍照中出现问题的视频,比方脏镜头导致的视频画面含糊,光线问题导致的画面暗淡及画面偏色的问题。

这些玩法和功用的背面是快手对前沿 AI技能的开发,触及人体姿势估量、手势辨认、布景切割等多个技能模块。这些都是快手尽力将记载方法变得愈加风趣的新测验。

这儿有一个应战,上述技能都要在手机本地实时地进行核算与烘托。快手具有数亿用户,用户的手机机型千差万别的,这要求咱们的算法有必要在一切的机型上都能流通运转,这对咱们AI才能的要求是十分高的,十分耗费核算资源。为了处理这个问题快手自研了YCNN深度推理学习引擎,处理了AI技能运转受限于用户设备核算量的问题。

音频方面,咱们也做了十分多的作业。比方之前专业的人在创造视频时,修改字幕是十分苦楚的工作。现在咱们经过语音辨认技能,能够帮视频制造者主动增加、修改字幕,而且还能够以各式各样的方法展现字幕,凭借AI的技能极大地下降了生成字幕的本钱。

在短视频场景里音乐起了十分重要的效果。据统计,快手的视频中,有60%-80%的视频用布景音乐烘托气氛。怎么挑选恰当的音乐表达心境,其实是不容易工作。让用户尽量贴合音乐的节奏创造动作,关于用户的要求也是十分高的,具有很强乐感的人其实十分少。

为了下降用户创造视频时挑选音乐的门槛,咱们开发了智能伴奏及AI生成音乐的技能。智能伴奏能够依据视频画面及用户画像为用户引荐合适视频画面,并被用户喜爱的布景音乐供用户挑选。AI生成音乐经过AI的剖析算法,能够感知到视频画面中人的动作,然后让生成的音乐节奏匹配人的动作,这样是极大地下降了用户创造视频时挑选音乐的门槛,让咱们更乐意创造自己的视频。

用AI了解视频,了解用户,做好分发

上面共享的是AI技能怎么下降人工创造短视频的门槛,使一般用户都能够创造出质量还不错的短视频。用户创造并上传到咱们的社区后,咱们又做了哪些工作更好的分发这些视频呢?

了解视频其实十分复杂,对人脸纬度的解析、场景类的解析、音乐类的解析等等,这些都是从单个视点进行建模,其实视频需求多模态的解析。咱们需求做到让机器高效的判别用户上传的视频是不是契合规矩的,判别视频内容是不是原创的,以及要做到把视频精准的匹配给对他感爱好的用户。

咱们让机器能够协助咱们办理好上传的海量视频,一起帮咱们做好视频的引荐,而且引荐给用户的视频是能激起用户爱好的。这儿还触及用户了解,指的是让机器了解咱们的用户,其间包含了解用户在社会学上的特征,以及用户的爱好,包含他的短期爱好爱好以及中长期爱好爱好,以及海量的能够代表用户特征的更小的向量。

在视频的分发上,快手上有一个十分有意思的现象,咱们不期望头部的视频内容占有太多的曝光,咱们用经济学上的基尼系数操控平台上用户之间的“贫富差距”。互联网上的注意力资源是十分名贵的资源,咱们期望这种名贵的资源也能分给一般人,而不是像聚光灯相同集合在少数的头部用户身上。所以咱们规划了快手的引荐机制,无论是明星仍是一般人在快手都是相同的。快手注重出产者的利益,注重长尾视频内容的分发。咱们期望注意力资源能够向阳光相同撒给一切出产视频的用户,这样一般人就有时机被更多人重视,能够感受到被重视被认可的幸福感。

经过短视频完成的记载,让人与人以及人与国际衔接起来。咱们以为,树立这种衔接是十分有含义的工作。咱们每个人的内心深处都是孤寂的,都期望经过衔接去取得重视、认可,而且能结交朋友。因而,快手用户之间的联系会粘性更高,更安定。从全体来看,这能够提高网民之间的信赖。

我今日的共享便是这些,谢谢咱们。


  • 86-66668888
  • 刘小姐