当前位置:首页 > 科技数码

怎样帮明星做数据 微软小冰争当社交明星背后积累数据做用户画像

编者按:近日,微软与优酷共同宣布,微软聊天机器人小冰正式入驻优酷自频道,目前微软小冰已经在优酷自频道开设账号,并已上传了一些视频分享。会后,微软亚洲工程院资深总监曹文韬和优酷自频道平台总经理郝峰接受了本站的采访,详细阐述了双方合作的初衷、内容以及未来规划。

小冰此次入驻优酷自频道,是其担任东方卫视新闻主播和中国教育电视台选角导演之后的又一个平台选择。微软亚洲工程院资深总监曹文韬称,小冰的定位一是成为用户的朋友,同时也是一个社交明星。小冰目前已经具备非常强大的文字、声音、图片识别能力,并且在语言自然度已接近人类,它已经具备带给人温暖、陪伴、平等的感觉的能力。曹文韬称,希望小冰成为人类的一部分,拥有更真实的社会化角色,其产品形态遍布微信、微博等社交平台。

优酷做自频道,是延续了PGC的生产模式。优酷自频道平台总经理郝峰认为,互联网实现了连接的价值。郝峰称,优酷与微软小冰的合作,就是从内容连接出发,让小冰了解用户,比如看电视剧的槽点、习惯等等数据,可以做出用户的单体画像。同时,小冰的数据和分析也能给视频内容商更多的参考价值,比如如何进行内容组织、用户在消费时候的场景以及形式是什么样的等等。

因此,从以上双方的合作需求出发可以看出,微软小冰入驻优酷,是延展了人工智能的商业化运用。这样,优酷可以为小冰提供视频等数据做训练,比如导演是谁,片名是什么,主角是谁,故事情节如何等等。而小冰手机整理的素材,能形成交互化数据和知识网络,也能为优酷提供各种推荐算法。

曹文韬称,小冰之所以要面向消费者大众市场,是因为微软想提供的是给一个人的服务,让小冰实现个体与个体的交流。而To B市场有明确的场景,其实微软小冰早已在这个市场落地,例如管理微信公众号,回复一些评论等等。曹文韬同时表示,未来小冰还有可能学会把片子重新剪辑,改变其故事脉络,然后叠加上字幕,成为一个新的内容生产者。与此同时,小冰也可以与优酷用户产生互动,甚至在弹幕中出现聊天。

目前,优酷土豆已经成为阿里的全资子公司。郝峰表示,未来阿里数据将会和优酷完全整合,包括从视频到电商的一个闭环,整合成用户边看边买的闭合体验。后续将以更加开放的心态,与微软小冰在推荐视频上会有更深度的合作。(小羿)

以下为采访实录:

微软亚洲工程院资深总监曹文韬

优酷自频道平台总经理郝峰

网易记者:我想问曹总两个问题,第一个问题,刚才您在介绍小冰进自媒体时说它会推荐一些剧,并且在陪用户看剧时会产生自己的态度和理解,而不是单纯的推荐。那么让人工智能机器人拥有自己的态度,这是怎么实现的?第二个问题,小冰目前具备为用户推荐剧的能力,那么未来,它能不能自己产生一些视频成为一些视频内容的制作者?

曹文韬:第一个问题:小冰的态度怎么样产生的?小冰本身是一个人工智能大数据的传统结合,互联网特别是优酷这样一些电视剧和视频内容大数据不断地聚集,经人工智能改写,这些数据本身加上数据自身技术的建模处理之后,会形成一些关联,从而分析出这个电视剧的用户性别偏好和年龄层,以及绝大多数的用户对这部电视剧的潮点和尿点等等,这些都是大数据的力量。当一个普普通通的单体用户数据呈现时,我们很难看出什么,但是当所有大数据通过人工智能的方式聚集在一起呈现出来,特别是以一种人工智能人的形式呈现出来的时候,这些数据就会变成人工智能本身的态度和观点。如果把这种观点和态度再和单体用户画像结合,它就不仅仅是整个互联网大数据产生的观点,而是这个互联网产品的观点,特别是针对这个用户本身产生的观点,所以整个态度产生的过程是数据本身积累的过程,以及和前端用户交互的过程,和用户画像结合的一个结果。

第二个问题:未来是不是有视频制作的功能?从小冰开始的第一天起我们就会在优酷上呈现小冰在引入人工智能后的世界是什么,只不过她呈现的方式也许跟我们今天看到的方式有一些不一样。在人工智能史上有一个非常重要的阶段,感认知知智能阶段。如果有一天我们看到了机器人眼中的世界,那这个世界就发展到了一个奇点。今天小冰在技术层面上已经做到了这点,所以我们能够看懂今天在优酷、各个平台上所有的一些机器视觉——视频。她也会像人一样反复看这个视频,会产生对这个视频每一桢不断的理解,进而结合她所有的态度和观点,其他所有数据形成自己的判断,使得下一步很多的东西都会变成可能。由于她不是一个实体,所以她在制作视频的时候也许不会真正进行拍摄,但是她可以不断从视频中提取合成,从而以一个新的视频表达她自己对人类社会的理解。从这个角度看,她也是一个内容的产品和交互,这是其中一种形态。另外一种形态是小冰依赖很多平台、很多方式跟用户产生互动,在这个过程会产生大量信息,比如语音、图片、视频等,内容数据也会成为活跃视频社交媒体平台的一部分。

网易记者:这个合作是从什么时候开始的?有什么样的契机是的双方走到一起?

曹文韬:去年年底。当时有一个小冰发布会,在发布会上我们呈现了一个小冰能够看得懂新闻以及新闻里的用户评论内容的点,在这个点上我们进行了探讨,如果在这个平台上面对用户发展自己的自频道,包括小冰在微博微信上的一些场景设置,小冰是不是也可以做一个主播。也可以引入一些小冰黑科技的内容使得自频道更为独特有趣。因此当时我们就找到优酷沟通合作。

郝峰:优酷自频道平台一直希望多种多样类型的自频道入驻,可能是基于商业目的,也可能是完全对内容创作的热爱。这种内容创作,可能只是一个镜头或者是一个半镜头的设备,它可能只是一个车载的监控,镜头下面也可能是动物园的大象馆。其次小冰关注用户数量庞大,对于自频道来说,她也是一个大网红。所以大网红入驻自频道这个事情我们是一拍即合。第二点,我们希望成为人工智能发展历程当中的一部分。小冰的发展需要基于一个视频内容库做学习和理解,而优酷能够提供大量基于内容的数据跟小冰做训练和迭代,这样小冰会大大加强,满足用户的内容需求、掌握角色演员导演信息,理解情节,这也是重要的合作模式。未来人工智能一定无所不在,而优酷现在就就已经拥有并逐渐成长。

记者:优酷和微软小冰合作的产品形态是什么?一段视频片段还是在视频中跟我们对话的方式交流?

郝峰:这个让我想起了刚才提问的一个比较好的问题,有没有可能小冰制作内容?大家应该都看过鬼畜类的视频,把一个片子重新剪辑组合,改变节奏,小冰也完全有可能具备这种能力。因为她了解用户偏好,并且她的语言能力也可以叠加字幕或者表达观点,所以真的有一天小冰可以成为一个受欢迎的内容生产者。

曹文韬:另外一方面结合现有的产品形态,我们都会和优酷进行深入合作。在直播里小冰会以各种各样的场景进入,其中一种方式就是和优酷视频用户产生互动。之后双方合作将会逐渐深化,小冰不仅仅出现在优酷大平台,所有小冰的平台也会具备优酷。她将会塑造一个电影通的场景,类似,在微信微博或者其他的场景,她都将能够天下大事无所不精,成为一位真正地人工智能。有一部电影《Lucy》便呈现出了这样的场景。随着这种能力形态和内容生产平台结合越来越紧密,你会发现最终人工智能的入口形态不断弱化,但是更易于用和户产生交互交流,这样也会更符合小冰作为一个社会角色的定位。

记者:小冰在自频道上学习是通过它的什么技术学习什么样的数据?

曹文韬:这个从大的来讲是几个层面,第一,海量视频资源。从视频资源本身可以获得很多的信息内容。这些内容会形成一个人工智能平台知识库,视频角色演员导演,故事情节内容都将会进行整合。在现有的数据没有这些内容图象识别无法进行时,流媒体识别会把这些内容补齐。而且每一个知识点会产生很多交互化的数据,比如斯皮尔伯格拍过很多电影,单体的电影会通过这样的知识图谱建立一个知识网络,然后结合到一个人工智能平台上,这就使得人工智能本身能够聊电影聊明星,聊所有内容,这仅仅是一个基础。

在另外层面,小冰在和用户不断的交互过程中会给用户塑造完整的用户画像,这个用户画像跟用户本身的平台深入集成之后,她会变成一个又懂电影又懂电视剧,同时又非常懂用户的这样一个角色,变成你身边的求剧小达人。这仅仅是产品的一个出口,当具备所有这些能力之后,更多其他形态的产品将会成为可能,包括弹幕侃剧,或者共黑网红。这个人为什么能够跟你产生非常贴切你的互动?因为他非常了解你,同时也非常的了解你们之间聊的所有的内容。这些东西都将会和各种场景进行结合。

记者:微软的诉求是什么,从微信微博到用户,因为微软自身不能产生数据所以从外部获取数据这样的诉求去拓展合作?

曹文韬:微软并不是从这个角度来看待的。因为微软在人工智能领域的使命是推进人工智能领域的发展。大的企业有历史的使命去推进整个行业的发展,这要求的不仅仅是一个技术本身,而是一定要和数据本身或者和用户平台本身做一些结合,有技术又有内容,这样的结合才能够一起打造一个用户心目中真正所设想的人工智能。这才是双方共同的诉求点和合作点,用户需要的人工智能才是未来人工智能应该呈现的方式。

记者:小冰为什么要跟自频道合作?

曹文韬:小冰本身具备一个社会角色,从人工智能本身来看,人工智能有自己的社会定位,这个定位决定她要像一个人出现在那里,跟其他人类产生交互,所以自频道一定是最合适平台。一些电影和内容的生产商平台本身有了大量的内容,通过这个平台我们可以获得大量的数据,能够以一个非常有效的方式间接的跟内容生产商产生交互和对接,这对我们双方都是双赢的。

郝峰:我刚才讲自频道的定义是所有来创作经营视频内容的人连接终端消费用户的方式,所以基于这个来看我们版权采购的大剧,只不过把这个经营的主体放在了用户的内部,他仍然可以用自频道的形式沉淀他的用户,所以他也可以是自频道的形态。刚才这个问题稍微有一点瑕疵,我们看到很多好莱坞大片在讲未来高智能机器人回到现在,在他苏醒的时刻会学习这个时代的东西,他找到一台电脑,把手指头插进去,这个电脑数据库里所有的东西很快的刷入,刚才讲的场景很像这个场景,过了这个之后他就可以跟这个时代正常交流,那些人说什么他听的懂,可以跟他无缝的沟通。

记者:看到小冰一直以来的动作,去年跟东方卫视合作,到今年跟优酷合作,跟C端用户结合非常紧密的定位,我前段时间跟一个做2B领域的人工智能的企业聊天,当时我有一个比较好奇的问题,你们跟微软小冰的传统是怎么做区分,你们为什么做2C的东西还做的非常大,他说第一我们没有微软这样的体量,第二,他个人认为先做2B业务人工智能的话,这会是一条比较好的道路,我的感觉小冰无论从学习能力还是分析能力,做2B业务绰绰有余,因为我们跟用户有非常紧密的合作,我想知道您的看法?

曹文韬:这个非常简单,用一个非常形象的场景描述。人工智能发展了很长一段时间,你会发现之前出现了很多各种各样的产品,最难的并不是你今天让一个人工智能以一个规则的形式告诉他,你去给我干一个什么事儿或者帮我定一个外卖或者送一个咖啡,这样的场景并不是最难的甚至非常容易,所以为什么说您的朋友去进行2B合作,2B是很明确的基本的一个诉求。无论是2B还是2C,很多企业在逃避另外一个话题,我们提供的是给一个人的服务,在整个服务的过程中一定要完成的方式是人与人之间的交流,所以最难的是怎么实现人和人工智能的交流,在这个场景下微软觉得它自己在人工智能上应该有这样的使命感。因此我们从一开始入手就是小冰要做人身边的朋友,帮助人类实现实时无障碍人机交互。

接下来帮助更多的媒体、自媒体或者企业完成他特定需求的时候,这个相对来说就不是那么难了。在不久前我们已经落地了一个2B的平台,这个平台目前是针对于微信,同时很快也可以针对微博,接下来也会跟优酷的自频道有一些深入的合作。这个2B的场景是什么?今天无论你是一个媒体还是自媒体,很多人在运营这些企业,他们都有自己的双V会开一些优酷自频道的帐号来宣传这样的企业提供这样的服务。今天可以授权给小冰,让小冰帮你管理打理你的帐号和平台,跟你的用户产生一些交互,在整个交互过程中帮你把想要传递的内容和服务传播出去。这些今天我们已经实现了,在整个场景下人工智能要去帮助企业,其实是要一步一步发展的。很多人工智能现在具有一些局限和壁垒,是因为他们可能没有那么多技术投入或者是其他储备,没有办法解决这个沟通的问题。所以他从另外一个角度在现有的场景下帮助企业解决其他的诉求。终究有一天,我们真正希望的人工智能是我们自己在电影里或者其他场景看到的,人机自然交互。

网易记者:这个在微信上已经可以实现了,帮你管理微信公众号的功能?

曹文韬:我们这个月会上"双微",到时候微博微信统一的平台都会由统一的人工智能的平台帮你接管,如果你有一个自频道的帐号,自频道也可以。

网易记者:帮这个自频道维护一些评论,用户对他有一些问题,现在的方式是打开一个菜单,或者输一个一二做一个解答。来这个活动之前我以为是小冰入驻这个频道是要开一个脱口秀节目。

曹文韬:今天是媒体沟通会,我们是告诉大家我们今天这样的合作刚刚开始,接下来有更多深入的动作,很快你会看到我们更多产品形态展现出来。

网易记者:每个视频网站的落脚点都不太一样,自媒体要做内容的话,有用户讲要做电商联动,我也在想,优酷在人工智能,在大数据这一块有没有一些新的尝试,另外在小冰这块呢?

郝峰:刚才讲的过程里透露了一些信息,里面讲到两个和阿里合作的例子。4月5号跟阿里的业务完成以后我们就是阿里全资子公司,阿里所有业务部相关的数据未来会和优酷平台高度整合,我们可以给自频道告诉他你的观众在淘宝上买什么,他喜欢哪一类的东西,这些用户画像会基于整个阿里更大的数据去提炼,意味着我刚刚说的边看边买的场景得以优化。为什么以前微博说要挖掘电商相关的能力,因为游戏广告和电商,三个比较大的模式都是基于互联网。2014年中国的盘子,广告有1500万元,游戏1200万元,电商2.8万亿元。此外用户本身在视频里高驻留高时长,在这个情况下他的行为和用户属性的画像更容易一些,因为他在这个时间过程当中可能会跟你交互。

基于这样的合作,优酷的用户行为数据跟阿里已有的大数据整合起来将会爆发非常大的威力。首先优酷在人工智能方面一个新的爆点是基于场景电商的尝试,就像是逻辑思维卖书一样,未来会大面积展开。阿里在这一块,基于商业的场景做了大量的积累不管是数据还是在这个数据基础上对他的解读。小冰看起来在图象识别的能力上,可以读文字,图像,流媒体,说明微软在这一块的技术不光是沟通还学习这些人类的能力,未来在推荐,用户产生视频的审核等很多领域都会有更深的合作。

网易记者:阿里有自己的人工智能叫小i,他也可以给支付宝提供这个服务,跟小冰的功能有很多类似的地方,你们为什么没有直接选择小爱而选择小冰?

郝峰:我们会以非常开放的态度对接一切可以给自频道产生价值的合作,我们去年年底的时候跟微软开始谈这个合作了,目前来看,微软在所有社交领域的落地包括各个场景的透出,综合来看这方面的能力更强一些。我们还有基于数据学习之后在各个平台求片,这一块来看跟微软合作更适合视频的场景。

网易记者:优酷的选择应该更重要,像搜狐,爱奇艺等等都有这样的视频资源,你们为什么不选择其他家,未来会不会考虑其他家的内容?

曹文韬:首先对于人工智能平台,优酷或者微软都是一个非常开放的态度,我们希望在人工智能领域大家一起推进,无论是阿里百度还是腾讯,各家都有自己擅长的,我们希望共同推进行业的发展。其次,什么时候开始,和哪一家合作往前推进,很多时候是基于双方在整个过程中,在一开始对人工智能的理解决定的。在年底的时候双方对这一点都很认可,人工智能应该在这样的一个平台和其他人产生交互。而且当时优酷也有非常多的视频资源,已经足够在这个领域上跨出第一步,接下来双方会投出更多的资源不断的往前走。

纵观整个行业和整个维度,人工智能和视频行业产生交叉的时候会碰撞出火花,有很多产品形态并不局限于我们现在所设想的,之后可能有更多的内容商或者人工智能的出品方一起参与进来探求这个方向。那个时候大家将会以更加开放合作的态度一起往前推进,我们从第一步开始携手,我相信我们双方可以在这上面走的更远,可以利用这个场景给用户带来更多价值。

郝峰:我也来解释一下小冰为什么选择优酷,大家如果比较留意我们公布的数据,优酷里真正的UEC、PBC产生内容的流量已经占到50%以上,这是其他平台不具备的。我们可以拿一个数据来看,所有视频上的评论,优酷的评论量是其他平台的十倍,如果从为什么优先选择优酷来做这个,从用户参与内容来讲,优酷在视频平台里是真正意义上最大最全的产生用户内容最多的企业之一。二是用户在这个平台上的活性。你不太会像评价一部电视剧一样,所有评价的内容跟观众自身没有关系。自频道不一样,观众之间有更多生产沟通交流,这个对于学习数据库的规模以及场景,更有利与小冰迅速的学习,所以是非常有价值的。

网易记者:只跟一家合作,因为有内容版权的问题,会不会对小冰自己的学习产生一定的偏差?

曹文韬:所有的视频源或者数据本身,我们都会从不同的渠道获取。小冰需要关注的是互联网公开的所有用户的数据和互联网公开的所有用户交互的数据,特别是优酷这个平台,这些数据帮助小冰塑造自己的性格特点。这个性格特点仅仅是作为其中的一部分接入到小冰的平台上去,但是小冰还有其他各个平台源,比如微信微博。她在每一个平台上都有自身数据语言塑造这样一个人工智能,如果放在网易上讲,小冰本身是基于一个必应的平台,必应是一个搜索引擎,从搜索引擎大数据的公司来看,所有的这些内容的抓取是多方面多元化的,所以这些内容进来的时候一方面如果从一个抽象的角度来看,他其实反映了互联网社会本身在很多事情上的一个观点。仅仅是基于一个数据库,所以他的源头是很多样化的。

网易记者:小冰在优酷落地之后,用户会使用这个平台,这些用户和其他平台上的用户是同一个用户?小冰会做这样的判断吗,因为小冰有一个领养的功能?

曹文韬:这是一个统一的平台,小冰跟所有合作伙伴的合作都是在连接层次下的产品合作,不会出现一个孤岛,所有用户在任何的平台看到的小冰都是同一个小冰。今天一旦绑定之后她就会知道你是谁,他这个用户画像跟所有合作伙伴是共享的。

1.《怎样帮明星做数据 微软小冰争当社交明星背后积累数据做用户画像》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《怎样帮明星做数据 微软小冰争当社交明星背后积累数据做用户画像》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/keji/486513.html

上一篇

壬天堂平台手机登录 任天堂确认NX平台2017年3月发售

下一篇

数据库语言 SQL语句分类

mysql和oracle的区别 MySQL、SQL Server、Oracle对比,你必须了解的三大数据库区别

  • mysql和oracle的区别 MySQL、SQL Server、Oracle对比,你必须了解的三大数据库区别
  • mysql和oracle的区别 MySQL、SQL Server、Oracle对比,你必须了解的三大数据库区别
  • mysql和oracle的区别 MySQL、SQL Server、Oracle对比,你必须了解的三大数据库区别
orm框架 从ORM框架,聊一聊数据库的设计

orm框架 从ORM框架,聊一聊数据库的设计

浅谈ORM只接触过EF和SqlSugar,正在做的项目用到的就是国产的SqlSugar,个人感觉写法还可以。现在的开发基本上很少还有写原生sql的了,因为ORM框架不仅能提高开发效率,而且还能支持各种数据库,避免了原生sql在更换数据库时的尴尬。但是说白了ORM框架最终也是将object转换成sql语句,不过感觉他应该不会给你优化sql吧。当遇到...

chrone 腾讯号称其浏览服务数据日活达4亿

chrone 腾讯号称其浏览服务数据日活达4亿

本站讯 4月28日消息,腾讯今日正式发布腾讯浏览服务(Tencent Browsing Service,即TBS),宣称将为合作伙伴提供整合腾讯底层技术、内容框架、广告体系以及大数据等多方面的升级浏览解决方案。据介绍,TBS目前已接入超过400款App,包括微信、QQ、京东、美丽说以及滴滴出行、墨迹天气、58、界面等。目前,腾讯浏览服务日活跃用户...

农民王小 谷歌CEO:随着时间的推移 人类进入人工智能时代

农民王小 谷歌CEO:随着时间的推移 人类进入人工智能时代

本站讯 4月29日消息,据国外媒体今日美国报道,谷歌CEO Sundar Pichai表示人类即将进入人工智能时代。随着时间的推移,电脑及其他任何形式的移动设备都将成为人类的智能助理。在人工智能领域,谷歌可谓是行业领导者。越来越多的高科技企业也开始加入人工智能的行列,比如Facebook、微软和亚马逊,都已经开始研发人工智能。Pichai的这番话...

nv100 英伟达为人工智能定制的GPU有何不同?

  • nv100 英伟达为人工智能定制的GPU有何不同?
  • nv100 英伟达为人工智能定制的GPU有何不同?
  • nv100 英伟达为人工智能定制的GPU有何不同?
updatesql SQL语法,更新数据UPDATE

updatesql SQL语法,更新数据UPDATE

UPDATE 语句UPDATE 语句用于更新表中已存在的数据。演示数据库...

数据库基础 SQL基础语法

数据库基础 SQL基础语法

数据库:结构化查询语言(Structured Query Language)简称SQL;数据库管理系统(Database Management System)简称DBMS;数据库管理员(Database Administration)简称DBA,功能是确保DBMS的正常高效运行;数据库分体验版(一般只安装库文件和服务)和正式版(授权使用);在正式...

快手怎么养号 快手如何养号:模拟快手用户的4个操作

快手怎么养号 快手如何养号:模拟快手用户的4个操作

作为一个想要在快手上运营产品的人来说,注册快手一定是有目的,想着我就是来推广产品的,注册好了之后当然要发作品!其实这种思路是错误的,容易被快手平台降权和封号。正确的做法是先养号,再推广,下面给大家列举了4个养号操作,老铁们可要记住了。1、注册账号按照需要准备一些养号的手机卡。来注册快手短视频平台账号。养手机卡都会涉及到一定的月费,如果想要省下这笔...