泛娱乐战略:开启互联网+时代
上QQ阅读APP看书,第一时间看更新

●○●第1章 移动互联网下的大数据

1.泛娱乐数据化变革

新时代——移动互联网时代已经来临。当你用iPhone 6 Plus砸核桃时,不小心将屏幕损坏了,你又希望再来一部iPhone 6 Plus,这时你并不需要去苹果专卖店,你只需要登录京东、亚马逊等平台下单即可。第二天你将收到一部新的iPhone 6 Plus,这样你就可以继续砸核桃了,当然这得你自己愿意。

经常在第三方购物的用户会发现,我们买了一部iPhone 6 Plus后,再次登录第三方平台,我们会发现推荐的其他一些手机产品,如华为、小米、三星,甚至iPhone 4等。这就是大数据时代的低层次营销。

因为你不可能继续拿着iPhone 6 Plus砸核桃吧,短时间也不会换手机。不过如果半年后,再为您推荐手机,有可能正合您的心思。

大数据时代通过浏览或搜索记录分析用户下一步的需求,尽管还不是那么智能,但是这已经为我们提供了一个新的启示。大数据时代,任何行业如果不主动参与其中,只能被动淘汰,泛娱乐就是大数据时代下新的一种产物。

泛娱乐指的是在移动互联网场景下,通过技术手段实现多领域跨界连接。在这一过程中,需要打造一个核心IP(Intellectual Property的缩写,直译为知识产权。这是通过智力创造性劳动所获得的成果,并且由智力劳动者对成果依法享有的专有权利)。这一IP可以是一本书、一个故事、一个视频等,同时连接一切是泛娱乐的终极目标。

图1.1 明星IP的组成要素

在2015年,业界认为互联网发展的八大趋势:车联网、在线教育、大数据、在线视频、泛娱乐、智能硬件、企业互联网、互联网金融。其中泛娱乐于2014年被文化部、新闻出版广电总局等中央部委的行业报告收录并重点提及。

腾讯旗下有两大核心产品:QQ和微信。QQ用户量超过8亿,微信用户量超过6亿。目前腾讯是在中国的泛娱乐领域做得最出色的企业之一。其中在泛娱乐方面,腾讯互动娱乐表现得最为突出。腾讯娱乐将游戏、文学、动漫三者融为一体进行全方位的连接。

图1.2 腾讯娱乐三位一体战略布局

随着腾讯在泛娱乐上不断发力,目前腾讯已基本构建了一个打通游戏、文学、动漫、影视、戏剧等多种文创业务领域的互动娱乐新生态,初步打造了“同一明星IP、多种文化创意产品体验”的创新业态。

除了腾讯之外,其他巨头也纷纷加入其中。小米、华谊、阿里数娱、百度文学、艺动、通耀、360等企业纷纷将“泛娱乐”作为公司战略大力推进。

是什么魔力让互联网行业与传统行业纷纷向泛娱乐战略示好?大数据。大数据为企业提供大量的参考信息,只需要借助技术优化就能得到精准的目标客户数据。当客户购买冰箱的时候,第三方平台会主动为用户推荐保鲜盒等,这一数据营销优化,让产品销量提升,客户也慢慢接受了。

麦肯锡曾专门对中小企业展开了一项调查研究,研究人员发现中小企业的数量占据所有企业的80%以上,而且所创造的GDP之和也非常巨大。由于中小企业的规模小,发展速度很快,但是资源较少,所以可以承受的营销成本有限。

这一难题在大数据时代就会得到解决,由于获得用户数据的多样性,企业很容易就能得到低价优质的用户需求信息。目前中国拥有超过4000万注册的企业,对用户的信息需求量很大,也很旺盛,如果通过大数据技术进行改进获取用户信息的方法,这将为企业节约数千亿元。

在泛娱乐时代,借助大数据的力量,一切IP的打造就会变得容易,根本原因在于大数据的无穷力量。移动互联网的许多场景都适用于泛娱乐场景。

在过去,人们往往关注于有形资产,而对无形资产则关注极少。而在大数据时代,价值分为两种,第一是隐性资产数字价值,第二是显性效果价值。对于传统行业,对于隐性资源价值,一般都归结为品牌知名度、美誉度,而在大数据时代,则附加了品牌与用户共创的数字生态价值,这一价值促进了IP升值。

腾讯动漫的一款人气漫画《尸兄》以5000万元天价将IP进行转让,迅速占据IP界话题热点头条。《尸兄》是贾海波(笔名七度鱼)创作的作品,是腾讯动漫独家签约的漫画。该作品自2011年12月6日上线以来,截至2014年3月29日,《尸兄》点击量在线突破30亿。这一优质IP迎来了泛娱乐热潮,《尸兄》被改编成同名动画《尸兄》(第一季)和《我叫白小飞》(第二季),以及网络小说《尸兄》。各参与方赚得盆满钵满,作为话题热点令各界讨论至今。

显然,《尸兄》实现了在泛娱乐场景之下隐性资产数字价值的变现过程。其实,隐性资产数字价值的高低源于对核心IP的挖掘深度与广度,如果核心IP能打通众多领域之间的壁垒,那么其IP价值会很高,这也是许多企业纷纷投入上千万元甚至上亿元去购买IP的原因。

2.大数据的摩尔定律

2015年4月19日这一天,正好是摩尔定律这一现象发现的五十周年纪念日。当工程师戈登·摩尔在半个世纪前提出这一定律的时候,电脑还像冰箱那样笨重。如今,摩尔定律已经成为了整个硅谷的基石。

摩尔定律是一个物理和自然概念,揭示了信息技术进步的速度,其主要内容是在价格保持不变的情况下,每隔18~24个月,集成电路的性能(以集成电路芯片中可容纳的晶体管数量衡量)就增加一倍,电脑性能也将提升一倍。换一句话说,每隔18~24个月,同样性能的集成电路的价格就下降一半。

美国芯片接口技术开发商兰巴斯公司的首席科学家克拉格·汉姆佩尔说:“摩尔定律是整个信息时代的驱动力,没有摩尔定律,就没有如今廉价的处理器,如今硅谷99%的公司也就不会存在了。多亏有了摩尔定律,我们今天才能把智能手机放在口袋或钱包里,今天智能手机的性能比1965—1995年里最大的电脑还要强劲。没有摩尔定律就没有超薄笔记本电脑,也不可能产生足以绘制整个基因组或是设计复杂药物的高性能计算机。流媒体视频、社交媒体、搜索功能、云计算——没有摩尔定律,这些都不可能产生。”

摩尔定律影响着整个信息产业和电子产业。这一定律引发的结果之一是:随着信息技术的发展,工程师和科学家将以前所未有的速度捕捉、分析并存储数据,而尖端科技产品的成本也会越来越低,低到逐渐能够为普通大众所接受。

摩尔定律由英特尔公司创始人戈登·摩尔提出,并以他的名字命名。不过,最早提出摩尔定律相关内容的实际上是加州理工学院名誉教授卡沃·米德。卡沃·米德是半导体先驱,按照他的说法,“摩尔定律不是一个物理定律,它是人类本性的一个定律。人们知道什么在物理上是可能实现的,而且对之深信不疑。戈登和我一起共事,摩尔定律彻底地改变了我们的生活。”

任何想要忽视摩尔定律重要性的努力都是徒劳的,因为摩尔定律不仅直接导致了个人笔记本电脑、包括iPhone在内的智能手机、包括Apple Watch在内的电子产品以及特斯拉智能汽车的诞生,还是支撑谷歌、Facebook等科技巨头的直接力量,仅这两家公司就操纵着全球数十亿美元级的广告业务。

因此,说“摩尔定律是推动人类GDP增长的根本动力”这句话一点都不为过。也就是说,在过去的半个世纪里,摩尔定律推动集成电路技术以指数增长的速度进步,而这是人类社会之前从来没有出现过的情况。从此,整个IT行业的技术革命正式开启,全球自动化和信息化时代全面到来。总而言之,在过去的半个世纪里,拉动世界经济增长的根本动力即为摩尔定律。

显然,摩尔定律对人类的影响已经远远超出了今天我们所拥有的电子产品,甚至远远超出了制造出这些电子产品的众多科技公司,其影响力已经触及人类活动和创造的方方面面。更为重要的是,这种影响力才刚刚开始,尽管按照戈登·摩尔本人的说法,到了2020年,摩尔定律就会黯然失色。

在加州山景城计算机历史博物馆举办的“纪念摩尔定律提出五十周年”活动上,前英特尔公司高级主管比尔·戴维德和卡沃·米德向人们描绘了一幅壮观的画面,在未来数十年的时间里,摩尔定律不仅会继续发挥其影响力,还将以一种更为宏大的方式颠覆整个人类的社会制度。

比尔·戴维德说:“每当科技变化发生之时,其所产生的社会影响都是十分巨大的。比如,从每小时3~4英里的马车到每小时30英里的火车,创造了工业城市。社会和经济变革是巨大的。50多年前,信息传递不仅缓慢,而且非常昂贵。所以我们把人们移动到距离信息很近的地方——沃尔玛。现在,有了亚马逊,可以把信息移动到人们所在的地方。由于摩尔定律,我们将会重建所有的物质性基础设施。”

摩尔定律还带来了另外两个结果:互联网的兴起和产业的数字化,而正是这两个结果的合力,诞生了一个过去一直没有引起我们足够重视的结果,即各种数据量的急剧增长。当数据量的增加累积到一定程度,量变就有可能发展为质变,即大数据。

通过使用大数据,谷歌的机器问答项目解决了30%左右的问题,已经远远超出了学术界迄今为止同类研究的最高水平。之所以提出大数据的概念,其根本原因是摩尔定律导致互联网的发展,进而导致各种数据量的急剧增长。结果是数据增长的速度超过了互联网的增长速度,如下图所示:

图1.3 摩尔定律导致数据增长速度超过互联网增长速度

虽然大数据已经成为了一个热门话题,但是,在行业里,人们对于它的理解依然停留在表层。主要表现在:在概念上认为大数据即数据量大,将大数据和大量数据相混淆,而忽视了大数据多维度和完备性的本质。在应用上只是看到了能够利用统计规律提升公司业务,没有看到大数据与摩尔定律的结合将带来机器智能社会,彻底改变现有的商业模式和产业结构,以及人们的生活和工作方式。在评价上明显低估了随着大数据和机器智能的到来,人类社会将迎接和经受前所未有的机遇和冲击。

3.Facebook平台为泛娱乐带来元数据

从总用户10亿到单日访问10亿,Facebook创始人与首席执行官说:“创立Facebook不仅仅是为了建立一家公司,更是为了实现连接世界的梦想。”事实上,通过虚拟现实和Internet.org的发展,这家社交网络公司已经让地球上每七个人中的一人使用Facebook。而在2014年Facebook成立十周年大会上扎克伯格就曾豪言:“要在未来十年连接占全球人口三分之二的还未接入互联网的人群。”

10年前,Facebook还只是扎克伯格在哈佛大学宿舍里创办的一家小公司,如今,已经发展成为在加州门洛帕克市拥有自己的办公园区全球最大的社交网络。全球12.3亿人都是Facebook的用户。目前,公司市值约为1350亿美元,而且很有可能成为史上最快达到1500亿美元市值的公司。

短短10年,Facebook扩张速度如此之快,原因在于它的开放图谱为泛娱乐提供元数据。所谓元数据(Metadata),简而言之就是数据的数据,又称为中介数据、中继数据,元数据可以描述数据属性的信息,为指示存储位置、显示历史数据、查找相关资源、记录个人和企业文件等功能提供支持。

正是借助Facebook的开放图谱,超过900万个应用得以在社交网络平台上分一杯羹,其中包括移动视频社交网站Viddy、SocialCam、谷歌、环球音乐和索尼音乐合资的VEVO音乐服务网站等,都是其受益者,也证明了开放图谱的价值。

开放图谱的本质是一种数据收集和利用方式,通过抓取Facebook用户在第三方服务上的数据,并反馈回Facebook机器,实现向所有在线的朋友分享全部信息的功能。例如,用户可以将喜欢的数字媒体音乐服务平台Spotify的音乐分享给他在Facebook上的朋友,所有的这些小碎片最终全部汇集到Facebook的动态更新,然后通过Facebook时间线,这个碎片会影响该用户在Facebook上的其他朋友。

每天,Facebook在全球超过10亿的用户都会产生大量的数据,因此,Facebook不可能把所有的信息碎片都显示在用户个人的新闻动态中。不过,应用和网站开发者可以利用开放图谱构建他们自己的数据,这样,Facebook机器也可以将这些数据进行重新分类,同时有目的性地利用这些数据。

Facebook开放图谱的总负责人麦克·凡尔纳说:“我们可以借助传统的文本分析来得出结果,但最后还是决定建立一个构架:开发者能够明确告诉我们他应用的相关信息,这样方便我们快速提炼出更有趣、更直观的信息。”

应用开发者能够在自己的网站上构建数据库,那么Facebook就可以在开放图谱上构建这些应用。来自全球第二大社交网站MySpace母公司Fox Interactive的一名员工安德里亚·奥恩说:“Facebook之所以能打败MySpace,就是因为它能够有效地管理数据,而且条理清楚。”

图1.4 Facebook的开放图谱

在Facebook上存储着两种数据:一种是目标数据,一种是对这种目标数据之间的关系进行描述的数据即元数据。麦克·凡尔纳说:“在系统的顶层,我们支持开发者定义他们的目标数据,然后像整理一般用户信息一样对开发者目标数据进行归类。”

这个系统主要从事两方面的工作,一是分析能让Facebook用户感兴趣的内容,二是根据分析结果选定对用户、开发者特别重要的那部分内容。最后,通过汇总这两个分析,Facebook机器决定新闻动态系、时间线,以及其他相关的系统显示的内容。

“在网页上,我们试图分析你在寻找什么,比如奥巴马有3000万粉丝,如果你访问他的主页,我们会提示你的哪些朋友也喜欢他,我们做这个只需要几毫秒。”

也许对于用户来说,点击这一行为并不具有特别重大的意义,也耗不了多少时间,不过对于Facebook来说,用户在Facebook上的每一次点击都值得软件平台Scribe实时记录。通过另外一个接入Scrible的平台对这些数据进行实时分析,Facebook机器能够分析出最受欢迎以及最不受欢迎的内容。而所有这些记录都会被存储在Facebook的另一个数据库里,之后显示在新闻动态和时间线里。按照麦克·凡尔纳团队的实时监测,所有的数据从一个系统转移到另一个系统,总耗时为20~30秒,而每个小时都会发生数亿的转移行为。这也因此保证了Facebook这个开放图谱的高速运行。

Facebook坐拥的海量用户数据,正是其赖以生存的基础。而能够玩转这些大数据,才是Facebook成为社交网站霸主的真正原因。Facebook甚至能知道用户是否或何时开始约会,以及何时分手。

图1.5 Facebook基于用户数据分析结果

上图显示了Facebook部分用户的发帖数随时间的变化。与传统的线下确定恋爱关系的过程类似,通过社交网络确立恋爱关系的双方也会经历一个所谓的“求爱”阶段。根据Facebook科学家卡洛斯·迪乌克的分析,沿着时间轴观察,在确定恋爱关系之前的100天里,双方相互发帖数量呈现逐步增加的态势。一直到恋情正式开始的“第0天”,之后越来越少。因为此时线上互动已经逐步给线下现实世界的互动让位了。

早在2012年,Facebook的数据工程师们就已经开始利用用户主动公开的感情数据,将情感关系与音乐进行融合,分析出用户开始一段新感情时喜欢播放的歌曲,以及结束一段恋情后经常播放的歌曲。

除了将这些分析结果发布在平台上,给用户们带去一些乐趣,Facebook的产品工程师们还将其用在基于数据的推荐引擎上,推出了新的社交服务——提供给用户最契合心境的曲目。

此外,扎克伯格还希望Facebook能够更加敏锐,在用户还没意识到问题之前就为用户解决问题。在Facebook上,有5%到10%的帖子数是用户向好友提出的问题,如推荐附近的印度餐厅,值得信赖的牙医。可见,扎克伯格正在引领Facebook进入谷歌的领域,不仅能够为互联网上的大部分问题提供可靠的答案,而且成为少数几个拥有强大资源和意愿的公司,推进搜索的技术界限。

4.可预测票房成败的谷歌

《爱在城南》(Southside With You)将于2016年在美国上映,这是一部独立爱情剧情片,主角为美国总统奥巴马与第一夫人米歇尔。剧情片以年轻的奥巴马与顶头上司米歇尔第一次约会为主线,设有冰淇淋屋前的初吻、逛街、聊天、看电影等情节,以此开启两人经典爱情之旅。

如果您是美国动漫行业巨头,有意将《爱在城南》电影作为IP改编成动漫。IP方要求您支付该电影动漫版权1亿美元,作为巨头的你,买还是不买呢?在大数据面前,臆想等同于白日梦。买与不买的决定由谷歌帮你做。

如果你是《爱在城南》的发行方,营销推广费用是500万美元还是5000万美元呢?这也由谷歌为你做决定。

谷歌以搜索引擎起家,市值4294亿美元(截至2015年8月3日),业务遍及大数据、“互联网+”、工业4.0所涉及的几乎所有高科技领域,对信息的挖掘更是走在世界的前列,预测票房就是一项新的功能。

2013年6月,谷歌的电影票房预测模型正式发布。谷歌宣称,利用这个电影票房预测模型,能够提前一个月对电影上映首周的票房收入进行预测,准确率高达94%,这一研究成果对于好莱坞电影公司具有重要意义,可以通过预测的票房状况及时调整其电影营销战略。

其实,谷歌的票房预测模型并不神秘,主要基于在该搜索引擎上电影相关的搜索量与票房收入之间的关联。随着互联网的发展,人们主要通过网络搜索电影相关信息。因此,从本质上看,该模型是大数据分析技术在电影行业的重要应用。

根据谷歌白皮书(Quantifying Movie Magic with Google Search),电影票房收入与搜索量这两条曲线的起伏变化具有极强的相似性。

图1.6 票房收入与搜索量曲线

谷歌将电影的搜索分为两大类:一类是涉及到电影名称的搜索,另一类是不涉及电影名的搜索,如“热门电影”“剧情片”“好莱坞电影”“奥斯卡获奖影片”等。下图显示了票房收入与这两种搜索量之间的关系。在一年中的大多数时间,涉及电影名的搜索量都高于不涉及电影名的搜索量。

不过图中的灰色椭圆区域显示了在电影淡季的时候,总体票房收入较低,而涉及电影名的搜索量会低于不涉及电影名的搜索量。因为此时一般缺乏知名度较高的电影,所以人们更倾向于用更宽泛的搜索找出想看的电影。

对于电影的网络营销,这一统计结果的意义是:处于电影旺季的时候,电影公司应该多购买涉及到具体的电影名和关键词的广告;而在电影淡季的时候,则应该多购买具有相对宽泛意义的关键词的广告。

图1.7 票房收入与两类不同搜索量之间的关系

由此可见,利用电影的搜索量对票房进行预测完全是可行的。不过,谷歌后来的研究表明,仅仅依靠搜索量对首周票房收入进行预测则是不够可靠的。通过研究2012年上映的99部电影,谷歌尝试着构建了一个线性模型,不过,这一次的准确率只有70%。如下图:

图1.8 搜索量与首周票房收入的关系

为了让构建的预测模型精度更高,谷歌决定采用四大类指标:电影上映前一周的搜索量、电影广告点击量、上映影院数量、此前上映的同系列电影的票房表现。每一类指标之下又包含了多项小指标。

通过这四大类指标,谷歌可以构建一个线性回归模型(Linear Regression Model),这是大数据分析领域里一个最基本的模型,基于票房收入与各类指标之间存在的简单线性关系建立这些指标与票房收入的关系。

图1.9 提前一周预测票房收入的效果

由上图看出,预测的结果与实际的结果非常接近,提前一周预测的准确度为92%。不过,这一模型对电影营销的价值并不大,因为在电影上映前一周几乎不可能对营销策略进行调整,也无法改善营销效果。因此,谷歌开始了进一步的研究,使得这个预测模型能够提前一个月进行首周票房的预测。

而要提前一个月进行电影票房预测,其关键在于谷歌采用的一项新指标——电影预告片的搜索量。根据谷歌的发现,与电影的直接搜索量相比,预告片的搜索量能够更好地预测首周票房表现。因为在电影上映前一个月,人们了解电影更多地是通过搜索预告片。

除了电影预告片的搜索量,谷歌还将此前上映的同系列电影的票房表现,以及档期的季节性特征引入票房预测模型,作为衡量指标,每一类指标之下也包含了其他小指标。谷歌再次构建了一个关于各类指标与票房收入之间关系的线性回归模型。

下图展示了提前一个月预测票房的模型效果,可见,预测结果的模型精度达到了94%,与实际结果非常接近。

图1.10 提前一个月预测票房的效果

为什么谷歌采用了数据分析中最简单的模型之一线性回归模型,首先是因为利用简单的线性模型就可以达到94%的准确度,在实际应用中具有很强的可操作性,也是人们一直追求的。其次,简单的模型更容易为人们所理解和分析,这也是大数据分析技术的优势,让人们能够从大量数据中挖掘出自己可以理解的规律,由此加深对整个行业的理解。正是利用如此简单的线性预测模型,谷歌可以很容易地对各项指标带来的影响进行分析。

谷歌的报告有这样一个分析结论:“距离电影上映一周的时候,如果一部影片比同类影片多获得25万搜索量,那么该片的首周票房就很可能比同类影片高出430万美元。若一部电影有搜索引擎广告,我们也可以通过其广告的点击量来推测票房表现——如果点击量超出同类电影2万,那该片首周票房将领先750万美元。”

如果能够掌握各项指标对票房收入的影响,各大电影公司可以优化自身的营销策略,同时有针对性的营销,也可以降低营销成本。根据谷歌的报告,用户了解电影信息的渠道多达13个,利用票房预测模型,毫无疑问可以让营销策略的制定更为有效。

谷歌的电影预测模型展示了在电影行业大数据分析的成功运用。未来大数据分析的应用前景是,将模糊的行业经验提升为科学、精准的量化指标。此前,谷歌还利用搜索数据对奥斯卡获奖者进行预测。

影业如此,动漫、音乐、文学等泛娱乐表现形式也是如此。对前文所说的有意将《爱在城南》电影作为IP的美国动漫行业巨头而言,大数据可以通过对《爱在城南》的票房预期,了解用户的需求,推导动漫用户的转化率,进而估算动漫授权是值500万美元还是5000万美元。

当然在数据挖掘方面,不止谷歌一家,像Facebook、苹果等都在行动。谷歌的这项挖掘用户需求模型停留在表面分析,但大数据为深度挖掘用户的需求提供了可能。

大数据的核心就是挖掘用户需求信息,所以我们需要先知道用户的哪些需求是可以从数据中挖掘到的,哪些需求是暂时不能挖掘出来的。因为并不是每一项需求都能被精准地挖掘到。利用大数据能挖掘出的用户需求一般都是符合正常逻辑推理或行业经验的。

泛娱乐时代的人们要想将大数据利用到其他行业,需要在三个方面做好探索:

第一,数据来源的种类。大数据时代的特点就是数据来源多样,可以是像谷歌一样的搜索引擎,也可以像Facebook一样的社交平台,当然也可以是游戏、动漫等产业。数据来源多样决定了信息采集时要分清主要元素与全面元素,分清后才能保证用户的潜在需求是精准的。

第二,大数据模型的选择。从谷歌的模型,我们能得到搜索量等数据与票房收入的关系;从Netflix的模型,则挖掘了观众对不同电影的偏好,以及其他的行为特点。不同的数据模型会产生不同的结果,所以在模型选择方面要以对商业决策最有利的模型为准。

第三,为大数据提供场景。从单一的数据分析中,往往我们会得到许多规律,但是有时我们并不需要这些规律,我们需要多数据的分析。因为这样的多角度场景为分析提供了潜在的实际价值。

第四,大数据删除。在泛娱乐时代,我们强调多元化、多角度、多元素地思考,但是在决策的时候,我们真正要权衡的关键点不会超过三个,即当我们确定了定位、方法、结果预测后,我们只需要删除一些大数据,让一切变得清晰起来。

我们的一切预测都是基于大数据,所以想要得到精准的预测,必须按照上面四个方向去探索。不过,美国电影公司梦工厂CEO卡森伯格坚持认为,电影创作靠的是创造力,而不是数据分析。

因此,我们需要思考,在大数据时代,我们可以获得哪些数据,我们希望和能够从这些数据中挖掘出哪些信息。如果只是单纯地依靠数据分析,得出的规律未必具有实际价值。因此,只有将数据分析与行业经验结合起来,总结出行业规律,形成一个精准的行业模型,才能具有实际指导意义,从而产生巨大的价值。

5.利用大数据推出的《纸牌屋》

自从进入21世纪以来,美国电视剧业便迎来了第二个黄金时代,由于其画面精良、阵容强大、摄影专业,无论是作品水平,还是全球化程度,都呈现出前所未有的高水准,不过与此同时,要在这么多的大制作中脱颖而出也加大了难度。

可是《纸牌屋》不用担心这个问题,其从北美市场出发,一路所向披靡,最后在全球掀起一阵收视狂潮的一个重要原因,正是大数据分析技术的应用。位于加州加斯盖图的一家在线影片租赁提供商Netflix公司,仅在美国市场,就有2700万的订阅用户,每天用户在Netflix上会产生3000多万个行为,包括暂停、回放、快进等,还会给出400万个评分和300万次搜索请求。

Netflix正是利用这些数据制作出的《纸牌屋》。通过官方网站,Netflix收集了大量用户的行为偏好数据,并对其进行分析发现,在那些喜欢观看英剧版《纸牌屋》的用户之中,点击率最高的是鬼才导演大卫·芬奇和男演员凯文·史派西,而最受欢迎的电影类型是“政治惊悚”。

于是,Netflix决定斥资1亿美元,请来大卫·芬奇做导演,打造了新版的《纸牌屋》,由凯文·史派西担当主演。其实仅从剧本质量来看,《纸牌屋》并不超出同期的其他几部热门剧。不过在《纸牌屋》中,主要聚焦政治黑暗面,而不是进行美国政界科普。

结果,Netflix赚得盆满钵满,就连美国总统奥巴马也是其忠实观众,虽然他说自己在白宫中并没有电视主人公那般的超能力。《纸牌屋》的爆红,体现了新兴的大数据模型与传统影视工业的结合,影响着整个娱乐市场的未来。

Netflix是如何将数据转化为生产力的?

在以美国为代表的西方成熟影视工业市场,其运作方式与以中国为代表的传统影视制作模式截然不同。在好莱坞,无论是由明星主演的名导名编剧的大制作,还是一些具有特定类型设定的肥皂剧,其最重要的目的就是赢利。

而只有符合观众口味才能赚钱,因此,观众的需求是衡量影视剧是否成功的最重要的标准,只要建立在这个基础上,无论是大制作还是小成本,最后都可能达成目标。尤其是在全球经济普遍低迷的这几年,口红效应(低价产品偏爱趋势,因经济萧条,导致口红等廉价非必要物的热卖)逐渐显现,娱乐工业也随之迎来繁荣。《纸牌屋》正是在这样的背景下出现。

而《纸牌屋》的成功,不仅仅在于赶上了娱乐行业发展的快车,更在于其出品商Netflix对大数据的匠心独运。Netflix是美国一家领先的视频播放网站,成立于1997年,主营业务是向家庭提供互联网即时媒体播放。登录Netflix账号后,用户可以通过个人笔记本电脑、电视、iPad及iPhone等媒体,实时观看各类节目。

根据美国HIS信息咨询公司的统计结果,早在2011年,Netflix的网上视频收入总和就已经超过了苹果,网站整体份额占据北美在线电影总销量的45%,而最接近的竞争对手亚马逊所占份额仅仅为1.8%。

虽然占据了流媒体视频播放服务提供商的领先地位,不过其CEO威尔默特·哈斯廷斯认识到,如果想继续保持这种领先地位,必须将自身与其他竞争对手区分开。而Netflix的大数据基因,正是推动《纸牌屋》出现的直接原因。

作为大数据在娱乐市场的开山之作,《纸牌屋》之所以没有出现在其他娱乐公司,源于成立之日起,Netflix的核心竞争力和发展战略的核心就是数据的计算和分析。借助推荐引擎和数据算法,Netflix可以提前得知观众喜欢看的影视内容,并根据结果进行准确地采购,再加上流媒体的广泛应用,观众再也不是一个静静守候在电视机前的群体,这也让Netflix颇为受益。

Netflix的通信负责人乔纳森·弗莱德兰德说:“我们知道人们正在Netflix上观看什么内容,而且根据人们的观看习惯,我们有能力去了解特定的一部剧集的受众人群可能会有多大,对此我们具有高度的信心。我们想要继续为所有人提供内容。随着时间的推移,我们正越来越善于选择内容,能带来更高的观众参与度。”

这是一个真实的Netflix,不仅仅将希望寄托在利用独家内容与那些已经占据行业地位的有线电视网络展开正面抗争,还希望引入传统电视网络所缺少的大数据,认知人们的观看习惯和偏好。美国知名电视评论人胡特·斯特恩说:“如果Netflix知道哪些观众喜欢看哪些频道,那就好像是打开了上帝的礼物,传统电视运营商将毫无抵抗力。”

其实,数据的分析和运用在电影工业并不新鲜,从电影市场最成熟的好莱坞来看,从一部电影的创意、拍摄,一直到后期的发行,数据整理无处不在,最终,投资方会根据不同组合的收视效果,排列出最优的创作和放映方案。

不过,这种数据分析形势并不等于大数据,无论是从数据的体量、类型、商业价值还是处理速度来看,大数据都与传统的数据挖掘技术有着本质的区别。在业内,大数据被归纳为4个“V”——Volume(体量)、Variety(类型)、Value(价值)、Velocity(速率)。

对于影视业,大数据不仅提供了一种创作的工具,更提供了一种观察世界的维度,大数据能够提供更多、更深入的关于制作、投资、营销的分析信息,帮助更好地进行决策。《纸牌屋》的成功,主要在于Netflix利用大数据分析巨量用户的需求,而纵观整个影视制作行业,一些影视公司使用的数据分析,不过是对数据的简单挖掘。

而从数据获取、质量及相关性分析、巨量数据处理技术和确定商业应用等方面的成本来看,大数据的高门槛导致了其目前还只能是“有钱人的游戏”。在中国,也只有一些大型的以用户为导向的公司,如阿里巴巴、腾讯等一些天然坐拥巨量高质数据累积的公司,才能说可以利用大数据。

而在与消费者距离较远的影视工业,目前还没有哪一家公司具备熟练运用大数据的实力。因此,更多的则是一方面基于大型公司提供的大数据研究获取数据,或者通过抓取的方式得到数据,另一方面进行商业运作来吸引用户,在这个过程中建立自己的数据,同时对这些数据进行再加工。可见,在影视行业,要实现大数据的广泛运用还有一段很长的路要走。