大数据于国内影视行业的分析
大数据为何近几年大热?
人类进入大数据时代,类似于生物学迎来了显微镜,天文学发现了望远镜,因为网络传输和计算机存储运算能力的提高,交给了我们一把信息放大镜,从此我们对现象的观察进入一个新的领域。
其实自古就有多维度数据的挖掘行为,历法的制定过程或许可以作为一个很好的例证,江湖上现在偶尔也会有关于林元帅诸葛军师的传说,自从计算机技术诞生之后,对数据的利用和处理一直在同步发展中,无论是分布处理还是并行处理,并不是一天就蹦跶到今日的技术高度,我们很多科学发现都是在近三十年之间才完成,正是得益于此。
但为何在这几年“大数据”忽然大热?原因其实很简单,全球智能手机的普及。
随着移动终端信息处理能力的提升,与用户的交互界面不仅更加具备黏性,并且实现了全方位全时段互动,此时每个人的移动终端实际上就变成了一个数据记录仪。它比PC所能获取到的信息更加个人化,不仅暴露这个人的生活细节,位置动向,同时也记录着他的消费习惯,人类第一次拥有了这么多数据的生产者。每一个元数据都可以直接挂钩一份具体的支出额度,每一个数字都可以被货币量化,大数据的商业价值与各个企业的营收几乎都可以直接挂钩。所以,围绕“大数据”来说故事迅速成为当下的主流。
但是揭开媒体的那些噱头背后,你会发现,国内对复杂系统的研究,仍然是处于概念大于应用的阶段,大部分行业对线性、封闭系统内的数据关系都没办法掌握,更不用说将大数据转化成有价值的信息。而在影视行业,工业化体系处于刚刚起步的阶段,很多从业人士连财务报表这种基础数据都看不明白,去理解大数据的价值更是有些不可想象了。
大数据于国内影视行业的意义
大数据技术作为一种工具,其应用方向,无非三个方面,一是对过于和曾经的理解,二是对以后和将来的认知,三是对当下进行判断并进行实时处理,影视行业大数据技术的应用如果想要有长足的发展,那么在这三个方面都会面临着一些需要解决的问题。
对过去和曾经的理解
既然是对已发生的进行判断,就会涉及到数据采集,这个部分往往会引发争论,中心议题是:到底多大才叫大,GB还是TB,PB还是EB?
如果我想要知道《致我们终将逝去的青春》这部差一点就可以归类到文艺片的电影,为什么在2013年上半年票房仅次于《西游·降魔篇》,我是应该仅以社交媒体的传播效率来进行数据的挖掘,还是要追溯到原着小说里的青春以及被电影宣传所唤起的记忆?
将数据挖掘的范围放在社交媒体的范畴,那么通过对一部电影推广过程的梳理,我们很容易通过数据制定出一张细化到分钟的参考,以及观众会被什么样的宣传内容所吸引,但是它仍然只是在描述表象。
如果观察只停留在眼前,将无法找到最终的因果。我们必须对推动现象发生的机制进行论证,那么我们该用什么样的体量来储存和分析观众们的记忆,从而找到个人经历和集体共鸣之间的关系?
在这个方面,如果只用社交媒体的数据进行相关性的分析,其实和我们日常所做的感性推导没有太大区别,甚至还不如感性推导灵活,很容易因为数据的不够全面犯下“黑天鹅”式的错误(在发现澳大利亚之前,西方认为只有白天鹅)。必须要追溯到成因阶段更庞大的外部数据,比如主要观众群十年间的消费偏好及社会经历,以及对他们观影之前的心理活动进行统计分析。会不会太复杂?但是从数据挖掘的角度来说,只有在这个方向上进行努力才可能会提供实质性的价值。
或者说,我们也可以简单粗犷一些,如麦特的负责人陈砺志所言,《致青春》的成功最主要的因素是因为赵薇的敬业与投入,以及她个人在行业的积累。
大家可以想一想,以上三个角度,哪个会更容易接近整个事件的核心。
对以后和将来的认知
大数据技术虽然可以让人类对现象的理解进行更深入的探究,但是当对国产的影视项目前景进行预测,首先需要面对的问题是,我们仍然处于一个观众群体持续波动的时期。
在北美市场,贡献50%票房的观众约占人口的10%,也就是3000万左右,这部分群体基本上结构相当稳定。上世纪70年代末,当北美电影的平均制作预算开始攀升到1000万美元以上,宣发费用达到500万以上时,对观众的监测从阶段性的调研逐渐转变成常态性的监控。在计算机还只是个神话的时期,“好莱坞”是用人工+信件的形式,建立了最早的大范围观众研究模型,这些历史数据通过几十年的积累,已经让一部电影与观众之间的联系变得非常透明。但即使是如此严谨的市场监控,近几年也因为受到移动互联的影响,观众去影院观影的行为随机性逐渐提高,导致传统的观众研究模型频频出现一些问题。
反观国内电影市场,差不多有三分之二的银幕是在近三年之内才出现的,2010年时,我们所拥有的现代化银幕不过才6223块,而如今,这个数字差不多是17000。可想而知,影院目前所迎来的观众,基本上是近三年才开始逐渐培养去影院观影的兴趣,这种行为暂时还不能称之为习惯。
所以说,中国电影市场目前的波动很难通过现有的技术手段完成监测,会因为存在有其他我们不可知的变量,而导致结果南辕北辙,这在统计学的回归分析上被称之为“变量遗漏偏差”,大数据技术目前所能覆盖到的范围并不能帮我们解决这个问题。我们还需要时间来不断修正对市场数据的理解,观众也需要时间来不断培养在影院观影的习惯。
(编辑:ASP站长网) |