大数据对电视产业意味着什么?

www.ts.cn 天山网   2014年01月09日 17:54:35    我来说两句 天山网官方微博
更换背景颜色:
 
 
 
 
 
 
 
更改文字大小:

    一、大数据带来的新思维

    (一)从样本到大数据

    以统计学为理论基础的抽样成为人们探索未知的主要方法,这实际上是以样本取代全局数据的思路,甚至认为样本就是研究对象的本来面目。长久的习惯使人们丧失了对大规模数据的追求,甚至对大规模数据产生了无所适从的恐惧。

    “大数据”的思维强调回归知识探索的本源,通过大规模的数据而不是样本获得知识。大规模的数据蕴含着样本数据不具有的新特征。迈尔-舍恩伯格在《大数据时代》一书中举了个例子:一幅马的照片无论怎么变,那还是照片,但如果每分钟播放24张不同形态的马的照片,就诞生了电影。这个例子的启示在于,当我们改变事物的规模时,事物的状态有时也会发生变化。

    (二)从因果关系到相关关系

    与抽样方法相配套的是千百年来人们对因果关系的渴求。人们之所以渴望知道因与果,并不是为了附和历史,而是期望预测未来。于是,人们建立了各种各样的逻辑线条,把社会的发展与变化抽象为一个个公式,妄图把每一种情况都视为自变量,在因果关系和因变量的作用下预测未来。且不说这种思维合理与否,单说推理出这样一条条的逻辑路径就足以使众多先哲皓首穷经。

    与2007年和2008年美国疾病预防控制中心的数据对比,谷歌对H1N1的预测与官方数据的相关度高达97%。[ ]最关键的是,谷歌的数据是即时的,带有前瞻性的。这些数据对于谷歌先进的云计算系统,只不过是几分钟的运算时间。获得这些数据的成本更是接近于零,它们原本就在硬盘里呆着,如果不被用来分析,它们任何价值都没有。谷歌的预测并不是建立在因果关系上的,而是建立在相关关系上的。相对于因果关系,相关关系的探索成本低、时间短,准确性却毫不逊色。

    (三)从精确分析到数据挖掘

    人们对抽样法的迷恋以及对因果关系的不懈探索,自然而然地产生了对精确分析的推崇。一直以来,研究者进行社会研究中使用抽样法时必须保证数据的准确性,在定量研究中,还专门设计了寻找数据异常值的方法,如库克距离。人们对“倒因为果”、“多因一果”等所谓因果联系对立面的恐惧,使精确分析成为研究者的“护身符”。在大数据时代,因果关系已经不那么重要,相关关系逐渐走上台前,研究相关关系的方法——数据挖掘,也应运而生。

    数据挖掘(Data Mining),是通过分析大量数据来揭示有意义的新联系、趋势和模式的过程。[2]与一般的数据处理技术不同,数据挖掘针对的是零散的信息——非结构化信息,如网络言论、图片和视频。同时,数据挖掘也继承了传统定量研究方法的优势,可以通过某些值的测量还原社会人的行为。在继承传统的基础上实现了对非结构化信息的处理,数据挖掘是大数据时代的必备工具。

    二、新思维带来的新变革

    (一)“大数据”对电视节目评估的启示

    中国电视市场近年出现的各种问题,电视节目的评估体系一定逃脱不了责任。上世纪90年代初引入中国的收视率评价体系尽管功效显著,但面对二十年间频繁涌现的社会新现象,明显捉襟见肘。

    首先,收视率评估体系存在价值缺陷,不能满足建立文化强国的要求。作为文化商品,电视节目兼有五种价值:播出价值、文化价值、娱乐价值、宣传价值和经济价值。[3]收视率作为一种定量评估方法,只能评估某一电视节目的经济价值,对于其他四种价值,尤其是文化价值的评估无能为力。中共中央第十七届六中全会要求“培养高度的文化自觉和文化自信,提高全民族文明素质,增强国家文化软实力,弘扬中华文化,努力建设社会主义文化强国”。 [4]缺失文化价值的评估,何谈文化价值的建设?

    其次,收视率评估体系存在操作缺陷,不能反映真实的市场情况。收视率评估建立在统计学抽样理论的基础上。抽样的前提是假设样本能够反映全局的情况,这是在“小数据”时代不得已而为之的方法。传统的收视率调查测评布点主要在大中城市,每个城市只有300—500个样本户。且不说这几百个样本数能否反映全局情况,根据统计学原理,样本的研究每深入一步,样本的误差就会明显增加。比如,如果要研究某一城市30岁以下女性电视观众的观看习惯,实际样本数量至少减少一半以上。用一两百个样本研究一座人口几百万甚至上千万的城市的收视状况,无论抽样多么科学,总是难免管中窥豹。

    最后,收视率评估体系存在系统缺陷,不能反映电视节目的网络传播情况。无论是传统的日记卡法还是最先进的测量仪法,收视率只能评估电视节目在有线网络和无线广播网络的收看情况。这种模式在尚未大面积普及互联网的时代是可行的,但是如今网络视频已经将传统电视节目播出市场围得水泄不通,电视节目的传统市场日益萎缩。网络播出渠道的力量已经足以和电视播出渠道相抗衡,如果仅以电视收视率评估某一节目的经济价值,无疑少算了网络传播这一大块。

    大数据提供了弥补了以上三大缺陷的思路:

    首先,大数据跨技术平台的技术优势为研究网络视频观众的收看行为提供了渠道。收视率仅限于对电视观众的研究,而大数据本身就是一个跨平台的技术方案,其分析的数据既可以来源于传统的机顶盒或测量仪,也可以来自网络视频的点击和收看行为。随着电视节目向视频节目转变,将网络播出数据和电视收视数据结合研究成为节目制作业健康发展的必然要求。

    其次,大数据研究全局数据的方法为分析全部(至少是大部分)观众的收看行为提供了支持。在收视率评估时代,之所以采用样本户的方法而不是大规模数据,一方面是出于控制成本的考虑,另一方面是分析大规模数据的方法缺失。与大数据相伴生的数据挖掘作为一种社会研究方法,就是为处理大规模数据而设计的。随着数字电视和网络视频的普及,收集用户收看数据的方式将从“原子”转化为“比特”——从传统的日记卡到用户的收看缓存,收集成本大大降低。

    最后,丰富的数据为研究电视节目的多元价值提供了可能。数据挖掘的源头是海量数据,其结果不仅仅是一个数值,而是一系列对行为的描述——性别、年龄、收入、居住地、学历、工作性质、浏览习惯等等。这种从数值到行为的变化使借助同一种方法分析电视节目的五种价值成为可能。

    (二)大数据对电视节目播出的启示

    大数据时代的电视节目将实现数据化播出。电视节目的播出和消费必须实现数据化,只有数据化,测量才有可能实现。因此,在电视节目制定播出方案时,必须考虑如何使观众消费电视节目的方式可以被低成本地测量。对于互联网平台而言,这不是难事。每一个网民的缓存中都保存了大量的描述性信息,包括粗略的网络位置、观看时间、观看时长、观看时的切换情况等,甚至可以包括网民的消费水平、职业习惯等个人信息。但是,对传统电视而言,目前的测量仪仅能够提供收看数据,难以提供观看者的信息。电视相对于电脑,还是个“家庭媒体”。电视的收视数据仅能代表某一个家庭,还不能代表某一个人或某一类人群。而电脑和手机的使用则呈现明显的私人化倾向。因此,在目前的条件下,鼓励电视节目在网络平台上播出,是获得有效收视数据比较经济的选择。

    电视节目的数据大规模化。仅仅得到数据还不够,数据必须达到一定规模才具有分析的价值。获得大规模的收视数据有两种途径,一是加大电视节目的推广力度,扩大播出范围;二是联合其他电视台,获得同一电视节目或同一类电视节目在多家电视台播出的收视数据。这就要求电视节目制作机构和电视节目播出机构之间打破人为藩篱,共享收视数据。毕竟,每个人的数据都是不完整的,只有把一定规模的数据汇集在一起,数据的价值方能彰显。这仅仅是电视节目的收看数据,与观众收看行为相关的信息还有更多,如节假日安排、宏观经济情况甚至交通拥堵情况。电视机构之间共享数据只是第一步,大数据的最终愿景是建立一套覆盖所有社会数据的平台,不同数据间的关系在这一盘棋中逐渐彰显,新的意义和新的信息逐渐浮现。

    (三)大数据对电视节目制作的启示

    大数据时代的电视节目评估与播出需要在播出领域实现数据化和大规模播出,网络无疑是难得的平台。因此,电视节目从策划伊始就必须考虑网络平台播出的特殊性。可以说,未来的电视节目制作业将转变为视频节目制作业。

    视频节目制作业与电视节目制作业至少存在两点不同。首先,视频节目的网络播出平台优势使节目实时互动成为可能。视频网站的自制剧中有一部分是“互动剧”(如激动网的“互动剧场”),即用户在观看时,每触发一个情节点,都需要通过点击视频播放器内的选项按钮,来选择剧情的走向。其次,网络为网民过滤掉时长较长的节目提供了便利,控制好节目时长是策划网络视频节目的第一步。传统的电视节目也发现了这一点,《非诚勿扰》、《非你莫属》、《谢天谢地你来了》等节目在网络上播出时通常以单个的人物故事出现,而不是整期节目的形式。

    大数据对社会、行业和未来的影响是全面、深远和颠覆性的。没有“大数据”或者不重视“大数据”的电视媒体没有未来。(作者单位:北京大学)

    注释:

    [1]维克托·迈尔—舍恩伯格等著.盛扬燕等译.大数据时代.浙江人民出版社,2013年6月版.

    [2]王光宏,蒋平.数据挖掘综述.同济大学学报(自然科学版),2004—02.

    [3]陆地.电视节目评估体系的创建与创新.南方电视学刊,2013—01.

    [4]中共中央关于深化文化体制改革推动社会主义文化大发展大繁荣若干重大问题的决定,news.xinhuanet.com/politics/2011-10/18/c_111105580.htm.


手机天山网
iPhone客户端

手机天山网
Android客户端

天山网官方微信
(微信扫描关注)
稿源: 视听界 责编: 许释文 收藏此页 打印此页
网友评论 (以下网友留言不代表本网观点)