文:一树
来源:影艺独舌(ID:yingyidushe)
12月26日,国家广播电视总局在北京举行新闻发布会,宣布国家广播电视总局广播节目收视综合评价大数据系统基本建成,并开通试运行。
这一新的大数据系统,是国家广播电视总局批准,广播电视规划院牵头组织多家广播电视台、网络运营商、科研院所、高校、企业展开自主研发,并由广播电视规划院作为主体承建的。
从2016年开始。在两年多的时间里,这一系统的研发建设经历了多次论证,聚集了行业内外各方专家学者的经验和智慧。通过两年间大小规模的试验,这一新数据系统的科学性、技术的先进性、方案的可行性,都已得到了基本的验证。
依托大数据计算,数据更干净,更精准
在发布会上,广播电视规划院院长余英介绍了大数据系统的基本情况。在收视渠道多元化的今天,余英表示,传统的收视率调查已经无法反映多渠道、多方式的新型用户收看行为。这也是广电总局决心制定新的收视综合评价大数据系统的原因之一。
截至2018年底,收视综合评价大数据系统汇聚了4000万有线电视和IPTV样本用户的收视数据,样本量基本能够代表全国的收视情况。全面涵盖直播、回看、点播等多种收视方式,并会逐步将样本量逐步扩大到数亿级的规模,进一步实现样本全覆盖。
在过去两年中,广电总局规划局带头收集了大量数据,制订了关键指标,并通过实验对数据进行了实验和试算,并将研究成果进行转化成此次投入试运行的新系统,并会进行持续的系统架构优化,并支持对收视数据的二次开发。
担任此次大数据系统的技术顾问的,是广电总局科技委副主任杜百川。他表示,这一系统以大数据技术为核心,利用双向机顶盒,来收集用户的观看数据。存储在机顶盒中的数据,在筛选掉无用数据,以及与用户隐私有关的数据之后,会由机器自动传输到大数据系统之中。
以往的收视率统计,往往因为样本容易受到污染,而导致乱象频生。正如国家统计局社会科技和文化产业统计司司长张仲梁在致辞中所说,过去,人们会为一些节目的收视率是零点几而争论,其实在小样本的统计环境下,收视率的误差远不止零点几。而收视综合评价系统是全样本统计,因此“小”和“偏”的问题都将不复存在。
另外,据杜百川介绍,大数据系统是一个全封闭的自动化流程,人无法接触数据,并且,数据的传输都是通过机器自动完成。此外,由于数据的来源足够广泛,个体样本数据污染对统计结果的影响可忽略不计。
除了让收视统计数据的误差更小,通过基于大量的样本和大数据计算技术,收视综合评价大数据系统能够精准捕捉小众节目、边缘时段的收视特征。在传统的收视率统计方法中,因为样本少,小众节目的观看数据会被过滤掉。而新的大数据系统通过机顶盒观测用户的收视行为,因此可以更客观地反映每一类节目的播出情况。
打破“唯收视论”神话
新系统不仅只看“收视率”
收视率的问题,一向为行业所关心。发布会上,张仲梁也强调了数据的重要性。他指出,数据能驱动时代,也是时代的引领和导向。他表示,新的大数据系统是中国收视率走出利益纠葛,迈向大数据时代的里程碑。
收视数据是广电行业的度量衡,但“唯收视论”却带来了如今的收视乱象。为了克服“唯收视论”的缺点,余英表示,新的系统得出的数据不仅是“收视率”,而是对节目的综合评价。既可以看出节目在观众中的热度,也会对节目从传播力、引导力、影响力、公信力等多维度进行建模分析。
此外,新系统还会引入人工智能自学习的技术,按照专业级和大众级,对数据进行分层的处理和评定,以此构建全方位的节目综合评价模型。
杜百川则介绍,在跨设备、跨平台、跨时空以及跨形态的观看现状下,“收视率”的概念太过简单。越来越多的国家和公司在挖掘非收视率的数据,比如到达率、接触率,以此进一步清楚地了解观众的倾向性,让节目和广告能够进行更精准的投放。
广电总局党组成员、副局长高建民也在发布会上表示,对节目的综合评价应该与节目的数据表现紧密结合。广电总局很快还会出台一系列的操作规范系统,防止收视数据的私下交易和违规使用。
此次,由广电总局带头组建和运营、国家统计局提供指导和支持的收视综合评价大数据系统,既可以看作是未来的“官方收视率”,也是让收视数据成为公共数据的重要一步。正如张仲梁所说,“没有被利益污染的收视率,走出样本偏差,是可信任的。”
杜百川表示,大数据系统里除了能反映整体情况的公共数据,同样也可以计算出传统的数据,比如收视率。此外,就是系统通过大数据计算得出的,更全面的数据。
根据余英介绍,大数据系统得出的相关收视数据将面对节目制作和创作部门发布,意在使节目创作人员得到真实的反馈,提升节目品质。而目前,数据以怎样的形式进行公开发布,如何投入使用,怎样监管等具体实施规范和细节,则还要等待广电总局即将发布的文件才能得知。
今日投入试运行后,未来收视综合评价大数据系统将重点在四个方面进行下一步的开发:首先进一步扩大样本规模;其次,加快建立长效运行机制,严格规范有关的标准建设;形成更丰富的收视指标和模型算法,跨媒介的融合评价方法;最后,在数据的基础上,能够动态地预测节目传播态势,为节目管理和节目传播效果追踪提供支撑。
领取专属 10元无门槛券
私享最新 技术干货