跳转到内容
洞察力>媒体

退回给发件人。单纯的大数据如何会有偏见和不具代表性

6分钟阅读|2019年3月

在设备和受众碎片化的今天,很明显,每个观众都是潜在的重要消费者,即使他们的内容消费的个性化,以及内容本身,都要细化很多。

能够以公平地代表所有 种族、年龄、民族和行为的方式进行衡量,对于该行业的信心交易至关重要。这也是确保内容选择反映特定电视台社区的多样性的唯一方法。

不管是节目制作者寻求发现他们真正的受众多样性的构成,以做出调度决策,还是广告商希望通过精确的信息接触到特定的细分市场,或者媒体所有者通过考虑到多样性的选角为屏幕上的包容性做出更多的努力,行业中的所有运营商都有必要了解真正的受众构成是什么。这就是为什么他们所依赖的任何测量洞察力都必须充分代表美国人口的丰富类型。任何群体都不应被有意或无意地排除在外或代表不足。

简而言之,不再有 "小众 "观众或网络的说法,没有观众应该因为测量过程没有考虑到他们,甚至更糟糕的是没有考虑到他们而被遗弃。当涉及到测量时,包容性是一个必要条件,而不是一个选项。

虽然大数据有很多好处,但如果公司不负责任地对待它,也会有坏处。利用这些数据所提供的优势的方法,例如在一个高度分散的观看环境中提供测量的稳定性,以及真正的个人层面的测量是至关重要的。简单地说,大数据作为一种独立的资源,不适合充分了解受众的动态。

尼尔森最近的一项分析研究了大数据是如何在不考虑代表性的情况下建立的,它可能因为固有的偏见而掩盖了这些真正的观众,因为数据包括了没有机顶盒的人,利用 空中(OTA)信号和流媒体(OTT)内容来观看优质电视节目的人。

具体而言,该分析试图了解返回路径数据(RPD)--拥有能够返回数据的机顶盒的家庭--与拥有根据尼尔森观众小组校准的观众数据的家庭之间的观众测量差异。分析发现,未经校准的RPD数据采用了可疑的加权方法,对少数族裔观众的计算不足,而且有内在的偏见。将其与 "人口普查 "数据相提并论是一种方法论上的飞跃。

毕竟,美国人不再以同样的方式对待他们的视频节目需求。一些人没有收入来购买高级娱乐内容;另一些人鉴于数字技术的改进,选择了OTA节目。广泛的技术进步也推动了纯宽带(BBO)家庭的稳定增长。在美国,OTA和BBO家庭的组合已经从2014年的1500万家庭膨胀到2018年的近2800万家庭。当你考虑到这2800万个家庭中41%的消费者是多元文化(西班牙裔、非裔或亚裔),10%是年轻人口(18-24岁),很明显,RPD样本将大大低估这些受众的代表性,并歪曲总的受众测量。

与其他家庭类型相比,仅有RPD能力的数据始终对西班牙裔和非裔美国人的家庭代表不足。与美国人口普查的官方估计和尼尔森具有代表性的国家小组相比,具有RPD功能的家庭对西班牙裔的代表性不足33%,以西班牙语为主的西班牙裔不足49%,非裔美国人不足34%。当你将具有RPD能力的家庭与OTA/BBO家庭进行比较时,代表性的差距甚至更大。具有RPD能力的测量结果对西班牙裔的代表性不足50%,对以西班牙语为主的西班牙裔的代表性不足68%,对非洲裔的代表性不足38%。仅仅加权并不能解决这个问题,数以百万计的RPD家庭被计算在内的事实并不重要。一个有偏见的大样本仍然是有偏见的。

而且,这些消息来源所倾斜的不仅仅是多元文化受众。

从年龄的角度来看,具有RPD功能的数据对年轻人口的代表不足,而对老年群体的代表过多。例如,25-34岁的消费者被低估了26%,而50岁以上的人实际上被过度代表了15%。那么,18-34岁这一更大的关键人群呢?尼尔森的国家小组和人口普查数据还显示,截至2018年12月,电视家庭中有6980万18-34岁的成年人。这个演示正在引领断线革命,并在演示中占断线者的最大份额。但是,具有RPD功能的家庭准确描述18-34岁成年人的可能性比具有代表性的小组低17%。

由于对18-34岁的成年人计算不足,营销人员、媒体所有者和两者之间的所有人,如果仅仅依靠RPD数据,可以接触到的人就会减少。为这个问题加权可能会掩盖RPD数据的固有问题,但它不会解决这个问题,也不会发现这些受众的独特观看行为。RPD家庭并不代表非RPD家庭的观看情况。每隔几年偶尔做一次在线调查,应用于复杂的日常收视记录,是一种廉价和粗心的方式,看起来好像已经纠正了什么。

对属于RPD群体的消费者、不具备RPD能力的群体(意味着这些消费者可能有一个不返回数据的机顶盒)和不断增长的OTA/BBO群体进行研究,发现他们的行为和生活方式有明显的差异。这是只有通过直接观察才能收集到的东西,不管做了多少加权,也不管大数据输入的规模如何,不管是3000万、10亿还是万亿的样本。

那么,这对由多元文化受众提供的实际节目意味着什么?这意味着需要考虑所有的来源,需要观察所有类型的受众,以便计入并与任何大数据集进行校准。

例如,像福克斯的《帝国》 这样的节目,其观众构成主要是多元文化,分析发现,考虑到该节目作为一个接近顶级的节目的历史,这些观众并不 "小众"。事实上,在2018年12月,多元化的观众占了《帝国》 的75%,在使用代表小组时,这些观众肯定有助于推动收视率的成功。

但是,由于其固有的代表性不足的偏见,这些多元文化的观众没有得到公平的反映,导致在通过RPD视角看这个节目时,帝国的观众被严重低估。这些差异是相当大的。从25-54岁观众的排名来看,《帝国》在尼尔森的代表小组中排名第16位,但在RPD家庭中排名下降到38位。相反,《帝国》 在OTA家庭中排名第三,这并不令人惊讶,因为这些家庭更加多样化,这表明在任何样本中实际包括这些家庭并准确测量他们的行为的关键性质。

最后,找到一个依靠任何不全面、不准确、不包容的测量的方法,包容的基本要素和核心原则就会受到损害。把这些 "小众 "观众和他们的行为从定义上算出来,会产生深远的影响,可能会用错误的信息破坏市场和营销人员的稳定,甚至可能使屏幕上的包容性受挫。