Zum Inhalt
Einblicke > Medien

Zurück an den Absender: Wie Big Data allein verzerrt und nicht repräsentativ sein kann

6 Minuten lesen | März 2019

Im Zeitalter der Geräte- und Publikumsfragmentierung ist es klar, dass jeder Zuschauer ein potenzieller Konsument von Bedeutung ist, auch wenn die Personalisierung des Inhaltskonsums und des Inhalts selbst viel granularer ist.

Eine Messung, die alle Rassen, Altersgruppen, Ethnien und Verhaltensweisen angemessen repräsentiert, ist für die Branche von entscheidender Bedeutung, um mit Zuversicht handeln zu können. Nur so kann sichergestellt werden, dass die Auswahl der Inhalte die Vielfalt der Gemeinschaft eines bestimmten Senders widerspiegelt.

Ob Programmgestalter, die die Zusammensetzung ihrer wahren Zuschauervielfalt aufdecken wollen, um Entscheidungen über die Programmplanung zu treffen, Werbetreibende, die bestimmte Segmente mit gezielten Botschaften erreichen wollen, oder Medieneigentümer, die sich mehr um die Integration auf dem Bildschirm bemühen, indem sie bei der Besetzung auf Vielfalt achten - alle Akteure in der Branche müssen unbedingt wissen, wie die wahre Zusammensetzung des Publikums aussieht. Deshalb ist es von entscheidender Bedeutung, dass alle Messdaten, auf die sie sich stützen, vollständig repräsentativ für die Vielfalt der US-Bevölkerung sind. Keine Gruppe oder Gruppen sollten wissentlich oder unwissentlich ausgeschlossen oder unterrepräsentiert sein.

Kurz gesagt, es gibt keine "Nischen"-Zuschauer oder -Netzwerke mehr, und kein Publikum sollte aufgrund von Messverfahren, die sie nicht berücksichtigen oder, schlimmer noch, sie überhaupt in Betracht ziehen, zurückgelassen werden. Wenn es um die Messung geht, ist Inklusion ein Gebot und keine Option.

Big Data hat zwar viele Vorteile, aber auch Nachteile, wenn die Unternehmen nicht verantwortungsvoll damit umgehen. Ein Ansatz, der die Stärken dieser Daten nutzt, wie z. B. die Stabilität der Messung in einer stark fragmentierten Fernsehumgebung, und der eine echte Messung auf Personenebene ermöglicht, ist entscheidend. Einfach ausgedrückt: Big Data als alleinige Ressource ist ungeeignet, um die Dynamik des Publikums vollständig zu verstehen.

In einer kürzlich von Nielsen durchgeführten Analyse wurde untersucht, wie Big Data, die ohne Berücksichtigung der Repräsentativität erstellt wurden, aufgrund der inhärenten Voreingenommenheit das wahre Publikum verschleiern könnte, da die Daten Personen OHNE Set-Top-Boxen, Personen, die Over-the-Air-Signale (OTA) nutzen und Over-the-Top-Inhalte (OTT) streamen, um Premium-Fernsehprogramme zu sehen, enthalten.

Die Analyse versuchte insbesondere, die Unterschiede in der Zuschauermessung zwischen Return Path Data (RPD) - Haushalte, die über Set-Top-Boxen verfügen, die Daten zurücksenden können - und Haushalte mit Zuschauerdaten, die auf der Grundlage des Nielsen-Zuschauerpanels kalibriert wurden, zu verstehen. Die Analyse ergab, dass unkalibrierte RPD-Daten, die zweifelhafte Gewichtungsmethoden verwenden, Minderheiten untererfassen und von Natur aus verzerrt sind. Sie mit "Volkszählungsdaten" zu vergleichen, ist ein methodischer Vertrauensvorschuss.

Schließlich gehen die Amerikaner nicht mehr auf die gleiche Weise an ihre Videoprogramme heran. Einige haben nicht das nötige Einkommen, um für Premium-Unterhaltungsinhalte auszugeben; andere entscheiden sich angesichts der verbesserten digitalen Technologie für OTA-Programme. Die weit verbreiteten technologischen Fortschritte haben auch zu einem stetigen Wachstum der reinen Breitbandhaushalte (BBO) geführt. Die Kombination aus OTA- und BBO-Haushalten ist in den USA von 15 Millionen Haushalten im Jahr 2014 auf fast 28 Millionen Haushalte im Jahr 2018 angewachsen. Wenn man bedenkt, dass 41 % der Verbraucher in diesen 28 Millionen Haushalten multikulturell sind (entweder hispanisch, afroamerikanisch oder asiatisch) und 10 % einer jüngeren Bevölkerungsgruppe (18-24) angehören, ist klar, dass eine RPD-Stichprobe diese Zielgruppen deutlich unterrepräsentieren und die Messung der Gesamtzielgruppe verzerren würde.

RPD-fähige Daten allein repräsentieren hispanische und afroamerikanische Haushalte im Vergleich zu anderen Haushaltstypen durchweg unterrepräsentiert. Verglichen mit den offiziellen Schätzungen der US-Volkszählung und dem repräsentativen nationalen Nielsen-Panel sind Hispanics in RPD-fähigen Haushalten um 33 %, spanischsprachige Hispanics um 49 % und Afroamerikaner um 34 % unterrepräsentiert. Vergleicht man die RPD-fähigen mit den OTA/BBO-Haushalten, so ist die Diskrepanz noch größer. Bei den RPD-fähigen Messungen sind Hispanics um 50 %, spanischsprachige Hispanics um 68 % und Afroamerikaner um 38 % unterrepräsentiert. Die Gewichtung allein kann dieses Problem nicht lösen, und die Tatsache, dass Millionen von RPD-Haushalten gezählt werden, spielt keine Rolle. Eine große verzerrte Stichprobe ist immer noch verzerrt.

Und es ist nicht nur das multikulturelle Publikum, auf das diese Quellen abzielen.

Was das Alter betrifft, so sind in den RPD-fähigen Daten jüngere Bevölkerungsgruppen unterrepräsentiert und ältere überrepräsentiert. So sind beispielsweise die Verbraucher zwischen 25 und 34 Jahren um 26 % unterrepräsentiert, während Personen über 50 Jahren um 15 % überrepräsentiert sind. Wie sieht es mit der größeren Schlüsselgruppe der 18- bis 34-Jährigen aus? Die nationalen Panel- und Zensusdaten von Nielsen zeigen auch, dass im Dezember 2018 69,8 Millionen Erwachsene zwischen 18 und 34 Jahren in TV-Haushalten leben. Diese Zielgruppe führt die Revolution des Kabelfernsehens an und macht den größten Anteil der Kabelabschneider nach Zielgruppe aus. RPD-fähige Haushalte haben jedoch eine 17 % geringere Wahrscheinlichkeit, Erwachsene 18-34 genau zu typisieren als ein repräsentatives Panel.

Durch die Untererfassung der 18- bis 34-Jährigen haben Vermarkter, Medieneigentümer und alle dazwischen weniger Menschen zu erreichen, wenn sie sich ausschließlich auf RPD-Daten verlassen. Die Gewichtung dieses Problems kann das inhärente Problem der RPD-Daten verbergen, aber sie wird das Problem nicht lösen oder das einzigartige Sehverhalten dieser Zielgruppen aufdecken. RPD-Haushalte repräsentieren nicht die Sehgewohnheiten von Nicht-RPD-Haushalten. Gelegentliche Online-Umfragen, die alle paar Jahre durchgeführt werden und auf komplexe tägliche Zuschauerzahlen angewandt werden, sind eine billige und nachlässige Methode, um den Anschein zu erwecken, dass etwas korrigiert worden ist.

Ein Blick auf die Verbraucher, die zur RPD-Gruppe gehören, eine nicht-RPD-fähige Gruppe (d. h. diese Verbraucher könnten eine Set-Top-Box haben, die keine Daten zurücksendet) und die wachsende OTA/BBO-Gruppe zeigt deutliche Unterschiede in ihrem Verhalten und Lebensstil. Dies lässt sich nur durch direkte Beobachtung feststellen, unabhängig davon, wie stark gewichtet wird und wie groß die Big-Data-Eingaben sind, ob es sich um eine Stichprobe von 30 Millionen, Milliarden oder Billionen handelt.

Was bedeutet das nun für die tatsächliche Programmgestaltung, die von einem multikulturellen Publikum getragen wird? Es bedeutet, dass alle Quellen berücksichtigt und alle Arten von Zuschauern beobachtet werden müssen, um in einem großen Datensatz berücksichtigt und kalibriert zu werden.

Bei einer Sendung wie Empire von Fox , deren Zuschauerschaft überwiegend multikulturell ist, ergab die Analyse, dass dieses Publikum alles andere als eine "Nische" war, wenn man die Geschichte der Sendung als Programm in der Nähe der Spitzengruppe betrachtet. In der Tat machte das multikulturelle Publikum im Dezember 2018 75 % von Empire aus, und diese Zuschauer trugen sicherlich zum Quotenerfolg bei, wenn ein repräsentatives Panel verwendet wurde.

Aber wegen der inhärenten Tendenz zur Unterrepräsentation wurden diese multikulturellen Zuschauer nicht fair wiedergegeben, was zu einer erheblichen Untererfassung des Empire-Publikums führt, wenn man diese Sendung durch die RPD-Linse betrachtet. Die Unterschiede sind recht groß. Betrachtet man die Rangliste der 25-54-jährigen Zuschauer, so landete Empire bei Verwendung des repräsentativen Nielsen-Panels auf Platz 16, fiel aber in RPD-Haushalten auf Platz 38. Umgekehrt belegte Empire bei den OTA-Haushalten den dritten Platz, was zwar nicht überraschend ist, weil diese Haushalte vielfältiger sind, aber zeigt, wie wichtig es ist, diese Haushalte tatsächlich einzubeziehen und ihr Verhalten in jeder Stichprobe genau zu messen.

Letztendlich könnte ein Ansatz, der sich auf etwas stützt, das weniger als eine vollständige, genaue und umfassende Messung ist, die grundlegenden Elemente und das Kernprinzip der Inklusion gefährden. Werden diese "Nischen"-Zuschauer und ihr Verhalten per Definition ausgeklammert, kann dies weitreichende Folgen haben, die den Markt - und die Vermarkter - mit Fehlinformationen destabilisieren und vielleicht sogar die Inklusion auf dem Bildschirm zurückwerfen könnten.