Przejdź do treści
Spostrzeżenia > Media

Return To Sender: Jak same Big Data mogą być stronnicze i niereprezentatywne

6 minut czytania | marzec 2019 r.

W dobie fragmentacji urządzeń i widowni, jasne jest, że każdy widz jest potencjalnym konsumentem ważnym, nawet jeśli personalizacja ich konsumpcji treści, jak i samych treści, jest znacznie bardziej granularna.

Możliwość dokonywania pomiarów w sposób, który uczciwie reprezentuje wszystkie rasy, wiek, grupy etniczne i zachowania jest kluczowa dla branży, aby dokonywać transakcji z zaufaniem. Jest to również jedyny sposób, aby upewnić się, że wybór treści odzwierciedla różnorodność społeczności danej stacji.

Niezależnie od tego, czy chodzi o programistów poszukujących informacji na temat składu ich prawdziwej widowni, aby podejmować decyzje dotyczące harmonogramu, reklamodawców pragnących dotrzeć do konkretnych segmentów z precyzyjnie określonymi komunikatami, czy właścicieli mediów podejmujących większe wysiłki na rzecz integracji na ekranie poprzez dokonywanie obsady z myślą o różnorodności, wszyscy operatorzy w branży mają biznesowy imperatyw, aby wiedzieć, jaki jest prawdziwy skład widowni. Dlatego tak ważne jest, aby wszelkie dane pomiarowe, na których się opierają, były w pełni reprezentatywne dla bogatej pastiszu populacji Stanów Zjednoczonych. Żadna grupa lub grupy nie powinny być świadomie lub nieświadomie wykluczane lub niedoreprezentowane.

Krótko mówiąc, nie ma już czegoś takiego jak "niszowi" widzowie lub sieci, a żadna publiczność nie powinna być pozostawiona w tyle z powodu procesów pomiarowych, które nie uwzględniają ich lub, co gorsza, nawet nie biorą ich pod uwagę. Jeśli chodzi o pomiary, integracja jest koniecznością, a nie opcją.

I choć big data ma wiele zalet, to ma również wady, jeśli firmy nie traktują jej w sposób odpowiedzialny. Kluczowe jest podejście, które wykorzystuje zalety tych danych, takie jak zapewnienie stabilności pomiaru w środowisku o dużej fragmentacji widowni, z prawdziwym pomiarem na poziomie osób. Mówiąc wprost, big data jako samodzielny zasób nie nadaje się do pełnego zrozumienia dynamiki widowni.

Ostatnia analiza Nielsen spojrzał na to, jak big data, zbudowany bez reprezentacji w umyśle, może zaciemnić to, co te prawdziwe publiczności są ze względu na nieodłączne stronniczości, jak dane zawarte, takie jak ludzie BEZ dekoderów, ludzie, którzy wykorzystują over-the-air (OTA) sygnały i strumień over-the-top (OTT) treści do oglądania programów telewizyjnych premium.

W szczególności, analiza miała na celu zrozumienie różnic w pomiarach widowni pomiędzy danymi o ścieżce zwrotnej (RPD) - domami, które posiadają dekodery zdolne do zwracania danych - a domami z danymi o widzach, które zostały skalibrowane na podstawie panelu widzów Nielsena. Analiza wykazała, że nieskalibrowane dane RPD, które wykorzystują wątpliwą metodologię ważenia, nie uwzględniają mniejszościowych odbiorców i są z natury stronnicze. Porównywanie ich do danych "spisu powszechnego" jest metodologicznym skokiem wiary.

W końcu Amerykanie nie podchodzą już tak samo do swoich potrzeb związanych z programami wideo. Niektórzy nie mają dochodów, które mogliby przeznaczyć na wysokiej jakości treści rozrywkowe; inni wybierają programy OTA w świetle ulepszonej technologii cyfrowej. Powszechny postęp technologiczny przyczynił się również do stałego wzrostu liczby domów korzystających wyłącznie z telewizji szerokopasmowej (BBO). Połączenie domów OTA i BBO wzrosło w USA z 15 milionów domów w 2014 roku do prawie 28 milionów domów w 2018 roku. Jeśli weźmiemy pod uwagę, że 41% konsumentów w tych 28 milionach domów jest wielokulturowych (Latynosów, Afroamerykanów lub Azjatów), a 10% to młodsza grupa demograficzna (18-24), jasne jest, że próba RPD znacznie niedostatecznie reprezentowałaby tych odbiorców i przekłamywałaby całkowity pomiar widowni.

Same dane o domach wyposażonych w RPD konsekwentnie zaniżają liczbę domów Latynosów i Afroamerykanów w porównaniu z innymi typami gospodarstw domowych. W porównaniu z oficjalnymi szacunkami amerykańskiego spisu powszechnego i reprezentatywnym panelem krajowym Nielsena, domy, w których zastosowano RPD są niedostatecznie reprezentowane przez Latynosów o 33%, Latynosów posługujących się językiem hiszpańskim o 49%, a Afroamerykanów o 34%. Gdy porównamy domy z pomiarem RPD z domami OTA/BBO, dysproporcja w reprezentacji jest jeszcze większa. Pomiar RPD-capable zaniża reprezentację Latynosów o 50%, Latynosów z dominacją języka hiszpańskiego o 68%, a Afroamerykanów o 38%. Samo ważenie nie rozwiązuje tego problemu, a fakt, że liczone są miliony domów z RPD nie ma znaczenia. Duża nieobiektywna próba jest nadal nieobiektywna.

I nie jest to tylko wielokulturowa publiczność, którą te źródła przekłamują.

Z perspektywy wieku, dane zgodne z RPD niedostatecznie reprezentują młodsze dema, a nadmiernie reprezentują starsze grupy wiekowe. Na przykład konsumenci w wieku 25-34 lat są niedoszacowani o 26%, podczas gdy osoby 50+ są w rzeczywistości nadreprezentowane o 15%. A co z większym kluczowym demem 18-34? Krajowy panel Nielsena i dane ze spisu powszechnego pokazują również, że w ramach telewizyjnych gospodarstw domowych na grudzień 2018 r. jest 69,8 mln dorosłych 18-34. To demo przewodzi rewolucji cord-cuttingu i stanowi największy udział cord-cutters według demo. Ale domy z obsługą RPD są o 17% mniej prawdopodobne, aby dokładnie typować dorosłych 18-34 wtedy reprezentatywny panel.

Przez zaniżanie liczby dorosłych 18-34, marketerzy, właściciele mediów i wszyscy inni mają mniej osób, do których mogą dotrzeć, jeśli polegają wyłącznie na danych RPD. Ważenie dla tego problemu może ukryć nieodłączny problem z danymi RPD, ale nie rozwiąże problemu ani nie odkryje unikalnych zachowań widzów. Domy objęte RPD nie reprezentują oglądalności domów nieobjętych RPD. Sporadyczne ankiety online przeprowadzane co kilka lat, stosowane do złożonych dziennych rekordów oglądalności, to tani i nieostrożny sposób, aby wyglądać, jakby coś zostało poprawione.

Spojrzenie na konsumentów, którzy należą do grupy RPD, grupy nie obsługującej RPD (co oznacza, że ci konsumenci mogą mieć dekoder, który nie zwraca danych) oraz rosnącej grupy OTA/BBO ujawnia wyraźne różnice w ich zachowaniach i stylu życia. Jest to coś, co można uzyskać tylko poprzez bezpośrednią obserwację, bez względu na to, jak bardzo ważone są dane i bez względu na wielkość danych wejściowych big data, czy jest to próba 30 milionów, miliardów lub bilionów.

Co więc oznacza to dla rzeczywistego programowania, które jest zasilane przez wielokulturową publiczność? Oznacza to, że wszystkie źródła muszą być brane pod uwagę, a wszystkie rodzaje publiczności muszą być obserwowane, aby mogły być wliczone i skalibrowane z każdym zestawem big data.

Na przykład, program taki jak Fox's Empire, gdzie skład widowni jest w przeważającej mierze wielokulturowy, analiza wykazała, że ci widzowie byli niczym innym jak "niszą", biorąc pod uwagę historię programu jako programu w pobliżu szczytu rangi. W rzeczywistości zróżnicowani widzowie stanowili 75% Imperium w grudniu 2018 roku i ci widzowie z pewnością pomogli napędzić sukces ratingowy, gdy używali reprezentatywnego panelu.

Jednak z powodu nieodłącznej tendencji do niedostatecznej reprezentacji, ta wielokulturowa publiczność nie została sprawiedliwie odzwierciedlona, co skutkuje znacznym zaniżeniem liczby widzów Empire, gdy patrzymy na ten program przez pryzmat RPD. Różnice są dość duże. Patrząc na ranking wśród widzów w wieku 25-54 lat, Empire zajęło 16 miejsce w reprezentatywnym panelu Nielsena, ale spadło na 38 miejsce w domach RPD. Z drugiej strony, Empire zajęło trzecie miejsce wśród domów OTA, co nie jest zaskakujące, ponieważ domy te są bardziej zróżnicowane, ale pokazuje krytyczną naturę włączenia tych domów i dokładnego pomiaru ich zachowania w każdej próbie.

W końcu znalezienie podejścia, które opiera się na czymkolwiek innym niż pełny, dokładny i integracyjny pomiar oraz fundamentalne elementy i podstawowa zasada integracji mogą zostać naruszone. Odliczanie tych "niszowych" widzów i ich zachowań z definicji może mieć daleko idące implikacje, które mogą zdestabilizować rynek - i marketerów - poprzez błędne informacje, a być może nawet cofnąć integrację na ekranie.

pl