Return To Sender: Jak same duże zbiory danych mogą być stronnicze i niereprezentatywne

W dobie rozdrobnienia urządzeń i odbiorców jasne jest, że każdy widz jest potencjalnie ważnym konsumentem, nawet jeśli personalizacja jego konsumpcji treści, a także samej treści, jest znacznie bardziej szczegółowa.

Możliwość pomiaru w sposób, który uczciwie reprezentuje wszystkie rasy, wiek, pochodzenie etniczne i zachowania, ma kluczowe znaczenie dla branży, aby móc dokonywać transakcji z zaufaniem. Jest to również jedyny sposób, aby upewnić się, że wybór treści odzwierciedla różnorodność społeczności danej stacji.

Niezależnie od tego, czy chodzi o programistów, którzy chcą odkryć skład swojej prawdziwej różnorodności odbiorców, aby podejmować decyzje dotyczące planowania, reklamodawców, którzy chcą dotrzeć do określonych segmentów za pomocą precyzyjnych komunikatów, czy też właścicieli mediów, którzy dokładają większych starań na rzecz integracji na ekranie poprzez casting z myślą o różnorodności, wszyscy operatorzy w branży mają imperatyw biznesowy, aby wiedzieć, jaki jest prawdziwy skład odbiorców. Dlatego tak ważne jest, aby wszelkie dane pomiarowe, na których polegają, były w pełni reprezentatywne dla bogatego pastiszu populacji USA. Żadna grupa lub grupy nie powinny być świadomie lub nieświadomie wykluczone lub niedostatecznie reprezentowane.

Krótko mówiąc, nie ma już czegoś takiego jak "niszowi" widzowie lub sieci i żadna publiczność nie powinna być pomijana z powodu procesów pomiarowych, które ich nie uwzględniają lub, co gorsza, nawet ich nie biorą pod uwagę. Jeśli chodzi o pomiary, inkluzywność jest koniecznością, a nie opcją.

I choć duże zbiory danych niosą ze sobą wiele korzyści, mają one również swoje wady, jeśli firmy nie traktują ich w sposób odpowiedzialny. Kluczowe znaczenie ma podejście, które wykorzystuje siłę, jaką te dane mają do zaoferowania, takie jak zapewnienie stabilności pomiaru w środowisku o dużym rozdrobnieniu oglądalności, z prawdziwym pomiarem na poziomie osób. Mówiąc najprościej, duże zbiory danych jako samodzielny zasób nie nadają się do pełnego zrozumienia dynamiki odbiorców.

Niedawna analiza Nielsena dotyczyła tego, w jaki sposób duże zbiory danych, tworzone bez uwzględnienia reprezentacji, mogą zaciemniać prawdziwą widownię z powodu nieodłącznej stronniczości, ponieważ dane obejmowały osoby BEZ dekoderów, osoby, które wykorzystują sygnały over-the-air (OTA) i strumieniują treści over-the-top (OTT) do oglądania programów telewizyjnych premium.

W szczególności analiza miała na celu zrozumienie różnic w pomiarach oglądalności między danymi o ścieżce powrotu (RPD) - domami, które mają dekodery zdolne do zwracania danych - a domami z danymi widzów, które zostały skalibrowane w oparciu o panel widzów Nielsena. Analiza wykazała, że nieskalibrowane dane RPD, które wykorzystują wątpliwe metodologie ważenia, zaniżają liczbę odbiorców mniejszościowych i są z natury stronnicze. Przyrównywanie ich do danych "spisu powszechnego" jest metodologicznym skokiem wiary.

W końcu Amerykanie nie podchodzą już do swoich potrzeb związanych z programowaniem wideo w ten sam sposób. Niektórzy nie mają dochodów, które mogliby wydać na treści rozrywkowe premium; inni wybierają programy OTA w świetle ulepszonej technologii cyfrowej. Powszechny postęp technologiczny napędza również stały wzrost liczby domów z dostępem wyłącznie do szerokopasmowego Internetu (BBO). Połączenie domów OTA i BBO wzrosło w Stanach Zjednoczonych z 15 milionów domów w 2014 roku do prawie 28 milionów domów w 2018 roku. Biorąc pod uwagę, że 41% konsumentów w tych 28 milionach domów jest wielokulturowych (Latynosi, Afroamerykanie lub Azjaci), a 10% to młodsza grupa demograficzna (18-24 lata), jasne jest, że próba RPD znacznie niedostatecznie reprezentowałaby tych odbiorców i wypaczyłaby całkowity pomiar oglądalności.

Same dane obsługujące RPD konsekwentnie niedostatecznie reprezentują domy Latynosów i Afroamerykanów w porównaniu z innymi typami gospodarstw domowych. W porównaniu z oficjalnymi szacunkami spisu ludności USA i reprezentatywnym panelem krajowym Nielsena, domy z obsługą RPD są niedostatecznie reprezentowane przez Latynosów o 33%, Latynosów z dominującym językiem hiszpańskim o 49% i Afroamerykanów o 34%. Porównując domy obsługujące RPD z domami OTA/BBO, różnica w reprezentacji jest jeszcze większa. Pomiary z obsługą RPD niedostatecznie reprezentują Latynosów o 50%, Latynosów z dominującym językiem hiszpańskim o 68% i Afroamerykanów o 38%. Samo ważenie nie rozwiązuje tego problemu, a fakt, że liczone są miliony domów RPD nie ma znaczenia. Duża tendencyjna próba nadal jest tendencyjna.

I nie chodzi tylko o odbiorców wielokulturowych, których te źródła wypaczają.

Z perspektywy wieku dane obsługujące RPD niedostatecznie reprezentują młodsze grupy demograficzne i nadreprezentują starsze grupy wiekowe. Na przykład konsumenci w wieku 25-34 lat są niedoszacowani o 26%, podczas gdy osoby w wieku 50+ są w rzeczywistości nadreprezentowane o 15%. A co z większą kluczową grupą demograficzną 18-34? Krajowy panel Nielsena i dane spisu powszechnego pokazują również, że w grudniu 2018 r. w telewizyjnych gospodarstwach domowych było 69,8 mln dorosłych w wieku 18-34 lat. Ta grupa demograficzna przewodzi rewolucji cord-cuttingu i stanowi największy odsetek osób przecinających przewody w podziale na grupy demograficzne. Domy obsługujące RPD mają jednak o 17% mniejsze prawdopodobieństwo dokładnego scharakteryzowania dorosłych w wieku 18-34 lat niż reprezentatywny panel.

Zbyt mała liczba dorosłych w wieku 18-34 lat sprawia, że marketerzy, właściciele mediów i wszyscy inni mają mniej osób, do których mogą dotrzeć, jeśli polegają wyłącznie na danych RPD. Ważenie tej kwestii może ukryć nieodłączny problem z danymi RPD, ale nie rozwiąże problemu ani nie odkryje unikalnych zachowań oglądających tych odbiorców. Domy RPD nie reprezentują oglądalności domów innych niż RPD. Sporadyczne ankiety online przeprowadzane co kilka lat, stosowane do złożonych dziennych rekordów oglądalności, to tani i nieostrożny sposób, aby wyglądać, jakby coś zostało poprawione.

Spojrzenie na konsumentów należących do grupy RPD, grupy nieobsługującej RPD (co oznacza, że konsumenci ci mogą mieć dekoder, który nie zwraca danych z powrotem) oraz rosnącej grupy OTA/BBO ujawnia wyraźne różnice w ich zachowaniach i stylu życia. Jest to coś, co można uzyskać tylko poprzez bezpośrednią obserwację, bez względu na to, jak duże są wagi i bez względu na wielkość danych wejściowych big data, niezależnie od tego, czy jest to próba 30 milionów, miliardów czy bilionów.

Co to oznacza dla rzeczywistego programowania, które jest zasilane przez wielokulturową publiczność? Oznacza to, że należy wziąć pod uwagę wszystkie źródła i obserwować wszystkie typy odbiorców, aby móc je uwzględnić i skalibrować z dowolnym dużym zestawem danych.

Na przykład w przypadku programu takiego jak Fox's Empire, w którym skład widowni jest w przeważającej mierze wielokulturowy, analiza wykazała, że widzowie ci nie byli "niszowi", biorąc pod uwagę historię programu jako programu znajdującego się w czołówce rankingów. W rzeczywistości zróżnicowana widownia stanowiła 75% widowni Empire w grudniu 2018 r., A ta widownia z pewnością pomogła w osiągnięciu sukcesu w rankingach przy użyciu reprezentatywnego panelu.

Jednak ze względu na nieodłączną tendencyjność polegającą na niedostatecznej reprezentacji, ta wielokulturowa publiczność nie została sprawiedliwie odzwierciedlona, co skutkuje znacznym zaniżeniem liczby widzów Empire, patrząc na ten program przez pryzmat RPD. Różnice są dość duże. Patrząc na ranking wśród widzów w wieku 25-54 lat, Empire zajął 16. miejsce przy użyciu reprezentatywnego panelu Nielsena, ale spadł do 38 w domach RPD. I odwrotnie, Empire zajął trzecie miejsce wśród domów OTA, co, choć nie jest zaskakujące, ponieważ te domy są bardziej zróżnicowane, pokazuje krytyczny charakter faktycznego uwzględnienia tych domów i dokładnego pomiaru ich zachowania w dowolnej próbie.

W końcu znalezienie podejścia, które opiera się na czymkolwiek, co jest mniej niż pełnym, dokładnym i inkluzywnym pomiarem, a także podstawowymi elementami i podstawową zasadą włączenia, może zostać zagrożone. Odliczanie tych "niszowych" widzów i ich zachowań z definicji może mieć daleko idące konsekwencje, które mogą zdestabilizować rynek - i marketerów - za pomocą dezinformacji, a być może nawet cofnąć integrację na ekranie.

Return To Sender: Jak same duże zbiory danych mogą być stronnicze i niereprezentatywne

Kontynuuj przeglądanie podobnych spostrzeżeń

Wpływ sztucznej inteligencji na pomiary

The Record: Trendy słuchalności audio w USA w czwartym kwartale

77. rozdanie nagród Primetime Emmy: Najchętniej oglądane tytuły i gwiazdy

Nasze produkty mogą pomóc Tobie i Twojej firmie

Brand Lift

Międzynarodowa telewizja linearna

Krajowe i lokalne pomiary telewizyjne w USA

Znajdź odpowiednie rozwiązanie dla swojej firmy

Jak możemy pomóc?