Przejdź do treści
02_Elements/Icons/ArrowLeft Powrót do Insight
Insights > Audiences

Sztuczna inteligencja jest ogniwem łączącym Big Data i pomiary na poziomie osób

4 minuta czytania | Mainak Mazumdar, Chief Data and Research Officer, Nielsen Global Media | październik 2019 r.

Prawda w pomiarach nigdy nie była tak ważna jak dziś. Dlatego prawda jest naszym jedynym celem. Ale dotarcie do tej prawdy nigdy nie było bardziej skomplikowane. Podczas gdy wielu uważa big data za panaceum na pomiary w cyfrowo bogatym świecie, my wiemy, że to nie jest takie proste.

Panele Nielsena przez dekady były podstawą pomiarów na poziomie osób i tak jest do dziś. Nie można jednak ignorować rozwoju big data jako źródła cennych informacji. Jednak same big data nie nadają się do pomiarów reprezentacyjnych. Pomyśl o tym, kiedy zmieniasz kanał w swoim telewizorze. Ta zmiana staje się częścią big data, ale nie ma zapisu, kto dokonał zmiany lub kto był jej świadkiem.

Aby podkreślić niedociągnięcia big data z perspektywy pomiaru, na początku tego roku przeprowadziliśmy w USA analizę, w której porównaliśmy dane dotyczące set-top boxów z danymi skalibrowanymi przez nas za pomocą danych panelowych Nielsena. Analiza wykazała, że nieskalibrowane dane są z natury stronnicze i niedostatecznie reprezentują mniejszościowe grupy odbiorców.

Nie oznacza to jednak, że big data nie ma wartości. Wręcz przeciwnie. Ale muszą być oparte na podstawowym zestawie prawd. W tym miejscu do gry wchodzą nasze panele i sztuczna inteligencja (AI). Nasze dane panelowe - klucz do pomiarów na poziomie osób - są idealnym zestawem prawdy do szkolenia big data.

Dzięki zastosowaniu AI, wykorzystujemy big data do radykalnego poszerzenia naszych możliwości pomiarowych przy jednoczesnym zachowaniu jakości i reprezentatywności. Obecnie AI jest integralną częścią naszych metodologii pomiarowych. Na przykład, odegrała ona kluczową rolę w rozwoju naszych rozszerzonych możliwości pomiarowych dla lokalnych rynków telewizyjnych, które łączą skalę big data (dane o ścieżkach powrotu {RPD} z odbiorników telewizyjnych) z w pełni reprezentatywnymi danymi panelowymi na rynku.

W miarę jak dążyliśmy do włączenia RPD do naszego lokalnego pomiaru, zidentyfikowaliśmy cztery kluczowe zastosowania AI.

Rozpoznawanie wzorców danych

Badając sposoby włączenia RPD do naszych pomiarów, zidentyfikowaliśmy ograniczenia związane z RPD poprzez to, co nazywamy "analizami wspólnych domów". W tych analizach, które trwają do dziś, porównujemy dane dotyczące strojenia z mierników Nielsena z danymi dotyczącymi strojenia RPD. Analizy te obejmują ponad 5 tys. domów (12 tys. telewizorów) każdego miesiąca i wykazały, że RPD pomija niektóre strojenia.

Aby rozwiązać ten problem, opracowaliśmy zgłoszoną do opatentowania technikę, która wykorzystuje klasyfikatory do rozpoznawania wzorców związanych z brakiem dostrojenia w domach RPD. Następnie algorytmy AI usuwają te domy z użycia w pomiarach.

Wiedza o tym, kiedy Set-Top Boxy są włączone, a telewizory wyłączone

W analizach Nielsena dotyczących domu powszechnego analizuje się ponad 77 milionów minut strojenia w danym miesiącu, co daje potężny wgląd w sytuację. To strojenie jednak nie zawsze jest dokładne. Na przykład ludzie nie zawsze wyłączają swoje dekodery, gdy wyłączają telewizory. RPD przedstawia te sytuacje jako oglądanie telewizji, nawet jeśli nikt nie ogląda.

Możemy przezwyciężyć to ograniczenie poprzez zastosowanie klasyfikatorów głębokiego uczenia do identyfikacji sytuacji, w których dekoder jest włączony, podczas gdy telewizor jest wyłączony. Algorytm następnie usuwa nieprawidłowe strojenie z RPD.

Identyfikacja charakterystyki gospodarstwa domowego i informacji demograficznych z RPD

RPD jest bezimienny i bez twarzy, nie może też dostarczyć informacji demograficznych. Informacje demograficzne są kluczowe dla prawidłowego reprezentowania wszystkich segmentów populacji. A poza tym dokładny pomiar oznacza możliwość zmierzenia ludzi, a nie tylko gospodarstw domowych.

Aby uwolnić potężne informacje zawarte w domach RPD, kalibrujemy RPD za pomocą znanych cech, danych demograficznych i informacji o strojeniu z ponad 45 000 domów mierzonych przez Nielsena oraz cech i danych demograficznych przypisanych przez strony trzecie. Następnie dodajemy te dane wejściowe do oczekującej na opatentowanie rekurencyjnej sieci neuronowej i techniki programowania mieszanych liczb całkowitych, która dokładnie identyfikuje cechy i dane demograficzne domów objętych RPD. Ten algorytm AI pozwala nam na dokładne raportowanie cech demograficznych osób i gospodarstw domowych. 

Określanie lokalizacji pomieszczenia Set-Top-Box

Informacje z panelu Nielsena dostarczają informacji o widzach i miejscu oglądania. RPD nie dostarcza ani jednego, ani drugiego. Możemy jednak uzyskać te informacje od RPD poprzez AI. Używamy naukowo sprawdzonej metodologii, aby zidentyfikować, który członek gospodarstwa domowego ogląda i gdzie w domu odbywa się oglądanie.

Badania wykazały, że lokalizacja w pomieszczeniu jest jednym z kluczowych predyktorów tego, którzy członkowie gospodarstwa domowego należą do widowni. Używamy więc klasyfikatora, aby zidentyfikować położenie dekodera w pomieszczeniu, w którym odbywa się strojenie w domach RPD. W ten sposób możemy wykorzystać tę zmienną w procesie przypisywania widzów.

Przy tak dużej ilości dostępnych dziś informacji, kuszące jest postrzeganie big data przez różowe okulary. Jednak bez powiązania z osobami, big data jest daleka od dokładności. Odkryliśmy AI jako potężny sposób na rozwiązanie problemu stronniczości w big data i z radością wprowadziliśmy tę innowację do klientów. Ta innowacja korzysta zarówno z bogactwa informacji, które dostarczają źródła big data, jak i z zestawu prawdy, który zapewnia, że mogą planować, aktywować i mierzyć w oparciu o dane, które są reprezentatywne i dokładne.

Ten artykuł po raz pierwszy pojawił się na Medium.

Kontynuuj przeglądanie podobnych spostrzeżeń