Passa al contenuto
Approfondimenti > Media

Ritorno al mittente: Come i Big Data da soli possono essere distorti e poco rappresentativi

6 minuti di lettura | Marzo 2019

In un'epoca di frammentazione dei dispositivi e del pubblico, è chiaro che ogni spettatore è un potenziale consumatore importante, anche se la personalizzazione del consumo di contenuti, così come i contenuti stessi, è molto più granulare.

La capacità di misurare in modo da rappresentare equamente tutte le razze, le età, le etnie e i comportamenti è fondamentale perché il settore possa operare con fiducia. È anche l'unico modo per assicurarsi che le scelte dei contenuti riflettano la diversità della comunità di una determinata emittente.

Che si tratti di programmatori che cercano di scoprire la composizione della vera diversità del loro pubblico per prendere decisioni di programmazione, di inserzionisti che cercano di raggiungere segmenti specifici con messaggi mirati o di proprietari di media che si impegnano maggiormente per l'inclusione sullo schermo effettuando il casting tenendo conto della diversità, tutti gli operatori del settore hanno l'imperativo commerciale di conoscere la vera composizione del pubblico. Per questo motivo è essenziale che qualsiasi dato di misurazione su cui si basano sia pienamente rappresentativo della ricca varietà della popolazione statunitense. Nessun gruppo o gruppi dovrebbero essere consapevolmente o inconsapevolmente esclusi o sottorappresentati.

In breve, non esistono più spettatori o reti "di nicchia" e nessun pubblico dovrebbe essere lasciato indietro a causa di processi di misurazione che non ne tengono conto o, peggio, non lo considerano nemmeno. Quando si parla di misurazione, l'inclusività è un imperativo e non un'opzione.

Se da un lato i big data offrono molti vantaggi, dall'altro presentano anche degli svantaggi se le aziende non li trattano in modo responsabile. È fondamentale un approccio che sfrutti i punti di forza di questi dati, come la stabilità della misurazione in un ambiente di visione altamente frammentato, con una vera misurazione a livello di persona. In poche parole, i big data come risorsa a sé stante non sono adatti a comprendere appieno le dinamiche dell'audience.

Una recente analisi di Nielsen ha esaminato come i big data, costruiti senza tener conto della rappresentazione, possano oscurare il vero pubblico a causa di pregiudizi intrinseci, in quanto i dati includono persone SENZA set top box, persone che sfruttano i segnali over-the-air (OTA) e lo streaming di contenuti over-the-top (OTT) per guardare la programmazione televisiva premium.

In particolare, l'analisi ha cercato di capire le differenze di misurazione dell'audience tra i dati del percorso di ritorno (RPD) - le case che hanno set top box in grado di restituire i dati - e le case con i dati dei telespettatori che sono stati calibrati sulla base del panel di telespettatori Nielsen. L'analisi ha rilevato che i dati RPD non calibrati, che utilizzano metodologie di ponderazione dubbie, sottovalutano il pubblico delle minoranze e sono intrinsecamente parziali. Paragonarli ai dati del "censimento" è un atto di fede metodologica.

Dopo tutto, gli americani non hanno più lo stesso approccio alle loro esigenze di programmazione video. Alcuni non hanno il reddito necessario per acquistare contenuti di intrattenimento di qualità superiore, altri optano per la programmazione OTA alla luce del miglioramento della tecnologia digitale. I diffusi progressi tecnologici hanno alimentato una crescita costante delle case a banda larga (BBO). La combinazione di case OTA e BBO è cresciuta negli Stati Uniti da 15 milioni di case nel 2014 a quasi 28 milioni di case nel 2018. Se si considera che il 41% dei consumatori di questi 28 milioni di case è multiculturale (ispanico, afroamericano o asiatico) e che il 10% è costituito da giovani (18-24), è chiaro che un campione RPD sottorappresenterebbe in modo significativo questi pubblici e falserebbe la misurazione dell'audience totale.

I dati relativi alla capacità di RPD da soli rappresentano in modo consistente le case degli ispanici e degli afroamericani rispetto ad altre tipologie di famiglie. Rispetto alle stime ufficiali del censimento degli Stati Uniti e al panel nazionale rappresentativo di Nielsen, le case con capacità RPD sottorappresentano gli ispanici del 33%, gli ispanici con lingua spagnola del 49% e gli afroamericani del 34%. Se si confrontano le case con capacità RPD con quelle OTA/BBO, la disparità di rappresentazione è ancora maggiore. La misurazione con capacità RPD sottorappresenta gli ispanici del 50%, gli ispanici di lingua spagnola del 68% e gli afroamericani del 38%. La ponderazione da sola non risolve il problema, e il fatto che vengano contate milioni di case RPD non ha importanza. Un campione ampio e distorto è sempre distorto.

E non è solo il pubblico multiculturale ad essere influenzato da queste fonti.

Dal punto di vista dell'età, i dati che consentono l'RPD sotto-rappresentano i gruppi demografici più giovani e sovra-rappresentano i gruppi di età più avanzata. Ad esempio, i consumatori tra i 25 e i 34 anni sono sottovalutati del 26%, mentre gli over 50 sono sovrarappresentati del 15%. E per quanto riguarda la più ampia fascia demografica 18-34? Il panel nazionale di Nielsen e i dati del censimento mostrano anche che ci sono 69,8 milioni di adulti 18-34 nelle famiglie televisive a dicembre 2018. Questo gruppo di persone sta guidando la rivoluzione del cord-cutting e rappresenta la quota maggiore dei cord-cutters per categoria. Ma le case dotate di RPD hanno il 17% in meno di probabilità di caratterizzare accuratamente gli adulti 18-34 rispetto a un panel rappresentativo.

Sottostimando gli adulti 18-34, i marketer, i proprietari di media e tutti gli altri hanno meno persone da raggiungere se si affidano esclusivamente ai dati RPD. La ponderazione di questo problema può nascondere il problema intrinseco dei dati RPD, ma non risolverà il problema né scoprirà i comportamenti di visione unici di questo pubblico. Le case RPD non rappresentano la visione delle case non RPD. I sondaggi online occasionali condotti ogni paio d'anni e applicati a registrazioni giornaliere complesse sono un modo economico e poco accorto per far credere che qualcosa sia stato corretto.

Uno sguardo ai consumatori che appartengono al gruppo RPD, al gruppo non RPD-capable (che potrebbe avere un set-top box che non restituisce i dati) e al crescente gruppo OTA/BBO rivela differenze marcate nei loro comportamenti e stili di vita. Si tratta di un dato che può essere colto solo attraverso l'osservazione diretta, indipendentemente dalla ponderazione effettuata e dalle dimensioni dei big data in ingresso, che si tratti di un campione di 30 milioni, miliardi o trilioni.

Quindi, cosa significa questo per la programmazione effettiva alimentata da un pubblico multiculturale? Significa che è necessario prendere in considerazione tutte le fonti e osservare tutti i tipi di pubblico per poterli considerare e calibrare con qualsiasi set di big data.

Ad esempio, per uno show come Empire di Fox , in cui la composizione del pubblico è prevalentemente multiculturale, l'analisi ha rilevato che questo pubblico era tutt'altro che "di nicchia", considerando la storia dello show come programma vicino ai vertici della classifica. Infatti, il pubblico eterogeneo ha rappresentato il 75% di Empire nel dicembre 2018 e questo pubblico ha certamente contribuito al successo degli ascolti quando si utilizza un panel rappresentativo.

Ma a causa del suo pregiudizio intrinseco di sottorappresentazione, questi pubblici multiculturali non sono stati rispecchiati in modo equo, con il risultato di una significativa sottovalutazione del pubblico di Empire quando si guarda a questo spettacolo attraverso la lente della RPD. Le differenze sono notevoli. Considerando la classifica degli spettatori tra i 25 e i 54 anni, Empire si è classificato al 16° posto utilizzando il panel rappresentativo di Nielsen, ma è sceso al 38° posto nelle case RPD. Al contrario, Empire si è classificato al terzo posto tra le case OTA, il che, pur non sorprendendo perché queste case sono più diversificate, dimostra la natura critica di includere effettivamente queste case e di misurare accuratamente il loro comportamento in qualsiasi campione.

Alla fine, un approccio che si basi su qualcosa che non sia una misurazione completa, accurata e inclusiva potrebbe compromettere gli elementi fondamentali e il principio di base dell'inclusione. Escludere per definizione questi spettatori "di nicchia" e i loro comportamenti può avere implicazioni di vasta portata che potrebbero destabilizzare il mercato - e gli operatori di marketing - con informazioni errate e forse anche far regredire l'inclusione sullo schermo.