Ir al contenido
Información > Medios de comunicación

Volver al remitente: Cómo los grandes datos por sí solos pueden ser sesgados y poco representativos

Lectura de 6 minutos | Marzo de 2019

En una época de fragmentación de dispositivos y audiencias, está claro que cada espectador es un consumidor potencial de importancia, aunque la personalización de su consumo de contenidos, así como el propio contenido, sea mucho más granular.

Ser capaz de medir de forma que se representen de forma justa todas las razas, edades, etnias y comportamientos es crucial para que el sector pueda operar con confianza. También es la única manera de asegurarse de que las opciones de contenido reflejan la diversidad de la comunidad de una emisora determinada.

Ya sea que los programadores busquen descubrir la composición de la verdadera diversidad de su audiencia para tomar decisiones de programación, que los anunciantes busquen llegar a segmentos específicos con mensajes precisos o que los propietarios de los medios de comunicación se esfuercen más por la inclusión en pantalla haciendo castings teniendo en cuenta la diversidad, todos los operadores de la industria tienen un imperativo comercial para saber cuál es la verdadera composición de la audiencia. Por eso es esencial que cualquier información de medición en la que se basen sea plenamente representativa del rico pastiche de la población estadounidense. Ningún grupo o grupos deben ser excluidos o subrepresentados a sabiendas o sin saberlo.

En resumen, ya no existen los espectadores o las cadenas "de nicho", y ninguna audiencia debe quedar relegada por procesos de medición que no los tengan en cuenta o, peor aún, que ni siquiera los consideren. Cuando se trata de medir, la inclusión es un imperativo y no una opción.

Y aunque el big data tiene muchas ventajas, también tiene inconvenientes si las empresas no lo tratan con responsabilidad. Es fundamental adoptar un enfoque que aproveche la fuerza que ofrecen estos datos, como la estabilidad de la medición en un entorno de visualización muy fragmentado, con una verdadera medición a nivel de personas. Sencillamente, el big data como recurso independiente no es apto para comprender plenamente la dinámica de la audiencia.

Un reciente análisis de Nielsen analizaba cómo los big data, construidos sin representación en mente, podrían oscurecer lo que son esas verdaderas audiencias debido a un sesgo inherente, ya que los datos incluían, por ejemplo, a personas SIN descodificadores, a personas que aprovechan las señales por aire (OTA) y que transmiten contenidos over-the-top (OTT) para ver la programación televisiva premium.

En concreto, el análisis pretendía comprender las diferencias de medición de la audiencia entre los datos de la ruta de retorno (RPD) -hogares que tienen decodificadores capaces de devolver datos- y los hogares con datos de espectadores que han sido calibrados sobre la base del panel de espectadores de Nielsen. El análisis ha revelado que los datos RPD no calibrados, que utilizan metodologías de ponderación dudosas, subestiman las audiencias minoritarias y están intrínsecamente sesgados. Compararlos con los datos del "censo" es un salto de fe metodológico.

Al fin y al cabo, los estadounidenses ya no enfocan igual sus necesidades de programación de vídeo. Algunos no tienen ingresos para gastar en contenidos de entretenimiento premium; otros optan por la programación OTA a la luz de la mejora de la tecnología digital. Los avances tecnológicos generalizados han impulsado también un crecimiento constante de los hogares que sólo utilizan la banda ancha (BBO). La combinación de hogares OTA y BBO ha crecido en Estados Unidos de 15 millones de hogares en 2014 a casi 28 millones de hogares en 2018. Si se tiene en cuenta que el 41% de los consumidores de esos 28 millones de hogares son multiculturales (ya sea hispanos, afroamericanos o asiáticos) y el 10% son un grupo demográfico más joven (18-24), está claro que una muestra de RPD infrarrepresentaría significativamente a estas audiencias y sesgaría la medición de la audiencia total.

Los datos con capacidad de RPD por sí solos sub-representan sistemáticamente a los hogares hispanos y afroamericanos en comparación con otros tipos de hogares. En comparación con las estimaciones oficiales del censo de EE.UU. y el panel nacional representativo de Nielsen, los hogares con capacidad de RPD infrarrepresentan a los hispanos en un 33%, a los hispanos con dominio del español en un 49% y a los afroamericanos en un 34%. Si comparamos los hogares con capacidad RPD con los hogares OTA/BBO, la disparidad de representación es aún mayor. Las mediciones con capacidad de RPD infrarrepresentan a los hispanos en un 50%, a los hispanos de habla hispana en un 68% y a los afroamericanos en un 38%. La ponderación por sí sola no cura este problema, y el hecho de que se cuenten millones de hogares RPD no importa. Una gran muestra sesgada sigue siendo sesgada.

Y estas fuentes no sólo se dirigen al público multicultural.

Desde el punto de vista de la edad, los datos con capacidad de RPD infra-representan a los grupos demográficos más jóvenes y sobre-representan a los grupos de mayor edad. Por ejemplo, los consumidores de 25 a 34 años están infrarrepresentados en un 26%, mientras que los mayores de 50 años están sobrerrepresentados en un 15%. ¿Qué ocurre con el grupo demográfico clave de 18 a 34 años? El panel nacional de Nielsen y los datos del censo también muestran que hay 69,8 millones de adultos de 18 a 34 años dentro de los hogares de televisión en diciembre de 2018. Este demo está liderando la revolución del cord-cutting y representa la mayor parte de los cord-cutters por demo. Pero los hogares con capacidad de RPD tienen un 17% menos de probabilidades de tipificar a los adultos de 18 a 34 años con precisión que un panel representativo.

Al infravalorar a los adultos de 18 a 34 años, los profesionales del marketing, los propietarios de los medios de comunicación y todos los demás tienen menos personas a las que llegar si se basan únicamente en los datos de RPD. La ponderación de esta cuestión puede ocultar el problema inherente a los datos de RPD, pero no solucionará el problema ni descubrirá los comportamientos de visualización únicos de estas audiencias. Los hogares con RPD no representan el visionado de los hogares sin RPD. Las encuestas ocasionales en línea realizadas cada pocos años aplicadas a los complejos registros de visionado diario son una forma barata y descuidada de parecer que se ha corregido algo.

Una mirada a los consumidores que pertenecen al grupo RPD, a un grupo no apto para RPD (lo que significa que estos consumidores pueden tener un decodificador que no devuelve los datos) y al creciente grupo OTA/BBO revela marcadas diferencias en sus comportamientos y estilos de vida. Esto es algo que sólo se puede obtener mediante la observación directa, independientemente de la ponderación que se haga y del tamaño de las entradas de big data, ya sea una muestra de 30 millones, mil millones o trillones.

Entonces, ¿qué significa esto para la programación real que se nutre de audiencias multiculturales? Significa que hay que tener en cuenta todas las fuentes y observar todos los tipos de audiencias para poder contar y calibrar con cualquier conjunto de big data.

Por ejemplo, un programa como Empire de Fox , donde la composición de la audiencia es predominantemente multicultural, el análisis encontró que estas audiencias eran cualquier cosa menos "nicho", teniendo en cuenta la historia del programa como un programa cerca de la cima de las filas. De hecho, las audiencias diversas constituyeron el 75% de Empire en diciembre de 2018 y estas audiencias ciertamente ayudaron a impulsar el éxito de las audiencias cuando se utiliza un panel representativo.

Sin embargo, debido a su sesgo inherente de infrarrepresentación, estas audiencias multiculturales no se reflejaron de manera justa, lo que dio lugar a un importante subregistro de la audiencia de Empire cuando se mira este programa a través de una lente RPD. Las diferencias son bastante grandes. Si observamos la clasificación entre los espectadores de 25 a 54 años, Empire se situó en el puesto 16 utilizando el panel representativo de Nielsen, pero cayó al 38 en los hogares de RPD. Por el contrario, Empire ocupó el tercer lugar entre los hogares OTA, lo cual, aunque no es sorprendente porque estos hogares son más diversos, demuestra la naturaleza crítica de incluir realmente estos hogares y medir con precisión su comportamiento en cualquier muestra.

Al final, encontrar un enfoque que se base en cualquier cosa que no sea una medición completa, precisa e inclusiva y los elementos fundacionales y el principio central de la inclusión podrían verse comprometidos. Excluir a estos espectadores "de nicho" y sus comportamientos por definición puede tener implicaciones de gran alcance que podrían desestabilizar el mercado -y a los comercializadores- con información errónea y quizás incluso hacer retroceder la inclusión en pantalla.