Skip to content
Connaissances > Audiences

La science pour comprendre le Big Data

5 minutes de lecture | Clem Thompson, VP, Data Science, Nielsen | Mai 2019

Avez-vous allumé la télévision aujourd'hui ? Et la radio ? Vous avez probablement utilisé une application sur votre smartphone. Vous avez peut-être acheté des ingrédients pour le dîner au magasin ou acheté une nouvelle bouteille de shampoing en ligne.

Toutes ces activités sont des gestes simples et quotidiens. Mais dans le monde d'aujourd'hui, vaste, interconnecté et, souvent, numérique, ce sont aussi des points de données précieux.

Plus important encore, elles peuvent aider les marques et les spécialistes du marketing à comprendre les besoins de leurs consommateurs, à prendre de meilleures décisions pour répondre à ces besoins et, en fin de compte, à stimuler la croissance de leurs entreprises. Mais d'abord, les marques et les spécialistes du marketing doivent donner un sens à toutes ces données.

La taille et la portée des données que nous générons tous à l'ère du numérique peuvent être stupéfiantes, et Nielsen en mesure une grande partie. Considérez ceci : Nielsen recueille 1,7 milliard d'enregistrements d'audience TV chaque mois, 6,7 milliards de transactions en magasin chaque mois, et 1,6 trillion d'impressions en ligne chaque année ! Prendre les énormes piles de données, parfois désordonnées, générées par nos actions quotidiennes et les organiser en informations utilisables, pratiques et significatives - tout en étant des gestionnaires responsables des données et en garantissant la confidentialité des personnes - exige des connaissances et des compétences spécifiques.

Heureusement, les technologies et les plates-formes en plein essor qui fournissent de nouvelles sources de données aux marques et aux spécialistes du marketing permettent également de disposer de nouveaux outils et moyens pour mesurer ces données et en tirer des enseignements. C'est le rôle des équipes de science des données de rechercher de nouvelles sources de données et de nouveaux outils analytiques qui peuvent aider à analyser (et donc à donner un sens) au Big Data créé par les consommateurs. À l'aide de méthodes, de processus, d'algorithmes et de systèmes scientifiques, les scientifiques des données découvrent des informations précieuses dans ces ensembles de points de données en boule de neige.

Chez Nielsen, environ 1 100 scientifiques des données sont chargés de trouver des méthodes solides et reproductibles pour "relier les points" pour nos clients et raconter une histoire sur les besoins de leurs consommateurs. Alors que les "points" dans cette analogie représentent les points de données apparemment illimités dont disposent nos clients lorsqu'ils s'efforcent de comprendre leurs consommateurs, ce sont les connexions que nos scientifiques des données sont capables de générer qui constituent l'apport numéro 1 à la prise de décision de nos clients et le carburant de leur croissance.

En tant que membre de l'équipe de data scientists de Nielsen, je travaille au développement de solutions personnalisées pour intégrer les données et créer des connexions clés pour nos clients. Ces solutions comprennent des fusions de données, des segmentations d'audience personnalisées, des analyses de retour sur investissement et des méthodologies entièrement nouvelles pour intégrer des sources de données afin de répondre à des questions commerciales spécifiques sur les consommateurs.

Il ne fait aucun doute que les nouvelles technologies et le Big Data révolutionnent la façon dont nous mesurons la consommation des médias et des produits que nous achetons. Mais il est également important de se rappeler qu'elles ont aussi leurs limites.

Les technologies ne sont généralement pas créées dans une optique de mesure. Par conséquent, le Big Data peut être biaisé de nombreuses façons. Pensez à la télécommande que vous utilisez pour changer de chaîne sur votre téléviseur, par exemple. En appuyant sur un bouton, vous envoyez un signal à un boîtier, et ce signal génère des données. Mais ces données sont limitées dans ce qu'elles peuvent dire sur vous. Par exemple, elles ne savent pas si vous avez appuyé sur le bouton ou si un autre membre de votre famille l'a fait. Des données biaisées peuvent conduire à des idées erronées sur les consommateurs et à de mauvaises décisions de la part des spécialistes du marketing.

Voici un autre exemple : Les appareils connectés à la télévision et les services de vidéo à la demande par abonnement permettent aux consommateurs de choisir ce qu'ils veulent, quand ils le veulent. Mais seuls 60 % environ des Américains possèdent ces appareils. Par conséquent, les données provenant de ces appareils ne représentent pas l'ensemble de la population américaine. En outre, ces données doivent être rendues comparables aux mesures de la télévision linéaire afin de fournir une vision globale du paysage télévisuel.

Chez Nielsen, nous utilisons des panels parallèlement au Big Data pour faire correspondre des points de données à des personnes réelles. Un panel bien construit peut éliminer bon nombre des biais inhérents au Big Data. Par exemple, nous utilisons nos panels TV américains pour représenter statistiquement la population du pays par âge, ethnie et niveau de revenu. En combinant les informations de ces panels avec les Big Data que Nielsen reçoit des boîtiers de câble grâce à des collaborations avec les fournisseurs de câble, nous sommes en mesure de découvrir qui se trouve derrière la télécommande. Ainsi, une approche de mesure hybride impliquant des panels et du Big Data peut fournir la granularité et le détail du Big Data et offrir la réduction des biais et la représentativité d'un panel.

Et avec l'augmentation exponentielle de la puissance offerte lorsque nous mettons l'intelligence artificielle (IA) au travail, il n'a jamais été aussi critique de s'assurer que les entrées de données sont propres, fiables et représentatives. Si ces critères ne sont pas respectés, cela signifie simplement que vous produisez des volumes plus importants (grâce à l'IA) de mauvais résultats. Il est important de se rappeler que c'est une question d'entrée et de sortie. Les données dites "suffisantes" ne le sont tout simplement pas dans un monde d'IA.

Les scientifiques des données eux-mêmes jouent également un rôle clé dans la réduction des biais de mesure. Si nos équipes de science des données comprennent effectivement des statisticiens très talentueux, beaucoup pourraient être surpris d'apprendre à quel point nos équipes sont diversifiées. Les équipes de science des données de Nielsen comprennent des associés issus d'horizons variés, tels que les mathématiques, les sciences du comportement, le génie chimique, la physique, l'enseignement, l'économie et le génie informatique, ainsi que de nombreux autres. Ces perspectives variées permettent de s'assurer que nous prenons en compte différents points de vue dans nos mesures.

En fin de compte, dans le monde actuel du Big Data, de plus en plus de disciplines commerciales - qu'il s'agisse de la finance, du service à la clientèle, des ressources humaines, de l'analyse des médias, etc. Donner à un plus grand nombre de personnes d'horizons divers les connaissances de base en matière de méthodes statistiques, de programmation et de compétences analytiques ouvre la voie à une meilleure prise de décision dans différents domaines d'activité.

Je pense que cela est de bon augure pour l'avenir de la science des données, à condition que ces nouveaux venus dans le domaine comprennent les biais et les considérations nécessaires pour glaner des informations de qualité à partir de nos points de données quotidiens.