Lewati ke konten
Wawasan > Media

Kembali ke Pengirim: Bagaimana Big Data Saja Dapat Bias dan Tidak Representatif

6 menit membaca | Maret 2019

Di zaman osekumentasi perangkat dan audiens, jelas bahwa setiap pemirsa adalah konsumen potensial yang penting, bahkan jika personalisasi konsumsi konten mereka, serta konten itu sendiri, jauh lebih terperinci.

Mampu mengukur dengan cara yang secara adil mewakili semua ras, usia, etnis, dan perilaku sangat penting bagi industri untuk bertransaksi dengan percaya diri. Ini juga satu-satunya cara untuk memastikan bahwa pilihan konten mencerminkan keragaman komunitas stasiun tertentu.

Baik itu programmer yang ingin mengungkap komposisi keragaman audiens mereka yang sebenarnya, untuk membuat keputusan penjadwalan, pengiklan yang ingin menjangkau segmen tertentu dengan pesan yang tepat atau pemilik media yang melakukan lebih banyak upaya untuk inklusi di layar dengan casting dengan mempertimbangkan keragaman, semua operator di industri ini memiliki keharusan bisnis untuk mengetahui apa susunan audiens yang sebenarnya. Itulah mengapa penting bahwa setiap wawasan pengukuran yang mereka andalkan sepenuhnya mewakili pastiche kaya populasi AS. Tidak ada kelompok atau kelompok yang secara sadar atau tidak sadar dikecualikan atau kurang terwakili.

Singkatnya, tidak ada lagi yang namanya pemirsa atau jaringan "niche", dan tidak ada audiens yang harus ditinggalkan karena proses pengukuran yang gagal memperhitungkannya atau, lebih buruk lagi, bahkan mempertimbangkannya. Dalam hal pengukuran, inklusivitas adalah keharusan dan bukan pilihan.

Dan meskipun ada banyak keuntungan dari big data, ada juga kerugian jika perusahaan tidak memperlakukannya secara bertanggung jawab. Pendekatan yang memanfaatkan kekuatan yang ditawarkan data ini, seperti memberikan stabilitas pengukuran dalam lingkungan tampilan yang terfragmentasi tinggi, dengan pengukuran tingkat orang yang sebenarnya sangat penting. Sederhananya, data besar sebagai sumber daya mandiri tidak layak untuk sepenuhnya memahami dinamika audiens.

Analisis Nielsen baru-baru ini melihat bagaimana data besar, yang dibangun tanpa representasi dalam pikiran, dapat mengaburkan apa audiens sejati itu karena bias yang melekat, karena data yang disertakan, seperti orang-orang TANPA set top box, orang-orang yang memanfaatkan sinyal over-the-air (OTA) dan streaming konten over-the-top (OTT) untuk menonton program televisi premium.

Secara khusus, analisis ini berusaha memahami perbedaan pengukuran audiens antara data jalur balik (RPD)—rumah yang telah menetapkan kotak teratas yang mampu mengembalikan data—dan rumah dengan data pemirsa yang telah dikalibrasi berdasarkan panel pemirsa Nielsen. Analisis ini menemukan data RPD yang tidak dikalibrasi yang menggunakan metodologi pembobotan yang meragukan kurang menghitung audiens minoritas dan secara inheren bias. Menyamakannya dengan data "sensus" adalah lompatan iman metodologis.

Lagi pula, orang Amerika tidak lagi mendekati kebutuhan pemrograman video mereka yang sama. Beberapa tidak memiliki penghasilan untuk dibelanjakan untuk konten hiburan premium; yang lain memilih pemrograman OTA sehubungan dengan peningkatan teknologi digital. Kemajuan teknologi yang meluas telah memicu pertumbuhan rumah khusus broadband (BBO) yang stabil juga. Kombinasi rumah OTA dan BBO telah membengkak di AS dari 15 juta rumah pada tahun 2014 menjadi hampir 28 juta rumah pada tahun 2018. Ketika Anda memperhitungkan bahwa 41% konsumen di 28 juta rumah tersebut multikultural (baik Hispanik, Afrika-Amerika atau Asia) dan 10% adalah demografis yang lebih muda (18-24), jelas bahwa sampel RPD akan secara signifikan kurang mewakili audiens ini dan memiringkan total pengukuran audiens.

Data berkemampuan RPD saja secara konsisten kurang mewakili rumah Hispanik dan Afrika-Amerika dibandingkan dengan jenis rumah tangga lainnya. Dibandingkan dengan perkiraan sensus resmi AS dan panel nasional perwakilan Nielsen, rumah berkemampuan RPD kurang mewakili Hispanik sebesar 33%, Hispanik dominan berbahasa Spanyol sebesar 49% dan Afrika-Amerika sebesar 34%. Ketika Anda membandingkan rpd-mampu dengan rumah OTA / BBO, disparitas representasi bahkan lebih besar. Pengukuran berkemampuan RPD kurang mewakili Hispanik sebesar 50%, Hispanik dominan berbahasa Spanyol sebesar 68% dan Afrika-Amerika sebesar 38%. Pembobotan saja tidak menyembuhkan masalah ini, dan fakta bahwa jutaan rumah RPD dihitung tidak masalah. Sampel bias yang besar masih bias.

Dan bukan hanya audiens multikultural yang condong ke sumber-sumber ini.

Dari perspektif usia, data berkemampuan RPD kurang mewakili demo yang lebih muda dan terlalu mewakili kelompok usia yang lebih tua. Misalnya, konsumen 25-34 kurang dihitung sebesar 26%, sedangkan Orang 50+ sebenarnya terlalu terwakili oleh 15%. Bagaimana dengan demo kunci yang lebih besar dari 18-34? Panel nasional Nielsen dan data Sensus juga menunjukkan ada 69,8 juta orang dewasa berusia 18-34 tahun dalam rumah tangga TV per Desember 2018. Demo ini memimpin revolusi pemotongan kabel dan menyumbang bagian terbesar dari pemotong kabel dengan demo. Tetapi rumah berkemampuan RPD 17% lebih kecil kemungkinannya untuk menjipifikasi orang dewasa 18-34 secara akurat daripada panel yang representatif.

Dengan kurang menghitung orang dewasa berusia 18-34 tahun, pemasar, pemilik media, dan semua orang di antaranya memiliki lebih sedikit orang untuk dijangkau jika mereka hanya mengandalkan data RPD. Pembobotan untuk masalah ini mungkin menyembunyikan masalah yang melekat pada data RPD, tetapi tidak akan memperbaiki masalah atau mengungkap perilaku menonton yang unik dari audiens ini. Rumah RPD tidak mewakili tampilan rumah non-RPD. Survei online sesekali yang dilakukan setiap beberapa tahun diterapkan pada catatan tontonan harian yang kompleks adalah cara yang murah dan ceroboh untuk terlihat seperti sesuatu telah diperbaiki.

Melihat konsumen yang termasuk dalam grup RPD, grup yang tidak mampu RPD (artinya konsumen ini mungkin memiliki set-top box yang tidak mengembalikan data kembali) dan grup OTA/BBO yang sedang berkembang mengungkapkan perbedaan nyata dalam perilaku dan gaya hidup mereka. Ini adalah sesuatu yang hanya diperoleh dengan pengamatan langsung tidak peduli berapa banyak pembobotan yang dilakukan dan tidak peduli ukuran input data besar, baik itu sampel 30 juta, miliar atau triliun.

Jadi, apa artinya ini bagi pemrograman aktual yang didukung oleh audiens multikultural? Ini berarti bahwa semua sumber perlu dipertimbangkan dan semua jenis audiens perlu diamati untuk dihitung dan dikalibrasi dengan kumpulan data besar apa pun.

Misalnya, acara seperti Fox's Empire, di mana komposisi penontonnya sebagian besar multikultural, analisis menemukan bahwa penonton ini sama sekali bukan "ceruk," mengingat sejarah acara tersebut sebagai program di dekat puncak peringkat. Faktanya, audiens yang beragam membentuk 75% dari Empire pada Desember 2018 dan audiens ini tentu saja membantu mendorong kesuksesan peringkat saat menggunakan panel yang representatif.

Tetapi karena bias yang melekat pada representasi yang kurang, penonton multikultural ini tidak tercermin secara adil sehingga menghasilkan jumlah penonton Empire yang kurang signifikan ketika melihat pertunjukan ini melalui lensa RPD. Perbedaannya cukup besar. Melihat peringkat di antara pemirsa berusia 25-54 tahun, Empire berada di peringkat ke-16 menggunakan panel perwakilan Nielsen, tetapi turun menjadi 38 di rumah RPD. Sebaliknya, Empire menempati peringkat ketiga di antara rumah-rumah OTA, yang, meskipun tidak mengejutkan karena rumah-rumah ini lebih beragam, menunjukkan sifat kritis dari benar-benar memasukkan rumah-rumah ini dan secara akurat mengukur perilaku mereka dalam sampel apa pun.

Pada akhirnya, menemukan pendekatan yang bergantung pada apa pun yang kurang dari pengukuran penuh, akurat dan inklusif serta elemen dasar dan prinsip inti inklusi dapat dikompromikan. Menghitung pemirsa "niche" ini dan perilaku mereka berdasarkan definisi dapat memiliki implikasi yang jauh jangkauannya yang dapat mengacaukan pasar — dan pemasar — dengan informasi yang salah dan bahkan mungkin menghambat inklusi di layar.