Loncat ke konten
02_Elemen/Ikon/PanahKiri Kembali ke Wawasan
Wawasan > Media

Kembali ke Pengirim: Bagaimana Data Besar Saja Bisa Menjadi Bias dan Tidak Representatif

6 menit dibaca | Maret 2019

Di zaman yang penuh dengan fragmentasi perangkat dan audiens, jelas bahwa setiap pemirsa adalah konsumen potensial yang penting, meskipun personalisasi konsumsi konten mereka, serta konten itu sendiri, jauh lebih terperinci.

Mampu mengukur dengan cara yang secara adil mewakili semua ras, usia, etnis, dan perilaku sangat penting bagi industri ini untuk bertransaksi dengan percaya diri. Ini juga merupakan satu-satunya cara untuk memastikan bahwa pilihan konten mencerminkan keragaman komunitas stasiun tertentu.

Baik itu programmer yang ingin mengungkap komposisi keragaman pemirsa mereka yang sebenarnya, untuk membuat keputusan penjadwalan, pengiklan yang ingin menjangkau segmen tertentu dengan pesan yang tepat, atau pemilik media yang melakukan lebih banyak upaya untuk inklusi di layar dengan melakukan casting dengan mempertimbangkan keragaman, semua operator di industri ini memiliki keharusan bisnis untuk mengetahui komposisi pemirsa yang sebenarnya. Itulah mengapa sangat penting bahwa wawasan pengukuran yang mereka andalkan harus sepenuhnya mewakili keragaman populasi AS. Tidak boleh ada kelompok atau kelompok-kelompok yang secara sadar atau tidak sadar dikecualikan atau kurang terwakili.

Singkatnya, tidak ada lagi yang namanya pemirsa atau jaringan "khusus", dan tidak ada pemirsa yang boleh ditinggalkan karena proses pengukuran yang tidak memperhitungkan mereka atau, lebih buruk lagi, bahkan tidak mempertimbangkan mereka. Dalam hal pengukuran, inklusivitas adalah sebuah keharusan dan bukan pilihan.

Meskipun ada banyak keuntungan dari big data, ada juga kerugiannya jika perusahaan tidak memperlakukannya secara bertanggung jawab. Pendekatan yang memanfaatkan kekuatan yang ditawarkan data ini, seperti memberikan stabilitas pengukuran dalam lingkungan menonton yang terfragmentasi tinggi, dengan pengukuran tingkat orang yang sebenarnya sangat penting. Sederhananya, big data sebagai sumber daya yang berdiri sendiri tidak cocok untuk memahami dinamika audiens sepenuhnya.

Analisis Nielsen baru-baru ini melihat bagaimana data besar, yang dibuat tanpa mempertimbangkan representasi, dapat mengaburkan siapa penonton yang sebenarnya karena bias yang melekat, seperti data yang disertakan, seperti orang-orang yang tidak memiliki set top box, orang-orang yang memanfaatkan sinyal over-the-air (OTA ) dan streaming konten over-the-top (OTT) untuk menonton program televisi premium.

Secara khusus, analisis ini berusaha untuk memahami perbedaan pengukuran audiens antara data jalur balik (RPD) - rumah yang memiliki dekoder yang mampu mengembalikan data - dan rumah dengan data pemirsa yang telah dikalibrasi berdasarkan panel pemirsa Nielsen. Analisis ini menemukan bahwa data RPD yang tidak dikalibrasi yang menggunakan metodologi pembobotan yang meragukan akan meremehkan pemirsa minoritas dan pada dasarnya bias. Menyamakannya dengan data "sensus" adalah sebuah lompatan metodologis.

Bagaimanapun juga, orang Amerika tidak lagi melakukan pendekatan yang sama terhadap kebutuhan program video mereka. Sebagian tidak memiliki pendapatan untuk dibelanjakan pada konten hiburan premium; sebagian lagi memilih program OTA dengan adanya peningkatan teknologi digital. Kemajuan teknologi yang meluas telah mendorong pertumbuhan yang stabil dari rumah broadband-only (BBO). Kombinasi rumah OTA dan BBO telah membengkak di AS dari 15 juta rumah pada tahun 2014 menjadi hampir 28 juta rumah pada tahun 2018. Ketika Anda memperhitungkan bahwa 41% dari konsumen di 28 juta rumah tersebut adalah multikultural (baik Hispanik, Afrika-Amerika, atau Asia) dan 10% adalah demografi yang lebih muda (18-24), jelas bahwa sampel RPD secara signifikan akan kurang merepresentasikan audiens ini dan memiringkan pengukuran total audiens.

Data berkemampuan RPD sendiri secara konsisten kurang mewakili rumah Hispanik dan Afrika-Amerika dibandingkan dengan jenis rumah tangga lainnya. Dibandingkan dengan estimasi resmi Sensus AS dan panel nasional perwakilan Nielsen, rumah berkemampuan RPD kurang mewakili Hispanik sebesar 33%, Hispanik yang dominan berbahasa Spanyol sebesar 49%, dan Afrika-Amerika sebesar 34%. Jika Anda membandingkan rumah berkemampuan RPD dengan rumah OTA/BBO, perbedaan representasi bahkan lebih besar lagi. Pengukuran berkemampuan RPD kurang mewakili Hispanik sebesar 50%, Hispanik yang dominan berbahasa Spanyol sebesar 68% dan Afrika-Amerika sebesar 38%. Pembobotan saja tidak dapat mengatasi masalah ini, dan fakta bahwa jutaan rumah RPD dihitung tidak menjadi masalah. Sampel yang besar tetap saja bias.

Dan bukan hanya khalayak multikultural yang menjadi sasaran sumber-sumber ini.

Dari perspektif usia, data berkemampuan RPD kurang mewakili demo yang lebih muda dan terlalu mewakili kelompok usia yang lebih tua. Misalnya, konsumen berusia 25-34 tahun kurang terwakili sebesar 26%, sementara orang berusia 50+ sebenarnya terwakili secara berlebihan sebesar 15%. Bagaimana dengan demo utama yang lebih besar yaitu 18-34 tahun? Panel nasional Nielsen dan data Sensus juga menunjukkan bahwa terdapat 69,8 juta orang dewasa berusia 18-34 tahun yang menonton TV per Desember 2018. Demo ini memimpin revolusi pemotongan kabel dan menyumbang pangsa terbesar dari pemutus kabel berdasarkan demo. Tetapi rumah berkemampuan RPD 17% lebih kecil kemungkinannya untuk mengklasifikasikan orang dewasa berusia 18-34 tahun secara akurat dibandingkan dengan panel yang representatif.

Dengan kurang menghitung orang dewasa berusia 18-34 tahun, pemasar, pemilik media, dan semua orang di antaranya memiliki lebih sedikit orang yang dapat dijangkau jika mereka hanya mengandalkan data RPD. Pembobotan untuk masalah ini dapat menyembunyikan masalah yang melekat pada data RPD, tetapi tidak akan menyelesaikan masalah atau mengungkap perilaku menonton yang unik dari audiens ini. Rumah RPD tidak mewakili penayangan rumah non-RPD. Survei online yang dilakukan setiap beberapa tahun sekali yang diterapkan pada catatan penayangan harian yang kompleks adalah cara yang murah dan ceroboh untuk terlihat seperti ada sesuatu yang telah dikoreksi.

Melihat konsumen yang termasuk dalam kelompok RPD, kelompok yang tidak memiliki kemampuan RPD (yang berarti konsumen ini mungkin memiliki dekoder yang tidak mengembalikan data) dan kelompok OTA/BBO yang sedang berkembang menunjukkan perbedaan yang mencolok dalam perilaku dan gaya hidup mereka. Ini adalah sesuatu yang hanya dapat diperoleh melalui pengamatan langsung, tidak peduli seberapa besar pembobotan yang dilakukan dan tidak peduli ukuran input data yang besar, baik itu sampel 30 juta, miliaran, atau triliunan.

Jadi, apa artinya hal ini bagi pemrograman aktual yang didukung oleh pemirsa multikultural? Artinya, semua sumber harus dipertimbangkan dan semua jenis audiens harus diamati agar dapat dihitung dan dikalibrasi dengan kumpulan data yang besar.

Misalnya, acara seperti Empire di Fox, yang komposisi penontonnya didominasi oleh multikultural, analisis menemukan bahwa penonton ini sama sekali tidak "khusus", mengingat sejarah acara ini sebagai program yang berada di peringkat teratas. Faktanya, penonton yang beragam terdiri dari 75% penonton Empire pada Desember 2018 dan penonton ini tentu saja membantu mendorong kesuksesan peringkat ketika menggunakan panel yang representatif.

Namun karena bias yang melekat pada bias kurang representasi, penonton multikultural ini tidak tercermin secara adil sehingga menghasilkan jumlah penonton Empire yang kurang signifikan ketika melihat acara ini melalui lensa RPD. Perbedaannya cukup besar. Melihat peringkat di antara pemirsa berusia 25-54 tahun, Empire berada di peringkat 16 dengan menggunakan panel representatif Nielsen, tetapi turun ke peringkat 38 di rumah-rumah RPD. Sebaliknya, Empire menduduki peringkat ketiga di antara rumah OTA, yang meskipun tidak mengejutkan karena rumah-rumah ini lebih beragam, namun menunjukkan sifat kritis dari memasukkan rumah-rumah ini dan secara akurat mengukur perilaku mereka dalam sampel apa pun.

Pada akhirnya, menemukan pendekatan yang bergantung pada sesuatu yang kurang dari pengukuran yang lengkap, akurat, dan inklusif serta elemen-elemen dasar dan prinsip utama inklusi dapat dikompromikan. Menghitung pemirsa "ceruk" ini dan perilaku mereka berdasarkan definisi dapat memiliki implikasi yang luas yang dapat mengacaukan pasar - dan pemasar - dengan informasi yang salah dan bahkan mungkin memundurkan inklusi di layar kaca.

Lanjutkan menelusuri wawasan serupa