콘텐츠로 건너뛰기
02_Elements/아이콘/왼쪽 화살표 인사이트로 돌아가기
인사이트 > 미디어

발신자로 돌아가기: 빅 데이터만으로는 편향되고 대표성이 없는 방법

6분 읽기 | 2019년 3월

디바이스와 시청자가 세분화되는 오늘날에는 콘텐츠 자체뿐만 아니라 콘텐츠 소비의 개인화가 훨씬 더 세분화되더라도 모든 시청자가 중요한 잠재 소비자라는 것은 분명합니다.

모든 인종, 연령, 민족 및 행동을 공정하게 대표하는 방식으로 측정할 수 있어야 업계에서 자신 있게 거래할 수 있습니다. 또한 특정 방송국 커뮤니티의 다양성을 반영하는 콘텐츠 선택을 보장할 수 있는 유일한 방법이기도 합니다.

진정한 시청자 다양성의 구성을 파악하여 편성 결정을 내리려는 프로그래머, 정확한 메시지로 특정 세그먼트에 도달하려는 광고주, 다양성을 고려한 캐스팅으로 화면 내 포용성을 높이기 위해 노력하는 미디어 소유자 등, 업계의 모든 사업자는 진정한 시청자 구성이 무엇인지 파악하는 것이 비즈니스의 필수 과제입니다. 그렇기 때문에 그들이 의존하는 측정 인사이트가 미국 인구의 다양한 성향을 온전히 대표할 수 있어야 합니다. 어떤 그룹도 고의적으로 또는 무의식적으로 배제되거나 과소 대표되어서는 안 됩니다.

요컨대, 더 이상 '틈새' 시청자나 네트워크 같은 것은 존재하지 않으며, 이들을 고려하지 않거나 고려조차 하지 않는 측정 프로세스로 인해 뒤처지는 시청자가 있어서는 안 됩니다. 측정에 있어 포용성은 선택이 아닌 필수입니다.

빅데이터에는 많은 장점이 있지만, 기업이 빅데이터를 책임감 있게 다루지 않는다면 단점도 있습니다. 고도로 파편화된 시청 환경에서 측정 안정성을 제공하는 등 빅데이터가 제공하는 강점을 활용하는 접근 방식, 즉 진정한 개인 수준의 측정이 중요합니다. 간단히 말해, 독립적인 리소스로서의 빅 데이터는 오디언스 역학을 완전히 이해하는 데 적합하지 않습니다.

최근 닐슨의 분석에서는 대표성을 염두에 두지 않고 구축된 빅데이터가 셋톱박스가 없는 사람, OTA(Over-the-Air ) 신호를 활용하고 프리미엄 TV 프로그램을 시청하기 위해 OTT(Over-the-Top) 콘텐츠를 스트리밍하는 사람 등 데이터에 내재된 편향성으로 인해 실제 시청자가 누구인지 모호하게 만들 수 있음을 살펴본 바 있습니다.

특히, 이 분석에서는 데이터를 반환할 수 있는 셋톱박스가 있는 가정에 대한 리턴 경로 데이터(RPD)와 닐슨의 시청자 패널을 기반으로 보정된 시청자 데이터가 있는 가정 간의 시청률 측정 차이를 이해하고자 했습니다. 분석 결과, 모호한 가중치 적용 방법을 사용하는 보정되지 않은 RPD 데이터는 소수 시청자를 과소 계수하고 본질적으로 편향된 것으로 나타났습니다. 이를 '인구조사' 데이터에 비유하는 것은 방법론적인 비약입니다.

결국, 미국인들은 더 이상 비디오 프로그램에 대한 니즈를 동일하게 접근하지 않습니다. 일부는 프리미엄 엔터테인먼트 콘텐츠에 지출할 수 있는 소득이 없고, 다른 일부는 디지털 기술의 발전으로 인해 OTA 프로그램을 선택합니다. 광범위한 기술 발전으로 인해 광대역 전용(BBO) 가정도 꾸준히 성장하고 있습니다. 미국에서는 2014년 1,500만 가구에서 2018년에는 약 2,800만 가구로 OTA와 BBO를 결합한 가정이 급증했습니다. 2,800만 가구의 소비자 중 41%가 다문화(히스패닉, 흑인 또는 아시아계), 10%가 젊은 층(18~24세)이라는 점을 고려하면 RPD 표본은 이러한 잠재고객을 상당히 과소 대표하고 전체 잠재고객 측정이 왜곡될 수 있다는 것을 분명히 알 수 있습니다.

RPD 지원 데이터만으로는 다른 가구 유형에 비해 히스패닉 및 아프리카계 미국인 가정을 지속적으로 과소 대표하고 있습니다. 미국 인구조사 공식 추정치 및 닐슨의 대표적인 전국 패널과 비교할 때, RPD 사용 가능 가정은 히스패닉계는 33%, 스페인어를 주로 사용하는 히스패닉계는 49%, 아프리카계 미국인은 34% 과소 대표합니다. RPD 가능 주택과 OTA/BBO 주택을 비교하면 대표성 격차는 훨씬 더 커집니다. RPD 지원 측정은 히스패닉계는 50%, 스페인어를 주로 사용하는 히스패닉계는 68%, 아프리카계 미국인은 38% 과소 대표합니다. 가중치만으로는 이 문제를 해결할 수 없으며, 수백만 개의 RPD 가구가 집계된다는 사실도 중요하지 않습니다. 편향된 대규모 샘플은 여전히 편향된 것입니다.

그리고 이러한 소스가 왜곡하는 것은 다문화 오디언스뿐만이 아닙니다.

연령 관점에서 볼 때, RPD가 가능한 데이터는 젊은 층을 과소 대표하고 고령층을 과대 대표합니다. 예를 들어, 25~34세 소비자는 26% 과소 대표되는 반면, 50세 이상은 실제로 15% 과대 대표됩니다. 그렇다면 18~34세의 더 큰 주요 데모는 어떨까요? 닐슨의 전국 패널 및 인구조사 데이터에 따르면 2018년 12월 기준 18~34세 성인 가구는 6,980만 명에 달합니다. 이 연령대는 코드커팅 혁명을 주도하고 있으며, 연령대별 코드커터 중 가장 큰 비중을 차지합니다. 그러나 RPD를 사용하는 가정은 대표 패널보다 18~34세 성인을 정확하게 분류할 가능성이 17% 낮습니다.

18~34세 성인을 과소 집계함으로써 마케터, 미디어 소유자 및 그 사이의 모든 사람들이 RPD 데이터에만 의존할 경우 도달할 수 있는 인구가 줄어들게 됩니다. 이 문제에 대한 가중치를 적용하면 RPD 데이터의 고유한 문제를 숨길 수는 있지만, 문제를 해결하거나 이러한 오디언스의 고유한 시청 행동을 밝혀내지는 못합니다. RPD 가정은 비RPD 가정의 시청을 대표하지 않습니다. 복잡한 일일 시청 기록에 몇 년에 한 번씩 실시하는 온라인 설문조사는 무언가 수정된 것처럼 보이게 하기 위한 값싸고 부주의한 방법입니다.

RPD 그룹에 속하는 소비자, RPD를 지원하지 않는 그룹(데이터를 반환하지 않는 셋톱박스를 보유한 소비자)과 성장하는 OTA/BBO 그룹을 살펴보면 이들의 행동과 라이프스타일에 뚜렷한 차이가 있음을 알 수 있습니다. 이는 아무리 많은 가중치를 적용하고 빅데이터 입력의 샘플이 3천만, 10억, 조 단위이든 상관없이 직접 관찰을 통해서만 얻을 수 있는 정보입니다.

그렇다면 이는 다문화 시청자를 대상으로 하는 실제 프로그램에 어떤 의미가 있을까요? 모든 소스를 고려하고 모든 유형의 시청자를 관찰해야 빅 데이터 세트에 포함시키고 보정할 수 있다는 뜻입니다.

예를 들어, 시청자 구성이 주로 다문화인 Fox의 Empire와 같은 프로그램의 경우, 상위권에 가까운 프로그램이라는 이 프로그램의 역사를 고려할 때 이러한 시청자는 '틈새'에 불과하다는 분석 결과가 나왔습니다. 실제로 2018년 12월 엠파이어의 시청자 중 다양한 시청자가 75%를 차지했으며, 이러한 시청자는 대표 패널을 사용할 때 시청률 상승에 확실히 도움이 되었습니다.

그러나 과소 대표라는 내재된 편견으로 인해 이러한 다문화 시청자가 공정하게 반영되지 않았기 때문에 RPD 렌즈를 통해 이 프로그램을 볼 때 Empire의 시청자 수가 상당히 과소 집계되었습니다. 그 차이는 상당히 큽니다. 25~54세 시청자 순위를 살펴보면, 닐슨의 대표 패널에서는 엠파이어가 16위에 올랐지만 RPD 가정에서는 38위로 떨어졌습니다. 반대로 엠파이어는 OTA 가정에서 3위를 차지했는데, 이는 이러한 가정이 더 다양하기 때문에 놀랍지는 않지만 실제로 이러한 가정을 표본에 포함시키고 그들의 행동을 정확하게 측정하는 것이 얼마나 중요한지를 보여줍니다.

결국, 완전하고 정확하며 포괄적인 측정이 아닌 다른 것에 의존하는 접근 방식은 포용성의 기본 요소와 핵심 원칙을 훼손할 수 있습니다. 이러한 '틈새' 시청자와 그들의 행동을 정의에 따라 계산하는 것은 잘못된 정보로 시장과 마케터를 불안정하게 만들 수 있으며, 심지어 화면 내 포용성을 저해할 수 있는 광범위한 영향을 미칠 수 있습니다.

유사한 인사이트 계속 탐색