콘텐츠로 건너뛰기
02_Elements/아이콘/왼쪽 화살표 인사이트로 돌아가기
인사이트 > 대상

샘플링은 대표적인 개인 수준 측정의 핵심입니다.

4분 읽기 | 우체 오니에우, 데이터 과학 부문 이사 | 2019년 7월

기업이 모든 사람이 무엇을 하는지 알지 못하면서 어떻게 소비자 행동을 정확하게 측정할 수 있을까 고민해 본 적이 있나요? 그렇다면 여러분은 혼자가 아닙니다. 실제로 이 주제에 대한 질문은 항상 제기되고 있습니다. 미국에는 3억 2,500만 명이 넘는 인구가 살고 있기 때문에, 미국 내 모든 사람을 일일이 확인하지 않고 미디어 참여도와 쇼핑 습관을 측정하는 능력에 대해 회의적인 시각이 있는 것은 충분히 이해할 수 있습니다.

여러 가지 이유로 가능한 한 많은 사람을 참여시켜 소비자 행동을 측정하는 것은 실용적이지 않거나 반드시 좋은 생각은 아닙니다. 다른 경우에는 단순히 불가능할 수도 있습니다. 어떤 사람들은 자신의 선택에 의해서든 상황에 의해서든 측정을 거부하기도 합니다. 이 경우 참여 가능성이 가장 높은 그룹에만 초점을 맞춰 결과 데이터가 왜곡될 수 있습니다.

좋은 소식은 각 개인을 개별적으로 조사하지 않고도 대규모 집단의 행동을 이해할 수 있다는 것입니다. 사람은 개인 수준의 측정에 필수적이며, 더 많은 사람들을 대표하도록 선정된 주요 그룹으로 구성된 패널은 더 많은 인구의 행동에 대한 통찰력을 제공할 수 있습니다. 하지만 패널에 측정 대상인 대규모 그룹보다 훨씬 적은 수의 사람들이 포함되어 있을 때 어떻게 가능한 걸까요?

패널은 실제 소비자 행동에 대한 개인 수준의 인사이트를 제공하기 때문에 엄격한 데이터 과학과 통계적 표본 추출 방법을 사용하여 패널과 설문조사를 통해 측정하는 모집단이 더 많은 인구를 정확하게 대표할 수 있도록 합니다. 일반적으로 샘플링은 특정 모집단을 측정하는 통계적 수단으로, 더 큰 모집단을 대표할 수 있도록 측정 범위를 정확하게 확장하려는 의도로 사용됩니다. 그러나 측정과 마찬가지로 모든 샘플링 방법이 동일하게 만들어지는 것은 아닙니다.

샘플링 방법은 일반적으로 확률 기반과 비확률 기반의 두 가지 범주 중 하나로 나뉩니다. 확률 기반 샘플링에서는 모집단의 모든 사람이 참여하도록 선택될 확률이 동일합니다. 비확률 기반 샘플링에서는 일부 사람들이 선택될 확률이 더 높거나 낮을 수 있습니다. 따라서 동등한 대표성을 보장하기 위해서는 어떤 형태의 확률 기반 샘플링을 사용해야 합니다.

하지만 샘플링에는 이 두 가지 방법 중 하나를 선택하는 것보다 더 많은 것이 있습니다. 특히 샘플링 프로세스는 복잡성과 실행 방식이 다양할 수 있습니다. 다시 말해, 샘플을 수행하기 위한 매개변수는 상당히 일반적이며, 주어진 샘플의 무결성은 얼마나 철저하게 준비했는지에 따라 달라집니다. 무선 측정의 경우, 저희는 휴대용 인원 측정기(PPM) 및 오디오 다이어리 측정 서비스를 구동하고 가능하게 하는 100가지 이상의 중요한 프로세스를 적용합니다. 이러한 프로세스를 매일, 매주, 매월, 분기 및 매년 수행하여 닐슨이 가장 대표적인 샘플을 생성할 수 있도록 합니다.

그렇다면 전체 프로세스는 어떻게 진행될까요? 우선 미국 인구조사 데이터를 활용하여 측정 대상 인구의 인구통계학적 특성(연령, 성별, 인종, 민족, 언어 선호도 등)과 지리적 구성을 추정하고, 궁극적으로 닐슨 제품의 샘플링 타겟을 설정하는 데 중점을 둡니다. 그런 다음, 과거 데이터와 예측 모델을 기반으로 무작위로 선정된 가구의 인구통계학적 구성과 참여 가능성을 예측합니다. 이러한 모델은 세분화된 지리적 수준(예: 교구, 도시 또는 카운티)에서 실행되며, 이러한 모델을 지속적으로 모니터링하여 대표 표본을 유지하고 필요에 따라 업데이트합니다.

패널 모집을 위해 가구를 모집할 때는 닐슨 전체에서 다양한 모집 방법을 사용합니다. 예를 들어, 무선 측정의 경우 샘플 공급업체에 연락하여 측정 지역 내의 광범위한 잠재 패널리스트의 기본 연락처 정보를 설정합니다. 이것이 우리의 시작 샘플이 됩니다. 시작 표본의 연락처 정보를 저장한 후, 우리 팀은 표본 선정 프로세스를 시작하여 궁극적으로 다양한 하위 모집 작업(예: 모집 자료 우편 발송, 전화 인터뷰 실시, 회원 담당자의 가구 방문 등)을 진행합니다.

전체 과정에서 한 가구가 패널 및 설문조사에 참여할 기회가 주어질지 여부를 결정하는 데는 여러 가지 요인이 있습니다. 이러한 요소는 우리가 측정하는 인구의 대표 표본을 확보하는 능력과 직결됩니다.

우리는 기술, 쿠키, 복귀 경로 데이터, 좋아요, 재생 목록 알고리즘 및 기타 수많은 디지털 마커가 온라인 생활의 모든 곳에 '발자국'을 남기는 세상에 살고 있는 것은 사실입니다. 하지만 이러한 데이터의 대부분은 완전하지 않습니다. 이러한 데이터의 대부분은 편견을 담고 있습니다. 이러한 데이터의 대부분은 측정에 사용하도록 의도되지 않았습니다. 그러나 개인 수준의 정보는 진정한 측정을 위한 결정적인 소스로 남아 있습니다. 그리고 샘플링은 개인 수준의 대표성 있는 측정을 위한 열쇠입니다.

유사한 인사이트 계속 탐색