조사구 대신 한국형 MAF를 만들자: 통계조사 패러다임 전환을 위한 제언

  조사구 대신 한국형 MAF를 만들자: 통계조사 패러다임 전환을 위한 제언 들어가며: 우리는 왜 아직 문을 두드리고 있나 매년 수십 개의 국가 승인 통계가 생산된다. 사회조사, 가계조사, 주거실태조사, 농림어업총조사…. 이 조사들은 하나같이 비슷한 방식으로 시작된다. 훈련받은 조사원이 지정된 구역을 찾아가고, 모르는 집의 초인종을 누르고, 때로는 여러 번 다시 찾아가며 응답을 구한다. 2025년, 스마트폰으로 주민등록을 갱신하고 병원 예약을 하는 나라에서. 왜 우리는 아직 문을 두드리고 있을까. 답은 간단하지 않다. 기술이 없어서가 아니다. 의지가 없어서도 아니다. 문제는 구조다. 정확히는 표집틀(Sampling Frame) 이라는 조사방법론의 가장 기초적인 개념에서 시작된다. 그리고 그 구조를 바꾸는 열쇠가 바로 우리가 이 글에서 이야기할 한국형 MAF(Master Address File) 다. 1. 표집틀이란 무엇이고, 왜 중요한가 통계조사에서 표집틀은 '누구를 뽑을 수 있는가'를 결정하는 모집단의 목록이다. 선거로 비유하면 유권자 명부다. 명부에 없는 사람은 애초에 선거에 참여할 수 없듯, 표집틀에 없는 가구는 조사 대상이 될 수 없다. 한국의 주요 국가 통계조사는 조사구(Enumeration District) 를 표집틀로 사용한다. 조사구는 전국을 약 60가구 규모의 지역 단위로 쪼갠 것이다. 통계청은 이 조사구를 1차로 뽑고, 현장에 조사원을 보내 그 안의 가구를 확인한 뒤 2차로 일부 가구를 표본으로 선정한다. 이 방식의 장점은 명확하다. 인터넷도 없고 전화번호도 모르는 가구까지 포함할 수 있고, 지역 단위로 층화(stratification)가 가능하다. 1950년대 이후 전 세계 대부분의 국가 통계가 이 방식으로 운영됐다. 그러나 결정적인 한계가 있다. 조사구는 지역 경계선일 뿐, 개별 가구의 연락처를 담고 있지 않다. 그래서 조사원이 직접 가야 한다. 가구를 확인하고, 목록을 만들고, 방문하고, 설득하고,...

산소마스크를 단 전화조사?

  산소마스크를 단 전화조사 좋은 인프라가 혁신을 지연시킬 때 한국 전화조사의 축복 한국의 공표용 선거여론조사 환경은 세계적으로 보기 드문 축복을 누리고 있다. 가상번호(안심번호) 제도는 이동통신사 가입자 전체에서 성별, 연령, 지역 기준으로 무작위 추출된 전화번호를 제공한다. 사실상 확률 표본에 가까운 표집틀을 국가가 만들어주는 것이다. 전화면접이든 ARS든 관계없이 이 번호를 받을 수 있고, 오토다이얼링으로 휴대전화에 자유롭게 발신할 수 있다. 법적 제약이 없다. 이것이 얼마나 특별한 환경인지는 미국과 비교하면 분명해진다. 미국에는 1991년에 제정된 TCPA(Telephone Consumer Protection Act)라는 법이 있다. 이 법은 사전 동의 없이 자동 다이얼러(autodialer)로 휴대전화에 전화를 거는 것을 금지한다. 여론조사도 예외가 아니다. 미국에서 휴대전화로 여론조사를 하려면, 면접원이 전화번호를 손으로 직접 눌러야 한다. 수백 명의 면접원이 물리적으로 번호를 찍는 것이다. 유선전화에서는 오토다이얼링이 가능했지만, 유선전화 보유 가구가 급감하면서 커버리지가 무너졌다. 휴대전화를 포함하려면 수동 다이얼링 비용을 감수해야 한다. 전화조사의 비용이 계속 올라가는 동안 웹조사의 비용은 계속 떨어졌고, 미국의 조사업계는 비확률 온라인 패널 중심으로 재편됐다. 확률 표본이라는 전화조사의 핵심 장점을 사실상 포기한 것이다. 한국은 이 딜레마가 없다. 오토다이얼링이 자유롭고, 가상번호가 확률 기반 표집틀을 제공하고, 소지역 타겟팅까지 가능하다. 미국이 비용과 법 때문에 포기한 것들을 한국은 다 갖고 있다. 전화조사를 하기에 이보다 좋은 환경은 세계 어디에도 없다. 그런데 전화를 안 받는다 문제는 전화를 받는 쪽에서 일어났다. 모르는 번호로 걸려오는 전화를 받는 것은 이미 일상적인 행위가 아니다. 젊은 층은 말할 것도 없고, 50~60대도 낯선 번호의 전화를 꺼리는 시대가 됐다. 통화라는 커뮤니케이션 방식 자체가 후퇴...

전화면접 대 ARS, 20년 전쟁의 전말

  전화면접 대 ARS, 20년 전쟁의 전말 한국 여론조사 업계가 방법론 연구 대신 선택한 것 2014년 7월 14일, 한국조사협회(KORA)는 41개 회원사 명의로 결의문을 발표했다. "ARS 여론조사를 수행하지 않겠다." 나아가 언론에도 ARS 조사 결과를 보도하지 말 것을 권고했다. 비과학적이라는 이유였다. 9년 뒤인 2023년 10월, 한국조사협회는 다시 한번 같은 선언을 했다. 이번에는 34개 회원사 명의로 '정치선거 전화여론조사기준'을 제정하며, ARS를 "과학적인 조사 방법이 아닐 뿐만 아니라 통신 환경마저 훼손하는 바람직하지 않은 방식"이라고 규정했다. 같은 주장을 9년 만에 한 번 더 해야 했다는 것은, 2014년의 선언이 작동하지 않았다는 뜻이다. ARS는 어떻게 한국 선거조사 시장을 장악했는가 ARS 조사기관은 1990년대 선거기획사에서 독립한 소규모 업체들로 시작했다. 2000년대 초반 5곳 안팎이던 것이 한때 70여 곳까지 폭발적으로 늘었다. 이유는 단순하다. 싸고 빠르다. 전화면접은 면접원을 고용하고, 교육하고, 관리해야 한다. 조사비는 크게 오르지 않는데 인건비는 계속 올랐다. ARS는 녹음된 음성과 자동 발신 장비만 있으면 된다. 노트북 한 대로 30㎡ 오피스텔에서 운영할 수 있다. 전화면접 대비 비용이 3분의 1에서 4분의 1 수준이다. 정치권은 이 가격에 반응했다. 후보자 개인이, 소규모 정당이, 인터넷 언론사가 여론조사를 의뢰할 수 있게 됐다. 2022년 지방선거 기준, 전체 여론조사의 77.7%가 ARS였다. ARS가 시장을 장악한 것이 아니라, 시장이 ARS를 선택한 것이다. "미국에서도 퇴출된 방식" — 그 비교는 정확한가 한국조사협회와 학계가 ARS를 비판할 때 자주 동원한 레퍼런스가 있다. "미국에서도 ARS(IVR)는 퇴출됐다"는 것이다. 사실 관계만 놓고 보면 틀린 말은 아니다. 미국에서 IVR 여론조사는 ...

리커트 척도, 짝수냐 홀수냐가 문제가 아니다

리커트 척도, 짝수냐 홀수냐가 문제가 아니다 — 단극(Unipolar)과 양극(Bipolar)을 모르면, 척도 설계는 동전 던지기다 서베이 설계를 하다 보면 이런 논쟁을 반드시 만난다. "5점으로 할까요, 4점으로 할까요?" 그리고 대부분 이렇게 결론 난다. "중립 응답이 몰리니까 4점으로 합시다." 이 판단이 맞을 수도 있고, 치명적으로 틀릴 수도 있다. 그 갈림길은  "지금 이 척도가 단극인가, 양극인가" 에 달려 있다. 그런데 놀랍게도 이 질문을 먼저 던지는 사람은 거의 없다. 양극 척도: 두 개의 극이 대칭을 이루는 구조 양극(bipolar) 척도는  의미적으로 반대되는 두 극  사이에 응답자를 위치시킨다. 가장 흔한 예는 이것이다. ① 매우 반대한다 ② 반대한다 ③ 보통이다 ④ 찬성한다 ⑤ 매우 찬성한다 ←← ← ■ 중립 → →→ 여기서 핵심은 "보통이다"가  진짜 중립 이라는 점이다. 찬성도 아니고 반대도 아닌, 의미 있는 제로 포인트(zero point)가 존재한다. 왼쪽으로 갈수록 반대의  강도 가 올라가고, 오른쪽으로 갈수록 찬성의  강도 가 올라간다. 두 방향이  거울처럼 대칭 이다. 양극 척도의 특징: 중립점이 개념적으로 자연스럽다 두 방향 모두 "강도"를 가진다 중립점을 기준으로 좌우가 대칭이다 단극 척도: 하나의 속성이 0에서 Max로 움직이는 구조 단극(unipolar) 척도는  하나의 속성 이 없는 상태에서 최대 상태로 올라가는 구조다. ① 전혀 만족하지 않는다 ② 별로 만족하지 않는다 ③ 약간 만족한다 ④ 매우 만족한다 0 Low Mid High 여기서 "전혀 만족하지 않는다"는  불만족이 아니다.  만족이라는 속성이 제로(0)인 상태다. 반대편에 "불만족"이라는 별도의 극이 존재하지 않는다. 그저 만족의 양이 적은 것이다. 단극 척도의 특징: 의미론적 중립이 존재하지 않는다 (0은 "없음"...

"피시킨의 꿈, 그리고 우리가 치르는 비용"

  들어가며 — 이상한 동거 공론조사, 혹은 숙의조사라 불리는 이 방법론은 오늘날 한국에서도 제법 익숙한 이름이 되었습니다. 정부 정책 결정의 도구로, 갈등 해소의 처방으로, 때로는 민주주의의 업그레이드 버전으로 소개됩니다. 그런데 저는 오늘 이 자리에서 한 가지 불편한 질문을 던지고자 합니다. 공론조사는 과연 '조사'인가요? 혹은 더 직접적으로 — 공론조사는 왜 여론조사 회사가 하고 있습니까? 왜 표본오차를 제시하고, 왜 과학적 절차를 강조합니까? 저는 이것이 단순한 방법론적 혼선이 아니라, 태생부터 내장된 구조적 문제라고 생각합니다. 1부 — 개념의 기원: 철학자의 몽상 공론조사(Deliberative Polling)는 스탠퍼드 대학의 제임스 피시킨(James Fishkin) 교수가 1988년 처음 제안하고, 이후 로버트 러스킨(Robert Luskin)과 함께 발전시킨 방법론입니다. 피시킨의 출발점은 여론조사가 아니었습니다. 그것은 민주주의 이론, 더 정확히는 심의민주주의(deliberative democracy)의 규범적 이상이었습니다. 그가 던진 질문은 이것입니다. "시민들이 충분한 정보를 갖고 진지하게 숙고한다면, 여론은 어떻게 달라질까?" 아름다운 질문입니다. 동시에, 이것은 철저히 규범적(normative) 질문입니다. "~한다면"으로 시작하는, 현실이 아닌 이상 조건의 언어입니다. 피시킨은 하버마스(Jürgen Habermas)의 이상적 담화 상황(ideal speech situation) — 권력과 왜곡 없이 오직 더 나은 논거의 힘만이 작동하는 소통의 공간 — 을 실험실에 구현하고자 했습니다. 이것은 정치철학의 사고실험이었습니다. 문제는, 이 사고실험이 어느 순간 실증적 방법론으로 탈바꿈 했다는 것입니다. 철학의 언어가 통계의 언어로 번역되었고, 규범적 이상이 측정 가능한 수치로 포장되었습니다. 이 번역의 과정이 저는 석연찮습니다. 2부 — 과학의 외피: ...

철학적 몽상은 어떻게 통계학의 탈을 쓰고 거대한 비즈니스가 되었나: 숙의조사의 치명적 역설

  [칼럼] 철학적 몽상은 어떻게 통계학의 탈을 쓰고 거대한 비즈니스가 되었나: 숙의조사의 치명적 역설 신고리 원전 5·6호기 건설 재개부터 대입 제도 개편안, 지역 행정 통합에 이르기까지. 한국 사회에서 첨예한 갈등이 발생할 때마다 전가의 보도처럼 등장하는 해법이 있다. 바로 '숙의조사(공론조사)'다. 무작위로 추출된 시민들이 모여 전문가의 의견을 듣고, 치열한 토론을 거쳐 합의된 결론을 도출해낸다니, 이 얼마나 민주주의의 숭고한 이상에 부합하는 그림인가. 하지만 화려한 온·오프라인 토론 시스템과 두꺼운 결과 보고서 이면을 들여다보면, 우리는 이 제도가 품고 있는 매우 위험하고 본질적인 역설과 마주하게 된다. 제임스 피시킨(James Fishkin) 교수가 고대 아테네의 제비뽑기식 민주주의를 현대 대중사회에 구현해보겠다며 주창한 이 '규범적 철학'은, 어느새 오차범위를 운운하는 '실증적 과학'의 탈을 쓴 채 거대한 정치적·상업적 이벤트로 변질되었다. 당위(Ought)와 실증(Is)의 의도적 혼동 여론조사의 본령은 철저히 관찰에 있다. 현실에 발을 딛고 있는 대중이 현재 어떤 생각을 하고 있는지(Is)를 오염 없이 측정하는 척도여야 한다. 반면 숙의조사는 '완벽한 정보와 충분한 토론 시간이 주어졌다면 대중은 이렇게 생각해야 한다(Ought)'는 가치 개입적이고 인위적인 실험이다. 주최 측이 정교하게 설계한 정보의 틀(프레이밍) 안에서 도출된 온실 속의 결과물을, 마치 자연 상태의 민심을 과학적으로 측정한 것인 양 포장하는 것은 조사 방법론에 대한 기만이다. '생태학적 타당도'를 상실한 유사 전문가들의 탄생 숙의조사를 주관하는 측은 늘 표본의 '대표성'을 강조한다. 하지만 생업을 뒤로하고 주말 내내 수백 페이지의 자료집을 읽으며 전문가의 강의를 소화해 낸 500명의 참여자는, 더 이상 출퇴근길에 뉴스를 힐끗 보며 일상을 살아가는 '일반 시민'이 아니다. 이들은...

여론조사의 부활: 2024 미국 대선 조사는 어떻게 '위기'를 '정확도'로 바꿨나? (AAPOR 보고서 심층 요약)

이미지
2016년과 2020년, 미국 대선 여론조사는 "트럼프의 숨은 표(Shy Trump)"를 잡아내지 못하며 '여론조사 위기론'에 시달렸습니다. "더 이상 조사는 믿을 수 없다"는 회의론이 팽배했던 2024년, 결과는 어땠을까요? 최근 미국여론조사협회(AAPOR)가 발간한 2024년 대선 여론조사 평가 보고서에 따르면, 이번 대선은 "여론조사가 신뢰를 회복한 해"이자 "조사(Survey)가 공학(Engineering)으로 진화한 분기점"이었습니다. 보고서의 핵심 내용을 4가지 포인트로 정리해 봅니다. 1. 성적표: 수십 년 만에 가장 정확했다 가장 먼저 눈에 띄는 것은 극적으로 개선된 정확도 수치입니다. 단순히 "맞췄다" 수준이 아니라, 오차 범위를 대폭 줄였습니다. 오차의 급격한 감소: 선거 직전 2주간 실시된 조사의 평균 절대 오차는 3.3%포인트 였습니다. 이는 2020년(5.3%p)과 2016년(5.2%p)에 비해 오차를 약 40% 가까이 줄인 성과입니다 . 주(State) 단위 조사의 부활: 특히 선거인단 승부를 가르는 경합주 조사가 중요했는데, 이번 주 단위 조사의 정확도는 1944년 이후 가장 정확한 수준(평균 오차 3.0%p)을 기록했습니다 . 편향(Bias)의 축소: 여전히 민주당 지지율을 실제보다 높게 예측하는 경향은 있었으나(+2.7%p), 2020년(+4.6%p)에 비하면 그 '거품'이 절반 수준으로 빠졌습니다 . 2. 승리 요인: '어떻게 묻느냐'보다 '어떻게 계산하느냐' (The Engineering) 많은 사람들이 "전화 대신 온라인으로 해서 맞춘 것 아니냐?"라고 묻지만, 보고서는 "단일한 해결책(Silver Bullet)은 없었다"고 말합니다 . 대신, 데이터를 다루는 공학적 접근(Engineering)이 승패를 갈랐습니다. ① 믹스 방법론 (Mix...