2026년 4월 5일 일요일

조사구 대신 한국형 MAF를 만들자: 통계조사 패러다임 전환을 위한 제언

들어가며: 우리는 왜 아직 문을 두드리고 있나

매년 수십 개의 국가 승인 통계가 생산된다. 사회조사, 가계조사, 주거실태조사, 농림어업총조사…. 이 조사들은 하나같이 비슷한 방식으로 시작된다. 훈련받은 조사원이 지정된 구역을 찾아가고, 모르는 집의 초인종을 누르고, 때로는 여러 번 다시 찾아가며 응답을 구한다. 2025년, 스마트폰으로 주민등록을 갱신하고 병원 예약을 하는 나라에서.

왜 우리는 아직 문을 두드리고 있을까.

답은 간단하지 않다. 기술이 없어서가 아니다. 의지가 없어서도 아니다. 문제는 구조다. 정확히는 표집틀(Sampling Frame) 이라는 조사방법론의 가장 기초적인 개념에서 시작된다. 그리고 그 구조를 바꾸는 열쇠가 바로 우리가 이 글에서 이야기할 한국형 MAF(Master Address File) 다.

1. 표집틀이란 무엇이고, 왜 중요한가

통계조사에서 표집틀은 '누구를 뽑을 수 있는가'를 결정하는 모집단의 목록이다. 선거로 비유하면 유권자 명부다. 명부에 없는 사람은 애초에 선거에 참여할 수 없듯, 표집틀에 없는 가구는 조사 대상이 될 수 없다.

한국의 주요 국가 통계조사는 조사구(Enumeration District) 를 표집틀로 사용한다. 조사구는 전국을 약 60가구 규모의 지역 단위로 쪼갠 것이다. 통계청은 이 조사구를 1차로 뽑고, 현장에 조사원을 보내 그 안의 가구를 확인한 뒤 2차로 일부 가구를 표본으로 선정한다.

이 방식의 장점은 명확하다. 인터넷도 없고 전화번호도 모르는 가구까지 포함할 수 있고, 지역 단위로 층화(stratification)가 가능하다. 1950년대 이후 전 세계 대부분의 국가 통계가 이 방식으로 운영됐다.

그러나 결정적인 한계가 있다. 조사구는 지역 경계선일 뿐, 개별 가구의 연락처를 담고 있지 않다. 그래서 조사원이 직접 가야 한다. 가구를 확인하고, 목록을 만들고, 방문하고, 설득하고, 재방문하는 모든 과정이 사람의 발품을 전제로 설계되어 있다.

2. 미국은 어떻게 했나: MAF의 탄생과 진화

미국 인구조사국(Census Bureau)은 오래전부터 이 문제를 다른 방식으로 풀었다. MAF(Master Address File), 즉 주소 마스터 파일이다.

MAF는 미국 전역의 모든 거주지 주소를 통합한 데이터베이스다. 단순한 주소록이 아니다. 우편 배달 데이터(USPS), 건물 허가 정보, 지역 정부 기록 등을 지속적으로 연계해 '지금 실제로 사람이 살고 있는 주소'를 실시간에 가깝게 유지한다. 여기에 Title 13이라는 연방법이 뒷받침되어, 인구조사국은 다른 연방기관의 데이터를 통계 목적으로 활용할 수 있는 강력한 법적 권한을 갖는다.

이 MAF가 있기 때문에 미국의 미국지역사회조사(ACS)는 다음과 같은 방식이 가능하다. 표본으로 선정된 주소로 등기 우편을 발송한다. 우편 안에는 웹 응답 URL과 개인 고유 코드가 들어 있다. 응답자는 집에서 컴퓨터나 스마트폰으로 접속해 설문을 완성한다. 한 달이 지나도 응답이 없으면 종이 설문지를 다시 보낸다. 그래도 안 되면 전화, 그래도 안 되면 대면 방문이 따라온다.

결과적으로 ACS는 조사원이 직접 방문하지 않고도 전체 응답의 상당 부분을 웹과 우편으로 수집한다. 조사원 방문은 최후의 수단이다. 비용은 대폭 낮아지고, 응답자 편의는 높아지고, 응답 품질도 유지된다.

조사구 기반 한국 방식과의 차이는 단순히 '웹이냐 대면이냐'의 문제가 아니다. 표집 설계의 출발점 자체가 다르다. 한국은 지역 면적에서 시작하고, 미국은 주소에서 시작한다. 이 차이가 모든 것을 결정한다.

3. 한국의 조건: 재료는 이미 있다

흥미로운 사실이 있다. 기술적 관점에서 보면 한국은 MAF를 만들기에 미국보다 유리한 조건을 갖추고 있다.

미국이 MAF를 구축하기 위해 USPS와 수십 년에 걸쳐 협력 체계를 만들어야 했던 것과 달리, 한국에는 이미 개별 가구 단위의 행정 데이터가 여러 곳에 존재한다.

주민등록 주소(행정안전부) 는 전 국민의 거주지를 실시간으로 추적한다. 이사할 때마다 갱신이 의무화되어 있다. 건강보험 가입자 주소(국민건강보험공단) 는 사실상 전 국민을 커버한다. 도로명주소 전산 DB(행정안전부) 는 모든 건물과 호수를 디지털로 관리한다. 건축물대장(국토교통부) 은 용도, 층수, 가구 수까지 담고 있다.

이 네 가지를 연계하면 '지금 실제로 사람이 사는 주소 명부'는 이론적으로 내일이라도 만들 수 있다. 기술 개발 기간이 필요한 것이 아니다. 데이터는 이미 존재한다.

그렇다면 왜 안 되고 있는가.

4. 세 개의 벽: 법, 칸막이, 관성

첫 번째 벽은 법이다.

개인정보보호법은 정보 주체의 동의 없이 개인정보를 다른 목적으로 활용하는 것을 제한한다. 행안부가 주민등록 주소를 수집한 목적은 통계조사가 아니다. 따라서 통계청이 이를 활용하려면 별도의 법적 근거가 필요하다.

미국의 Title 13에 해당하는 조항이 현행 통계법에는 없다. 통계청이 다른 부처의 행정자료를 통계 목적으로 연계하는 것을 허용하는 규정은 일부 있지만, 강제성이 약하고 범위도 제한적이다. 진정한 한국형 MAF를 구축하려면 통계법 또는 별도 특별법 수준의 입법이 필요하다.

두 번째 벽은 부처 간 칸막이다.

행안부, 국토부, 복지부, 통계청은 각자의 데이터를 각자의 목적으로 관리한다. 부처 간 데이터 연계는 협력이 아니라 협상의 영역이다. 어느 부처가 주도권을 갖느냐, 데이터 품질 책임은 누가 지느냐, 보안 사고 발생 시 책임 소재는 어디냐 같은 문제들이 실무 협력을 어렵게 만든다.

이는 한국만의 문제가 아니다. 미국도 Census Bureau와 USPS의 데이터 협력 체계를 구축하는 데 수십 년이 걸렸다. 그러나 미국은 Title 13이라는 강제 규정이 있었다. 한국은 아직 그 수준의 제도적 기반이 없다.

세 번째 벽은 관성이다.

어떤 의미에서 이것이 가장 높은 벽일 수 있다. 조사구 방식은 70년 이상 운영되어 온 검증된 시스템이다. 그것을 기반으로 훈련된 조사원 네트워크가 있고, 설계된 조사표가 있고, 쌓인 시계열 데이터가 있다. 방식을 바꾸면 과거 데이터와의 비교 가능성이 흔들릴 수 있다는 우려도 있다.

무엇보다, 지금도 통계는 나오고 있다. 시급한 위기감이 없는 것이다. 패러다임 전환은 위기가 닥쳤을 때 일어나거나, 비전이 강력할 때 일어난다. 지금 한국 통계 인프라는 어느 쪽 압력도 충분하지 않은 상태다.

5. 비용 이야기: 사실 경제적 논리가 제일 강하다

여기서 잠깐 현실적인 이야기를 하자.

조사구 기반 대면 조사는 비싸다. 조사원 모집, 훈련, 현장 supervision, 재방문 비용, 그리고 조사원 인건비. 국가 주요 통계조사 하나를 수행하는 데 드는 비용은 억 단위를 쉽게 넘는다. 표본 규모가 수만 명에 달하는 사회조사 같은 경우는 더하다.

반면 MAF 기반 웹 우선 조사는 어떨까. 주소로 우편을 발송하는 비용, 웹 시스템 운영 비용, 무응답 가구에 대한 전화·방문 후속 비용. 미국 ACS의 경험에 따르면 웹 응답 1건의 비용은 대면 응답 1건 비용의 수분의 일에 불과하다. 전체 조사비용은 구조적으로 낮아진다.

물론 MAF 구축과 유지에도 비용이 든다. 그러나 이것은 일회성 투자가 아닌 인프라 투자다. MAF가 완성되면 그것을 활용하는 모든 조사에서 비용 절감 효과가 발생한다. 통계청의 수십 개 조사가 공통으로 혜택을 누린다.

장기적으로는 MAF 구축 비용을 조사비용 절감으로 충분히 상쇄할 수 있다는 것이 선진국들의 경험이다. 경제적 논리만으로도 한국형 MAF는 충분히 타당한 투자다.

6. 반론에 답하다

"조사구 주소로도 우편 발송이 가능하지 않나?"

조사구 기반 표집은 2단계다. 1단계에서 조사구를 뽑고, 2단계에서 그 안의 가구를 현장에서 확인한 후 표본을 선정한다. 조사구 경계는 알아도, '이 조사구 안에서 표본이 될 가구의 주소'는 현장 listing 작업 전까지 존재하지 않는다. 조사원이 가야 그 주소를 알 수 있다. 순서가 바뀌지 않는다.

"개인정보 침해 우려가 있지 않나?"

정당한 우려다. 그러나 MAF 자체는 통계 목적의 주소 명부이지 개인 식별 정보가 결합된 데이터베이스가 아니다. 미국 MAF도 이름, 성별, 소득 같은 개인정보는 담지 않는다. 주소라는 공간 정보만 관리한다. 법적 근거와 접근 통제를 제대로 설계하면 개인정보보호와 통계 목적 활용은 충분히 양립 가능하다.

"시계열 비교가 깨지는 문제는?"

실제로 중요한 방법론적 문제다. 수집 방식이 바뀌면 응답 패턴도 바뀌고, 과거 데이터와의 단절이 생길 수 있다. 그러나 이것은 전환을 하지 말자는 이유가 아니라, 전환을 어떻게 설계하느냐의 문제다. 미국도 ACS에 인터넷 응답을 도입할 때 수년간의 병행 테스트와 모드 효과(mode effect) 연구를 거쳤다. 급진적 전환이 아닌 점진적 전환이 답이다.

7. 어떻게 시작할 것인가: 단계적 로드맵

한국형 MAF는 하루아침에 만들어질 수 없다. 그러나 시작할 수는 있다.

1단계 (1~2년): 파일럿 연구와 법적 기반 마련

통계청이 주도해 행안부, 국토부, 건보공단의 주소 데이터를 연계한 시범 명부를 구축한다. 실제 통계조사 한두 개를 대상으로 기존 조사구 방식과 병행 테스트를 실시한다. 이 과정에서 데이터 품질, 커버리지, 연계 오류율 등을 점검한다. 동시에 통계법 개정 또는 특별법 제정을 위한 법률 검토를 시작한다.

2단계 (3~5년): 제도화와 확대

시범 연구 결과를 바탕으로 법적 근거를 마련하고, 부처 간 데이터 연계 협력 체계를 제도화한다. MAF를 활용한 웹 우선 조사를 일부 조사에 공식 도입하고, 조사원 역할을 점진적으로 재정의한다. 조사원은 현장 listing 담당에서 무응답 추적·디지털 취약 계층 지원으로 역할이 전환된다.

3단계 (5년 이후): 전면 전환

MAF가 모든 주요 통계조사의 공식 표집틀이 된다. 조사구는 지리적 층화 변수로만 활용된다. 웹·우편이 1차 수단이 되고, 전화·대면은 보완 수단이 된다.

맺으며: 패러다임 전환은 인프라에서 시작된다

통계조사 방법론의 역사는 인프라의 역사다. 전화가 보급되자 전화 조사가 생겨났고, 인터넷이 보급되자 웹 조사가 등장했다. 지금 우리는 데이터 인프라의 대전환기에 서 있다. 행정 데이터, 공공 데이터, 민간 데이터가 빠르게 디지털화되고 연계되고 있다.

한국형 MAF는 단순히 조사 방식 하나를 바꾸는 것이 아니다. 국가 통계 인프라의 기초를 다시 놓는 작업이다. 조사구라는 70년 된 표집틀에서 주소 명부라는 새로운 표집틀로의 전환, 조사원 중심에서 응답자 편의 중심으로의 전환, 일회성 현장 작업에서 지속 갱신 데이터베이스로의 전환.

기술은 준비되어 있다. 재료도 있다. 남은 것은 결단이다.

문을 두드리는 방식으로 20세기를 보낸 우리 통계가, 21세기의 방식으로 나아갈 준비가 되어 있는지 묻고 싶다.

산소마스크를 단 전화조사?

산소마스크를 단 전화조사

좋은 인프라가 혁신을 지연시킬 때

한국 전화조사의 축복

한국의 공표용 선거여론조사 환경은 세계적으로 보기 드문 축복을 누리고 있다.

가상번호(안심번호) 제도는 이동통신사 가입자 전체에서 성별, 연령, 지역 기준으로 무작위 추출된 전화번호를 제공한다. 사실상 확률 표본에 가까운 표집틀을 국가가 만들어주는 것이다. 전화면접이든 ARS든 관계없이 이 번호를 받을 수 있고, 오토다이얼링으로 휴대전화에 자유롭게 발신할 수 있다. 법적 제약이 없다.

이것이 얼마나 특별한 환경인지는 미국과 비교하면 분명해진다.

미국에는 1991년에 제정된 TCPA(Telephone Consumer Protection Act)라는 법이 있다. 이 법은 사전 동의 없이 자동 다이얼러(autodialer)로 휴대전화에 전화를 거는 것을 금지한다. 여론조사도 예외가 아니다. 미국에서 휴대전화로 여론조사를 하려면, 면접원이 전화번호를 손으로 직접 눌러야 한다. 수백 명의 면접원이 물리적으로 번호를 찍는 것이다.

유선전화에서는 오토다이얼링이 가능했지만, 유선전화 보유 가구가 급감하면서 커버리지가 무너졌다. 휴대전화를 포함하려면 수동 다이얼링 비용을 감수해야 한다. 전화조사의 비용이 계속 올라가는 동안 웹조사의 비용은 계속 떨어졌고, 미국의 조사업계는 비확률 온라인 패널 중심으로 재편됐다. 확률 표본이라는 전화조사의 핵심 장점을 사실상 포기한 것이다.

한국은 이 딜레마가 없다. 오토다이얼링이 자유롭고, 가상번호가 확률 기반 표집틀을 제공하고, 소지역 타겟팅까지 가능하다. 미국이 비용과 법 때문에 포기한 것들을 한국은 다 갖고 있다. 전화조사를 하기에 이보다 좋은 환경은 세계 어디에도 없다.

그런데 전화를 안 받는다

문제는 전화를 받는 쪽에서 일어났다.

모르는 번호로 걸려오는 전화를 받는 것은 이미 일상적인 행위가 아니다. 젊은 층은 말할 것도 없고, 50~60대도 낯선 번호의 전화를 꺼리는 시대가 됐다. 통화라는 커뮤니케이션 방식 자체가 후퇴하고 있다. 카카오톡 메시지를 보내는 것이 자연스러운 사회에서, 녹음된 목소리가 질문을 읽어주고 버튼을 누르라고 하는 ARS는 물론, 사람이 직접 말을 거는 전화면접조차 어색한 접촉 방식이 되어가고 있다.

응답률은 이 변화를 숫자로 보여준다. 표집틀이 아무리 좋아도, 전화를 안 받으면 그 표집틀에 도달할 수 없다. 가상번호가 확률 기반으로 완벽하게 추출되어 있어도, 그 번호의 주인이 전화를 받지 않으면 비응답 편향이 발생한다. 인프라의 질과 무관하게, 전화라는 모드 자체의 수용성이 떨어지고 있는 것이다.

전화를 받는 사람들은 점점 더 특정한 부류로 좁혀진다. 시간 여유가 있는 사람, 조사에 관심이 있는 사람, 정치적으로 동기화된 사람. 표집틀은 모집단 전체를 대표하지만, 실제로 응답하는 사람은 모집단의 일부다. 그 일부가 전체를 대표한다고 보기는 점점 어려워지고 있다.

산소마스크의 역설

여기서 역설이 발생한다.

한국의 전화조사 인프라가 나빴다면, 전화조사는 진작 쇠퇴했을 것이다. 미국처럼 비용이 감당이 안 되고, 법적 제약에 부딪히고, 표집틀이 무너지면서 자연스럽게 다른 방법론으로 전환했을 것이다. 그 과정이 고통스럽더라도, 커뮤니케이션 환경의 변화에 맞는 조사 방법론을 일찍 찾았을 수도 있다.

그러나 한국의 인프라는 너무 좋았다. 가상번호는 계속 나왔고, 오토다이얼링은 계속 가능했고, 비용은 여전히 감당할 수 있는 수준이었다. 환자에게 산소마스크를 달아준 것과 같다. 환자가 살아 있는 것은 맞지만, 그것이 회복은 아니다. 산소마스크가 좋을수록 환자는 자가 호흡을 시도할 동기를 잃는다.

미국이 TCPA 때문에 일찍 전화를 포기하고 웹으로 넘어간 것이, 결과적으로는 커뮤니케이션 환경 변화에 먼저 적응한 셈이 됐다. 미국의 전환이 자발적이었다고 보기는 어렵다. 법이 강제한 측면이 크다. 그러나 결과적으로 미국 조사업계는 온라인 패널, 혼합모드, 주소 기반 표집(ABS) 등 대안적 방법론을 먼저 탐색하고 발전시켰다. 물론 비확률 표본이라는 새로운 문제를 안게 됐지만, 적어도 "전화를 안 받는 사회"에 대한 적응은 한국보다 먼저 시작됐다.

한국은 인프라가 좋았기 때문에 오히려 전환이 늦었다. 전화조사가 아직 돌아가니까 굳이 바꿀 이유를 느끼지 못한 것이다. 그 사이 사회의 커뮤니케이션 방식은 돌이킬 수 없이 바뀌었다.

산소마스크를 떼는 방법

전화조사의 산소마스크를 단번에 떼어낼 수는 없다. 당장 대체할 완벽한 방법이 없기 때문이다. 그러나 자가 호흡으로의 전환을 준비하는 것은 가능하다.

이동통신사 고객 대상 휴대전화웹조사(문자조사)는 그 전환의 한 경로다. 같은 가상번호 인프라를 사용하되, 전화를 거는 것이 아니라 문자를 보내는 것이다. 확률 기반 표집틀이라는 전화조사의 핵심 강점은 유지하면서, 접촉 방식만 현재의 커뮤니케이션 습관에 맞게 바꾸는 것이다.

문자는 전화와 다르다. 전화는 상대방의 시간을 즉시 점유한다. 지금 당장 받아야 하고, 지금 당장 답해야 한다. 문자는 수신자가 자신의 시간에 맞춰 열어볼 수 있다. 웹설문 링크를 받아 자신이 편한 시간에 응답하는 것은, 낯선 번호의 전화를 받아 녹음된 목소리에 버튼을 누르는 것보다 훨씬 자연스러운 행위다.

물론 문자조사에도 한계는 있다. 고연령층의 웹설문 완료율이 낮다는 것은 앞서 다른 글에서 다루었다. 그러나 이 한계는 고연령층의 디지털 리터러시가 시간이 지나면서 자연스럽게 향상되는 방향으로 해소될 가능성이 있다. 오늘의 60대는 10년 전의 60대보다 스마트폰에 익숙하다. 전화 응답률의 하락은 구조적이고 비가역적이지만, 웹설문 완료율의 상승은 세대 교체와 함께 점진적으로 일어나고 있다.

인프라를 살리는 것은 모드를 바꾸는 것이다

한국이 가진 가상번호 인프라는 진짜 자산이다. 확률 기반 표집틀을 국가가 제공하는 나라는 드물다. 이 인프라를 버릴 이유는 없다.

그러나 이 인프라 위에 올리는 접촉 방식은 바뀌어야 한다. 가상번호로 전화를 거는 시대에서, 가상번호로 문자를 보내는 시대로. 표집틀은 그대로 두고, 모드만 전환하는 것이다.

한국 조사업계가 20~30년 동안 전화면접이냐 ARS냐를 놓고 싸우는 사이, 정작 중요한 질문은 따로 있었다. 전화라는 모드 자체가 언제까지 유효한가. 그 질문에 답하는 것이 인프라의 가치를 지키는 길이다.

산소마스크를 달고 있는 동안 자가 호흡을 준비해야 한다. 마스크가 좋다고 영원히 의존할 수는 없다.

전화면접 대 ARS, 20년 전쟁의 전말

한국 여론조사 업계가 방법론 연구 대신 선택한 것

2014년 7월 14일, 한국조사협회(KORA)는 41개 회원사 명의로 결의문을 발표했다. "ARS 여론조사를 수행하지 않겠다." 나아가 언론에도 ARS 조사 결과를 보도하지 말 것을 권고했다. 비과학적이라는 이유였다.

9년 뒤인 2023년 10월, 한국조사협회는 다시 한번 같은 선언을 했다. 이번에는 34개 회원사 명의로 '정치선거 전화여론조사기준'을 제정하며, ARS를 "과학적인 조사 방법이 아닐 뿐만 아니라 통신 환경마저 훼손하는 바람직하지 않은 방식"이라고 규정했다.

같은 주장을 9년 만에 한 번 더 해야 했다는 것은, 2014년의 선언이 작동하지 않았다는 뜻이다.

ARS는 어떻게 한국 선거조사 시장을 장악했는가

ARS 조사기관은 1990년대 선거기획사에서 독립한 소규모 업체들로 시작했다. 2000년대 초반 5곳 안팎이던 것이 한때 70여 곳까지 폭발적으로 늘었다. 이유는 단순하다. 싸고 빠르다.

전화면접은 면접원을 고용하고, 교육하고, 관리해야 한다. 조사비는 크게 오르지 않는데 인건비는 계속 올랐다. ARS는 녹음된 음성과 자동 발신 장비만 있으면 된다. 노트북 한 대로 30㎡ 오피스텔에서 운영할 수 있다. 전화면접 대비 비용이 3분의 1에서 4분의 1 수준이다.

정치권은 이 가격에 반응했다. 후보자 개인이, 소규모 정당이, 인터넷 언론사가 여론조사를 의뢰할 수 있게 됐다. 2022년 지방선거 기준, 전체 여론조사의 77.7%가 ARS였다. ARS가 시장을 장악한 것이 아니라, 시장이 ARS를 선택한 것이다.

"미국에서도 퇴출된 방식" — 그 비교는 정확한가

한국조사협회와 학계가 ARS를 비판할 때 자주 동원한 레퍼런스가 있다. "미국에서도 ARS(IVR)는 퇴출됐다"는 것이다. 사실 관계만 놓고 보면 틀린 말은 아니다. 미국에서 IVR 여론조사는 사실상 소멸했다. 그러나 퇴출의 이유가 다르다.

미국에는 1991년에 제정된 TCPA(Telephone Consumer Protection Act)라는 법이 있다. 이 법은 사전 동의 없이 휴대전화에 자동 다이얼러(autodialer)로 전화를 거는 것을 금지한다. 여론조사도 예외가 아니다. 면접원이 휴대전화에 전화를 걸려면 번호를 일일이 손으로 눌러야 한다. 자동 발신이 허용되는 건 유선전화뿐이다.

미국의 IVR 조사기관들은 유선전화에서만 자동 발신으로 조사를 돌릴 수 있었다. 유선전화 보급률이 급감하면서 커버리지가 무너졌고, IVR은 자연스럽게 퇴조했다. Rasmussen Reports 같은 대표적 IVR 업체는 유선전화 IVR에 온라인 패널을 결합하는 하이브리드 방식으로 전환했다.

한국은 상황이 완전히 다르다. 한국에서는 공표용 여론조사로 등록하면 전화면접이든 ARS든 관계없이 가상번호를 제공받을 수 있고, 자동 다이얼링으로 휴대전화에 얼마든지 발신할 수 있다. 법적 제약이 없다. 따라서 미국에서 IVR이 퇴출된 구조적 원인 — 휴대전화 자동 발신 금지로 인한 커버리지 붕괴 — 이 한국에는 존재하지 않는다.

"미국에서도 퇴출됐다"는 말은 사실이지만, 퇴출 사유가 다른 두 나라를 하나의 결론으로 묶는 것은 정확한 비교가 아니다.

규제가 인증이 되는 역설

한국조사협회가 ARS를 퇴출하려 했던 시기에, 한국의 제도 환경은 오히려 ARS를 공인하는 방향으로 움직였다.

중앙선거여론조사심의위원회(여심위)가 만들어지고, 여론조사기관 등록 체계가 정비됐다. ARS 조사기관도 여심위에 등록할 수 있었다. 가상번호(안심번호) 제도가 도입됐을 때, ARS 기관도 동일하게 가상번호를 발급받을 수 있었다. 등록하고, 번호를 받고, 조사 결과를 공표하는 절차에서 전화면접과 ARS 사이에 제도적 차별은 없었다.

ARS를 비과학적이라고 선언한 것은 한국조사협회였지만, 제도는 ARS를 과학적 여론조사와 동일한 자격으로 인정했다. 규제 체계가 의도치 않게 ARS에 정당성을 부여한 것이다. 퇴출하려 했는데 인증이 된 셈이다.

20년 동안 놓친 것들

내가 이 글에서 말하고 싶은 것은 ARS가 좋다거나 나쁘다는 판단이 아니다. ARS에는 분명한 한계가 있다. 응답자의 성별과 연령을 확인할 수 없고, 응답률이 낮아 정치 고관여층이 과대 대표되며, 문항 수와 질문 방식에 제약이 크다. 자동응답이라는 조사 방식의 구조적 특성에서 오는 문제들이고, 이것은 부정하기 어렵다.

그러나 한국 조사업계를 대표하는 기관이 20~30년의 시간을 이 싸움에 집중한 것은 다른 문제다.

그 시간 동안 세계 조사업계에서는 많은 일이 벌어졌다. 온라인 패널 조사가 주류로 올라섰다. 모바일웹 조사가 등장했다. 혼합모드(mixed-mode) 설계가 표준이 되어갔다. 비확률 표본의 보정 방법론이 발전했다. 응답률 하락이라는 전 세계적 현상에 대한 대응 연구가 쏟아졌다. 그리고 지금은 합성 응답자(synthetic respondent)까지 논의되고 있다.

한국조사협회가 ARS 퇴출에 에너지를 쏟는 동안, 이 방법론적 변화들에 대한 업계 차원의 체계적 연구와 대응은 상대적으로 부족했다. 전화면접이라는 기존 방식을 지키기 위해 ARS라는 적을 만드는 데 집중했지, 전화면접 자체의 한계를 인정하고 대안적 방법론을 탐색하는 데는 같은 수준의 열정을 보이지 않았다.

전화면접도 응답률이 하락하고 있다. 전화면접도 정치 고관여층 편향에서 자유롭지 않다. 전화면접도 젊은 층에 대한 접근성이 떨어진다. 이것은 ARS의 문제가 아니라 전화조사 전체의 구조적 문제다. ARS를 없앤다고 해결되는 문제가 아니었다.

2026년 4월 4일 토요일

리커트 척도, 짝수냐 홀수냐가 문제가 아니다

— 단극(Unipolar)과 양극(Bipolar)을 모르면, 척도 설계는 동전 던지기다

서베이 설계를 하다 보면 이런 논쟁을 반드시 만난다.

"5점으로 할까요, 4점으로 할까요?"

그리고 대부분 이렇게 결론 난다.

"중립 응답이 몰리니까 4점으로 합시다."

이 판단이 맞을 수도 있고, 치명적으로 틀릴 수도 있다. 그 갈림길은 "지금 이 척도가 단극인가, 양극인가"에 달려 있다. 그런데 놀랍게도 이 질문을 먼저 던지는 사람은 거의 없다.

양극 척도: 두 개의 극이 대칭을 이루는 구조

양극(bipolar) 척도는 의미적으로 반대되는 두 극 사이에 응답자를 위치시킨다. 가장 흔한 예는 이것이다.

① 매우 반대한다	② 반대한다	③ 보통이다	④ 찬성한다	⑤ 매우 찬성한다
←←	←	■ 중립	→	→→

여기서 핵심은 "보통이다"가 진짜 중립이라는 점이다. 찬성도 아니고 반대도 아닌, 의미 있는 제로 포인트(zero point)가 존재한다. 왼쪽으로 갈수록 반대의 강도가 올라가고, 오른쪽으로 갈수록 찬성의 강도가 올라간다. 두 방향이 거울처럼 대칭이다.

양극 척도의 특징:

중립점이 개념적으로 자연스럽다
두 방향 모두 "강도"를 가진다
중립점을 기준으로 좌우가 대칭이다

단극 척도: 하나의 속성이 0에서 Max로 움직이는 구조

단극(unipolar) 척도는 하나의 속성이 없는 상태에서 최대 상태로 올라가는 구조다.

① 전혀 만족하지 않는다	② 별로 만족하지 않는다	③ 약간 만족한다	④ 매우 만족한다
0	Low	Mid	High

여기서 "전혀 만족하지 않는다"는 불만족이 아니다. 만족이라는 속성이 제로(0)인 상태다. 반대편에 "불만족"이라는 별도의 극이 존재하지 않는다. 그저 만족의 양이 적은 것이다.

단극 척도의 특징:

의미론적 중립이 존재하지 않는다 (0은 "없음"이지 "중간"이 아니다)
방향이 하나뿐이다 — 낮음에서 높음으로
개념적 제로 포인트가 한쪽 끝에 있다

그래서 척도수와 무슨 상관인가

여기가 핵심이다.

양극 척도와 홀수점의 궁합

양극 척도에는 중립점이 필수다. 찬성과 반대 사이에 "어느 쪽도 아닌" 지점이 개념적으로 자연스럽기 때문이다. 따라서 양극 척도에는 홀수점(5점, 7점)이 구조적으로 맞는다.

그런데 만약 양극 척도에 짝수점(4점)을 쓰면?

① 반대한다	② 약간 반대한다	③ 약간 찬성한다	④ 찬성한다
←	←	→	→

중립이 사라진다. 진심으로 "어느 쪽도 아닌" 응답자에게 어느 한쪽을 억지로 고르게 만드는 것이다. 이것을 강제 선택(forced choice)이라고 부른다.

강제 선택이 항상 나쁜 것은 아니다. 정치적 태도 조사에서 "찬성이야 반대야, 하나만 골라"라는 의도가 분명하다면 짝수점 양극 척도는 전략적 선택이 될 수 있다. 하지만 중요한 것은 이것이 의도적인 설계여야 한다는 것이다. "중립 응답이 많아서 짝수로 바꿨어요"라는 것과 "양극 구조에서 명확한 방향성을 확인하기 위해 강제 선택을 적용했습니다"는 설계 철학이 완전히 다르다.

단극 척도와 짝수점의 궁합

단극 척도에는 의미론적 중립이 원래 없다. 만족도가 0에서 Max로 올라가는 구조에서 "중간"이란 무엇인가? "반쯤 만족한다"일 뿐이지, "만족도 아니고 불만족도 아니다"가 아니다.

따라서 단극 척도에서는 짝수점이 오히려 자연스럽다.

반대로, 단극 척도에 5점을 쓰면서 가운데에 "보통이다"를 넣으면 어떻게 될까?

① 전혀 만족하지 않는다

② 별로 만족하지 않는다

③ 보통이다 (?)

④ 약간 만족한다

⑤ 매우 만족한다

③ "보통이다"가 여기서 대체 무슨 의미인가? 만족이 중간쯤 있다는 뜻인가, 만족도 불만족도 아니라는 뜻인가? 단극 척도에는 "어느 쪽도 아닌" 상태가 개념적으로 존재하지 않기 때문에, 이 중간점은 해석의 모호성을 만들 뿐이다.

실전에서 자주 보이는 혼동

사례 1: 만족도를 양극으로 설계

① 매우 불만족

② 불만족

③ 보통

④ 만족

⑤ 매우 만족

한국 서베이에서 가장 흔하게 보이는 만족도 척도다. 그런데 이 척도는 양극인가, 단극인가?

"불만족"과 "만족"을 반대 극으로 본다면 양극이다. 하지만 심리측정학적으로 보면 불만족과 만족이 정말로 하나의 연속선 위에 있는 반대 개념인지는 논쟁적이다. 허츠버그(Herzberg)의 2요인 이론처럼, 만족의 원인과 불만족의 원인이 다른 차원이라면 이 둘을 하나의 양극 척도에 올려놓는 것 자체가 타당하지 않을 수 있다.

실무적 판단은 이렇다:

"귀하의 삶에 얼마나 만족하십니까?" → 단극에 가깝다. 삶의 만족도라는 하나의 속성이 0에서 Max로 움직인다.
"이 정책에 대해 어떻게 생각하십니까?" → 양극에 가깝다. 지지와 반대라는 두 극이 존재한다.

같은 "만족"이라는 단어를 쓰더라도, 질문의 맥락에 따라 단극과 양극이 달라진다.

사례 2: 빈도를 양극으로 설계

① 전혀 하지 않는다

② 거의 하지 않는다

③ 보통 (?)

④ 자주 한다

⑤ 매우 자주 한다

빈도는 본질적으로 단극이다. 0회에서 N회까지 올라갈 뿐, "자주 하지 않는다"가 "자주 한다"의 반대 극이 되지 않는다. ③ "보통"은 아무런 의미가 없다. 빈도의 중간이 "보통"이라니, 그게 일주일에 몇 번인가?

올바른 설계:

① 전혀 하지 않는다

② 거의 하지 않는다

③ 가끔 한다

④ 자주 한다

4점 단극. 방향이 하나고, 제로에서 시작한다. 깔끔하다.

사례 3: 동의 척도의 함정

① 전혀 동의하지 않는다

② 동의하지 않는다

③ 보통

④ 동의한다

⑤ 매우 동의한다

리커트가 원래 제안한 척도가 바로 이것이다. 이건 양극인가, 단극인가?

"동의하지 않는다"와 "동의한다"가 반대 극이므로 양극이라고 볼 수 있다. 하지만 DeVellis 같은 학자들은 동의 척도가 실제로는 단극적으로 작동한다고 주장한다. "동의하지 않는다"는 "동의한다"의 진정한 반대가 아니라, 동의라는 속성이 약한 상태일 뿐이라는 것이다.

이 논쟁은 여전히 열려 있다. 중요한 것은 설계자가 이 질문을 던졌느냐다.

정리: 척도수를 정하기 전에 물어야 할 질문

척도수(4점, 5점, 7점…)를 먼저 정하고 보기를 끼워 맞추는 것은 순서가 뒤집힌 것이다. 올바른 순서는 이렇다.

첫째, 이 문항이 측정하는 속성은 하나인가, 둘인가?

하나의 속성이 없음에서 최대로 움직인다 → 단극
두 개의 반대 속성 사이에서 위치를 잡는다 → 양극

둘째, 단극이라면 짝수점을 기본으로 고려한다.

4점이 가장 흔하다
중립점이 없어도 어색하지 않다
"보통"을 억지로 넣지 않는다

셋째, 양극이라면 홀수점을 기본으로 고려한다.

5점 또는 7점이 일반적이다
중립점이 개념적으로 의미가 있다
강제 선택이 필요하면 짝수점을 의도적으로 사용한다

넷째, 척도수는 측정하려는 개념의 변별력에 맞춘다.

응답자가 실제로 구분할 수 있는 수준 이상으로 세분화하면 노이즈만 늘어난다
일반 대중 대상이면 4~5점이 적절하고, 전문가 패널이면 7점까지 가능하다

마지막 한마디

"5점으로 할까 4점으로 할까"는 결과여야지, 출발점이 되면 안 된다. 출발점은 항상 "이 문항은 단극인가 양극인가"다.

이걸 모르면 척도수를 아무리 고민해봐야 동전 던지기와 다를 바 없다. 그리고 동전 던지기로 설계한 척도에서 나온 데이터는, 아무리 정교한 통계 기법을 써도, 설계의 결함을 치유하지 못한다.

척도 설계는 통계 이전의 문제다. 개념의 문제다.

2026년 3월 19일 목요일

"피시킨의 꿈, 그리고 우리가 치르는 비용"

들어가며 — 이상한 동거

공론조사, 혹은 숙의조사라 불리는 이 방법론은 오늘날 한국에서도 제법 익숙한 이름이 되었습니다. 정부 정책 결정의 도구로, 갈등 해소의 처방으로, 때로는 민주주의의 업그레이드 버전으로 소개됩니다.

그런데 저는 오늘 이 자리에서 한 가지 불편한 질문을 던지고자 합니다.

공론조사는 과연 '조사'인가요?

혹은 더 직접적으로 — 공론조사는 왜 여론조사 회사가 하고 있습니까? 왜 표본오차를 제시하고, 왜 과학적 절차를 강조합니까?

저는 이것이 단순한 방법론적 혼선이 아니라, 태생부터 내장된 구조적 문제라고 생각합니다.

1부 — 개념의 기원: 철학자의 몽상

공론조사(Deliberative Polling)는 스탠퍼드 대학의 제임스 피시킨(James Fishkin) 교수가 1988년 처음 제안하고, 이후 로버트 러스킨(Robert Luskin)과 함께 발전시킨 방법론입니다.

피시킨의 출발점은 여론조사가 아니었습니다. 그것은 민주주의 이론, 더 정확히는 심의민주주의(deliberative democracy)의 규범적 이상이었습니다.

그가 던진 질문은 이것입니다.

"시민들이 충분한 정보를 갖고 진지하게 숙고한다면, 여론은 어떻게 달라질까?"

아름다운 질문입니다. 동시에, 이것은 철저히 규범적(normative) 질문입니다. "~한다면"으로 시작하는, 현실이 아닌 이상 조건의 언어입니다.

피시킨은 하버마스(Jürgen Habermas)의 이상적 담화 상황(ideal speech situation) — 권력과 왜곡 없이 오직 더 나은 논거의 힘만이 작동하는 소통의 공간 — 을 실험실에 구현하고자 했습니다. 이것은 정치철학의 사고실험이었습니다.

문제는, 이 사고실험이 어느 순간 실증적 방법론으로 탈바꿈했다는 것입니다. 철학의 언어가 통계의 언어로 번역되었고, 규범적 이상이 측정 가능한 수치로 포장되었습니다.

이 번역의 과정이 저는 석연찮습니다.

2부 — 과학의 외피: 무엇이 문제인가

피시킨의 공론조사 모델은 외형적으로 여론조사의 문법을 충실히 따릅니다. 무작위 표집, 사전·사후 설문, 통계적 유의성 검증. 읽는 사람으로 하여금 이것이 엄밀한 과학적 절차처럼 느끼게 만듭니다.

그러나 저는 이 과학적 외피가 세 가지 근본적인 문제를 은폐한다고 생각합니다.

첫째, 개입(intervention)의 비통제성입니다.

일반 여론조사는 시민의 의견을 있는 그대로 포착하려 합니다. 공론조사는 다릅니다. 숙의 과정 — 자료 제공, 전문가 발표, 소집단 토론 — 이라는 강력한 개입을 가한 뒤 의견을 측정합니다. 과학적 실험에서 개입의 내용, 순서, 강도는 엄격하게 통제되어야 합니다. 그러나 공론조사의 숙의 과정은 누가 발표하는가, 어떤 자료를 쓰는가, 토론 진행자가 누구인가에 따라 결과가 얼마든지 달라질 수 있습니다.

이것은 측정 도구의 문제가 아니라 실험 설계 자체의 문제입니다.

둘째, '균형 잡힌 정보'라는 신화입니다.

공론조사의 핵심 전제 중 하나는 참여자에게 '균형 잡힌 정보'를 제공한다는 것입니다. 그러나 균형이란 누가 정의합니까? 어떤 쟁점에서 양측을 동등하게 제시한다는 것은, 사실 특정한 쟁점의 틀(frame)을 이미 전제한 것입니다. 의제를 어떻게 설정하느냐, 어떤 전문가를 부르느냐, 어떤 언어로 자료를 작성하느냐 — 이 모든 것이 정치적 선택입니다. 그것을 '중립'이라 부르는 순간, 그 정치성은 더욱 강화됩니다.

셋째, 참여자의 대표성 문제입니다.

공론조사는 무작위 표집을 통해 대표성을 확보했다고 말합니다. 그러나 표집의 대표성과 참여자의 대표성은 다른 문제입니다. 이틀, 사흘씩 합숙하며 토론에 참여할 수 있는 사람은 누구입니까? 시간적 여유가 있는 사람, 해당 의제에 관심이 있는 사람, 낯선 집단 토론에 거부감이 없는 사람입니다. 이 단계에서 이미 체계적 선택 편향(systematic selection bias)이 발생합니다. 무작위 표집이라는 과학적 시작점은, 실제 참여 단계에서 무력화됩니다.

3부 — 이벤트 안에 끼워진 조사

저는 공론조사의 실질을 이렇게 표현하고 싶습니다.

"시민 참여 이벤트에 설문지를 앞뒤로 붙인 것"

이것은 비하가 아닙니다. 구조적 묘사입니다.

공론조사에서 핵심적인 것은 무엇입니까? 숙의입니다. 토론입니다. 정보 제공입니다. 그리고 그 과정을 통한 의식의 변화입니다. 설문조사는 그 변화를 수치로 기록하는 역할을 합니다.

그렇다면 이것은 사실 시민 교육 프로그램의 효과 측정에 더 가깝지 않습니까?

그럼에도 불구하고, 이것이 '조사'의 언어로 포장되는 이유가 있습니다. 조사는 권위를 줍니다. 과학은 정당성을 줍니다. 수치는 반박하기 어렵게 만듭니다.

공론조사의 결과물 — "숙의 후 찬성 59%, 반대 41%" — 은, 단순한 여론조사 결과와는 전혀 다른 위상을 갖습니다. 그것은 '계몽된 여론(enlightened public opinion)'이라는 피시킨 자신의 언어처럼, 일반 여론보다 더 우월한 것으로 제시됩니다.

여기서 저는 심각한 민주주의적 질문을 제기하지 않을 수 없습니다.

4부 — 정치적 제도화의 문제

공론조사는 이렇게 말합니다. "지금의 여론은 무지와 편견에 찌들어 있다. 우리가 시민에게 정보와 숙의의 기회를 준다면, 더 나은 여론이 만들어진다."

이 전제 자체가 대단히 엘리트주의적입니다.

누가 지금의 여론을 '계몽 이전의 것'으로 규정합니까? 누가 '올바른 정보'를 선별합니까? 누가 '더 나은 여론'의 기준을 설정합니까?

공론조사의 결과는 종종 정치적으로 활용됩니다. 이미 내려진 결정에 정당성을 부여하기 위해, 혹은 정치적으로 부담스러운 결정을 '시민의 뜻'으로 포장하기 위해. 이때 공론조사는 민주주의의 도구가 아니라, 민주주의를 흉내 낸 정당화 장치가 됩니다.

이것이 제가 공론조사가 "다분히 정치적"이라고 말할 때의 의미입니다. 그것은 피시킨의 이론이 정치적으로 나쁘다는 뜻이 아닙니다. 그 이론이 특정한 정치적 맥락에서, 특정한 정치적 필요에 의해 제도로 번역되고 과학으로 포장되는 방식이 문제라는 것입니다.

마무리 — 그래서 무엇을 말하고 싶은가

저는 공론조사의 규범적 이상을 부정하는 것이 아닙니다. 시민이 더 많은 정보를 갖고 더 깊이 숙고하는 민주주의 — 그것은 우리 모두가 지향할 수 있는 가치입니다.

그러나 그것은 정치철학의 언어로, 시민 교육의 언어로, 참여 민주주의의 언어로 이야기되어야 합니다.

여론조사의 언어 — 표본오차, 신뢰수준, 통계적 유의성 — 로 치장될 때, 그것은 과학이 되는 것이 아니라, 과학의 권위를 도용하는 것이 됩니다.

공론조사는 훌륭한 이벤트일 수 있습니다. 유의미한 시민 참여 경험일 수 있습니다. 그러나 그것을 여론조사라 부르는 것은, 조사 방법론의 과학적 엄밀성에 대한 오해이거나, 아니면 의도된 혼동입니다.

우리는 이 구분을 분명히 해야 합니다.

철학적 몽상은 어떻게 통계학의 탈을 쓰고 거대한 비즈니스가 되었나: 숙의조사의 치명적 역설

[칼럼] 철학적 몽상은 어떻게 통계학의 탈을 쓰고 거대한 비즈니스가 되었나: 숙의조사의 치명적 역설

신고리 원전 5·6호기 건설 재개부터 대입 제도 개편안, 지역 행정 통합에 이르기까지. 한국 사회에서 첨예한 갈등이 발생할 때마다 전가의 보도처럼 등장하는 해법이 있다. 바로 '숙의조사(공론조사)'다. 무작위로 추출된 시민들이 모여 전문가의 의견을 듣고, 치열한 토론을 거쳐 합의된 결론을 도출해낸다니, 이 얼마나 민주주의의 숭고한 이상에 부합하는 그림인가.

하지만 화려한 온·오프라인 토론 시스템과 두꺼운 결과 보고서 이면을 들여다보면, 우리는 이 제도가 품고 있는 매우 위험하고 본질적인 역설과 마주하게 된다. 제임스 피시킨(James Fishkin) 교수가 고대 아테네의 제비뽑기식 민주주의를 현대 대중사회에 구현해보겠다며 주창한 이 '규범적 철학'은, 어느새 오차범위를 운운하는 '실증적 과학'의 탈을 쓴 채 거대한 정치적·상업적 이벤트로 변질되었다.

당위(Ought)와 실증(Is)의 의도적 혼동 여론조사의 본령은 철저히 관찰에 있다. 현실에 발을 딛고 있는 대중이 현재 어떤 생각을 하고 있는지(Is)를 오염 없이 측정하는 척도여야 한다. 반면 숙의조사는 '완벽한 정보와 충분한 토론 시간이 주어졌다면 대중은 이렇게 생각해야 한다(Ought)'는 가치 개입적이고 인위적인 실험이다. 주최 측이 정교하게 설계한 정보의 틀(프레이밍) 안에서 도출된 온실 속의 결과물을, 마치 자연 상태의 민심을 과학적으로 측정한 것인 양 포장하는 것은 조사 방법론에 대한 기만이다.

'생태학적 타당도'를 상실한 유사 전문가들의 탄생 숙의조사를 주관하는 측은 늘 표본의 '대표성'을 강조한다. 하지만 생업을 뒤로하고 주말 내내 수백 페이지의 자료집을 읽으며 전문가의 강의를 소화해 낸 500명의 참여자는, 더 이상 출퇴근길에 뉴스를 힐끗 보며 일상을 살아가는 '일반 시민'이 아니다. 이들은 고도로 훈련된 '유사 전문가(Pseudo-expert)'로 인위적인 개조를 거친 상태다. 이 특수한 실험실 환경에서 만들어진 응답 분포를 5천만 국민의 뜻으로 일반화하는 것은, 통계학에서 말하는 생태학적 타당도(Ecological Validity)를 완벽히 잃어버린 억지 논리다.

숫자 뒤에 숨은 정치의 책임 외주화 그렇다면 왜 정치권과 행정부는 막대한 예산을 들여가며 이 철학적 실험에 열광하는가? 이유는 단순하다. 현대 정치에서 책임 회피를 위한 가장 완벽한 방패막이가 바로 '숫자'이기 때문이다. 선출직 공직자가 갈등의 한가운데서 정치적 생명을 걸고 결단해야 할 무거운 책임들은 "신뢰수준 95%에 표본오차 ±3.1%p"라는 과학의 언어 뒤로 깔끔하게 증발해 버린다. 숙의조사는 숙의(Deliberation)의 탈을 쓴 채, 정치의 몫을 시민에게 떠넘기는 가장 세련된 '책임 외주화' 수단으로 전락했다.

민주주의를 상품화한 리서치 업계의 '특화 비즈니스' 가장 뼈아픈 대목은 조사 업계의 행보다. 철학자의 몽상이 정치인들의 알리바이로 쓰이는 과정에서, 리서치 기관들은 이를 하나의 거대한 '특화 사업'이자 고수익 비즈니스 모델로 정착시켰다. 수억 원이 오가는 입찰 시장에서 기업들은 화려한 이러닝 플랫폼, 자동화된 분임조 편성 시스템, 온·오프라인 연계 솔루션 등을 내세우며 방법론의 고도화를 자랑한다. 정밀한 표집 틀 설계나 조사의 질적 담보라는 본질적 고민보다는, 얼마나 매끄럽고 그럴듯한 '합의의 무대'를 연출해 내는지가 관건이 된 셈이다. 갈등을 조율해야 할 공론의 장이, 화려한 이벤트 기획업으로 전락해버린 현실이다.

거울은 거울로 남아야 한다 숙의조사를 무조건 배척하자는 것이 아니다. 여론의 다각적인 면모를 탐색하는 하나의 정성적 참고 자료로서는 분명 가치가 있다. 하지만 방법론의 화려한 겉포장에 취해, 이를 민주주의의 만능열쇠이자 절대적인 '국민의 뜻'으로 맹신하는 촌극은 멈춰야 한다.

여론조사는 그저 시민의 민낯을 있는 그대로 비추는 차가운 거울이어야 한다. 정치는 여론을 참고하되 스스로의 철학으로 결단하고 책임져야 하며, 조사 업계는 정밀한 측정이라는 본연의 전문성으로 돌아가야 한다. 철학과 정치가 통계학의 뒤에 숨어 벌이는 이 위험한 비즈니스를, 이제는 냉정하게 직시할 때다.

2025년 12월 1일 월요일

여론조사의 부활: 2024 미국 대선 조사는 어떻게 '위기'를 '정확도'로 바꿨나? (AAPOR 보고서 심층 요약)

2016년과 2020년, 미국 대선 여론조사는 "트럼프의 숨은 표(Shy Trump)"를 잡아내지 못하며 '여론조사 위기론'에 시달렸습니다. "더 이상 조사는 믿을 수 없다"는 회의론이 팽배했던 2024년, 결과는 어땠을까요?

최근 미국여론조사협회(AAPOR)가 발간한 2024년 대선 여론조사 평가 보고서에 따르면, 이번 대선은 "여론조사가 신뢰를 회복한 해"이자 "조사(Survey)가 공학(Engineering)으로 진화한 분기점"이었습니다.

보고서의 핵심 내용을 4가지 포인트로 정리해 봅니다.

1. 성적표: 수십 년 만에 가장 정확했다

가장 먼저 눈에 띄는 것은 극적으로 개선된 정확도 수치입니다. 단순히 "맞췄다" 수준이 아니라, 오차 범위를 대폭 줄였습니다.

오차의 급격한 감소: 선거 직전 2주간 실시된 조사의 평균 절대 오차는 3.3%포인트였습니다. 이는 2020년(5.3%p)과 2016년(5.2%p)에 비해 오차를 약 40% 가까이 줄인 성과입니다.
주(State) 단위 조사의 부활: 특히 선거인단 승부를 가르는 경합주 조사가 중요했는데, 이번 주 단위 조사의 정확도는 1944년 이후 가장 정확한 수준(평균 오차 3.0%p)을 기록했습니다.
편향(Bias)의 축소: 여전히 민주당 지지율을 실제보다 높게 예측하는 경향은 있었으나(+2.7%p), 2020년(+4.6%p)에 비하면 그 '거품'이 절반 수준으로 빠졌습니다.

2. 승리 요인: '어떻게 묻느냐'보다 '어떻게 계산하느냐' (The Engineering)

많은 사람들이 "전화 대신 온라인으로 해서 맞춘 것 아니냐?"라고 묻지만, 보고서는 "단일한 해결책(Silver Bullet)은 없었다"고 말합니다. 대신, 데이터를 다루는 공학적 접근(Engineering)이 승패를 갈랐습니다.

① 믹스 방법론 (Mixed Mode)의 승리

전통적인 전화 면접(Live Phone)은 이제 전체의 10% 수준으로 줄었고, 온라인 패널과 문자(Text-to-Web) 등을 섞는 방식이 대세가 되었습니다. 하지만 특정 방식(모드) 자체가 정확도를 담보하진 않았습니다. 중요한 건, 유권자가 있는 곳이라면 어디든 찾아가서 데이터를 긁어모으는 '유연성'이었습니다.

② 투표 의향자 모델링 (Likely-Voter Modeling)의 고도화

이번 조사의 숨은 공신입니다. 과거에는 "투표할 겁니까?"라는 질문에 "네"라고 하면 유권자로 분류했습니다. 하지만 2024년에는 더 정교해졌습니다.

데이터 연동: 응답자의 답변뿐만 아니라, **유권자 파일(Voter File)**에 기록된 과거 투표 이력을 결합해 '진짜 투표할 사람'을 가려냈습니다.
확률 점수 도입: 유권자를 '투표함/안함'의 이분법으로 나누지 않고, "이 사람이 투표할 확률은 85%"와 같이 연속적인 확률(Probability)을 부여해 미세한 표심까지 잡아냈습니다.

③ 정당 가중치 (Party ID Weighting)

인구통계(성별, 연령)만 맞추던 관행을 깨고, 표본 내 지지 정당 비율을 강제로 조정하는 '정당 가중치'를 적용한 기관들이 더 정확한 결과를 냈습니다. 이는 '샤이 트럼프'를 보정하는 데 큰 역할을 했습니다.

3. 여전한 사각지대: 누구를 놓쳤는가?

완벽하진 않았습니다. 정확도가 높아졌음에도 불구하고 여전히 포착하기 어려운 그룹들이 존재했습니다.

히스패닉 유권자의 우경화: 여론조사는 히스패닉 유권자들의 민주당 지지를 과대평가했습니다. 실제로는 트럼프 쪽으로 상당히 이동했음이 드러났습니다.
공화당 텃밭의 침묵: 공화당 지지세가 강한 지역(시골 등)에 거주하는 공화당원들은 여전히 조사에 응답하지 않거나 과소표집되었습니다.
'간헐적 투표자'의 등장: 2020년에는 투표하지 않았지만 2024년에는 투표장에 나온(주로 공화당 성향의) 유권자들을 모델이 충분히 잡아내지 못했습니다.

4. 시사점: '설계'에서 '공학'으로

이번 AAPOR 보고서가 주는 메시지는 명확합니다. "응답률 하락의 시대, 단순히 많이 묻는 것만으로는 부족하다"는 것입니다.

2024년 미국 대선 조사의 성공은 조사를 잘 '설계(Design)'하는 것을 넘어, 확보된 데이터를 외부 데이터(유권자 파일)와 결합하고, 정교한 확률 모델로 보정하는 '데이터 엔지니어링(Data Engineering)' 역량이 필수적임을 증명했습니다.

이제 여론조사는 '듣는 기술'을 넘어 '계산하는 과학'으로 진화하고 있습니다. 한국의 조사 시장 또한 이러한 '공학적 접근'을 얼마나 빠르게 도입하느냐가 신뢰 회복의 열쇠가 될 것입니다.