2018년 6월 25일 월요일

할당표집 대표성 제고 방안: ‘학력’과 ‘직업’ 변인 추가

  우리나라에서 실시되는 일반국민 대상 여론조사에서는 조사 방법(전화조사, 웹조사, 대면면접조사 등)에 관계없이 표본추출 방법으로 할당표집(Quota Sampling)을 주로 활용하고 있다. 할당표집은 조사할 모집단의 특성을 잘 반영한다고 판단되는 변인별로 조사할 표본수를 미리 할당하여 조사하는 방법을 의미한다. 즉 할당변인을 교차한 할당표라는 것을 만든 후, 이를 근거로 조사하는 방법이다. 전국 1,000명을 조사한다고 했을 때, 가장 많이 활용하는 변인은 지역별, 성별, 연령대별인데 이를 근거로 한 할당표는 <1>과 같다. <1>은 매월 발표되는 주민등록인구통계(201712월 말 기준) 자료를 인구비례에 맞게 작성한 것으로 할당표집 조사에 있어 일종의 나침반같은 역할을 한다.

  할당표집에서 왜 지역별, 성별, 연령대별 변인을 주로 활용하는 것일까? 사실 지역별, 성별, 연령대별 할당은 조사업계에서는 너무나 당연한 것으로 받아들여져 왔다. 그래서인지 이에 대한 명확한 이유를 찾기는 어렵다. 그러나 리서치 실무를 담당하면서 느낀 현실적인 이유는 아래 세 가지 정도이다.

1. 정치나 사회에 대한 태도를 형성하는데 지역별, 성별, 연령대별 변인이 가장 기본적이면서 중요하다.
2. 매달 업데이트되는 주민등록인구통계를 통해 비교적 정확한 최신의 모집단 분포를 알 수 있다.
3. 할당표 차원에서 지역별, 성별, 연령대별 변인 구간을 곱하면 160개의 셀이 나오는데, 그 외에 할당 변인을 추가할 경우 셀이 너무 많아져 사실상 셀별 할당이 어려워진다.

  지역별, 성별, 연령대별 할당표집에 문제가 없는 것은 아니다. 비확률표집(Nonprobability Sampling)이라는 문제는 차치하고서라도 조사 방법별로 선택편향(Selection Bias) 문제로 지역별, 성별, 연령대별 이외의 다른 사회경제적 변인에서 편향이 나타날 수 있다는 게 일반적인 지적이다. 대표적으로 거론되는 것이 학력과 직업의 편향 문제이다. 지역별, 성별, 연령대별 변인만 할당으로 맞추어 조사하다보니, 학력이나 직업 변인이 모집단 분포와는 다르게 조사된다는 것이다. 조사 방법별 조금씩 차이는 있지만 실제로 전화조사나 웹조사를 기준으로 학력별로 대졸자 이상, 직업별로는 주부와 사무/관리직 비율이 과대 대표되는 게 현실이다.

  그렇다면 지역별, 성별, 연령대별 변인 외에 학력이나 직업도 할당 변인으로 추가할 수는 없는 것일? 실 학력과 직업을 할당 변인에 추가해야한다는 이야기는 여론조사의 대표성 문제를 제기하는 자리에서는 어김없이 나왔다. 그런데도 조사업계에서 이를 적용하지 못한 것은 지역별, 성별, 연령대별 변인과는 달리 학력이나 직업 변인의 경우 비교적 정확한 최신의 모집단 분포를 알 수 없었기 때문이다. 즉 만 19세 이상 일반국민을 기준으로 일반적인 여론조사에서 나누는 학력 분포(중졸이하, 고졸, 대졸이상) 직업 분포(//어업, 자영업, 판매/영업/서비스직, 생산/기능/노무직, 사무/관리/전문직, 전업주부, 학생, 무직/기타)의 비율을 참고할 만한 자료가 없거나 있어도 최신의 자료가 아니다 보니 사용할 수 없었다는 문제가 있었다.

  하지만 올해 초부터 통계청에서 '마이크로데이터(MD)'를 인터넷으로 무료 제공하기 시작하면서, 19세 이상 일반국민의 학력과 직업 분포를 알 수 있는 길이 열렸다. 즉 통계청에서 실시하는 조사 중에 매년 실시하면서 학력과 직업 변인이 포함된 조사의 마이크로데이터를 활용할 경우 비교적 정확하면서도 최신의 학력과 직업 분포를 유추할 수 있게 된 것이다. 통계청의 사회조사가 이러한 조건에 맞는 조사로 이 조사의 마이크로데이터를 만19세 이상 일반국민 비율에 맞게 가중치를 주고 분석해 본 결과, 2015년 기준 우리나라 만 19세 이상 일반국민의 학력과 직업 비율은 <2>와 같았다.

  이렇게 산출한 학력과 직업 비율 자료를 활용할 경우, 지역별, 성별, 연령대별 외에 학력과 직업이 할당 변인으로 반영된 여론조사가 가능해질 것으로 보인다. 한국리서치는 지금까지 5회에 걸쳐 웹조사 방식의 1,000명 일반국민 여론조사에 이 할당 방식을 적용하였고, 조만간 전화조사와 대면면접조사에도 적용할 계획이다. 물론 할당변인의 증가로 인해 조사의 난이도가 증가하는 문제는 여전히 해결해야 할 과제이다. 조사에 대한 협조율이 낮아지는 추세 속에서 할당 변인을 늘리는 것은 분명 조사 기간과 비용에도 영향을 주기 때문이다. 그러나 조사 결과의 편향을 줄이고, 대표성을 제고하기 위해서 할당표집 시 학력직업변인의 추가는 반드시 실현되어야 할 과제라고 생각한다.

<1> 1,000명 조사 기준 지역별·성별·연령별 할당표
                                                                                                                                                                                                       (단위: )
행정구역

합계
19-29
30-39
40-49
50-59
60세이상
전국
1,000
179
182
208
199
232
497
93
94
106
101
103
503
86
88
102
98
129
서울특별시
198
38
39
40
37
44
97
19
20
20
18
20
101
19
19
20
19
24
부산광역시
71
12
12
14
15
18
34
6
6
7
7
8
37
6
6
7
8
10
대구광역시
48
9
8
10
10
11
24
5
4
5
5
5
24
4
4
5
5
6
인천광역시
56
10
11
12
12
11
28
5
6
6
6
5
28
5
5
6
6
6
광주광역시
29
6
6
6
6
5
14
3
3
3
3
2
15
3
3
3
3
3
대전광역시
30
6
6
6
6
6
15
3
3
3
3
3
15
3
3
3
3
3
울산광역시
21
4
4
4
5
4
11
2
2
2
3
2
10
2
2
2
2
2
경기도
240
44
47
55
47
47
120
23
24
28
24
21
120
21
23
27
23
26
강원도
30
5
4
6
6
9
15
3
2
3
3
4
15
2
2
3
3
5
충청북도
29
5
5
6
6
7
15
3
3
3
3
3
14
2
2
3
3
4
충청남도
(세종시포함)
44
7
8
9
8
12
22
4
4
5
4
5
22
3
4
4
4
7
전라북도
37
6
6
7
7
11
19
3
3
4
4
5
18
3
3
3
3
6
전라남도
38
6
5
7
8
12
19
3
3
4
4
5
19
3
2
3
4
7
경상북도
53
8
8
10
11
16
26
4
4
5
6
7
27
4
4
5
5
9
경상남도
65
11
11
14
13
16
33
6
6
7
7
7
32
5
5
7
6
9
제주특별자치도
11
2
2
2
2
3
5
1
1
1
1
1
6
1
1
1
1
2


<2> 1,000명 조사 기준 학력과 직업 할당 표본 수와 비율

학력 비율

표본 수()
비율(%)
중졸이하
236
23.6
고졸
397
39.7
대졸이상
367
36.7
직업 비율

표본 수()
비율(%)
//어업
48
4.8
자영업
130
13.0
판매/영업/서비스
72
7.2
생산/기능/노무
156
15.6
사무/관리/전문
196
19.6
주부
212
21.2
학생
62
6.2
무직/기타
123
12.3

댓글 없음:

댓글 쓰기