조사 협의를 하면서 고객에게 가장 많이 받는 질문 중 하나가 몇 명 정도나 조사해야하냐는 거다. 사실 표본수는 명확히 돈(예산)과 비례한다. 예산이 많으면야 표본수를 늘릴수록 좋다. 표본수를 늘릴수록 표집오차가 감소하기 때문이다. 그러나 무한정 늘린다고 그에 따라 오차가 무한정 줄어들지 않는다. 아래 그림과 같이 처음엔 가파른 경사로 표집오차가 감소하다가 점점 그 기울기가 완만해진다. 보통 500명에서 1000명 사이에서 드라마틱하게 감소한다. 이 지점 중에서 표본수를 선택하면 그만이다.
이왕 표집오차 얘기를 꺼낸 김에 한 가지 더 유의할 것이 있다. 위에 표를 보면 제목 밑에 약 50% 정도일 때(for a result of around 50%)라는 말이 있는데 이건 무엇을 의미하는 것일까? 이 말은 관측비율이 50% vs. 50%일 때의 표집오차라는 의미이다. 이해를 돕기 위해 아래표를 보자. 표본수가 동일하더라고 관측비율이 다르면 표집오차가 달라진다. 즉 50%일 때 표집오차가 가장 크다. 그렇다. 원래는 표본수가 동일해도 문항마다 표집오차가 다르다. 그러나 이를 문항마다 표기할 경우 너무 복잡할 수 있기 때문에 '최대허용오차'라는 표현으로 50%일 때의 표집오차는 대표로 표기하는 것이다.
2018년 6월 25일 월요일
피드 구독하기:
댓글 (Atom)
ARS가 득표율과 비슷한 것은 정확해서가 아니다
ARS가 득표율과 비슷한 것은 정확해서가 아니다 선거가 다가오면 어김없이 반복되는 논쟁이 있다. ARS 조사가 전화면접보다 실제 득표율에 더 가깝다는 주장이다. 리얼미터 등 19개사가 속한 한국정치조사협회는 "각 당 싱크탱크도 ARS를 선호할...
-
중간 보기가 없는 2점이나 4점의 경우는 긍정비율(찬성, 만족 등)을 가지고 주로 분석을 한다. 그러나 중간 보기가 있는 3점이나 (특히) 5점의 경우 긍정비율보다는 평균값(3점 or 5점 만점, 아니면 이를 100점으로 환산)을 많이 활용한다. 왜...
-
서론: 시간의 흐름 속 ‘스냅샷’으로 정책 효과 측정하기, 횡단조사와 이중차분법(DID) 어떤 정책이 시행된 후, 그 효과를 과학적으로 측정하고 싶다고 가정해 봅시다. 가장 이상적인 방법은 정책의 영향을 받은 사람들과 받지 않은 사람들을 수년간 추...
-
서론: 표본을 ‘유권자 전체’로 만드는 마법, 가중치와 두 가지 해법 선거여론조사는 보통 1,000여 명의 표본을 통해 수천만 명에 달하는 전체 유권자의 민심을 추정하는 작업입니다. 하지만 우리가 무작위로 추출한 1,000명의 인구통계학적 특성(성...
댓글 없음:
댓글 쓰기