이중차분법(DID)과 평행추세가정: 횡단 데이터로 정책 효과 측정하기

 

서론: 시간의 흐름 속 ‘스냅샷’으로 정책 효과 측정하기, 횡단조사와 이중차분법(DID)

어떤 정책이 시행된 후, 그 효과를 과학적으로 측정하고 싶다고 가정해 봅시다. 가장 이상적인 방법은 정책의 영향을 받은 사람들과 받지 않은 사람들을 수년간 추적하는 종단조사(패널조사)를 실시하는 것입니다. 하지만 이는 막대한 비용과 시간이 소요되어 현실적으로 불가능한 경우가 많습니다.

그렇다면 우리에게 주어진 것이 특정 정책 시행 **‘전(before)’**과 **‘후(after)’**에 각각 실시된, 서로 다른 사람들을 대상으로 한 두 번의 횡단 웹서베이 데이터뿐이라면 어떨까요? 마치 특정 장소의 풍경을 다른 시간대에 찍은 두 장의 ‘스냅샷 사진’만 가지고 그곳에서 일어난 ‘변화의 원인’을 추론해야 하는 상황과 같습니다. 바로 이러한 제약 속에서 정책의 순수한 효과를 분리해내는 통계적 현미경이 바로 ‘이중차분법(DID)’입니다.

1. 분석을 위한 준비물: 필요한 데이터의 구조와 요건

횡단조사 데이터로 DID 분석을 수행하기 위해서는, 단순히 두 시점의 데이터가 있는 것만으로는 부족합니다. 다음과 같은 데이터 구조가 반드시 필요합니다.

  1. 두 개 이상의 횡단조사 데이터: 정책 시행 , 최소 두 번의 조사가 필요합니다. 물론, 정책 시행 전 여러 시점의 데이터가 있다면 분석의 신뢰도는 훨씬 더 높아집니다.

  2. 동일한 표집틀과 모집단: 각 시점의 조사는 동일한 모집단(예: 대한민국 성인)을 대상으로, 일관된 표집틀(예: 휴대전화 가상번호)을 사용하여 수행되어야 합니다.

  3. 처치집단(Treatment Group)과 통제집단(Control Group)의 구분: 조사 데이터 내에, 정책의 영향을 받은 ‘처치집단’과 받지 않은 ‘통제집단’을 명확하게 구분할 수 있는 변수가 있어야 합니다. 예를 들어, ‘서울시’에만 특정 청년수당 정책이 도입되었다면, ‘거주 지역’ 변수를 통해 서울 거주자는 처치집단, 그 외 지역 거주자는 통제집단으로 나눌 수 있습니다.

  4. 일관된 결과변수(Outcome Variable): 정책의 효과를 측정하려는 핵심적인 결과변수(예: 청년의 월평균 저축액, 삶의 만족도 등)가 모든 시점의 조사에서 정확히 동일한 방식으로 측정되어야 합니다.

  5. 시간 구분 변수: 각 응답이 정책 시행 ‘전’의 데이터인지, ‘후’의 데이터인지를 나타내는 변수가 필요합니다.

2. DID 분석의 심장: ‘평행추세가정(Parallel Trends Assumption)’의 모든 것

DID 분석의 모든 논리와 신뢰성은 단 하나의 강력한 가정, 바로 ‘평행추세가정’ 위에 세워져 있습니다.

  • 평행추세가정이란?: **“만약 정책이 시행되지 않았더라면, 처치집단의 결과변수 평균값은 통제집단의 평균값과 동일한 추세(평행한 궤적)로 변화했을 것이다”**라는 가정입니다.

  • 직관적 비유: 처치집단(서울)과 통제집단(부산)이라는 두 대의 기차가 서로 다른 높이의 선로를 달리지만, 정책 시행 전까지는 두 선로가 나란히 평행하게 가고 있었다고 상상해 봅시다. 정책 시행이라는 ‘터널’을 지난 후, 서울 기차의 고도가 부산 기차보다 더 많이 높아졌다면, 그 ‘추가적인 상승분’이야말로 터널 속에서 작용한 정책의 순수한 효과라고 추론하는 것입니다. 여기서 가장 중요한 전제는, 터널이 없었어도 두 기차는 계속 평행하게 달렸을 것이라는 믿음입니다.

  • 이 가정이 왜 중요한가: 만약 이 가정이 깨진다면(즉, 원래부터 두 집단의 추세가 달랐다면), 정책 시행 후의 차이가 순전히 정책 때문인지, 아니면 원래부터 존재했던 다른 요인 때문인지 구분할 수 없게 되어 분석 전체가 무의미해집니다.

  • 어떻게 확인할까: 이 가정 자체를 통계적으로 완벽하게 증명할 수는 없습니다. 하지만 정책 시행 전 여러 시점(예: 3년 전, 2년 전, 1년 전)의 데이터가 있다면, 그 기간 동안 두 집단의 추세가 실제로 평행했는지를 그래프로 그려봄으로써 가정이 타당한지를 간접적으로 확인할 수 있습니다. 이것이 바로 사전 조사를 여러 번 수행하는 것이 중요한 이유입니다.

3. 실전 분석: 회귀 모형을 이용한 이중차분(DID) 추정

필요한 데이터가 준비되고 평행추세가정이 어느 정도 타당하다고 판단되면, 실제 분석은 보통 회귀 모형을 통해 이루어집니다. 여러 시점의 횡단조사 데이터를 모두 합친 뒤, 다음과 같은 형태의 회귀식을 추정합니다.

  • Yit: 개인 i의 시점 t에서의 결과값 (예: 월 저축액)

  • 처치집단i: 해당 개인이 처치집단에 속하면 1, 통제집단이면 0

  • 정책시행후t: 해당 시점이 정책 시행 후이면 1, 전이면 0

  • : 두 변수의 상호작용항(Interaction Term)

여기서 각 계수의 의미는 다음과 같습니다.

  • β1: 정책 시행 전, 처치집단과 통제집단 간의 평균적인 차이

  • β2: 정책과 상관없이, 시간이 흐름에 따라 통제집단에서 나타난 평균적인 변화 (자연적인 시간 효과)

  • (델타): 바로 이것이 우리가 찾던 **정책의 순수한 효과(DID 추정치)**입니다. 이는 통제집단의 시간 변화분을 제외하고, 오직 처치집단에게만 정책 시행 후에 추가적으로 나타난 평균적인 변화량을 의미합니다.

결론: 강력하지만 엄격한 가정을 요구하는 준(準)실험

결론적으로, 종단 데이터가 없는 상황에서 횡단 웹서베이 데이터를 활용한 DID 분석은 정책의 인과적 효과를 추론할 수 있는 매우 강력한 준(準)실험(Quasi-experiment) 방법론입니다. 이는 단순한 사전-사후 비교가 놓칠 수 있는, 시간의 흐름에 따른 자연적인 변화 효과를 통제집단과의 비교를 통해 정교하게 분리해낼 수 있다는 점에서 큰 장점을 가집니다.

하지만 이 모든 분석의 타당성은 ‘평행추세가정’이라는 단 하나의 신뢰의 다리 위에 서 있음을 결코 잊어서는 안 됩니다. 만약 이 가정이 무너진다면, 분석 결과는 신기루에 불과합니다.

따라서 이 방법론을 성공적으로 활용하려는 연구자는 단순히 정책 시행 전후에 한 번씩 조사를 수행하는 데 그쳐서는 안 됩니다. 가능한 한, 정책이 시행되기 훨씬 이전부터 여러 시점의 횡단 데이터를 확보하여 평행추세가정의 타당성을 입증하려는 노력을 기울여야 합니다. 이처럼 DID 분석은 그 강력함만큼이나, 연구 설계 단계에서부터 연구자의 깊은 고민과 치밀한 사전 계획을 요구하는, 매우 정교하고 까다로운 도구라 할 수 있습니다.

댓글

이 블로그의 인기 게시물

5점 척도 분석 시 (환산) 평균값이 최상일까?

선거 여론조사 가중치 분석: 셀 가중 vs 림 가중, 무엇이 더 나은가?