메소드서베이

2018년 11월 18일 일요일

웹조사에서 표 스타일 설문(grid-style questions) 응답의 질 향상 방안은?

표 스타일 설문(grid-style questions)은 웹조사에서 가장 많이 쓰이는 설문 방식이다. 많은 문항을 한 공간에 한 번에 물을 수 있고, 불필요한 중복을 피할 수 있기 때문이다. 그러나 표 스타일 설문은 일자로 찍기, 막 찍기, 패턴으로 찍기 등 응답 불성실과 관련하여 자유롭지 못하다. 이 논문은 이러한 문제 제기에서 씌여진 듯 하다. 스마트폰의 경우 화면 크기 문제로 표 스타일의 설문을 다른 형태로 변형하기 때문이다. 그러나 이는 화면 크기만의 문제는 아니다. 피씨에서도 스마트폰 형태로 문항을 변형하면 된다. 표 스타일 설문(grid-style questions)의 응답 정확성은 디바이스의 문제가 아니라 설문 구성의 문제이다.

2018년 11월 13일 화요일

웹설문 너무 빨리 응답하는 응답자에게 경고하기...그 효과는?

웹조사는 대표적인 자기기입조사이다. 그 누구도 컨트롤하지 않으니 응답자 중 일부는 빨리 조사를 마치고 리워드를 받으려고 무아지경(?) 상태로 설문에 응답하기도 한다. 사실 지금까지 이런 사람들은 조사 후에 제외하는 방식으로 에러를 최소화했다. 물론 대다수의 웹조사는 이런 분들까지 포함하는게 일반적이다.

그러나 이를 시스템적으로 해결한 사례가 있어 소개한다. 아래 논문을 보면 일종의 경고창 방식을 택했는데, 그 효과가 꾀나 쏠쏠한 걸로 나온 것 같다. 물론 이러한 경고창을 응답에게 띄우려면 웹조사 시스템이 발전해야한다. 그러나 못할 기술도 아니다. 웹조사의 기술은 점점 정교해지고 있다.

전화조사와 웹조사의 차이는 심각한가? 사회적 웰빙 관련하여

전화조사와 웹조사간 결과 차이는 항상 핫이슈였고, 지금도 그렇다. 전화조사가 아직은 더 대표성이 있는 것으로 인식되기 때문에 이 논쟁은 마치 웹조사의 도전(?)처럼 느껴진다.

아래 논문은 사회조사 중 가장 핫한 웰빙과 관련하여 전화조사와 웹조사 간 차이를 비교하였다. 결론적으로 응답 분포에는 분명히 차이가 나지만 그것이 통계적으로 심각할 정도의 차이는 아니라는 것이다. 더불어 두 모드간의 차이는 설명 가능한 정도라는 것이다.

재미있는 것은 웹조사의 경우 중간 보기에 덜 응답하는 경향이 있다는 것이다. 이는 한국리서치에서 했던 자체 조사에서도 나타났던 현상이다. 반대로 말하면 양 극단으로 조금 더 흩어지는 경향이 전화조사보다 웹조사가 강하다는 것이다. 그리고 조금 더 현상에 대해 부정적이라는 것이다.

사실 전화조사와 웹조사의 논쟁은 앞으로 진행될 것이다. 그러나 중요한 것은 뭐가 더 좋다는 것을 판단할 객관적인 증거를 찾기가 어렵다는 것이다. 그냥 많이 하는 조사가 더 좋은 조사가 될 확률이 높다고 본다.

길어도 너무 긴 웹설문의 정확도를 높이려면?

길어도 너무 긴 설문이 응답의 정확성을 저해한다는 증거는 의외로 적다. 착각하면 안되는게 그렇다고 없다는 건 아닌거다. 사실 이런 주제는 리서처들이 별로 좋아하지 않는다. 왜냐하면 많은 문항을 한 번에 조사하는 것이 경제적이기 때문이다.

그러나 직관적으로 너무 긴 설문에서 뒤에 배치된 문항의 정확성은 떨어질 수 밖에 없다. 모르시겠다면 40분짜리 웹조사를 한 번 해보면 알게된다.

이번 논문은 길어도 너무 긴 설문의 정확성을 높이기 위한 솔루션을 제시해준다. 친절하게도 실험조사를 하여 그 증거까지 제시해주고 있다.

결과적으로 설문문항을 쪼개란 것이다. 사실 설문지를 쪼개는 방법은 두 가지가 있다. 우선 선 쉽게 할 수 있는 것은 설문의 파트를 두개로 나누는 것이다. 즉 1번부터 100번까지를 한 파트, 101번부터 200번까지를 다른 파트로 나누는 것이다. 그러나 이 논문에서 제시한 방법은 이 방법이 아니다. 문항마다 랜덤하게 응답자를 선정하는 것이다. 즉 어떤 응답자는 1번, 3번, 5번을 응답하게 되고 또 다른 응답자는 1번, 2번, 4번을 응답하게 되는 것이다.

긴 설문은 해야겠고, 응답의 정확성도 포기할 수 없는 연구자의 경우 이 방법을 사용할 법하다. 나는 첫 번째로 설명한 쪼개기(1부와 2부로 나누는 것)도 시도할만 하다고 본다. 물론 아직 증거는 없다.

2018년 11월 8일 목요일

5점 척도 분석 시 (환산) 평균값이 최상일까?

중간 보기가 없는 2점이나 4점의 경우는 긍정비율(찬성, 만족 등)을 가지고 주로 분석을 한다. 그러나 중간 보기가 있는 3점이나 (특히) 5점의 경우 긍정비율보다는 평균값(3점 or 5점 만점, 아니면 이를 100점으로 환산)을 많이 활용한다. 왜 일까? 아마도 중간 보기의 해석이 어려워서일거다.

그러나 최근에 통계청 2018 사회조사 결과를 보면서 5점 척도의 경우 평균값을 활용하지 않는다는 것을 알게 되었다. 심지어 평균값 자체를 산출하지 않는다고 했다. 척도 간 등간성이 확실하지 않은 상황에서 평균을 내는 것은 결과치를 왜곡할 수 있다는 이유에서였다. 물론 1점에서 5점 사이의 주관식 값으로 응답을 받은 거라면 평균을 낼 것이라고 했다.

(이 기회에 저의 취재(?)를 응해주신 사회조사 담당 통계청 직원분께 감사의 말씀을...^^)

사실 10여년 간 5점 척도를 활용한 문항을 분석할 때 비율을 쓸지 평균을 쓸지 고민을 많이 했었다. 물론 선배 리서처들의 보고서에서 대부분 평균을 활용했길래 그걸 따라했었다. 그러나 오늘부터는 평균과 이별해야겠다.

2018년 11월 5일 월요일

확률표집과 비확률표집 중 더 정확한 것은?

확률표집에 대한 회의와 의심이 높아져서일까? 최근 확률표집이 비확률표집보다 더 정확하다는 류의 논문이 다량 생산되고 있다. 사실 당연한 걸로 생각했는데 이렇게 논문이 많이 나오니 오히려 의심이 든다.

이 논문은 좀 더 많은 조사와 변수를 RMSE(root mean squared error) 방식으로 분석했으니 더 믿을 수 있어요를 반복하고 있다. 그러면서 깨알같이 응답율이 예전만 못해도 확률표집이 '짱'이라고 설파하고 있다.

그러나 조사회사 자료가 대부분 2012년이라는 점에서 신뢰하기가 좀 어려운 부분이 있다. 2018년이니 2017년 정도는 썼어야하지 않았을까?

자세한 내용은 아래 사이트에서 확인하면 된다.
https://academic.oup.com/poq/advance-article-abstract/doi/10.1093/poq/nfy038/5151369?redirectedFrom=fulltext

2018년 10월 21일 일요일

왜 유선전화보다 무선전화로 인터뷰할 때 시간이 길까?

영어 번역이 귀찮아 파파고 번역을 통해 논문 요약을 하면 아래와 같다.
앞으로 이런 식의 성의 없는 논문 요약이 자주 등장할거다...^^ 뭐 대충 내용만 이해하면 땡이니까...

왜 전화 인터뷰가 유선전화보다 휴대폰에서 더 오래 지속될까요? 이 현상에 대한 일반적인 설명에는 질문 하위 집합으로의 차등 선택, 질문 답변 순서 밖의 활동(셀-분 보상을 위한 연락처 정보 수집 등), 응답자 특성, 응답자의 인식 및 이해에 지장을 나타내는 행동 및 행동 i가 포함된다.붕괴에 대한 시청자의 반응 우리는 우리가 인터뷰의 질문-답변 부분에만 집중하고 공유된 질문에만 집중하더라도(즉, 위의 처음 두 개의 설명을 삭제) 시간 차이는 지속된다는 것을 알게 된다. 그 차이가 지속되는 이유를 알기 위해, 우리는 미국 성인을 대상으로 한 이중 프레임 전화 설문 조사인 미국/일본 신문 의견 설문조사의 행동 코드를 사용하여 만족, 선 품질 문제 및 주의 산만함의 지표를 조사합니다. 전반적으로, 우리는 휴대폰에 대한 응답자들이 더 혼란스러워졌고, 휴대폰 응답자들이 받아들일 수 있는 답변을 제공하는 데 시간이 더 오래 걸리기 때문에 인터뷰 지속시간의 차이가 발생한다는 것을 알게 되었다. 면접관들도 질문을 할 때 연설의 속도를 늦춘다. 두 배우의 느린 말하기 비율은 응답자들이 휴대전화를 사용할 때 더 길고 더 비싼 인터뷰를 하게 된다.

실증 자료를 통해 다양한 분석을 하는데...결론은 엄청 허무하다. 그냥 무선전화로 응답하는 응답자들이 말을 길게 오래한다는 거다. 내 생각엔 그냥 무선전화로 인터뷰하는게 조금 더 익숙하고 편해서이지 않을까?