메소드서베이

2022년 7월 18일 월요일

DIY 웹조사가 판치는 세상에서 내 조사 품질을 올리는 방법은?

내 조사의 품질을 올린다는 것은 무엇을 의미할까? 어려운 질문처럼 느껴지지만 답은 의외로 명확한데 조사 과정에서 발생하는 소위 네 가지 정도의 에러를 최소화하는 것이다. 네 가지 중 세가지는 대표성과 관련한 것이고, 나머지 하나는 측정과 관련한 것이다.

<대표성 관련 에러>

1. Coverage Error

2. Sampling Error

3. Nonresponse Error

<측정 관련 에러>

4. Measurment Error

최근 서베이 시장은 퀵하고 상대적으로 저렴한 DIY 웹서베이가 대세가 되었다. DIY 웹서베이는 설문은 의뢰하는 사람(즉 고객)이 만들고, 조사는 대규모 패널을 보유한 조사회사가 대행해주는 서비스를 말한다.

여기서 잠깐.........................................................이러한 서비스 구조에서 고객은 대표성과 관련한 세 가지 에러(Coverage Error, Sampling Error, Nonresponse Error)와 관련하여 개입이 가능할까? 답은 명확하다. 절대 개입할 수 없다. 패널을 보유한 조사회사가 해주는대로 할 뿐이다.

그렇다면 측정 관련한 에러(Measurment Error)는 어떠한가? 이 부분은 오롯이 고객 스스로가 책임져야한다. 즉 좋은 설문지를 만든다면(좋은 질문과 보기를 만든다면) 측정 에러의 대부분은 줄일 수 있다.

답은 나왔다.

DIY 웹조사가 판치는 세상에서 내 조사 품질을 올리려면?

설문지를 잘 만들어야한다는 것이다. 그냥 만들면 안된다. 잘 만들어야한다.

2022년 7월 13일 수요일

푸시웹서베이(push-to-web survey)를 우리나라에서 활성화시킬 수 있을까?

해외 특히 미국에서는 푸시웹조사(push-to-web survey)가 대세가 되어가고 있다. 전화조사의 몰락(?)이 이러한 현상을 부추겼다고 할 수 있다.

푸시웹조사란 무엇인가? 아래는 구글에서 푸시웹조사를 검색했을 때 나타나는 정의이다. 오프라인을 통해 응답자에게 1차적으로 접근하여 웹조사를 하도록 만드는 조사라고 하는 편이 가장 보편적인 정의일 것이다.

What is a push to web survey?

A push-to-web survey is a quantitative data collection method in which offline contact modes are used to encourage sample members to go online and complete a web questionnaire.

핵심은 1차 접근을 어떻게 할 것이냐인데, 미국이나 유럽의 경우 일반적으로 우편(정확히는 우체국 등기)으로 1차 접근을 시도한다. 우편으로 하는 이유는 이것이 비용적으로나 시간적으로 가장 합리적인 수단이기 때문이다. 우편을 통해 인사말과 웹설문 참여 안내문을 보내고(대부분 5달러 내외의 돈을 동봉), 이후에 전화나 방문 등을 통해 조사한다. 즉 주 방법이 웹조사가 되는 것이고, 이에 응하지 않은 응답자의 경우에 웹조사가 아닌 방식으로 조사하는 것이다. 믹스모드 조사라고 불리는 최근의 방법의 대다수는 이 방식을 의미한다고 해도 과언이 아니다.

그렇다면 우리나라는 어떨까? 결론적으로 말하면 우리나라는 현재 푸시웹조사 측면에서는 완전히 '걸음마' 단계이다. 웹환경이 어느 나라보다 발달한 우리나라에서 왜 푸시웹조사가 걸음마 단계일까? 그것은 우편조사가 거의 불가한 환경에 그 원인이 있다. 우리나라는 표집틀의 문제로 인해 우편조사가 '거의' 불가능하다. 통계청에서 제공하는 표집틀인 조사구에서 제공하는 정보가 요도와 주소만 있고 가구주 이름이나 전화번호가 없기 때문에 우편조사가 불가능하다. 물론 조사구 주소로 '세대주님' 혹은 '가구주님' 하고 보낼 수는 있지만 스팸 우편 같아 보여 이 우편이 가구 내 응답자에게 도달할 확률이 극히 낮다. 상황이 이러하다보니 웹설문을 안내하기 위해 조사원이 방문해야하는 아주 희안한 상황이 발생한다. 이러한 상황은 현재 통계청 조사에서 발생하고 있는데, 웹조사 비율을 늘리기 위해 궁여지책으로 하고 있는 듯 하다. ㅋㅋㅋ

여기서 드는 의문 하나는 그렇다면 우리나라에서 푸시웹서베이는 불가능한 것일까? 1차 접촉을 우편으로 하는 푸시웹조사는 현재로서는 불가하다. 하지만 다른 방법으로 생각을 전환해보면 불가능할 것도 없다. 1차 접촉을 휴대전화 RDD 생성을 통해 전화로 한다면 가능할 수 있기 때문이다. 조금 더 자세히 얘기하면 휴대전화 RDD로 전화번호를 생성하고, 그 번호로 조사원이 전화를 걸어 조사를 안내하고 웹설문을 할 수 있는 URL을 문자로 보내주면 응답자는 URL을 눌러 조사에 참여하는 절차를 거친다. 조사 사례금도 모바일(모바일문화상품권 등)로 받는다. 이 방법은 2012년부터 2020년까지 아산정책연구원 연례조사에서 실제로 활용된 적도 있다.

2022년 5월 4일 수요일

온라인 샘플 구매자를 위한 37가지 질문(Questions to help buyers of online samples)

유럽조사협회(ESOMAR)에서 변화한 온라인 조사 환경에 맞추어 온라인 패널을 통한 웹조사를 하려는 고객이 알아야 할 질문 37개를 발표하였습니다.

https://esomar.org/code-and-guidelines/questions-for-users-and-buyers-of-online-sample

온라인 샘플 구매자를 위한 37가지 질문

회사 프로파일

1. 귀사는 시장 조사를 위해 온라인 샘플을 제공한 경험이 있습니까? 이 서비스를 제공하신 지 얼마나 되셨습니까? 다이렉트 마케팅 등 다른 용도로도 비슷한 서비스를 제공하나요? 만약 그렇다면, 당신의 업무 중 시장 조사를 위한 비율은 어느 정도인가요?

2. 샘플링 알고리즘 및 관련 자동화 기능의 성능을 개발하고 모니터링해야 하는 담당 직원이 이 분야에 대한 지식과 경험을 가지고 있습니까? 일선 직원에게 샘플링 기술에 대한 어떤 교육을 제공합니까?

3. 다른 서비스는 어떤 게 있나요? 샘플만 취급합니까, 아니면 광범위한 데이터 수집 및 분석 서비스를 제공합니까?

샘플 출처 및 리쿠르팅

4. 위의 광범위한 분류를 사용하여 온라인 샘플의 어떤 출처에서 참가자를 도출합니까?

5. 다음 중 독점적 또는 독점적 공급원이며 구매자에게 제공된 전체 샘플에서 각 공급원의 비율은 얼마입니까? (표본 제공자가 자산을 소유하고 있음을 의미한다고 가정합니다. 표본제공자가 원래 다른 기업이 수집한 표본에 대한 접근권을 관리/제공하는 독점적 계약을 가지고 있다는 것을 의미한다고 가정한다.)

6. 귀하가 설명한 각 출처에 대해 어떤 채용 채널을 사용하고 있습니까? 모집 과정은 '모든 사람에게 공개'인가요, 아니면 초청에 의해서만 진행되나요? 확률론적 방법을 사용하고 있습니까? 제휴 네트워크와 추천 프로그램을 어느 정도 사용하고 있습니까? 이 채널들을 사용하는 방법은 지역에 따라 어떻게 다릅니까?

7. 참가자가 실제적이고, 독특하며, 자신이 누구라고 말하는지 확인하기 위해 채용 시 어떤 형태의 검증을 사용하십니까?

8. 독점 소스와 함께 어떤 브랜드(도메인) 및/또는 앱을 사용하십니까? 모바일 앱, 이메일 또는 기타 지정된 수단을 통한 샘플 액세스 설문 조사 비율을 출처별로 요약합니다.

9. 샘플을 제공할 수 있는 모델은 무엇입니까? 관리 서비스, 셀프 서비스 또는 API 통합?

10. 절편을 제공하거나 둘 이상의 소스에 대한 액세스를 제공하는 경우 표본 구성에 대해 어느 정도의 투명도를 제공합니까(표본 소스, 혼합에 포함된 표본 공급자). 구매자가 프로젝트에 포함할 샘플의 출처를 통제하도록 하고, 그렇다면 어떻게 관리합니까? 제공되는 타사 소스와의 통합 메커니즘이 있습니까?

11. 사용 가능한 샘플 출처 중 각각이 다른 연구 용도에 적합한지에 대해 어떻게 설명하시겠습니까? 예를 들어, 구매자가 동일한 샘플로 다시 돌아가야 할 수 있는 제품 테스트 또는 다른 리크루트/리콜 상황에 적합한 샘플이 있습니까? 샘플이 짧은 설문지나 긴 설문지에 적합한가? 모바일 전용 설문지 또는 데스크톱 전용 설문지? 커뮤니티 모집에 적합한가요? 온라인 포커스 그룹?

샘플링 및 프로젝트 관리

12. 초대부터 설문 조사 완료까지의 전반적인 프로세스에 대해 간략하게 설명합니다. 대상 모집단을 "모양"으로 보이는 표본을 얻기 위해 어떤 단계를 밟습니까? 인구통계학적 할당량 통제(있는 경우)는 무엇입니까?

13. 패널 구성원의 80% 이상에 대해 어떤 프로파일링 정보와 사전 연락을 통해 알려진 가로채기 정보를 보유하고 있습니까? 당신이 제공하는 출처에 따라 이것이 어떻게 다릅니까? 각 데이터 포인트는 얼마나 자주 업데이트됩니까? 이 데이터 포인트를 데이터 세트에 추가되는 대로 제공할 수 있습니까? 이 프로파일링 정보를 직접 수집하십니까? 아니면 타사에서 제공합니까?

14. 실현 가능성에 대한 견적을 제공하기 위해 프로젝트에 대해 어떤 정보가 필요합니까? 이러한 추정치에 대한 상한 또는 하한을 제공하기 위해 어떤 조치를 취하십니까?

15. 현장에서 프로젝트를 완료하는 것이 불가능하다는 것이 입증되면 어떻게 하시겠습니까? 당신은 프로젝트를 완료하기 위해 누구를 사용할 것인지 샘플 구매자에게 알려주나요? 이러한 상황에서 제3자 출처/하청업체를 어떻게 유지하고 인증합니까?

16. 조사 라우터 또는 수익률 관리 기법을 사용하십니까? 그렇다면 설문조사에 참가자를 할당하는 방법에 대해 설명하십시오. 잠재적 참가자들이 어떻게 연구에 참여하도록 요청받습니까? 제공하는 각 소스에 대해 이 작업을 수행하는 방법을 지정하십시오.

17. 설문조사에 응하기 전에 참가자가 라우터에 있을 수 있는 시간을 제한합니까?

18. 설문 조사 참여 여부를 결정하기 전에 프로젝트에 대한 어떤 정보를 잠재적 참여자에게 제공합니까? 당신이 제공하는 출처에 따라 이것이 어떻게 다릅니까?

19. 참가자가 사용 가능한 설문 조사 중에서 설문 조사를 선택할 수 있도록 허용합니까? 그렇다면, 각 설문 조사에 대해 어떤 정보를 얻었습니까?

20. 설문 조사 과정에서 잠재적 참가자(또는 참가자의 하위 그룹)에게 제공되는 인센티브를 증가(또는 감소)할 수 있는 능력은 무엇입니까? 그렇다면 데이터 세트의 참가자 수준에서 플래그를 지정할 수 있습니까?

21. 개별 프로젝트 수준에서 참가자 만족도를 측정합니까?

22. 프로젝트가 완료된 후 프로젝트에 대한 결과 보고서를 제공합니까? 만약 그렇다면, 예를 들어줄 수 있습니까?

데이터 품질 및 검증

23. 동일한 개인이 얼마나 자주 설문조사에 참여할 수 있습니까? 샘플 출처에 따라 어떻게 달라집니까? 이 설문조사에 참여하기 전에 이미 설문조사를 실시했을 수 있는 평균 및 최대 시간은 얼마입니까? 어떻게 하는 겁니까?

24. 최근 참여 내역, 참가 날짜, 출처/채널 등 개별 참가자에 대해 어떤 데이터를 유지하고 있습니까? 이러한 개별 레벨 데이터에 대한 프로젝트 분석을 구매자에게 제공할 수 있습니까? 이러한 데이터 포인트를 참가자 기록에 추가할 수 있습니까?

25. 프로젝트 수준에서 참가자의 신원 확인을 위한 절차를 설명하십시오. 이러한 절차는 설문 조사 또는 라우터의 진입 지점에서 구현될 때 설명하십시오.

26. 프로젝트 레벨에서 소스 일관성 및 혼합을 어떻게 관리합니까? 추적기와 관련하여, 샘플 소스의 특성과 구성이 시간이 지남에 따라 동일하게 유지되도록 어떻게 보장합니까? 구매자에게 제공할 수 있는 블렌드와 소스에 대한 보고서가 있습니까? 소스를 참가자 데이터 기록에 추가할 수 있습니까?

27. 회원/참가자에 대해 유지 관리하는 건강 지표와 함께 참가자/회원 품질 추적 및 플랫폼, 라우터 또는 설문 조사에 참여하는 사람들을 초대, 추적, 검역 및 차단하는 데 사용되는 메트릭에 대해 설명하십시오. 프로파일링 및 알려진 데이터를 조사 중인 응답과 비교하기 위해 어떤 프로세스가 있습니까?

28. 평가 데이터를 프로그래밍, 호스팅 및 제공하는 작업의 경우 다음과 같이 원치 않는 평가 내 행동을 줄이거나 제거하기 위해 어떤 프로세스를 가지고 있습니까?

(a) 무작위 응답, (b) 비논리적이거나 일관성 없는 응답, (c) 항목 무응답의 과다 사용(예: "모름")

(d) 부정확하거나 일관되지 않은 응답, (e) 불완전한 응답 또는 (f) 설문조사가 너무 빨리 완료되었습니까?

정책 및 규정 준수

29. 참가자의 개인 정보 보호 정책(개인 정보 보호 정책이라고도 함)에 대한 링크와 함께 이 알림이 다루는 주요 개념에 대한 요약을 제공하십시오. (참고: 회사에서 여러 제품 또는 서비스에 대해 서로 다른 개인 정보 보호 통보를 사용하는 경우, 이 질문에 대한 답변에서 다루는 제품 또는 서비스와 관련된 예를 제공하십시오.)

30. 귀사는 운영 중인 다양한 국가에서 적용되는 주요 데이터 보호 법률 및 규정을 어떻게 준수합니까? 개인 데이터 처리에 대한 동의 또는 기타 법적 근거와 관련된 요구사항을 어떻게 해결합니까? 데이터 침해 대응, 국경 간 전송 및 데이터 보존에 대한 요구사항을 어떻게 해결합니까? 데이터 보호 담당자를 지정했습니까?

31. 참가자들은 개인 데이터 처리에 대한 동의를 어떻게 제공하고, 관리하고, 수정할 수 있는가? 참가자들에게 어떤 지원 채널을 제공하고 있습니까?

32. 참가자에게 지급되는 인센티브에 영향을 미칠 수 있는 다른 관련 법률 및 규정을 어떻게 추적하고 준수합니까?

33. 어린이와 청소년의 개인 데이터를 수집하고 처리하는 당신의 접근법은 무엇인가? ESOMAR 또는 GRBN 회원 협회가 제공하는 표준 및 지침을 준수합니까? 해당 데이터 보호 법률 및 규정을 어떻게 준수합니까?

34. 시스템 및 프로세스에 "설계별 데이터 보호"(설계별 개인 정보 보호라고도 함)를 구현하고 있습니까? 그렇다면 방법을 설명하십시오.

35. 정보 보안 컴플라이언스 프로그램의 핵심 요소는 무엇입니까? 준수하거나 인증하는 프레임워크 또는 감사 절차를 지정하십시오. 프로그램에 자산 기반 위험 평가 및 내부 감사 프로세스가 포함되어 있습니까?

36. ISO 20252와 같은 품질 프레임워크를 인증하거나 준수합니까?

메트릭스

37. 다음 중 구매자에게 국가별 및 출처별로 제공할 수 있는 것은 무엇입니까? 사용하는 각 메트릭에 대한 샘플 보고서의 링크를 포함하거나 파일을 첨부하십시오.

01. 월별 평균 합격률 또는 완료율 추이

02. 월별/프로젝트별로 거부된 유료 완료 비율(월별 추세)

03. 삭제/격리된 회원/계정 비율(월별 추이)

04. 월별로 추이하여 0-3개월 재직 기간 중 급여가 완료되는 비율

05.월별로 추이하여 스마트폰에서 완료되는 유료 비율

06. 월별 추세로 보면, 소유/브랜드 회원 관계 대 대행 참여자의 급여 완료

07. 회원당 월별(잠재적으로 코호트별) 평균 처분 횟수(조사 시도, 선별 배제 및 완료)

08. 월별 추세(잠재적으로 코호트별)인 구성원당 평균 지급 완료 횟수

09.지난 30일 동안 활동적인 고유 참가자

10. 최근 30일 동안 활동적인 18-24명의 남성 참가자

11. 특정 국가에서 natrep 쿼터가 있는 최대 실현 가능성, 7일 현장, 100% 발생률, 10분 인터뷰

12. 인도 시 전체 할당량에 도달한 할당량의 백분율(월별 추이)

***원문***

Questions to help buyers of online samples

Company Profile

1. What experience does your company have in providing online samples for market research? How long have you been providing this service? Do you also provide similar services for other uses such as direct marketing? If so, what proportion of your work is for market research?

2. Do you have staff with responsibility for developing and monitoring the performance of the sampling algorithms and related automated functions who also have knowledge and experience in this area? What sort of training in sampling techniques do you provide to your frontline staff?

3. What other services do you offer? Do you cover sample-only, or do you offer a broad range of data collection and analysis services?

Sample sources and Recruitment

4. Using the broad classifications above, from what sources of online sample do you derive participants?

5. Which of these sources are proprietary or exclusive and what is the percent share of each in the total sample provided to a buyer? (Assume proprietary to mean that the sample provider owns the asset. Assume exclusive to mean that the sample provider has an exclusive agreement to manage/provide access to sample originally collected by another entity.)

6. What recruitment channels are you using for each of the sources you have described? Is the recruitment process ‘open to all’ or by invitation only? Are you using probabilistic methods? Are you using affiliate networks and referral programs and in what proportions? How does your use of these channels vary by geography?

7. What form of validation do you use in recruitment to ensure that participants are real, unique, and are who they say they are?

8. What brand (domain) and/or app are you using with proprietary sources? Summarise, by source, the proportion of sample accessing surveys by mobile app, email or other specified means.

9. Which model(s) do you offer to deliver sample? Managed service, self-serve, or API integration?

10. If offering intercepts, or providing access to more than one source, what level of transparency do you offer over the composition of your sample (sample sources, sample providers included in the blend). Do you let buyers control which sources of sample to include in their projects, and if so how? Do you have any integration mechanisms with third-party sources offered?

11. Of the sample sources you have available, how would you describe the suitability of each for different research applications? For example, Is there sample suitable for product testing or other recruit/recall situations where the buyer may need to go back again to the same sample? Is the sample suitable for shorter or longer questionnaires? For mobile-only or desktoponly questionnaires? Is it suitable to recruit for communities? For online focus groups?

Sampling And Project Management

12. Briefly describe your overall process from invitation to survey completion. What steps do you take to achieve a sample that “looks like” the target population? What demographic quota controls, if any, do you recommend?

13. What profiling information do you hold on at least 80% of your panel members plus any intercepts known to you through prior contact? How does this differ by the sources you offer? How often is each of those data points updated? Can you supply these data points as appends to the data set? Do you collect this profiling information directly or is it supplied by a third party?

14. What information do you need about a project in order to provide an estimate of feasibility? What, if anything, do you do to give upper or lower boundaries around these estimates?

15. What do you do if the project proves impossible for you to complete in field? Do you inform the sample buyer as to who you would use to complete the project? In such circumstances, how do you maintain and certify third party sources/sub-contractors?

16. Do you employ a survey router or any yield management techniques? If yes, please describe how you go about allocating participants to surveys. How are potential participants asked to participate in a study? Please specify how this is done for each of the sources you offer.

17. Do you set limits on the amount of time a participant can be in the router before they qualify for a survey?

18. What information about a project is given to potential participants before they choose whether to take the survey or not? How does this differ by the sources you offer?

19. Do you allow participants to choose a survey from a selection of available surveys? If so, what are they told about each survey that helps them to make that choice?

20. What ability do you have to increase (or decrease) incentives being offered to potential participants (or sub-groups of participants) during the course of a survey? If so, can this be flagged at the participant level in the dataset?

21. Do you measure participant satisfaction at the individual project level? If so, can you provide normative data for similar projects (by length, by type, by subject, by target group)?

22. Do you provide a debrief report about a project after it has completed? If yes, can you provide an example?

Data quality and Validation

23. How often can the same individual participate in a survey? How does this vary across your sample sources? What is the mean and maximum amount of time a person may have already been taking surveys before they entered this survey? How do you manage this?

24. What data do you maintain on individual participants such as recent participation history, date(s) of entry, source/channel, etc? Are you able to supply buyers with a project analysis of such individual level data? Are you able to append such data points to your participant records?

25. Please describe your procedures for confirmation of participant identity at the project level. Please describe these procedures as they are implemented at the point of entry to a survey or router.

26. How do you manage source consistency and blend at the project level? With regard to trackers, how do you ensure that the nature and composition of sample sources remain the same over time? Do you have reports on blends and sources that can be provided to buyers? Can source be appended to the participant data records?

27. Please describe your participant/member quality tracking, along with any health metrics you maintain on members/participants, and how those metrics are used to invite, track, quarantine, and block people from entering the platform, router, or a survey. What processes do you have in place to compare profiled and known data to in-survey responses?

28. For work where you program, host, and deliver the survey data, what processes do you have in place to reduce or eliminate undesired in-survey behaviours, such as (a) random responding, (b) Illogical or inconsistent responding, (c) overuse of item nonresponse (e.g., “Don’t Know”) (d) inaccurate or inconsistent responding, (e) incomplete responding, or (f) too rapid survey completion?

Policies And Compliance

29. Please provide the link to your participant privacy notice (sometimes referred to as a privacy policy) as well as a summary of the key concepts it addresses. (Note: If your company uses different privacy notices for different products or services, please provide an example relevant to the products or services covered in your response to this question).

30. How do you comply with key data protection laws and regulations that apply in the various jurisdictions in which you operate? How do you address requirements regarding consent or other legal bases for the processing personal data? How do you address requirements for data breach response, cross-border transfer, and data retention? Have you appointed a data protection officer?

31. How can participants provide, manage and revise consent for the processing of their personal data? What support channels do you provide for participants?

32. How do you track and comply with other applicable laws and regulations, such as those that might impact the incentives paid to participants?

33. What is your approach to collecting and processing the personal data of children and young people? Do you adhere to standards and guidelines provided by ESOMAR or GRBN member associations? How do you comply with applicable data protection laws and regulations?

34. Do you implement “data protection by design” (sometimes referred to as “privacy by design”) in your systems and processes? If so, please describe how.

35. What are the key elements of your information security compliance program? Please specify the framework(s) or auditing procedure(s) you comply with or certify to. Does your program include an asset-based risk assessment and internal audit process?

36. Do you certify to or comply with a quality framework such as ISO 20252?

Metrics

37. Which of the following are you able to provide to buyers, in aggregate and by country and source? Please include a link or attach a file of a sample report for each of the metrics you use.

01. Average qualifying or completion rate, trended by month

02. Percent of paid completes rejected per month/project, trended by month

03. Percent of members/accounts removed/quarantined, trended by month

04. Percent of paid completes from 0-3 months tenure, trended by month

05. Percent of paid completes from smartphones, trended by month

06. Percent of paid completes from owned/branded member relationships versus intercept participants, trended by month

07. Average number of dispositions (survey attempts, screenouts, and completes) per member, trended by month (potentially by cohort)

08. Average number of paid completes per member, trended by month (potentially by cohort)

09. Active unique participants in the last 30 days

10. Active unique 18-24 male participants in the last 30 days

11. Maximum feasibility in a specific country with nat rep quotas, sevendays in field, 100% incidence, 10-minute interview

12. Percent of quotas that reached full quota at time of delivery, trended by month

2021년 11월 15일 월요일

(업데이트) 정치사회 영역의 웹조사는 어떻게 진화해나갈 것인가?

마케팅 영역에서 활발하던 웹조사 방법은 어느새 정치 사회 영역에도 깊숙이 자리를 잡아버렸다. 정치, 경제, 심리 등 다양한 사회과학 영역에서 뿐만 아니라 정치나 정책 영역에서도 이제는 웹조사가 소위 '대세'가 되고 있다.

웹조사는 응답 대상자에게 구조화된 웹설문 url을 보내고, 응답 대상자가 그 url에 접속하여 자기기입을 통해 조사를 진행하는 방식을 의미한다.

웹조사가 다 그게 그거 같겠지만 크게 네 가지 유형이 있는데 정리하면 다음과 같다.

(유형1) 조사회사나 연구소가 구축해 놓은 액세스 패널을 활용한 웹조사

(유형1-1) 구축한 액세스 패널이 옵트인 패널(한마디로 비확률추출 기반 패널)인 경우

(유형1-2) 구축한 액세스 패널이 확률추출기반 패널인 경우

(유형2) 특정 사이트 게시판이나 배너를 매개로 참여한 응답자를 활용한 웹조사

(유형2-1) 페이스북 등 소셜미디어를 통해 모집한 응답자인 경우

(유형2-2) 아마존의 Mturk 등 크라우드 소싱을 통해 모집한 응답자인 경우

(유형3) 오프라인 조사 등을 통해 모집한 응답자를 활용한 웹조사

(유형3-1) 전화면접조사를 통해 모집한 응답자인 경우

(유형3-2) 대면면접조사를 통해 모집한 응답자인 경우

(유형3-3) 우편조사를 통해 모집한 응답자인 경우

(유형4) 무작위로 생성한 무선전화(RDD)를 활용한 웹조사

(유형4-1) 무선전화 RDD에 문자를 보내 진행하는 웹조사

(유형4-2) 무선전화 RDD에 전화를 걸어 안내를 한 후 문자를 보내 진행하는 웹조사

그렇다면 이렇게 다양한 유형의 조사 중 어떤 유형이 정치사회 영역의 웹조사로 살아남고 진화할 것인가? 필자 생각에는 (유형1-1), (유형2-1), (유형2-2), (유형3-3), 유형(4-2) 정도가 아닐까 하는데, 그 이유는 다음과 같다.

(유형1) 중 (유형1-2)가 진화하기 어려운 이유는 이론적으로는 (유형1-2)가 좋지만, 비용적 측면에서 부담이 높고, 관리 패널 수가 상대적으로 적어서 패널 오염(패널이 많은 조사를 하다보면 나름의 노하우가 생기는 것)의 가능성이 높다는 단점이 있기 때문이다. 그에 비해 (유형1-1)은 많은 패널 수를 관리하기 때문에 그러한 가능성이 낮고, 지속적인 업그레이드가 용이한 측면이 있다.

(유형2)의 경우 표집틀 측면에서 문제가 많은 조사이지만 참여자가 확대되고, 많은 노하우가 쌓이다보면 계속해서 진화할 가능성이 크다.

(유형3) 중 (유형3-1)과 (유형3-2)는 응답 대상자를 모집하는 과정에서 비용이 너무 많이 발생하는 단점이 있어 진화하기 어려울 것으로 보이는 반면, (유형3-3)은 우편조사의 특성답게 저비용으로 응답자 모집이 가능하다는 장점이 있다.

(유형4-1)의 경우 이론적으나 비용적으로나 아이디얼한 조사에 가까우나 모르는 번호로 문자가 왔을 경우 응답자가 이를 거부할 가능성이 높다는 문제로 아직은 진화 가능성이 높지는 않다고 본다. 반면 (유형4-2)의 경우에는 전화조사 비용의 1.5배 정도를 들이면 진행할 수 있고 응답율 차원에서도 기존의 전화조사에 비해 크게 낮지 않다는 장점이 있어 활성화될 여지가 있다.

2021년 7월 24일 토요일

선거여론조사에서 '모름/무응답'이라고 쓰는게 맞을까?

중앙여론조사심의위원회 홈페이지 등록 선거여론조사에서 아래와 같이 '모름/무응답'이란 항목을 매번 본다. '2021 선거여론조사 가이드북'에 나온 내용이니 당연하게 문제가 없다고 여기고 습관적으로 활용하고 있는 것이다. 그렇다면 정말 '모름/무응답'으로 표기하는 건 문제가 없는 것일까??????????????

<2021 선거여론조사 가이드북>

우선 '모름'과 '무응답'의 의미부터 알아보자.

'모름'은 그야말로 해당 문항에 대해 '모르겠다'는 자기 표현이다. 예를 들어 어느 정당을 지지하는지 물어보고 정당 이름(지지정당 없음 포함)를 불러주었을 때 정말 모르겠다고 응답할 수 있다.

반면 '무응답'은 항목무응답 즉 해당 문항에 대해 응답을 받지 못한 결측치(Missing Data)를 의미하는 것으로 응답자의 의사표현이 아니다.

그러면 왜 이렇게 성격이 다른 모름/무응답을 같이 표기하는 것일까? 유추해보면 전화조사에서 CATI를 쓰지 않았던 과거에는 종이설문지를 조사원에게 나누어주고 종이설문지에 응답을 표기하게 하고, 표기한 설문지를 수거하여 입력원이 컴퓨터에 입력하는 과정에서 실수로 문항에 답을 표기하지 않았거나 혹은 해당 문항을 묻지 않고 넘어갔을 경우가 있었을 것이다. 이러한 이유로 무응답이라는 것이 발생했을 것이고 아마도 이를 따로 표기하기보다 모르겠다에 포함했을 개연성이 컸다고 본다....

반대로 CATI 시스템을 활용하는 전화조사에서는 '무응답'은 절대로 나올 수 없다. 그러니 굳이 무응답이란 항목이 필요 없는 것이다.

그러면 앞으로 어떻게 하는 것이 좋을까? 한국갤럽과 같이 무응답 대신에 '응답거절'이라고 표기하는 것도 한 가지 대안이 될 수 있다고 본다.

2021년 7월 1일 목요일

정치사회 영역의 웹조사는 어떻게 진화해나갈 것인가?

마케팅 영역에서 활발하던 웹조사 방법은 어느새 정치 사회 영역에도 깊숙이 자리를 잡아버렸다. 정치, 경제, 심리 등 다양한 사회과학 영역에서 뿐만 아니라 정치나 정책 영역에서도 이제는 웹조사가 대세가 되고 있다.

웹조사는 응답 대상자에게 구조화된 웹설문 url을 보내고, 응답 대상자가 그 url에 접속하여 자기기입을 통해 조사를 진행하는 방식을 의미한다.

웹조사가 다 그게 그거 같겠지만 크게 네 가지 유형이 있는데 정리하면 다음과 같다.

(유형1) 조사회사나 연구소가 구축해 놓은 액세스 패널을 활용한 웹조사

(유형1-1) 구축한 액세스 패널이 옵트인 패널(한마디로 비확률추출 기반 패널)인 경우

(유형1-2) 구축한 액세스 패널이 확률추출기반 패널인 경우

(유형2) 특정 사이트 게시판이나 배너를 매개로 참여한 응답자를 활용한 웹조사

(유형2-1) 페이스북 등 소셜미디어를 통해 모집한 응답자인 경우

(유형2-2) 아마존의 Mturk 등 크라우드 소싱을 통해 모집한 응답자인 경우

(유형3) 오프라인 조사 등을 통해 모집한 응답자를 활용한 웹조사

(유형3-1) 전화면접조사를 통해 모집한 응답자인 경우

(유형3-2) 대면면접조사를 통해 모집한 응답자인 경우

(유형3-3) 우편조사를 통해 모집한 응답자인 경우

(유형4) 무작위로 생성한 무선전화에 문자를 보내 진행하는 웹조사

그렇다면 이렇게 다양한 유형의 조사 중 어떤 유형이 정치사회 영역의 웹조사로 살아남고 진화할 것인가? 필자 생각에는 (유형1-1), (유형2-1), (유형2-2), (유형3-3) 정도가 아닐까 하는데, 그 이유는 다음과 같다.

(유형2)의 경우 표집틀 측면에서 문제가 많은 조사이지만 참여자가 확대되고, 많은 노하우가 쌓이다보면 계속해서 진화할 가능성이 크다.

(유형4)의 경우 이론적으나 비용적으로나 아이디얼한 조사에 가까우나 모르는 번호로 문자가 왔을 경우 응답자가 이를 거부할 가능성이 높다는 문제로 아직은 진화 가능성이 높지는 않다고 본다.

2021년 1월 29일 금요일

긍부정 척도는 어떤 순으로 배치하는게 좋을까?

설문지를 만들면서 고민되는 게 참 많지만 척도 배치를 긍정에서 부정순으로 하느냐 아니면 부정에서 긍정순으로 하는 것도 그 중 하나다. 경험적으로 보면 고객마다 이 부분은 다르게 생각하는 것 같다. 즉 어떤 고객은 긍정에서 부정을 선호하고 어떤 고객은 그 반대인 경우가 있다.

그렇다면 긍부정 척도는 어떤 순으로 배치하는게 좋을까? 어떻게 해도 상관 없는 것일까? 음...문헌을 찾다보니 그건 아닌거 같다.

정답부터 말하자면 긍정에서 부정순으로 하는 게 더 나은 것 같다.

그렇다면 어떤 근거로? 그 대답을 위해서 약간은 이론적인 이야기를 해보겠다. 설문을 만드는데 있어 아래와 같은 5가지 휴라스틱이 있다.

1. Middle means typical: respondents will see the middle option as the most typical

2. Left and top means first: the leftmost or top option will be seen as the 'first' in conceptual sense

3. Near means related: options that are physically near each other are expected to be related conceptually

4. Up means good: the top option will be seen as the most desirable

5. Like means close: visually similar options will be seen as closer conceptually.

이 중에서 이번에 적용할 휴리스틱은 바로 '2. Left and top means first'과 '4. Up means good'이다. 이 말은 쉽게 설명하자면 왼쪽이나 위를 시작점으로 잡고 왼쪽에서 오른쪽으로 위쪽에서 아래쪽으로 척도를 이해한다는 것이다. 한 걸음 더 나아가 시작점을 긍정으로 인식하고 대척점을 부정으로 인식한다는 것이다.

마지막으로 예를 들어 조금 더 명확히 하고자 한다. B보다는 A타입이 더 낫다는 것이다. 이는 세로나 가로 배치 모두에 적용된다

귀하께서는 문재인 대통령이 국정을 어떻게 운영한다고 생각하십니까?

(A-1)

1. 매우 잘한다

2. 대체로 잘한다

3. 별로 못한다

4. 매우 못한다

9. 모르겠다

(A-2)

1. 매우 잘한다 2. 대체로 잘한다 3. 별로 못한다 4. 매우 못한다 9. 모르겠다

(B-1)

1. 매우 못한다

2. 별로 못한다

3. 대체로 잘한다

4. 매우 잘한다

9. 모르겠다

(B-2)

1. 매우 못한다 2. 별로 못한다 3. 대체로 잘한다 4. 매우 잘한다 9. 모르겠다

뭐 여기까지 얘기했으니 관련해서 조금 더 얘기해보자면 위의 A타입 척도 배치에도 문제가 있다. 이는 '1. Middle means typical'과 관련이 있는데 즉 모르겠다는 보기 때문에 척도의 중간지점이 '3. 별로 못한다'가 되어 버리는 문제가 있다. 이를 감안하여 수정해보면 아래와 같이 하는 것이 가장 이상적이다.

귀하께서는 문재인 대통령이 국정을 어떻게 운영한다고 생각하십니까?

(A-1-1)

1. 매우 잘한다

2. 대체로 잘한다

3. 별로 못한다

4. 매우 못한다

-----------------------------------------------

9. 모르겠다

(A-2-1)

1. 매우 잘한다 2. 대체로 잘한다 3. 별로 못한다 4. 매우 못한다 9. 모르겠다

메소드서베이

2022년 7월 18일 월요일

DIY 웹조사가 판치는 세상에서 내 조사 품질을 올리는 방법은?

2022년 7월 13일 수요일

푸시웹서베이(push-to-web survey)를 우리나라에서 활성화시킬 수 있을까?

2022년 5월 4일 수요일

온라인 샘플 구매자를 위한 37가지 질문(Questions to help buyers of online samples)

2021년 11월 15일 월요일

(업데이트) 정치사회 영역의 웹조사는 어떻게 진화해나갈 것인가?

2021년 7월 24일 토요일

선거여론조사에서 '모름/무응답'이라고 쓰는게 맞을까?

2021년 7월 1일 목요일

정치사회 영역의 웹조사는 어떻게 진화해나갈 것인가?

2021년 1월 29일 금요일

긍부정 척도는 어떤 순으로 배치하는게 좋을까?

층화와 할당은 어떻게 다른가

블로그 보관함