척도 설계: 30개 질문과 대답

Q128. 척도와 문항은 어떻게 다른가? 문항은 하나의 질문이고, 척도는 하나의 개념을 측정하기 위해 설계된 문항들의 체계다. 단일 문항으로 측정하는 경우도 있지만, 복잡한 개념(이념 성향, 삶의 만족도, 번아웃)은 여러 문항을 묶어 척도로 측정해야 신뢰도와 타당도가 확보된다. 문항은 척도의 구성 요소이고, 척도는 측정의 도구다. 이 구분을 모르면 단일 문항으로 측정한 결과를 척도인 양 보고하는 오류를 범한다.

Q129. 리커트 척도의 정확한 정의는? 1932년 렌시스 리커트가 개발한 방법으로, 동일한 개념을 측정하는 여러 문항에 대해 동의 정도를 응답하고 그 합산 점수로 태도를 측정하는 방식이다. 핵심은 개별 문항이 아니라 문항들의 합산이 측정값이 된다는 것이다. 그러므로 5점 척도 단일 문항 하나를 리커트 척도라고 부르는 것은 엄밀히 틀렸다. 그것은 리커트형 응답 형식일 뿐이다.

Q130. 리커트 척도와 리커트형 척도는 어떻게 다른가? 리커트 척도는 복수 문항의 합산으로 하나의 개념을 측정하는 척도 구성 방식이다. 리커트형 척도는 '매우 동의'에서 '전혀 동의 안 함'까지 동의 정도를 묻는 응답 형식 자체를 말한다. 전자는 측정 설계의 개념이고, 후자는 응답 포맷이다. 실무에서는 두 용어를 혼용하지만, 연구 맥락에서는 구분이 필요하다. 5점 리커트형 문항 하나가 리커트 척도가 되려면 유사한 문항들과 묶여야 한다.

Q131. 5점 척도와 7점 척도 중 어느 것이 더 좋은가? 정답은 없다. 7점이 더 세밀한 변별을 가능하게 하지만, 응답자가 7개 범주를 실제로 구분할 수 있는지가 전제다. 연구에 따르면 인간이 안정적으로 구분할 수 있는 범주는 5~7개 수준이다. 조사 목적이 집단 간 차이를 세밀하게 보는 것이라면 7점, 빠른 응답이 중요하고 응답자 부담을 줄여야 한다면 5점이 낫다. 맥락 없는 선택은 의미 없다.

Q132. 척도점 수가 많을수록 좋은가? 아니다. 10점이나 100점 척도는 심리적으로 세밀해 보이지만, 응답자가 6점과 7점의 차이를 실제로 구분하는지는 의심스럽다. 척도점이 많아질수록 응답자의 인지 부담이 커지고, 실제로는 응답이 몇 개 지점에 집중되는 경향이 있다. 척도점 수는 측정하려는 구성 개념의 복잡성, 응답자 특성, 조사 방식을 함께 고려해서 결정해야 한다.

Q133. 짝수 척도와 홀수 척도 중 무엇을 선택해야 하는가? 측정 대상의 성격에 달려 있다. 개념적으로 중립이 존재하는 태도(찬반, 이념, 만족·불만족)라면 홀수 척도로 중립점을 두는 것이 적절하다. 반면 방향성이 없는 단극 개념(빈도, 정도)이나 응답자가 반드시 입장을 취해야 하는 상황이라면 짝수 척도로 강제 선택을 유도할 수 있다. 중립점 유무는 척도 구조의 핵심 결정이지 편의의 문제가 아니다.

Q134. 중립점은 왜 논쟁이 되는가? 중립 응답이 무엇을 의미하는지 해석이 모호하기 때문이다. 진정한 중립 태도일 수도 있고, 모르겠다는 의미일 수도 있고, 귀찮아서 중간을 찍는 것일 수도 있다. 세 가지 의미가 같은 숫자 안에 섞이면 분석 결과의 해석이 흐려진다. 그렇다고 중립점을 없애면 진짜 중립인 사람에게 거짓 입장을 강요하는 문제가 생긴다. 답은 없고 트레이드오프가 있을 뿐이다.

Q135. 모르겠다와 중간이다는 어떻게 다른가? 완전히 다른 인지 상태다. '중간이다'는 양쪽 입장을 모두 알고 있으며 그 사이 어딘가에 있다는 의미다. '모르겠다'는 판단할 정보나 의견이 없다는 의미다. 이 두 응답을 같은 선택지로 묶으면 데이터 해석이 왜곡된다. 이슈 인지도가 낮은 주제에서 '모르겠다'가 많은 것은 여론 공백의 신호인데, 이를 중립 여론으로 오해하면 분석이 완전히 틀어진다.

Q136. 중립점 제거가 데이터 품질을 높이는가? 상황에 따라 다르다. 중립점 제거는 응답자를 양방향 중 하나로 밀어내는 효과가 있어 변별력이 높아 보인다. 하지만 진정한 중립 태도를 가진 응답자에게 왜곡된 응답을 강요한다. 이슈에 대한 인지가 낮거나 태도가 형성되지 않은 집단이 많은 조사에서 중립점 제거는 오히려 데이터를 오염시킨다. 제거의 목적이 편리함이 아니라 측정 타당성에 근거해야 한다.

Q137. 단극척도와 양극척도는 언제 구분해야 하는가? 개념의 구조에 따라 결정해야 한다. 양극척도는 반대되는 두 극이 존재하는 개념에 쓴다. 진보-보수, 찬성-반대, 긍정-부정이 대표적이다. 단극척도는 없음에서 많음으로 가는 개념, 즉 한 방향으로만 증가하는 개념에 쓴다. 빈도, 강도, 만족도(논란 있음)가 여기 해당한다. 양극 개념을 단극으로 측정하면 반대 방향의 정보를 잃고, 단극 개념을 양극으로 측정하면 구조적으로 맞지 않는 응답을 강요한다.

Q138. 만족도는 단극인가, 양극인가? 논쟁이 있는 질문이다. 전통적으로 만족도는 '불만족'이 반대 극에 있는 양극 개념으로 본다. 그러나 허츠버그의 2요인 이론 관점에서는 만족과 불만족이 별개의 차원이다. 즉 만족이 없다고 불만족인 것이 아닐 수 있다. 실무에서는 대부분 양극척도로 측정하지만, 고객 경험이나 서비스 품질 연구에서는 단극으로 측정하는 것이 더 적합한 경우도 있다. 맥락에 따라 판단해야 한다.

Q139. 이념 성향은 단극으로 측정해야 하는가, 양극으로 해야 하는가? 이것이 한국 여론조사에서 가장 중요한 척도 설계 논쟁 중 하나다. 양극척도(진보-보수)로 측정하면 진보와 보수를 하나의 연속선으로 보는 것이다. 하지만 진보 성향과 보수 성향이 독립적인 차원이라면 각각 단극으로 측정해야 한다. 단일 양극 문항은 응답자를 강제로 진보 혹은 보수로 분류한다. 복합적 이념 구조를 가진 한국 20대를 측정할 때 이 선택은 결과를 크게 바꾼다.

Q140. VAS(시각적 아날로그 척도)는 언제 유용한가? 응답자가 선택지 경계 없이 연속적 판단을 표현해야 할 때 유용하다. 0mm에서 100mm 사이의 선 위에 표시하는 방식으로, 이론적으로 무한히 세밀한 측정이 가능하다. 통증 강도, 감정 강도처럼 연속적이고 미묘한 차이를 포착해야 할 때 적합하다. 그러나 온라인 조사에서는 마우스·터치 정밀도에 따라 응답이 달라질 수 있고, 응답자가 선택지 없이 판단하는 것을 불편해하기도 한다.

Q141. 온도계 척도(feeling thermometer)란 무엇인가? 0에서 100 사이의 온도계 모양 척도로 특정 대상(정치인, 집단, 정책)에 대한 호감도를 측정하는 방법이다. 50이 중립, 100이 가장 호감, 0이 가장 비호감을 의미한다. 미국 선거 연구(ANES)에서 오랫동안 써온 척도로, 집단 간 감정적 거리를 비교하는 데 유용하다. 숫자 척도보다 직관적이고, 연속적 판단을 가능하게 한다. 한국 정치 연구에서도 활용 가능성이 높다.

Q142. 순위척도와 평정척도는 어떻게 다른가? 평정척도(rating scale)는 각 항목을 독립적으로 평가한다. 모든 항목이 동점을 받을 수 있다. 순위척도(ranking scale)는 항목들 사이의 상대적 순서를 매긴다. 1등이 하나뿐이다. 평정척도는 항목 간 절대적 평가 수준을 알 수 있지만 관대화 편향이 생긴다. 순위척도는 변별력이 높지만 항목 수가 많아지면 응답 부담이 급격히 커진다. 목적에 따라 선택해야 한다.

Q143. 강제선택(forced choice) 척도는 왜 쓰는가? 사회적 바람직성 편향을 줄이기 위해서다. 응답자에게 모두 긍정적이거나 모두 중립적으로 보이는 선택지들 중 하나를 강제로 고르게 함으로써, 사회적으로 바람직한 방향으로 응답이 몰리는 것을 막는다. 인사 선발이나 성격 측정에서 자주 쓰인다. 단점은 응답자가 어느 선택지도 자신에게 해당하지 않는다고 느낄 때 불만이 생기고, 데이터 해석이 복잡해진다는 점이다.

Q144. 최대차별화척도(MaxDiff)란 무엇인가? 여러 항목 중 가장 중요한 것과 가장 중요하지 않은 것을 동시에 선택하게 하는 방법이다. 일반적인 중요도 평정에서 발생하는 관대화 편향과 척도 사용 방식 차이를 극복할 수 있다. 응답자는 매번 일부 항목들의 부분집합을 보고 최고·최저를 선택하며, 이 결과를 집계해 전체 항목의 상대적 중요도를 도출한다. 마케팅 조사에서 특히 유용하며, 우선순위 파악이 목적일 때 평정척도보다 변별력이 높다.

Q145. 척도의 신뢰도와 타당도는 어떻게 다른가? 신뢰도는 동일한 측정을 반복했을 때 일관된 결과가 나오는 정도다. 타당도는 측정하려는 개념을 실제로 측정하고 있는지의 문제다. 신뢰도가 높아도 타당도가 낮을 수 있다. 체중계로 키를 일관되게 잴 수 있지만 그것이 키 측정은 아닌 것과 같다. 타당도 없는 신뢰도는 의미 없고, 신뢰도 없는 타당도는 불안정하다. 좋은 척도는 둘 다 필요하다.

Q146. 크론바흐 알파가 높으면 좋은 척도인가? 높은 알파는 문항들이 내적으로 일관된다는 것을 보여주지만, 그것만으로 좋은 척도가 되지는 않는다. 알파는 문항 수가 늘어날수록 자동으로 높아지는 경향이 있다. 또한 알파가 높다는 것은 문항들이 너무 비슷해 사실상 같은 것을 중복 측정할 가능성도 있다. 더 중요한 것은 타당도다. 알파가 0.9라도 엉뚱한 개념을 측정하고 있다면 쓸모없는 척도다.

Q147. 단일 문항 척도는 언제 쓸 수 있는가? 개념이 단순하고 명확하며, 응답자가 즉각적으로 이해할 수 있을 때 가능하다. "전반적인 삶의 만족도는?" 같은 문항은 단일 문항으로도 타당한 측정이 된다는 연구가 있다. 반면 번아웃, 정치적 냉소, 신뢰 같은 다차원적 개념을 단일 문항으로 측정하면 개념의 복잡성을 포착하지 못한다. 설문 길이 제약이 있을 때 단일 문항을 쓰더라도, 그 한계를 인식하고 해석해야 한다.

Q148. 복합 지표(composite index)를 만들 때 주의할 점은? 구성 문항들이 실제로 같은 개념을 측정하는지 확인해야 한다. 이론적 근거 없이 관련 있어 보이는 문항들을 합산하면 의미 없는 숫자가 된다. 문항 간 상관관계 확인, 요인분석을 통한 차원 구조 파악이 선행되어야 한다. 또한 문항별 가중치를 어떻게 설정할지도 결정해야 한다. 단순 합산이 기본이지만, 중요도가 다른 문항들을 동일 가중치로 더하는 것이 항상 옳지는 않다.

Q149. 응답 선택지 레이블은 어떻게 정해야 하는가? 심리적 거리가 균등해야 한다. '매우 동의', '동의', '보통', '비동의', '매우 비동의'에서 각 단계 간 거리가 응답자에게 동등하게 느껴져야 한다. 레이블이 비대칭이면 척도의 중심이 틀어진다. 형용사 선택도 중요하다. '약간'과 '다소'가 같은 강도인지, '매우'와 '극히'가 다른지 검토해야 한다. 레이블은 단순히 이름을 붙이는 것이 아니라 응답자의 인지 구조를 설계하는 행위다.

Q150. 숫자 레이블을 쓰면 응답이 달라지는가? 달라진다. 1~5 대신 -2~+2로 표시하면 응답 분포가 바뀐다. 음수가 포함된 척도에서는 중립점이 0이 되어 응답자가 음수 선택에 더 강한 거부감을 보인다. 또한 1~10 척도에서 1~7에 레이블을 붙이느냐 전체에 붙이느냐에 따라서도 달라진다. 숫자 그 자체가 의미를 전달하기 때문이다. 척도를 설계할 때 숫자의 의미와 레이블의 의미가 충돌하지 않도록 해야 한다.

Q151. 척도 문항을 역코딩할 때 주의할 점은? 역코딩 대상 문항을 정확히 식별하고, 실수 없이 처리했는지 확인해야 한다. 역코딩 후 문항 간 상관관계가 의도한 방향으로 바뀌었는지 검증하는 것이 기본이다. 흔한 실수는 역코딩해야 할 문항을 빠뜨리거나, 이미 역코딩된 문항을 다시 역코딩하는 이중 역코딩이다. 또한 중립점이 있는 홀수 척도에서 역코딩을 할 때 중립값은 그대로 유지되는지도 확인해야 한다.

Q152. 한국어 척도 레이블의 특수한 문제는? 영어 척도를 번역할 때 동등한 심리적 거리를 가진 한국어 표현을 찾기 어렵다는 점이다. 예를 들어 'strongly agree'와 'agree'의 차이가 '매우 동의'와 '동의'로 번역되었을 때 영어 원본과 동일한 심리적 거리를 갖는지 불확실하다. 또한 한국어에는 정도를 나타내는 부사가 풍부해 선택지가 불필요하게 세분화되거나 뉘앙스가 겹치는 문제도 있다. 한국 맥락에 맞는 레이블을 독자적으로 검증할 필요가 있다.

Q153. 번역된 척도를 그대로 쓸 수 있는가? 원칙적으로는 번역·역번역 절차와 인지 사전조사를 거쳐야 한다. 번역자가 원문의 의미를 정확히 옮겼는지, 한국 응답자들이 번역된 문항을 원래 의도대로 해석하는지 확인해야 한다. 특히 심리·사회적 개념은 문화마다 의미가 다를 수 있다. 그냥 번역해서 쓰면 구성 타당도를 잃을 수 있다. 척도 도입의 편의성과 측정 타당도 사이의 트레이드오프를 인식해야 한다.

Q154. 척도 응답을 연속형으로 분석해도 되는가? 통계학적으로는 논쟁이 있지만 실무에서는 널리 허용된다. 엄밀히 말하면 5점 리커트형 척도는 순서형 데이터다. 간격이 동등하다고 가정할 수 없다. 그러나 문항 수가 충분하고 응답 분포가 정규분포에 가깝다면 연속형으로 처리해도 결과에 큰 차이가 없다는 연구가 많다. 단일 문항은 순서형으로, 여러 문항의 합산 점수는 연속형으로 분석하는 것이 현실적 타협점이다.

Q155. 척도 불변성(measurement invariance)이란 무엇인가? 같은 척도가 서로 다른 집단에서 동일한 방식으로 작동하는지를 검증하는 개념이다. 예를 들어 '삶의 만족도' 척도가 남성과 여성에게 동일한 의미를 갖는지, 응답 방식이 같은지 확인하는 것이다. 불변성이 확보되지 않으면 집단 간 평균 비교가 의미 없다. 형태 불변성, 측정 불변성, 스칼라 불변성 순으로 단계적으로 검증한다. 비교 연구에서 반드시 선행되어야 할 절차다.

Q156. 집단 간 척도 비교는 어떤 전제가 필요한가? 척도 불변성이 확보되어야 한다. 최소한 측정 불변성(factor loading 동일)이 확인되어야 평균 차이를 비교할 수 있고, 스칼라 불변성(절편 동일)이 확인되어야 평균 수준 비교가 유효하다. 이 검증 없이 집단 간 평균을 비교하는 것은, 같은 자를 쓴다고 가정하고 비교하는 것과 같다. 실무 조사에서 이 검증은 거의 이루어지지 않는다. 비교 연구의 숨겨진 취약점이다.

Q157. 척도 설계에서 가장 많이 범하는 실수는? 단극·양극 구분 없이 관행적으로 5점 척도를 쓰는 것이다. 개념의 구조를 먼저 생각하지 않고 형식부터 결정한다. 그 다음으로 흔한 실수는 중립점과 모름 응답을 구분하지 않는 것, 레이블의 심리적 거리가 균등한지 검토하지 않는 것이다. 더 근본적인 실수는 단일 문항으로 복잡한 개념을 측정하면서 타당도를 검증하지 않는 것이다. 척도 설계의 가장 큰 적은 관행이다.

댓글

이 블로그의 인기 게시물

5점 척도 분석 시 (환산) 평균값이 최상일까?

이중차분법(DID)과 평행추세가정: 횡단 데이터로 정책 효과 측정하기

선거 여론조사 가중치 분석: 셀 가중 vs 림 가중, 무엇이 더 나은가?