안녕하세요! 오늘은 데이터 분석에서 꼭 알아야할 4가지 측정척도를 알아보려고 합니다.
데이터 분석을 시작하려는 분들이라면 반드시 알아야 할 개념이 있습니다. 바로 측정척도(Scale of Measurement)입니다. 어떤 종류의 데이터를 다루고 있는지 알아야 올바른 분석 방법을 선택할 수 있기 때문입니다.
오늘은 스탠리 스미스 스티븐스(Stanley Smith Stevens)가 1946년 제시한 측정척도의 4가지 유형을 자세히 살펴보겠습니다.
측정척도란 무엇인가?
측정척도는 데이터를 어떤 방식으로 측정하고 분류하는지를 나타내는 체계입니다. 각 척도마다 수행할 수 있는 수학적 연산과 통계 분석 방법이 다르기 때문에, 데이터의 성격을 정확히 파악하는 것이 중요합니다.
1. 명목척도 (Nominal Scale)
개념
명목척도는 가장 기본적인 측정 수준으로, 분류나 범주화를 위해서만 사용됩니다. 숫자가 부여되더라도 그 숫자 자체에는 의미가 없고, 단순히 구별을 위한 라벨 역할만 합니다.
특징
- 동등성만 판단 가능 (같다/다르다)
- 순서나 크기 비교 불가능
- 사칙연산 불가능
- 최빈값(Mode)만 의미 있음
예시
- 성별: 남성(1), 여성(2)
- 혈액형: A형, B형, AB형, O형
- 거주지역: 서울, 부산, 대구, 인천
- 브랜드 선호도: 삼성, LG, 애플
- 학과: 경영학과, 컴퓨터공학과, 심리학과
실제 예제
설문조사에서 "선호하는 커피 브랜드는?"
1) 스타벅스 2) 이디야 3) 투썸플레이스 4) 기타
→ 여기서 1, 2, 3, 4는 단순한 구분 코드일 뿐
1+2=3이라고 해서 "스타벅스+이디야=투썸플레이스"가 되지 않음
2. 서열척도 (Ordinal Scale)
개념
서열척도는 명목척도의 분류 기능에 순서의 개념이 추가된 척도입니다. 항목들 간의 순위는 매길 수 있지만, 그 간격이 동일하다고 보장할 수 없습니다.
특징
- 분류 + 순서 판단 가능
- 크기 비교 가능하지만 간격은 불명확
- 사칙연산 부적절
- 중위값(Median), 최빈값 사용 가능
예시
- 학력: 초졸 < 중졸 < 고졸 < 대졸 < 대학원졸
- 군계급: 이등병 < 일등병 < 상등병 < 병장
- 만족도: 매우 불만족 < 불만족 < 보통 < 만족 < 매우 만족
- 성적등급: F < D < C < B < A
- 경제 수준: 하 < 중하 < 중 < 중상 < 상
실제 예제
고객 만족도 조사 결과:
1점(매우 불만) - 5명
2점(불만) - 10명
3점(보통) - 20명
4점(만족) - 35명
5점(매우 만족) - 30명
→ 4점이 3점보다 만족도가 높다는 것은 알 수 있지만,
4점과 3점의 차이 = 3점과 2점의 차이라고 단정할 수 없음
3. 등간척도 (Interval Scale)
개념
등간척도는 서열척도에 동일한 간격의 개념이 추가된 척도입니다. 항목들 간의 차이를 정확히 측정할 수 있지만, 절대적인 영점(0)이 없어 비율 비교는 불가능합니다.
특징
- 분류 + 순서 + 동일한 간격
- 덧셈, 뺄셈 가능
- 곱셈, 나눗셈 부적절 (의미 있는 0점이 없음)
- 평균, 표준편차 계산 가능
예시
- 온도: 섭씨 온도, 화씨 온도
- IQ 점수: 100, 110, 120
- SAT 점수: 800점, 1200점, 1600점
- 년도: 2020년, 2021년, 2022년
- Likert 척도: 7점 척도 설문
실제 예제
온도 측정:
어제: 10℃, 오늘: 20℃, 내일: 30℃
→ 오늘은 어제보다 10℃ 높다 (간격 계산 가능)
→ 하지만 "오늘이 어제보다 2배 뜨겁다"고 할 수 없음
(0℃가 절대적 무온도가 아니기 때문)
4. 비율척도 (Ratio Scale)
개념
비율척도는 등간척도에 **절대적인 영점(0)**이 추가된 가장 완전한 형태의 척도입니다. 모든 수학적 연산이 가능하며, 비율 비교도 의미가 있습니다.
특징
- 분류 + 순서 + 동일한 간격 + 절대적 영점
- 모든 사칙연산 가능
- 비율 비교 가능
- 모든 통계량 계산 가능
예시
- 키, 몸무게: 170cm, 70kg
- 나이: 25세, 30세
- 소득: 300만원, 500만원
- 거리: 100km, 200km
- 시간: 30분, 60분
실제 예제
두 사람의 몸무게:
A: 50kg, B: 100kg
→ B는 A보다 50kg 무겁다 (간격)
→ B는 A보다 2배 무겁다 (비율)
→ 0kg는 절대적인 무게 없음을 의미
연봉 비교:
신입사원: 3000만원, 부장: 6000만원
→ 부장은 신입사원보다 정확히 2배 높은 연봉
척도별 비교표
척도 | 분류 | 순서 | 동일간격 | 절대영점 | 가능한 연산 | 대표값 |
명목척도 | ✓ | ✗ | ✗ | ✗ | =, ≠ | 최빈값 |
서열척도 | ✓ | ✓ | ✗ | ✗ | =, ≠, >, < | 최빈값, 중위값 |
등간척도 | ✓ | ✓ | ✓ | ✗ | +, -, =, ≠, >, < | 최빈값, 중위값, 평균 |
비율척도 | ✓ | ✓ | ✓ | ✓ | +, -, ×, ÷, =, ≠, >, < | 모든 통계량 |
실무에서의 활용법
1. 올바른 통계 분석 선택
- 명목척도: 카이제곱 검정, 빈도분석
- 서열척도: 순위상관분석, 비모수 검정
- 등간척도: t검정, 분산분석 (조건부)
- 비율척도: 모든 모수 통계 분석
2. 시각화 방법
- 명목/서열척도: 막대그래프, 원그래프
- 등간/비율척도: 히스토그램, 상자그림, 산점도
3. 주의사항
- 서열척도를 등간척도로 잘못 해석하는 경우가 많음
- 리커트 척도의 경우 연구자에 따라 서열 또는 등간척도로 해석
- 척도의 성격을 정확히 파악한 후 분석 방법 결정
일상 비유법으로 기억하기
"이름 → 순위 → 온도 → 키"
- 명목척도: 이름 (김철수, 이영희 - 그냥 구분만)
- 서열척도: 순위 (1등, 2등, 3등 - 순서는 알지만 간격 모름)
- 등간척도: 온도 (10℃, 20℃ - 간격은 같지만 2배 뜨겁다고 할 수 없음)
- 비율척도: 키 (160cm, 180cm - 모든 계산 가능, 진짜 0cm 존재)
측정척도의 4가지 유형을 제대로 이해하면 데이터의 성격을 정확히 파악하고, 적절한 통계 분석 방법을 선택할 수 있습니다. 특히 데이터 분석 초보자라면 이 개념을 확실히 익혀두는 것이 향후 분석 작업에 큰 도움이 될 것입니다.
데이터 분석의 첫 걸음은 데이터를 올바르게 이해하는 것부터 시작됩니다. 오늘 배운 측정척도 개념을 실제 프로젝트에 적용해보시기 바랍니다!