Z-점수의 의미
Z-점수는 개별 데이터 값이 평균에서 얼마나 떨어져 있는지를 표준편차의 단위로 나타낸 값입니다. 이 값을 통해 특정 데이터가 정규분포에서 어느 위치에 있는지 알 수 있습니다.
- Z = 0: 해당 값이 평균과 같음을 의미합니다.
- Z > 0: 평균보다 큰 값을 의미합니다.
- Z < 0: 평균보다 작은 값을 의미합니다.
평균이자 중앙값은 하위 50%와 상위 50%의 경계점에 위치합니다. 즉, 중앙값은 하위 50%에도 속하고 상위 50%에도 속하는 값입니다.
따라서 중앙값은 데이터 분포를 정확히 반으로 나누는 기준점이므로, 하위 50%와 상위 50%의 경계에 해당합니다.
표준정규분포표로 비율 확인하기
표준정규분포표에서 백분위수(상위 퍼센트와 하위 퍼센트)를 확인하는 방법은 다음과 같은데요, 표준정규분포표는 해당 Z-점수 이하의 값의 비율을 나타내고 있습니다.
- 하위 퍼센트:
- Z-점수를 기준으로, 해당 Z-점수 이하의 값이 차지하는 비율을 확인할 수 있습니다.
- 예를 들어, Z-점수가 1.00이라면 표에서 해당 값(약 0.8413)을 찾아 하위 84.13%가 해당 Z-점수 이하에 속함을 알 수 있습니다.
- 상위 퍼센트:
- 상위 퍼센트는 1에서 하위 퍼센트를 빼면 구할 수 있습니다.
- 예를 들어, Z-점수 1.00에서 하위 84.13%를 알았으니, 상위 퍼센트는 1 - 0.8413 = 15.87%가 됩니다.
즉, Z-점수를 표에서 찾아서 확인한 값이 하위 퍼센트이고, 상위 퍼센트는 100에서 하위 퍼센트를 뺀 값입니다.
하위 퍼센트는 해당 Z-점수 이하의 값이 차지하는 비율이므로 그 값을 포함해 밑으로 몇 퍼센트가 있는지를 말하는 것이고,
상위 퍼센트는 그 값을 포함해 위로 몇 퍼센트가 있는지를 말하는 것입니다.
간단한 예를 들자면 영희가 수학 시험에서 10명 중 3등을 했다면 하위 70%임과 동시에 상위 30%가 되는 것과 같은 이치라고 보시면 됩니다.

Z-점수와 누적 확률
표준정규분포표는 매우 방대하기 때문에, 주로 사용하는 Z-점수 범위에 대해 일부만 간단히 표로 작성할 수 있습니다.
일반적으로 Z-점수는 위의 예시 표에서 볼 수 있듯이, 소수 둘째 자리까지 기록되며, 그에 해당하는 누적 확률값이 표시됩니다.
아래는 예시적인 Z-점수와 그에 대응하는 누적 확률값의 일부를 보여줍니다.
-3.0 | 0.00135 |
-2.5 | 0.00621 |
-2.0 | 0.02275 |
-1.5 | 0.06681 |
-1.0 | 0.15866 |
-0.5 | 0.30854 |
0.0 | 0.50000 |
0.5 | 0.69146 |
1.0 | 0.84134 |
1.5 | 0.93319 |
2.0 | 0.97725 |
2.5 | 0.99379 |
3.0 | 0.99865 |
이 표는 Z-점수에서 해당하는 누적 확률을 보여주는 간단한 표인데요, 서두에 언급했듯이 Z-점수가 음수일 때는 평균보다 낮은 값을, 양수일 때는 평균보다 높은 값을 의미하며, 0일 때는 평균에 해당합니다.
아래는 Z-점수 -3.9~3.9까지의 값의 비율을 소수점 다섯 자리까지 표시한 표준정규분포표입니다.
출처: https://math.arizona.edu/~rsims/ma464/standardnormaltable.pdf