반응형
안녕하세요! 오늘은 표준정규분포가 어떻게 해서 생겼는지 그 원리를 살펴보려고 해요. 그냥 무턱대로 그럴듯하게 만들어진 분포가 아니라는 것이지요.
정규분포에서 표준편차에 따른 퍼센트는 정규분포의 수학적 정의와 확률밀도 함수에 의해 자연스럽게 결정된 것이라고 합니다.
정규분포는 매우 중요한 확률 분포 중 하나로, 많은 자연 현상과 데이터가 이 분포를 따르는 경우가 많은데요, 정규분포는 다음의 수학적 방정식으로 표현됩니다:

여기서:
- μ(mu)는 평균을 나타내고, 데이터의 중심값입니다. 우리말로는 '뮤'라고 읽습니다.
- σ(sigma)는 표준편차로, 데이터가 평균으로부터 얼마나 흩어져 있는지를 나타냅니다. 우리말로는 '시그마'라고 읽습니다.
- e(e)는 자연로그의 밑, 약 2.718을 의미합니다. 우리말로는 그냥 '이'라고 읽습니다.
- π(pi)는 원주율, 약 3.1415를 의미합니다. 우리말로는 '파이'라고 읽습니다.
이 방정식은 정규분포 곡선의 모양을 정의하며, 평균을 중심으로 대칭적인 종 모양을 갖습니다. 표준편차는 곡선의 너비를 결정하는 요소로, 표준편차가 클수록 곡선은 넓고 낮게 펼쳐지며, 작을수록 좁고 높게 나타납니다.
퍼센트는 이 정규분포 함수의 적분에 의해 계산됩니다. 예를 들어, 평균 ± 1 표준편차 구간 안에 데이터가 얼마나 분포하는지를 계산하려면, 확률밀도 함수를 평균에서 1 표준편차 범위 내에서 적분하면 그 결과가 0.68, 즉 68%가 나옵니다. 마찬가지로, 평균 ± 2 표준편차에서는 95%, 평균 ± 3 표준편차에서는 99.7%의 데이터가 존재함을 알 수 있습니다.
이러한 결과는 정규분포 곡선의 성질에 의해 자연스럽게 나오는 것이며, 수학적으로 결정된 값들입니다.

반응형