pandas

z-score

gggg21 2024. 11. 29. 17:19

공식 z=x−mmsdz = \frac{x - m}{\text{msd}}Z-점수(Z-score)를 계산하는 데 사용됩니다. 이는 특정 값이 데이터의 평균에서 얼마나 떨어져 있는지를 표준편차를 기준으로 나타낸 값입니다.


변수 설명

  1. xx: 개별 데이터 값 (예: 특정 관찰값).
  2. mm: 평균(mean) 값. 데이터의 중심값입니다.
  3. msd\text{msd}: 표준편차(standard deviation, σ\sigma). 데이터 값들이 평균에서 얼마나 흩어져 있는지 측정합니다.

Z-점수 공식

z=x−mmsdz = \frac{x - m}{\text{msd}}

  • 의미: 특정 데이터 xx가 평균 mm에서 몇 표준편차만큼 떨어져 있는지 나타냅니다.
  • Z-점수의 해석:
    • z>0z > 0: xx가 평균보다 큼.
    • z<0z < 0: xx가 평균보다 작음.
    • ∣z∣>2|z| > 2: 값이 평균에서 2 표준편차 이상 벗어나면 이상치로 간주할 수 있음.

예제 계산

데이터

  • x=75x = 75: 특정 학생의 시험 점수.
  • m=70m = 70: 시험 점수의 평균.
  • msd=5\text{msd} = 5: 시험 점수의 표준편차.

계산

z=75−705=55=1z = \frac{75 - 70}{5} = \frac{5}{5} = 1

해석

  • Z-점수 1은 해당 학생이 평균보다 1 표준편차만큼 높은 점수를 얻었다는 의미입니다.