-
공식 z=x−mmsdz = \frac{x - m}{\text{msd}}는 Z-점수(Z-score)를 계산하는 데 사용됩니다. 이는 특정 값이 데이터의 평균에서 얼마나 떨어져 있는지를 표준편차를 기준으로 나타낸 값입니다.
변수 설명
- xx: 개별 데이터 값 (예: 특정 관찰값).
- mm: 평균(mean) 값. 데이터의 중심값입니다.
- msd\text{msd}: 표준편차(standard deviation, σ\sigma). 데이터 값들이 평균에서 얼마나 흩어져 있는지 측정합니다.
Z-점수 공식
z=x−mmsdz = \frac{x - m}{\text{msd}}
- 의미: 특정 데이터 xx가 평균 mm에서 몇 표준편차만큼 떨어져 있는지 나타냅니다.
- Z-점수의 해석:
- z>0z > 0: xx가 평균보다 큼.
- z<0z < 0: xx가 평균보다 작음.
- ∣z∣>2|z| > 2: 값이 평균에서 2 표준편차 이상 벗어나면 이상치로 간주할 수 있음.
예제 계산
데이터
- x=75x = 75: 특정 학생의 시험 점수.
- m=70m = 70: 시험 점수의 평균.
- msd=5\text{msd} = 5: 시험 점수의 표준편차.
계산
z=75−705=55=1z = \frac{75 - 70}{5} = \frac{5}{5} = 1
해석
- Z-점수 1은 해당 학생이 평균보다 1 표준편차만큼 높은 점수를 얻었다는 의미입니다.
'pandas' 카테고리의 다른 글
python의 데이터 분석 도구들 (1) 2024.12.03 표준편차 (2) 2024.11.29 데이터의 전체 카테고리 (3) 2024.11.29 plotly의 기본 method들 (1) 2024.11.28 plotly의 이해 (1) 2024.11.28