평균, 분산 그리고 표준편차

2021. 2. 23. 22:10기본수학/통계

산포도(dispersion)란

통계에서 자료가 얼마나 그리고 어떻게 분포되어 있는지를 나타내는 수치라고 할 수 있습니다.

대표적인 산포도 값으로는 '분산', '표준편차' 등이 있습니다.

 

--------------------

 

편차(deviation)

평균과 변량(자료)값 간의 차이를 편차라합니다.

변량(자료)에서 평균값 또는 중앙값을 빼서 차이값을 구합니다.

 

 

분산(variance)

평균으로 부터 퍼져있는 정도를 나타내는 양을 말합니다.

분산값이 크면 확률밀도함수의 모양은 평균으로부터 넓게 퍼지고,

분산값이 작으면 평균에 가깝게 몰리게 됩니다.

분산은 변량(자료)에서 평균을 뺀 값을 제곱하고, 그것을 모두 더한 후 전체 수로 나눠서 구합니다.

즉, 편차의 제곱값을 전체 수로 나눈 값과 같습니다.

 

 

표준편차(standard deviation)

표준편차는 분산값에 제곱근한 것입니다.

분산을 구할때 제곱해서 값이 뻥튀기 된 분산값을 제곱근해서 다시 월래 크기로 만들어 줍니다.

표준편차는 어떤 수의 크고 작음을 직관적으로 이야기 해 줄 수 있는 지표가 됩니다.

또한 표준편차가 크면, 수치들의 차이값이 크다고 해석할 수 있으며,

표준편차가 작으면 수치들의 차이값이 작다고 이해할 수 있습니다.

 

 

 

예제)

한 학급 학생들의 수학성적을 통하여 평균, 분산 그리고 표준편차를 구하세요

 

구분 계산식 A B C D E
변량 - $88$ $68$ $73$ $96$ $55$
평균 $\frac{변량의합}{인원수}$ $=$$\frac{88+68+73+96+82}{5}$$=$$76$
편차 $변량-평균$ $88-76$
$=12$
$68-76$
$=-8$
$73-76$
$=-3$
$96-76$
$=20$
$55-76$
$=-21$
분산 $\frac{(편차)^2의 합}{인원수}$ $=$$\frac{12^2+(-8)^2+(-3)^2+20^2+(-21)^2}{5}$$=$$\frac{144+64+9+400+441}{5}$$=$$\frac{1058}{5}$$=$$211.6$
표준편차 $\sqrt{분산}$ $=\sqrt{211.6}\approx$$14.5$
결과 - *인원수: 5,  *평균: 76점,  *분산: 211.6,  *표준편차: 14.5