• 검색 결과가 없습니다.

제 5장 분산도

N/A
N/A
Protected

Academic year: 2022

Share "제 5장 분산도"

Copied!
14
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

제 5장 분산도

[ 제 2부 기술 통계학 ]

(2)

목 차

1. 범위 2. 변량

3. 표준편차

4. 사분위편차

(3)

실험

1. 분산도의 개념과 종류

 한 대표치를 중심으로 사례가 어느 정도 밀집 또는 분산되어 있는지를 나타내는 지수

(자료의 흩어진 정도)

 분산도를 파악하기 위해서는 범위, 변량(분산), 표준편차, 사분위편차 등을 알아야 한다.

[그림1] 세 학급의 중간고사 점수분포 (p. 72)

분산도

(4)

실험

1. 범위의 정의

 자료의 최고치에서 최저치까지의 거리

 장점 : 계산하기 쉬움

 단점 : 최고치와 최저치만을 고려, 극단치의 영향을 많이 받기 때문에 분산도로서 이용가치가 떨어짐

사례 수가 다른 두 분포의 분산도를 비교할 때 범위의 계산 및 해석 시 주의를 기울여야 함

범위

(range)

R = (H - L) + 1

* H : 최고치

* L : 최저치 정확한계를 고려하기 위하여

(5)

실험

범위

(range)

학급 A 학생 점수

갑돌 90 을만 88 병철 82 영철 40 철수 40 민수 40 영기 40 홍식 20

학급 B 학생 점수

갑순 90 을희 80 병자 70 나희 60 철희 50 민자 40 영희 30 춘자 20

평균: 55, 범위: 71 평균: 55, 범위: 71

(6)

1. 편차(deviation) 실험

 각 점수가 평균으로부터 떨어진 정도

 편차의 절대치가 크면 평균에서 멀리 떨어져있음을 의미

 편차의 합은 0이다.

변량

(분산 variance)

90

80

70

60

50

40

30

20 0

20 40 60 80 100

(7)

실험

변량

(분산 variance)

학생 점수(Χ) 편차(

χ)

편차자승(

χ2

)

갑순 을희 병자 나희 철희 민자 영희 춘자

90 80 70 60 50 40 30 20

35 25 15 5 -5 -15 -25 -35

1125 625 225 25 25 225 625 1125

Σ

χ2

= 4000

Ѕ2 = 500

(8)

2. 변량 실험

 평균을 중심으로 자료의 값이 얼마나 흩어져 있는가를 나타내는 값 (편차 제곱의 평균)

 편차를 모두 제곱한 후 그 수를 모두 더하여 총 사례수로 나눈 값

 수치가 커지고 원자료의 단위와 달라지는 문제가 있음

변량

(분산 variance)

(9)

1. 표준편차 실험

 자료의 값이 평균을 중심으로 얼마나 밀집되어 있는가를 나태는 값 (분산의 제곱근)

 표준편차가 작으면 자료의 값이 평균을 중심으로 밀집

 표준편차가 크면 자료의 값이 평균을 중심으로 퍼져있음

표준편차

(standard deviation)

(10)

1. 사분위수(quartiles) 실험

 수집된 자료를 크기 순으로 배열하여 4등분한 값 (Q1, Q2, Q3)

2. 사분위간 범위(IQR: interquartile range)

 제 3사분위와 제 1사분위의 차이 (Q3 – Q1)

 사분위간 범위가 길면 좀 더 흩어진 분포, 짧으면 밀집된 분포

사분위 편차

(quartile deviation)

25% 25% 25% 25%

Q1 Q2

(중앙치)

Q3

(11)

실험

3. 사분위 편차

 중앙치(Q2) 를 중심으로 한 분산도

 퍼센타일 : 100의 단위를 갖는 척도에서 위치 혹은 위치값

 범위 내에 있는 많은 값들을 고려하여 분산도를 측정하기 때문에 범위보다 정밀

 빈도분포의 편포 정도를 검토하는데 유용한 기준

 사분위 편차와 사분위수에 따라 부적편포, 정적편포인지 파악

사분위 편차

(quartile deviation)

(12)

53 58 68 73 75 76 79 80 85 88 91 99

실험

사분위 간 범위(IQR) = Q3 – Q1 = 86.5 - 70.5 = 16 사분편차 (Q) = (Q3 – Q1)/2 = 8

P25 + Q(70.5+8=78.5) > Q2(중앙치) = 정적편포

사분위 편차

(quartile deviation)

Q1 = (68+73) / 2 = 70.5

Q2 = (76+79) / 2 = 77.5

Q3 = (85+88) / 2 = 86.5

(13)

53 60 70 75 80 82 84 84 87 88 91 99

실험

사분위 간 범위(IQR) = Q3 – Q1 = 87.5 - 72.5 = 15 사분편차 (Q) = (Q3 – Q1)/2 = 7.5

P25 + Q(72.5+8=78.5) < Q2(중앙치) = 부적편포

사분위 편차

(quartile deviation)

Q1 = (70+75) / 2 = 72.5

Q2 = (82+84) / 2 = 83

Q3 = (87+88) / 2 = 87.5

(14)

실험

감사합니다.

참조

관련 문서

산포도는 변량들이 평균 주위에 흩어져 있는 정도를 하나의 수로 나타내는 값이므로 표준편차가 클수록 산포도는 커지고 자료가 평균을 중심으로 멀리 흩어져 있음을

중앙값은 자료의 개수가 홀수인 경우 한가운데 값을 사용하지 만 자료의 개수가 짝수인 경우 한가운데 놓이는 두 값의

자료의 개수와 표준편차의 크기는 서로

이때 자료들이 흩어진 정도가 클수록 표준편차가 크다.. ① 자료의 흩어진

중앙값은 자료의 값의 개수가 짝수이면 자료를 작은 값 부터 크기순으로 나열할 때, 중앙에 있는 두 자료의 값 의 평균이므로 자료에

[출제의도] 확률밀도함수의 성질을 이용하여 연속확률변수의 평균을.. 또한,

표준편차는 자료가 평균으로부터 얼마나 흩어져 있는가를 나타내 는 산포도 중 하나이며 그 값이 클수록 평균으로부터 멀리 떨어져 있고, 성적이 고르지

목표값은 연산식 방향에 맞는 값이 설정 되어야 하며 정 방향인 경우 현재 측정값보 다 큰 값이, 반대로 역 방향인 경우 측정값 보다 작은 값이 설정되어야 합니다.