• 검색 결과가 없습니다.

제 3장 빈도분포와 그래프

N/A
N/A
Protected

Academic year: 2022

Share "제 3장 빈도분포와 그래프"

Copied!
28
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

제 3장 빈도분포와 그래프

[ 제 2부 기술 통계학]

(2)

목 차

1. 빈도분포

2. 정확한계, 중간점

3. 막대그래프, 히스토그램, 절선그래프 4. 그래프 사용 시 유의할 점

5. 누적빈도분포

6. 백분율, 상대백분율, 누적백분율 7. 백분위, 백분위 점수

8. 백분위 점수의 값을 구하는 근사계산법

(3)

실험

1. 빈도분포 정의

 수집한 자료를 분류하거나 요약하기 위해서 특성이나 크기가 유사한 자료를 순서대로 정리하여 표로 나타낸 것.

예시

 방과후학교 교육활동이 학생의 학력신장에 얼마나 영향을 준다고 생각합니까?

① 아주 긍정적인 영향을 준다.

② 약간 긍정적인 영향을 준다.

③ 영향을 주지 않는다.

④ 약간 부정적인 영향을 준다.

⑤ 아주 부정적인 영향을 준다.

빈도분포

(4)

빈도분포

범주 반응수

아주 긍정적인 영향 25

약간 긍정적인 영향 35

영향을 주지 않음 20

약간 부정적인 영향 15

아주 부정적인 영향 5

 비교적 쉽게 요약할 수 있고, 보기가 쉽다.

 하지만, 실제의 경우는 이보다 복잡한 경우가 훨씬 더 많다.

(5)

빈도분포

100명 학생의 창의성 검사 점수

166 167 65 196 148 87 130 118 128 92 182 135 140 146 153 156 69 100 90 195

75 154 148 156 144 176 127 190 134 88 143 161 60 145 146 166 112 81 132 143

92 166 162 173 73 165 182 102 175 129 170 77 155 146 151 156 185 86 114 102 134 144 159 138 163 143 90 124 132 130 160 138 74 61 161 63 124 119 123 114 61 145 186 149 146 150 110 85 119 180 146 67 148 177 154 74 170 122 72 75

가장 빈번하게 나타나는 점수는 몇 점인가?

점수가 어느 정도 퍼져 있는가?

가장 높은 점수는 몇 점인가?

점수가 어느 점수대에 많이 분포되어 있는가?

(6)

빈도분포

창의성 검사 점수(묶지 않은 점수)의 단순빈도분포표

X

f

(7)

실험

1. 빈도분포의 급간을 설정하는 일반적인 원칙

 점수의 범위를 구한다. 범위=최대치-최소치+1

 전체 급간의 수는 10개 전후가 적당하다.

 급간의 폭은 3, 5, 10, 20 등과 같이 편리한 수로 시작하는 것이 좋다.

 모든 급간은 동일한 간격을 가져야 한다.

 급간의 시작점은 0, 5 등의 익숙한 숫자로 시작하는 것이 좋다.

 모든 급간은 중복되어서는 안 되며, 어떤 특정 값은 반드시 한 급간에만 속해야 한다

.

빈도분포

(8)

빈도분포

X f X f

195~199 2 125~129 3 190~194 1 120~124 4 185~189 2 115~119 3 180~184 3 110~114 4 175~179 3 105~109 0 170~174 3 100~104 3 165~169 5 95~99 0 160~164 5 90~94 4 155~159 5 85~89 4 150~154 5 80~84 1 145~149 10 75~79 3 140~144 7 70~74 4 135~139 3 65~69 2 130~134 6 60~64 5

X f

190~199 3 180~189 5 170~179 6 160~169 10 150~159 10 140~149 17 130~139 9 120~129 7 110~119 7 100~109 3 90~99 4 80~89 5 70~79 7 60~69 7

X f

180~199 8 160~179 16 140~159 27 120~139 16 100~119 10

80~99 9

60~79 14

X f

150~199 34 100~149 43 50~99 23

(a) 급간크기 5인 빈도분포표 (b) 급간 크기 10인 빈도분포표 (c)급간 크기 20인 빈도분포표

(d)급간 크기 50인 빈도분포표

(9)

2. 정확한계의 정의 실험

연속변수의 개별치를 측정할 때 단위의 ½단위만큼 반올림한 값으로 표현한 것.

즉, 연속변수의 급간을 나누는 경계치

Ex) 110은 109.5에서 110.5사이에 존재한다

3. 중간점

 (정확상한계 + 정확하한계) ÷ 2 EX) (64.5+59.5) ÷ 2 = 62

정확한계, 중간점

X f

60 ~ 64

정확상한계:

64.5

정확하한계:

59.5

(10)

1. 그래프 실험

 수집한 자료를 시각적으로 좀 더 이해시키기 위하여 일목요연하게 표시된 그림.

2. 그래프의 기능

 수집된 자료를 구성하는 수들이 어떤 값을 중심으로 모이는 경향과 흩어진 정도를 쉽게 분석할 수 있다.

 자료 속에 존재하는 집단 간의 차이 여부를 비교해 볼 수 있다.

 어떤 변인 간에 연관성이 존재하는지를 쉽게 파악할 수 있다.

막대그래프, 히스토그램, 절선그래프

(11)

 예:100명의 직장인을 대상으로 한 결혼 여부 조사(유형)

유형 기혼 미혼 이혼 사별 합계

빈도 48 34 8 10 100

막대그래프, 히스토그램, 절선그래프

X축=유목 (범주) Y축=빈도

(백분위)

(12)

막대그래프, 히스토그램, 절선그래프

히스토그램

선 그래프보다 압축하여 개괄적으로 수집된 자료의 속성을 나타낼 수 있 다.

선 그래프가 드러내는 번잡성을 체계화한 그래프 2. 히스토그램

 선 그래프보다 압축하여 개괄적으로 수집된 자료의 속성을 나타낼 수 있다.

 선 그래프가 드러내는 번잡성을 체계화한 그래프

 질적변인의 경우 막대그래프 사용

 연속변인일 경우 히스토그램 사용

 히스토그램을 그리는 절차

 범의(최대치-최소치+1)를 정한다. (예:196-60+1=137)

 범위를 급간의 수로 나누어 적당한 급간의 폭을 결정한다. 이때 급간의 수는 10개 내외가 적절하다.

 빈도분포를 만든다. 이때 최소치를 맨 아래에 위치하도록 하며, 각 급간에 해당되는 빈도를 헤아린다.

 정확한계를 설정한다.

 X축에는 변인의 정확한계를 경계로 하여 나누고, Y축에는 빈도를 표시한다.

 X축과 Y축의 단위와 이름을, 그리고 히스토그램의 제목을 붙인다.

(13)

막대그래프, 히스토그램, 절선그래프

200명의 학생을 대상으로 한 창의성 검사 점수분포

(14)

막대그래프, 히스토그램, 절선그래프

0 2 4 6 8 10 12 14 16 18

200명의 학생을 대상으로 한 창의성 검사 점수분포

히스토그램

(명)

창의성검사점수

(15)

막대그래프, 히스토그램, 절선그래프

3. 절선그래프

 히스토그램의 중간점에 해당되는 점을 연결하는 절차를 하나 더 추가한다

 최저급간과 최고급간의 중간점과 X축에 연결하여 닫힌 다각형 모양을 갖게 해야 한다.

0 2 4 6 8 10 12 14 16 18

64.5 74.5 84.5 94.5 104.5 114.5 124.5 134.5 144.5 154.5 164.5 174.5 184.5 194.5

창의성검사점수

(16)

막대그래프, 히스토그램, 절선그래프

4. 완만한 곡선

사례수가 많은 모집단이나 표본을 나타내려고 할 때.

 절선도표에 나타난 비정규적인 것이 모집단에서는 나타나지 않을 것이므로 비정규적인 것을 제거 할 수 있다.

하지만 가끔 모집단의 비정규적인 특성이 완만한 곡선화 절차에 의해 제거될 위험이 있다.

0 5 10 15 20

50 70 90 110 130 150 170 190

창의성검사점수

(17)

그래프 사용 시 유의 할 점

 그래프는 요약된 자료를 시각적으로 조금 더 이해하기 위한 기능을 가지고 있다.

 그래프는 똑같은 자료의 속성을 어떻게 그리느냐에 따라 다르게 해석될 가능성이 있다.

 그래프의 Y축 길이를 X축 길이의 2/3~3/4 전후로 잡는 것이 무난하다는 것이다.

 자료의 특성이나 사용목적에 따라 적합한 그래프의 유형을 선택하여 사용해야 한다.

0 5 10 15 20

2003 2004 2005 2006 등록금 인상률(%)

0 10 20 30 40 50

2003 2004 2005 2006 등록금인상률(%)

(18)

1. 누적빈도분포

 어떤 특정한 점수까지 누적된 빈도나 백분율을 알고자 할 때 예) 적성검사에서 60점 미만은 몇 %가 있는지 알고자 할 때

 누적빈도그래프(cumulative frequency polygon), 오자이브 곡선(ogive curve)

누적빈도분포

0

5

10

15

20

25

(19)

실험

1. 백분율

 전체 사례수에 대해 그 급간 내의 빈도를 %로 나타낸 것

 사례 수가 다른 두 집단의 분포를 비교할 때 유용하다

2. 상대백분율

 한 급간 내의 빈도를 전체 사례에 대해 %로 나타낸 것

3. 누적백분율

 해당 급간을 포함시킨 그 아래의 급간에 대한 누적빈도를 %로 나타낸 것

백분율, 상대백분율, 누적백분율

(20)

상대비율과 상대백분율의 예

백분율, 상대백분율, 누적백분율

점수 빈도 상대비율 상대백분율 누적백분율

47~49 5 0.10 10 100

44~46 7 0.14 14 90

41~43 10 0.20 20 76

38~40 12 0.24 24 56

35~37 8 0.16 16 32

32~34 4 0.08 8 16

29~31 2 0.04 4 8

26~28 2 0.04 4 4

합계 50 1.00 100% -

(21)

누적백분율도표를 그리기 위한 기초통계학 200명의 학기말 시험점수 묶음 누적도수표

백분율, 상대백분율, 누적백분율

급간 급간 상한값 도수(

f

) 백분율(%) 누적백분율(%)

30.5~37.5 37.5 6 3 3

37.5~44.5 44.5 14 7 10

44.5~51.5 51.5 32 16 26

51.5~58.5 58.5 40 20 46

58.5~65.5 65.5 22 11 57

65.5~72.5 72.5 36 18 75

72.5~79.5 79.5 28 14 89

79.5~86.5 86.5 16 8 97

86.5~93.5 93.5 4 2 99

93.5~100.5 100.5 2 1 100

- 200 100(%)

(22)

누적백분율도표

 히스토그램과 절선도표를 그리는 절차와 동일하다.

 다만 각 급간의 상한계까지 누적된 도수와 백분율을 계산하고, 그에 따라 누적백분율도표를 그리는 부분이 다르다.

백분율, 상대백분율, 누적백분율

0 10 20 30 40 50 60 70 80 90 100

30.5 37.5 44.5 51.5 58.5 65.5 72.5 79.5 86.5 93.5 100.5

%

(23)

실험

1. 백분위

 100의 단위를 갖는 척도에서 위치 혹은 위치값

 상대비교평가를 추구할 때 흔히 쓰이는 변환점수

 예) 백분위 점수: 72점의 백분위60의 해석

: 학생이 소속된 집단에서 이 학생보다 낮은 점수를 얻은 학생은 60%가 있고, 나머지 40%는 높은 점수를 받았다는 상대적 평가를 낼 수 있다.

2. 중앙치(Median)

 점수분포를 위아래 50%로 나누는 점수에 해당되는 것으로 Mdn(Md)로 표시

백분위, 백분위 점수

(24)

백분위, 백분위 점수

명칭 십분위 또는 사분위점수 백분위점수

첫 번째 십분위 D1 10

두 번째 십분위 D2 20

세 번째 십분위 D3 30

네 번째 십분위 D4 40

다섯 번째 십분위 D5 =Q2 =Mdn 50

여섯 번째 십분위 D6 60

일곱 번째 십분위 D7 70

여덜 번째 십분위 D8 80

아홉 번째 십분위 D9 90

첫 번째 사분위 Q1 25

두 번째 사분위 Q2 =D5 =Mdn 50

세 번째 사분위 Q3 75

십분위, 사분위, 백분위 점수 표시

(25)

백분위 점수의 값을 구하는 근사계산법

점수 정확한계 빈도 백분율 누적백분율

47~49 46.5~49.5 5 10 100

44~46 43.5~46.5 7 14 90

41~43 40.5~43.5 10 20 76

38~40 37.5~40.5 12 24 56

35~37 34.5~37.5 8 16 32

32~34 31.5~34.5 4 8 16

29~31 28.5~31.5 2 4 8

26~28 25.5~28.5 2 4 4

합계 50 100% -

1. 백분위 50%에 해당하는 백분위 점수를 구하고자 할 때

2. 백분위 점수 45점에 해당하는 백분위 %를 구하고자 할 때

(26)

백분위 점수의 값을 구하는 근사계산법

40.5점 X

37.5점

56%

50%

32%

백분위 점수

백분위

(27)

46.5 점 45 점

43.5점

90%

X

76%

백분위 점수 백분위

백분위 점수의 값을 구하는 근사계산법

(28)

제 3장 빈도분포와 그래프

참조

관련 문서

 Employee-oriented versus results-oriented (focus on people) (focus on goals).  Parochial (employees identify with employer) versus professional (employees

우리나라 유아교육의 발전과정..

치아와 얼굴 및 경부를 포함한 구강내의 모든 조직 을 조사하고 평가하는 것을 말하며 구강 뿐 아니라 전신적인 환자의 건강 상태에 영향을 미칠 수

다만, 지문인식 신원확인 입찰이 곤란한 자는 국가종합전자조달시스템전자입찰특별유의서 제 10조 제1항 제6호 및 제 7호의 절차에 따라

다만, 지문인식 신원확인 입찰이 곤란한 자는 국가종합전자조달시스템전자입찰특별유의서 제 10조 제1항 제6호 및 제 7호의 절차에 따라

다만, 지문인식 신원확인 입찰이 곤란한 자는 국가종합전자조달시스템전자입찰특별유의서 제 10조 제1항 제6호 및 제 7호의 절차에 따라

다만, 지문인식 신원확인 입찰이 곤란한 자는 국가종합전자조달시스템전자입찰특별유의서 제 10조 제1항 제6호 및 제 7호의 절차에 따라

71) 강제채혈의 경우 주사를 잘못 놓은 경우 등 극히 이례적인 경우를 제외하고는 건강훼손의 위험이 통상적으로 발생하지 않는다는 점에서 강제채뇨(삽관을 함으로