이 기 성
연구실 : 상허연구관 210호
전화번호 : 450-4294 / 010-6272-5984 E-mail : ekis21@konkuk.ac.kr
경제정보처리
Economic Information Processing
경제정보처리
Economic Information Processing
제1장
자료의 정리와 요약 제1장
자료의 정리와 요약
제1장 자료의 정리 및 요약
도수분포표 (frequency distribution table)
§ 도수분포표(frequency distribution table) :
많은 수의 관측값들을 몇 개의 묶음으로 나누어 각 묶음에 속한 관측값의 수를 요약∙정리한 표
§ 누적도수분포표(cumulative frequency distribution table) : 각 묶음에 속한 관측값을 순차적으로 누적하여 기입한 표
§ 상대도수분포표(relative frequency distribution table) : 각 묶음에 속한 관측값을 백분율로 계산하여 기입한 표
§ 상대누적도수분포표(relative cumulative frequency distribution table) :
각 묶음에 속한 관측값을 순차적으로 누적하고 백분율로 계산 하여 기입한 표
계급(자녀수) 도수 상대도수 0
1 2 3 4 5 6
3 4 4 2 1 0 1
3/15=0.20 4/15=0.27 4/15=0.27 2/15=0.13 1/15=0.07 0/15=0.00 1/15=0.07
합계 15 1.00
제1장 자료의 정리 및 요약
도수분포표와 상대도수분포표
§ 예제 : 어느 지역 15세대에 대한 각 세대당 자녀수 자료 0, 1, 3, 1, 2, 0, 4, 6, 3, 2, 2, 1, 0, 1, 2
§ 도수분포표를 작성하기 위해서 자료를 몇 개의 그룹으로 나눔.
§ 자녀수를 계급(class)으로, 각 계급의 빈도수(frequency)를 정리 자녀수에 대한 도수분포표 및 상대도수분포표
제1장 자료의 정리 및 요약
도수분포표의 작성방법
§ 도수분포표의 계급(class)은 자료의 성질에 따라 좌우됨.
• 질적 자료 : 범주로 표시=범주형자료(예 : 성별, 학점 등)
• 양적 자료 : 구간으로 표시(예 : 앞의 도수분포표 참조)
도수분포표의 작성순서
§ 자료의 범위(range) 결정 : 최대값(max)-최소값(min)
§ 계급(또는 계급구간)의 수(K) : 최소 5개~최대 20개 정도 Sturges’ formula : K=1+3.3log10n
§ 계급의 크기(=계급의 폭) : 범위(range)/계급의 수(K)
§ 중복되지 않도록 계급의 폭 조정
§ 각 계급의 빈도수 작성
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 계급구간별 도수분포는 함수마법사를 이용하여 계산이 가능함.
함수마법사
→ 함수마법사 클릭 범주 선택: 통계 함수 선택
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 범위를 설정하기 위하여 최대값(MAX)과 최소값(MIN)을 구함.
§ 함수마법사에서 최대값은 MAX, 최소값은 MIN이라는 함수명을 사용함.
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
최대값-최소값
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
스터지스 공식K=1+3.3log10(40) K=1+5.286798»6.29
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 이제 계급의 수와 계급의 폭이 정해지면 Excel에 계급구간을 설 정함.
§ 여기서 유의할 점은 아래의 Excel에서 처럼 계급구간에는 (계급) 상한값만 설정함.
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 계급구간이 정해지면 도수영역의 셀(cell)을 모두 지정함.
§ 이제 함수마법사의 함수선택에서 ‘FREQUENCY’를 선택하고 확인 버튼을 누름.
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 함수인수에서 Data_array는 전체 자료의 영역을 지정하고, Bins_array는 계급구간의 영역을 지정함.
§ 여기서 확인을 클릭하면 절대 안됨.
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 마우스를 수식입력줄의 맨 끝부분으로 이동시켜 커서를 깜박이 게 함.
§ Ctrl+Shift+Enter 키를 누름(확인을 클릭하면 절대 안됨).
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 그 결과 아래의 도수분포표와 같이 각 계급구간에 대한 도수들이 구해짐.
§ 도수의 합계 셀을 지정한 후 Excel 창에서 홈 → 자동합계를 클 릭하고 Enter 키를 누르면 도수의 합계가 구해짐.
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 이제 상대도수를 구해보기로 함. 우선 상대도수의 첫 번째 셀 을 마우스를 클릭함.
§ Excel 수식입력줄에서 계산할 때는 등식(=)을 먼저 입력해야 함.
§ 상대도수는 전체 도수에 대한 각 계급구간의 도수, 즉 전체 도 수에서 각 계급구간들이 차지하는 비중을 나타내므로 첫 번째 셀은 2/40으로 구할 수 있음.
§ 그러나 상대도수는 각 셀에서 하나하나씩 구할 수도 있지만 Excel에서는 편리한 기능이 있음.
§ 첫 번째 셀에서 상대도수를 구할 때 분모(전체 도수)를 고정하 고 계산하면 나머지 상대도수를 한꺼번에 계산할 수 있음.
§ 분모를 고정시키기 위해서 행과 열(셀 주소)을 고정해야 함.
§ 셀 주소를 고정시키기 위해 행과 열 앞에 $표시를 넣어주면 됨.
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 첫 번째 계급구간에 대한 상대도수가 구해지면 다시 첫 번째 셀 을 지정하고 오른쪽으로 마우스를 이동하면 가는 십자가 형태 가 나타남.
§ 마우스를 합계 셀까지 드래그(drag)하면 자동으로 상대도수가 구해짐.
제1장 자료의 정리 및 요약
계급구간을 사용한 도수분포표
§ 도수분포표가 정리되면 다시 도형화한 도수분포와 상대도수분포 에 대한 히스토그램(histogram)으로 나타낼 수 있음.
§ 히스토그램은 자료의 특징이나 분포구조를 시각적으로 파악할 수 있음.