2. 그래프에 의한 데이터의 처리
1. 데이터의 정리
2. 질적 데이터
3. 계량적 데이터
4. 누적도수분포표
1. 데이터의 정리
• 변수(variable): 관심대상의 성격,속성(attribute)
• 자료(data): 변수를 기록한 결과
• 정보(Information)
변수(variable) 의 종류
• 질적 변수 (qualitative variable)
ex) 성, 인종, 노조가입여부, 학력, 지역, …
• 양적 변수 (quantitative variable)
ex) 학점평점, 나이, 무게, 매출액, 가격, GNP, … - 이산적 변수 (discrete variable): 정수 값
- 연속적 변수 (continuous variable): 실수 값
변수의 수준
변수(variable) 가 갖는 정보의 수준
• 명목 변수(nominal variable): 특성 분류 ex) 성별, 종교, 운동선수 등 번호
• 서열 변수(ordinal variable): 순서 ex) 석차, 선호도
• 등간 변수(interval variable): 순서 사이의 간격 ex) 지능지수, 학년, 온도
• 비율 변수(ratio variable): 측정자료간의 비율계산 ex) 연령, 무게, 시간, 거리
2. 질적 데이터
• 막대그래프
10 30
1 2 3 4
원 그림표 (Pie Chart)
3. 계량적 데이터
도수분포표(Frequency Distribution Table) - 도수의 분포 정도를 나타낸 표
계급(class): 어떤 변수를 분류한 구간
⇒ 계급간격: 계급의 폭
계급한계: 계급의 양 끝점
계 급 값: 계급의 중앙값
계급도수
각 계급에 속하는 관찰단위의 개수 Ex) 경영학과 학생 10명의 학점
3.6 3.9 4.1 2.1 2.2
0.7 1.5 2.7 2.9 2.5
도수분포표
계 급 계급도수
0~1미만 1
1~2미만 1
2~3미만 5
3~4미만 2
4~ 1
계 10
도수분포표 작성시 유의 사항
1. 가능한 계급간격을 일정하게
2. 관찰치가 중복되지 않고 한 계급에만 속하도록
계 급 계급도수
0.5~1미만 1
1~1.5미만 0
1.5~2미만 1
2~2.5미만 2
2.5~3미만 3
3~3.5미만 0
3.5~4미만 2
4~4.5 1
도수분포표
도수분포표 작성방법
• 구간의 수
- 결정 관측자료의 수에 따라 결정되어야 하나 5 이상 15 미만이 적당한 수준이다.
• 구간의 크기 결정
- 구간의 크기는 구간과 구간의 차이가 의미 있는 정도가 되도록 결정. 구간의 수가 결정되면 구간의 크기는 다음 계산한다.
구간의 크기= (자료의 최대값- 자료의 최소값) /구간의 수
• 경계값 설정
- 계산한 구간의 크기를 정수값, 또는 편리한 값(5, 10, 100 등)이 되도록 조정한 후, 구간이 서로 중복되지 않도록 경계 값을
설정한다.
도수분포 그래프
히스토그램(Histogram)
- 각 계급값에 대하여 계급의 도수를 수직적인 막대로 나타냄
구간의 크기= (자료의 최대값- 자료의 최소값) /구간의 수 ex) 9.11-0.72 / 6
구간의 크기= (자료의 최대값보다 크게- 자료의 최소값보다 작게) /구간의 수
ex) 9.115-0.715 / 6 = 1.4
0.715+1.4=2.115, 2.115+1.4=3.515…
도수분포 그래프
0.715 2,115 3.515 4.915 6.315 7.715 9.115 8
4
4. 누적도수분포표
누적도수분포표(Cumulative Frequency Dist. Table) - 도수분포의 계급도수를 변수 값이 작은 것부터
차례로 더해서 만든 표
계 급 계급도수 계 급 누적도수 0~1미만 1 0~1미만 1
1~2미만 1 1~2미만 2 2~3미만 5 2~3미만 7 3~4미만 2 3~4미만 9 4~4.5 1 4~4.5 10
계 10
누적도수분포 그래프
0.715 2,115 3.515 4.915 6.315 7.715 9.115 18
14