2장
기술 통계 :
표와 그래프로 나타내기 Part B
탐색적 자료 분석
교차제표와 산점도
탐색적 자료 분석 (exploratory data analysis)
탐색적 자료 분석의 기술은 간단한 산수와 쉽게 그릴 수 있는 그림으로 이루어져 있으며, 자료를 빠르게 요약하는데 사용
된다.
그러한 하나의 기술은 줄기-잎 그림이다.
줄기 - 잎 그림(stem-and-leaf display)
줄기에 있는 각 자리수는 잎이다.
그림의 각 행의 왼쪽에 있는 수를 줄기라 한다.
수직선의 오른편에는 각 자료의 마지막 자리 숫자를 순서대로 적는다.
자료 항목의 앞 자리 숫자가 수직선의 왼쪽에 배열된다.
이런 측면에서 히스토그램과 비슷하지만, 실제 자료값을 보여주는 장점이 있다.
줄기-잎 그림은 자료의 순위와 분포모양을 모두 보여 준다.
예 : Hudson 자동차 수리점
Hudson 자동차의 관리자는 자신들의 수리점에서 행해진 엔진 조정에 사용되는 부품비용에 대하여 좀더 자세한 조사를 하려 한다.
그래서 엔진조정을 한 50건의 고객 송장을 조사 하였다. 부품비용(달러 단위로 반올림 함)이 다음 슬라이더에 나타나 있다.
예 : Hudson 자동차 수리점
50건의 엔진조정에 대한 부품비용 표본
91 78 93 57 75 52 99 80 97 62 71 69 72 89 66 75 79 75 72 76 104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74 62 82 98 101 79 105 79 69 62 73 91 78 93 57 75 52 99 80 97 62 71 69 72 89 66 75 79 75 72 76 104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74 62 82 98 101 79 105 79 69 62 73
줄기 - 잎 그림
5 6 7 8 9 10
2 7
2 2 2 2 5 6 7 8 8 8 9 9 9
1 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9 0 0 2 3 5 8 9
1 3 7 7 7 8 9 1 4 5 5 9
줄기
잎
자세한 줄기 -잎 그림
같은 줄기가 두 번 표시될 때는, 첫 번째 줄기는 0 에서 4의 잎을 표시하고, 두 번째 줄기는 5 에서 9의 잎을
표시한다.
만약 줄기-잎 그림이 자료를 너무 간략하게 나타냈다고
생각한다면, 각 앞 자리수마다 두 개 이상의 줄기를 사용해서 그림을 더 펼칠 수 있다.
자세한 줄기 - 잎 그림
5 5 9 1 4
7 7 7 8 9 1 35 8 9
0 0 2 3
5 5 5 6 7 8 9 9 9 1 1 2 2 3 4 4
5 6 7 8 8 8 9 9 9 2 2 2 2
7 2 5
5 6 6 7 7 8 8 9 9 10 10
줄기 -잎 그림
잎 단위
줄기-잎 그림에서 잎의 단위가 나타나 있지 않다면, 잎 단위는 1이라고 가정한다.
잎 단위는 100, 10, 1, 0.1 등일 수 이다.
앞의 예에서는 잎 단위는 1이다.
각 잎을 구성하는 데 한 자리 자릿수가 쓰였다.
예 : 잎 단위 = 0.1
다음과 같은 자료를 가지고 있다면:
8 9 10 11
잎 단위 = 0.1 6 8 1 4 2 0 7
8.6 11.7 9.4 9.1 10.2 11.0 8.8 이 자료의 줄기-잎 그림은:
예 : 잎 단위 = 10
다음과 같은 자료를 가지고 있다면:
16 17 18 19
잎 단위 = 10 8
1 9 0 3 1 7
1806 1717 1974 1791 1682 1910 1838 이 자료의 줄기-잎 그림은:
1682에는 82이나, 80으로 내림 되어 8로 표시 되었다.