• 검색 결과가 없습니다.

그래프로 나타내기

문서에서 주제 선정하기 1 (페이지 42-50)

결과값을 그래프와 표로 나타내기

7.1 그래프로 나타내기

그래프에는 여러 가지 종류가 있는데, 연구결과의 내용에 따라 가장 적합한 그래프를 선택하는 것이 좋다.

선 그래프: 직교좌표계에서 데이터를 나타내는 점들을 선으로 연결하여 나타낸다. 독립변수(x축)의 일정 간격에 따라 종속변수(y축)인 데이터의 추세를 표시하는데 유용하다.

히스토그램: 양적 데이터를 나타내는 그래프. 어떤 특정 값에 대한 빈도수를 나타내고자 할 때 사용한다.

상자 수염 그림: 양적 데이터의 분포를 설명하는데 이용된다. 이 그래프에서는 최솟값, 최댓값, 특이값, 사분위간 범위, 중앙값, 하위 사분위, 상위 사분위를 나타낸다.

산포도: 직교좌표계에서 독립변수와 종속변수를 모두 하나의 점으로 나타내는 그래프이다. 점들의 경향성(기울기)을 통하여 정적 상관관계인지 부적 상관관계인지, 혹은 두 변수들 간의 상관이 없는지를 파악할 수 있다.

막대그래프: 질적 데이터의 분포를 설명하는데 이용된다. 막대의 크기로 특정 카테고리(범주)의 빈도수를 나타낸다.

파이 차트: 마치 피자처럼 하나의 전체 원반을 데이터의 크기에 비례하는 구역으로 나누어 나타내는 원형 차트를 말한다.

방사형 차트: 알아보고자 하는 어떤 특성이 n개의 범주를 가질 때, n개의 축을 그려 이 범주에 대하여 얻어진 값을 각각의 축에 대해 나타내는 평면 차트를 말한다. 마치 거미줄처럼 나타내는 차트이다. 원점을 기준으로 3개 이상 범주의 값들을 비교할 때 유용하게 사용된다.

그래프의 종류

결과값을 그래프와 표로 나타내기

41

7

가. 양적 데이터를 그래프로 나타내기

a. 선 그래프

아래의 선 그래프는 시토키닌이 식물의 성장에 미치는 효과를 나타낸 것이다. x축은 실험한 날의 수를 나타내고 있고, y축은 날마다 측정한 식물의 높이를 나타내고 있다. 그리고 실험그룹과 통제그룹에 대한 결과값을 한 그래프에 모두 표현하고 있어서 결과를 비교하기 쉽다.

•직교좌표계에서 데이터를 나타내는 점들을 선으로 연결하여 나타낸다.

•주로 독립변수를 x축으로, 종속변수를 y축으로 설정한다. 예를 들어, 시간에 대한 결과값의 변화(추이)를 보고자 할 때는 독립변수가 시간이 되므로 그래프의 x축을 시간으로 놓으면 된다.

이때 y축은 종속변수로서의 결과값으로 설정한다.

•선 그래프는 시간의 흐름이나 일정 간격의 항목에 따른 추세를 표시하는 데 유용하며, 특히 데이터 요소가 많고 데이터 요소를 표시하는 순서가 중요한 경우에 적합하다.

엑셀에서 선 그래프를 작성할 때, 유의해야 할 점은 다음과 같다.

•x와 y의 각 축에 대해 변수를 지칭하는 제목과 단위를 반드시 기입하여야 한다.

•축 위에 눈금(주 눈금과 보조눈금)이나 눈금선을 표시하는 것이 좋다. 보조눈금은 생략해도 무관하나 필요하면 포함시키도록 한다. 눈금선은 그래프를 처음 보았을 때 너무 복잡해 보이지 않도록 적당한 개수로 한다.

•위의 그래프와 같이 하나의 그래프에 여러 개의 선 그래프를 그릴 경우 반드시 범례를 달아서 각각의 선 그래프가 어떤 데이터를 나타내고 있는지 알려주어야 한다.

•그래프의 위쪽에 그래프 제목을 포함시키도록 한다. 이는 그래프가 어떤 연구결과를 나타내고 있는지를 신속하게 알려주는 역할을 한다. 또는 그래프 제목을 생략하는 대신 그래프 하단에 그림설명을 첨부하기도 한다.

참 고

(mm)

b. 히스토그램

•히스토그램은 양적 데이터의 분포를 나타내는 그래프로서, 어떤 특정 값에 대한 빈도수를 나타내고자 할 때 사용한다.

•히스토그램은 가로막대나 세로막대로 표현할 수 있다.

예를 들어 20개의 과일젤리 봉지가 있을 때 각각의 봉지에 들어있는 젤리의 개수를 조사한다고 하자. 각 봉지 안의 젤리 개수를 올림차순으로 나열했을 때 다음과 같은 결과를 얻었다.

봉지에 들어있는 젤리 개수의 분포를 나타내고자 할 때는 히스토그램을 사용하는 것이 바람직하다.

이때 x축은 젤리의 개수를 나타내는 양적 데이터가 되는데 …12~18…과 같이 연속적인 값이다. 그리고 막대의 높이는 빈도수, 즉 젤리 봉지 수를 나타낸다.

언뜻 보면 히스토그램은 막대그래프와 매우 비슷하게 보인다. 하지만 막대그래프는 봉지 안에 있는 다른 색깔의 젤리의 수를 비교하는데 사용하는 것이 더 합리적이다. 이때 막대그래프에서의 x축은 빨강, 노랑, 파랑, 초록 등의 불연속적인 질적 데이터가 되어야 한다. 그리고 막대의 높이로 각 색깔에 대한 젤리의 개수를 나타낸다.

12, 13, 13, 14, 14, 14, 14, 15, 15, 15, 15, 15, 15, 15, 16, 16, 16, 17, 17, 18

☞막대들의 높이는 각각의 젤리 개수가 들어있는 봉지의 수이다. 젤리가 15개 들어있는 봉지가 제일 많으며, 12개나 18개가 들어있는 봉지가 제일 적다. 또한 그래프는 최대치를 나타내는 막대를 중심으로 대칭적이다. 이와 같은 분포를 정규분포라고 한다.

결과값을 그래프와 표로 나타내기

43

7

엑셀을 이용하여 히스토그램을 그리고자 할 때, “countif” 함수로 젤리 개수에 대한 봉지 수를 계산하여 다음과 같은 표를 얻은 다음 막대그래프로 그릴 수 있다. 단 막대들 사이에 틈이 없도록 한다.

참 고

c. 상자 수염 그림

•상자 수염 그림은 상자 그림이라고도 한다. 상자의 위아래 수직방향으로 선이 그려지는데 이를 “수염”이라 한다.

•상자 수염 그림은 양적 데이터의 분포를 설명하는데 이용된다.

•상자 수염 그림은 데이터를 각각 25%씩 네 개의 범위로 나눈다. 그래프에서는 사분위 간 범위, 중앙값, 하위 사분위, 상위 사분위, 최소값, 최대값, 특이값 등을 나타낸다.

•이 상자 수염 그림은 실험그룹과 통제그룹에서와 같이 데이터 그룹 간의 비교를 하는데 매우 효과적이다.

예를 들어, 대리석, 콘크리트, 그리고 샌드페이퍼의 표면 위에서 공이 지나간 거리에 대해 상자 수염 그림으로 나타내고자 한다.

상자 수염 그림을 얻기 위해 먼저 다음과 같이 수평(혹은 수직)으로 데이터를 정렬한다. 일례로, 다음은 대리석 바닥에 대한 데이터를 정렬한 것이다. 이 데이터 값들에 대해 하위 25%(Q1), 중앙값, 상위 25%(Q3)를 결정한다.

공이 대리석 위를 지나간 거리의 4분위 범위 경계값(단위: cm)

24, 55, 60, 75, 79, 79, 80, 82, 82, 85, 90 중앙값

Q1 Q3

젤리 개수 12 13 14 15 16 17 18

봉지 수 1 2 4 7 3 2 1

참고로 이 상자 수염 그림에서의 데이터 값을 표로 나타내면 다음과 같다.

용어정리

•사분위 간 범위: 상위 25% 범위와 하위 25% 범위를 제외한 중간 범위

•중앙값: 결과값들 중 가운데 해당하는 값. 상위 50%의 값은 이 값보다 크다.

•하위 사분위(Q1): 하위 25%에 해당하는 값의 범위

•상위 사분위(Q3): 상위 25%에 해당하는 값의 범위

•최소값: 특이값을 제외할 때, 가장 작은 값

•최대값: 특이값을 제외할 때. 가장 큰 값

•특이값: 경향성에 벗어난 값으로, 상위 사분위보다 3/2배 큰 값이나 하위 사분위보다 3/2배 작은 값을 말한다.

특이값 최대값

상위 4분위

중앙값 하위 4분위

최소값 특이값 평균값

표면 종류 공이 지나간 거리 (cm)

대리석 24 55 60 75 79 79 80 82 82 85 90

라미네이트 48 51 51 52 53 55 56 57 59 60 63

샌드페이퍼 34 36 38 39 41 45 50 52 52 52 54

이와 같이 결정한 것을 상자 수염 그림으로 나타낸 것이 첫 번째 세로방향의 상자 수염 그림이다.

결과값을 그래프와 표로 나타내기

45

7

d. 산포도

•산포도는 직교좌표계에서 한 쌍의 좌표 (x, y)의 값을 점으로 나타내는 그래프이다.

보통 x축을 독립변수로, y축을 종속변수로 설정한다.

•점들의 경향성(기울기)을 통하여 독립변수(x)와 종속변수(y) 간의 상관이 정적 상관관계인지 부적 상관관계인지, 혹은 두 변수들 간의 상관이 없는지를 파악할 수 있다.

•(x, y)에 해당하는 점들의 분포가 왼쪽 아래에서 오른쪽 위로 분포하면 정적 상관이 있다고 해석할 수 있다. 반대로 왼쪽 위에서 오른쪽 아래로 분포하면 부적 상관이 있다고 해석할 수 있다.

아래의 그림은 공부한 시간과 시험 성적 간의 상관을 보여주는 산포도이다. 점들의 분포가 양의 기울기를 가지므로 정적 상관이 있다고 볼 수 있다. 즉, 공부 시간이 길수록 시험 성적이 높다고 결론지을 수 있다.

산포도와 선 그래프의 가장 주목할 만한 차이점은 산포도에서의 점들은 선으로 연결하지 않는다는 것이다. 예를 들면 아래의 산포도에서 7시간에 대해 한 개 이상의 점들이 그려져 있다. 이는 7시간을 공부한 학생들과 그들의 성적 각각을 나타낸 것이기 때문이다.

나. 질적 데이터를 그래프로 나타내기

a. 막대 그래프

•막대그래프는 질적 데이터의 분포를 설명하는데 이용된다.

•막대의 크기로 특정 범주의 빈도수를 나타낸다.

•막대그래프는 히스토그램과 비슷하게 보이지만, 질적 독립변수에 대한 결과값을 나타내는데 사용된다.

•세로 막대형 차트에는 일반적으로 가로축을 따라 항목(질적 독립변수)이 표시되고 세로축을 따라 값(종속변수)이 표시된다.

예를 들어, 하나의 젤리 봉지 안에 젤리가 색상별로 몇 개씩 들어있는지를 알아본다고 하자. 20개의 젤리 봉지를 준비하여 한 봉지 안에 들어 있는 젤리의 색상별 개수를 조사한 후, 평균을 구했다고 하자. 이때 다음과 같이 막대그래프를 작성할 수 있다.

막대그래프는 하나의 그래프에 여러 계열을 함께 나타낼 수도 있다.

다음의 예시는 어떤 처치(예학습법)에 대한 사전-사후 검사의 점수를 비교하기 위해 한 그래프에 두 계열의 데이터를 함께 나타낸 것이다.

결과값을 그래프와 표로 나타내기

47

7

b. 원형 그래프(또는 파이 차트)

• 원형 그래프를 파이 차트라고도 한다.

• 파이 차트는 하나의 전체 원반을 결과값의 크기에 비례하는 구역으로 나누어(마치 피자조각처럼) 나타내는 원형 도표를 말한다.

• 원 전체는 100%에 해당한다. 이중 각 조각들은 어느 정도를 차지하고 있는지를 나타낸다.

• 파이 차트는 어떤 데이터 조각들이 있는지, 데이터 조각이 전체에 대해 얼마나 차지하는지를 보여주는데 적합하다.

위의 파이 차트는 하나의 봉지에 들어있는 초코볼 색의 비율을 나타내고 있다. 파이 차트에서 각각의 파이 조각의 크기로 데이터 값을 비교하는 것이 가능하다.

☞ 파이 차트는 다음과 같은 경우에 사용하는 것이 좋다.

•데이터 계열이 하나만 있는 경우

•데이터에 음수 값이 없는 경우

•데이터 값 중 0이 거의 없는 경우

•항목의 수가 7개 이하가 좋으며 모든 항목이 원반 전체의 일부분인 경우 참 고

☞ 데이터 계열이 두 개 이상인 경우에는 도넛형 차트를 사용할 수 있다.

예 연령별로 스마트폰의 사용 비율을 조사한 결과를 나타내고 있다. 안쪽 도넛은 전년도 사용 비율을, 바깥쪽 도넛은 현재 년도 사용 비율을 나타낸다.

20대의 사용 비율이 현저히 높아졌음을 알 수 있다.

문서에서 주제 선정하기 1 (페이지 42-50)

관련 문서