• 검색 결과가 없습니다.

확률과 통계

N/A
N/A
Protected

Academic year: 2022

Share "확률과 통계"

Copied!
12
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

<1∼3학년>

영역 2007 교육과정 2009 교육과정 수학적

과정 비고

확률과 통계

 도수분포와 그래프(1학년)

① 도수분포표, 히스토그램, 도수 분포다각형을 이해한다.

② 주어진 자료를 표나 그래프로 나타내고, 이를 해석할 수 있 다.

③ 도수분포표에서 평균의 뜻을 알고, 이를 구할 수 있다.

 도수분포와 그래프(1학년)

① 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형 을 이해하고 해석할 수 있다.

② 도수분포표로 주어진 자료의 평균을 구할 수 있다.

③ 상대도수를 구하며, 이를 그 래프로 나타내고, 상대도수의 분포를 이해한다.

① 추론

② 의사 소통

•추가 : 줄 기와 잎 그 림을 현행

①에 추가

•삭제 : 누 적도수의 분 포

•중영역 통 합

 상대도수의 분포와 누적도수 의 분포(1학년)

① 상대도수의 분포와 누적도수 의 분포를 이해하고, 이를 그래 프로 나타낼 수 있다.

 확률과 그 기본 성질(2학년)

① 경우의 수를 구할 수 있다.

② 확률의 뜻을 알고, 그 기본 성 질을 이해한다.

③ 간단한 확률의 계산을 할 수 있다.

 확률과 그 기본 성질(2학년)

① 경우의 수를 구할 수 있다.

② 확률의 의미와 그 기본 성질 을 이해한다.

③ 확률의 계산을 할 수 있다.

① 추론

③ 문제 해결

 대푯값과 산포도(3학년)

① 중앙값, 최빈값, 평균의 의미 를 이해하고, 이를 구할 수 있 다.

② 분산과 표준편차의 의미를 이

 대푯값과 산포도(3학년)

① 중앙값, 최빈값, 평균의 의미 를 이해하고, 이를 구할 수 있 다.

② 분산과 표준편차의 의미를 이

① 추론, 문제 해결

확률과 통계

인류의 삶과 더불어 우연히 발생하는 사건에 대한 문제는 항상 존재하여 왔다. 우연으로 여겨지던 가능성을 수량화하여 수학적으로 다루려는 시도로부터 확률에 대한 연구는 시작되었다. 통계학 또한 주어진 자료를 바 탕으로 불확실한 사실에 대해 귀납적 추론에 의한 결론이나 일반성을 이끌어 내는 학문이다. 따라서 자연 현 상이나 실생활로부터 자료를 조사하고 정리하는 활동은 이 영역의 기초적인 학습 활동이다.

현대 사회와 같이 다양한 정보 속에서 살고 있는 우리는 매 순간 판단하거나 결정을 내려야 할 경우가 많 다. 이 경우에 감정이나 고집 또는 직관 등에 의한 것이 아니라, 과거와 현재의 가능한 모든 정보를 바탕으로 미래를 예측하고, 이를 토대로 객관적이고 보편타당한 의사 결정을 하는 것이 중요하다. 확률과 통계의 학습은 과거의 수량적 자료로부터 어떤 규칙성을 발견하여 미래를 예측하게 함으로써 합리적인 의사 결정을 할 수 있 게 해 준다.

특히, 오늘날의 정보화․산업화 시대에서는 정보가 어떻게 처리되며, 어떻게 유용한 지식으로 전환되는가에 대한 이해가 필요하다. 이러한 입장에서 보면, 정보와 자료를 처리하는 능력에 관한 확률과 통계의 지식을 길 러 주는 것은 단순히 수학적 지식의 습득이라는 측면을 넘어 서서 민주 사회에서의 건전한 삶을 누릴 수 있도 록 하는 국민 소양으로서 필요한 것이라고 볼 수 있다. 따라서 학생들에게 확률과 통계를 지도할 때에는 단순 히 수학적인 측면에서만 다룰 것이 아니라 다른 교과의 소재나 실생활과 관련하여 지도하는 것이 바람직하다.

(2)

<1∼3학년>

영역 2007 교육과정 2009 교육과정 수학적

과정 비고

해하고, 이를 구할 수 있다. 해하고, 이를 구할 수 있다.

용어 와 기호

변량, 계급, 계급의 크기, 도수, 도 수분포표, 계급값, 히스토그램, 도수분포다각형, 상대도수, 누 적도수, 사건, 중앙값, 최빈값, 대푯값, 산포도, 편차, 분산, 표 준편차

변량, 줄기와 잎 그림, 계급, 계 급의 크기, 도수, 도수분포표, 계급값, 히스토그램, 도수분포 다각형, 상대도수, 사건, 확률, 중앙값, 최빈값, 대푯값, 산포 도, 편차, 분산, 표준편차

•추가 : 줄 기와 잎 그 림, 확률

•삭제 : 누 적도수

교수

․ 학습 상의 유의점

① 실생활 자료를 수집하여 정리 하고, 표나 그래프로 나타낼 수 있게 한다.

② 가평균을 이용하여 평균을 구 하는 것은 다루지 않는다.

③ 경우의 수를 구할 때, 지나치 게 복잡한 경우는 다루지 않는 다.

④ 확률 개념의 도입과 계산에서 는 간단한 경우의 수 또는 상 대도수와 관련된 소재를 다룬 다.

⑤ 실생활의 여러 소재를 이용하 여 대푯값과 산포도를 도입하 고, 그 필요성을 인식하게 한 다.

① 다양한 상황에서 자료를 수집 하게 하고, 수집한 자료가 적 절한지 판단하는 활동을 하게 한다.(, )

② 다양한 상황의 자료를 표나 그래프로 나타내고, 그 분포의 특성을 설명할 수 있게 한다. ()

③ 눈금 등을 잘못 사용하여 자 료를 부정확하게 나타낸 표나 그래프에서 오류를 찾는 활동 을 하게 한다.()

④ 상대도수는 도수의 총합이 다 른 두 집단의 분포를 비교하 는 상황에서 다룬다.()

⑤ 경우의 수는 두 경우의 수를 합하거나 곱하는 경우 정도로 만 다룬다.()

⑥확률은 실험이나 관찰 상황에 서 구한 상대도수로서의 의미 와 경우의 수의 비율로서의 의미를 연결하여 이해하게 한 다.()

⑦ 경우의 수의 비율로 확률을 다룰 때, 각 경우가 발생할 가 능성이 동등하다는 것을 가정 한다는 점에 유의한다.()

⑧ 확률의 계산에서는 경우의 수 를 활용하는 것을 다룬다.()

⑨ 자료의 특성에 따라 적절한 대푯값을 선택하여 구할 수 있게 한다. ()

⑩ 공학적 도구를 활용하여, 표 와 그래프를 그리고 대푯값과 산포도를 구할 수 있게 한다. (, )

⑪ 경우의 수 용어는 교수 학습 상황에서 다루어질 수 있다. ()

① 추론

② 추론, 의사 소통

③ 추론

④ 추론

⑧ 문제

해결

⑨ 추론

(3)

1. 도수분포와 그래프

1.1. 이론적 배경 (1) 통계학의 역사

국가 또는 정치와 밀접한 관계가 있는 통계학(statistics)이란 어원은 라틴어의 국가(stato), 이탈리아어의 정치학(statista)에서 유래되었다. 고대의 통치자들은 국가의 재정 및 방위를 위하여 인구, 토지, 과세, 징병 대장 등을 만들어 사용했는데, 이때부터 통계조사가 실시되었다고 볼 수 있다.

통계학은 주로 인구조사 등의 목적으로 비롯되었으나 학문으로서의 통계학은 17세기 후반 유럽에서 국 가의 중요 사항을 기술할 목적으로 발생되었다고 볼 수 있다.

근대 통계학의 성립은 프랑스, 이탈리아, 스위스 등에서 시작된 확률론과 관계가 있다. 베르누이 (Bernoulli, J.;1654~1705)에 의해 발견된 큰수의 법칙(The law of large numbers), 드 무아브르(De Moibre, A.;1667~1754)에 의해 정리된 확률 이론, 라플라스(Laplace, P. S.;1749~1827)에 의해 출간된 ‘확률의 이론적 분석’ 등은 우연적인 현상을 수학적으로 관찰하여 처리하는 방법인 확률 이론을 개발시켰고 통계학 발전에 중요한 영향을 끼쳤다.

확률론에 의거하여 벨기에의 케틀레(Quètelet, L, A. J; 1796~1874)는 독일의 국상학과 영국의 정치산술 학을 통합하여 근대적인 수리통계학을 확립시켰다. 그는 사회 현상을 수량으로 분석하는 이론을 발전시키 고 범죄, 신체 측정, 지능 등 인간 생활을 확률과 연결시켜 통계적으로 분석하였으며 인구 통계, 도덕 통계 등에 업적을 남겼다.

정치산술학은 영국에서 발생한 하나의 통계적 체계인데, 국가를 사회 형태로 보고 사회와 경제의 실질적 측면에 대한 수량적인 관찰과 해석을 하여 통계학을 활용한 것이다.

국상학은 가장 최초로 형성된 통계학으로서 독일의 콘링(Conring, H.; 1606~1681)에 의해 창시되었다. 콘 링은 국가적 현상, 정치, 경제, 사회, 역사, 지리 등의 각종 현상으로부터 하나의 독립적인 학문적 체계를 수립하였으며, 아헨발(Achenwall, G.; 1719~1772)은 국상학을 더욱 발전시켜 ‘통계학’이라는 현재의 용어를 처음 사용하기도 하였다.

19세기 후반에서는 진화론의 발달 등 자연과학의 진보에 의하여 통계학은 사회과학적 통계뿐만 아니라 생물학, 유전학에 있어서의 종(種)의 분포 등도 통계학의 대상이 되었다. 특히, 다윈(Darwin, C.; 1809~1882), 갈톤(Galton, F.; 1822~1911) 등은 통계유전학이란 새로운 개념을 도입하였다.

피어슨(Pearson, K.; 1857~1936)은 모집단의 개념을 확립하고 통계학을 한층 더 발전시켰다.

20세기 초 고셋(Gosset, W. S.; 1876~1937)이 t분포를 발견함으로써 소규모의 표본으로 모집단에 관한 추 측을 내리는 추측통계학이 발달하였다. 그는 소규모의 표본으로부터 신뢰할만한 정보를 추출해내는 방법을 개발해야 한다고 하면서 표본 이론의 중요성을 인식시켰다.

후에 피셔(Fisher, R. A.; 1890~1962)와 그의 동료들은 고셋의 이론을 바탕으로 오늘날 널리 사용하고 있 는 귀무가설이라는 개념을 최초로 소개하였고, 추정․검정 이론에 대한 많은 업적과 분산분석에 대한 통계 학적 기술을 개발하는 등 추측통계학을 집대성하였다.

통계학은 과거 자료를 조사 분석하여 그 내용만을 제시하거나 두 시점의 자료를 비교하는 일, 표본을 추 출하여 품질 및 특성을 파악하는 일, 과거의 자료로부터 미래를 예측하는 일 등 다방면에 걸쳐서 사회 전 반에 깊이 관여하고 있다.

통계학은 크게 기술통계학(descriptive statistics)과 추측통계학(inferential statistics)으로 나뉜다. 기술통계

(4)

학은 통계 자료를 분석 목적에 알맞게 정리, 요약하여 도표로 나타내거나 또는 평균, 분산 등을 구하여 그 집단의 전반적인 성격을 기술하거나 분석하는 일종의 자료 처리 방법이다. 반면에 추측통계학은 전체 대상 집단의 개체를 낱낱이 조사하고 실험하는 데 막대한 시간 및 경비, 인력이 소요되고 또한 현실적으로 전수 조사가 불가능한 경우에 대상모집단으로부터 표본을 추출하여 이 표본으로부터 모집단의 특성을 추측하는 것에 관련된 분야이다. 중학교 수준에서 다루는 통계는 기술통계학 측면의 내용이다.

통계학은 OR(Operations Research), LP(Linear Programming), 게임 이론 분야의 연구, 컴퓨터의 발달, 사 무의 자동화 등과 결부하여 사회 각 분야에서 매우 중요한 구실을 하고 있다.

(2) 통계 교육의 필요성

통계학은 급격히 팽창하는 지식의 양과 컴퓨터의 대량 정보 처리 기능의 발달로 인해 급속한 발전을 하 고 있으며 응용 면에서도 그 범위가 확대되고 있다. 또한, 통계학은 확률과 함께 자연과학, 사회과학, 교육 등 거의 모든 분야에서 그 필요성이 증대되고 있다. 최근 들어 확률과 통계의 기초 교육은 수학에서 문제 해결력 향상을 위한 수단으로 중요시 되고 있다.

무어(Moore, 1997)는 통계학이 이론적이기보다는 경험적이며, 그렇기 때문에 자료를 관찰하는 과정이 우 선적으로 전제되어야 한다고 보았다. 이때 각각의 개체는 변화 가능하며, 동일한 개체를 반복적으로 측정해 도 변화 가능한 결과를 얻는다. 이러한 자료의 변이성 속에서 규칙성을 찾는 것이 바로 통계적 사고 과정 이다. 통계적 탐구의 전형적인 형태는 외양상 수학적이지 않은 상황에서, 자료를 수집하고 그 안에 숨어 있 는 규칙성과 그 규칙이 상황에 미치는 영향을 파악하는 것이다. 통계적 사고는 자료 수집 설계, 탐색, 해석 을 거치는 가운데 발전되며 이 과정은 전적으로 상황에 의존하여 진행된다.

이와 같이 정보화 사회에 필수적인 확률과 통계교육의 중요성이 강조되므로 학생들이 기초적인 확률과 통계 개념을 이해하여 생활에 적용할 수 있도록 해야 한다.

(3) 도수분포표

집단의 특성에 대해 많은 정보를 얻고 분석을 원활히 하기 위해서는 자료를 간결한 형태로 정리할 필요 가 있다. 자료를 정리하는 것은 자료의 특성을 아는 것을 목적으로 하며, 자료에서 대푯값으로 평균을 구하 는 것은 수치적 정리의 예이고, 자료의 분포의 특성을 알기 위한 줄기와 잎 그림, 도수분포표, 막대그래프, 원그래프, 히스토그램은 도표적 정리의 예이다.

양이 많은 자료의 수량적 값, 즉 변량을 간단하게 요약할 때에는 그 자료를 계급으로 분류하고 각 계급 에 속하는 개체의 수 즉, 계급의 도수를 정하여야 한다. 자료를 계급과 그것에 대응하는 도수로 정리해 놓 은 표를 도수분포표(度數分布表; frequency distribution table)라 한다. 이 표는 항상 범주를 갖고 있으며 각 범주에 속하는 변량의 도수를 헤아려 만들어진다.

자료는 조사된 값의 종류에 따라 출생지, 등급과 같은 범주형 자료와 줄넘기 횟수, 성적, 키, 몸무게, 온 도 등과 같은 수치형 자료가 있다. 수치형 자료에서 각각의 측정값을 변량이라 하는데 변량을 셀 수 있느 냐의 여부에 따라 이산변량과 연속변량으로 구분한다. 예를 들어, 줄넘기 횟수는 이산변량이고 키는 연속변 량이다.

연속 변량은 적당히 몇 개의 범주로 나누어 도수분포표를 만들게 되는데, 이 범주를 계급이라 부른다.

도수분포표를 작성할 때는 먼저 계급의 위 끝과 아래 끝을 결정하고 나서 계급의 수, 계급의 간격을 결정 하여야 한다. 계급의 폭은 지나치게 좁으면 취급하기가 복잡하여 정리할 가치가 작고 계급의 폭이 너무 크 면 대략 취급하게 되어 상태를 정확하게 파악하기 힘들게 된다.

(5)

자료의 수 8 16 32 64 128 256

계급의 수 4 5 6 7 8 9

계급의 개수를 정하는 방법은 다음 2가지가 있다.

(1) 율(Yule, G. U)의 방법

주관적인 방법으로써 대개 15개에서 25개 정도가 적당하다고 권장한다.

(2) 스타지(Sturges, H. A)의 방법

자료 전체의 개수, 즉 총 도수가 N일 때, 계급의 수 K는 K=1+[logN]으로 결정한다.

이 공식에 의하면 다음을 알 수 있다.

이때 계급의 수 K, 변량의 최댓값과 최솟값을 각각 M과 N이라 할 때, 계급의 크기 d는 d= 

 

로 결정한다.

한편 줄기와 잎 그림은 분포의 형태를 직접 묘사하고 있다는 장점이 있다. 즉 점수가 어느 부분에 집중 되어 있는지를 시각적으로 보여준다. 따라서 줄기와 잎 그림은 자료 분석의 탐색 단계에서 유용하다.

도수분포표를 그래프로 나타낼 수 있다. 그래프로 나타내면 표보다 알아보기 쉽고, 비교하기가 쉬워서 모집단의 상태를 대략적으로 빨리 파악할 수 있다. 도수분포표를 나타낸 그래프에는 히스토그램(histogram) 과 도수분포다각형(frequency polygon)이 있다. 히스토그램은 변량의 크기를 직사각형의 높이로 나타낸 그 래프이고, 도수분포다각형은 히스토그램에서 직사각형들의 윗변의 중점을 차례로 선분으로 연결한 그래프 이다. 이산적 수치형 자료는 막대그래프로, 연속적 수치형 자료는 히스토그램으로 나타내는 것이 원칙이다.

그 이유는 이산변량과 관련된 확률변수의 확률분포는 확률함수로 나타내고, 연속변량과 관련된 확률변수의 분포는 확률밀도함수로 나타내기 때문이다.

히스토그램과 확률밀도함수의 관계를 살펴보면, 우선 상대도수의 히스토그램에서 상대도수를 계급의 크 기로 나눈 밀도도수를 생각하고 밀도도수의 히스토그램을 생각하면, 한 개의 직사각형의 넓이 (계급의 크 기)×(밀도도수)는 상대도수를 나타낸다. 따라서 밀도도수의 히스토그램에서 직사각형 전체의 넓이는 1이 된 다.

이들 그래프는 통계학의 발달과 더불어 더욱 발전하여 도수분포 곡선과 표준 정규분포 곡선의 개념으로 발전한다.

도수분포 그래프의 특징으로는 다음이 있다.

(1) 도수분포 그래프의 주어진 변량에 대응하는 넓이는 그 부분의 넓이가 그 구간에 속하는 변량의 도수 또는 상대도수를 가리킨다.

(2) 도수분포 곡선으로 근사시키면 정규분포곡선과 같은 이론적인 곡선의 방정식을 추측할 수 있고 자료 전체의 분포상태를 파악할 수 있다.

(6)

1.2. 교육과정 및 교과서 내용

 도수분포와 그래프

역사상 손이 가장 큰 피아니스트

피아니스트는 손이 크면 클수록 연주하는 데 유리하다. 역사상 손이 가장 큰 피아니스트는 러시아의 작곡가이자 피아니스트인 라흐마니노프(Sergei Rachmaninov, S. ; 1873~1943)이다. 그는 도에서 한 옥 타브 위의 솔까지 12개의 건반을 여유 있게 짚을 수 있었다고 한다. 반면에 손이 작기로 유명한 피아 니스트는 에스파냐의 데라로차(De Larrocha, A. ; 1923~)이다. 그는 손을 완전히 뻗어야 한 옥타브를 간신히 짚을 수 있었다고 한다.

생각해 봅시다

① 줄기와 잎 그림, 도수분포표, 히스토그램, 도수분포다각형을 이해하고 해석할 수 있다.

◦ 자료를 정리하여 줄기와 잎 그림을 그리고 이를 해석할 수 있게 한다.

제시된 자료나 수집한 자료를 정리하여 줄기와 잎 그림으로 나타내고 자료의 특성을 파악할 수 있게 한다. 다음은 시험 성적의 십의 자리를 줄기로, 일의 자리를 잎으로 하여 두 학급의 시험 성적을 줄기와 잎 그림으로 나타낸 것이다.

자료를 이와 같이 정리하여 나타냄으로써 각각의 자료값과 분포 상태를 동시에 쉽게 알 수 있고, 두 학급의 자료를 시각적으로 비교하기 쉽다 또한 자료가 어디에 집중되어 있는지, 점수의 범위는 어떻게 되어 있는지 등을 찾아볼 수 있다.

◦ 자료를 정리하여 도수분포표를 만들고, 이를 해석할 수 있게 한다.

자료를 수량으로 나타낸 것을 변량이라 하고, 변량을 일정한 간격으로 나눈 구간을 계급, 구간의 너비를 계 급의 크기, 각 계급에 속하는 자료의 개수를 도수라고 함을 알게 한다. 계급을 대표하는 값으로 계급 중앙의 값인 계급값을 알게 한다.

통계 자료는 적절한 계급을 사용하여 정리하면, 그 자료의 특징을 어느 정도 파악할 수 있다. 자료를 계급에

(7)

다음 표는 여러 동물의 최대 수명에 대한 자료이다.

<표1> 동물의 최대 수명 자료

동물 수명(년) 동물 수명(년) 동물 수명(년) 동물 수명(년) 동물 수명(년)

앵무새 25 양 15 개 22 늑대 18 여우 14

박쥐 24 사자 35 지렁이 10 사슴 35 낙타 50 악어 45 돼지 18 호랑이 22 황소개구리 16 캥거루 9 큰고니 33 메추라기 6 들쥐 4 방울뱀 22 꿩 18

여왕벌 5 고양이 25 염소 15 닭 15 코알라 8

곰 40 하마 45 토끼 9 거북이 57 말 40

(출처 http://www.sonic.net/~petdoc/lifespan.htm) 위의 자료에서 최대 수명이 가장 긴 동물은 무엇인가?

위의 자료에서 최대 수명이 10년 이상 ~ 20년 미만인 동물은 몇 종류인가?

따라 정리할 때, 가장 먼저 고려해야 할 것은 계급의 개수와 계급의 크기이다. 몇 개의 계급을 어떻게 정할 것 인가 하는 문제는 자료의 종류나 양에 따라 달라지지만, 계급의 개수는 대개 5~15로 하고 계급의 크기는 동일 하게 한다. 이를 토대로 실생활의 여러 가지 자료를 정리하여 도수분포표를 만들고, 이를 해석할 수 있게 한다.

◦ 히스토그램과 도수분포다각형을 만들고 이를 해석할 수 있게 한다.

히스토그램의 뜻을 알고, 자료를 히스토그램으로 나타낼 수 있게 한다. 도수분포다각형의 뜻을 알고, 자료를 도수분포다각형으로 나타낼 수 있게 한다. 도수분포다각형은 히스토그램에서 양 끝의 도수가 0인 계급이 하나 씩 더 있는 것으로 생각하고 각 계급의 직사각형에서 위에 있는 변의 중점을 차례로 선분으로 잇는 것임을 알 게 한다. 히스토그램과 도수분포다각형을 통해서 자료의 전체적인 분포 상태 등과 같은 자료의 특징을 해석할 수 있게 한다.

② 도수분포표로 주어진 자료의 평균을 구할 수 있다.

◦ 도수분포표에서 평균의 뜻을 알고, 이를 구할 수 있다.

자료가 도수분포표로 제시된 경우에는 도수분포표를 이용하여 다음과 같이 평균을 구할 수 있다.

(평균)=도수 의총합

계급값  × 도수 의총합

도수분포표에서 얻은 평균은 실제의 평균과 일치하지 않을 수 있음에 유의한다. 계산의 간편성을 이유로 가 평균을 이용하여 평균을 구하는 것은 다루지 않는다.

③ 상대도수를 구하며, 이를 그래프로 나타내고, 상대도수의 분포를 이해한다.

◦ 상대도수의 뜻을 알게 하고, 상대도수의 분포를 그래프로 나타낼 수 있게 한다.

투표율, 시청률 등과 같은 실생활 자료를 통해 상대도수의 필요성을 이해하게 한다. 도수분포표에서 어떤 계급의 상대도수는 전체 도수에 대한 각 계급의 도수의 비율임을 알게 한다. 상대도수의 분포표를 만들고, 이 를 그래프로 나타낼 수 있게 한다. 상대도수의 분포표에서 각 계급의 상대도수의 합계는 반드시 1이 됨을 이 해하게 한다. 이 때, 반올림을 하여 상대도수를 구한 경우에는 그 합계가 1이 되지 않는 경우가 생길 수 있음

(8)

을 알게 한다.

학습 시간(시간) 학생 수(명) 1이상 ~ 2미만 14

2 ~ 3 25 3 ~ 4 40 4 ~ 5 16

5 ~ 6 5

합계 100

오른쪽 도수분포표는 어느 온라인 학습 사이트를 이용하는 100명의 중 학생을 대상으로 일주일 동안 이 사이트에서 온라인 학습을 한 시간을 조사하여 정리한 것이다. 온라인 학습 시간이 5시간 이상 ~ 6시간 미 만인 학생의 비율은 전체의 얼마인가?

(9)

◯◯일보는 T 공연 예매 사이트와 공동으로 한 해 동안 공연 표를 2회 이상 산 관객 1140명을 대 상으로 설문 조사를 실시하였다. 다음은 설문 조사 결과이다.

위의 신문 기사 내용을 읽고 다음 물음에 답하여라.

1.

조사 대상 중에서 20대 관객의 상대도수는 얼마인가?

2.

연간 공연 관람 편 수가 5회 이상인 관객의 수를 구하여라.

3.

위의 기사 내용 중에서 한국의 대표 관객이

31세라고 한 것은 무슨 뜻이고, 어떻게 구한 값인지 설명하여라.

4.

위의 기사 내용 중에서 공연비로 지출하는 표 값이 매월 3~5만 원이라고 한 것이 무슨 뜻인지 위의 표를 보고 설명하여라.

(10)

히스토그램은 통계 소프트웨어를 이용하여 쉽게 그릴 수 있다.

통계 소프트웨어를 이용하여 동물의 최대 수명 자료 <표1>에 대한 히스토그램을 그려 보자.

통계 소프트웨어의 초기 화면에서 다음 순서에 따라 활동하여 보자.

❶ <표1>의 자료를 오른쪽 그림과 같이 세로로 입력한다.

❷ 메뉴에서 [그림 분석]-[히스토그램]을 선택한다.

❸ 히스토그램 도구상자의 분석변수에 ‘V1'을 선택하고 확인키를 누른다.

❹ 히스토그램이 나타나면 마우스의 오른쪽 버튼을 눌러 선택사항에서 축 설정을 선택하고, 축 범위 조정에서 최솟값을 0, 구간 너비를 10으로 하면 다음과 같은 히스토그램을 얻을 수 있다.

<표1>의 최대 수명 자료에 대한 히스토그램

(11)

1.3. 교수학습 참고자료

탐색적 자료 분석 _ 줄기와 잎 그림

탐색적 자료 분석은 간단한 계산과 간단한 그림에 대한 해석에 기초하여 자료 이면에 들어 있는 의미를 파악하 는 시도이다(허명회, 문승호, 2000). Tukey는 탐색적 자료 분석에서는 일부 자료가 파손되어도 자료 전체에 대하 여 비교적 합리적인 해석을 내릴 수 있어야 하며, 자료를 그래프로 나타내는 것이 다양한 해석을 가능하게 해야 한다고 하였다. 탐색적 자료 분석에서는 평균보다 중앙값이 더 선호되며 그래프 지도에 상당한 비중을 두게 된다.

자료를 표로 정리하고, 자료의 추세와 분포에 주목하는 것은 탐색적 자료 분석의 주요한 방법이다. 줄기와 잎 그 림(stem and leaf display)은 소규모의 자료를 수집하여 그 자료의 분포를 대략적인 형태로 알아보기 위해 작성되 는 그래프로서, 탐색적 자료 분석 관점에서 많이 쓰인다.

[참고문헌] 허명회, 문승호(2000). 탐색적 자료 분석. 자유아카데미.

김남희 외(2009). 수학교육과정및교재연구. 경문사.

재미있는 수업 _ 수업 참여도 높이기

학생들이 직접 실습을 하여 얻은 자료로 학습을 하면 수업 참여도가 높아질 수 있다.

[감으로 30초 맞추기]

① 벽시계를 앞에 두고 모두 동시에 눈을 감는다.

② 30초가 되었다고 생각되는 순간 눈을 뜨고 자신이 예상한 시간을 확인한다.

③ 학급 학생의 기록을 조사하여 칠판에 도수분포표를 완성한다.

자료 수집의 원칙

어떤 목적을 위해 자료를 수집할 때, 수집하는 자료가 전체를 대상으로 한 것이 아니라 일부일 때가 있다.

이때 표본의 선정을 포함하여 자료를 수집하는 과정은 매우 중요하다.

표본은 대표성이 있어야 한다. 예를 들어 대통령 후보 지지도를 특정 지역에서만 한다면 전 국민의 의견을 대표한다고 할 수 없다. 따라서 표본을 선정할 때는 모집단을 몇 개의 집단으로 나눈 후 각 집단에서 할당된 수에 따라 표본을 추출하는 할당추출법(quota sampling)과 임의로 표본을 추출하는

임의추출법(random sampling)이 함께 쓰이고 있다.

[출처] 최제호(2007). 통계의 미학. 동아시아.

상대도수의 쓰임새

상대도수를 이용하면 도수분포표에서 각 계급의 도수가 전체에서 차지하는 비율을 쉽게 알 수 있다.

상대도수는 전체에서 해당 부분이 차지하는 비율을 알고자 하는 데 그 목적이 있으며, 분수보다 소수

(12)

표현이 더 쉽게 이해된다.

어떤 설문조사에 대한 결과를 발표할 때, 자료의 수가 많은 경우에는 구체적인 수치를 제시하는 것보다 비율로 설명하는 것이 훨씬 이해하기 쉽다. 예를 들어, 1학년 학생 298명이 산으로 소풍갔다는 것만 제시하기보다는 전체 1학년 학생이 313명인데 약 95.2%가 참석했다고 하는 것이 더 좋은 정보일 수 있다.

선거 참여율이나 득표율, 시청률 등도 마찬가지로 상대도수가 쓰이는 예이다.

재미있는 수업 _ 상대도수 다시보기

하연: 난 오토바이가 자동차보다 훨씬 안전하다고 생각해. 교통사고의 대부분은 자동차 사고거든.

하진: 난 시속 160㎞ 이상으로 달리는 것이 훨씬 안전하다고 생각해. 자동차 사고의 대부분은 시속 160㎞

이하에서 나거든.

두 사람이 잘못 생각하고 있는 것은 무엇일까?

확률밀도함수

상대도수는 나중에 확률밀도함수(probability density function)의 개념으로 연계된다. 상대도수를 계급의 크기로 나눈 것이 밀도도수인데, 상대도수의 합이 1인 것처럼 밀도도수의 히스토그램은 넓이의 합이 1이 된다. 계급의 크기를 매우 작게 줄이면 히스토그램은 부드러운 곡선 모양을 갖게 되며, 이 곡선이 확률밀도 함수이다. 연속확률변수 에서 확률은 확률밀도함수 를 적분하여 다음과 같이 구한다.

     



분포 개념의 발달 측면에서 상대도수 이후 밀도도수 개념을 도입하면 고등학교의 확률밀도함수로 직접 연 계될 수 있다.

심슨의 패러독스(Simpson's paradox)

1973년 미국 캘리포티아 주립대학교(UC Berkeley)에서 학생의 성별에 따른 대학원 합격률을 조사하였다.

학과별로는 여학생의 합격률이 전반적으로 더 높은데 전체적으로는 여학생의 합격률이 남학생에 비해 낮았 던 실제 상황에서 비롯된 패러독스이다.

예를 들어, 수학과 합격률은 여학생이 40%로 남학생의 30%보다 높고, 과학과 합격률은 여학생이 40%이 고 남학생은 30%로 여학생이 더 높다. 하지만 전체 합격률은 남학생이 더 높은 경우가 있을 수 있다. 이 런 경우의 예를 하나 들어 보자.

참조

관련 문서

2차 시행에서는 복원 추출, 비복원 추출에 따라 상자가 달라진다.4. 확률과

문제 대규모 건축물의 자동화재 탐지설비는 보안설비 등과 같은 여러 관련설비와 문제 대규모 건축물의 자동화재 탐지설비는 보안설비 등과 같은 여러

0104 남학생과 여학생의 혈액형에 대한 상대도수의 분포표를 만들면 다음과 같다.. 따라서 여학생이 남학생보다

그는 자주 저녁 식사 전에 그의 어머니를 도와준 다. 교통수단 앞에 는 전치사 by 를, ‘~ 후에’라는 뜻을 나타낼 때는 전치사

시간을 나타내는 접속사 뒤에서 미래의 뜻을 나타낼 때는, 반드시 현재시제를 써야 한다. because strong people are not always right

단말기의 센서를 통해 부지불식간에 데이터가 수집되기도 하고 헬스케어 등과 같은 제품 의 경우 개인의 민감한 정보를 주로 다루고 있다는 점 등에서 사물인터넷 관련 서비스

자료를 분석 하여 불확실 한 사실에 대하여 과학적 , 합리적 판단 을 내린다?. 추론 ( 추측

생업의 경험으로부터 나온 지식뿐만 아니라 강원대학교 시설농업학과에서 배운 전문적인 지식을 통해 저는 더욱 더 발전한 저의 모습을 발견할 수 있게 되었고, 이를