확률 개념의 다면성과 확률
지도
확률 지도의 의의와 난점
• 의의
ü 일상생활에서 접하는 불확실하고 우연적인 사건이 일어날 가능성을 합리적(?)으로 측정하는 수단
ü 통계적 방법의 바탕
• 난점
ü 확률 개념의 애매성(확률의 의미에 대해 여러 가지 관점 병존) à 확률 개념 자체가 이해하기 쉽지 않음.
ü 확률적 사고는 기존의 수학적 사고와 다름.
[Bertrand의 현 문제]
원에 내접하는 정삼각형이 있다. 이 원에서 임의로 현을 하나 그릴 때, 그려진 현의 길이가 주어진 정삼각형의 한 변의 길이보다 길 확률은?
① 현의 중점 M의 위치가 차지하는 영역의 넓이: 1/4
② 현에 수직인 지름에서 현의 중점이 차지하는 선분의 길이 : ½
③ 현의 한 끝점을 지나는 접선과 현이 이루는 각의 크 기 : 1/3
확률 개념에 대한 세 가지 관점
• 고전적 관점 (Laplace의 수학적 확률, 고전적 확률) ü 1의 눈이 나올 확률은 일어날 가능성이 똑같다고 가
정된 6개의 면이 있으므로 1/6이다.
• 도수적 관점 (경험적 확률 : 상대도수의 극한)
ü 1의 눈이 나올 확률은 (반복된 실험을 통해) 상대도 수가 1/6으로 수렴하므로 1/6이다.
• 구조적(형식적) 관점(공리적 확률)
ü 확률은 몇 개의 공리를 만족하는 함수이다.
ü 확률의 의미에 관심을 두지 않음.
확률 개념의 기원
• 인류가 우연현상을 인식한 것은 매우 오래되었으나, 확률은 16-17세기에 와서야 개념화되기 시작
ü 우연 현상의 이론화를 신성 모독으로 간주
ü 불확정 상황에서 다음 번 시행의 결과를 명확히 예측 하는 것은 원칙적으로 불가능(즉, 우연 현상은 수학 의 다른 분야와 달리 연역적이고 논리적인 접근이 쉽 지 않은 애매한 현상으로 수학화가 용이하지 않음)
• Cardano와 Galilei(16세기) : 공정한 내기와 주사위 게임에 대한 논의를 최초로 함.
• Pascal과 Fermat(17세기) : de Mèrè의 문제와 상금 의 분배 문제 해결을 위한 서신 왕래를 통해 확률 개 념화에 큰 진전 이룩함.
[de Mèrè의 문제]
한 개의 주사위를 4회 던졌을 때 적어도 한 번 6의 눈 이 나오는 것에 내기를 걸면 유리하다. 그런데 두 개의 주사위를 24회 던졌을 때 적어도 한 번 (6,6)이 나오 는 것에 내기를 거는 것은 왜 불리한가?
àde Mèrè의 생각 : 6:4 = 36:24로 두 경우가 차이가 없을 것 같다.
à Pascal과 Fermat의 해법 : ?
ü 가능한 모든 경우를 고려한다는 아이디어 처음 사용 ü 그러나 확률 개념을 정의하는 데에는 이르지 못함.
[상금 분배 문제]
두 사람이 같은 돈을 걸고 게임을 해서 먼저 5점을 얻 는 사람이 돈을 모두 가지기로 하였다. 그런데 4 : 3의 득점 상황에서 게임을 중단해야 한다면 돈을 어떻게 나누어가져야 하는가?
à 4 : 3 (비례배분)으로? 아니면 2 : 1 (이기는데 필요 한 남은 게임 수)로?
à Pascal과 Fermat의 해법 : ?
고전적 확률(수학적 확률)
• Laplace(19세기초) : 확률에 대한 명확한 정의를 처 음으로 내림
ü “P(A)는 모든 경우의 수에 대한 사건 A가 일어나는 경우의 수의 비이다.” à 수학적인 확률 이론의 발전 과 응용을 가능하게 한 강력하고 유용한 정의
- 각각의 경우가 일어날 가능성이 같다는 가정이 암묵 적으로 전제
- Laplace는 이 가정을 합리화하기 위해 ‘이유 불충분 의 원리’를 도입(“구별되어야 할 충분한 이유가 없다 면 구별 지을 수 없다”)
ü 문제점
- 철학적으로 모호한 ‘이유 불충분의 원리’ 원용
- 적용이 어려운 경우 존재 : 각 경우가 일어날 가능성 이 균일하지 않거나(압정 던지기 등), 균일하다고 분 석하기 어려운 경우(남녀의 출생 등), 경우의 수가 무한히 많은 경우 등
- 논리적 결함 : 각각의 경우가 일어날 가능성이 같다 는 것은 확률이 같다는 것이므로 순환적 정의에 해당 - 여러 가지 패러독스 출현 : 가능한 경우에 대한 여러
가지 모델이 서로 다른 확률 제시(예;도서관 문제)
[도서관 문제]
어떤 대학 도서관에서 무작위로 책을 한 권 뽑을 때 그 책이 영어로 쓰여진 책일 확률은?
E = 500, T = 1000 이라고 하자.
① E/T = 1/2
② 책이 여러 서고에 나누어져 있다면, 서고 선택 확률과 각 서고에서 영어책을 뽑을 확률을 고려해야 함.
공리적 확률
• Kolmogorov(20세기초)가 측도론의 관점에서 확률 을 공리적으로 정의
ü 표본공간(모든 가능한 결과의 집합)의 멱집합을 정 의역으로 하면서 다음 공리를 만족하는 함수
① 임의의 사건 E에 대해 P(E)≥ 0
② 표본공간 S에 대해 P(S) = 1
③ P(∪Ei) = ΣP(Ei) (Ei 와 Ej : 배반사건)
• ‘순환적 정의’의 문제 해소
• 그러나 확률이 실제로 무엇인지는 설명하지 못함. 즉, 구체적인 사건의 확률값을 결정하는 데 도움이 되지 는 않음.
경험적 확률(통계적 확률)
• 상대도수의 극한 : 시행을 여러 번 반복하면 그 사건 의 상대도수는 어떤 값에 수렴할 것이다.(시행의 반 복 à 규칙성)
• 영국 수학자 Graunt(17C 초) : 서기가 기록한 사망 표 자료를 기초로 런던시의 인구를 여러 가지 질병에 걸릴 위험이 있는 집단으로 분류.
• J.Bernoulli(18C) : 대수의 법칙으로 상대도수와 확 률의 관련성 정당화(상대도수는 그 바탕에 놓여있는 확률에 수렴한다.)
• 현실에서 직면하는 여러 사건의 확률 계산 가능
ü 각 경우가 일어날 가능성이 동등하지 않은 사건(병 뚜껑 던지기)
ü 가능한 경우의 수가 무한히 많은 사건(우리나라 사 람이 90세까지 생존할 확률) 등
• 문제점
ü 상대도수의 극한이 존재한다는 것을 이론적으로 보 장할 수 없다는 문제
ü 일련의 사건을 그 상대도수가 같은 극한을 갖는다는 보장이 없이 유사한 사건으로 간주할 수 있는가의 문 제(예 : 컨디션에 따라 들쭉날쭉한 야구 선수의 타율) ü 상대도수가 안정화되어 가는데 필요한 시행의 횟수
는 얼마이어야 하는가의 문제(예 : 타율과 규정 타석)
확률 개념의 도입 방안
① 실제적인 상황에 초점을 맞추어 상대도수로서 확률 을 도입하는 방법
② 사건, 표본공간 등의 기본 개념을 명확히 정의 하고 이상적인 대칭성을 가정한 이론적인 형식으로 고전 적인 Laplace식의 확률을 도입하는 방법
à 고전적 관점과 도수적 관점은 확률현상을 설명하는 서로 다른 모델로 상호 보완적이므로 적절한(?) 조 화 필요
v 현행 교과서에서 확률 개념을 어떻게 도입하고 있 는지 알아보자.
확률적 사고의 4가지 수준(발달) (Shaughnessy, 1992)
• 확률적 사고는 다음의 4가지 수준을 거쳐 발달한다.
( 그러나, 이들 수준이 선형적으로 발달하거나 서로 배 타적인 것은 아니다.)
ü 비확률적 사고 수준
ü 원시 확률적 사고 수준
ü 발생 단계의 확률적 사고 수준 ü 실제적인 확률적 사고 수준
ü 비확률적 사고 수준
- 논리, 수학적 판단이 아니라 신념에 근거하여 판단
- 확률 개념의 기초인 우연 현상, 무작위 사건에 대한 인식 불가능
ü 원시 확률적 사고 수준
- 과거의 경험에 기초하여 판단
- 확률 개념의 기초 우연 사건, 무작위 사건 등의 직관적 인식(불완전 한 이해)
ü 발생 단계의 확률적 사고 수준
- 간단한 문제상황에 수학적 확률이나 통계적 확률 개념 적용 가능 - 확률 교육을 받은 초기 단계에 해당
ü 실제적인 확률적 사고 수준
- 수학적 확률과 통계적 확률의 의미, 차이점 등을 알고 상황에 따라 적절하게 적용 가능
확률 관련 인식론적 장애
- 확률 직관 및 판단 전략 관련
• 확률 직관과 인식론적 장애
ü Piaget & Inhelder(1951)
- 확률 교육을 받기 이전에 이미 인간의 일상적인 행동과 생각 속에 확 률 직관이 존재함.
- 확률 직관은 인과적 사고와는 다름(예: 3주 내내 일요일마다 비가 왔 다고 해서 일요일마다 비가 온다고 생각하는 것은 잘못)
ü Fischbein(1975)
- 확률 교육을 받기 이전에 형성된 확률 직관은 확률 개념 이해에 오히 려 방해가 되는 경우가 있다.(à 인식론적 장애 유발)
- 형성된 확률 직관의 한계 인식 à 수정하여 균형 추구하는 태도 필요 - 연역적 사고 방법만으로는 확률의 의미 교육 불가능 à 귀납적 사고
의 가치와 역할 교육 필요
- 인간 행동 자체가 확률적이므로, 인간 행동 탐구 강조
• 확률 판단 전략과 인식론적 장애
- 확률 문제 상황에서 어떤 판단을 내릴 때 사람들이 흔히 사용하는 판 단 전략이 있음.(à 인식론적 장애 유발)
ü 대표성 전략, 정보의 이용가능성 전략, 조정과 고정 전략 (Kahneman, Slovic, Tversky, 1982)
- 대표성 전략: 표본이 크기에 관계없이 모집단과 유사할 것을 기대하 거나, 표본 추출 과정이 무작위성을 반영한다고 기대하는 것(예: ‘전 체의 1/3이 여자’라고 하면, 세 명 중 한 명은 반드시 여자라고 기대, 동전 6개를 던지면 HHHTTT보다는 HTTHHT로 나타날 가능성이 더 높다고 생각)
- 정보의 이용 가능성 전략: 판단을 내릴 때 개인적으로 이용할 수 있 는 정보에 영향을 받는 것(예: 교통사고의 직, 간접 경험이 있는 사 람이 그렇지 않은 사람보다 교통사고 확률을 높게 추측)
- 조정과 고정 전략: 결과를 얻기 위해 초기 값을 조정하되, 초기 값을 어떻게 정했는가에 따라 결과가 고정되는 현상(예: 8*7*…*2*1과 1*2*…*7*8의 값을 다르게 추측하는 현상)
ü 결과 중심 판단 전략, 인과적 정보 주목 전략(Konold, 1992)
- 결과 중심 판단 전략: 사건이 일어날 가능성보다는 결과가 실제로 어 떻게 될 것인가를 판단하여 결정하는 것 (예: 비가 올 확률이 60% / 40% à 비가 올 것 / 오지 않을 것 으로 단정지어 생각)
- 인과적 정보 주목 전략: 도수에 관한 정보보다는 인과적 정보에 주목 하여 판단하는 것 (예: ‘비가 올 확률 70%’를 도수에 관한 정보가 아 니라 습도가 70% 혹은 하늘에 구름 70% 등으로 추측하여 인과적 해석을 내리는 경우)