제 10 장 T, ℵ 𝟐 , F-분포
충북대학교 농업생명환경대학 지역건설공학과
실 험 통 계 학
맹 승 진
10.1 T 분포
10.1-1 T 분포의 정의
표준정규분포 N(0, 1)을 따르는 확률변수를 Z라 하고, 이와는 독립이며
자유도 k인 카이제곱분포를 따르는 확률변수를 V라 하면, T = Z / √(V/k) 의 분포를 자유도 k인 T분포라 한다. 이 때, 기호로서 T ~ t(k) 로 나타낸다
10.1 T 분포
10.1-1 T 분포 정의
• t-분포는 다음의 확률변수의 분포로 정의된다
이 값들은 평균과 분산에 대한 불편 추정값이다. 이 때 카이제곱분포 식은 다음과 같다
10.1 T 분포
• 위 식은 자유도가 n-1인 카이제곱분포가 된다는 것이 코크란의 정리이다 T-분포의 확률밀도함수는 평균이 0이고 표준편차가 1인 표준정규분포를 따르고 또한 카이제곱분포도 따른다
이 때 Z 와 V는 확률적으로 서로 독립일 때 Z를 분자로 를 분모로 취한 확률변수를 T라 하면 T의 확률밀도 식은 다음과 같다.
10.1-1 T 분포 정의
10.1 T 분포
• 위 확률 밀도함수 식에서 자유도가 2일 때 확률밀도 함수는 다음과 같다
(t)의 성질은 t=0에서 대칭이고 최대값을 갖는다. 그리고 가 증가할수록 그 값이 감소하고 t=0 을 중심으로 단조 감소하는 함수이다. 여기서 자유도가 증가하면 정규분포에 접근한다.
10.1-1 T 분포 정의
10.1 T 분포
10.1-2 T 분포 - 사용이유
• 두 분포는 평균이 0이고 확률밀도함수는 평균을 중심으로 종모양의 좌우 대칭을 이루나 T-분포의 밀도함수는 표준정규분포보다 큰 분산을 갖는다 큰 분산을 갖게 되는 이유는 모집단 표준편차 대신 표본 표준편차를
사용하기 때문에 추가적인 불확실성이 존재한다
• T-통계량을 사용하면 신뢰구간의 폭이 커지는데 이는 모집단의 표준편차 를 모르는 데서 오는 추정상의 오류를 보정해 주기 위하고 가설검정을 위해 서 사용된다
10.1 T 분포
10.1-3 Student T-분포
• Student의 t분포는 W.S. Gosset의 이론적 상대빈도분포
• z 대신에 t를, σ 대신 s를 사용한다는 것만 제외하면 이 공식은 표준정상분 포에서의 공식과 동일하나, s가 계산된 표본의 크기에 따라서 상이한 t분포 들이 존재한다
10.1 T 분포
10.1-3 Student T-분포
• 적절한 T분포의 표본의 크기는 N, 정확히는 자유도 (Degree of freedom)인 N-1 에 의해서 결정되고 자유도가 증가함에 따라, t분포는 점차 표준정상 분포에 가까워진다
• 자유도가 (표본의 크기)가 이론으로 무한하다면 t분포와 표준 정상분포는 동일하다
10.1 T 분포
10.1-3 Student T-분포
10.2 ℵ 𝟐 분포
10.2-1 ℵ𝟐 분포 정의
• 표준편차가 있음에도 치우침을 파악하기 위해 분산을 많이 사용하는데, 이 분산을 활용한 분포가 카이제곱분포(χ2)
• 카이제곱분포는 데이터나 집단의 분산을 추정하고 검정할 때 많이 사용하며, 분산의 제곱된 값을 다루기 때문에 χ2분포(Chi-square distribution)라고 한다
10.2 ℵ 𝟐 분포
10.2-1 ℵ𝟐 분포 정의
• 카이제곱분포의 특징 중 하나는 제곱된 값 분산을 다루기 때문에, - 값은 존재하지 않고 +값만 존재한다.
• 정규분포 그래프와 비교해보면, 정규분포는 –값도 다루기 때문에 좌우가 모두 발달하여 좌우대칭인 모양을 하는 반면, 카이제곱분포는 +값만 다루기 때문에 한쪽만 유달리 발달하여 오른쪽 꼬리가 긴 비대칭 모양을 한다.
10.2 ℵ 𝟐 분포
10.2-1 ℵ𝟐 분포 정의
10.2 ℵ 𝟐 분포
10.2-2 자유도에 따른 ℵ𝟐 분포
10.2 ℵ 𝟐 분포
10.2-2 자유도에 따른 ℵ𝟐 분포
• ℵ2 분포는 앞의 자유도에 따라서 모양이 결정되는데 자유도가 작은 값일 때에는 분포의 모양은 비대칭으로 정점은 좌측(0쪽)으로 기울며 자유도가 커짐에 따라 분포의 모양은 급격히 대칭에 가까워지고 ν = 10 정도에서도 분포의 모양은 거의 대칭이 되며 ν가 아주 커지면 ℵ2 분포는 거의 정규적 으로 분포
• ℵ2 분포 역시 자유도에 따라 무한히 많은 모양이 존재하므로 모든 ℵ2 분포의 ℵ2 값에 대한 확률표의 작성은 불가능하다. 따라서 몇 개의 특정확률에 대한 ℵ2 값을 구하여 표로 정리한 것이 ℵ2 -분포표이다
10.2 ℵ 𝟐 분포
10.2-2 자유도에 따른 ℵ𝟐 분포
10.3 F 분포
10.3-1 F 분포 정의
• F분포는 통계학에서 사용되는 연속 확률 분포로
두 확률 변수 V₁, V₂가 각각 자유도가 k₁, k₂이고 서로 독립인 카이제곱분포를 따른다고 할 때, 다음과 같이 정의되는 확률변수 F는 자유도가 (k₁, k₂)인
F-분포를 따른다
10.3 F 분포
10.3-1 F 분포 정의
• F는 두 모집단의 분산에 대한 불편추정치의 비율로서 다음과 같은 수식으로 정의
• 이 분산비 F 분포는 두 분산 간의 동질성 여부를 검정하거나 두 개 이상의 평균치의 간의 차이의 유무를 검정하는 주로 이용
10.3 F 분포
10.3-1 F 분포 정의
• 여기서 , 이며 가설에서 이므로
의 관계가 성립된다. 즉 두 표본의 분산비 F는 두 개의 독립적인 통계량을 각각의 자유도로 나눈 값의 비율과 같다
10.3 F 분포
10.3-1 F 분포 곡선
• F분포에서 F값이 나타내는 확률은
의 곡선식이 나타내는 곡선에 의하여 결정되며 이 곡선이 나타내는 분포가 F-분포이다
• F 분포곡선의 모양은 두 개의 자유도, 즉 분자분산의 자유도 과 분모분 산의 자유도 에 따라 결정되며 비대칭이고 곡선의 정점은 좌측으로 기울 어져 있으나 과 중에 어느 한 자유도나 두 자유도 모두의 값이 커 질수록 대칭에 가까워 진다
10.3 F 분포
10.3-1 F 분포 곡선
10.3 F 분포
10.3-1 F 분포 곡선
• F분포에서 F값이 나타내는 확률은
의 곡선식이 나타내는 곡선에 의하여 결정되며 이 곡선이 나타내는 분포가 F-분포이다
10.3 F 분포
10.3-1 F 분포 곡선
• F-분포곡선의 모양은 두 개의 자유도, 즉 분자분산의 자유도 과 분모분 산의 자유도 에 따라 결정되며 비대칭이고 곡선의 정점은 좌측(0쪽)으 로 기울어져 있으나 와 중에 어느 한 자유도나 두 자유도 모두의 값 이 커질 수록 점점 대칭에 가까워진다
• F값의 기대치는 분산은
이므로 F-분포에 있어서는 <=2일 때는 평균이 존재하지 않으며 <=4 일 때는 분산이 없다