• 검색 결과가 없습니다.

. 빈도분석 :

N/A
N/A
Protected

Academic year: 2022

Share ". 빈도분석 : "

Copied!
17
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

강의 12 – 빈도분석

12

. 빈도분석 :

(chi-square)분포에 의한 검정

∙ 카이제곱 분포 (  distribution) - 자유도의 형태에 이해 규명되는 가 족분포 (family distribution)의 한 종류로 자유도 가 무한대로 증가하면 정규분포의 형태를 나타내 며, 일반적으로 정적편포 (positively skewed distribution)의 형태임.

∙  분포 - Z분포의 표준점수를 제곱하여 만들어진 분포 

  

  

  



 

  



 

∵    

 

 

   

  



  

 

  

자유도 (df) = n-1

* 주의: 이항분포의 검정에서 만약 p 확률이 추출된 자료로부터 계 산되지 않았을 때 (예, 동전의 경우 p=0.5)는 ν(degree of freedom)= # of class -1, 만약 얻어진 자료로부터 p값을 계산하 여 얻었을 경우는 ν(degree of freedom)= # of class -2를 사 용. (강의 4 내용 참조)

∙  분포를 사용한 검정의 가정과 목적 기본가정:

1. 종속변수가 명명변수에 의한 질적변수이거나 최소한 연속변수를 어떤 목적 하에 비연속변수로 전환한 범주변수(categorical variable) 이어야 함 (예: 성별, 인종, 자동차 유형).

2. 획득도수(obtained frequecy)와 기대도수(expected frequency)가

(2)

5보다 작은 경우가 전체의 20% 이하 -- 그룹핑 3. 각 사례가 상호 독립적

A. 두집단 동질성(homogeneity) 연구

J수의 집단과 I수의 응답 범주의 경우 자유도는 (I-1)×(J-1)

SPSS 프로그램을 이용한 교재 산아제한 남녀찬반의 결과의  검정 (교재 p436)

1) 자료입력(SPSS)

남 여

찬성 230 420

반대 270 180

(3)

2) 메뉴선택

Analyze - Descriptive Statistics - Crosstabs - 선택 Column(gender), Row(agree) - statistics - 'chi-square' 그리고 cell 클릭하여- 관측빈도 (observed) 또는 기대빈도(expected)와 다른 옵 션 선택

(4)

3) output 결과

(5)

B. 다집단 동질성 연구

집단이 세 집단 이상이며, 응답범주 혹은 분류범주가 세 개 이상일 경우 에 집단 간의 비교 검정.

예)‘전공에 따라 청소년범죄 해소방안에 관한 견해차의 연구’

 





  





 

    

 

이 진이 아니다

응 답 범 주 (I)

전공(J)

응답 전공 사회학 교육학 정치학 행정학 계 

처벌규정 강화     

경찰 및 선도요원 증가 청소년 교육프로그램 개발

입시제도 개선    

계          

(6)

예제) 전공에 따른 청소년범죄 해소방안에 대한 응답 결과

 

  

   

  

   

  

 

         

>   이므로 영가설은 기각된다.

결론: 전공에 따라 청소년 범죄 해소방안에 대해 다른 견해를 가지고 있다.

• 웹사이트 활용(http://vassarstats.net/)

→ Frequency data → For Chi-Squre, Cramer’s V, and Lambda for

응 답 범 주 (I)

전공(J)

응답 전공 사회학 교육학 정치학 행정학 계 

처벌규정 강화 6 (24) 7 (30) 25 (20) 62 (26) 100

경찰 및 선도요원 증가 14

(50.4) 43

(63) 80 (42) 73

(54.6) 210 청소년 교육프로그램 개발 120

(76.8) 110

(96) 45 (64) 45

(83.2) 320

입시제도 개선 100

(88.8) 140

(111) 50 (74) 80

(96.2) 370

계  240 300 200 260 1000

검정 절차 1.

    설정

2. 각경우의 획득도수  얻음 3. 각경우의 기대도수

 계산

  

·× ·

4. Karl Pearson에 의한  통계값을 계산 

  

  







5. 분포에서 유의수준과 자유도(  

 

  )에 의한  값으 로 채택역과 기각역 확인.

6.  통계값이   보다 크면 영가설 기각.

(7)

a Rows by columns contingency table

∙ 상관성 연구

- 한 모집단으로부터 추출된 표본의 두 변수에 대한 검정을 통한 상관 성 연구 (앞서 언급된 여러집단을 비교하기 위한 여러 모집단의 동질 성 비교연구와는 다름)

A. 2×2 분할표에 의한 상관연구: ø(phi)계수 검정

기술통계의 상관에서 ø(phi)계수는 두 변수가 이분변수(dichotomous variable)일 때 두 변수간의 상관계수를 나타내는 지수.

상관성 연구를 위한 전제조건: 산아제한에 대한 남녀찬반비율의 자료로 성별과 산아제한에 대한 찬반의 상관연구를 한다면, 성인의 모집단에서 하나의 표본(성별 구분없이)을 추출한 후 (성별 및 찬반에 대한) 분석한 결과로 상관관계 검정.

(8)

예제) 서울에 거주하는 30세 성인 집단에서 100명의 표본을 추출하여 토지공개념에 대한 찬, 반을 묻고 성별과 토지공개념사이의 상관관계 분 석

서술적 가설;

H

0 : 성별과 토지공개념에 대한 응답과는 관계가 없다.

H

A : 성별과 토지공개념에 대한 응답과는 관계가 있다.

통계적 가설;

H

0 : ø = 0

H

A : ø ≠ 0

 

  총사례수

 

  

   

  

 

 



   (상관도가 매우 낮음)

ø계수는 에서 계산되므로 그 기각값도  통계값으로 검정.

(0.073)

<           

이므로 영가설 채택!

결론은 성별과 토지공개념에 대한 견해와는 관계가 없다’

성별

남 여 total

응답

찬성 40 (40.56) 38 (37.44) 78 반대 12 (11.44) 10 (10.56) 22

52 48 100

(n)

(9)

• 웹사이트 활용(http://vassarstats.net/)

→ Frequency data → For 2 x 2 table of cross-categorized Frequency data (Version 1)

B. I×J 분할표에 의한 상관연구: Cramer의 V

두질적변수의 범주 혹은 수준이 3개 이상 되는 경우 일 때의 상관관 계를 검정하기 위하여 Cramer가 상관정도를 측정하는 계수 V를 제안 함.

V를 Cramer의 상관추정치 혹은 mean square contingency coefficient라 부름.

예제) 인종과 머리색사이의 관계를 알아보기 위해 국제대학 교양학부 한국역사를 수강하는 300명의 인종과 머리색에 따라 분류함.

인종

머리색 황 백 흑 계

(10)

서술적 가설;

H

0 : 인종과 머리색에는 관계가 없다.

H

A : 인종과 머리색에는 관계가 있다.

통계적 가설;

H

0 : V = 0

H

A : V ≠ 0







 

m은 (I-1)과 (J-1)중 작은 수이며 n은 총사례수이다.

V 계수 역시 에서 계산되므로 그 기각값도  통계값으로 검정.

(125.339) >      

    

이므로 영가설 채택!

결론은 유의수준 0.05에서 ‘인종과 머리색 사이에는 상관성이 있다.’

라고 할 수 있다.

검정 50 (35) 5 (42) 50 (28) 105

금발 17 (29) 65 (34.8) 5 (23.2) 87

검은 갈색 30 (21.67) 20 (26) 15 (17.33) 65 회색 3 (14.33) 30 (17.2) 10 (11.47) 43

total 100 120 80 300

(11)

• 웹사이트 활용(http://vassarstats.net/)

→ Frequency data → Chi-square, Cramer’s V

(12)

※ 범주가 5개 이상일 경우 다른 웹 사이트 활용 → http://www.quantpsy.org/chisq/chisq.htm

∙  검정시 주의점

1) 분할표 (contingency table)에 떨어진 도수는 각각 독립적이어야 함.

예- 동일대상에 대한 반복 측정 금물

2) 획득빈도가 0 또는 1이 많은 경우 문제가 됨.

3) 기대도수가 5보다 작은 경우가 전체의 20% 미만이 되지 않아야 함.

(13)

예제 1) 해양생물학자가 동해안의 어느 암반 조간대 상하부에서 따개비의 분포 차이를 파악하기 위해 방형구를 이용하여 따개비의 출현빈도를 암반 상부와 하부지역에서 아래와 같이 관측하였다.

(카이제곱 동일비 적합도 검정)

영가설: 조간대 상부와 하부지역의 따개비 출현빈도는 차이가 없다.

대립가설: 조간대 상부와 하부지역의 따개비 출현빈도는 차이가 있다.

• 웹사이트 활용(http://vassarstats.net/)

→ Frequency data → Chi-square “Goodness of fit” test

* Yate’s correction

범주(서식장소)

합계

조간대 상부 조간대 하부

130 32 162

(14)

결과:

(58.08) >          

- 영가설을 기각함.

해석:

1안) 조간대 상부와 하부지역의 따개비 출현빈도에는 유의한 차이가 있다 ( =58.08, ν=1, P < 0.001).

2안) 따개비의 출현빈도는 조간대 상부가 하부지역보다 유의하게 더 많았다 ( =58.08, ν=1, P < 0.001).

예제 2) 청주호에 서식하는 어류를 채집하였는데 총 4종의 어류가 관찰되었 다. 각 종의 출현 개체수(출현빈도)는 붕어 22마리, 베스 30마리, 쏘가리 10마리, 누치 8마리였다. 출현종 들의 개체수(관측빈도)는 동일한가?

서술적 가설;

H

0 : 청주호에 출현하는 어류 4종의 출현 개체수에는 차이가 없다.

H

A : 청주호에 출현하는 어류 4종의 출현 개체수에는 차이가 있다.

결과:

(18.46) >          

(15)

- 영가설을 기각함.

해석: 청주호에 출현하는 어류 4종의 출현빈도는 유의한 차이가 있으며 베 스가 다른종에 비해 더 많이 관찰되었다( =18.46, ν=3, P < 0.001).

예제 3) 식물유전학자가 자주색 꽃을 가진 식물과 붉은색 꽃을 가진 식물의 교배실험을 100번 수행하여 표현형으로 자주색 꽃 식물 84개, 붉은색 꽃 식 물 16개를 얻었다. 이들 식물의 교배에 따른 꽃 색깔의 분리비가 3:1 로 알 려져 있는데 이번 실험이 이러한 분리비를 따르는지를 검정하고자 한다 (Goodness of fit - 분리비 적합도 검정).

영가설: 자주색과 붉은색 꽃을 가진 식물의 교배실험결과는 분리비를 따른다 (또는 관측빈도와 기대빈도사이에 차이가 없다).

대립가설: 자주색과 붉은색 꽃을 가진 식물의 교배실험결과는 분리비를 따르 지 않는다(또는 관측빈도와 기대빈도사이에 차이가 있다).

범주(꽃색깔)

자주색 붉은색 합계

관측빈도 84 16 100

기대빈도(분리비) 75(100x3/4) 25(100x1/4)

(16)

결과:

(3.85) >          

- 영가설을 기각함.

해석: 자주색과 붉은색 꽃을 가진 식물의 교배실험결과 관측빈도는 3:1의 분 리비를 따르지 않는다( =3.84, ν=1, P < 0.05).

(17)

Homework-12 (성명: )

문제 1) 완두콩의 모양과 같은 형질이 어떻게 유전되는지 알아보기 위해 110개의 완두콩 씨를 모양과 색의 형질에 따라 4가지로 분류하여 빈도를 관측하였다. 이러한 관측치가 알려진 유전적 분리비(9:3:3:1)를 따르는지 검 정 결과를 제시하고 이런 결과에 대해 해석하시오(통계 웹 사이트 검정 결 과 제시).

문제 2) 해양생물 연구자가 퇴적물 형태와 저서생물의 종 분포와 어떤 관계 가 있는지 살펴보기 위해 1 m2의 방형구를 이용하여 2개의 다른 퇴적물 형 태(모래갯벌, 펄갯벌)에서 2종의 저서생물(단각류, 갯지렁이)의 출현빈도를 조사하였다. 이러한 조사결과를 가지고 퇴적물 형태와 저서생물 간의 연관성 을 통계적 방법으로 검정하고 결과에 대해 해석하시오(통계 웹 사이트 검정 결과 제시).

분류(모양과 색깔) 둥글고 합계

노란색 둥글고

푸른색 주름지고

노란색 주름지고

푸른색

관측빈도 31 26 27 26 110

출현종

퇴적물 유형

모래갯벌 펄갯벌

단각류 14 6

갯지렁이 22 46

참조

관련 문서