• 검색 결과가 없습니다.

 ) log normallinearparaboliclog Y 또는 log (Y+C)포아송paraboliclinear

N/A
N/A
Protected

Academic year: 2022

Share " ) log normallinearparaboliclog Y 또는 log (Y+C)포아송paraboliclinear"

Copied!
18
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

강의 5 – 추리통계를 위한 가설검정: 모수, 비모수 통계 선택 6. 모수-비모수 통계 선택 과정

표본 평균차이 검정 방법

(2)

∙ 모수 검정을 위한 가정

① 종속변수가 양적변수이어야 함 ② 모집단 분포가 정규분포

③ 등분산 가정(equal variance assumption)이 충족되어야 함

error term or residual =

  

이들 가정은 약자로 NID (0, σ2)로 표현: Normally, Independently, Distributed with mean of zero and common variance(σ2)

* 등분산 가정의 검정:

1) Fmax test - max S2/min S2 (Critical value of Fmax와 비교 검정) 2) Spearman's rank correlation - rank correlation between absolute

residuals and predicted values 3) Levene's test - 절대오차값의 ANOVA

4) Bartlett's test (만약 각 treatment마다 sample size가 다를 경우 사 용)

- 등분산 가정의 기각 이유:

1) 집단 간에 본질적으로 이미 큰 차이가 있을 경우.

2) 특정집단이 다른 집단에 비해 적용된 실험에 더 큰 분산을 가질 경우 3) 관측 척도의 부적절한 선택: 이 경우 자료의 변환으로 정정가능

등분산 가정을 충족시키기 위한 자료의 변환 (Data Transformation)

관계

분포 평균(μ) 과 표준편차 (σ) 평균(μ) 과 분산 (σ2) 자료 변환

정규 독립적 독립적 필요없음

이항 semi-circle

p=0 또는 1 일 경우 σ 또는 σ2 =0 그리고 p=1/2일 때

최대

arcsin(

) 또는 arcsin(

 )

log normal linear parabolic log Y 또는 log

(Y+C)

포아송 parabolic linear

 또는



(3)

그래픽 관계 (각 집단의 평균과 residuals (각 집단의 관측치-각 집단의 평 균)의 절대치)

잔차 절대값 Residual(

 

 

)

treatment means

예제) 5 가지 살충제가 사과나무벌레를 제거하는 정도를 살피기 위해 각 살 충제를 5자루의 사과나무에 살포한 후 약 4주 후에 죽은 사과나무 벌레의 수를 측정하였다.

Fmax = S2max/S2min = 3557/71 =50.1

Critical value of Fmax (treatment 수, 각 treatment의 자유도)

Fmax(5,4) = 25.2 < Fmax = 50.1 (등분산가정 기각)

살충제 종류

사과나무 A B C D E

1 24 67 30 117 145

2 27 54 42 77 99

3 38 163 87 70 202

4 44 129 72 161 182

5 28 134 107 212 251

S2 71 2182 1004 3557 3307

S 8 47 32 60 58

평균 32 109 68 127 176

(4)

residual(



 

)과 각 treatment평균 그래프를 이용한 등분산가정 검정 및 적절한 자료의 변환

자료의 로그변환 (log transformation of data)후 등분산 가정의 재검정

Fmax = S2max/S2min = .0525/.0119 = 4.41

Critical value of Fmax (treatment 수, 각 treatment의 자유도)

Fmax(5,4) = 25.2 > Fmax = 4.41 (등분산가정 채택)

살충제 종류

사과나무 A B C D E

1 1.38 1.83 1.48 2.07 2.16

2 1.43 1.73 1.62 1.89 2.00

3 1.58 2.21 1.94 1.85 2.31

4 1.64 2.11 1.86 2.21 2.26

5 1.45 2.13 2.03 2.33 2.40

S2 .0119 .0437 .0525 .0420 .0235

S .109 .209 .229 .205 .153

평균 1.52 2.00 1.79 2.07 2.23

(5)

residual(



 

)과 각 treatment평균 그래프를 이용한 등분산가정 재검정

(아래 표 출처: http://archive.bio.ed.ac.uk/jdeacon/statistics/table8.htm)

(6)

7. 추리통계 가설검정: 평균 비교 및 비모수 통계 적용

* 가설검정의 순서

1. 가설의 설정 (영가설, 대립가설) 2. 유의수준(α)결정

3. 검정에 사용할 통계 분포(Z, t, χ2, F, 등) 4. 표본으로부터 검정 통계치와 probability 계산

1) 실제 분포에 의한 가설검정: Sign, Fisher-Irwin, Wilcoxon ...

∙ 동전놀이를 통한 가설 검정 (binomial distribution)

동전을 10번 던져 나온 결과를 가지고 동전에 대한 판단을 하면, 통계적 가설

H

0 (영가설): P(H) = 1/2 (앞이 나올 확률)

H

A (대립가설): P(H) ≠ 1/2 (P(H)<1/2 and p(H)>1/2) (양방적 검정: two-tailed tests)

기각역과 채택역의 설정 (유의수준으로 결정 보통 0.05 또는 0.01)

만약 기각역을 유의수준을 0.05로 설정하였다면 확률이 0.05 이하로 동전의 앞면이 나온 수가 10, 9, 1, 0 는 기각역이라 한다.

* if P-value (probability) > α (level of significance), 영가설을 수락함 (accept). 그러나 if P-value (probability) ≤ α (level of significance), 영가설을 기각함 (reject).

∙ 부호화 검정 (sign test - nonparametric test)

조사된 결과를 부호화하여 가설을 검정하는 통계적 방법-두 그룹(paired

앞면수 p 확률 (probability)

10 10C10 p10q0 (1×(0.5)10×(0.5)0) = 0.00098 9 10C9 p9q1 (10×(0.5)9×(0.5)1) = 0.00976 8 10C8 p8q2 (45×(0.5)8×(0.5)2) = 0.04394 7 10C7 p7q3 (120×(0.5)7×(0.5)3) = 0.11719 6 10C6 p6q4 (210×(0.5)6×(0.5)4) = 0.20508 5 10C5 p5q5 (252×(0.5)5×(0.5)5) = 0.24609 4 10C4 p10q0 (210×(0.5)4×(0.5)6) = 0.20508 3 10C3 p10q0 (120×(0.5)3×(0.5)7) = 0.11719 2 10C2 p10q0 (45×(0.5)2×(0.5)8) = 0.04394 1 10C1 p10q0 (10×(0.5)1×(0.5)9) = 0.00976 0 10C0 p0q10 (1×(0.5)0×(0.5)10) = 0.00098

(7)

또는 non-paired)의 결과를 비교 분석

예제) 유치원생에게 수의 개념 이해를 위하여 답을 맞추었을 때 사탕을 주 는 방법과 칭찬을 하는 두 방법을 사용한 후, 두 방법의 차이를 알고자 한 다. 동일 유아에게 사탕을 주는 방법과 칭찬을 하는 두 방법을 모두 사용한 후, 테스트를 실시하여 답을 맞춘 문항 수를 비교 그 차이에 따라 기호를 (+)와 (-)로 설정하였다. 이런 부호화 검정을 위한 통계적 가설은 다음과 같다.

H

0 (영가설): P(+) = P(-) = 1/2

H

A (대립가설): P(+) ≠ P(-)≠ 1/2 연구결과

유의수준(0.05)을 결정하여 부호화 검정에 따라 기각과 채택여부 검정.

위의 동전놀이 경우처럼 각 부호가 나올 숫자의 확률을 구하여 확률에 따라 설정한 유의수준에 따른 기각과 채택 여부 결정함.







   (> 0.05)

+ 부호가 5개 나올 확률이 유의수준보다 크기에 유아들의 수 개념 학습에 있어 사탕에 의한 강화와 칭찬에 의한 강화의 차이는 없다고 결론을 내릴 수 있다.

∙ 부호(non-parametric)와 그 차이의 양을 고려하기 위하여는 Wilcoxon matched pairs test를 사용하여 검정. 두그룹의 nonparamatric unparied 부호화 결과는 Mann-Whitney test(또는 Wilcoxon rank-sum test)로 검정. matched 3그룹 이상을 비교할 시에는 Friedman test (unmatched 3그룹은 Kruskal-Wallis test로 검정.

Wilcoxon matched pairs test (SPSS program)

유아 사탕 칭찬 차이 부호

1 13 14 -1 -

2 8 4 +4 +

3 6 8 -2 -

4 13 12 +1 +

5 7 9 -2 -

6 14 10 +4 +

7 8 7 +1 +

8 10 12 -2 -

9 9 7 +2 +

10 10 10 0

(8)

1. Open SPSS prog.→ File → New (or Open) → Data

2. Open Variable View → Type in variable name, type(자료유형: 숫자, 문자 등), measures(자료유형에 따라 선정) * 메뉴의 Help 참조

The Wilcoxon matched pairs compares two matched groups, without assuming that the distribution of the before-after differences follows a Gaussian distribution. Look elsewhere if you want to perform the paired t test.

Beware: Wilcoxon's name is used on two different tests. The test usually called the Mann-Whitney test is also called the Wilcoxon rank-sum test. It compares two groups of unpaired data.

(9)

3. Data view로 이동 → 각 variable의 자료 입력 → 메뉴에서 Analysis에서 Nonparametric Tests → Legacy Dialogs → 2 Related Samples

4. Select Test Pairs → Choose the Wilcoxon → click OK

(10)

5. Pop-up Ootput screen → review the results

6. Polish the graph

A before-after graph shows all the data. This example plots each subject as an arrow to clearly show the direction from 'before' to 'after', but you may prefer to plot just lines, or lines with symbols.

(11)

Avoid using a bar graph, since it can only show the mean and SD of each group, and not the individual changes.

To add the asterisks representing significance level copy from the results table and paste onto the graph. This creates a live link, so if you edit or replace the data, the number of asterisks may change (or change to 'ns'). Use the drawing tool to add the line below the asterisks, then right-click and set the arrow heads to "half tick down'.

Interpreting the P value

The Wilcoxon test is a nonparametric test that compares two paired groups. If the two sums of ranks are very different, the P value will be small.

Checklist

- Pairs independancy (하나의 대상에 대해 두 번이상 측정한 경우는 상호영향!) - P value가 0.05이상으로 클 경우, 이 paired 분석이 타당한지 재검토 필요.

- 정확히 두 그룹간의 비교인지 재확인 (여러그룹에서 두그룹간의 비교를 여러번 시행하지 말것!)

- 일방적 또는 양방적 검정인지 재확인

- 표본이 non-Gaussian 분포로 부터의 인지 확인 (만약 Gaussian분포로부터 올 경우 표 본수가 적을 경우 검정의 정확도의 신뢰도가 낮음) 그리고 만약 분포가 벨 모양이 아닐 경 우 자료변환을 통해 Gaussian분포를 만족한 후 t-test 수행 필요

- 본 통계검정은 두 그룹간의 차이가 중앙값(median)을 중심으로 대칭적으로 분포하는 것 으로 가정하고 실시함.

Mann-Whitney test

1. Open SPSS prog.→ File → New (or Open) → Data (위에 참조)

2. Open Variable View → Type in variable name, value(성별과 같이 명명 자료일 경우 숫자로 전환), type(자료유형: 숫자, 문자 등), measures(자료유형에 따라 선정) * 메뉴의 Help 참조

The Mann-Whitney test is a nonparametric test that compares the distributions of two unmatched groups. Look elsewhere if you want to compare three or more groups with the Kruskal-Wallis test, or perform the parametric unpaired t test.

This test is also called the Wilcoxon rank sum test. Don't confuse it with the Wilcoxon matched pairs test, which is used when the values are paired or the Wilcoxon signed-rank test which compares a median with a hypothetical value.

(12)

3. Data view로 이동 → 각 variable의 자료 입력 → 메뉴에서 Analysis에서 Nonparametric Tests → Legacy Dialogs → 2 Independent Samples

4. Select Test Variable → Grouping Variable and degine groups (group1 = 1, group 2=2) → Choose Mann-Whitney U → click OK

5. Pop-up Ootput screen → review the results

(13)

6. Polish the graph

Graphing notes:

A scatter plot shows every point. If you have more than several hundred points, a scatter plot can become messy, so it makes sense to plot a box-and-whiskers graph instead. We suggest avoiding bar graphs, as they show less information than a scatter plot, yet are no easier to comprehend.

The horizontal lines mark the medians.

To add the asterisks representing significance level copy from the results table and present onto the graph.

Interpreting results: Mann-Whitney test

P value

The Mann-Whitney test, also called the rank sum test, is a nonparametric test that compares two unpaired groups. For the Mann-Whitney test, the smallest number gets a rank of 1. The largest number gets a rank of N, where N is the total number of values in the two groups. Then sums the ranks in each group, and reports the two sums. If the sums of the ranks are very different, the P value will be small.

If the P value is small, you can reject the idea that the difference is due to random sampling, and conclude instead that the populations have different medians.

If the P value is large, the data do not give you any reason to conclude that the overall medians differ. This is not the same as saying that the medians are the same. You just have no compelling evidence that they differ. If you have small samples, the Mann-Whitney test has little power. In fact, if the total sample size is seven or less, the Mann-Whitney test will always give a P value greater than 0.05 no matter how much the groups differ.

If you have large sample sizes and a few ties, no problem. But with small data sets

(14)

Divide your response into a few categories, such as low, medium and high. Then use a chi-square test to compare the two groups.

The Mann-Whitney test doesn't really compare medians

You'll sometimes read that the Mann-Whitney test compares the medians of two groups. But this is not exactly true, as this example demonstrates.

 The graph shows each value obtained from control and treated subjects. The two-tail P value from the Mann-Whitney test is 0.0288, so you conclude that there is a statistically significant difference between the groups. But the two medians, shown by the horizontal lines, are identical. The Mann-Whitney test compared the distributions of ranks, which is quite different in the two groups.

It is not correct, however, to say that the Mann-Whitney test asks whether the two groups come from populations with different distributions. The two groups in the graph below clearly come from different distributions, but the P value from the Mann-Whitney test is high (0.46).

(15)

The Mann-Whitney test compares sums of ranks - it does not compare medians and does not compare distributions. To interpret the test as being a comparison of medians, you have to make an additional assumption - that the distributions of the two populations have the same shape, even if they are shifted (have different medians). With this assumption, if you reject the Mann-Whitney test reports a small P value, you can conclude that the medians are different.

If you want to compare three or more groups, use the Kruskal-Wallis test.

1. Open SPSS prog.→ File → New (or Open) → Data (위에 참조)

2. Open Variable View → Type in variable name, value(성별과 같이 명명 자료일 경우 숫자로 전환), type(자료유형: 숫자, 문자 등), measures(자료유형에 따라 선정) * 메뉴의 Help 참조

3. Data view로 이동 → 각 variable의 자료 입력 → 메뉴에서 Analysis에서 Nonparametric Tests → Legacy Dialogs → K-Independent (paired 일 경우는 Related) Samples

(16)

4. Select Test Variable → Grouping Variable and define groups (minimum = 1, maximum = 5) → Choose Kruskal-Wallis H → click OK

5. Pop-up Ootput screen → review the results

(17)

∙ Irwin-Fisher (또는 Fisher's exact)검정 - 변수들이 이분질적 변수일 때 두집단에서 연구대상이 되는 비율이 같은지를 검정 (예, 기독교인과 비기독교인이 제사에 대하여 찬성하는 비율의 차이 연구)

 ×  빈도표가 사용됨.

예) 성별에 따른 운전면허 획득비율에 차이가 있는지 알아보기 위해 남자 40명 과 여자 20명을 무선추출하여 유의수준 0.05에서 검정.

통계적 영가설과 대립가설은:

  

 

  

≠ 

 



 









 



 

유의수준 0.05에서 양방적 검정 (two-tailed test)이므로 양극단으로부터 누적확률이 .025를 넘지 않는 도수가 기각역이 된다. (표14-5 참조) 그러 므로 위 결과는 영가설을 기각하지 못하여 운전면호 획득비율은 성별에 따 라 유의한 차이가 없다고 결론내릴 수 있다.

성별

남 여 total

운전면허

획득 8 (A) 2 (B) 10

미획득 32 (C) 18 (D) 50

40 20 60 (N)

(18)

* 참조:

http://vassarstats.net/ 에서 Frequency data에서 2x2 Table of

cross-categorized frequency data Version 1 으로 자동 계산 가능!

참조

관련 문서

We exhibit an example that the scaling property of Hausdorff measure on R ∞ does

The advantages of our approach is that (1) the efficiency does not plateau for a large number of threads; we compare our approach to the current state-of-the-art

A smaller value of the starting relaxation order ω = ω max given by (17) for the sparse PSDP formulation (7) than the sparse POP formulation (3), as shown in Section 4, does

“Demonstration Test Weld” following that SWPS before using it in production welding; the objective of this demonstration weld is to show that the manufacturer has the ability

The empirical results do not support the PIH/LCH which consumption does not respond to anticipated income changes, so the presence of excess sensitivity of

In conclusion, the ‘zì( 自 )+X’ structure of Modern Chinese does not reveal clear morphological and structural criteria that classify parts of speech. However,

It does not increase the power of the amplifier and, if it is found necessary to have the volume control set to a position which is considered to be high, before the desired

Merely because the market fails to meet somone's hypothetical idealized conditions for economic efficiency, it does not follow that government intervention