사용자경험 리서치 매뉴얼 사용자경험 리서치 매뉴얼
( 김승인 , 안지현 저 , 2018.1. 지앤선 ) 4 장 . 예제를 통해 배우는 통계 분석
숙명여자대학교 임순범
1. 가설검정
가설검정 (hypothesis testing)
상반되는 가설 중에서 표본 데이터가 어느 쪽에 더 부합하는지 결정하는 것
귀무가설 (null hypothesis) H0 : 기각하고 싶은 기존 가설
대립가설 (alternative hypothesis) H1 : 주장하고 싶은 새로운 이론
예
항공예약 모바일 앱 , A 사와 신규 B 사 비교
귀무가설 (A 사 앱과 B사 앱의 만족도 차이는 없다 ), 대립가설 ( 차이가 있다 )
A사 골프공 평균 비거리 295 야드 되어야 함
귀무가설 (A 사 골프공 비거리 모평균은 295 이다 ), 대립가설 ( 모평균 비거리가 295 가 아니다 )
A약은 그동안 고혈압 치료제 , 신규 B 약은 더 효과 있는지 비교
귀무가설 (A 약과 B 약의 고혈압 치료 효과에 차이는 없다 ), 대립가설 ( 차이가 있다 )
가설 검정의 단계
귀무가설 ( 대립가설 ), 유의수준 결정
가설검정
유의수준 (level of significance)
어느정도 발생해야 의미가 있는지의 기준
검정통계량이 귀무가설 하에 나올 가능성이 5% 이하일 때 기각
검정통계량 (test statistics)
Z-통계량 , t- 통계량 , F- 통계량
유의확률 (p-value, significance probability)
귀무가설을 지지하는 정도를 확률로 표현
p-값이 유의수준 보다 작으면 귀무가설 기각
(검정통계량과 p- 값은 반비례 )
자유도 (degree of freedom, df)
n-1 ( 표본수 – 1)
N 개 데이터에서 자신을 제외한 나머지는 편차가 있다 .( 변할 수 있다 )
2. 엑셀 데이터 분석 도구의 활용
기술통계
순위와 백분위
히스토그램
분산에 대한 두집단 F- 검정
t-검정
쌍체비교 , 모집단 분산이 동일한 경우 , 모집단 분산이 다른 경우
분산분석 (ANOVA)
일원배치 , 반복 없는 이원배치 , 반복있는 이원배치
공분산분석
상관분석
회귀분석
2.1 기술통계 (descriptive statistics)
데이터의 중심에 대한 정보 ,
평균 (mean), 중앙값 (median), 최빈값 (mode)
변동성에 대한 정보
표준오차 (standard error), 표준편차 (standard deviation), 분산 (variance)
첨도 (kurtosis), 왜도 (skewness)
범위 (range), 최대값 , 최소값
데이터 전반적인 정보
합 , 관측수 , 신뢰구간 (confidence interval, 95%)
2.2 순위와 백분위 2.3 히스토그램
계급 범위 내의 데이터 빈도수 및 누적 비율 , 그래프 제공
2.4 분산에 대한 두 집단 F- 검정
목적
독립적인 두 집단에 대해 분산의 동질성 파악
t-검정을 하기 위한 사전 검정
귀무가설 채택시 등분산 t- 검정 , 귀무가설 기각시 이분산 t- 검정 실시
귀무가설
두 집단의 모분산은 동일하다 (H0: σ12=σ22)
F- 통계량
F = S12 / S22
유의확률 p- 값
유의확률 (p-값 ) 이 0.05 이하이면 귀무가설 기각
(예 , p147)
2.5 t- 검정
목적 : 모집단의 평균을 비교
대응표본 t- 검정 : 예 , 동일한 사용자 그룹에게 두 방법 / 제품을 비교
쌍체비교 : 동일한 모집단에서 데이터 추출 (p.182 예제 2)
독립표본 t- 검정 : 예 , 각기 다른 사용자 그룹에 두 방법 / 제품을 비교
독립적인 두 표본에 대해 모집단 분산의 동일 여부 F- 검정
=> 등분산 t- 검정 , 이분산 t- 검정 (p.187 예제 3)
귀무가설
두 집단의 모평균은 동일하다 (H0: μ1=μ2)
t- 통계량
쌍체비교 , 등분산 , 이분산 경우에 따라 t- 통계량이 다르다 .
유의확률 p- 값
유의확률 (p-값 ) 이 0.05 이하이면 귀무가설 기각 ( 예 , p152)
쌍체 비교 (p.182)
동일한 모집단
쌍체측정 (paired data)
등분산
동일한 모집단
별도측정
이분산 (p.187)
상이한 모집단
2.6 분산분석 (ANOVA)
목적 : 세 개 이상의 모집단의 평균이 동일한지 검정
일원배치법 (one-factor) : 변동요인이 하나인 경우 (p.192, 예제 4)
반복없는 이원배치 (two-factor) : 변동요인이 두개인 경우 (p.196, 예제 5)
반복있는 이원배치 (two-factor) : 변동요인이 두개인 경우 (p.200, 예제 6)
귀무가설
일원배치 : 변동요인에 대한 모평균은 동일하다 (H0: μ1=μ2=μ3)
F- 통계량
p.157~p.159
유의확률 p- 값
유의확률 (p-값 ) 이 0.05 이하이면 귀무가설 기각 ( 예 , p154,155,157)
일원배치 (one-factor)
예 ) 출시될 제품의 연령대별 선호도
귀무가설 (H0: μ1=μ2=μ3)
2.7 공분산분석
2.8 상관분석 (Correlation Analysis) 2.9 회귀분석
2.10 기타
Z- 검정 : 분산이 알려진 평균에 대한 검정
표본수가 30 이상일 때 z- 검정