www.withview.com
위드뷰는 함께 보는 열린 학습공간입니다.
이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.
[제 9 장] 내용분석 및 기술통계
학습과정− 내용분석의 종류
− 내용분석의 단계
− 기술통계
− 분석기법의 종류
− 통계분석
(1) 내용분석의 종류
− 질적분석의 의미 : 주제의 성격에 따라 양적으로 분석할 수 없는 내용의 분석, 비모수통계
− 양적분석의 의미 : 양적분석의 초기형태로 언어나 주제의 발생빈도, 지면의 단위나 길이, 방송시간 등 양적으로 알 수 있게 하는 분석방법, 모수통계
(2) 분석내용의 단계 1. 모집단과 표본
− 통계의 주목적은 모집단의 성격을 파악하는 것, 여기에는 전수조사와 표본조사가 있음
− 모집단 : 평균µ, 분산σ2
− 표본 : 평균X, 분산S
2. 자료의 형태
− 비수치적 질적자료 : 단지 어떤 범주에 속하는지를 구분해 주는 자료
− 양적자료 : 수치 척도에 의해 측정된 자료
(3) 기술통계
− 기술통계 : 자료분포의 모양과 형태를 파악하는데 주안점 1. 중심위치의 척도
− 자료들을 대표할 수 있는 대표값으로 자료분포의 중심점을 나타내며 평균, 중위수, 최빈수 등 i. 평균 : 산술평균, 기하평균, 조화평균, 가중평균, 중앙평균, 추리통계의 가장 큰 관심사가 표본의
평균, 분산, 비율을 측정에 모집단의 평균, 분산, 비율을 추정하는 것
ii. 중위수(중앙값) : 위치적인 대표값으로 자료를 크기순서대로 나열했을 때 중앙에 위치하는 값 iii. 최빈수(최빈값) : 자료의 분포에서 가장 많은 빈도를 갖는 관찰 값, 주로 질적자료분석에 활용
− 좌로 치우친 분포 : 최빈값 > 중앙값 > 평균
− 우로 치우친 분포 : 평균 < 중앙값 < 최빈값 2. 산포의 척도
− 평균은 같다고 해도 분포의 형태가 다를 경우 발생
− 분포란 집단내 값들이 중앙에서 얼마나 멀리 떨어져 있는가를 나타내는 형상
i. 범위 : 자료의 최대값과 최소값의 범위, 자료분포의 폭 파악, 자료의 밀집정도는 파악이 불가
www.withview.com
위드뷰는 함께 보는 열린 학습공간입니다.
이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.
ii. 사분위간 범위 : 최대와 최소의 일정부분을 제외한 나머지로 범위산정, 이를 산포의 척도로 iii. 표준편차 : 각각의 관찰치와 표본평균과의 차이, 편차의 합은 항상 0 이 되어야
iv. 분산 : 편차들의 제곱합
v. 절대평방오차 : 표본평균에서 각 관찰치의 편차를 절대값으로 표기
vi. 왜도 : 자료가 좌우로 치우친 정도를 나타내는 척도로서 -3 에서 +3 의 값을 가짐 vii. 첨도 : 분포가 중심근처에서 퍼져있는 정도를 측정, 표준편차가 작을수록 높아짐 viii. 변동계수 : 변동계수가 클수록 자료의 분포는 평균에서 넓게 분포
− 신뢰구간
i. 1
σ
= 평균 ± 1σ
= 68.26%ii. 2
σ
= 평균 ± 2σ
= 95.44%iii. 3
σ
= 평균 ± 3σ
= 99.74%− 표준편차와 표준오차
i. 표준편차 : 표본평균과 표본들과의 차이, 작을수록 표본값들이 표본평균에 밀집되어 있음 ii. 표준오차 : 모평균과 표본평균과의 차이, 즉 표본이 모집단으로부터 얼마나 차이가 나는가의
수치, 작을수록 표본의 대표성 높음
(4) 분석기법의 분류 1. 단일변량분석
− 분석에 이용되는 변수가 하나인 경우의 분석
− 정규분포, t 분포, 카이제곱분포 등 특정한 성격을 이용해 표본집단을 분석 또는 비모수통계기법 등 2. 다변량분석
− 분석에 사용되는 변수가 2 개 이상인 경우
− 변수간 상호관계추정에 활용 3. 변수의 수
− 단일변량분석 : Z 검정, T 검정
− 다변량분석 : 분산, 회귀, 상관, 판별, 요인, 군집 등 4. 분석의 성격
− 종속관계분석 : 독립변수와 종속변수간 종속관계를 분석, 분산, 회귀, 판별, 결합, 로짓분석 등
− 상호관계분석 : 변수간 상호 이질성이나 동질성을 분석, 요인, 군집, 다차원척도법 등
− 구조분석 : 특정현상을 구성하는 각 이론단위간의 종속 및 상호관계를 포괄적으로 파악하는 분석 5. 척도의 종류
− 모수통계분석 : 등간이나 비율척도로 측정된 자료분석
− 비모수통계분석 : 명목이나 서열척도로 측정된 자료분석 6. 집단의 수
− T 검정 : 두집단의 평균차이분석
− F 검정 : 세집단 상의 집단간 평균차이분석 7. 평균의 독립성
www.withview.com
위드뷰는 함께 보는 열린 학습공간입니다.
이 문서의 전체 또는 일부는 원저작권자와 위드뷰의 허가 없이 복제, 배포, 인용, 전제, 전시 및 공공열 람의 대상이 될 수 없으며 이를 위반하는 행위는 법에 의해 금지됩니다.
− 각 표본집단 중 하나의 표본이 다른 표본집단으로부터 추출되었을 경우 Æ 독립성 결여
− 각 표본집단이 상호 독립적으로 추출되었을 경우
(5) 통계분석 1. 교차분석
− 범주형 자료(명목척도)의 분석방법으로 카이제곱분석
− 교차분석은 통계적으로 기대되는 비율/빈도와 실제비율/빈도와의 차이를 분석하는 기법
− 예) 가족수에 따라서 냉장고 크기의 차이가 있는가 등
− 적합도 검정 : 가정과 실제가 맞는지 검정, 즉 기대빈도와 관측빈도의 일치정도를 의미
− 독립성 검정 : 두변수간 기대도수와 관찰도수가 일치하는지 등의 분석, 기타 강의 참조 2. T-test
− 집단간 평균차이검정에 주로 활용
− 단일표본 T 검정 : 하나의 집단에 대한 추론, 예) 새우깡 한봉지의 무게가 예전과 차이 나는지
− 독립표본 T 검정 : 두 집단이 서로 독립일때 사용, 예) 대졸남자와 대졸여자의 봉급차이
− 대응표본 T 검정 : 두 집단이 짝을 이룰 때, 예) 식품복용 전과 식품복용 후의 차이 분석
독립변수 종속변수 통계기법
단일변량 명목,서열 명목,서열 등간,비율 등간,비율
명목,서열 등간,비율 등간,비율 명목,서열
카이제곱,빈도분석
T-test, 분산분석, 더미회귀분석 상관분석, 회귀분석
로짓모형, 프로빗모형 등간,비율
등간,비율
등간,비율 명목,서열
다변량 회귀분석 로지스틱분석, 판별분석 다변량
구분 없는 경우 요인, 주성분, 군집