제 4장 연구대상의 표집
[ 제 1부 교육연구의 원리 ]
들어가며
* 표집이 필요한 이유:
- 연구자들은 자신의 연구대상이 되는 모든 사례들을 다 조사하는 경우가 드물다.
- 전체 모집단 중에서 일부분에 해당되는 표본을 선택해서 그 표본 집단을 대상으로 연구를 진행해야 한다.
- 비록 모집단을 연구 대상으로 하지 않더라도 체계적이고 과학적인 표본연구를 통해서 모집단을 대상으로 연구결과를 얻은 것과 유사한 결과를 얻을 수 있다.
목 차
1. 표집의 의미와 표집방법 2. 표집 시 유의사항
3. 표본의 크기
4. 표집오류
표본의 의미와 표집방법
모집단(전집)
(population)
표본
(sample)
표집
(sampling)
• 포집을 추출하는 행위
• 연구자의 궁극적인 관심 은 표집을 통하여 산출한 결과를 전체 모집단에 걸쳐 일반화하는 것
(예, 조사연구, 실험연구)
• 연구의 관심이 되는 목적집단
• 연구의 대상이 되는 전체집단
• 실제 연구대상이 된 부분집합
• 전집의 특성을 대표할 수 있는 집단
표본의 의미와 표집방법
확률적 표집
집단의 각 사례가 표본으로 추출될 기회가 동등하게 기회가 부여되는 표집 방법
단순무선표집(simple random sampling) 유층표집(stratified sampling)
군집표집(cluster sampling
)
다단계 표집(multistage sampling)
체계적 표집(systematic sampling)
비확률적 표집
집단의 각 사례가 표본으로 추출될 기회가 동등하게 기회가 부여되지 않는 표집 방법
의도적 표집 (purposive sampling)
할당표집(quota sampling)
우연적 표집 (accidental sampling)
표본의 의미와 표집방법
1. 단순무선표집(simple random sampling)
정 의 • 아무런 의식적인 조작 없이 표본을 추출하는 것
조 건
• 모집단에서 개개 요소 모두 동등한 독립된 기회를 가진 절차에 의해 표본의 구성원으로 선택
• 각 표본들의 요소는 상호 “독립적”이어야 함 필요조건 ① 모집단의 사례가 충분히 커야 함
② 표집을 하는 동안에 모집단의 자체에 변동이 없어야 함 - • 난수표 사용, 제비뽑기 등
장 점 • 모집단에 대해 최소한 정보만 알고 있어도 됨
• 자료분석이나 오차계산이 용이
단 점 • 연구자가 이전에 알고 있던 지식이 활용되지 않음
• 같은 표본 크기일 때 유층표집보다 큰 오차가 생길 수 있음
1) 확률적 표집방법
표본의 의미와 표집방법
1) 확률적 표집방법
2. 유층표집(stratified sampling) = 층화표집
정 의
• 전집이 특정 하위집단으로 분류될 수 있을 경우 전집 내 하위집단 구성비율에 맞추어 표본을 표집, 표본과 모집단 의 동질성을 확보하고 표본의 대표성을 높이는 방법
- • 비례유층표집, 비비례유층표집
장 점 • 표본의 크기를 줄일 수 있음
• 표본과 모집단의 동질성 확보로 대표성을 높일 수 있음 단 점 • 우선적으로 모집단의 특성을 알고 있어야 함
표본의 의미와 표집방법
1) 확률적 표집방법
3. 군집표집(cluster sampling)
정 의 • 이미 형성되어 있는 집단을 표집단위로 하여 추출하는 방법
조 건
① 표집의 단위가 개인이 아니라
자연적, 또는 행정적 집단을 표집 단위로 봄
② 전집을 집단단위로 나누고 몇 개 집단을 무선으로 선정하여 그 집단 구성원 모두를 표본으로 선정
장 점 • 군집 속에서 조사대상자를 선정함으로써 조사과정이 간편
• 노력과 비용이 절감
단 점 • 단순 무선보다는 오차가 큼
• 표집오차가 크게 나타남
보완점 • 단수무선표집보다 최소한 2배 이상의 표본을 선정이 바람직함.
표본의 의미와 표집방법
1) 확률적 표집방법
4. 다단계표집(multistage sampling)
정 의
• 최종 단위를 위하여 몇 단계를 거쳐서 표집하는 방법
• 표집의 단계를 몇 번 거치느냐에 따라 2단계, 3단계 표집으로 불림
장 점 • 표집 단위가 지리적을 규정되면 시간과 경비를 줄일 수 있음
단 점 • 표본의 크기가 동일 할 때 표준오차가 크게 나타나기 쉬움
• 표집 단위의 수가 감소됨에 따라 표집오차가 증가
표본의 의미와 표집방법
1) 확률적 표집방법
5. 체계적표집(systematic sampling)
정 의 • 모집단의 전체 사례에 번호를 붙여놓고 일정한 표집 간격으로 표집하는 방법
장 점
• 짧은 시간 내에 효과적으로 표집을 해낼 수 있음
• 표본이 매우 크고,
모집단의 전체 명단을 이용할 수 있을 때 장점을 가짐
단 점 • 만약 지정되는 번호가 특정 기준으로 일정한 간격을 두고 반복되면, 편중된 사례만이 표본으로 추출될 가능성이 있음
표본의 의미와 표집방법
1) 비확률적 표집방법
1. 의도적표집(purposive sampling)
정 의 • 연구자가 연구의 목적에 따라 주관적인 판단(경험, 전문적 식견)하에 대표한다고 생각하는 사례를 임의로 표집하는 방법
장 점 • 표집이 간편
• 비용절약가능
단 점 • 연구자의 주관적 판단이 잘못되었을 때, 발생하는 오류 수정 불가능
의도적 표집이란?
① 연구자가 모집단의 충분한 사전지식과 신뢰할 만한 판단을 내릴 수 있을 때
② 확률적 표집이 불가능할 때 사용
표본의 의미와 표집방법
1) 비확률적 표집방법
2. 할당표집(quota sampling)
정 의
• 전집의 여러특성(성별, 종교, 지역 등)을 대표할 수 있는 여러 개의 하위집단을 구성하여 각 집단에 알맞은 표집수를 할당한 후 그 범위내에서 임의로 표집하는 방법
장 점
• 비용절약가능
(최종 표집단위를 각 조사자들에게 지리적으로 가깝게 함)
• 어느 정도 유층화 기대
단 점 • 할당하는 데 연구자의 편견개입가능
• 비확률적 표집이기 때문에 대표성에 문제
표본의 의미와 표집방법
1) 비확률적 표집방법
3. 우연적 표집(accidental sampling)
정 의 • 특별한 표집 계획 없이 연구자가 가장 손쉽게 구할 수 있는 대상들 중에서 표집 하는 방법
(예) • 길거리 인터뷰, 근무하는 하는 학생을 대상으로 표집
한 계
• 표집의 대표성을 전혀 생각할 수 없는 표집 방법으로
어떤 모집단을 대표한다고 할 수 없어, 결과를 일반화하기 어려움
과학적인 연구에서는 되도록 사용하지 않는 것이 바람직함
실험
* 표집오차
: 모집단의 모수치와 표본에서 산출된 통계치 간의 차이
- 모집단의 특성을 충분히 반영하는 대표성 있는 표집을 선택하지 못했을 때 발생하며,
표집오차가 커질수록 연구 결과의 의미가 상실된다.
표집 시 유의사항
실험
* 표집 시 일반적으로 유의해야 할 사항
1) 모집단의 크기: 표집이 충분히 커야 한다.
2) 표집은 모집단과 충분한 동질성이 있어야 한다.
3) 표집 방법의 특성에 대한 이해
: 표집 방법의 장단점을 충분히 숙지하고 있어야 한다.
4) 현실적 문제 고려
: 인력, 비용, 시간 등을 고려해야 한다.
5) 표집 방법의 일관성 6) 표본의 대표성
: 고의적인 표집은 지양해야 한다.
7) 자료 분석 시 사용할 분석 유목의 수
: 분석 유목의 숫자가 많을 수록 표본의 수도 많아야 한다.
표집 시 유의사항
“ 표본의 크기를 어느 정도로 하는가” 실험
>> 연구 결과의 신뢰성과 직접적인 관계가 있음.
* Gall 등(1999)에 의한 기준 *
- 상관연구: 최소 30명 이상
- 비교-실험연구: 각 집단마다 최소 15명 이상
- 조사연구: 하위그룹별로 20-50명씩 최소 100명 이상
표본의 크기
실험
1) 표집분포와 표준오차
※ (평균의) 표준오차
- 전집에서의 표준편차
- 어느 한 표집에서 구한 표준편차 - 평균치들의 분포에서 구한 표준편차
* 통계치의 표집분포에서 그 값들의 표준편차를 계산하여 얻음
* 표집에서 얻은 통계치를 얼마나 신뢰할 수 있는가의 정도를 의미
* 사례 수의 크기에 따라 결정되며, 사례 수가 증가할수록 값이 감소
* 실제, 모집단의 표준편차를 아는 경우가 거의 없기 때문에 표본의 표준편차로서 모집단의 표준편차를 추정함
표본의 크기
실험
2) 표본의 크기
표본의 크기를 결정하는 통계적인 방법
- 표집의 크기, 신뢰한계, 수용오차의 관계를 고려하여 사례 수를 정하는 것
ex) 부산에 거주하는 초등학교 교사들의 평균 나이를 알고자 할 때 필요한 표본의 크기를 생각해보자.
첫째, 최대허용오차(최대한으로 허용할 수 있는 표본평균과 모집단 평균의 차이)를 결정 >> 1.0으로 가정
둘째, 신뢰한계(통계치를 가지고 전집치를 추정할 때, 그 추정이 어느 정도 맞을 것인가를 나타내는 확률)를 결정 >> 95%로 가정
셋째, 신뢰수준에 따른 Z값을 결정 >> 95% 신뢰수준에서는 1.96
넷째, 모집단의 표준오차를 추정(흔히, 표본의 최대값과 최소값의 차이를 6으로 나누어 추정하는 방법이 있음) >> 사전 조사 결과, 61세-26세로 6
다섯째, 계산식을 이용하여 표본의 크기를 결정 >> 약 137명
표본의 크기
실험
3) 일반적 지침
- 모집단 크기가 커질수록 모집단과 표본의 비율은 작아진다.
모집단의 크기가 비교적 작을 경우
10% 정도와 모집단이 대단히 클 경우의 10%는 엄청난 차이가 남
- 모집단 크기가 N=100 이하가 될 경우 모집단 전체를 대상을 조사한다.
- 모딥단 크기가 N=1,500 정도일 경우 표본의 크기는 20% 정도이다.
- 모집단 크기가 어느 정도 이상(약 5,000 이상) 일 경우, 모집단 크기를 고려한다는 것 자체가 어려우므로 모집단 크기와 상관없이 표본의 크기는 적어도 400명 이상으로 한다.
표본의 크기
실험
4) 통계적 분석 방법에 따라
- T-검증, 변량분석: 가능한 한 집단에 최소한 30명 이상 배치, 통계가 잘 이루어진 엄격한 실험연구에서는 10~15명 이상 - 중다휘귀분석: 독립변인과 피험자의 비율이 최소한 1:5,
적합한 피험자의 수는 각 변인 별로 15~20 - 판별분석: 각 판별변인 당 20정도
- 요인분석: 변인과 피험자의 비율이 최소한 1:5 혹은 1:20(적어도 1:10이상), 문항수가 적을 경우 최소한 문항수는 +100이상
표본의 크기
5) 큰 표집의 사례수가 필요한 경우 실험
- 통제 불가능한 변수가 많을 때
- 효과의 크기가 미미할 것으로 예상되는 때 - 여러 개의 하위집단으로 구성되었을 때 - 높은 통계적 신뢰수준이 요구될 때
- 모집단이 매우 이질적일 때
표본의 크기
실험
5) 큰 표집의 사례수가 필요한 경우
- 연구에서 지원자를 사용한 경우 : 지원자들은 비지원자들에 비해 동기수준에서 차이가 있으며 대표성이 거의 없다. “지원자 사용으로 인해 이 연구의 결과는 어떤 영향을 받았는가” 를 탐색해야 한다.
- 피험자의 탈락이 있는 경우 : 탈락된 피험자들은 일반적으로 연구의 수행 끝까지 남아있는 피실험자들과는 다르다.
- 가외변인에서 차이가 나는 피험자 : 인과-비교연구에서 이런 오류가 자주 나타난다. (예, 흡연과 폐암의 관계연구- 흡연가는 대도시에서 표집,
비흡연가는 시골지역에서 표집)
- 피험자들이 극단적인 비대표성을 가진 경우: 모집단과 다른 특성을 고려하여 해 석, 논의해야 한다.(예:우등생 상위권 학생이 하위권 학생 프로그램 이수 후 결과)