• 검색 결과가 없습니다.

제3절 불확실성의 미래

과거와 현재에 대한 이러한 관점은 표본추출이 미래에 나아갈 방향을 암시한다. 가까운 미래에는 Frankel과 Frankel(1987)이 언급한 새로운 기술을 적용하기 위해 기본적 방법과 확장이 지속적으로 이루어 질것으 로 예상된다. 하나의 예로써 발전 가능성이 있는 분야는 다중추출틀의 활용이다. 다중추출틀을 사용할 경우 포함률이나 효율을 높이기 위해 두 개, 혹은 더 많은 추출틀에서 개체가 선택된다. 예를 들어 사업체 조사 에서 한 개의 추출틀은 완벽하지 않지만, 사업체 목록에 접근하기 쉽고 다른 추출틀은 사업체가 기록된 곳이나 추출된 지리적 위치가 있는 추 출틀이 될 수 있다. 두 개의 틀을 사용하는 것은 구할 수 있는 자료를 이용하면서 효율성 높은 표본을 제공한다. 다중표본틀은 행정등록 자료 들을 사용함으로써 비용을 줄일 수 있기 때문에 더욱 효과적이다.

추가적으로 다중 추출틀 이론은 현재 휴대폰 설문조사에서도 적용되 는데, 이 연구결과는 나중에 설명될 표본추출에서의 몇가지 근본적인 결 점을 드러냈다. Brick(2010)은 전체 무응답을 설계단계에서 서로 다른 표본에 대해 최적할당과 다른 가중치로 접근하는 것에 문제가 있음을 지적하였다.

표본추출이론의 전제는 여전히 추출틀 내에서 전체 인구를 완전히 포

괄한다고 가정하고, 추출된 표본들로부터 정확한 응답을 얻을 것이라고 가정한다. 추출틀의 불완전 포괄성은 대부분 전체적으로 추정단계에서 대체될 수 있다.

미래의 표본추출의 중요한 새로운 방향은 어렵게 하나의 추정치를 작 성하는 효과보다 표본설계와 자료수집 과정에서의 비표본오차의 효과를 고려하는 것이다. 이것은 표본에서 응답자들의 특성을 더 일관성 있게 만들기 위해 노력함으로서 자료수집단계에서 무응답편향을 줄이기 위한 설계를 고려하는 것이 더 좋은 방법이 될 것이다. 관심변수와 강한 상관 성이 있는 보조자료들은 무응답편향을 줄이는데 필수적인 요소로 간주되 고 있다. 또한 표본설계가 앞에서 언급한 자료들이 이용가능할 때 유용 하기 때문에, 표본추출 단계에서 이러한 자료들을 결합하는 방법들에 관 한 연구가 새로운 기저가 될 것이다.

자료수집비용은 조사원들에게 저렴한 비용으로 자료수집을 강요하는 요인이 된다. 현재 조사원에 투입되는 조사비용은 전체 조사비용의 약 70%를 상회하고 있으며, 웹상에서 수집된 비확률 조사자료를 보완해주 는 통계학적 이론이 반드시 필요하다. 그러나 아직 미해결된 문제는 저 비용의 고품질 조사자료의 수집이 확률표본추출 이론에 기반한 설계로서 는 성공하기 어렵다는 것이다.

1. 비확률 표본(nonprobability sampling)

확률표본을 대체할 새로운 이론의 성질에 대한 추측은 매우 어려운 일이지만 비확률표본이나 자원자 표본으로부터 나온 추론을 만들기 위해 조사되는 방식에 대한 비판적인 견해는 당연하다. 관측된 자료에 대한 분석은 웹 지원자 표본들의 분석과 가장 밀접하게 관련된 통계적 분야 이다. 사실 웹 표본을 이용한 연구는 관측연구를 위해 가장 주목할만한

성향 점수화로 본래부터 발전시킨 기술을 사용해왔다. 이러한 이유 때문 에 우리는 성향 점수화방법을 논의를 시작한다.

성향점수화는 관측자료나 임의추출에 기반하지 않게 선택된 자료의 묶음을 분석하려고 제안된 기술이다. 기본적인 생각은 개인에게 수행이 임의적으로 배정되지 않았을 때 수행에 대한 인과관계 효과를 평가하기 위해 “수행한” 개인의 그룹과 “수행하지 않은” 개인의 그룹의 결과를 비교해보는 것이다. 성향 점수화는 조건부 확률이다. 개체들은 모형안에 서 수행되었고 보조변수의 모음이 주어진다. 만약 연구원들이 성향점수 화에서 수행 그룹과 비수행 그룹의 균형을 맞출 수 있다면, 그리고 만약 모델이 맞다면, 편견 없이 그 수행의 인과관계는 추정할 수 있다.

이러한 지원자 표본에 대한 장점이 있으나 관측연구와 조사 간에는 중요한 차이점이 있다. 중요한 차이점 중 하나는 대부분의 조사가 반대 의 연구 대상의 집단을 설명하기 위한 것이다. 비록 실업률과 같은 특정 한 목표를 위해 조사의 설계를 할 수 있는 반면에 관측연구는 대부분 처리 효과를 결정하는 주요한 요인을 위해 작은 양의 조사에 응답하게 된다.

관측연구를 위해 성향점수화를 사용하는 연구는 조사에 자발적 참여 로 이끄는 방법에 대한 모형 설계에 도움이 된다. 이러한 노력은 관측자 료 연구에서 잠재적으로 수행 효과에 관련한 모형을 위한 변수들을 확 인하는 것이 필요하다. 조사 계획에서 자발적 참여로 계산된 점수성향화 모델의 발전은 더욱 어렵다. 왜냐하면 범위가 단일처리나 결과 측정이 아니기 때문이다. 자발적 참여 변수들과 다중 결과 변수와 관련된 변수 들은 편향을 감소하여 모델에 적절히 포함되어야만 한다.

성향점수화는 무응답과 미포함을 보완하기 위해 확률표본을 사용한다.

적합한 보조 변수가 이러한 모형에서 이용가능할 때 성향점수화(또는 다 른 무응답 조정 방법)는 상당히 많이 편향을 감소시키는 것으로 나타났

다. 그러나 이러한 방법들은 작은 편향을 제거하는데는 효과적이지 않다.

이러한 모형화로 부터 무응답 편향을 줄이지 못하는 두가지 이유는 주 로 주요한 변수들을 제외하거나 변수들 사이의 상호작용을 설명하지 못 하는 모형오류와 임의 측정 오류 때문이다. 회귀분석과 같이 모형 오류 는 예측변수를 모형에서 제외하거나 변수들간의 상호작용을 모형에 포함 하지 못할때 추정에서 편향을 갖게 된다. Steiner, Cook, Shadish(2011) 는 편향이 임의측정오류에 기인하여 발생하며, 이 결과를 직접적으로 지 원자 표본에 적용하였다. 그들은 비록 모형의 특성화가 정확하다 하더라 도 보조변수의 측정오류가 처리효과의 추정에서 상당한 편향을 발생시킬 가능성이 있다고 보았다. 그러므로 성향점수화와 또 다른 추정 방법은 모형을 정확하게 규정하는 것 뿐만 아니라, 적은 측정오류를 가진 보조 정보를 이용해야 한다.

또한 확률 표본들에서 사용되는 무응답조정방법은 비확률적 표본이나 지원자 표본에 대해 사용할때 큰 이점을 가진다. 표본조사에서 추출된 모든 개체들이 조사에 참여하도록 권유를 받는다. 그러므로 성향점수화 모형을 모형화하거나 특성화하기 위해서 추출된 개체들의 조사와 관련된 전체 보조변수가 필요하다. 그러나 이러한 작업은 상당히 복잡하다. 예 를 들어 비접촉과 거절의 경우는 이와는 다른 관계가 있을 수 있다. Lin 과 Schaeffer(1995)는 모형규정을 어렵게 하는 조사접촉과 거절이 반대 방향으로 편향이 발생되는 것을 발견하였다.

확률표본에서 가중치 조정방법의 또 다른 이점은 조사에서 무응답에 관한 많은 연구가 있다는 것이다. Groves와 Couper(1998)는 응답과 추 정량의 성질과의 관계를 규명하였다. 이러한 정보는 가중치 조정이나 성 향모형을 만드는데 매우 유용할 수 있다.

온라인 지원자 표본의 문제들 중 하나는 목표 인구의 전체 구성원들 이 온라인 조사에 동일한 확률로 참여하지 않는다는 것이다. 일부 인구

집단의 경우 온라인에 접근할 수 없기 때문에 조사에 참여할 수 없을 수도 있다. 반면에 조사를 홍보하는 웹페이지에 절대 방문하지 않거나, 조사에 대해 개인의 노출을 피하기 위해 방화벽을 설정한 경우와 같이 다른 구성원에게 접근하지 못할 수도 있다. 또한 다른 구성원들은 웹사 이트에 방문할 수 있지만 조사의 무응답문제와 비슷한 여러 가지 이유 로 조사 참여에 흥미가 없을 수도 있다. 지금까지 웹조사에서 편향에 대 한 다수의 모형화는 단순히 이런 온라인상에 접근이 안되거나 방문을 꺼리는 사람들과 같은 웹사이트의 노출부족에만 초점이 맞춰져 있었다.

비록 할당표집 방법은 확률표본추출을 대체할 수 있는 한 가지 방법 이다. 할당표집은 확률표본보다 저렴하고 합리적인 추정치를 제공하기 때문에 할당표집 방법을 활발히 사용하였으며, 여러 나라에서 아직 까지 많이 사용되고 있다. Stephan과 McCarthy(1958)는 실증적인 증거를 검 사하고, 할당표집이 비록 할당으로 인한 편향을 상당히 증가시키는 상황 이 있지만 편향의 측면에서 확률표본추출보다 지속적으로 나쁘지 않다는 사실을 제시하고 있다. 오늘날 할당표집은 미국에 지방정부에서 여전히 사용된다. 그러나 다수의 할당 표집은 조사 추정치를 산출할때 조정과 같은 처리가 적용되지 않은 경우 통상적인 자료로 받아들여지지 못한다.

미국의 경우 할당표집에 대한 활용이 감소하는 경우는 선거에서 득표율 의 차이와 승자 예측에 대해 편향이 발생하고, 이러한 원인이 결과적으 로 할당표집에 따른 것이라고 규명되었기 때문이다. 선거여론 조사에서 다수의 편향 발생이 할당 표집에 기인한다고 볼 수 있다.

주요한 할당표집의 단점은 조사자에 의한 할당그룹 내에서 응답자를

주요한 할당표집의 단점은 조사자에 의한 할당그룹 내에서 응답자를