• 검색 결과가 없습니다.

통계와통계와 응용응용((1515강강))

N/A
N/A
Protected

Academic year: 2022

Share "통계와통계와 응용응용((1515강강))"

Copied!
28
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

통계와

통계와 응용 응용((15 15강 강))

담당교수 : 손창균

(2)

3. 통계적 추론

v

사례연구

2005년 7월 28일자 시드니 모닝 해럴드에 1998년에서 2000년 사이에 태어난 아기 138,000명 모두에 대한 연구 결과를 인용하였다. 뉴사우스웨일즈 주 보건 부 환경보건과에 있는Vicky Sheppeard 박사는 출생 전에 최고 수준의 오염에 노출된 아기는 가장 요염수준 낮은 지역에 있던 아기들에 비해 약 12그램 정 도 가볍다고 말했다.

이 연구에 관해 논평한 Bruce Armstrong (시드니 대학의 공공보건학과 학과장) 교수는 “공기오염이 낮은 출생체중과 연관되었다는 증거의 실체를 부인하기 어렵다... 이것은 아마도 원인과 효과를 고려해야 한다.... 가능한 할 수 있는 만 큼 낮은 공기오염도를 유지할 필요가 있다는 점을 재차 강조한 것이다...” 라고 말했다.

“오염 노출된 아기들”

(3)

3. 통계적 추론

v

사례연구

이 기사의 주요 쟁점은 다음과 같다.

1. 계획된 연구이다.

2. 그 연구는 가설을 검증하기 위해 수행되었다 - 즉 오염이 아기의 출생체중에 영향을 주었다.

3. 표본추출방법을 계획하였다(이 경우 1998년부터 2000년 까지 3년간의 모든 아기를 포함)

4. 주장을 만들었다 : 측정된 두 개의 변수간의 연계성을 추출하였다. -그 표본은 오염의 증가가 출생체중의 감소의 원인이 되었다라고 언급하였다.

5. 주장을 만들었다: 연구에서 표본은 보다 많은 논거로 전체적인 증거가 되도 록 시드니에서 태어난 모든 아기 모집단으로 일반화 하였다,

6. 공공보건정책과 정부지출/자산에 관한 연구 결과로부터 함의를 만들었다- 이 경우 시드니의 오염도를 낮출 필요가 있다.

(4)

3. 통계적 추론

3.1 주장을 지지하기 위한 자료 이용하기

1. 어떤 이론을 검증하기위해서나 질문에 대한 답을 얻기 위해 연구가 설계되 고, 표집이 수행되며 자료가 수집된다

2. 기술통계절차에서는 표와 그래프로 그 자료를 표현한다. 그 자료는 표집 된 자료로 모집단에 관한 분명한 결론을 나타낼 수 있다.

☞ 그러나 그 자료가 얼마나 강력하게 결론을 지지하는가? 자료와 결론 간에 연계에 대해 강력한 증거가 있는가? 관찰된 효과가 실험적 처리에 기인한 것이며, 우연적 결과가 아니라고 얼마나 확신할 수 있는가?

의문

☞ 자료간의 연계성을 결정하고 모집단에 관한 결론을 도출하는 것은 해 석을 수반한다.

(5)

3. 통계적 추론

3.1 주장을 지지하기 위한 자료 이용하기

☞ 해석하는 방법의 기저는 추측통계학이라고 하는 또 다른 통계적 절차에 있 다.

추측통계학은 표본에 기반하여(통계량) 모집단에 관한 측정 가능한 주장 을 만들기 위해 통계적 방법과 모형을 사용한다.

☞ 자료에 관한 유용한 해석이 되기 위해 또는 다른 해석의 적절성을 평가하기 위해 우선 제시된 자료가 어떻게 생산되었는지에 관해 질문할 필요가 있다.

(6)

3. 통계적 추론

3.2 자료에 대한 의문

1) 변수를 잘 정의하고 있는가?

세계 2차 대전 이후 대부분의 서구 국가들은 경찰통계에 의해 측정함으로서 범죄기록의 증가를 경험했다. 그러나 공식적인 범죄 발생률은 실제로 구속된 가해자의 수의 증가보다는 경찰에 의해 단지 기록된 가해자의 수가 증가한 것임을 나타낸다. 범죄, 특히 폭력범죄는 최근 호주에서 증가하고 있다는 것 이 일반적인 인식이다. 그러나 1993년 자료는 1983년에 비해 폭력범죄 수준 에서 단지 일부 변동이 있는 것으로 나타났다.

-강도에 의한 피해율이 0.6%에서 1.2%로 2배 증가한 반면, 성폭력 발생률은 0.6%로 거의 변동하지 않은 상태이며, 다른 폭력유형들의 발생률은 3.4%에서 2.5%로 감소하였다.

-이들 1983년과 1998년 자료는 폭력범죄발생률의 일단을 나타낸 것이며, 범 죄 사건은 두 년도에서 변동하였음을 주지해야 한다. (호주통계청 1995)

(7)

3. 통계적 추론

3.2 자료에 대한 의문

1) 변수를 잘 정의하고 있는가?

§ 1983년에 자료를 면대면 면접으로 수집하였지만, 1993년에는 자기기입식 조사표를 이용하였다.

▪ 비록 두 조사가 12개월을 기준기간으로 갖지만, 1993년 조사는 4월에 실시 된 반면, 1983년 조사의 표본은 1983년 2월부터 1984년 1월까지 12개월 이상 퍼져있다.

조사간의 방법론과 정의 차이 때문에 이들의 결과를 이용하는데 조심해야 한다. 1983년과 1993년 조사의 중요한 차이는 다음과 같다.

(8)

3. 통계적 추론

3.2 자료에 대한 의문

1) 변수를 잘 정의하고 있는가?

피해발생률은 범죄피해자로 보고된 특정 범주의 사람들 또는 가구 수를 해당 범주에 있는 모든 사람 또는 가구 수의 백분율로 표현한 것이다. 가해유형의 발생 회수와 무관하게 피해는 각 유형의 가해자에 대해 단지 한번 헤아린다.

가구범죄는 주거침입, 주거침입미수 그리고 자동차 절도로 구성된다. 후 자인 자동차 절도는 자동차 절도, 가구원 소유이거나 중고차인지에 배타 적으로 포함하며, 이는 집으로부터 멀리 떨어져 발생할 수 있다.

경찰청 통계와의 비교 : 호주통계청의 범죄 및 안전 조사에서 얻은 응답은 범죄 가해 피해를 당했던 응답자의 인지에 의존하고 있다. 경찰에 보고되 지 않은 범죄 관련 자료가 수집된다. 사용된 용어는 응답자에게 묻는 질문 문항을 요약하였고, 적법하거나 경찰의 정의를 따르진 않았다.

(9)

3. 통계적 추론

3.2 자료에 대한 의문

1) 변수를 잘 정의하고 있는가?

동일한 개념을 사용한 2개 이상의 기관이 있을 때, 변수의 정의와 활용에 수반 된 복잡성을 나타내고 있다. 범죄 자료에서 논의된 문제들은 다음과 같다.

1. 호주통계청 내에서도 서로 다른 자료 수집방법을 이용하고 있다 – 면대면 조사와 응답자 직접 기입식 방법

2.호주 통계청에서 서로 다른 시점의 프레임을 사용하고 있다.

3.경찰자료는 보고된 범죄에만 기초한다(호주통계청은 그러한 조사상의 불일 치를 정의하고 있다)

4.경찰의 정의가 호주통계청의 정의와 다를 수 있다.

5.어떤 주거 범죄는 가구에서 발생하지 않을 수 있다(자동차 강도).

6. 범죄 피해율은 복합적인 발생회수를 사용하지 않기 때문에 실제 발생률 보 다 낮을 수 있다.

(10)

3. 통계적 추론

3.2 자료에 대한 의문

1) 변수를 잘 정의하고 있는가?

§ 다음 항목에서 조사연구로부터 편향을 제거하기 위해 사용할 수 있는 방법을 고르시오.

a) 통제

b) 다중표본

c) 확률표집 (임의표집) d) 편의 표집

(11)

3. 통계적 추론

3.2 자료에 대한 의문

1) 변수를 잘 정의하고 있는가?

§ 다음 항목에서 조사연구로부터 편향을 제거하기 위해 사용할 수 있는 방법을 고르시오.

a) 통제

b) 다중표본

c) 확률표집 (임의표집) d) 편의 표집

(12)

3. 통계적 추론

3.2 자료에 대한 의문

2) 자료를 어떻게 생산하였나?

Coleman, Hoffer and Kilgore (1982) [2]는 고등학교에 대한 연구로부터 자료 를 분석하였다. 이 연구는 10학년부터 12학년 까지 공립, 가톨릭 및 기타 사 립 고등학교에 다니는 학생들을 대상으로 독해력, 어휘력 및 수학 시험성적 을 분석하였다. 연구문제는 “기본적인 인지능력에 기반한 보다 높은 성취도 를 평가하여 사립학교가 경쟁력 있는 학생을 길러내는가” 이었다.

연구에 참여한 학생들은 2종의 시험을 치르도록 하였다.

<사례연구>

(13)

3. 통계적 추론

3.2 자료에 대한 의문

2) 자료를 어떻게 생산하였나?

<사례연구>

(14)

3. 통계적 추론

3.2 자료에 대한 의문

2) 자료를 어떻게 생산하였나?

제시된 표로부터 성적에 관한 가능한 해석을 고르시오.

a) 각 부문은 독해력보다 수학에 보다 높은 인지결과를 나타내기 위해 학 생들을 지원하고 있다.

b) 가톨릭 학교는 독해력, 수학 및 어휘력에서 유사한 점수를 얻도록 기여 하고 있다.

c) 비공립학교(사립과 가톨릭)는 학생들의 점수에서 공립학교 만큼 기여 하지 못하고 있다.

d) 공립학교는 학생들의 점수에서 비공립학교 만큼 기여하지 못하고 있다.

(15)

3. 통계적 추론

3.2 자료에 대한 의문

2) 자료를 어떻게 생산하였나?

자료가 좋은 것인지 아닌지를 어떻게 결정할 수 있는가?

<가이드라인>

1. 자료에 영향을 줄 수 있는 고려하지 않은 다른 변수가 있는지를 자문하라.

2. 자료의 상황을 제시하고 있는가? 즉, 자료의 근거를 명확히 설명하고 있는가?

이는 변수가 잘 정의 되었는지 또는 측정은 타당하고, 신뢰성 있고 정확한지를 결정하도록 한다.

3. 연구에 사용될 표본을 어떻게 추출하였나? 표본을 추출하는 방법에 어떤 편향 은 없나?

4. 호주통계청과 같이 조직화되고 인정받는 기관에서 생산된 자료인가?(비록 이 러한 기관이 자료가 훌륭하다고 보증할 수는 없지만, 일반적으로 이해관계가 있

(16)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

Ø 통계량으로부터 모수 추정하기 및 표본크기 추정하기

여론조사에서 투표자 표본을 선정하고, 만일 표본이 모집단을 대표한다면 모평균이 표본평균±허용오차 내에 떨어진다고 확신할 수 있다. 그 범위를 신뢰구간이라 하며, 다음과 같이 표현할 수 있다

(17)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

Ø 통계량으로부터 모수 추정하기 및 표본크기 추정하기

표본평균을 기반으로 모평균을 추정하는 상황을 고려하자

여기서 특별한 숫자 Z와 모집단 표준편차 (σ) 과 표본크기(n)이 포함되 었다.

(18)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

Ø 통계량으로부터 모수 추정하기 및 표본크기 추정하기

과거경험으로부터 기계로 생산된 장대의 지름에 대한 표준편차는 약

0.135cm 였다. 30개 장대의 단순임의 표본에 대해 평균 지름이 3.560cm 였다.

다음을 계산하라.

[예제]

(a) 모집단 평균 지름에 대한 95% 신뢰구간.

(b) 모집단 평균 지름에 대한 90% 신뢰구간.

(19)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

▪ n=30

▪ σ=0.135cm

▪ =3.56cm

▪ Z=1.960

☞ 모평균 에 대한 95%신뢰구간

(20)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

▪ n=30

▪ σ=0.135cm

▪ =3.56cm

▪ Z=1.645

☞ 모평균 에 대한 90%신뢰구간

(21)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

표본크기가 신뢰구간의 폭에 영향을 준다. - 즉 보다 큰 규모의 표본크기는 신 뢰구간 의 폭을 줄인다.

신뢰계수는 신뢰구간에 영향을 준다. 보다 높은 신뢰도는 신뢰구간의 폭을 넓 힌다. - 그러므로 추정하는 실제 평균으로부터 보다 멀리 떨어지게 된다.(즉, 정 확성을 상실하지만, 신뢰도를 얻는다)

(22)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

한 사회사업가가 95%의 신뢰도로 최대 허용오차 $60로서 방학 동안 10대 들이 벌어들인 평균임금을 결정하고자 하였다. 이전의 연구로부터 σ=$430 이라고 한다. 이를 달성하기위해 필요한 표본크기는 얼마인가?

[예제]

(23)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

☞ 표본 비율에 근거한 모비율 π 추정하기

(24)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

USA Today지는 “최선의 대통령후보들을 낙선 시키는 현재의 시스템에 찬 성하십니까?” 라는 질문에 응답하도록 하는 여론조사를 CNN과 실시하 였다. 1406명의 표본 중에서 ‘매우찬성’에 320명이 응답하였다.

그 선거에서 ‘매우찬성’하는 모집단 비율에 대한 99%신뢰구간을 계산하 시오.

[예제]

(25)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

[예제]

품질관리사무소는 생산라인으로부터 400개의 문고리에 대한 단순임의표 본을 추출하여 이 중 44개의 불량품을 찾아냈다

모집단의 불량 문고리에 대한 90% 신뢰구간은 다음 중 무엇인가?

a) 0.11±0.026 b) 0.11±0.077 c) 0.15±0.084 d) 0.10±0.084

(26)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

[예제]

낚싯대 제조업자는 낚싯대의 강도에 대한 표준편차가 2.25kg 이라고 한다.

필요한 표본 규모는 얼마인가?

a) 3,548 b) 865 c) 441 d) 217 e) 30

(27)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

Ø 모 표준편차 σ를 모를 때 모평균 μ를 추정하기

이는 통상적으로 발생하는 것으로서 - 표본 표준편차 s를 안다. 이럴 경우 s 를 σ 대신 사용 한다. 또한 Z 대신 t 라 하고 하는 다른 신뢰계수를 이용한다.

t는 표본크기가 작을 때 유용한 값이다. 따라서 다음과 같은 신뢰구간 공식을 표현할 수 있다.

(28)

3. 통계적 추론

3.2 자료에 대한 의문

3) 주장을 뒷받침 하는 자료 이용; 추론하기

Ø 모 표준편차 σ를 모를 때 모평균 μ를 추정하기

학생들이 어떤 책에서 고정된 페이지 까지 읽는데 걸리는 시간을 결정하기 위한 검사를 실시하였다. 모든 학생들은 그 책을 이해하면서 가장 빠른 속도 로 읽도록 훈련 받았다. 16명의 표본 학생들이 그 검사를 받았으며, 평균 소요 시간은 24.19 분이었고, 표본표준편차는 5.29분이었다.

[예제]

☞ 모든 학생들이 그 책을 읽는데 걸리는 평균 소요시간을 t=2.131인 95%

신뢰구간을 이용하여 추정하시오

☞ 모든 학생들이 그 책을 읽는데 걸리는 평균 소요시간을 t=2.947인 99%

신뢰구간을 이용하여 추정하시오.

참조

관련 문서

- 추론 : 불활성 기체처럼 되기 위해 전자구조를 바꿀 수 있는 다른 원소들은 전자 구조를 불활성 기체처럼 바꾸어서 반응성이 작아질 것이다.. 주기율표를

– 보수나 점검 시 작업자의 안전 때문에 접지 필요 이런 문 제를 해결하기 위하여 GIS 내의 가스를 회수하지 않고도 외부에서 접지할 수 있도록 적당한 위치에 접지

단일 개인을 유일하게 식별하거나, 접촉하거나 찾아내기 위해 사용 될 수 있는 정보 또는 단일 개인을 유일하게 식별하기 위해 다른 정 보원들과 함께 사용될 수

이 같은 측면에서 본 연구에서는 예의 개정 가능성에 관한 이론적 토대를 마음에서 찾아보고자 한다. 이를 위해 유가 철학을 중심으로 마음과 예의 관계가

소아의 경우 A형 간염에 걸리면 대부분 무증상이거나 감기 처럼 앓고 지나가며 가벼운 증상을 보이지만 성인에서는 급성 간염 이 유발되고 입원이나 요양을 해야 하는 심한

 Member A: I move that we vote immediately on the motion 구성원 A: 본 동의를 즉각 채결할 것을 동의합니다.. Chairman, I move that we close debate and v

재무관리자기 되기 위해 필요한 자격증과 재무관리자의 역할에 대해서

§ 표본들은 모집단을 대표하지 못하기 때문에 표본을 기반으로 모집단에 관한 결론을 내리기가