제 4장 모수와 통계량
충북대학교 농업생명환경대학 지역건설공학과
실 험 통 계 학
맹 승 진
4.1 모수
4.1-1 모집단과 분포
• 모집단
- 데이터 정리 및 통계분석의 대상이 되는 모든 개최들의 집합으로 통계분석을 할 때 명확하게 설정한다.
4.1 모수
• 모집단의 분포
- 관측치로부터 분포 추정
- 분포의 이해 및 타 분포와의 비교 : 분포의 특성을 나타내는 수치 필요 - ex) 정규분포, 비정규분포 등
정규분포
4.1-1 모집단과 분포
4.1 모수
4.1-2 분포를 대표하는 수치
• 중심경향 (Central tendency)
- 자료가 어떤 값을 중심으로 분포되어 있는가를 파악 - ex) 평균, 중앙치, 최빈치, 백분위 수 등 ← 중심점
4.1 모수
4.1-2 분포를 대표하는 수치
• 산포도 (Degree of dispersion)
- 자료가 중심점을 중심으로 흩어져 있는 정도 - ex) 분산, 범위, 평균 절대편차, 변동계수 등
4.1 모수
4.1-3 모수
• 의사결정에 어던 정보가 필요한지를 결정하기 위해 모집단의 특성을 식별하는 수치적 지표를 활용
• 모집단의 중심점 및 산포도 등을 나타내는 함수
• 대표적인 모수
- 중심경향을 나타내는 평균
- 모집단 자료의 산포도를 나타내는 분산
4.1 모수
4.1-3 모수
• 모수에 대한 추정
- 모수를 표본을 통해서 추정하는 것. 표본으로부터 전체 모집단의 모수에 대해 추정하는 방식
• 모수에 대한 가설검정
- 모수에 대한 가설을 설정하고, 그 가설의 기각 또는 채택을 결정하는 규칙 통계적 모형에 대 한 가설 채택, 기각할지 판단하는 통계적 절차
4.1 모수
4.1-3 모수
• 모수 사용 예
- 제조회사의 종업원들의 봉급을 분석한다고 할 때, 모든 회사의 종업원 봉급을 단순히 수집하여 정리한다고 해서 모집단의 특성이 파악되는 것은 아니다
- 그 대안으로서 회사 종업원 봉급의 평균을 파악하고, 봉급간의 변화가 얼마나 되는 지를 분산을 파악함으로써 자료에 대한 보다 합리적인 판단을 용이하게 할 수 있다
4.2 통계량
4.2-1 표본
• 모집단 특성을 파악하기 위해서는 모수의 산출이 필수적
• 모집단의 모든 자료를 수집하는 것이 일반적으로 불가능하므로 평균이나 분산 등의 모수를 산출할 수 없다 그래서 모집단으로부터 임의로 추출된 모집단의 부분집합 또는 표본 분석을 통해서 모수를 추정하는 것이 일반적
• 표본이란 : 모집단으로부터 임의로 추출된 모집단의 부분집합이다
4.2 통계량
4.2-1 표본
4.2 통계량
4.2-2 통계량
• 단 한 개의 수로 전체 자료집단을 설명할 수 있는 값 흔히 ‘대표값’이라고도 함
• 표본의 특성을 나타내는 수치
• 일반적으로 사용되는 통계량
- 평균, 중앙값, 최빈수, 분산, 표준편차
4.2 통계량
4.2-2 통계량
• 주요 중심경향을 나타내는 통계량 - 평균 : 표본자료의 중심 무게 - 중앙값 : 극단값에 덜 영향 받음 - 최빈수 : 대단위 자료에 유용 - 기대값 : 확률분포 중심
4.2 통계량
4.2-2 통계량
• 자료의 산포(분포)를 나타내는 통계량 - 분산, 표준편차, 범위 등
• 자료의 형태를 나타내는 통계량 - 왜도 : 치우침 정도
- 첨도 : 뽀족함 정도
4.2 통계량
4.2-2 통계량
• 통계량에 평균
- 평균에는 산술평균, 기하평균, 조화평균등 다양한 평균이 존재하나 일반적으로 평균은 산술 평균을 지칭하며 '데이터의 합계를 데이터의 총 개수로 나눈 값'을 의미
① 산술평균 : 데이터의 합계를 데이터의 총 개수로 나눈 값
4.2 통계량
4.2-2 통계량
② 기하평균 : n개의 데이터가 있을 때 데이터의 곱의 n제곱근의 값을 의미 변화량의 평균을 계산하기에 상승평균이라고도 한다
③ 조화평균 : 데이터의 역수의 합을 산술 평균한 것의 역수 값
4.2 통계량
4.2-3 모집단 통계량, 표본 통계량
• 모집단 통계량 → 모수 → 상수 : 모집단 자료에서 계산된 통계량
• 표본통계량 ( 일반적으로 통계량이라고 함 )
모집단에서 추출한 표본을 담겨있는 통계적 특성치 실제 관측 표본 자료 집단으로부터 계산됨
• 표본을 어떻게 선택하는에 따라 달라질 수 있기 때문에 이 또한 랜덤변수 무작위 표본 𝑋1, 𝑋2, 𝑋3, ㆍㆍㆍ𝑋𝑛의 함수가 되므로, 모든 통계량은 또한 랜덤변수이고, 확률적 분포(표본 분포)를 갖음
4.2 통계량
4.2-3 모집단 통계량, 표본 통계량, 추정량 비교
• 표본통계량과 모집단 모수 – 기호의 차이
4.2 통계량
4.2-4 추정량
• 추정량(Estimated Value)
- 미지의 모수를 추정하는 량, 표본 통계량에 의거하여 모수 추정
① 불편성/불편의성 : 편의(치우침) 없는 성질 , 불편의 추정량
4.2 통계량
4.2-4 추정량
② 효율성 : 추정량 분산이 작게 나타나는 성질
③ 일치성 :
표본 크기가 커질수록 추정량이 모수에 점근적으로 근접하는 성질