• 검색 결과가 없습니다.

도수도수

N/A
N/A
Protected

Academic year: 2022

Share "도수도수"

Copied!
35
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

자료와 통계학 1 장

경영과 경제에서 응용 자료

자료의 원천 기술 통계 통계적 추론

컴퓨터와 통계분석

(2)

경영과 경제에서의 응용

회계

경제

회계법인들이 회계감사를 실시할 때 통계적 표본절차를 사용한다.

경제학자들은 미래의 경제 현상들을 예측할 때 통계적 정보를 활용한다.

(3)

경영과 경제에서의 응용

다양한 통계적 품질관리차트가 생산 과정의 산출물을 모니터링 하는데 사용 된다.

생산

소매점 Checkout 카운터에서 사용되는 전자판매스캐너가 다양한 마케팅연구 자료 수집에 이용된다.

마케팅

(4)

경영과 경제에서의 응용

재무전문가들은 투자추천을 할 때 P/E 비율이나 배당수익률 등을 이용한다.

재무

(5)

자료와 자료집합

 자료(data)는 수집되고 ,요약되고, 분석, 해석된 사실(facts)나 수치(figures)이다.

 특정 연구를 위해 수집된 자료를 자료집합(data set) 이라고 한다.

(6)

 요소(elements)는 자료가 수집되는 대상이다.

 변수(variable)는 요소들에 대한 특성이다.

 특정요소에 대하여 수집된 측정치의 집합이 관찰값(observation)이다.

 자료집합에서 자료값들의 총 수는 요소의 수에 변수의 수를 곱한 것이다.

요소 , 변수 , 관찰값

(7)

주식 연간 이익/

거래시장 매출($M) 주($)

자료 , 자료집합, 요소 , 변수, 관찰값

기업명 Dataram

Energy South Keystone

LandCare

Psychemedics

AMEX 73.10 0.86 OTC 74.00 1.67 NYSE 365.70 0.86 NYSE 111.40 0.33 AMEX 17.60 0.13

변수 요소명

자료집합

(8)

측정척도 (Scales of Measurement)

이러한 척도는 가장 적절한 자료의 요약방법과 통계적 분석을 결정한다.

이러한 척도는 자료에 있는 정보량을 결정한다. 측정척도로는 다음과 같은 것이 있다 :

명목 서열

등간 비율

(9)

명목(Nominal)

비수치적라벨이나 숫자코드가 사용된다.

는 요소의 속성을 구분하기 위해 부호나 명칭을 사용하는 자료이다.

(10)

예:

대학생들은 경영학, 인문학 , 교육학 등 비수치적 기호를 사용하여 그들이 속한 학부에 따라 분류될 수 있다.

아니면 숫자코드를 써서 분류할 수도 있다. (예컨대, 경영학은 1, 인문학은 2, 교육학은 3

등) 예:

대학생들은 경영학, 인문학 , 교육학 등 비수치적 기호를 사용하여 그들이 속한 학부에 따라 분류될 수 있다.

아니면 숫자코드를 써서 분류할 수도 있다. (예컨대, 경영학은 1, 인문학은 2, 교육학은 3

등)

명목 예제

(11)

서열(Ordinal)

비수치적라벨이나 숫자코드가 사용된다.

명목자료의 특성을 가지고 있으면서 순서와 서열을 가지고 있는 자료이다.

(12)

서열예제

예:

대학생들은 Freshman, Sophomore, Junior, or Senior 와 같은 비수치적 라벨로 지위를 분류할 수 있다.

또는 숫자코드로 지위를 나타낼 수 있다.

(예컨대, Freshman은 1, Sophomore는 2, 등 ) 예:

대학생들은 Freshman, Sophomore, Junior, or Senior 와 같은 비수치적 라벨로 지위를 분류할 수 있다.

또는 숫자코드로 지위를 나타낼 수 있다.

(예컨대, Freshman은 1, Sophomore는 2, 등 )

(13)

등간(Interval)

등간척도로 측정한 자료는 항상 숫자로 나타난다. 서열자료의 특성을 가지고 있으며, 관찰값들 사이의 구간이 특정 고정된 측정단위로 표현되는 자료이다.

(14)

등간예제

예:

Melissa 는 SAT 성적이 1205점이며, 반면 Kevin 은 SAT 성적이 1090점이다. Melissa 는 Kevin보다

115점 더 높다.

예:

Melissa 는 SAT 성적이 1205점이며, 반면 Kevin 은 SAT 성적이 1090점이다. Melissa 는 Kevin보다

115점 더 높다.

(15)

비율(Ratio)

등간자료의 특성을 모두 가지고 있으며, 두 값들의 비율이 의미가 있다.

거리, 높이, 무게, 시간 같은 변수들은 비율척도를 사용한다.

비율척도는 그 변수에 대해 아무것도 존재하지 않는다 것을 의미하는 ‘0’ 값을 포함한다.

(16)

비율예제

예 :

Melissa는 36학점을 획득했으며, 반면 Kevin 은 72학점을 이수하였다. Kevin 은 M elissa보다 2배 많이 이수하였다 .

예 :

Melissa는 36학점을 획득했으며, 반면 Kevin 은 72학점을 이수하였다. Kevin 은 M elissa보다 2배 많이 이수하였다 .

(17)

자료는 질적(qualitative) 자료와 양적(quantitative) 자료로 분류될 수 있다.

적절한 통계적 분석방법은 그 변수에 대한 자료가 질적인지 아니면 양적 인지에 달려 있다.

일반적으로, 자료가 양적일 때 더 많은 통계적 분석을 적용할 수 있다.

질적 (정성적) 자료와 양적(정량적) 자료

(18)

질적 자료

기호나 명칭 등이 각 요소의 속성을 분별하는데 사용된다.

범주형 자료라고도 한다.

명목 또는 서열척도 중의 하나가 사용된다. 수치적 또는 비수치적일 수 있다.

적절한 통계적 분석을 하는 데에는 다소 한계가 있다.

(19)

양적 자료

양적 자료는’ how many or how much’를 나타낸다:

이산자료 : how many의 경우 연속자료 : how m uch의 경우

양적 자료는 항상 숫자로 나타난다.

양적 자료에 대해서 일반적 산술연산이 사용될 수 있다

(20)

측정 척도

질적 자료 양적 자료

수치적 비수치적비수치적 수치적

자료

명목 서열 명목 서열 등간 비율

(21)

횡단면 (cross-sectional) 자료

횡단면 자료는 동일한 시점에 수집된 자료이다. 예: 2003년 6월 Ohio주의 각 카운티에서 발행한

건축허가증의 수를 나타내는 자료

(22)

시계열 (time series) 자료

시계열 자료는 여러 시점에 걸쳐 수집된 자료이다.

예: 지난 36개월의 각 월에 O hio주 Lucas 카운티 에서 발행한 건축허가증의 수를 나타내는 자료

(23)

자료의 원천

현존하는 원천(existing sources)

회사내 – 거의 모든 부서

기업자료서비스 – Dow Jones & Co.

정부기관 - U.S. Department of Labor 산업협회 – Travel Industry Association

of America

특수 이익단체 – Graduate Management

Admission Council 인터넷 – 수많은 회사

(24)

자료의 원천

통계적 연구(statistical studies)

실험 연구에서는 관심 대상이 되는 변수를 먼저 확인

하고, 이 변수에 영향을 미칠 수 있는 하나 또는 그 이상의 변수를 정의하고 통제하여야 한다.

관찰(비실험적) 연구에서는 관심 대상 변수를 통제를 하지 않는다.

survey가 좋은 예이다

(25)

자료수집시 고려할 사항

시간 소요

획득비용

자료 오류

 정보에 대한 조사는 시간을 필요로 한다.

 정보를 획득할 때 쯤이면 그 정보는 더 이상 유용 하지 않을 수 있다.

 정보획득에 대하여 비용이 소요된다.

 우연히 얻을 수 있는 자료나 부주의 하게 얻은 자료를 사용할 경우 잘못된 정보를 얻을 수 있다.

(26)

기술 통계 (descriptive statistics)

기술통계는 표나 도표, 수치적 방법으로 자료를 요약한 것이다.

(27)

예 : Hudson 자동차 수리점

 Hudson 자동차 수리점의 관리자는 자기

수리점에서 시행하는 엔진조정(tune-ups)에 사용된 부품값을 알아보려고 엔진조정을 한 50명

고객의 송장(invoice)을 조사하였다.

부품비용은 dollar단위로 다음 Slide에 표시되어 있다.

(28)

91 78 93 57 75 52 99 80 97 62 71 69 72 89 66 75 79 75 72 76 104 74 62 68 97 105 77 65 80 109

85 97 88 68 83 68 71 69 67 74 62 82 98 101 79 105 79 69 62 73 91 78 93 57 75 52 99 80 97 62 71 69 72 89 66 75 79 75 72 76 104 74 62 68 97 105 77 65 80 109

85 97 88 68 83 68 71 69 67 74 62 82 98 101 79 105 79 69 62 73

예 : Hudson 자동차 수리점

 표본 (50 엔진조정 고객의 부품 비용)

(29)

표 정리 :

도수와 백분율 도수

50-59 60-69 70-79 80-89 90-99 100-109

2 13 16 7 7 5 50

4 26 32 14 14 10 100

(2/50)100

부품

비용 ($) 부품 도수

백분율 도수

(30)

그래프 요약 : Histogram

22 44 66 88 10 10 12 12 14 14 16 16 18 18

부품 비용 ($)

부품 비용 ($)

도수도수

5059 6069 7079 8089 9099 100-110 5059 6069 7079 8089 9099 100-110

엔진조정 부품 비용

(31)

수치적 기술 통계

 Hudson의 50 명 고객의 평균 부품비용은

$79 이다.

(50 명 고객의 비용을 합하여 50으로 나눔)

 가장 일반적인 수치적 기술통계는 평균이다.

(32)

통계적 추론 (statistical inference)

모집단 표본

통계적 추론

전수조사 표본 조사

 특정 연구에서 관심의 대상이 되는 모든 요소들의 집합

 모집단의 부분집합

 표본으로부터 얻어진 자료를 분석 하여 모집단의 특성을 추정하는 과정

 모집단에 대한 자료를 수집 조사하는 것

 표본에 대한 자료를 수집 조사하는 것

(33)

통계적 추론의 과정

1. 모집단은 모든

엔진조정으로 구성된다. 평균 부품비용은

알려져 있지 않다.

2. 50개의 엔진조정 표본을 조사한다.

3. 표본자료에서 엔진조정당 평균

부품비용은 79$ 이다.

4. 표본평균으로 모집단의 평균을

추정한다.

(34)

컴퓨터와 통계분석

 통계분석에는 종종 많은 양의 자료가 사용된다.

 컴퓨터 소프트웨어가 주로 통계분석을 위해 사용된다.

 엑셀이나 미니탭 같은 통계 패키지가 자료 관리나 분석, 프레젠테이션에 이용될 수 있다.

 엑셀이나 미니탭 사용을 위한 지침은 부록에서 다룬다.

(35)

1장 끝

참조

관련 문서

창업기업의 수명주기 창업기업의 자금조달 순서 창업자금의 원천... 기업의 유형 개인기업과

시설별 식중독 발생 통계 지역별 식중독 발생 통계 HACCP 부적합 업체 정보. 나

이산적

서울 특별시 중구 일대의 장소 중심의 문화재를 직접 답사함으로써. 실제적인 역사에

• 컴퓨터가 교육에 도입된 것은 1950년대 후반 - 메인프레임 컴퓨터와 여러 대의 터미널 이용 - 일리노이大 PLATO(Programmed Logic for.. Automatic Teaching

다중 방호를 통해 방사능 유출을

따라서 현재 지능형 시스템에서 연구가 활발히 진행되고 있는 온톨로지 기술, 시맨틱 웹 기술에 기반을 둔 다양한 추론 기술, 지능형 접근 제어모델, 텍스트 마이닝과

사람과 컴퓨터에게 같은 명령을 내렸을 때 어떻게 다르게 명령을 수행하는지 알아보고, 컴퓨터의 명령처리 방식인 순차적 실행에 대하여 지도한다.. 또한