• 검색 결과가 없습니다.

개발기획 단계 지원 선호군 예측 모델(프로파일링)

제4장에서 설명한 바와 같이 의사결정나무 분석은 비모수 통계 분석으로 변수의 변환은 불필요 했으며, <그림 9~13>의 나무분석 결과를 활용해서 예측 모형 또는 프로파일링이 가능하다. 그러나 모수 통계분석인 판별분석으 로 보다 강건한(robust)한 예측 모델을 제시할 수도 있기 때문에, 본 장에서 는 <표 4>에서 설명된바와 같이 정규성이 크게 의심되는 변수들을 제곱근이 나 자연로그로 변환해 분석한다. 판별분석은 강건한 결과를 주지만, 모수 분 석에 적합한 변수를 직접 선정해야 하는 노력이 필요하다. 일단 판별분석에 적용할 독립 또는 통제 변수를 선정하기 위해서 의사결정나무 분석을 다시 활용하는데, 변환된 변수를 적용해 다시 분석을 진행했다.

역시 응답자 중 2,000명의 데이터를 훈련용과 검정용(5:5)으로 나누어 분 석했다. 총 25개의 설문 문항을 독립 및 통제변수들로 활용하였으며, 4가지 개발단계 중에서 기획단계의 지원 필요성이 가장 높다고 선택한 실험군(기 획단계 강화 선호군)과 다른 단계 지원을 선호한 대조군으로 구분하였다. 분 석 결과는 <그림 14>와 같았으며, 기획단계 소요기간(제곱근), 벤처여부, 기 술개발 성공 건수(제곱근), 지재권 출원 건수(제곱근), 총 소요기간(제곱근) 이 25개의 변수 중에서 분류하는데 유의미한 영향 요인으로 나타났다. <그 림 14>의 결과가 <그림 9>의 영향요인과 다르게 나타난 것은 변수변환에 따른 효과보다는 임의로 구성된 훈련용과 검정용 데이터 구성 차이 때문으 로 설명할 수 있다. <그림 14> 분류의 분류 정확도는 훈련 자료에서 78.9%, 검정 자료에서 81.2% 나타나서, 80%가까운 높은 정확도와 안정적 분류 결과를 보여주었다(분류 정확도 도표는 생략함).

<그림 14> 개발기획 단계 지원 선호군에 대한 의사결정나무 분석결과(변환 변수 사용)

응답 기업 2000개사 중 개발기획 단계 지원을 선호한 기업은 455개이며, 다른 단계를 선호한 기업은 1545개 기업이다. 각 집단의 공분산행렬의 동일 성에 대한 검증(Box’M)을 실시한 결과 p-value가 0.000으로서 “집단내 독립변수들 사이의 공분산 행렬이 동일하다.”는 가정은 유의수준 5%내에서 기각되어 그대로 판별분석을 할 수 없게 되었다. 즉, Box-M 통계량은 집단 의 등분산성을 보는 것인데 등분산성이 인정되면 개별-집단의 공분산행렬을 사용해 적합시키면 되는데, 그렇지 않았기 때문에 집단-내 공분산행렬을 사 용해 적합시켰다. 판별분석은 Fisher의 선형판별함수로 분석했고, 단계선택 은 Wilks' Lamda를 기준으로 했다. 사전 확률은 집단표본 크기로 계산했다.

의사결정나무 분석에서 유의미하게 제시된 5개의 독립변수를 사용하여 개 발기획 단계 지원 선호 기업과 비 선호 기업의 판별식의 적합도를 Wilks' Lamda를 통해 살펴보면, Wilks' Lamda의 수치가 작아 판별식이 통계적으 로 유의미함(두 집단의 차이가 있음)을 알 수 있다(<표 10> 참조). 집단 평 균의 동질성 검증결과인 <표 11>에 따르면 기획 소요기간, 기술개발 성공 건수, 지재권 출원 건수가 개발기획 단계 지원 선호 기업을 판별하는데 판별 력이 통계적으로 유의미함(p<0.05)을 보여주고 있다. 반면, 총 소요기간과 벤처 기업 여부에 있어서 집단 간 차이는 비유의적으로 나타났다. 5개의 변 수 중 기획 소요기간이 가장 작은 Wilks's lamda값과 가장 큰 F값을 나타 내어 대체로 판별력이 가장 높음을 알 수 있다(p<0.05).

<표 10> Wilks's lamda(개발기획 단계 지원 선호)

함수의 검정 Wilks의 람다 카이제곱 자유도 유의확률

1 0.921 163.180 4 0.000

<표 11> 집단평균의 동질성에 대한 검정(개발기획 단계 지원 선호)

Wilks 람다 F 자유도1 자유도2 유의확률

총 소요기간 1.000 0.064 1 1998 0.800

기획 소요기간 0.969 64.529 1 1998 0.000

기술개발 성공 건수 0.993 14.734 1 1998 0.000

지재권 출원 건수 0.990 21.089 1 1998 0.000

벤처여부 0.999 1.596 1 1998 0.207

판별분석도 회귀분석과 같이 변수의 진입 방법을 결정할 수 있는데, 본 연 구에서는 단계적 진입으로 변수 진입을 결정했다(Wilks's lamda 기준). <표 12>를 살펴보면 벤처기업 여부를 제외한 4개 변수가 선택되었다(변수의 정 규성이라는 측면에서 볼 때 범주형 변수의 활용은 바람직하지 않음). <표 13>은 판별 점수와 집단 간의 관계를 나타내는 정준상관계수가 제시되어 있 다. 정준상관계수가 0.280으로 이를 제곱하면 0.0784이다. 즉, 종속변수의 판별 점수 분산의 7.84%가 4개의 독립변수들에 의해 설명됨을 알 수 있다.

<표 12> 단계별 판별분석 결과(개발기획 단계 지원 선호)

이 0.3 이상인 요인은 기획 소요기간과 지재권 출원 건수이며 기술개발 성

결과 값이 작으면 작은 값을 나타낸 집단에 분류한다. 이는 향후 어떤 기업

중률 차이가 거의 없는 우수한 분류를 보여 주었다(<표 17> 참조).