A Study of Measurement for National Information Index

(1)

A Study of Measurement for National Information Index

지경용(K.Y. Jee) 강신원(S.W. Kang) 김정란(J.R. Kim)

네트워크경제연구팀책임연구원, 팀장 정보기반연구팀선임연구원 R&D전략연구팀연수연구원

일반적으로 정보화 수준을 측정할 때 많이 사용되는 방법은 산술평균의 개념에 의한 대표값 산출방식이 다. 그러나 이는 항목간의 통합문제의 관점에서 각 항목의 정보화 기여도가 무시되고, 급격한 정보화의 구조변화를 적절히 반영하지 못하며, 기본지표의 측정항목이 많아질 경우에는 해당 측정항목이 상대적 으로 작은 기여도를 갖는 것으로 나타나는 등 여러 문제점을 내포하고 있다. 따라서 본 연구는 이와 같은 문제점을 해결하기 위하여 새로운 정보화 수준 측정방법을 제안하고 이에 따른 정보화지수의 측정・비 교ㆍ분석을 통하여 새로운 측정방법을 검증하는 데에 그 목적이 있다. 본 고에서는 서로 상관된 국가정보 화 지표들을 결합하여 하나의 가중치를 구하는 인자분석 및 대표성분점수화법 등 세 가지 방법을 이용하 여 방법별로 정보화지수를 산출한 결과를 비교・분석하여 보았다. 세 가지 방법들에 의한 가중치 및 지수 는 다소 값의 차이를 보이고 있지만 전체적인 추이는 같음을 보았다. 방법1과 방법2는 요인분석에 의한 분석 결과로서 가중치나 지수에서 다소의 차이를 보이고 있지만 유사성이 매우 크며, 방법3에 의한 분석 결과는 앞의 방법들과는 가중치 및 지수에서 차이를 보이고 있다. 특히 방법3은 다른 측정 방법과는 달 리 상관성이 높은 변수들에게 가중치가 집중되는 현상을 방지할 수 있으며, 가중치를 배분하기 때문에 가 중치 배분에서 소외된 항목에도 가중치를 부여하게 된다. 따라서 방법1과 방법2보다 더 객관적으로 각 지표의 가중치를 반영한다고 볼 수 있어 어느 정도 이 방법에 의한 분석이 유의함을 보여주었다.

I . ^{서 론}

어떤 한 국가의 정보화 수준을 측정하여 하나 의 숫자로 표현하는 일은 어려운 일이다. 이러한 숫자는 그 사회가 가지고 있는 정보화와 관련된 사회구조의 특성 및 정보화 수준이 모두 포함되 어야 되기 때문이다. 또한 여러 정보화와 관련된 항목의 통합에서 각 항목의 특성이 무시될 수 있 기 때문에 여러 특징을 포괄적으로 나타낼 수 있도록 항목간의 통합작업도 요구된다. 더욱이

요즘 같이 정보화의 빠른 진전이 있을 때에는 새 로운정보기술및정보화영향변수들이적절하게 반영될 수 있는 새로운 통합방법이 요구되고 있 다. 일반적으로 정보화 수준을 측정할 때 많이 사 용되는 방법은 산술평균의 개념에 의한 대표값 (지수)산출방식이다. 그러나 이는 항목간의통합 문제의 관점에서 각 항목의 정보화 기여도가 무 시되고, 급격한 정보화의 구조변화를 적절히 반 영하지못하며, 기본지표의측정항목이많아질경 우에는 해당 측정항목이 상대적으로 작은 기여도

(2)

를 갖는 것으로 나타나는 등 여러 문제점을 내포 하고있다.

이러한문제점을해결하기위해서는각 정보화 수준 측정 시 각 항목의 비중을 고려한 측정방법 이 요구되고 있다. 또한 기존의 정보화 산출방식 의 주된 문제점은 각 항목이 차지하고 있는 비중 이 정보화 측정 시에 적절하게 반영이 안된다는 점이다. 따라서 본 연구는 이와 같은 문제점을 해 결하기 위하여 새로운 정보화 수준 측정방법을 제안하고 이에 따른 정보화지수의 측정・비교ㆍ 분석을통하여새로운측정방법을검증하는데에 그목적이있다.

II. 정보화지수 측정방법에 관한 접근

국가의 정보화 정도를 측정하는 것은 매우 어 려운 일로써 현재까지는 극히 만족할 만한 연구 결과를 찾기가 어렵다. 이렇게 정보화 수준을 측 정하는 것이 어려운 이유는 먼저 정보화의 개념 자체를정의하기가어렵고아울러정보화지표선 정의 어려움, 데이터의 부족, 상이한 정보화 지표 를 지수화하는 문제 등 여러 문제가 있기 때문이 다.

본 장에서는 지금까지 정보화 측정을 위해 시 도되었던기존연구를살펴보고, 제I I I장에서는본 연구의 최종목표인 국가정보화 측정방법에 관하 여살펴본다.

1.

^{산술평균법}

정보화지수를 산출하는 가장간단한방법은 단 순하게구성항목에대해개별적으로계산된지수 를 단순히 평균하는 방법이 있다. 이 방법을 이용 하여 계산된 종합지수는 적절한 수준을 나타낸

것이라고 볼 수 없는데, 그 이유는 측정되는 자료 의 성질이 같다라고 하더라도 각 항목이 정보화 에 미치는 영향(중요도)은 다를 수 있기 때문이 다. 예를 들면 전화보급이 한 나라의 정보화에 미 친정도와PC 보급이한나라에미친정도는분명 히 다를 것이며 이를 고려한 종합지수와 그렇지 않은지수와는차이가있을것이다.

이러한 단점을 보완하기 위하여 한국전산원 ( 1 9 9 6 )에서는 가중평균을 이용한 지수를 제안하 였다. 이는각 항목이 정보화에미친 정도의 차이 를계산상고려한지수로써가중평균지수라고하 는데 이때 고려된 각 개별지수의 비중이 바로 가 중치이다. 한국전산원( 1 9 9 6 )에서는 우선 가중치 를 적절하게 사용하기 위한 기준을 정하였는데, 조사된 항목들을 유량( f l o w )항목과 저량( s t o c k ) 항목으로 구분하였다. 구분된 항목을 대상으로 각각 한 국가의 정보화에 미치는 영향을 전체항 목의 수치에서 각 항목의 절대적인 수치가 차지 하는 비중을 생각하였다. 그리고 이 비중을 계산 하는 방법으로 모든 항목들의 수치에 1 / 2멱을 사 용하였는데, 이는 절대적인 수치의 차이로 인한 가중치의심한편차가실제데이터의변화추이를 왜곡되게표현하는것을방지하고자하는의도라 고기술하고있다.

그러나 이 방법은 변수들간에 존재하는 서로 다른상관관계의정도를연구자의의도에의하여 저량항목과 유량항목으로 값을 재정의 한 뒤 각 각의 항목 사이에서 차지하는 비중을 고려해야 하는 단점이 있으며, 문항선정의 과정을 통해 악 용또는왜곡될가능성이있다. 또한 1 / 2멱을사용 하는 점에 있어서도 본래 데이터가 가지고 있는 크기를 줄이는 효과이기 때문에 사실을 그대로 반영한다고 볼 수 없을 것이다. 따라서 보다 객관 적방법에의한가중치계산방법이필요하다.

(3)

국가정보화지수 측정방법에 관한 연구

2.

^제

1

^{주성분점수법}

서로상관되어있는각각의항목(변수)들을하 나의지수값으로만드는방법으로제1주성분점수 법이 많이 사용되고 있다. 여기서 제1주성분이란 선정된 변수들의 선형결합으로서 원재료에 내재 하는 전체변이 중 가장 큰 부분을 보유하는 하나 의 인공변수를 말한다. 이는 정보의 손실을 최소 화하는 차원축약의 의미가 큰 점수화법( s c o r i n g method; index)이라고할수있다.

만약 대표점수화의 목적이 개체들의 대표점수 들을 최대한 벌려놓아 그들간의 분산이 가장 크 도록 하는 데 있다면 제1주성분점수는 대표점수 로서의 의미를 지닌다. 그러나 이 방법은 상관계 수가 큰 변수들의 집단에 너무 높은 가중값을 부 여하게 된다는 점과 이를 악용할 소지가 있다는 점에서각개체의대표점수로이용하기에는신중 을기할필요가있다.^{1 )}

3.

^제

1

^{인자점수법}

개체들의 대표점수를 구하고자 할 때 제1주성 분점수와 마찬가지로 하나의 인자만을 고려하는 단일인자모형에근거한인자점수도자주사용한 다. 여기서의 인자란 상호 연관된 다변량 확률변 수들간에내부적의존관계를재현하고있는변수 들의 저변에 깔려 있는 가설적인 개념으로서의 공통성분을 의미한다. 이와 같이 관찰할 수 없는 가설적인 인자는 하나의 확률변수로 생각할 수 있으며, 인자점수는 모형에 따른 확률적 인자에 대한 추측값의 의미를 갖는다. 이와 같은 인자점 수를얻기위한방법으로는대표적으로 T h o m s o n 의 회귀적 방법과 B a r t l e t t의 가중회귀방법 등이 있지만, Thomson의 방법에 의해 구해진 인자점 수가주로사용되어지고있다.

그러나어떤방법에의해구해졌든인자점수라 는것은인자적재행렬의비유일성에의해일반적 으로 유일하게 존재하지 않으며, 앞에서 주어진 표본상관행렬의경우제1주성분점수와마찬가지 로 인자점수법도 인자분석의 속성상 상관관계가 높은 변수들의 집단에 높은 가중값을 부여한다.

즉인자점수도세항목에각각1/2 : 1/2 : 0 정도의 비율로 가중값을 부여한다. 만약 우리의 목적이 서로상관된항목들을결합하여전체적인의미에 서 각 개체들의 대표값을 구하는 데 있다면 이렇 듯 한 쪽으로만 치우쳐진 가중값을 이용한다는 것은불합리한 일일것이다. 또한 제1인자만을 선 택한다는것은제1주성분점수방법과마찬가지로 전체 변수들의 구조를 모두 설명해 줄 수 없는 단 점이 있다. 그렇다면 이런 경우 합당한 가중값을 부여하는 점수화 방법을 유도할 수는 없을까? 이 에대한하나의해답으로대표성분점수화법을제 안하며, 제I I I장에서 구체적으로 측정방법에 대하 여살펴보기로하겠다.

1) 예를 들면, 정보화를나타내는항목으로이동전화, 무선 호출, 텔렉스 가입자수를 조사하였다고 하자.이들의 표 본상관행렬이다음과같이나타났다고한다면이들항목 들에 어떤 가중값을 부여하는 것이 상식적으로 타당할 까?

1.0 1.0 0.0 1.0 1.0 0.0 0.0 0.0 1.0

이런 자료에 대해서 제1주성분점수법을 적용하면 거의 1 / 2:1 / 2:0의비율로가중값을부여하게된다. 그러나이 상관행렬을 잘 살펴보면 이동전화와 무선호출은 거의 완전양의상관관계가있고, 이동전화와텔렉스, 무선호 출과텔렉스는거의독립인것으로보아정보화를 측정 하는데있어서이동전화와무선호출은거의중복평가 된 것으로 볼 수 있다. 따라서 이런 경우라면 이동전화, 무선호출, 텔렉스의세항목에 1 / 4:1 / 4:1/2 정도의비율 로가중값을부여하는것이더타당할것으로여겨진다.

한가지더제안을한다면정보화를측정하는항목으로 써무선호출과이동전화를동시에고려하기보다는무선 호출을제외하고다른항목을고려해보는 것도바람직 할것이다.

(4)

I I I . ^{정보화지수 측정방법}

정보화지수는 국가 전체, 지역 또는 한 부문의 정보화수준을총체적이고함축적으로알기쉽게 파악할 수 있도록 수치화하는 것을 말한다. 국가 전체의 정보화 수준을 나타내는 국가 정보화지 수, 지역의 정보화 수준을 나타내는 지역정보화 지수, 그리고 어느 한 부문의 정보화지수 등 다양 하게 산출될 수 있다. 이러한 정보화지수는 특정 한 국가, 특정한 지역, 특정한 부문이 점차적으로 정보사회로 변화되어 감에 따라 특정한 국가, 특 정한 지역, 특정한 부문에서의 정보화 수준을 정 확하게 파악하고, 그 변화의 추이를 정확하게 예 측하기위해필요하다.

본 연구에서는 국가정보화지수를 이용하여 각 국가간의 정보화 정도를 추정해보는 데 목적이 있다. 여기서 국가정보화지수란“어떤 국가의 정

보화의 정도를 포괄적으로 파악하기 위해 또는 가늠할 수 있도록 작성한 수치"로 정의될 수 있 다. 따라서국가정보화지수를산출하기위해서는 어떤 변수를 이용하여 지수를 작성할 것인가 하 는 문제와 선정된 변수의 가중치를 어떻게 설정 할 것인가 하는 문제가 제기된다. 이와 같은 지수 작성을위한변수의선택은전적으로연구자에게 의존할 수밖에 없다. 따라서 여기서는 그 선택된 변수의 가중치를 어떻게 계산해야 하는가 하는 문제해결방법을검토해보고자한다.

<표 1 >의 구조는 전체적으로 4수준을 갖는다고 볼수있다. 여기에서본연구는두수준만이존재 하는 단일 목표개념 측정을 위한 구조의 확장이 라 볼 수 있기 때문에 <표 2 >와 같이 간단하게 나 타낼 수 있다. 예를 들어 <표 1 >을 참조하면, 단일 목표개념은 정보기반구조지표가 되며 이 지표를 구하기 위해 선택된 측정항목은 PSTN 회선수,

<표1> 정보화지표구성

제1수준 정보화지수

정보화설비지표

정보기반 구조지표

・P S T N

・P S D N

・I S D N

・정보통신기기

・정보기기

・통신기기

・통신서비스

・통신기기부품

・인터넷

・셀룰러

・무선호출

・비디오텍스

・정보통신관련

・과학기술논문

・특허출원

・총연구개발

・연구원수

・통신고용

・고등교육자수

・인구밀도

・국제전화

・텔렉스

・팩스・전화가입

・TV 보급

・PC 보급

・우편사용

・일간신문 정보산업

지표

기초이용 지표

고도정보 이용지표

정보연구 개발투자

정보인력 지표

정보화이용지표 정보화지원지표

제2수준

제3수준

제4수준

(5)

PSDN 가입자수, ISDN 가입자수, 정보통신기기 내수이다. 따라서<표 2 >의표기를인용하면모변 수 ξ는 정보기반구조지표이며, X1은 PSTN 회선 수, X2는PSDN 가입자수등으로나타낼수있다.

미지의 모평균을 추정하기위하여 모평균에관 한 정보를 지닌 개체들의 모집단(개체모집단)에 서표본개체들을추출하여측정값을얻어이들의 어떤 대표값을 이용하듯이, 우리가 알지 못하면 서 직접 측정이 불가능한 하나의 목표개념(모변 수)을추정하고자할때통상의연구자들은그목 표개념과 관련이 있는 측정 가능한 변수들의 모 집단(변수모집단)에서 표본변수들을 추출하여 추출된 각 변수의 측정값을 얻고 이들을 적절히 결합하여얻어진일변량화한어떤대표값을이용 하는 과정을 거친다. 예를 들어 최하위 수준에 있 어서표본변수들에의하여측정값을얻은변수들 은제4수준에위치한값들이며제3수준의값은목 표개념이라 볼 수 있다. 따라서 측정 가능한 항목 제4수준에 위치한 변수들을 이용하여 상위수준 의미지항목들에대한값(혹은지수)을계산해야 하는것이다.

따라서 본연구에서는 지수작성을 위한변수의 선택과 각 변수에 대한 가중치의 설정이라는 문

제를 해결하는 통계적 방법으로써 인자분석기법 (factor analysis technique)과대표성분점수화법을 이용하였다.

1.

^인자분석

여러경우에있어연구하고자하는관심사가되 는개념이나형성과정을관측해보는것은매우어 려운 일이다. 이때, 연구대상의 개념에 관련되는 수집 가능한 여러 변수의 자료를 수집하여 이 자 료들이 요인이라고 불리는 소수의 측정이 어려운 잠재변수와 일치성의 존재여부를 분석하기 위해 서관측된변수들간의상관관계를분석하게된다.

요인분석은 많은 변수들의 상호관계를 공유하 는숨겨진요인들로서설명하고자하는통계적방 법이다. 즉, 서로 상관성이 있는 변수들에 포함된 정보를 최소의 정보손실을유발하는 방향으로몇 개의요인을통하여축약하는방법중하나이다.^{2 )}

인자분석방법을 통하여 계산되는 인자적재치 행렬(factor loading matrix)을 이용하여인자분석 이 내포하고 있는 의미와 이를 이용한 가중치의 설정에대해살펴보고자한다.

<표3 >은변수가 X₁, X₂, X₃, X₄, X₅로5개인경우의 요인적재치행렬을 나타낸 것이다. 대상변수가X₁ –X5까지5개인경우요인은원칙적으로요인1부 터요인5까지5개가존재하게된다. 왜냐하면X 1– X ₅의변수가동일한변수가아닌이상각변수가내 포하는의미는각기다르기때문이다.

요인적재치행렬에서요인적재치(factor loading value: f_{i j}i = 1, 2 , …5 , j= 1, 2 , … 5)와공통성( c o m - 1

2

⋮ N

모평균 μ1 μ2 … μp

개체

변수 X₁ X₂ …

…

⋮

…

X_p 모변수

(ξ)

추정

추정 ξ₁ ξ₂

⋮ ξ_N

<표2> 단일 목표개념 측정을 간접적으로 측정한 자료의 전형적인구조

x1 1

x2 1

⋮

xN1

x1 2

x2 2

⋮

xN2

x1P

x2P

⋮

xN P

2) 예를들어정보기반구조지표는가설적인변량요인이되 며실제로관측되는PSTN 회선수, PSDN 가입자수등과 같은 변수들 사이에 존재하는 상관관계를 설명해 주는 공통의인자로서정보기반구조지표를생각하는것이다.

(6)

munality), 고유치(eigen value)간에는 다음과 같 은관계가성립된다.

즉, 변수 X 1의전체변동분을1이라고할때 f11²은 요인 1에 의해 설명되는 X 1의 변동분을 의미하며 f₁₂²는 요인2에 의해 설명되는 X ₁의변동분을 의미 한다. 따라서 요인 1 요인5에 의해 설명되는 X ₁의 변동분의합계 f11² + f12²+ f13² + f14²+ f15²은 1이된다.

또한요인1이설명하는 X1, X2, X3, X4, X5의변동분 의 합계인 f₁₁² + f₁₂² + f₁₃² + f₁₄² + f₁₅²을 고유치라고 하는데, 이는요인1이 전체변동 중에서설명하는 부분을 나타낸다. 이제 지수의 작성에 필요한 변 수의 설정과 가중치를 부여하는 방법에 대하여 살펴보도록 하자. <표 3 >의 요인적재치행렬에서 X ₁의요인적재치중에서는 f_{1 1}이, X ₂의요인적재치 행렬에서는 f2 1이, X 3의 요인적재치행렬에서는 f3 1

이, X 4의요인적재치행렬에서는 f4 2가, 그리고X5의 요인적재치행렬에서는f_{5 2}가 가장 높은 값을 갖는 다고가정하자. 이경우 X ₁, X ₂, X ₃은요인1에의해 동일한 성격을 갖는 하나의 집단으로 집계 ( g r o u p i n g )될수있으며, X 4 , X 5는요인2에의해동

일한 성격을 갖는 하나의 집단으로 집계될 수 있 다. 따라서 X 1에서 X 5는 요인 1과 요인 2로 대표되 는 2개의집단으로구분될수있으며, 이러한과정 을 통하여 지수의 작성에 필요한 변수의 선정이 이루어지게된다.X ₁, X ₂, X ₃이하나의집단으로집 계되었을때가중치는요인적재치를이용하여작 성된다. 즉, 요인1에의하여설명되는 X 1 , X 2, X 3의 변동분 f₁₁²+ f₂₁²+ f₃₁²에대한각변수의변동분( f _{i 1}², i = 1 , 2 , 3)이각변수의가중치가된다. 따라서X ₁의 가중치는 f1 1²/( f1 1²+ f2 1²+ f3 1²)이되고, X 2의가중치 는 f21²/( f11²+ f21² + f31²)이되며, X 3의가중치는 f31²

/( f₁₁² + f₂₁² + f₃₁²)이 된다. 지수는 각 변수에 대한 가중치와각변수의표준화된값( Z - s c o r e )을이용 하여다음과같이계산된다.

여기서 Z ₁, Z ₂, Z ₃은각각 X ₁, X ₂, X ₃의표준화된 값이다. 이와 같은 방법으로 계산된 지수 ξ는 표 준정규분포를 이루게 되는데, 이는 마이너스 값 과 플러스 값이 동시에 존재하게 되므로 객관적 인 평가가 용이하지 않게 된다는 문제점을 지니 고 있다. 따라서 지수 ξ를 일정한 구간내의 플러 스 값을 갖도록 변형시킬 필요가 있다. 본 연구에 서는각변수에대한가중치와표준정규분포치로 부터 계산된 지수 ξ를 0 ～ 1 사이의 값을 갖는 지 수로변환하였다.

위에서계산한인자점수를얻기위한방법은가 중되지 않은(일반화) 최소자승법( u n w e i g h t e d (ordinary) least squares procedure)을사용한것이 다. 즉, 인자모형 X–μ_{= F ξ+}

ε

에서, E(

ε

)= 0과 c o v(

ε ε

^′)= D i a g {π1,π2 , ^…,πp } =Ψ을가정하고있는

<표3> 요인적재치행렬 변수

E i g e n V a l u e

요인1 C o m m u

- n a l i t y X1

X2

X₃ X₄ X₅

f1 1

f2 1

f3 1

f4 1

f5 1

E₁

요인2 f1 2

f2 2

f3 2

f4 2

f5 2

E₂

요인3 f1 3

f2 3

f3 3

f4 3

f5 3

E₃

요인4 f1 4

f2 4

f3 4

f4 4

f5 4

E₄

요인5 f1 5

f2 5

f3 5

f4 5

f5 5

E₅ C₁ C2

C3

C₄ C₅

f₁₁²+ f₂₁² + f₃₁² f₁₁²

× Z 1 + ξ=

f₁₁²+ f₂₁²+ f₃₁² f₂₁²

× Z 2

+

f11²+ f21² + f31²

f31²

× Z 3

f_ij²= C _i= 1

fij²= E j , E j = 5

(7)

데,‘πi , i=1, 2,…, p의 값이 같다’라고 가정하는 것 이다. 여기에서X는 p개의 변수들로 구성된 확률 벡터이며, F와 ξ는 요인적재치와 공통인자, 그리 고

ε

은 오차벡터이다. 따라서 지수 ξ를 다시 쓰면 (f ^′f )^{- 1}f ^′Z로써 Z는 X의표준화된확률벡터이며, f 는인자분석에의하여계산된요인적재치벡터이 다.

그러나‘πi , i=1, 2,…, p의값이같다’라는가정은 실제적이지 않기 때문에, 이러한 문제를 해결하 기 위하여 T h o m s o n ( 1 9 5 1 )이제안한 회귀적방법 (regression method)과 B a r t l e t t ( 1 9 3 7 )의 가중최소 자승법(weighted least squares procedure)이 제안 되었다. 본 연구에서는 B a r t l e t t의 방법을 사용할 것을 제안하고자 하며, 이 방법에 의해 계산되는 지수 ξ는(f ^′ψ^{- 1}f )^{- 1}f ^′ψ^{- 1}Z 이다. 단, ψ는인자분석에 의하여계산된특수분산(specific variance)이다.

지금까지 인자분석에 의한 인자점수( f a c t o r score) 즉, 지수를계산하는방법에대하여검토하 였다. 그러나 이 방법이 가진 단점은 인자분석이 갖는 특성에 의하여 상관관계가 높은 일련의 변 수들에 높은 가중값을 주게 되고, 반면에 상관성 이 적은 변수의 가중값은 상대적으로 매우 작아 z e r o에 가까운 값이 나오는 결과가 나타나게 된다 는데있다. 앞의예에서도살펴보았듯이실험자의 의도는 5개의 변수 X 1 , X 2 , X 3 , X 4 , X 5에 의하여 모 두설명되기를기대했지만(X ₁, X ₂, X ₃)그룹과(X ₄, X ₅)그룹으로 분리되어 설명되어 진다. 따라서 우 리가목적으로하는표본변수들전체를대표하는 값이라고 보기에 어려울 것이다. 따라서 다음의 대표성분점수화법을제안하고자한다.

2.

^{대표성분점수화법}

대표성분점수화법(Representative Component Scoring System: RCSS)는 이광진( 1 9 9 7 )에 의하

여 제안된 방법이다. Ω를 상위목표개념(ξ)과 관 련이 있는 직접측정이 가능한 모든 변수들의 집 합이라고 하자. 일반적으로, Ω는 무한집합의 성 격을지니면서그원소들간에는양의상관관계를 지닌다. 한편 연구자를 포함한 전문가들이「Ω의 각 원소들이 ξ와 가지는 상대적 관련성의 정도를 상관계수의잣대로보면 ( 1 )과같은것이다」라고 의견일치를내릴수있다면, 그리고 ξ는 Ω의원소 들의선형결합으로구현될수있다는가정을받아 들일 수 있다면, 이는 바로 상위목표개념을 고정 화시키는것즉, 객관적으로정의하는것이된다.

c o rr(X₁,ξ):c o rr(X₂,ξ) :…:c o rr (X_t,ξ) = k₁: k₂: … : k_t (1) 여기에서 k1, k2, …, kt는 상수들이고, t 는 ∞일 수도 있다. 후자는 ( 1 )을 만족하는 ξ의 추정값 Y 즉, 조작화된상위목표개념의측정값을구하기위 해 Ω로부터 p개의 표본변수들 X1 , X2 , …, X p를 의 도적으로 추출하였다고 하자. 그러면 ( 1 )의 관계 는다음과같이쓸수있다.

c o rr(X1, Y): c o rr (X2, Y):… :c o rr(Xp ,Y) = c1:c2 : … : cp

( 2 ) 여기에서c₁, c₂,…, c_p는상수들이다. 이제X _j들의 선형결합으로써 ( 2 )를만족하는 Y를구해보자. 표 준화된(s t a n d a r d i z e d) 확률벡터(random vector) X= (X₁, X₂, …, X_p) ^′가 공분산행렬(covariance ma- trix) R = ( ri j )을 가진다고 하자. 이때 상수벡터 (constant vector)a=(a ₁, a ₂,…, a p )^′에대해다음조 건을만족하는변수 X_j,j = 1 , 2 ,…,p들의선형결합 인 Y를생각한다. 즉,

Y= a^′X, 단, a^′1p=1 for 1p=(1, 1, …, 1)^′ (3) 이다. 그러면 X 와 Y의 표본공분산은 ( 4 )와 같으

(8)

며, 여기에서cp= c1_p라고가정한다.

cov (X, X^′a) = Ra= c1_p, 단, c는상수이다. (4)

따라서( 4 )를만족하는 a와Y는각각다음과같 다.

a= cR ^–11_p, 단, c= 1/ 1_p^′R ^–11_p

Y= 1_p^′R ^–1X / 1_p^′R ^–11_p (5)

여기에서계산된 Y를표준화된표본변수 X의 대 표성분(representative component)이라고 정의하 였으며, i번째개체에대한대표성분점수는Y _i= 1_p^′ R ^–1x_i/ 1_p^′R ^–11_p, i= 1 , 2 ,…, N 이다.

즉, 대표성분점수는 지수를 의미하므로 i 번째 개체(혹은 국가)의 지수값은 플러스와 마이너스 값을 가지게 된다. 따라서 본 연구에서도 이 값들 을0과1사이의값을갖도록변환하였다.

IV. ^사례분석

본 장에서는 제I I I장에서 제시한 인자분석과 대 표성분점수화법을 이용하여 정보화지수를 계산 하였다. 분석대상으로 선진국, 중진국, 후진국의 세그룹으로나누었다. 연구대상국선정은대표성 과 자료의 신뢰 및 입수가능성이 선정의 기준이 되었다. 분석대상으로 선진그룹은 미국, 영국, 독 일, 프랑스, 일본등이고중진그룹으로는한국, 대 만, 싱가포르, 홍콩, 말레이시아 등이며, 후진그룹 으로는 인도네시아, 파키스탄, 필리핀, 중국, 인도 등이다.

분석대상 시기는 1 9 8 7년부터 1 9 9 6년으로 하였 는데, 이 기간 동안 세계적으로 정보관련산업이 급속히 발달하였고, 각 국의 정보화에 대한 마인

드 및 정보화 추진에 있어서 가장 중요한 시기이 기 때문이다. 분석자료들은 정보통신부, 통신개 발연구원, 통계청, 한국은행, 한국전산원, 한국전 자통신연구원, 통신진흥협회, IMF 통계자료, ITU 통계자료, IDC 등에서 기초지표자료를 구하였으 며, 통계의 일관성을 확보하기 위하여 신뢰성이 확보된 자료만을 사용하였으며 통계패키지는 S A S를사용하였다.

본 고에서는 3가지 방법에 의한 정보화를 측정 해보았다. 여기서 방법 1, 방법 2, 그리고 방법 3으 로 구분하는데, 방법 1은 일반화최소자승법에 입 각한 인자분석방법이며, 방법 2는 가중최소자승 법에의한인자분석방법이다. 방법3은 본고에서 새롭게 제안하고 적용해본 대표성분점수화법을 이용한 정보화지수 측정방법이다. <표 4 >는 측정 모델에서 사용한 인자분석 및 대표성분점수화법 으로측정한국가정보화가중치값들을비교한것 이다.

정보기반구조지표의 가중치를 분석해보면, 방 법1에서 P S T N (4 4 4 . 5)이가장높고정보통신기기 내수(6 6 . 4)는 제일 낮게 나타나 있다. 방법 2의 경 우방법1과유사하게 P S T N (4 9 4 . 1)이제일높고정 보통신기기내수(1 2 6 . 7)는제일 낮게나타나있다.

그러나방법3의경우정보통신기기내수(3 3 4 . 6)가 제일높게나타나고P S T N (3 1 . 6)은제일낮게나타 나고있다.

정보인력지표의 가중치를 살펴보면, 방법 1의 경우연구원수( 3 6 1 . 0 )가제일높게나타나있고인 구밀도( 3 4 . 7 )는 낮게 나타나 있다. 방법 2의 경우 방법1과유사하게연구원수( 4 4 2 . 7 )는높게나타났 고 인구밀도( 3 4 . 7 )는 낮게 나타나 있다. 방법 3의 경우, 방법1과방법2와는달리인구밀도( 4 0 4 . 5 )가 가장 높게 산출되었고, 통신고용( 9 2 . 7 )이 제일 낮 게나타나고있다.

(9)

정보화 측정 항목

정보설비지표

정보이용지표

정보지원지표

정보기반구조지표

정보산업지표

기초정보이용지표

고도정보이용지표

정보화

연구개발투자지표

정보인력지표

방법1 (인자분석: 일반

화최소자승법)

방법2 (인자분석: 가중

최소자승법)

방법3 (대표성분 점수화법)

<표4> 측정방법별정보화가중치(1 9 9 1년)

<표4 >에서볼때방법1과방법2를적용한결과 가중치는 다소 차이를 보이고 있으나 유사성이 높게나타났으며, 방법3과비교적큰차이를보이 고 있다. 그 이유는방법1과 방법2는변수들간의 상관관계를고려하여관련성이높은변수들에가 중치를 주는 방법이기 때문에 값에 차이는 있지 만경향은유사하게나타나는반면, 방법3은상관 관계가높은변수들이차지하는가중치를분할해 서배분하고그와관련이적은부분에좀더큰가 중치를부여하는방법이기때문에상이한결과를

보여주고있다.

<표 5 >는 세가지 방법에 의해서 측정된 정보화 지수를 보여주고 있다. 가중치 산출 분석에서 설 명한 바와 같이 방법 1과 방법 2는 전체적으로 유 사한결과를보이고있다. 그러나방법3의경우는 비교적상이한결과를보이고있다. 방법1의경우 미국( 5 0 8 . 2 )은 선진그룹 중 제일 높은 정보화 수 준을 보이고 있으며, 독일( 3 1 1 . 6 )의 경우 낮은 수 준을보이고 있다. 방법 2의경우방법 1의경우와 유사하게 미국( 5 3 8 . 2 )은 높은 수준을 독일( 3 1 5 . 7 ) PSTN 회선수

PSDN 가입자수 ISDN 가입자수 정보통신기기내수 정보기기내수액 통신기기내수액 통신서비스매출액 통신기기부품내수 국제전화이용시간 텔렉스가입대수 팩스대수 전화가입자수 TV 보급대수 PC 보급대수 우편사용량 일간신문구독 인터넷호스트수 셀룰러가입자수 무선호출가입자수 비디오텍스가입자수 정보통신관련투자액 과학기술논문발표 특허출원 총연구개발비투자 연구원수

통신고용 고등교육자수 인구밀도

4 4 4 . 5 3 2 3 . 6 1 6 5 . 5 6 6 . 4 1 1 5 . 9 3 8 4 . 7 8 1 . 5 4 1 7 . 8 3 5 . 8 8 . 2 1 5 7 . 2 2 1 9 . 3 1 8 3 . 3 1 3 3 . 6 1 2 3 . 7 1 3 8 . 8 3 0 9 . 5 3 2 0 . 5 3 3 8 . 5 3 1 . 5 1 7 8 . 0 3 8 7 . 2 3 8 4 . 1 5 0 . 7 3 6 1 . 0 3 4 3 . 7 2 6 0 . 6 3 4 . 7

4 9 4 . 1 2 2 6 . 6 1 5 2 . 6 1 2 6 . 7 1 1 0 . 2 3 7 5 . 8 8 7 . 6 4 2 6 . 4 7 6 . 0 6 8 . 4 1 1 8 . 6 2 7 7 . 5 1 4 7 . 9 1 0 4 . 4 1 0 0 . 1 1 0 7 . 0 1 9 8 . 3 2 5 1 . 2 4 7 2 . 1 7 8 . 4 1 3 6 . 8 4 0 1 . 3 3 9 4 . 5 6 7 . 5 4 4 2 . 7 3 3 6 . 6 1 4 9 . 5 7 1 . 2

3 1 . 6 3 3 0 . 4 3 0 3 . 4 3 3 4 . 6 4 1 2 . 5 1 1 2 . 2 3 9 1 . 7 8 3 . 5 5 3 . 7 1 8 2 . 1 5 8 . 8 1 6 . 3 1 3 4 . 5 1 1 3 . 6 2 0 6 . 5 2 3 4 . 5 1 3 9 . 5 1 8 1 . 2 1 7 9 . 0 5 0 0 . 2 3 3 0 . 0 7 3 . 2 1 4 9 . 9 4 4 7 . 0 1 0 0 . 7 9 2 . 7 4 0 2 . 1 4 0 4 . 5

(10)

은 낮은 수준을 보이고 있다. 방법 3의 경우는 프 랑스( 1 , 1 8 5 . 9 )가 매우 높은 정보화 수준을 나타내 고 있으며, 영국( 2 8 0 . 1 )의 경우는 매우 낮은 수준 을기록하고있는것으로나타났다.

여기서프랑스정보화지수가 높은 이유는 정보 이용지표( 2 , 8 0 2 )가미국( 4 8 8 )이나, 영국( 3 0 4 )보다 월등히 높고 세부지표로 보면 기초정보이용지표 ( 4 6 9 )와고도정보이용지표( 5 , 1 3 4 )가다른국가들 보다높았기때문이다.^{3 )}

V. ^{결 론}

지금까지 서로 상관된 국가정보화지표들을 결 합하여 하나의 가중치를 구하는 세 가지 방법과, 이를이용하여방법별로정보화지수를산출한결 과를 비교・분석하여 보았다. 세 가지 방법들에 의한 가중치 및 지수는 다소 값의 차이를 보이고 있지만 전체적인 추이는 같음을 알 수 있다(그림 1). 방법 1과 방법 2는 요인분석에 의한 분석결과

로서 가중치나 지수에서 다소의 차이를 보이고 있지만유사성이매우크며, 방법3에의한분석결 과는 앞의 방법들과는 가중치 및 지수에서 차이 를보이고있다. 특히방법3은다른측정방법과는 달리상관성이높은변수들에게가중치가집중되 는 현상을 방지할 수 있으며, 가중치를 배분하기 때문에가중치배분에서소외된항목에도가중치 를부여하게된다. 따라서방법1과방법 2보다 더 객관적으로 각 지표의 가중치를 반영한다고 볼 수 있어 어느 정도 이 방법에 의한 분석이 유의함 을보여준다.

<표5> 측정된방법별정보화지수(1 9 9 1년)

국가명

방법1 (인자분석: 일반화

최소자승법)

방법2 (인자분석: 가중

최소자승법)

방법3 (대표성분점수화법) 미국

영국 독일 프랑스 일본 한국 대만 싱가포르 홍콩 말레이시아 인도네시아 파키스탄 필리핀 중국 인도

5 0 8 . 2 3 3 1 . 4 3 1 1 . 6 4 6 5 . 6 5 0 1 . 6 1 0 0 . 0 1 8 4 . 1 5 5 5 . 7 4 0 1 . 4 5 7 . 7 6 . 0 5 . 2 1 0 . 7 1 0 . 6 6 . 9

5 3 8 . 2 3 3 4 . 9 3 1 5 . 7 3 9 3 . 8 5 4 7 . 5 1 0 0 . 0 1 8 6 . 7 5 4 2 . 2 3 6 9 . 8 5 7 . 9 6 . 2 4 . 8 1 1 . 6 1 0 . 7 6 . 3

5 0 1 . 6 2 8 0 . 1 3 4 5 . 1 1 , 1 8 5 . 9 5 8 4 . 6 1 0 0 . 0 1 7 4 . 8 7 9 8 . 1 4 3 0 . 9 6 6 . 3 8 . 1 6 . 3 1 5 . 1 8 . 1 7 . 9

3) 대표성분점수화법에서 프랑스가 1위인 반면에 다른 인 자분석에서는 미국이 1위인 결과가 나타난 원인으로는 고도정보이용지표에서의측정항목인인터넷, 셀룰러, 무 선호출, 비디오텍스들의상관관계가 { (인터넷, 셀룰러, 무 선호출) (비디오텍스) }로 g r o u p i n g됨으로써 인자분석에 서는인터넷, 셀룰러, 무선호출에큰 w e i g h t를주어비디 오텍스가무시되는경향이강하다. 대표성분에서는비디 오텍스의영향을 고려하고있다. 이에따라미국과프랑 스의비디오텍스보급률이1 0배이상차이가남에따라서 방법에따른순위변동이나타나게되었다(좀더자세한 내용은다음호에게재될예정임) .

(11)

본 연구결과는 사회과학, 계량연구, 정보화 관 련 지수개발 및 측정방법 개발에 있어서 일조를 할 수 있으리라고 여겨진다. 그러나 정보화 가중 치를 구하는 과정에 있어서 가중치의 왜곡이 있 을 수도 있는데, 이를 보완하기 위해서는 정보화 지표들의합리적인선정문제가선결하여야 하며, 나아가 이런 문제를 보다 근본적으로 해결하기 위하여는지속적으로정보화측정방법에대한통 계학적연구가후속되어야할것이다.

참 고 문 헌

[ 1 ] 김충련, SAS라는통계상자, 데이터리서치, 1994, pp.

4 17–4 6 0 .

[ 2 ] 김기영, 전명식, SAS 주성분 분석, 자유아카데미, 1 9 8 9 .

[ 3 ] 백운붕, 이재창, 통계적 방법 I, 법경출판사, 1986, pp. 49–5 3 .

[ 4 ] 송문섭 외 3인 , 통계자료분석, 자유아카데미, 1992.

[ 5 ] 이광진, “대표성분점수화법의제안과이의타당성

및활용성에관한연구 ,”응용통계연구, 제1 0권 2호, 1997, pp. 275–2 9 1 .

[ 7 ] 유지성, 오창수, 현대통계학, 박영사, 1995.

[ 8 ] L.A. Guttman, A New Approach to Factor Analysis, New York, Columbia University Press, 1954.

[ 9 ] Harold J. Larson, INTRODUCTION TO PROBABILITY THEORY AND STATISTICAL INFERENCE, JOHN WILEY & SONS, 1982.

[ 1 0 ] Richard A. Johnson and Dean W. Wichern, A P P L I E D MULTIVARITE STATISTICAL ANALYSIS, Prentice- Hall International Editions, 1988, pp. 378–4 3 7 . [ 1 1 ] Robert V. Hogg and Allent T. Craig, I N T R O D U C T I O N

TO MATHEMATICAL STATISTICS , Macmillan Publishing Co., Inc., 1989.

[ 1 2 ] D. Nachmias and C. Nachmias, Research Methods in the Social Sciences, 2^{n d}ed. St. Martin's Press, Inc., 1981.

(그림1) 측정방법별국가정보화지수추이변화 (미국의경우)

6 0 , 0 0 0 5 0 , 0 0 0 4 0 , 0 0 0 3 0 , 0 0 0 2 0 , 0 0 0 1 0 , 0 0 0

01987 1988 1989 1990 1991 1992 1993 1994 1995 1996

방법 1 방법 2 방법 3

(지수)

(연도)

A Study of Measurement for National Information Index