슈퍼컴퓨터 4호기 수요분석 - 한국과학기술정보연구원 슈퍼컴퓨터 도입 타당성 분석

4.1.1 수요분석 모형

(1) 수요예측을 위한 이론적 검토

예측은 과거와 현재를 반추하여 미래 특정시점에서 어떠한 일이 일어날 것인가 를 미리 추측하는 것이다. 이러한 예측이 제품이나 서비스에 대한 미래의 고객 또 는 사용자 수요를 추정하고자 할 경우 이를 수요 예측이라 한다. 수요 예측기법은 일반적으로 정성적 기법과 정량적 기법으로 구분된다. 정성적 수요 예측기법은 과 거의 정보가 부족하거나 과거의 추세가 미래에도 지속될 가능성이 적을 때 예측 자의 주관적인 판단 등을 이용하여 예측하는 기법이며, 정량적 수요 예측기법은 주로 과거의 자료들을 이용하여 계량적으로 미래를 예측하는 기법이다.

<표 4-1> Methods of demand forecasting

구분 예측기법

정성적 기법 시장조사법, 전문가 토론, 델파이기법, 시나리오 분석, 역사적 유추 등

정량적 기법

시계열 분석 이동평균법, 지수평활법, ARIMA 분석 등 인과관계 분석 회귀분석, 계량경제모형, 신경망분석 등

시스템 모형 투입산출모형(Markov), 시스템다이내믹스 모형 등

성장곡선 모형

Logistics 곡선, 수정지수 곡선 등

확산모형: Bass의 확산 모형, Bayus의 유사추론 확산 모형, 다세 대 확산 모형 등

정성적 수요 예측 기법으로는 시장조사법, 전문가 토론, 델파이기법, 시나리오 분석, 역사적 유추 등이 있으며, 정량적 기법은 시계열 분석, 인과관계분석, 시스 템모형, 성장곡선모형 등으로 세분화되어질 수 있다.

이상과 같은 다양한 수요 예측기법 중 시계열 분석, 인과관계 분석, 시스템 모 형 등은 주로 과거의 역사적 데이터를 기반으로 분석되는 기법 들이며, 과거의 변 화 추세나 인과관계들이 미래에도 유사하게 유지될 것이라는 가정들을 내포하고 있는 기법들이다. 따라서 미래의 변화가 과거와는 단절되게 일어나거나 새로운 제

품이나 서비스가 출현하는 경우 기존의 방법으로는 수요예측을 적절히 수행하기 가 어렵기 때문에 시장조사나 델파이와 같은 정성적 기법들이 많이 사용되어 왔 다. 그러나 이러한 정성적 기법들은 조사대상자들의 표본 추출 문제, 개인의 주관 적 판단과 영향력 크기가 예측 결과에 많은 영향을 미치기 때문에 그 신뢰도가 떨어지는 단점이 있다.

본 연구의 분석대상인 KISTI 슈퍼컴퓨터는 이미 과거부터 지속적으로 사용되어 온 제품으로서 과거의 역사적 데이터들이 축적되어 있는 상태이다. 따라서 정성적 수요 예측 보다는 과거 자료를 바탕으로 한 정량적 수요 예측이 그 예측결과의 신뢰도를 더 높일 수 있는 방법이라 판단된다.

정량적 예측 기법은 보다 구체적으로 시계열 분석, 인과관계분석, 시스템모형, 성장곡선모형 등으로 세분화되어질 수 있다. 여기서는 모든 정량적 기법들을 다 살펴보지 않고 본 분석대상에 보다 적합하다고 판단되어지는 몇 가지 대표적인 기법들을 중심으로 살펴보고자 한다.

먼저 시계열 분석 기법 중에서 이동평균법(moving average)은 가장 간단한 방 법으로서, 과거 일정기간의 자료를 평균하여 곧바로 다음 기간의 예측치로 사용한 다. 제품이나 서비스의 수요가 급격하게 변하지 않고 그리고 계절적 변동 요인을 가지고 있지 않는 경우에 유용하다. 이동평균법에는 크게 두 가지 방법이 있는데, 과거 일정기간의 실적치에 동일한 가중치를 두는 단순이동평균법(simple moving average)과 일정기간 중에서 최근 실적치에 가장 높은 가중치를 두는 가중이동평 균법(weighted moving average)이 있다. 또 다른 시계열 기법인 지수평활법 (exponential smoothing)은 가중평균의 일종으로서 최근 자료에 더 많은 가중을 두어 평활시키는 기법이다. 이 기법의 장점은 모형이 비교적 이해하기 쉽고 간단 하다는 점이다.

이동평균법과 지수평활법이 이해하기 쉽고 사용하기 쉽다는 장점이 있는 반면 통계적으로 얼마나 신뢰할 수 있느냐의 문제가 있다. 이에 반해 ARIMA분석 (Box-Jenkins 모델)은 여러 형태의 단변량시계열 자료를 확률모형(AR, MA, ARMA, ARIMA, 계절 ARIMA)에 접목시켜 효과적으로 분석하는 방법으로서 어떤 형태를 가진 시계열자료라도 분석을 할 수 있는 일반성을 가졌으며, 이론적으로 잘 정립되어 있고, 경험에 의하면 이 방법에 의한 예측의 정확성이 다른 방법(복 잡한 계량경제모형 분석)에 뒤지지 않은 것으로 알려져 있다.

인과관계분석 기법 중의 하나인 회귀분석법은 전적으로 과거 자료에만 의존하 여 시계열을 따라 그 추세나 경향을 좇아 미래를 예측하는 것이 특징이다. 이것은 과거 자료에 나타나 있는 수요 패턴이 미래에도 지속된다는 가정에서 적용하는 예측기법이다. 환경이나 수요 변화가 심한 경우에는 예측이 부정확해지며, 그 패

턴을 파악하기가 어렵다. 따라서 시계열 기법은 수요패턴이 비교적 안정되어 있는 제품의 자료나 중단기 예측에 적합하다. 수요예측에서 회귀분석을 하면 장기적인 추세변동을 확연하게 알 수 있다. 추세 변동선은 주어진 시계열 산포자료 위에 대 개 일직선으로 나타내는데, 이것을 회귀선이라고 부르다.

슈퍼컴퓨터 수요예측을 위해 어떠한 분석방법을 사용할 것인가? 본 연구에서는 다양한 각도에서 각 모델의 한계점을 살펴보고, 연구자들의 토론과 전문가의 의견 들을 수렴하여 질적 판단에 근거하여 비교적 바람직한 모델을 선택하고자 하였다.

거시경제지표를 독립변인으로 하는 회귀분석모델은 여러 가지 환경적 요인의 변화 특히 연구개발비의 변화에 크게 영향을 받기 때문에 미래의 가능한 변화를 반영할 수 있으며, 이론적으로도 설명력이 높다고 할 수 있다. 물론 독립변인으로 쓰이는 여러 변수들 자체도 예측해야 한다는 단점이 있지만, 본 연구에서는 다양 한 환경의 변화를 반영하여 예측한다는 점에 의미를 두고 이를 사용하고자 한다.

또한 시간을 설명변수로 하는 단순회귀모델을 이용하여 그 추세를 예측할 수 있다. 이 모델은 미래의 가능한 변화를 반영하지 못한다는 한계를 지니고 있으나, 과거의 추세를 충실히 반영하고 있다는 점에서 의미가 있으며, 그 간편성과 용이 성 때문에 많이 사용되어지고 있는 모델이다.

따라서 본 연구에서는 정량적 예측 모델 중 거시경제지표 등을 독립변수로 하 는 회귀분석모형과 시간을 독립변수로 하는 시계열 단순회귀모형을 선택하여 슈 퍼컴퓨터 수요를 예측하고자 한다.

(2) 4호기 슈퍼컴퓨터 수요예측을 위한 절차 및 모형

예측모형은 크게 두 가지 방향으로 구분되어 질 수 있다. 하나는 거시경제지표 및 학술연구 지표를 독립변인으로 하는 회귀분석모델을 통해 국내 학술연구용 슈 퍼컴퓨터 규모의 적정치를 예측하고자 한다. 이는 국내 슈퍼컴퓨터 및 KISTI 슈퍼 컴퓨터에 관한 시계열 자료가 충분하지 않아, 시계열 자료를 이용한 회귀분석들이 매우 힘들기 때문에, 안문석(1997)과 신태영(2000)의 연구를 참고하여 전 세계 슈 퍼컴퓨터 보유 국가들에 관한 횡단면 자료를 이용하여 분석하고자 하는 것이다.

국내 슈퍼컴퓨터 성능의 적정규모를 예측 한 후, 그동안 KISTI가 국내 슈퍼컴퓨 터 규모에서 차지하여 왔던 비중을 감안하여 KISTI의 슈퍼컴퓨터 4호기에 대한 수요를 산출해내고자 한다. 이러한 분석절차는 외국 특히 OECD(본 연구의 주요 대상 국가들임) 국가들이 평균적으로 적정수준의 슈퍼컴퓨터를 보유하고 있다는 가정을 기반으로 하고 있다.

다른 하나는 TOP500의 학술연구용 총 성능치의 시계열 자료를 바탕으로 시계

열 예측을 한 후, TOP500 학술연구용 슈퍼컴퓨터 총 성능 중 KISTI가 차지하여 왔던 비중을 고려하여 KISTI 슈퍼컴퓨터 4호기의 적정 수요를 예측하고자 한다.

이를 위해 위 두 가지 방향을 기준으로 선택된 여러 개의 모형 중 가장 설명력 이 높은 모형을 기준으로 최종적으로 슈퍼컴퓨터 4호기의 수요를 예측하고자 한 다.

먼저 분석을 위한 기초 데이터는 TOP500(2004.11월 기준)의 국가별 RMax와 OECD통계상에 나타난 국가별 각종 거시경제 및 연구개발 자료를 수집하여 정리 하였다. 특히 KISTI 슈퍼컴퓨터 4호기의 주요 용도가 학술 및 연구에 집중되고 있 기 때문에, 적절한 수요 예측을 위해서는 상업용을 제외한 학술연구용 슈퍼컴퓨터 만을 대상으로 분석하여야 보다 그 적정성이 높다고 판단된다. 따라서 TOP500의 국가별 RMax 산출은 학술연구용(Research/Academy) 슈퍼컴퓨터만을 대상으로 산출하였다.

한편 학술연구용 TOP500 슈퍼컴퓨터를 보유한 국가의 수는 모두 21개 국가이 지만, 거시경제 및 학술연구 데이터를 구하기 어려운 2개 국가(Belarus, India)를 제외하고, 홍콩은 중국에 포함시켜 총 18개 국가를 대상으로 분석하였다. 18개 국 가는 호주, 캐나다, 핀란드, 프랑스, 독일, 이탈리아, 일본, 한국, 멕시코, 네덜란 드, 스페인, 스웨덴, 영국, 미국, 중국(홍콩), 러시아, 싱가폴, 대만 등이다.

분석에 사용된 주요 독립변수들은 국내총생산(GDP), 연구개발비, SCI 논문수, 인구 등이다. 이들 자료들은 주로 OECD 및 기타 통계자료들을 참고하여 수집하 였으며, 2001년도 부터 2003년도의 데이터를 수집하여 이를 평균하여 사용하였 다. 3년간 데이터의 평균값으로 사용한 이유는 특정연도의 자료보다 한결 안정적

문서에서 한국과학기술정보연구원 슈퍼컴퓨터 도입 타당성 분석 (페이지 75-92)