2004, Vol. 15, No. 2, pp. 331∼337
A Study on The Optimization Method of The Initial Weights in Single Layer Perceptron
Yong-Jun Cho 1) ․ Yong-Goo Lee 2)
Abstract
In the analysis of massive volume data, a neural network model is a useful tool. To implement the Neural network model, it is important to select initial value. Since the initial values are generally used as random value in the neural network, the convergent performance and the prediction rate of model are not stable. To overcome the drawback a possible method use samples randomly selected from the whole data set.
That is, coefficients estimated by logistic regression based on the samples are the initial values.
Keywords : 로지스틱 회귀모형, 신경망, Neural Network, SLP
1. 서론
신경망에 대한 최근의 연구는 전통적인 통계적 알고리듬에 대한 제약조건을 완화 또는 보완하기 위한 신경망 알고리듬의 적합에 대한 것이 주를 이루고 있다. 또한 신 경망의 성능 개선을 위하여 컴퓨터 프로그래밍 또는 시스템 구조개선 등의 공학적 연 구가 되고 있는 것이 일반적이나, 최근 데이터 마이닝에 대한 통계적 관점에서의 연 구가 활발해지고 있다
통계적 관점에서 보았을 때, 신경망 분석을 평가하는 중요 요소는 모델의 예측력과 모델 산출의 완성도라고 할 수 있다. 하지만, 신경망 알고리듬은 초기치의 할당에 따 라 이 두 가지 요소가 달라지는 단점을 지니고 있다. 본 논문에서는 이런 단점을 보 완하고자 신경망의 가장 기본인 단층 퍼셉트론(Single Layer Perceptron : SLP) 이론 에 근거하여 보완알고리듬을 제시하고자 한다.
SLP 알고리듬은 중간단계에 활성함수를 사용하게 되는데, 여기에 각 입력값에 초기 의 임의 가중치(initial random value)를 할당하게 된다. 여기에서 임의의 초기 가중치 1) 제 1저자 : 서울 동작구 흑석동 221번지 중앙대학교 수학통계연구소 박사
[email protected]
2) 서울 동작구 흑석동 221번지 중앙대학교 수학통계학부 교수
[email protected]
가 어떻게 할당되는가에 따라 모델을 생성하게 되는 시간과 예측의 결과가 달라지므 로 1회의 임의의 가중치 부여로는 완벽한 모델의 생성이 힘들게 된다. 이는 예측력과 관련된 국소 최적해(local optimum solution)와 대역해(global solution)의 문제와, 모델 생성 과정과 관련된 수렴의 신속성 문제가 발생하게 된다.
본 연구의 목적은 퍼셉트론의 단점을 보완할 수 있는 적절한 초기 가중치를 구함으 로써 신경망의 예측의 정확도와 모형 수렴의 신속성에 대한 최적의 방법을 찾고자 하 는 것이다. 즉, 예측의 정확도와 모형 수렴의 신속성을 향상시키길 수 있는 합리적인 초기 가중치를 찾는 것이 본 논문의 연구목적이라 할 수 있다.
따라서 본 논문에서는 대용량 자료를 고려하였을 때, 예측정확도와 모형 수렴의 신 속성 향상을 위해 신경망에서 사용되는 초기 가중치에 임의의 초기치가 아닌 표본 추 출을 통해 최적의 초기치를 찾는 것을 고려하고자 한다. 즉, 표본 추출을 통해 로지스 틱 회귀분석으로 추정된 독립변수의 계수 값을 초기치로 사용함으로써 신경망의 모형 산출 과정을 최소화시켜 수렴의 신속성을 향상시키고 국소 최적해의 문제를 탈피하여 대역해에 가깝게 도달할 수 있음을 제시하고자 한다. 이를 위하여 신경망 프로그램을 구현하여 실증적 연구를 통해 타당성을 입증할 것이다.
실증적 연구를 위한 기본 가정으로 신경망의 가장 기초인 SLP 모형에 적합 시켰으 며, 활성함수로는 가장 보편적으로 사용되는 시그모이드 함수를 사용하였다.
2. 로지스틱 회귀모형의 사용
신경망의 퍼셉트론 알고리듬은 활성함수를 사용하게 된다. 신경망에서 사용되는 활 성함수 중 가장 대표적인 활성함수는 ‘S'자 곡선을 그리는 시그모이드 함수이다. 신경 망에서 사용되는 시그모이드 함수식은 다음과 같다.
f (v ) = 1 1 + exp ( − av ) v = Σ
i = 1 m