• 검색 결과가 없습니다.

사례기반추론에 기초한 모델 구축방법

문서에서 저작자표시 (페이지 46-51)

5.1.1 사례기반추론

본 연구에서는 환경부하 산정 모델을 개발하기 위하여 사례기반추론 (Case-Based Reasoning, CBR)을 바탕으로 모델을 제작하였다. 사례기반추론이 란 과거에 있었던 사례들의 결과를 바탕으로 새로운 사례의 결과를 예측하는 기법이다. Kolodner, J는 사례기반추론 기법을 ‘새로운 요구에 부응하기 위해 과거 해를 적응시키고, 새로운 상황을 설명하기 위해 과거 사례를 사용하고, 새 로운 해를 평가하기 위해 과거 사례를 사용하거나 새로운 문제에 대한 유용한 해를 도출하기 위해 과거 사례로부터 추론하는 것이다.’라고 정의하고 있다.

(Kolodner, J. 1993)

이와 같이 사례기반추론의 기본적인 아이디어는 인간이 사고하는 과정에서 과거의 문제에 사용되었던 해결책을 새로운 문제의 해결을 위해서 사용하는 것 이다. 즉, 사례기반추론은 전혀 새로운 해결안을 제시하는 혁신적인 기법이라기 보다는 과거의 유사한 사례로부터 해결방안을 도출하는 추론기법이다.

사례기반추론의 처리과정은 문제해결에 있어 기존 사례를 활용하는 사람의 의사결정 과정과 유사하다. 예를 들어 우리가 새로운 문제에 부딪쳤을 때, 우리 는 새로운 사례와 유사한 기존 사례를 생각하고, 다양한 방면에서 신규사례와 유사사례를 비교하여 최적의 대안을 제시할 수 있다. 즉, 기존 경험과 이와 관 련된 처리 결과를 비교하여 새로운 문제에 대한 처리방법을 결정할 수 있다.

사례기반추론에서 사례(Case)는 핵심 부분이며, 사례베이스(Case Base)는 이

러한 사례들을 집적한 것이다. 또한 사례베이스(Case Base)에 내재된 값은 인위 적으로 만들어진 것이 아닌, 과거에 발생한 실제 값을 사용하고 새로운 문제 해결에 있어서 주어진 조건에 적합한 과거 사례를 적용하거나 유추, 또는 변형 하는 과정을 통하여 보다 개선된 해결안을 제시한다.

사례기반추론은 일반적으로 조회(Retrieve), 재사용(Reuse), 수정(Revise), 저장 (Retain)의 4단계로 구성된다. 조회(Retrieve)단계는 구축된 조회사례 데이터베이 스에서 가장 유사한 사례들을 조회하는 단계이다. 재사용(Reuse)단계는 문제를 해결하기 위해 조회된 사례를 이용하여 분석하는 단계이다. 수정(Revise)은 가 장 유사한 사례를 추출한 이후에 새로운 문제의 특성을 반영하기 위하여 기존 의 해를 수정하는 과정이다. 저장(Retain)은 문제해결에 적용된 새로운 해결책 을 향후의 새로운 문제에 사용할 수 있도록 사례 데이터베이스에 저장하는 단 계이다. Fig 5.1은 사례기반추론의 프로세스를 나타내었다.

Fig 5.1 4 steps of case-based reasoning

사례기반추론을 이용하기 위해서는 일반적으로 과거의 사례와 사례들 사이의 유사 정도를 측정하기 위한 유사도 척도가 준비되어야 한다. 사례기반추론의

정확도에 가장 큰 영향을 주는 유사사례 조회방법은 귀납적 조회방법(Inductive retrieval method), 지식기반 조회방법(Knowledge-based retrieval method), 최 근접 추출방법(Nearest-neighbor retrieval method)의 3가지로 구분할 수 있으 며, 이 세 가지 방법을 조합하여 사용하기도 한다. Table 5.1은 사례기반추론의 유사사례 조회방법 3가지를 나타내었다.

유사사례 조회방법 상 세 내 용

귀납적 조회방법

의사결정 맵을 작성하는 추론알고리즘에 의해 분석 조회속도가 빠름

사례 데이터가 누락될 경우 유사사례 조회 불가능

지식기반 조회방법 기존의 분야별 지식을 적용

규칙기반 시스템과 유사

최근접 추출방법

사례 데이터베이스에서 일정한 유사성 척도 산정 유사한 사례를 추출한 후 가중 합계하여 대응시킴

사례의 수가 증가할수록 조회시간이 증가함 사례의수가 적을수록 유리

Table 5.1 A method of retrieving similar cases of CBR

5.1.2 유전자 알고리즘

유전자 알고리즘은 1970년대 초 Holland에 의해 본격적으로 연구되기 시작한 학문으로서 자연 유전학 및 자연 도태의 원리(The genetics and natural selection)에 근거한 최적화 기법의 일종이다. 이것은 해공간을 확률적으로 탐색 하는 것과 동시에 개체간의 체계적 정보교환을 통하여 주위 환경에 가장 적절 한 해를 구하는 방법이다.

자연 진화의 법칙인 적자생존과 자연도태의 원리를 토대로 최적의 해를 찾는 알고리즘으로서, 두 개의 부모 유전자로부터 그들 자손의 유전자를 형성하는 유성생식과 자연환경에서 일어나는 진화원리를 흉내 내는 것을 모태로 발전한 문제해결 방식이다. 주로 복합한 문제해결 과정에서 점진적으로 문제를 개선해 나가는 방법을 이용한다.

Fig 5.2 Composition of genetic algorithm

Fig 5.2는 유전자 알고리즘의 구성이다. 유전자 알고리즘은 적합도 평가, 재생 산, 교배, 돌연변이의 4단계를 거치게 된다. 초기단계에 해가 될 수 있는 개체 들은 해공간 내에서 무작위로 선택되거나 경험적인 방식을 이용하여 선택된다.

선택된 개체들은 적합도 평가를 통해 선별되는 과정을 거치게 되며 재생산과정 에서 적합도가 높게 평가된 개체들을 선택하여 다음 세대에 전이하고, 그렇지 못한 개체들은 소멸시킨다. 적합도 평가에서 선택된 개체들은 교배를 통해 재 결합되고 유전정보 교환과정을 통해 돌연변이에서 새로운 개체를 만들어낸다.

진화가 거듭될수록 적합도가 높은 개체들로 변화하게 되고, 최적의 해로 수렴 하게 되며, 한 세대 동안 이러한 과정을 거친 집단은 다시 평가되어 최적의 해 가 발견될 때까지 반복된다.

유전자알고리즘에서 해를 도출하는 과정은 한 개의 해를 위한 과정보다는 집 단을 단위로 추출하며, 도출되는 결과가 결정적이기 보다는 확률적이라는 특성 을 가지고 있다. 본 연구에서는 유전자 알고리즘을 영향요인에 대한 가중치를 산정하는데 적용하였으며, 적용방법은 Fig 5.3과 같다.

Fig 5.3 Case learning using genetic algorithm

유전자 알고리즘을 이용하여 추정 편차를 최소화하는 환경부하량 영향요인에 대한 가중치를 산정하기 위한 과정은 그림과 같다. 먼저 기존 사례를 바탕으로 Case Base를 구성하고, 가중치를 산정하기 위한 학습의 과정을 다음과 같이 수 행한다. 환경부하량 영향요인에 대한 유사도 점수에 각 영향요인의 중요도인 가중치를 곱하여 신규(학습)사례에 대한 Case Base에 저장되어 있는 각 사례와 의 유사도 점수를 산정한다. 이때 각 영향요인에 대한 가중치는 학습과정을 통 하여 신규사례에 대한 추정된 환경부하량의 편차를 최소화하고자 하는 목적함 수를 만족시키기 위한 변수(Changing cells)로 설정한다. 가장 유사도가 높은 n 개의 사례에 대한 환경부하량(solution)에 유사도 점수를 이용하여 가중 평균한 값을 신규(학습)사례의 추정 환경부하량으로 한다. 추정 환경부하량과 신규(학 습)사례의 실제 환경부하량과 비교를 통하여 환경부하량 추정편차를 구한다. 이 러한 과정을 반복하여 각 신규사례의 환경부하량을 예측하고 추정편차를 구하 는 학습과정을 수행하며 이러한 학습의 과정에서 모든 신규학습사례에 대한 추 정 환경부하량 편차 평균값을 최소화하는 것을 목적 함수로 설정한다. 유전자

알고리즘을 이용하여 목적함수를 만족시키는 환경부하량 추정 영향요인에 대한 가중치를 산정한다.

문서에서 저작자표시 (페이지 46-51)

관련 문서