종합 결론 - 최종보고서

인공지능은 해무 예측 또는 앞서 선정된 6개 분야에 대한 맞춤형 서비스의 수치 예측 에 적용될 수 있으며, 현재의 기상관측망에서 수집되는 데이터에 대한 데이터 품질 관리 에 이용될 수 있으며, 향후 기상관측망이 강화되는 경우 이들에 대한 데이터 품질 관리 에도 인공지능이 이용될 수 있다.

앞서 언급한 각 선결조건을 만족하기 위해 인공지능 기반의 품질 관리 기술과 인공지 능 기반의 기상 분석 기술을 개발할 것을 제안하며, 인공지능 기반 품질 관리에 있어서, 데이터 품질 관리 대상을 식별한 이후 품질 관리를 위한 기술 연구가 진행되어야 할 것 이며, 인공지능 기반 기상 분석을 위해 인공지능을 적용할 서비스를 식별할 필요가 있다.

로드맵을 참조하면 상세히 설명하면, 연도별로 서비스 대상 식별 현황을 분석을 완료 후 관측 품질 개선을 위한 플랫폼 연구를 진행할 수 있다. 이후 국지 예측 판독을 위한 인공지능 플랫폼을 개발하고 최종적으로 복합의사결정을 지원하는 인공지능 플랫폼을 개 발하는 목표를 세울 수 있다.

구체적으로 인공지능 기반 품질 관리 기술을 살펴보면, 데이터 품질을 적용할 개선 대 상을 식별할 수 있다. 이 단계에서는 인공지능 기반 서비스 개발을 위한 관측 품질을 개 선할 대상을 식별하고, 품질 개선 요소의 식별과 관련 인프라 확충, 유관기관 협조 필요 여부 등 구체적인 전략을 수립한다. 이후, 관측 데이터 품질 관리 기술 연구 단계에서 인 공지능 활용 대상 해양기상 관측 데이터 품질 관리 및 데이터 보정 기법의 연구가 필하 고, 데이터 품질관리 기술을 실용화하고 고도화하여, 인공지능을 통해 관리되는 데이터 품질의 신뢰도를 증진시켜야 할 것이다.

한편, 인공지능 기반의 기상 분석 기술을 살펴보면, 맞춤형 서비스 운영 결과 분석 및 기술 타당성 검토를 통한 인공지능 적용 대상을 식별하는 서비스 대상 식별 단계를 우선 시행할 수 있다. 예를 들면, 해무, 항로 기상 예측, 크로스 섹션 판정 기술, 해군 및 해경 의 작전을 지원하는 서비스 등이 예시될 수 있다. 인공지능의 적용 대상이 식별된 이후, 현재 조사된 인공지능 기법 등에 기초하여 인공지능 적용을 위한 기반기술에 대한 연구 를 진행할 수 있다. 인공지능 기반의 관측 외 지점 비선형 데이터 보간 기법을 설계하거 나, 보정, 보간 데이터 검증 기법 설계, 검증 환경 구축 계획을 수립할 수 있다. 이후, 인 공지능 기반 해양기상 판독 단계에서는 비관측점 해양기상현상의 판독기술 연구 및 검증 데이터 자동생성 플랫폼을 개발할 수 있고, 가시화 등 정보전달체계를 개발할 수 있다.

최종적으로는 인공지능을 통한 복합의사 결정을 지원하는 기술을 개발할 수 있다.

별첨 1. 인공지능 대표 알고리즘

가. 예측 알고리즘

n Linear Regression

통계학에서, linear regression은 하나 이상의 독립 변수와 종속 변수와의 선형 상관 관 계를 모델링하는 회귀분석 기법이다. 독립 변수가 하나인 경우 단순 선형 회귀, 하나보다 많은 독립 변수인 경우는 다중 선형 회귀라고 한다.

그림 53 단순 선형 회귀

선형 회귀는 대개 두 가지 중 하나로 사용한다.

∙ 값을 예측하는 것이 목적인 경우

∙ 종속 변수와 관련된 독립 변수들이 존재하는 경우에, 선형 회귀 분석을 이용해 독 립 변수가 종속 변수에 얼마나 기여하는지는 정량화할 수 있다. 이를 이용해 관계가 없 는 독립 변수를 제거하거나, 관계가 높은 독립 변수를 찾을 수 있다.

일반적으로 선형 회귀는 최소제곱법(least square method)을 사용해 선형 회귀 모델을 세운다. 최소제곱법은 실제 해와 예측 해의 오차의 제곱이 합이 최소가 되는 해를 구하 는 방법이다. 이외에도 손실 함수(loss function)를 최소화 하는 방식으로 선형 회귀 모델 을 세울 수 있다. 비선형 회귀 모델에도 이와 같은 방법을 적용할 수 있다.

개의 데이터 집합 ^_ …^_{  }^ 이 주어지면, 선형 회귀 모델은 종속 변수 와 설명 변수  (차원이 인 벡터)의 관계가 선형이라고 가정한다. 이 관계는 종속 변수와 설명 변수 간의 선형 관계에 노이즈를 추가하는 관찰되지 않은 확률 변수 를 통해 모델링 된 다. 모델은 다음과 같다.

_ _  __⋯  __ _ x_^ _   …

여기서 ^는 전치를 나타내며, 따라서 ^x_^는 벡터 x_와 의 내적이다.

종종 개의 방정식은 쌓아 놓은 형태로 표현하는 행렬 표기법으로 작성되기도 한다.

  

 







^⋮^^^^^^^^



^

 







^x^^^





x_^

⋮

x_^









^⋮^{ }^{ }^{ }^⋮^^^^⋯^⋯^{⋱ ⋮}^⋯ ^^^^^^^^



^

 







^⋮^^^^^^^^^^



^{  }^^

^

^⋮^^^^^^^^

^

^

n Gaussian Process Regression

Gaussian Process(GP)는 확률 과정으로 시간 진행에 대해 확률적인 변화를 가지는 구 조이다. 한편, 확률 변수의 모든 유한 집합은 다변수 정규분포를 갖고, 확률 변수의 모든 유한 선형 결합은 정규 분포를 따른다. GP의 분포는 모든 확률 변수의 결합 분포이다.

따라서 분포는 연속적인 도메인을 가진 함수들에 대한 분포이다.

GP를 사용하는 기계학습 알고리즘은 lazy learning을 사용한다. 따라서 학습을 미리 할 수 없으며, 학습에 필요한 자료를 저장해야하기 때문에 큰 공간을 필요로 한다. 또한 GP 는 유사성 측정을 사용하여 학습 데이터로부터 보이지 않는 지점의 값을 예측한다. 예측 은 단순한 추정과 1차원 가우스 분포를 따르는 불확실성 정보(marginal distribution)를 가지고 있다. GP는 가우시안 정규분포(Gaussian distribution) 개념을 기반으로 하며, 다 변수 가우스 분포를 무한 차원으로 확장한다. Multivariate normal distribution은 mean vector와 covariance matrix로 정의된다. 한편, GP에서는 mean vector와 covariance matrix를 함수로 정의하고, 함수의 분포를 함수로 공식적으로, GP는 유한 부분 집합이 다변수 가우스 분포를 따르도록 데이터를 생성한다.

GP는 평균 함수를 보통 0으로 설정한다. 이렇게 설정한 경우에 관측값과 다른 관측값 에 관련되는 것은 covariance function ′이다. 인기있는 선택으로는 다음의 squared exponential 함수이다.

′   

_^



^^^

   ′^

여기서 _^은 최대 허용 공분산이다. 이 매개 변수는 축에서 넓은 범위를 커버하는 함 수들에 대해 높아야한다. 만약 ≈ ′인 경우, ′은 최대값에 다가가며, 이는 가

 ′와 거의 완벽하게 상관이 있다는 것을 의미한다. 또한 와 ′과 거리가 멀다면, 우 리는 ′≈ 을 얻게 된다. 이러한 분리의 효과는 매개 변수 에 따라 유연하게 바뀐 다.

데이터는 측정 오류 등으로 인해 종종 노이즈가 있을 수 있다. 각 관측치 는 Gaussian 잡음 모델에 숨어있는  와 관련되어 있다고 생각할 수 있다.

   _^

이 식은 일반적인 회귀식과 비슷하다는 것을 알 수 있다. 이 회귀는  를 찾는다. 이 예제에서는 기존 공분산 함수에 새로운 항을 추가한다.

′   

_^



^^^

   ′^

 

_^

′ 

여기서 ′은 Kronecker delta 함수이다.

GPR을 위해서, 우리는 주어진 데이터에서 모든 가능한 조합을 활용해 공분산 함수를

계산한다.

 







^





__ __ ⋯ _ _

__ __ ⋯ _ _

⋮ ⋮ ⋱ ⋮

_ _ _ _ ⋯ _ _







^_ _ _ ⋯ _ _



^

  _ _

의 대각선 요소들의 값은 모두 _^ _^이라는 것을 확인해 볼 수 있다. 에는 학습할 데이터들로 구성이 되며, 가 붙은 경우 테스트 할 데이터를 넣게 된다. 즉 _에서 예측 치 _를 찾는 것이 목표이다. 만일 테스트할 데이터가 한 개이면 위와 동일하지만, 아닌 경우는 다음과 같다.

_







^





_′ _ _′ _ _⋯ _′_

_′ _ _′ _ _⋯ _′_

⋮ ⋮ ⋱ ⋮

_′_ _′_ _⋯ _′ _



_{ }







^





_′_′ _′ _′  _⋯ _′ _′

_′_′ _′ _′  _⋯ _′ _′

⋮ ⋮ ⋱ ⋮

_′ _′  _′_′ ⋯ _′ _′



GP 모델링의 주요 가정은 우리의 데이터를 다변수 Gauss 분포의 샘플로 나타낼 수 있 기 때문에 우리는 다음을 얻는다.







^





_ ^∼ 



^^_

^

^{ }_^_{ }^^_

^ 

우리는 조건부 확률 _y에 관심이 있다. 이것은 데이터가 주어졌을 때, _에 대한 예측 가능성이 얼마나 있는지를 나타낸다. 한편, 이 조건부 확률의 분포는 다음과 같이 해결할 수 있다.

_y∼  _ ^{ }y_{ } _ ^{ }_^

_에 대한 최고의 추정치는 이 분포의 평균이다:

__ ^{ }y

또한 우리 추정치의 불확실성은 분산으로 나타내지며 다음과 같다:

var_ _{ }_ ^{ }_^

GP에서 회귀의 신뢰도는 공분산 함수를 얼마나 잘 선택하는지에 달려있다. 또한 매개 변수를 ^_ 현명하게 선택되지 않으면, 공분산 함수를 잘 선택해도 결과는 좋지 않을 수 있다. 의 posteriori 추정의 최댓값은    이 가장 큰 경우이다. 베이즈 정리 는 가 무엇인지에 대한 사전 지식이 거의 없다고 가정하면, 이는 log y x를 최대화 하는 것에 해당 하며, 다음과 같이 주어진다.

log y x   

y^ ^{ }y 

log 

log 

따라서, 다변수 최적화 알고리즘(conjugate gradients, Nelder-Mead simplex 등)을 사 용하면, GP의 매개 변수를 찾을 수 있다.

n RBFN (Radial Basis Function Network)

RBFN은 방사 기능을 활성화 기능으로 사용하는 인공 신경 네트워크이다. 네트워크의 입력과 출력은 뉴런 매개 변수의 방사형 기저 함수의 선형 조합이다. RBFN은 함수 근 사, 시계열 예측, 분류 및 시스템 제어를 포함하여 많은 용도로 사용된다.

RBFN의 기본 구조는 아래 그림과 같다. 그림에서  ^→  문제를 풀기 위해 개의 은닉 뉴런을 가지는 RBFN을 보여준다. 우선, 입력 차원이 이므로 입력 패턴은

  _ __ _로 표현할 수 있다. 아래 그림에서 _는 번째 은닉 뉴런의 중심이고,

_는 너비이다. _는 출력 유닛의 바이어스이며, _는 번째 은닉 뉴런과 출력 유닛 사이 의 가중치이다. 각각의 입력이 은닉 뉴런과 전부 연결되어 있고, 은닉 뉴런에서는 가우시 안 함수에 의해 해당 입력 패턴에 대한 출력을 내보낸다. 출력 유닛에서는 은닉 뉴런의 출력 값에 각 은닉 뉴런의 가중치를 곱해서 더한 값을 최종 신경망의 출력으로 내보낸 다.

그림 54 RBFN의 구조

출력 유닛이 하나인 RBFN의 출력 값은  



^^^^^{ }^로 계산할 수 있다. 여기서,

_ exp 

^^

∥^ ∥

 이다.

기계학습의 도구로서 신경망을 사용할 때, 가장 많이 연구가 되고, 많이 사용되는 것은 다층 퍼셉트론(Multilayer Perceptron, MLP)이다. 그러나 전통적인 MLP는 학습 속도가 느리고 학습된 최종 신경망이 표현하는 지식을 이해하기 어렵다는 단점이 있다. 이에 RBFN이 제안되었고, 그 이유는 은닉 뉴런들이 확률분포 함수를 이룰 수 있고, 학습 속 도도 빠를 수 있으며 신경망이 표현하는 지식을 어느 정도 이해할 수 있다는 장점이 있 기 때문이다. 아래 표는 다층 퍼셉트론과 RBFN을 비교 정리한 것이다.

문서에서 최종보고서 (페이지 115-149)