• 검색 결과가 없습니다.

딥러닝 기반 조류예측 알고리듬 개발

3. 딥러닝 예측 알고리듬 개발

가. 예측을 위한 데이터 구축

딥러닝 예측 모형을 구축하기 위해서는 조류-상류지점수질-수위-기상정보 간의 유기적 인 결합이 먼저 필요하다. 예측 대상 데이터는 측정소별 유해남조류세포수이므로, 유해남조 류세포수의 관측일에 맞춰서 설명변수를 정리했다. 가장 먼저, 유해남조류세포수의 관측지 점에서 같이 관측되는 수온 및 클로로필a를 결합하였다. 한강 친수활동구간의 조류정보는 2007년 데이터부터 제공되는데, 2014년까지는 수온, 클로로필a 데이터만 제공되고 2015 년부터 용존산소량, 수소이온농도 등의 데이터도 같이 제공된다. 데이터 학습을 2015년부 터 수행하면 조류관측지점의 더 많은 변수를 설명변수로 활용하여 예측 모형을 구축할 수 있으나 2007년부터 2014년까지의 데이터를 학습에 사용하지 못하게 되므로 본 연구에서 는 수온과 클로로필a만 활용하였다. 상류지점 수질정보는 유해남조류세포수 관측일자에서 가장 최근에 관측된 데이터를 결합하였다. 세밀한 해상도에서 관측되는 수위 및 기상정보는 유해남조류세포수 관측일자의 과거 6일 데이터까지 활용하였다. 본 연구의 딥러닝 알고리 듬 구축에 직접 사용한 변수 목록은 <표 4-4>와 같다.

변수 변수 구분 변수명 변수설명

변수 변수 구분 변수명 변수설명

변수 변수 구분 변수명 변수설명

변수 변수 구분 변수명 변수설명

나. RNN 예측 알고리듬 구축

자료: 저자 작성.

<그림 4-14> 유해남조류세포수 예측 RNN 알고리듬

<그림 4-14>는 본 연구에서 구축한 RNN 모형을 그림으로 나타낸 것이다. <그림 4-14>

의 위쪽 그림에는 본 연구의 입력데이터와 출력데이터에 다층신경망을 부여한 것을 나타내 었고, 아래쪽 그림에는 다층신경망에 순환구조를 부여한 것을 그림으로 단순화하여 나타내

었다. 입력층, 출력층이 있고 가운데에는 은닉층이 존재한다. 입력층에는 앞서 서술한 이전 시점 유해남조류세포수 및 수질, 상류지점 수질, 수위, 기상데이터가 들어가며, 출력층에는 친수활동구간 유해남조류세포수가 들어간다. 직전 시점뿐 아니라 더욱더 과거의 수질 및 기상이 현재의 조류에 영향을 미치므로 단순 신경망 알고리듬이 아닌 순환신경망 구조를 부여하였다. 장기 기억 정보도 활용하기 위해 단순 RNN 알고리듬 대신에 LSTM(Long Short Term Memory) 알고리듬으로 예측 모형을 구축하였다.

실제 예측 모형은 남조류세포수의 원자료를 예측하지 않고 로그스케일에서의 남조류세포 수를 대상으로 하였다. 조류발령 기준이 20,000과 100,000이므로 로그스케일에서의 예측은 충분히 의미 있으며, 변환 시 안정적인 데이터가 되므로 알고리듬을 구축하기가 수월하다.

최적화를 위한 손실함수(loss function)는 최소제곱함수를 사용하였으며, 최적화알고리 듬은 ADAM을 사용하였다.

겨울철을 제외한 한강 친수활동구간 조류정보의 총 데이터 수는 486개이다. 이 중 75%

인 365개 데이터를 학습 데이터(training data)로 활용하여 딥러닝 모형을 학습하였고, 나머지 25%인 121개 데이터를 테스트 데이터(test data)로 하여 예측 모형을 검증하였다.

검증 기준은 RMSE(Root Mean Square Error)이다.

자료: 저자 작성.

<그림 4-15> 성산대교 로그스케일 유해남조류세포수 데이터의 학습 데이터(training data)와 검정 데이터(test data) 구분

<그림 4-15>는 성산대교 관측점을 기준으로 학습 데이터와 테스트 데이터를 구분하여 나타낸 것이다. 다른 관측지점에 대해서도 마찬가지로 학습 데이터와 테스트 데이터를 구분 하였다. 본 장 2절에서 상기하였듯 한강 유역의 조류 데이터는 2015년부터 특성이 크게 달라진다. 데이터 특성이 달라진 후인 2015년과 2016년의 데이터가 포함되어 있기는 하나, 대부분의 학습 데이터는 조류가 본격적으로 늘어나기 전인 2007년부터 2014년까지의 데 이터이다. 또한 특이 기상 현상을 보인 2018년 폭염 및 2020년 폭우 사태가 있을 때의 데이터는 모형 학습에 사용하지 않았기 때문에 특이 기상 현상으로 인한 변화가 예측에 영향을 미칠 수 있다. 해당 기간의 예측 효율성을 봄으로써 딥러닝 모형의 적용 가능성을 모색해볼 수 있다.

다. 예측 결과

<그림 4-16>~<그림 4-20>은 한강 친수활동구간의 관측지점별 딥러닝 예측 결과를 시계 열그림으로 나타낸 것이다. 파란색 선은 2017년 4월부터 2020년 8월까지의 테스트 데이터 인 로그스케일에서의 실제 유해남조류세포수 관측값이고, 빨간색 선은 본 연구에서 구축한 순환신경망 예측 모형을 통해 예측을 수행한 결과이다.

자료: 저자 작성.

<그림 4-16> 한강 친수활동구간(성수대교) 유해남조류세포수 딥러닝 예측 결과

자료: 저자 작성.

<그림 4-17> 한강 친수활동구간(한남대교) 유해남조류세포수 딥러닝 예측 결과

자료: 저자 작성.

<그림 4-18> 한강 친수활동구간(한강대교) 유해남조류세포수 딥러닝 예측 결과

자료: 저자 작성.

<그림 4-19> 한강 친수활동구간(마포대교) 유해남조류세포수 딥러닝 예측 결과

자료: 저자 작성.

<그림 4-20> 한강 친수활동구간(성산대교) 유해남조류세포수 딥러닝 예측 결과

전반적으로 전 관측소에서 유해남조류세포수가 증가하고 감소하는 패턴을 잘 예측하였 고, 특히 값이 가장 튀는 시점을 동 시점에서 예측하였다. 한강 친수활동구간은 강의 하류 쪽이기 때문에 클로로필a 및 유해남조류세포수 데이터의 불안정성이 커 물리모형이나 전통 적인 통계 모형을 활용한 예측에는 한계가 큰데, 본 연구에서 적용한 딥러닝 알고리듬은 친수활동구간에서 조류의 증감을 비교적 잘 예측하였다. 특히, 조류가 본격적으로 발생하는 여름철의 조류 증감 패턴을 잘 예측하였다. 기록적인 폭염을 기록하여 조류 또한 많이 발생 한 2018년의 예측력이 좋은 것을 확인할 수 있다. 또한 <그림 4-16>~<그림 4-20>에서 원으로 표시한 지점은 유해남조류세포수가 갑자기 큰 값으로 튀는 것을 동 시점에서 예측한 결과이다. <표 4-5>는 순환신경망을 활용한 예측의 연도별 예측오차를 나타내는데, RMSE 값은 2020년 가장 작은 값이지만 이는 2020년 유해남조류세포수의 변동성 자체가 작기 때문이다. 원자료의 변동성을 고려하였을 땐 2018년의 예측력이 가장 좋음을 알 수 있다.

2018년의 여름철 기후는 다른 연도와 패턴이 다르기 때문에 과거 데이터를 활용해서 예측 모형을 구축한 데이터 기반 모형에서는 효율성이 떨어질 것으로 예상하였으나, 실제 데이터 변동성 대비 가장 좋은 예측력을 보였다.

<표 4-6>은 관측지점별 예측오차를 나타낸 것이다. 마포대교에서의 예측오차가 0.584로 다른 관측지점보다 작았고, 한남대교에서의 예측오차가 0.771로 가장 큰 것을 확인할 수 있다.

연도 예측오차(RMSE)

2017 0.819 (Cf. 데이터 표준편차 1.262) 2018 0.729 (Cf. 데이터 표준편차 1.234) 2019 0.750 (Cf. 데이터 표준편차 1.323) 2020 0.574 (Cf. 데이터 표준편차 0.868)

<표 4-5> 한강 친수활동구간 딥러닝 예측 모형 적용 연도별 유해남조류세포수 예측오차

자료: 저자 작성.

관측지점 예측오차(RMSE)

성수대교 0.725 (Cf. 데이터 표준편차 1.191) 한남대교 0.771 (Cf. 데이터 표준편차 1.236) 한강대교 0.732 (Cf. 데이터 표준편차 1.244) 마포대교 0.584 (Cf. 데이터 표준편차 1.268) 성산대교 0.718 (Cf. 데이터 표준편차 1.285)

<표 4-6> 한강 친수활동구간 딥러닝 예측 모형 적용 예측지점별 유해남조류세포수 예측오차

자료: 저자 작성.

관측지점 상관계수

성수대교 0.794

한남대교 0.773

한강대교 0.800

마포대교 0.886

성산대교 0.832

<표 4-7> 한강 친수활동구간 딥러닝 예측 모형 적용 예측지점별 유해남조류세포수 예측값-관측 값 간 상관계수(경계월 4월, 11월 제외)

자료: 저자 작성.

종합적으로, 실제 관측값이 큰 값을 기록한 시점에서의 예측 효율성이 좋았으며, 이는 큰 값의 예측이 중요한 조류현상 예측에 있어 실제 활용 가능성이 있다고 볼 수 있다.

제5장

관련 문서