[하이라이트] 기계 학습법을 이용한 공정 최적화 방법론의 연구 동향 및 적용 사례

(1)

1. 서론

화학공정의 수리모델링은 그 동안 화학공정의 최 적 설계, 제어 및 스케줄링에 있어서 핵심적인 역할 을 담당해 왔다. 공정 모델은 보통 다차원의 복잡한 비선형시스템 방정식을 포함하고 함께 정의되어 있 는 많은 매개변수들은 물리 화학적 물성 실험을 통 하여 도출 되어야 하기 때문에 공정 모델 구축을 하 기 위해서는 많은 시간과 비용이 요구된다. 또한, 공 정모델에서 필연적으로 발생하는 불 확실성을 제거 하기 위해서는 파일럿 플랜트 등을 통한 실증 테스 트를 거쳐야 하고 따라서 화학공학적으로 개발된 신 기술을 파일럿 및 산업 규모의 공정에 실제로 적용 하기 위한 설계 및 운전조건 최적화를 하는데 많은 어려움을 겪어 왔다. 하지만 최근에 폭발적으로 개 발되는 화학 공정산업들의 신기술들에 대한 경제성 평가와 최적화에 대한 수요가 급증하고 있어 기존의 공정 모델링을 대신하여 경제적으로 공정 설계 및 최적화를 수행 할 수 있는 방법론에 대한 요구가 늘 어나고 있다.

이러한 요구를 해결하기 위해 자연 현상 그 자체 에 대한 본질적인 제 1법칙 모델과 수리모델링을 통 한 최적화 대신, 복잡한 화학공정의 입력 및 출력 변 수 간 상관관계 혹은 인과관계를 복합적으로 이용 해서 대안모델(Surrogate Model)을 만들고 반응 표면 (Response Surface) 관계식을 만드는 black box 최적

화 방법론이 대두되고 있다. Black box 최적화 방법 론은 탐색 영역 내에서 샘플을 추출하고 기계학습법 을 이용하여 미리 정해놓은 대안모델의 매개변수를 훈련시키는 기계학습법을 통해 본 모델을 잘 설명하 는 대안모델을 구축한다. 이렇게 구축된 대안모델 은 일반적으로 본 모델에 비해 전통적인 비선형최적 화 방법론이 적용되기 적합한 구조이기 때문에 다양 한 알고리즘을 통해 최적해를 쉽게 찾아낼 수 있다.

만약 구축된 대안모델의 성능이 떨어진다면, 기저함

기계 학습법을 이용한 공정 최적화 방법론의 연구 동향 및 적용 사례

나종걸^a, 이 웅^b*

a서울대학교 화학생물공학부

b한국과학기술연구원 청정에너지 연구센터 [email protected], [email protected]

그림 1. 대안모델을 사용한 Black Box 최적화 방법론의 예시.

(2)

수 후보군을 통해 새로운 대안함수를 이용하여 훈련 시키거나, 실험계획법(Design of Experiment; DoE)을 통해 더 많은 정보량을 포함하게 하는 샘플을 추가 로 추출하는 방식을 취할 수 있다. 이러한 일련의 과 정에 대한 방법론의 예시가 그림 1에 간략하게 제시 되었다.

대안모델을 사용한 black box 최적화의 일반적 인 방법론 핵심은 탐색 구간 내에서 어떤 탐색점을 통해 대안 모델을 훈련시킬 것인지, 어떤 기저를 갖 는 대안 모델을 사용할 것인지 그리고 어떤 방식으 로 훈련시킬 것 인지로 나눌 수 있다. 특히 어떤 기 저를 갖는 대안 모델로 기존 모델을 훈련시키느냐에 따라서 접근할 수 있는 정보와 성능이 극단적으로 변하게 된다. 대표적인 기저함수로는 linear, cubic, polynomial, splines, multiquadratic, neural network, radial basis function, 그리고 Gaussian process (kriging) 등이 있다. 가장 최근 공정최적화에 적용된 대표적 인 사례로는, 주어진 데이터를 통해 다양한 기저 중 최적의 subset을 뽑아내는 방법론[1]으로 이산화탄 소 포집공정의 초구조(superstructure) 경제성 최적화 를 수행한 사례, neural network 기반 대안 함수와 ε- 제약조건법을 이용한 피셔-트롭쉬 마이크로채널 반 응기 다중목적함수 최적화[2], 그리고 리튬이온 멀 티스케일 편미분방정식 다이나믹 모델을 PiecesWise affine AutoRegressive eXogenous (PWARX) 대안 모델 로 훈련시켜 모델예측제어 (model predictive control) 에 적용한 사례 [3] 등을 들 수 있다.

대안모델을 사용한 최적화 방법론은 그 동안 신 뢰성에 많은 의심을 받아왔다. 특히, 다 변수 다항 회 귀분석과 같은 non-interpolating 방법론을 사용하는 경우는 원 함수의 성질과 다른 반응 표면을 가지는 대안모델을 구축한 사례가 종종 보고되었고 Cubic Spines 함수와 같은 interpolating 방법론의 경우에도 전역 최적화에 실패한 사례가 많이 보고되고 있었 다. 또한, 제 1법칙을 통한 모델링을 통해 현상을 표 현해야 그 근원을 정확하게 예측할 수 있고, 때문에 데이터가 존재하지 않는 부근에서의 extrapolating에

도 물리적 설명을 진행할 수 있어 본질적인 회의론 이 존재하였다. 하지만 최근 기계학습법, 특히 딥 러 닝을 필두로 여러 비선형 변환 기법의 조합을 통한 추상화, 시계열 데이터에 대한 높은 예측력, 그리고 획기적인 병렬 컴퓨팅 기술이 발전함에 따라서 원 함수를 정확히 예측하고 전역 최적 해를 찾을 수 있 는 방법론들이 소개 되고 있다. 따라서 본 기고에서 는 복잡한 화학공정의 수리 모델링 및 최적화의 대 안으로 사용될 수 있는 기계학습 방법론을 살펴보고 그 적용 예를 소개하고자 한다.

2. 본론

2.1 CCUS 적용사례

US Department of Energy(DOE)의 주도하에 진행 되어온 Carbon Capture Simulation Initiative(CCSI) 사 업에는 다양한 계산과학적 접근을 통한 공정 및 장 치개발 연구가 진행되어 왔다[4]. 그 중 핵심으로 꼽 힐 수 있는 공정 설계 및 최적화 부분에 본 글에서 설 명하고 있는 기계 학습법을 통한 공정 최적화를 적 용한 대표적 사례가 있어 소개하고자 한다.

최근 20, 30년 사이 다양한 반응기를 포함하는 화 학공정에 사용되는 다양한 장치를 시스템 수준에서 상당히 높은 신뢰성을 가지는 시뮬레이터들이 개발 되었고 이를 통하여 이용하여 매우 빠르고 정확하게 제 1법칙 모델을 구축 할 수 있었다. 공정 시뮬레이 터를 이용한 방법들은 다양한 설계문제에 적용할 수 있어 학계 및 산업계 전반에서 활발하게 사용되고 있는 추세지만, 모델이 점점 복잡해짐에 따라 전 공 정을 단순한 비선형 시스템 방정식형태로 표현이 어 려워지고 계산 시간이 길어질 뿐만 아니라 특정 탐 색영역에서 수렴성을 보장하지 못하는 문제들이 발 생하여 공정 시뮬레이션을 직접적으로 최적화 하는 데 한계가 발생하고 있다.

이에 National Energy Technology Laboratory와 Carnegie Mellon 대학의 Nikolaos V. Sahinidis 교수 연 구실에서는 머신러닝 기법와 최적의 subset 테크닉, 그리고 MILP를 복합적으로 사용하여 기존 공정 시

(3)

뮬레이션을 대안 모델로 치환하는 automated learning of algebraic models for optimization (ALAMO)를 개 발하였다[5]. 기저함수로는 polynomial, multinomial, exponential, logarithmic, 그리고 그 외 예상되는 다 양한 형태의 함수를 사용하였고 Latin hypercube 디 자인을 통해서 일차적인 샘플링을 진행한다. 샘플링 된 데이터를 이용하여 대안모델을 훈련시키는데, 기 저 중에서 가장 잘 시뮬레이션 데이터를 설명할 수 있는 subset만 추출하는 MILP 형태의 최적화 문제를 풀게 하여 overfitting을 막으면서도 물리적인 의미를 해석할 수 있는 대안모델을 생성하게 한다. 이후 추 가적인 adaptive 샘플링을 이용해 가장 에러가 높을 것으로 판단되는 지점을 찾아 샘플을 추가적으로 확 보함으로써 가장 적은 수의 샘플링으로 가장 정확 한 대안모델을 만들어낸다. 이렇게 만들어진 대안모 델은 미리 정해둔 기저함수의 선형조합으로 나타나 기 때문에 쉽게 기울기 정보, 제약조건 등을 가져오 거나 추가할 수 있다. 위의 방법론을 이용하여 CCUS 공정에서 핵심적으로 사용되는 bubbling fluidized bed 를 포함한 solid sorbent processes를 유닛 별로 나눠서 대안모델을 생성하고 각 모델 사이에 필요한 mass balance, design specs을 추가적으로 넣어 최종적으로 최적 공정을 설계할 수 있는 superstructure MINLP 문 제를 만드는데 성공하였다.

2.2 베터리 관리 시스템(Adcanced Battery Management Systems; ABMSs) 사례 이탈리아 Pavia 대학과 미국의 MIT에서 공동으 로 연구한 ABMSs는 리튬이온 베터리를 안전하면서 도 최적으로 운영하기 위한 필수적인 시스템이다[3].

기존 전기화학 제 1법칙을 기반으로 하는 베터리 모 델은 pseudo two-dimensional(P2D) 멀티스케일 모델 로 구축되어 연산 시간이 길기 때문에 실시간 계산 이 필요한 Model Predictive Control (MPC)에 사용되 기 어려웠다. 이는 정상상태 공정설계에 필요한 최적 화 방법과 마찬가지로, 매 시간마다 미래에 베터리가 어떤식으로 충전, 방전 되어야 가장 효율적으로 사용 될지를 최적화 알고리즘을 통해 계산해내야 하기 때 문에 대안모델을 사용할 경우 계산시간을 획기적으 로 줄일 수 있는 장점이 있다. 본 연구에서는 Pieces Wise affine Auto Regressive eXogenous(PWARX)를 대 안모델로 삼았는데, 다이나믹 시스템에 입력변수와 출력변수의 선형조합으로 시계열 데이터를 표현하 는 ARX를 도입하고, 여러 운전 포인트들을 복합적으 로 표현하기 위해 ARX를 k-means clustering로 나눠 지는 regressors set으로 나눠 구축해 사용하였다. 이렇 게 만들어진 대안모델은 기존모델에 비해 매우 빠른 속도로 베터리 전류, 전압, State of Charge(SOC), 온도 등을 예측할 수 있고 MPC와 연동되어 강력한 최적제 어에 사용될 수 있을 것으로 보았다. 단순히 기저를

그림 2. 기존모델(P2)와 다양한 대안모델을 통한 베터리 온도 예측 비교. 많은 클러스터로 나눈 데이터셋으로 훈련된 PWARX가 가장 높 은 예측성을 보이는 것으로 확인된다[3].

(4)

정해놓고 데이터를 훈련시키는 지도 학습(supervised learning)과 clustering과 같은 비지도 학습 (unsupervised learning)이 복합적으로 사용될 수 있음을 볼 수 있으 며, 대안함수의 특성에 따라서 정상상태 뿐만이 아니 라 비정상 상태, 다이나믹 시스템에도 적용할 수 있 음을 확인할 수 있다.

2.3 FT 마이크로채널 reactor 적용 사례

최근 대안모델의 overfitting 문제를 해결할 수 있 는 방법론의 하나로 가우시안 프로세스를 이용한 베 이지안 최적화가 주목을 받고 있다. 가우시안 프로 세스는 각 랜덤 변수가 Joint Gaussian Distribution을 가지는 집합으로 가우시안 프로세스를 통해 생성된 랜덤 평균함수와 공분산 함수를 바탕으로 베이지안 추론을 통하여 기저함수를 구축 할 수 있다. 이렇게 도출 된 기저함수로부터 대안모델을 구성하기 위해 서는 모델 탐색과 획득의 최적화를(Explore/Exploit trade off) 적절하게 수행할 수 있는 알고리즘이 필 요하다. 이러한 탐색/획득의 문제는 Multiple Armed Bandit 문제로 잘 알려져 있는데 이 문제를 풀기 위 해 제시되었던 ε-greedy, upper confidence bound, expected improvement, Thomson sampling들의 알고 리즘이 적용 될 수 있다. 가우시안 프로세스를 기저 함수로 사용하는 방법은 복잡한 원함수의 계산을 획 기적으로 줄여서 계산시간을 단축시키고 도출된 대 안 모델이 높은 신뢰성을 가지는 장점이 있다.

이러한 베이지안 기반의 최적화 방법론을 피셔- 트롭쉬 마이크로채널 반응기의 성능을 최적화하기 위한 다중목적함수 최적화에 적용한 사례가 있어서

소개하고자 한다. 피셔-트롭쉬 반응기은 높은 발열 반응으로 인하여, 반응기 내 제열성능이 매우 중요 하다. 특히 반응물의 농도가 높은 반응기 초입 부에 서 높은 발열현상으로 인해 촉매의 비활성화, 높은 메탄 선택도, 그리고 안전에 대한 문제가 있어 이를 해결하고자 <그림 3>에서 표현한 것과 같이 반응기 앞부분은 촉매와 함께 Al2O3와 같은 비활성물질을 넣 어 희석된 촉매를 넣고 뒷부분에는 높은 농도의 촉 매를 넣어 발열량을 분산시키는 불연속 최적 촉매충 진법이 제안되었다[6].

기존의 연구는 반응기 모델은 2차원 축 대칭 전산 유체역학을 이용하여 반응기모사를 진행하고, 2 단 계 GA 최적화를 통해 C5+ 생산량과 반응기 내 최대 온도(∆Tmax)를 동시에 최적화해 파레토곡선을 얻었 다. 이러한 방법은 반응기 모델을 직접 지속적으로 돌려야 하기 때문에 최종 결과가 더 나은 파레토곡 선을 보여줄지라도 연산량이 많아져 비효율적일 수 있다는 단점이 있다. 이에 본 최적화를 가우시안 프 로세스를 이용한 베이지안 최적화 방법론으로 수행 한 결과를 <그림 4>에서 보여준다.

그림에서 나타나는 것처럼 Genetic Algorithm(GA) 를 사용한 최적화 방법론과 가우시안 프로세스를 사 용한 방법론은 비슷한 파레토곡선을 가진다. 하지만 GA를 사용한 최적화 방법론은 2000번에 가까운 전산 유체역한 기반 반응기모델 연산이 필요한 반면 가우 시안 프로세스의 경우 33번의 CFD simulation 만으로 보다 넓은 도메인에 걸쳐 파레토곡선을 구할 수 있음 을 보여준다.

그림 3. FT 마이크로채널 반응기에 적용된 불연속 촉매충진 방법[6].

(5)

3. 결론 및 outlook

본 기고를 통하여 최근 주목받고 있는 기계 학습 법을 적용한 공정 시스템 최적화에 대한 내용을 사 례 중심적으로 살펴보았다. 복잡한 제 1 법칙을 명확 하게 규명하여 최적 공정을 설계하거나, 전통적으로 공정최적화에 활용되었던 수리계획법을 통해 수학 적으로 자명한 최적해를 찾는 방식으로 진행되면 좋 겠으나, 1) 현실적인 컴퓨팅 파워의 한계로 인한 시 간문제, 2) 수리계획법을 위한 모델링 구축의 복잡성 및 함수 구조의 제한성, 그리고 3) 화학, 물리적 현상 에 대한 제 1법칙에 대한 무지로 인하여 다양한 기 계 학습법이 많은 부분에서 강세를 보이고 있다. 특 히 본 기고에서 살펴본 바와 같이 실제 데이터를 이 용해 대안모델을 훈련시켜서 거의 제 1 법칙을 비슷 하게 모방하는 subset selection부터 해서, 계산시간이 오래 걸리는 전산유체역학 기반의 반응기 모델에 적 합한 베이지안 최적화, 그리고 시계열데이터 및 모 델예측제어에도 활용할 수 있는 대안모델까지 다양 한 분야에 적용될 수 있는 가능성을 가지고 있다. 최 근에는 2차원, 3차원의 이미지 데이터들이 가지고

있는 추상화된 특징을 자체적으로 학습할 수 있는 기법과 AlphaGo에 쓰인 것과 같은 강화학습, 그리고 Monte Carlo Tree Search와 같은 탐색 알고리즘을 복 합적으로 적용하여, 대규모 공정의 계약 기반 모듈 자율 설계(contract based modular autonomous design), 풍력 및 태양광 발전 시스템의 최적 운전 전략 도 출 등, 전통적인 공정 최적화를 뛰어넘어 전혀 새로 운 형태의 최적화 방법론이 개발되고 있다. 이런 다 양한 기계학습 기법들을 공정 최적화 분야에 적절히 적용되어 많은 시너지를 내고 있는 이 지점에서, 우 리 역시 인공지능, 스마트팩토리, 빅데이터 등의 4차 산업혁명을 대표하는 다양한 기술을 공정 시스템 공 학 분야에 적용하기 위해 인적자원 확보와 많은 투 자가 이루어져야 할 것이라고 생각한다.

References

1. Wilson, Z.T. and N.V. Sahinidis, The ALAMO approach to machine learning. Computers & Chemical Engineering, 2017. 106(Supplement C): p. 785-795.

2. Jung, I., et al., Optimal design of a large scale Fischer- Tropsch microchannel reactor module using a cell- coupling method. Fuel Processing Technology, 2017.

159(Supplement C): p. 448-459.

3. Torchio, M., et al., Design of Piecewise Affine and Linear Time-Varying Model Predictive Control Strategies for Advanced Battery Management Systems. Journal of The Electrochemical Society, 2017. 164(4): p.

A949-A959.

4. Miller, D.C., et al., Carbon Capture Simulation Initiative: A Case Study in Multiscale Modeling and New Challenges. Annual Review of Chemical and Biomolecular Engineering, 2014. 5(1): p. 301-323.

5. Cozad, A., N.V. Sahinidis, and D.C. Miller, Learning surrogate models for simulation-based optimization.

AIChE Journal, 2014. 60(6): p. 2211-2227.

6. Na, J., et al., Multi-objective optimization of microchannel reactor for Fischer-Tropsch synthesis using computational fluid dynamics and genetic algorithm. Chemical Engineering Journal, 2017. 313: p.

1521-1534.

그림 4. 2 단계 GA 최적화와 가우시안 프로세스를 이용한 베이지 안 최적화 방법비교.