• 검색 결과가 없습니다.

머신러닝

문서에서 저작자표시 (페이지 39-46)

2. 선박 접안에너지

3.2 머신러닝

Table 3.1과 같은 특징에 따라 머신러닝은 빅데이터를 기반으로한 인공지능 (artificial intelligence, AI)의 일부라고 할 수 있다. 이는 컴퓨터 또는 기계가 복 잡한 데이터 또는 문제를 입력하여 스스로 학습하게 하고 인간수준의 능력을 발휘하는 것을 뜻하기 때문이다. 이에 발전된 딥러닝(Deep Learing)은 머신러닝 의 한 분야이지만 약간의 차이점이 있다. 딥러닝은 컴퓨터 또는 기계가 학습조 차도 스스로 판단하여 실행하고 미래의 상황을 예측하는 분야이다. 딥러닝의 한 예로는 전 세계가 주목한 2016년 3월 딥마인드 챌린지 매치(Google Deepmind Challenge match)에서 펼쳐진 알파고(AlphaGo)와 이세돌 9단의 대국 이 있다. 빅데이터, 인공지능, 머신러닝, 딥러닝의 관계도는 Fig. 3.4와 같이 설 명된다(전해남, 2018).

Fig. 3.4 Relationship diagram of Big Data, Machine Learning and Deep Learning

머신러닝은 학습종류에 따라 3가지로 분류하는데 지도학습(Supervised Learning)과 비지도학습(Unsupervised Learning), 강화학습(Reinforcement Learning)으로 나눠진다(Raghav Bali et al., 2017; 박인근 등, 2019).

지도학습은 주로 데이터를 통한 예측모델을 구축하는데 많이 쓰인다. 예측모 델은 데이터와 머신러닝 알고리즘으로부터 추측 가능한 값들을 학습하여 얻어 진다. 지도학습 알고리즘은 입력된 데이터의 특성과 예측 결과 값의 연관성 및 관계를 모델링하는 것이다. 지도학습 알고리즘은 분류와 회귀 알고리즘으로 나 뉜다.

- 분류 알고리즘(Classification algorithm) : 카테고리나 레이블을 가진 데이터 를 바탕으로 예측모델을 만든다. 새로운 데이터가 입력되었을 때 그 카테고리 나 레이블을 분류하기 위한 예측에 사용된다.

- 회귀 알고리즘(Regression algorithm) : 데이터로부터 얻은 특성을 바탕으로 결과값을 예측한다. 기존 데이터를 통한 특성 및 결과값을 통해 모델을 만들고, 이 모델을 사용하여 새로운 데이터에 해당하는 값을 예측하는 알고리즘이다.

- 인공신경망(Artificial Neural Network, ANN) : 인간 두뇌의 학습 과정을 뉴 런과 노드의 망 등을 통한 연산 과정으로 간주하여 만들어진 분류, 예측 모형 이다. 데이터를 뉴런과 노드의 망을 통해 입력하여 분석하고 출력한 뒤 결과를 도출한다.

비지도학습은 입력된 데이터로부터 규칙, 패턴을 도출하여 데이터를 요약하 거나 그룹화하여 결과를 해석하고 데이터를 분석하는 방법이다. 이에 대한 결 과 값에는 카테고리나 레이블은 존재하지 않는다.

- 군집화 알고리즘(Clustering algorithm) : 입력 데이터로부터 도출한 특징을 이용하여 다양한 카테고리로 군집화 또는 그룹핑(Grouping)하는 알고리즘이다.

분류 알고리즘과 다른 점은 결과 값을 도출하기 전까지는 결과 레이블을 알 수 없다.

- 연관성 규칙 학습 알고리즘(Association rules algorithm) : 이 알고리즘은 데

이터의 규칙과 패턴을 알아내고자 할 때 사용된다. 데이터 내의 각기 다른 변 수와 속성을 분석하여 도출하고 그 사이의 관계를 규칙을 설명한다.

- 차원 축소 알고리즘(Dimensionality Reduction algorithm) : 차원 축소 알고 리즘은 보통 데이터가 복잡하고 높은 차원을 가져 분석 및 시각화 등이 어려울 때 사용된다. 이는 데이터에 적합한 머신러닝 기법을 찾기 이전의 초기단계에 도 사용된다. 크게 속성 선택(feature selection)과 속성 추출(feature extraction) 으로 나눌 수 있다.

강화학습은 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여 선 택 가능한 행동 중 행동에 따른 보상을 얻게 하면서 최선의 행동 또는 행동순 서를 선택하는 방법이다(박인근 등, 2019). 이와 같은 머신러닝의 3가지 학습방 법에 따라 알고리즘의 종류를 Table 3.2과 같이 정리하였다.

Learning Analysis Algorithm

Supervised Learning

Classification

KNN (K-Nearest Neighbors) NBC (Naive Bayes Classification) Surpport Vector Machine

Desicion Tree Random Forest Cross-Validation Ensemble Learning Boosting

Hidden Markov model

Regression

Linear Regression Logistic Regression Ridge Regression Lasso Regression Jackknife Regression Artificial Neural

Network, ANN

CNN (Convolutional Neural Network) RNN (Recurrent Neural Network) DQN (Deep Q-Network)

Unsupervised Learning

Clustering

K-means Clustering Density-based Clustering Fuzzy Clustering

SOM, Self-Organization Map Association

rules

Association rules Navie Bayes

Dimensionality Reduction

PCA (Principle Component Analysis) ICA (Independent Component Analysis) NNMF (Non-negative matrix factorization) SVD (Singular Value Decomposition) Reinforcement

Learning

Monte Carlo Method

TD-Learning, Temporal Difference Learning Policy Gradient Algorithm

Table 3.2 Machine Learning algorithm

머신러닝 알고리즘 중 특히 지도학습 알고리즘이 미래에 대한 예측이 가능하 고 예측을 통한 예방 및 대비가 가능하기 때문에 각 산업분야에서는 머신러닝 지도학습 알고리즘 머신러닝을 이용한 연구가 활발히 진행되고 있다.

남규민(2018)은 데이터마이닝 기법을 이용하여 기업부실 예측모형의 성과를 비교하였다. 머신러닝 지도학습 알고리즘인 로지스틱회귀(Logistic Regression), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network, ANN)을 이 용하여 부실기업과 정상기업에 대한 기업부실 예측모형의 성과를 비교하였다.

김지혜(2018)은 조선 생산 리드타임 예측을 위한 기계학습 방법론을 연구하였 다. 빅데이터 기반의 머신러닝 알고리즘 연구가 조선분야의 설계분야에서는 이 루어지고 있으나 생산관리 관점에서 연구가 미흡하다고 언급하였다. 조선소의 공정에 따른 생산 리드타임이라는 시간요소에 대한 개선을 위하여 머신러닝 알 고리즘을 적용하여 예측모델을 구축하였다.

임상섭(2018)은 벌크선 용선에 수반되는 기간연장옵션의 가격 결정 문제와 일 정기간 확보된 선박을 이용하여 다양한 대선 전략을 선택하는 문제를 다루며 머신러닝 기법을 활용하였다. 머신러닝 기법의 비교를 통해 최적의 해운의사결 정문제 적용가능성을 제시하였다.

본 논문의 목적은 선박의 접안속도를 이분화해서 적정 접안속도 예측모델을 만들고 접안속도에 미치는 요인을 분석하는 것이다. 예측대상인 ‘접안속도’

가 출력되는 값으로 정의되며 예측모델을 생성하기 위하여 접안속도에 영향을 미치는 요인들을 입력값으로 가진다. 따라서 본 논문에서는 머신러닝 기법 중 지도학습을 적용하며 그 중에서도 예측에 대표적인 알고리즘인 의사결정나무 (Decision Tree), 랜덤포레스트(Random Forset), 로지스틱회귀(Logistic Regression), 인공신경망(Artificial Neural Network, ANN)을 이용하여 예측모델 을 만들고자 한다. 예측모델을 이용하여 접안속도에 미치는 요인을 분석할 수 있다. 머신러닝 기법을 이용한 본 논문의 데이터 분석 과정은 Fig. 3.5와 같다.

Fig. 3.5 Data analysis process

문서에서 저작자표시 (페이지 39-46)

관련 문서