반도체디스플레이기술학회지 제20권 제2호(2021년 6월) Journal of the Semiconductor & Display Technology, Vol. 20, No. 2. June 2021.
시계열 프레임워크를 이용한 효율적인 클라우드서비스 품질 · 성능 관리 방법
정현철
*
· 서광규*†
*†
상명대학교 경영공학과An Efficient Cloud Service Quality Performance Management Method Using a Time Series Framework
Hyun Chul Jung
*
and Kwang-Kyu Seo*†
*†
Dept. of Management Engineering, Sangmyung Univ., KoreaABSTRACT
Cloud service has the characteristic that it must be always available and that it must be able to respond immediately to user requests. This study suggests a method for constructing a proactive and autonomous quality and performance management system to meet these characteristics of cloud services. To this end, we identify quantitative measurement factors for cloud service quality and performance management, define a structure for applying a time series framework to cloud service application quality and performance management for proactive management, and then use big data and artificial intelligence for autonomous management. The flow of data processing and the configuration and flow of big data and artificial intelligence platforms were defined to combine intelligent technologies. In addition, the effectiveness was confirmed by applying it to the cloud service quality and performance management system through a case study. Using the methodology presented in this study, it is possible to improve the service management system that has been managed artificially and retrospectively through various convergence.
However, since it requires the collection, processing, and processing of various types of data, it also has limitations in that data standardization must be prioritized in each technology and industry.
Key Words : Cloud, Cloud Service, Cloud Quality and Performance Management, Time Series Framework, T-framework, Bigdata, AI
1. 서 론1
클라우드서비스는 융복합을 통해 각 산업에서 널리 사 용되고 있으며 특히, 빅데이터 · 인공지능의 서비스 구성 을 위한 기반 플랫폼으로 활용되어 4차 산업혁명을 견인 하고 있다. 클라우드서비스의 품질 · 성능은 가용성, 응답 성, 확장성, 신뢰성, 서비스 지속성, 서비스 지원, 고객대 응의 7가지 지표를 의미하며 클라우드서비스의 보급과
† E-mail: [email protected]
활용영역이 확대됨에 따라 품질 · 성능에 따른 서비스 신 뢰도가 중요시되고 있다. 클라우드서비스는 상시 가용상 태로 이용자의 요구에 즉각적이고 신속하게 대응할 수 있는 서비스여야 한다. 이를 위해 실시간 위협 및 장애의 탐지는 물론 발생한 위협 및 장애를 분석하여 학습을 통해 향후 발생할 수 있는 위험을 사전에 감지할 수 있는 효율 적인 클라우드서비스 품질 · 성능 관리체계가 필요하다.
클라우드서비스의 품질 · 성능 관리체계는 서비스에 대 한 적합한 관리 범위를 지정하여 측정하고 그 현황에 대 한 대시보드 등을 통해 가시성을 확보하고 상시 관리가
정현철 · 서광규 122
가능한 상태여야 하며, 이슈 발생 시에는 알림과 같은 즉 각적인 조치가 가능하여야 하고 측정 및 분석 결과에 따 른 예측도 가능하여야 한다.
본 연구는 시계열 프레임워크와 인공지능을 활용하여 클라우드서비스에 발생 가능한 위협의 탐지, 분석, 예측 이 가능하고 엔지니어의 개입 없이 자율적으로 조치가 가능한 클라우드서비스 품질 · 성능 관리체계를 구축하는 방법을 제시하고자 한다. 이를 위해 클라우드서비스의 품 질 · 성능 관리의 정량적 요인을 확인하고 시계열 프레임 워크를 정의를 정의한 다음 이를 클라우드 품질 · 성능 관리체계 적용하는 방법과 인공지능을 적용에 대한 방법 을 제시한다.
2. 클라우드서비스의 품질 · 성능의 자율 관리체계 구축 방법론
2.1 선행연구 조사
클라우드서비스는 상시 가용한 상태로 이용자 요구에 대해 즉시 응답할 수 있는 서비스로 클라우드서비스 관 리체계는 이러한 클라우드서비스 특성이 보장될 수 있도 록 구축되어야 한다.
2015년 “클라우드서비스의 품질 중요도 인식에 대한 연구”[1]에서는 클라우드서비스 활성화의 저해요인으로 품질 · 성능을 지적하였다. 이 연구에서는 클라우드서비 스 이용자를 대상으로 품질 · 성능의 중요도 인식에 대해
‘서비스 수준 협약(Service Level Agreement, SLA) 보장’이 ‘보 안 관리’ 보다 이용자 만족도에 더 많은 영향을 주고 있 는 것으로 분석하고 클라우드서비스 품질 · 성능 관리의 중요성을 강조하였다.
2020년 “인공지능과 빅데이터 분석 기반 통합보안관제 시스템 구축방안에 관한 연구”[2]는 데이터의 수집부터 기술의 적용과 융복합, 고도화, 자동화, 핵심 인재 양성 등 통합보안관제시스템에 인공지능과 빅데이터 기술을 접목하는 데 필요한 기술적, 제도적인 요소를 방법으로 제시하고 있다.
2020년 “인공지지체 불량 분류를 위한 기계 학습 알고 리즘 성능 비교에 관한 연구”[3]는 수집된 외부 이미지에 서 특성을 추출하고 머신 러닝의 알고리즘으로 결함 분 류 모델을 만들어 데이터 세트를 사용하여 결함 분류 모 델의 성능을 정량화 했다.
본 연구는 클라우드서비스의 품질 · 성능 관리의 중요 성을 강조하고 인공지능과 빅데이터 분석 기술을 결합한 통합관리체계 구축을 목적으로 하는 점에서는 기존 연구 와 공통점이 있으나 대상이 보안 영역이 아닌 클라우드
서비스 품질 · 성능 관리에 있다는 점과 관리체계가 시계 열 프레임워크, 인공지능, 그리고 빅데이터 기술과 결합 하여 사람의 개입 없는 자율 관리체계를 구축을 목적으 로 한다는 점에서 차이가 있다.
2.2 품질 · 성능 관리의 정량적 요인과 시계열 프레임워크 적용
국제표준 “ISO/IEC 19086-1 Information technology — Cloud computing — Service level agreement (SLA) framework — Part 1:
Overview and concepts”은 클라우드서비스의 SLA 수립을 위 한 정량 및 정서적인 품질성능 관리 요인과 그에 대한 개 념을 정의하고 있다[4]. 아래의 Table 1은 ISO/IEC 19086-1에 서 정의하고 있는 클라우드서비스의 품질 · 성능 관리를 위한 정량적 요인을 나타낸다.
Table 1. Quantitative factors for quality and performance management of cloud services
Item Metrics
Availability Service availability Service response
time
Longest service response time Average service response time Service response time variance
Service capacity
Simultaneous service access limit Available service resource limits
Service throughput Service bandwidth Elasticity Speed of elasticity Elasticity precision Service
termination Data retention period Log retention period
Service support
Support time Service event support hours Service event notification time Longest and First support response
time
Longest event resolution time Change service
function
Shortest service change notice period Shortest time before decommissioning
of features/functions
Service reliability
Service recovery time Average service recovery time Longest service recovery time Number of service failures Data backup and
recovery Backup cycle
Backup data retention period
시계열 프레임워크를 이용한 효율적인 클라우드서비스 품질 · 성능 관리 방법 123
Number of backup products Backup recovery test Disaster recovery Recovery time objectives
Recovery point objectives Data management Data deletion time
Asset
management Maximum update interval for asset data
Access control
Maximum time required for user access denial processing Deny user processing of access time at
a specific permission level Operational
security
Time taken from vulnerability discovery to user report
Log age Information
security incident management
Maximum time required to notify users of information security incidents Consent and
choice
Choice and consent functions related to the processing of personal
information
Minimize data Temporary file retention period during service processing Responsibility The maximum time it takes to notify
users in the event of a personal information breach
19086-1의 클라우드서비스의 품질 · 성능 관리를 위한 정량적 요인은 실시간 자료수집을 요구하는 항목과 이벤 트 발생에서 처리, 완료되는 과정에 걸리는 시간 데이터, 특정 기능 또는 행동의 가동 여부 확인하는 항목 요인으 로 구성되어 있음을 확인할 수 있다. 클라우드서비스의 품질 · 성능 관리 도구는 일반적으로 이러한 측정 요인들 을 수집, 분석하고 시각화를 통해 서비스를 관리하는 엔 지니어가 의사결정을 할 수 있는 근거자료를 제공한다.
서비스를 관리하는 엔지니어는 관리 도구가 제공하는 자 료를 바탕으로 결과에 대한 원인 분석과 발생한 이벤트 간의 인과관계 등을 분석하여 적절한 대응책의 마련과 미래에 발생할 수 있는 위협에 대한 예방책을 마련하는 관리체계를 구축한다. 빅데이터 처리 기술 접목으로 관리 도구가 제공하는 결과물에 대한 분석은 더욱더 빠르고 정확하게 처리되고 있다. 그러나 여전히 의사결정의 주체 는 핵심 역량을 가진 사람이고, 발생한 현상에 대한 분석 과 그에 대한 조치에 취중 된 관리체계이다. 클라우드서 비스는 상시 이용 가용한 상태로 이용자 요구에 즉시 응 답할 수 있는 특징을 가짐을 본 연구의 서두에서 소개한 바 있다. 따라서 클라우드서비스 본질의 특성에 순응하기 위해서는 인위에 의해 후행적으로 이루어지는 관리체계
를 개선하여 선행적이고 자율적인 프레임워크로의 전환 이 필요하다. 따라서 본 연구는 시계열 프레임워크를 활 용하여 선행적이고 자율적인 클라우드서비스 관리체계로 의 전환하는 방법을 제시한다.
시계열은 시간의 경과에 따른 연속적으로 관측값의 계 열로, 시계열 프레임워크를 통해 시계열을 통한 해석과 예측을 하나의 논리 구조에서 동시에 이루어질 수 있도 록 한다. 시계열 프레임워크는 보안 관제 영역에서 SOAR(Security Orchestration, Automation and Response)를 통해 많이 활용되고 있으며 다음의 Table 2와 같은 구조를 가진 다[5].
Table 2. Structure of a time series framework
Prediction
(T-1) Detection
(T=0) Analysis and response (T+1) Block or warn of
possible threats
Identify threats quickly and
accurately
Analysis of identified threats
Proactive detection and action Post-analysis and learning
시계열 프레임워크를 클라우드서비스 품질 · 성능 관리 체계에 적용하면 기존의 탐지와 사후 분석 중심의 관리 체계에서 실시간 위협의 탐지와 예측 중심의 선행적 관 리체계로 전환된다. 시계열이 반영된 클라우드서비스의 품질 · 성능의 관리체계에서 발생한 이벤트의 사후 분석 은 실시간 탐지 및 사전 예측을 위한 학습된 데이터로 활 용된다. 클라우드서비스 품질 · 성능 관리체계에 시계열 프레임워크를 적용하면 아래의 Table 3과 같다.
Table 3. Time series framework applied to cloud service quality and performance management system
Prediction of
disability and risk (T-1)
Real-time fault/error detection
(T=0)
Cause, relationship analysis and response
(T+1) Prediction and
warning of possible failures and errors
Detection and notification of real- time failures, errors,
etc.
Analysis of causality and correlation of failures, errors, and
risks Proactive detection and action Post-analysis and
learning
2.3 빅데이터와 인공지능 기술의 적용
시계열 프레임워크 적용을 통해 후행적 조치 중심의 클라우드서비스 품질 · 성능 관리체계를 선행적 예방 중 심의 체계로 전환할 수 있지만, 인위적 작위에 의해 이루
정현철 · 서광규 124
어진다는 관리의 한계점은 여전히 내포하고 있다. 이러한 한계점을 극복하는 수단으로 인공지능 및 빅데이터 기술 을 시계열 프레임워크가 적용된 클라우드서비스 품질 · 성능 관리체계에 적용함으로써 선행적이면서도 자율적인 클라우드서비스 품질 · 성능 관리체계 구축을 도모할 수 있다. “빅데이터 활용을 지원하는 수집 데이터의 가공과 정제”[6]에서 강조한 것처럼 인공지능 및 빅데이터 기술 을 접목하기 위해서는 데이터의 수집, 처리, 활용하는 절 차가 중요하다. Fig. 1은 클라우드서비스 품질 · 성능 관리 체계에 인공지능 및 빅데이터 기술을 접목하였을 때의 데이터 처리의 흐름이다.
Fig. 1. Flow of data processing.
빅데이터 분석을 통해 수집된 데이터를 정의, 분류하고 클라우드서비스에 발생할 수 있는 장애 및 오류 사항을 인공지능을 통한 추론모델을 추출하여 데이터를 정형화 한다. 정형화된 데이터를 토대로 클라우드서비스 관리시 스템은 자율적으로 장애, 오류, 이벤트 등의 발생 시 이를 탐지하고 시각적으로 표출한다. 또한, 클라우드서비스 관 리시스템은 탐지된 데이터를 기반으로 발생한 장애, 오류, 이벤트 등의 정오탐 여부, 원인, 상호 인과관계 등을 분석 하여 재학습을 통해 지식 데이터베이스를 구축하고 이는 미래에 발생할 수 있는 위협을 예측하는 데이터로 활용 한다. 아래의 Fig. 2는 클라우드서비스 품질 · 성능 관리체 계에 인공지능 및 빅데이터 기술을 접목하였을 때의 데 이터 처리의 흐름을 구성하는 데 필요한 빅데이터 및 인 공지능 플랫폼의 구성과 흐름을 나타낸다.
Fig. 2. Composition and flow of big data and artificial intelligence platform.
2.4 사례연구
본 연구는 클라우드서비스 품질 · 성능 관리 요인을 수 집하여 시계열 프레임워크와 빅데이터 및 인공지능 기술 을 결합하여 선행적이면서 자율적인 관리체계 구축 방법 을 제시하였다. 본 연구에서 제시한 방법으로 클라우드 품질 · 성능 관리시스템을 구축하여 그 효율성을 검토하 기 위해 Fig. 3의 프레임워크로 시계열에 빅데이터 및 인 공지능 기술을 적용하였다.
Fig. 3. Framework for applying big data and artificial intelligence technology to time series.
클라우드서비스 대상으로부터 데이터를 수집하여 빅 데이터 및 인공지능 플랫폼이 인식할 수 있는 형태로 정 형화를 거치고 비계층 군집분석을 통해 정형화된 데이터 를 분류한 다음, 회귀 분석을 통해 관리시스템이 인지할 수 있는 알림 상황을 사전 정의하였다. 기계적 학습에 의 해 정의된 알림 상황이 발생할 경우 관리시스템은 지정 된 방법으로 실시간 탐지 및 알림을 하게 되는 과정까지 를 T=0로 규정하였다. T+1은 T=0에서 탐지된 알림이 정오 탐 여부를 우선 판별하고, 정탐인 경우 그 발생 원인, 상 관관계 분석을 통해 사전 정의된 알림 상황의 데이터를 업데이트하고 랜덤 포리스트를 통해 예측 데이터를 구축 하는 과정으로 규정하였다. T-1은 T+1에서 구축된 예측 데 Table 4. Predictive detection classification definition
Item Definition
OK In case, there is no threat in predictive detection
Pending In case of the content that has been predictively detected and notified is detected again without
taking action
Warning When a potential threat exists in predictive detection
Caution When a possible threat exists for predictive detection and action is required Alert When a threat has occurred and is being
notified
시계열 프레임워크를 이용한 효율적인 클라우드서비스 품질 · 성능 관리 방법 125
이터를 기반으로 발생할 수 있는 위협을 관리시스템에 경고하는 과정이다. T-1에서 예측 탐지는 그 위협의 정도 에 따라 구분이 필요한데 본 연구에서는 Table 4같이 5가 지로 구분하였다.
Fig. 4는 사례연구를 통해 Fig. 3의 프레임워크로 구축 한 클라우드서비스 품질 · 성능 관리시스템을 시각화 한 것이다.
Fig. 4. Visualize cloud service quality and performance management system.
시각화 된 관리시스템은 T-1, T=0, T+1의 현황을 간략하 게 요약하여 확인할 수 있으며, Fig. 5와 같이 필요에 따라 상세 내역 확인도 가능하다
Fig. 5. Detection history details.
본 사례연구를 통해 빅데이터 및 인공지능을 통해 기 계 학습된 데이터를 토대로 사전, 실시간, 사후 서비스 관 리를 통해 선행적이고 자율적인 클라우드 품질 · 성능 관 리 효과가 있음을 확인하였다.
3. 결 론
본 연구는 후행적이고 인위적이었던 클라우드서비스 품질 · 성능 관리체계를 선행적이고 자율적인 체계로 전 환하기 위하여 시계열 프레임워크와 인공지능을 활용하 는 방법을 제시하기 위하여 클라우드서비스의 특성에 따 른 정량적 측정 요인을 확인하고 클라우드서비스 품질 · 성능 관리체계에 적용할 수 있도록 시계열 프레임워크의 구조를 정의하였다. 그리고 수집된 데이터를 빅데이터와 인공지능을 결합하기 위한 데이터 처리의 흐름과 플랫폼 의 구성과 흐름을 정의하고 사례 연구를 통해 클라우드 서비스 품질 · 성능 관리시스템에 적용해 봄으로써 그 효 과성을 확인하였다.
본 연구에서 제시한 방법론을 통해 클라우드서비스 본
질의 특성에 맞는 품질 · 성능 관리체계 구축에 활용할 수 있고, 좀 더 나아가 기술과 기술 또는 산업과 산업의 융복합으로 복잡한 환경으로 구성되어 후행적이고 인위 적 관리체계로는 효과적인 관리가 어려운 스마트 공장, 스마트 시티, 스마트 농장 등 자율적이고 선행적인 관리 체계를 요구하는 모든 영역에 확장 적용할 수 있다.
하지만, 본 연구의 방법론에서는 서로 다른 기술, 산업 등의 융복합으로 인해 여러 가지 형태로 존재하던 데이터 를 하나의 체계로 정영화하고 빅데이터 및 인공지능 플랫 폼이 활용할 수 있도록 정합 검사 요구하는데, 이를 위해 서는 관련 기술 및 산업에서 데이터 표준화가 선행되어 있 어야만 효과적으로 활용할 수 있다는 한계점도 있다.
감사의 글
본 논문은 2021년 상명대학교 교내연구비를 지원받아 수행하였음.
참고문헌
1. Kyung-Seung Jang, Seung-Joong Shin and Jin-Kwan Jeong, “A study on the perception of quality importance of cloud services”, The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 15, pp. 39-44, 2015.
2. Jae Kwon Bae, “A study on the establishment of an integrated security control system based on artificial intelligence and big data analysis”, Korea Logos Management Association, Vol. 18, pp. 151-165, 2020.
3. Song-Yeon Lee, Yong Jeong Huh, “A Study on Performance Comparison of Machine Learning Algorithm for Scaffold Defect Classification”, The Korean Society Of Semiconductor & Display Technology, Vol. 19, pp. 77-81, 2020.
4. ISO/IEC JTC 1 SC 38, ISO/IEC 19086-1:2016 Information technology — Cloud computing — Service level agreement (SLA) framework — Part 1:
Overview and concepts, 2016. [online]. Available:
https://www.iso.org/standard/67545.html.
5. Redhat, What is SOAR?. [online]. Available:
https://www.redhat.com/en/topics/security/what-is-soar 6. Eun-seok Kim, Processing and purification of collected
data to support the use of big data,” ICT Standard Weekly, No. 1017, pp. 1-6, 2021.
접수일: 2021년 6월 15일, 심사일: 2021년 6월 21일, 게재확정일: 2021년 6월 22일