공사기간 영향요인에 따른 생산성의 OLAP 분석과 의사결정트리 분석
OLAP and Decision Tree Analysis of Productivity Affected by Construction Duration Impact Factors
류 한 국*1)
Ryu, Han-Guk*
Department of Architectural Engineering, Changwon National University, Changwon, GyeongNam-Do, 641-773, Korea
Abstract
As construction duration significantly influences the performance and the success of construction projects, it is necessary to appropriately manage the impact factors affecting construction duration. Recently, interest in the construction industry has been rising due to the recent change in the construction legal system, and the competition among the construction companies on construction time. However, the impact factors are extremely diverse. The existing productivity data on impact factors is not sufficient to properly identify the impact factor and measure the productivity from various perspectives, such as subcontractor, time, crew, work and so on. In this respect, a multidimensional analysis by a data warehouse is very helpful in order to view the manner in which productivity is affected by impact factors from various perspectives. Therefore, this research proposes a method that effectively takes the diverse productivity data of impact factors, and generates a multidimensional analysis. Decision tree analysis, a data mining technique, is also applied in this research in order to supply construction managers with appropriate productivity data on impact factors during the construction management process.
Keywords : Construction Duration Impact Factor, Productivity, Multidimensional Analysis, Decision Tree, Data Warehouse
1. 서 론
1.1 연구의 배경 및 목적
건설 공사는 다양한 주체(발주자, 시공자, 설계자, 감리 자)가 참여하고 공장생산품의 제조업과는 달리 동적이며, 위 험요소가 많은 현장 생산 작업이다. 건설 프로젝트는 제한 된 시간과 정해진 품질 및 예산의 범위 내에서 목적을 달성 하기 어려운 경우가 많다. 특히 건설공사의 공사기간은 건
Received : April 26, 2010
Revision received : November 8, 2010 Accepted : November 15, 2010
* Corresponding author: Ryu, Han-Guk
[Tel: 82-55-213-3804, E-mail: [email protected]]
ⓒ2011 The Korea Institute of Building Construction, All rights reserved.
설프로젝트의 성공적인 완수를 위하여 공사기간에 영향을 미치는 요인들을 체계적으로 관리하는 것이 필요하다. 최근 에는 건설 제도적 변화로 건설공사의 공사기간에 대한 관심 이 증대되고 있다[1]. 건설 프로젝트의 공사기간에 미치는 영향요인은 매우 다양하며, 각 요인들 중 어떤 요인이 어느 정도 작업의 생산성에 영향을 미치는지에 대한 데이터의 체 계적인 활용이 부족하다. 또한 특정 프로젝트, 특정 작업, 특정 협력업체 등에 영향을 미치는 요인이 무엇인지 또는 전체 프로젝트에 공통적으로 영향을 미치는 요인이 무엇인 지를 인식하는 것조차 어려운 경우가 많다.
이에 데이터 웨어하우스 기술의 다차원 분석을 활용함으
로써 다양한 각도에서의 공사기간 영향요인이 미치는 생산
성을 파악할 수 있다. 본 연구는 건설공사에서 발생하는 다
양한 영향요인에 따른 작업 생산성 데이터를 OLAP기술의
OLAP and Decision Tree Analysis of Productivity Affected by Construction Duration Impact Factors
다차원 분석을 실시하고 의사결정에 활용할 수 있는 데이터 모델링, 데이터 마이닝 모델, 데이터 마이닝 기술 중 의사결 정 트리분석을 적용하여 생산성 데이터들을 효과적으로 활 용하는 방법을 제시한다.
1.2 연구의 범위 및 방법
본 연구의 절차와 방법은 Figure 1과 같다. 데이터 웨어 하우스 기술의 OLAP 기술의 정의와 특징을 살펴보고 공사 기간의 영향요인에 따른 생산성 정보를 활용할 수 있는 지 에 대한 가능성을 살펴본다.
공사기간의 영향요인에 따른 생산성에 영향을 미치는 요 인에 대하여 참여주체별로 구분하여 살펴보고 영향요인에 따른 생산성 정보를 다차원으로 분석한다.
의사결정트리 분석을 통하여 공사기간의 영향요인에 따른 생산성 데이터에 함축된 정보를 도출하여 데이터 마이닝의 적용 가능성을 제시한다. 결론으로 본 연구의 결과 및 성과 를 서술한다.
Figure 1. Research process and method
2. 예비적 고찰
2.1 건설공사의 공사기간 영향요인
건설공사의 공사기간에 영향을 미치는 요인은 다양하다.
그 요인은 분류방식에 따라 다양할 것이나 본 연구는 공사
기간에 영향을 미치는 요인이 어떤 차원들에 따라 영향을 받는지에 대한 다차원 분석을 위한 것이므로 참여주체에 따 라 분류하였다.
본 연구는 공사기간 영향요인을 구분하는 연구가 아니라 영향요인이 있다라는 가정하에 이와 관련된 생산성정보를 축적하고 활용성을 제시하는 연구로 범위를 한정하였다. 즉 공사기간 영향요인을 귀책사유에 따라 구분하였으며 본 연 구에 사용된 공기영향요인은 참고문헌[2]의 연구에서 발췌 하여 사용하였다. 주요 내용은 다음과 같다.
1) 발주자의 공사기간 영향 요인
발주자 공사기간 영향 요인은 크게 발주자가 계약상의 책 임을 완수하지 못한 결과로 인한 요인, 계약상에 지정된 작 업에 변화를 유발, 원도급자의 작업 방해, 작업의 비협조 등 이다. 일반적인 발주자의 계약상의 책임은 프로젝트 부지, 승인, 재정, 설계와 계약의 이행과 관련이 있다.
2) 설계자의 공사기간 영향 요인
설계도면, 계약서류, 시방서 등에서 설계자의 작업 결함 은 프로젝트의 실적에 많은 영향을 미치게 된다. 설계자의 잘못은 원도급자의 작업에 직접적으로 영향을 미친다. 일반 적으로 설계자에 의한 공사기간 영향 요인은 설계결함, 설 계 잘못의 태만적 수정, 작업상세도의 태만적 검토, 검사의 지연으로 분류할 수 있다.
3) 원도급자와 협력업체의 공사기간 영향 요인
원도급자와 협력업체의 공사기간 영향 요인은 대지조사와 설계검토의 부족, 계약 검토 부족, 자금, 자재, 노무 등의 부적절한 자원관리, 시공 결함, 외주 관리 부족 등으로 구분 할 수 있다.
4) 제3자의 공사기간 영향 요인
국내 공사계약 일반조건의 경우, 천재지변에 해당하는 불 가항력에 의한 사유는 발주자가 추가비용을 책임지도록 되 어 있다. 이러한 요인은 특정 참여주체들의 통제범위를 벗 어난 것이지만 공사기간에 영향을 미치므로 적절하게 관리 될 수 있도록 노력해야 한다. 이와 같은 제3자에 의한 요인 들은 악천후, 노동 분쟁, 피할 수 없는 재난, 교통 지연 등 이다.
2.2 OLAP(On Line Analytical Processing)의 정의와 특징
OLAP은 OLTP(On Line Transaction Processing)에
상대되는 개념으로 1993년 코드(Codd)에 의해 처음 사용된
용어이다[3,4]. 코드는 기업의 데이터 모델을 정적 모델과
를 생성, 조작, 활성화(animation), 종합하는 데 필요한 역 동적 기업 분석”으로 정의하고 있다.
정적 모델이란 사용자들의 대화식 참여가 거의 없고 정형 화된 모델이며 동적 모델은 다차원 질의, What If분석, Goal Seeking에 해당한다. 사용자는 기업환경의 다양한 각 도에서 정보를 분석한다. 따라서 OLAP 모델은 다차원 데이 터 분석능력을 갖고 다차원적 관점에서 사용자들이 다차원 데이터 모델을 쉽고 직관적으로 조작 및 분석할 수 있다.
즉, OLAP은 “Analytical”이라는 단어에서 알 수 있듯이 데이터웨어하우스에 체계적으로 쌓여 있는 데이터 속에 담 겨 있는 정보를 효율적으로 끌어내어 분석하기 위하여 사용 된다[5]. 기존 운영 시스템과 구별된 OLAP의 특징은 4가지 로 구분할 수 있다.
첫째, 분석을 위해 활용되는 정보의 형태는 다차원이다.
다차원 정보는 사용자들에 의해 이해되는 기업의 실제 차원(기간, 협력업체, 자재, 작업자, 지역 등) 을 반영한다. 정보의 다차원성은 OLAP 시스템을 다른 시스템과 구분하는 가장 중요한 개념으로 OLAP을 다른 말로 표현한다면 바로 ‘다차원 분 석’이다.
둘째, 최종사용자는 중간 매개자(전산부서)나 매개체(리 포트)없이 온라인상에서 직접 데이터에 접근한다.
과거에는 사용자가 정보를 필요로 하는 경우, 전산 부서 등에 요구하면 원시 데이터가 추출되고, 추출 된 데이터는 다시 사용자에게 넘겨져 정보로 가공 되었다. 이는 많은 시간이 걸리고 사용자와 전산부 서 사이의 의사소통 장애로 인해 사용자가 원하는 정보를 얻기가 힘들다.
셋째, 최종사용자는 대화식(Interactive)으로 정보를 분 석한다. 하나의 질의는 또 하나의 질의를 이끌어 낸다. 예를 들어 “이번 달 작업량은 목표를 달성 했는가?”라는 질문은 만약 목표를 달성하지 못했 다면 “어떤 작업공종이 작업량 목표를 달성하지 못했는가?”, 혹은 “어떤 협력업체 또는 작업조 가 작업량 목표를 달성하지 못했는가?”와 같은 질문을 이끌어 낼 수 있다. 사용자는 이와 같은 대 화식 질의를 통해 시스템으로부터 신속하게 결과를 얻을 수 있다.
넷째, OLAP의 목적은 최종사용자가 조직의 전반적인 상
있다. OLTP는 매일의 데이터를 입력하고 활용할 수 있도록 하지만, OLAP는 장기적인 관점에서 조 직이 나아가야 할 방향을 설정할 수 있게 한다.
2.3 데이터 웨어하우스 기술을 적용한 건설관리 분야 기존 연구
데이터 웨어하우스 기술의 특징을 활용하여 건설 분야에 다양한 연구들이 2000년대에 들어서 많이 수행되고 있다.
주요 연구를 정리하면 Table 1과 같다.
3. 공기영향요인에 따른 다차원 생산성 분석
본 장에서는 공사 관리자가 의사결정에 활용할 수 있는 다양한 측면(차원)에서 영향요인이 미치는 생산성 다차원 분 석을 실시하였다. 생산성은 완료물량/작업자수이며 완료물 량은 작업한 양의 합이다. 공기영향요인에 따른 생산성의 변화는 “어떤 공기영향요인이 어떤 작업의 생산성에 어느 정도의 영향을 미쳤는가?”, “어떤 공기영향요인이 어떤 작업의 어느 시간에 생산성에 영향을 미쳤는가?”, “어떤 공기영향요인이 어떤 협력업체의 어느 작업조에 영향을 미 쳤는가?”, “ 어떤 공기영향요인이 어떤 작업의 어느 작업 공간에서 작업 생산성에 영향을 미쳤는가?” 등에 대한 다 차원적 답변이 필요하다는 관점에서 다차원 분석을 실시하 였다. 이와 같이 다양한 질문에 대한 답변은 여러 차원들을 조합하여 구성된 큐브의 셀 정보를 활용함으로써 가능하다.
따라서 본 연구의 다차원 분석을 위하여 사용된 차원은 공 기영향요인, 작업, 자재, 시간, 협력업체, 작업조, 작업공간 차원 등으로 규정하였다.
본 연구의 데이터 웨어하우스 기술의 다차원 분석을 적용 하기 위하여 Microsoft SQL Server 2005와 SQL Server Business Intelligence(BI) 2005를 활용하였다. 세부 공사 기간 영향요인의 차원별 생산성 다차원 분석은 다양하나 본 연구에서는 상기한 다차원 질문의 답변이 될 수 있는 사례 를 8가지로 정리하였다.
1) 공기영향요인(레벨 3단계의 공기영향요인으로 세분화)
과 작업 차원의 생산성 분석
OLAP and Decision Tree Analysis of Productivity Affected by Construction Duration Impact Factors
Researchers
(Year) Contents
Chau, KW et al (2002)[6]
A prototype construction management decision support system, acronym CMDSS was developed employing the integration of the
‘data warehouse’ technology with an OLAP was delineated.
Integration of a data warehouse and a DSS can enable the right data to be tracked down and provided the required information in a direct, rapid and meaningful way. Construction managers can view data from various perspectives with significantly reduced query time, thus making decisions faster and more comprehensive.
Lee, JK (2004)[7]
The research developed a preliminary system prototype of construction data warehouse of construction industry application to provide the construction manager with electronic decision supporting information. Construction data warehouse is a contractor-focused concept that provides electronic information analyzed from the separately stored database by management dimension, management subject and data warehouse technology modules.
Ahmad I, Azhar S, Lukauskis P
(2004)[8]
Application of the data warehousing technique in developing a prototype DSS for use in selecting sites for residential housing development was illustrated in the research.
The objective of the prototype DSS was to help investors or builders/developers to select the most appropriate site from a list of available ones by rank ordering.
The DSS is interactive and is built using data from several sources including spatial and financial ones. A GIS software had been used in the back-end of the system while an analytical modeling technique, AHP had been employed in the front-end.
Zhiliang M (2004)[9]
Based on the data warehousing technique, the research presented a method which can utilize electronically exchanged documents among project participants for decision support. A prototypical system called EXPLYZER was developed and tested through its application in a construction project.
Rujirayanyong T, Shi JJ (2006)[10]
The research presented a Project-oriented Data Warehouse (PDW) for contractors. PDW was designed with dimensional data models consisting of 26 tables. Sixteen of the tables were dimension tables for storing general descriptive information, and the other ten were fact tables for detailing various facts that are captured in the lifecycle of construction projects.
Oh SW, Kim MH, Kim YS (2006)[11]
The research developed a construction productivity management system using data warehouse, OLAP and data mining technologies which enables to accumulate the construction productivity data and perform multilayer analysis.
Fan H, Kim H and Zaiane OR
(2006)[12]
The research presented an equipment data warehouse and a prototype decision support system(DSS). The proposed equipment data warehouse enabled equipment managers to visually analyze the equipment data form different perspectives and at various level of details.
Table 1. Previous Construction Data Warehouse Research
Figure 2. Productivity of impact factor(level3 segmentation) and work dimension
2) 공기영향요인, 작업, 시간(2008년 하반기로 필터링) 차원의 생산성 분석
Figure 3. Productivity of impact factor, work, time(filtering:
2
ndhalf of 2008) dimension
3) 공기영향요인, 작업, 시간, 작업공간(101동 6F~10F 필터링) 차원의 생산성 분석
Figure 4. Productivity of impact factor, work, time, and
location(filtering:6F~10F of building 101) dimension
필터링), 작업조(미장2 필터링) 차원의 생산성 분석
Figure 5. Productivity of impact factor, work, time, location and crew(filtering: plaster 2) dimension
5) 공기영향요인(발주자 요인 필터링), 작업, 시간 차원의 생산성 분석
Figure 6. Productivity of impact factor(filtering:contractor's impact factors), work, time dimension
6) 공기영향요인(원도급자요인의 대지조사와 설계검토요 인 Filtering), 작업, 시간 차원의 생산성 분석
Figure 7. Productivity of impact factor(filtering:site investigation and design review of contractor), work, time dimension
시간 차원의 생산성 분석
Figure 8. Productivity of subcontractor(filtering:Handle industry Ltd.), impact factor, work, time dimension
8) 협력업체(한들공영(주) 필터링), 공기영향요인(발주자 요인 필터링), 작업, 시간 차원의 생산성 분석
Figure 9. Productivity of subcontractor(filtering:handle industry Ltd.), impact factor(filtering:owner), work, time dimension
4. 영향요인 데이터 마이닝을 위한 의사결정 트리 분석
3장에서는 공기영향요인에 따른 다차원적 생산성 정보를
제공하였다. 그러나 다차원 생산성 정보는 단순한 생산성
수치 정보만을 제공하지만 어떤 영향요인이 어떤 협력업체,
어떤 작업, 어떤 작업조 등에 얼마나 영향을 미치는 지에 대
한 정보를 제공하지는 못하였다. 따라서 본 장에서는 다차
원 분석에서 도출된 데이터로부터 숨겨진 정보를 추론하는
데이터 마이닝의 의사결정 트리분석을 실시하였다.
OLAP and Decision Tree Analysis of Productivity Affected by Construction Duration Impact Factors
데이터 마이닝을 흔히 "작업 가능하고 인증된 유효 정보 를 큰 데이터베이스에서 추출하는 프로세스"라고 설명한다.
즉, 데이터 마이닝은 데이터에서 패턴 및 경향을 찾아서 생 산성 예측, 특정 협력업체 또는 작업조에 작업 독려, 공사기 간 영향요인의 파급이 예산되는 작업의 확인 등의 특정 시 나리오에 적용할 수 있다.
데이터 마이닝 알고리즘으로는 의사결정 트리 1) , 클러스 터링, Naive Bayes, 신경망, 로지스틱 회귀 등이 있으며 본 연구에서는 의사결정 트리로 데이터 마이닝을 수행하였 다.
4.1 영향요인에 따른 작업량 분석을 위한 데이터모델
작업현황(STATUS)차원과 관련된 작업량을 파악하기 위 한 데이터모델은 Figure 10과 같다.
Figure 10. Data model for worked quantity analysis
작업현황(STATUS)차원과 관련된 작업량을 파악하기 위 하여 마이닝 모델은 Figure 11과 같다.
1) 의사결정 트리는 불연속 특성 및 연속 특성을 예측 모델 링에 사용하기 위한 분류 및 회귀 알고리즘이다. 불연속 특성의 경우 알고리즘은 데이터 집합 내 입력 열 간의 관 계를 기반으로 예측합니다. 알고리즘은 해당 열의 값 또는 상태를 사용하여 예측 가능으로 지정한 열의 상태를 예측 한다. 특히 알고리즘은 예측 가능한 열과 상관 관계에 있 는 입력 열을 식별합니다. 예를 들어 조적 작업의 생산성 을 예측하는 시나리오에서 자재 조달에 따른 작업 생산성 이 평균보다 10% 떨어진 반면 설계 레이아웃 변경으로 인해 생산성의 변화가 없었다면 알고리즘은 생산성에 있 어 공사기간 영향요인이 좋은 지표가 될 수 있음을 유추 할 수 있다.
Figure 11. Data mining model(decision tree) for worked quantity
Figure 12는 작업량에 영향을 미치는 요인 즉, 협력업체, 작업조, 영향요인의 종속성 네트워크를 나타낸다.
Figure 12. Dependency network graph of worked quantity
4.2 작업량의 데이터 마이닝을 위한 의사결정 트리
Figure 13과 같이 작업현황(STATUS)차원과 관련된 작 업량을 파악하기 위해 데이터 마이닝의 성향습득 사례의 데 이터수는 13866개임을 알 수 있다.
Figure 13. All case numbers for data mining
에서 "SubconID<29이고 CrewID=Form3"인 사례가 30개 로 IFID가 2~6번에 해당하는 영향요인이 작업조 FORM3 가 작업을 하는데 영향을 미쳤음을 알 수 있다.
Figure 14. Results of decision tree(level 4)
Figure 15. Drill through of data mining pattern recognition
Figure 16. Impact factors in the data warehouse
Form3"은 IFID가 2~6번에 해당하는 영향요인을 많이 받 았다. 즉, Figure 16에서 보듯이 발주자요인의 프로젝트 부 지와 관련된 영향요인을 많이 받았음을 알 수 있다.
5. 결론 및 향후 연구방향
연구는 데이터 웨어하우스의 OLAP 기술의 특징 중 하 나인 다차원 분석 기술과 의사결정트리 데이터마이닝을 통 하여 건설공사의 공사기간에 영향을 미치는 요인을 체계적 으로 관리할 수 있는 방법을 제시하였다. 본 연구를 통한 성과를 정리하면 다음과 같다.
건설공사의 공사기간 관리를 위한 주요 영향요인과 다차 원 정보를 제공할 수 있는 차원을 도출하고 다차원 분석과 데이터마이닝이 가능한 데이터 모델링과 데이터 마이닝 모 델을 구축하였다. 실제로 공사 관리자가 건설공사의 기간관 리에 필요한 다양한 차원에서 어떻게 정보를 추출할 수 있 는 지에 대한 방법을 제시하였다. 또한 의사결정트리 분석 을 통하여 공사기간의 영향요인에 따른 생산성 데이터에 함 축된 정보를 도출하였다.
본 연구의 기대효과로 건설공사 관리자가 건설공사 수행 중에 발생하는 공사기간 영향요인에 대한 체계적인 생산성 정보를 확인할 수 있다. 본 연구의 다차원 분석과 의사결정 트리 분석을 통하여 공사기간의 영향요인에 따른 생산성 정 보를 다차원적으로 제공하고 이에 대한 대책을 수립할 수 있다. 또한 의사결정자는 공사기간 영향요인에 대한 다차원 정보에 기반하여 데이터에 숨겨져 있는 정보를 데이터 마이 닝 기술로 도출할 수 있다.
요 약
건설공사의 공사기간은 건설프로젝트의 성공적인 완수를 위하여 중요한 부분을 차지하기 때문에 공사기간에 영향을 미치는 요인들을 체계적으로 관리하는 것이 필요하다. 최근 에는 건설 제도적 변화로 건설공사의 공사기간에 대한 관심 이 증대되고 있다.
그러나 건설 프로젝트의 공사기간에 미치는 영향요인은
매우 다양하며, 각 요인들 중 어떤 요인이 어느 정도 작업의
생산성에 영향을 미치는지에 대한 데이터의 체계적인 활용
OLAP and Decision Tree Analysis of Productivity Affected by Construction Duration Impact Factors
이 부족하다. 또한 특정 프로젝트, 특정 작업, 특정 협력업 체 등에 영향을 미치는 요인이 무엇인지 또는 전체 프로젝 트에 공통적으로 영향을 미치는 요인이 무엇인지를 인식하 는 것조차 어려운 경우가 많다.
그러나 데이터 웨어하우스 기술의 다차원 분석을 활용함 으로써 다양한 각도에서의 공사기간 영향요인이 미치는 생 산성을 파악할 수 있다. 이에 본 연구는 건설공사에서 발생 하는 다양한 영향요인에 따른 작업 생산성 데이터를 다차원 적으로 분석하고 의사결정에 활용할 수 있는 데이터 마이닝 기술을 적용하여 기존 생산성 데이터들을 효과적으로 활용 하는 방법을 제시한다.
키워드 : 공사기간 영향요인, 생산성, 다차원 분석, 의사결정트 리, 데이터 웨어하우스
Acknowledgement
This research is financially supported by Changwon National University in 2009-2010.
References