A Block Relocation Algorithm for Reducing Network Consumption in Hadoop Cluster

하둡 클러스터의 네트워크 사용량 감소를 위한 블록 재배치 알고리즘

1 )김 준 상*, 김 창 현*, 이 원 주**, 전 창 호*

A Block Relocation Algorithm for Reducing Network Consumption in Hadoop Cluster

Jun-Sang Kim*, Chang-Hyeon Kim*, Won-Joo Lee**, Chang-Ho Jeon*

∙제1저자 : 김준상 ∙교신저자 : 전창호

∙투고일 : 2014. 8. 21, 심사일 : 2014. 9. 16, 게재확정일 : 2014. 10. 13.

* 한양대학교 컴퓨터공학과(Dept. of Computer Science & Engineering, Hanyang University ERICA Campus)

** 인하공업전문대학 컴퓨터정보과(Dept. of Computer Science, Inha Technical College)

※ 이 논문은 2012년 한양대학교 교내연구비 지원으로 연구되었음(HY-2012-G)

1. Hadoop Distributed File System(HDFS)

2. 하둡 내장 스케줄러

3. 스케줄러 성능향상 관련 연구

1. 개요

2. Load Value

3. 블록 재배치 알고리즘

그림 1. 블록 재배치 알고리즘 Fig. 1. Block Relocation Algorithm

1. 개요

2. 시뮬레이션 환경

블록 용량 64MByte

클러스터의 블록 개수 70,000개

복사본 포함 블록 개수 210,000개

표 1. 시스템 파라미터 Table 1. System Parameters

작업 당 맵/리듀스 비율 9:1

전체 작업 수 630,000개

전체 태스크 수 6,300,000개

표 2. 작업 파라미터 Table 2. Job Parameters

3. 시뮬레이션 결과

내부 처리 블록 (TByte)

원격 처리 블록 (TByte)

블록 교체 오버헤드 (TByte)

Default 12.30 26.15 0

TH-10% 19.99 18.46 1.43

TH-20% 18.84 19.61 0.92

TH-30% 16.53 21.92 0.72

표 3. 시뮬레이션 결과 Table 3. Simulation Result

그림 2. 네트워크 전송량 비교

저 자 소 개

김 준 상 2003: 한양대학교

전자컴퓨터공학부 공학사 2005: 한양대학교

컴퓨터공학과 공학석사 2008-2012: 해군사관학교

컴퓨터학과 전임강사 현 재: 한양대학교

컴퓨터공학과 박사과정 관심분야: 성능 분석, 그리드 컴퓨팅,

클라우드 컴퓨팅 Email : [email protected] 김 창 현

2008: 경일대학교 컴퓨터공학과 공학사 2010: 한양대학교

컴퓨터공학과 공학석사 현 재: 한양대학교

컴퓨터공학과 박사과정 관심분야: 센서 네트워크, 성능 분석,

그리드 컴퓨팅, 클라우드 컴퓨팅

이 원 주 1989: 한양대학교

전자계산학과 공학사 1991: 한양대학교

컴퓨터공학과 공학석사 2004: 한양대학교

컴퓨터공학과 공학박사 현 재: 인하공업전문대학

컴퓨터정보과 교수 관심분야: 병렬처리시스템, 성능분석,

모바일 컴퓨팅, 그리드 컴퓨팅, 클라우드 컴퓨팅

1977: 한양대학교 전자공학과 학사 1982: Cornell University

컴퓨터공학과 석사 1986: Cornell University

현 재: 한양대학교 컴퓨터공학과 교수 관심분야: 병렬처리시스템, 성능 분석,

그리드 컴퓨팅, 클라우드 컴퓨팅 Email : [email protected]

A Block Relocation Algorithm for Reducing Network Consumption in Hadoop Cluster

하둡 클러스터의 네트워크 사용량 감소를 위한 블록 재배치 알고리즘