A Hybrid Data Broadcast Scheduling Scheme Using Moving Average of Data Access Probability

*종신회원, 세명대학교 정보통신학부

접수일자 : 2018년 8월 15일, 수정완료 : 2018년 9월 15일 게재확정일자 : 2018년 10월 5일

Received: 15 August, 2018 / Revised: 15 September, 2018 / Accepted: 5 October, 2018

School of Information and Communication, Semyung University, Korea

https://doi.org/10.7236/JIIBC.2018.18.5.131

데이터 액세스 확률의 이동 평균을 이용한 하이브리드 데이터 방송 스케줄링 기법

A Hybrid Data Broadcast Scheduling Scheme Using Moving Average of Data Access Probability

Abstract

Key Words :

^{ ×  }



d₁d₂d₃d₄… d_sd_s+1….…... …... d_x…... d_N-1d_N

ccut₁ ccut₂ ccut_NoOfPushCh

G₁ G₂ ….…....……..G_NoOfPushCh G_PullData

dNoOfPushData

dNoOfPushData+1

NoOfpushCh

NoOfPushCh+1

NoOfPushCh

NoOfPushCh 개의 그룹으로 분할되어 각 푸쉬채

_ for each data according to Eq. (1) SumSrMAForAllData = ∑_{  }^

_ //determine ccut0 ～ ccutNoOfPushCh

AvgSrMAPerCh = SumSrMAForAllData / K ccut0 = 0

①for each cut point i from 1 to NoOfPushCh ChSumSrMA = 0

for each data index j from ccuti-1+1 to N ChSumSrMA = ChSumSrMA +

_ if (ChSumSrMA >= AvgSrMAPerCh) ccuti = j

end if end for end for

for each cut point index i from 1 to NoOfPushCh allocate _{ }

 ∼_{ }

 into CHi

The remaining data items(_{ }

 ∼_) will be broadcast on demand

_{  }

NoOfPushCH

dNoOfPushData+1

R과 W에 서로 다른 가중치를 주는 RxW^α

K 개의 방송채널중 PullPct 만큼의 채널은 풀채널이

0 100 200 300 400 500

1 3 5 7 10 15 20 25 30 40 50 60 70 80 평균

질의 요청률(Query Requests per Tick: QRT) HDAMA DAMA DP FLAT RxW K = 10

입력변수 의미 기본값 설정

N 데이터 항목의 수 5000 5000

K 방송 채널의 수 10 1 ∼ 20

PullPct K 대비 풀채널의 퍼센트 50% 20 ∼ 80

θ 데이터 액세스 zipf 분포의 θ 값 0.95 0.0 ∼ 1.0

QRT tick 구간당 질의 요청횟수 50 1 ∼ 80

Q 질의에 포함된 데이터 수 10 1 ∼ 15

α RxW^α에서 W의 가중치 2 1 ∼ 5

R Q가 방송빈도에 미치는 영향력 100 100

0 100 200 300 400 500 600

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 평균

질의 크기(Q: 질의에 포함된 데이타의 수) HDAMA DAMA DP FLAT RxW K = 10

QRT = 50 θ = 0.95

0 500 1000 1500 2000 2500 3000 3500 4000 4500

1 2 4 6 8 10 12 14 16 18 20

방송 채널의 수(K)

HDAMA DAMA DP FLAT RxW Q = 10

QRT = 50 θ = 0.95

0 500 1000 1500 2000 2500 3000 3500 4000 4500

1 2 4 6 8 10 12 14 16 18 20

방송 채널의 수(K)

HDAMA DAMA DP FLAT RxW Q = 10

QRT = 10 θ = 0.95

※ 이 논문은 2017학년도 세명대학교 연구년 지원에 의한 연구임.

A Hybrid Data Broadcast Scheduling Scheme Using Moving Average of Data Access Probability

JIIBC 2018-5-17

데이터 액세스 확률의 이동 평균을 이용한 하이브리드 데이터 방송 스케줄링 기법

A Hybrid Data Broadcast Scheduling Scheme Using Moving Average of Data Access Probability

권혁민

Hyeokmin Kwon

broadcast schedule, hybrid broadcast, mobile computing, simulation

Ⅰ. 서 론

인터넷의 폭발적인 인기 및 무선 네트워크의 활성화 로 인하여 전 세계는 온라인 데이터 서비스에 대한 요구 가 크게 증가하고 있고, 이에 따라 시스템의 확장성 (scalability)이 어느 때보다 중요해 지고 있다. 특히, 뉴스

정보, 주식 정보, 일기 정보 및 교통 정보 서비스 시스템

과 같은 정보 소비(information consumption) 모델의 형

태를 띠고 있는 정보 시스템에서는 응답시간의 성능 저

하 없이 어떻게 방대한 클라이언트들을 지원할 것이가가

주된 관심사였다

. 이와 같이 수많은 클라이언트들을

지원해야 하는 시스템에서는 전통적인 유니캐스트

. 방송 스케줄링 기법은 방송 데 이터의 선정 방법에 따라 푸쉬(Push) 기반과 풀(Pull) 기 반 기법으로 구분할 수 있는데

풀기반 시스템은 질의 요청률이 낮은 환경에서 매우 바람직한 성능 특성을 보인다

.

단일 데이터 질의 환경에서는 각 데이터의 액세스 확

률에 기초하여 푸쉬 데이터와 풀 데이터를 결정하면 되

는데, 다중 데이터 질의 환경에서는 액세스 확률이 방송

빈도에 미치는 영향력을 적절하게 제어해서 푸쉬 데이터

와 풀 데이터를 결정해야 바람직한 성능 특성을 보일 수

있다. 본 논문은 다중 데이터 질의 환경에 한하여 연구를

수행하는데, 각 데이터의 방송 빈도를 그들의 액세스 확

률의 이동 평균(Moving Average) 값의 제곱근에 비례하

게 설정할 때 최적이라는 휴리스틱을 적용하여 푸쉬 데

이터와 풀 데이터를 결정하여, 질의 응답시간의 성능을

개선할 수 있는 새로운 하이브리드 방송 스케줄링 기법

을 제안한다. 본 논문의 구성은 다음과 같다. 2 장에서 기

존에 개발된 기법에 대하여 기술하고, 3 장에서는 본 논

문이 제안하는 새로운 방송 스케줄링 기법에 대하여 기

술한다. 4장에서는 제안된 기법의 성능을 평가, 분석하고,

마지막으로 5 장에서 결론을 맺는다.

Ⅱ. 관련 연구

이 장에서는 다중 방송채널 환경을 위해 제안된 방송 스케줄링 기법들에 대하여 기술한다. 데이터 방송 스케 줄링 기법은 푸쉬기반과 풀기반 기법으로 구분되는데, 푸쉬기반 기법에는 단일 데이터 질의 환경을 위해 FLAT

, DP(Dynamic Programming)

, NODA(Near Optimal Data Allocation)

기법이 제안되었고, 다중 데이 터 질의 환경을 위하여 PBA(Placement-Based Allocation)

와 DAMA(Data Allocation using Moving Average)

터의 액세스 확률의 이동 평균(Moving Average) 값을 식 (1)과 같이 계산한 후 이를 이용하여 각 방송채널에 데이터를 할당했다. DAMA 기법은 각 데이터의 방송 빈 도를 

값에 비례하게 설정하는 정책을 사용하 여 응답시간의 성능을 개선했다. 식 (1)에서 Q는 한 질의 에 포함되는 평균 데이터 항목의 수를 의미하며, R은 Q 가 방송빈도에 미치는 영향력을 의미한다.

 

  





  ×   (1)

, 이들 중에서 RxW 기법은 적절한 실행부담을 보이면서 도 매우 바람직한 성능 특성을 보인다

PBSA(Profit-Based Scheduling Algorithm)은

다중

데이터 질의 환경을 위해 개발된 풀기반 방송 스케줄링

기법이다. PBSA는 요청된 질의에 포함된 데이터들을 방

송함으로써 얻는 이익(Profit)과 각 질의의 기회 비용

(Opportunity Cost)를 계산하여 다음에 방송할 데이터를

결정한다. 비록 이 기법이 매우 바람직한 성능 특성을 보

이기는 하지만 스케줄링을 위한 실행 부담이 매우 크다

그림 1. 푸쉬 데이터를 NoOfPushCh 그룹으로 분할하는 문제

Fig. 1. Problem for partitioning push data in NoOfPushCh groups

는 단점이 있다. 따라서 클라이언트들의 데이터 요청이 급격하게 증가하게 되면 적시에 방송 데이터를 선정하는 불가능해 질 수도 있다는 단점이 있다.

Ⅲ. 새로운 방송 스케줄링 기법

이 단점은 극복하기 위하여 본 논문은 DAMA에서

1. 기본 시스템 모델 및 용어

본 논문은 다음과 같은 시스템 모델과 용어를 사용 한다.

1) 방송 데이터들은 d

(1≤k≤N)로 표현되는 동일 크 기의 N 개의 데이터로 구성되며, d

의 액세스 확률 을 p

로 표현한다. 그리고 데이터는 액세스 확률의 내림차순으로 정렬되어 있다고 가정한다. d

～

는 푸쉬 방식으로 방송되며

～d

은 풀 방식으로 방송된다.

2) 방송 서버에는 동일 대역폭을 갖는 K 개의 방송채 널이 있는데, 이를 CH

(1≤i≤K)로 표현한다. CH

～CH

는 푸쉬 방식으로, CH

～

는 풀 방식으로 데이터들을 방송하는데, 이들 을 각각 푸쉬채널, 풀채널이라 명명한다.

3) 푸쉬 데이터들은 그림 1과 같이 G

～G

^

^ ^ ^× ^ ^ ⁽¹⁾

= R (Q* – first_arrival_time)