• 검색 결과가 없습니다.

데이터 분석결과

문서에서 저작자표시 (페이지 64-72)

B. 제안 모델 개발

1. 데이터 분석결과

이 절에서는 실제 전력사용량 패턴 분석을 통해서 CNN-LSTM결합 딥러닝 모델 적용 시 성공 가능성을 확인하고자 한다. [그림 4-5]는 실험 대상 1000개 계량기의 시간별 구간 전력사용량을 산점도로 표시하였다. 대부분의 계량기 데이터가 1시간 동안 전력사용량이 4 kWh를 넘지 않는다는 것을 알 수 있고, 또한 최댓값도 10 kWh가 넘지 않았다. 이것으로 실험용 데이터의 특이 값이 없음을 알 수 있다.

[그림 4-5] 시간별 구간 전력사용량 데이터 산점도

데이터 분석은 실제 누적 전력사용량과 차분을 한 후 구간별 전력사용량 패턴을 분석하고 그 의미를 파악하고자 한다.

먼저 아래 [표 4-1], [표 4-2], [표 4-3]은 누적 전력사용량 패턴을 표현하였다.

[표 4-1]은 일반적인 누적 전력사용량 패턴을 보여주고 있다. 7월 1일 00:00분 데 이터부터 7월 25일 23:00까지의 시간별로 계속 증가하는 값을 가지고 있음을 알 수 있다. 특히 1000개의 계량기 중 976개가 [표 4-1]과 같은 패턴을 보였다.

[표 4-1] 일반적인 누적 전력사용량 패턴

50

-아래 [표 4-2]는 일반적인 누적 전력사용량 패턴과 다르게 사용량이 1개월 동안 전혀 변하지 않는 데이터들이 11개가 존재했다. 이 경우는 농촌에서 사용하는 전기 중에 논두렁 옆에 펌프를 설치하여 논에 물을 공급하기 위해 설치된 계량기의 경 우 전기를 실제로 사용하지 않았을 수도 있고, 또는 전자식 전력량계나 데이터집중 장치의 오류로 인해 데이터 오류가 발생했을 수도 있다. 하지만 이런 데이터의 경 우 예측이 실패하더라도 최종 가중치 보정을 적용하기 때문에 문제가 되지 않는다.

[표 4-2] 사용량 변경 없는 케이스의 누적 전력사용량 패턴

아래 [표 4-3]은 누적 전력사용량이 계속 변경되지 않고 1개월 중에 갑자기 특정 시간에만 급격하게 사용되고, 나머지 시간대에는 변경이 없는 특이사용 계량기가 2 3개 존재했다. 이 계량기들의 사용량을 분석해보니 평상시 전력사용량이 거의 없는 계량기들이며 그 사용량이 0.001 ~ 0.2 kWh 이내로 미미하여 그래프로 표현시 특 이 케이스로 분류되었다. 이런 분류의 데이터가 딥러닝 알고리즘으로 예측 시에 그 정확도가 떨어질 수 있다.

[표 4-3] 사용량이 특이한 케이스의 누적 전력사용량 패턴

52

-다음은 아래 [표 4-4], [표 4-5], [표 4-6]은 시간대별 구간 전력사용량 패턴을 표 현하였다.

아래 [표 4-4]는 일반적인 시간별 구간 전력사용량 패턴을 보여주고 있다. 아래 계량기들은 월요일부터 토요일까지 아침 9시부터 18시까지 전기를 사용하고 있다.

저녁 시간 때와 일요일에는 전력사용량이 적은 것으로 봐서 이 계량기들은 주택이 아니고 회사인 것으로 추측된다.

[표 4-4] 일반적인 시간별 구간 전력사용량 패턴

아래 [표 4-5]는 7월 중순경부터 갑자기 전력사용량이 늘어나는 패턴으로 보아 여름철에 에어컨 가동 등으로 갑자기 전력소비가 늘어났을 것으로 판단된다. 특정 일자에 갑자기 사용량이 크게 증가하였지만 연속성이 있으므로 일반적인 패턴으로 볼 수 있다.

[표 4-5] 여름철 특징인 시간별 구간 전력사용량 패턴

54

-아래 [표 4-6]은 시간별 구간 전력사용량이 불규칙적인 패턴을 보이는 계량기들 이다. 특별한 규칙이 없이 갑자기 전력사용량의 변화량이 크게 나타났다. 이런 데 이터들은 딥러닝으로 예측하더라도 그 정확도가 현저히 떨어질 것으로 예상된다.

[표 4-6] 불규칙 사용량인 시간별 구간 전력사용량 패턴

아래 [표 4-7]은 누적 전력사용량 분석에서도 이상 값을 보인 것처럼 중간에 사용 량 변화량이 없거나 1개월 동안 사용량이 전혀 없는 경우, 사용량이 미미하여 변하

지 않고 있다가 일시적으로 조금 증가한 경우, 또는 구간 전력사용량이 0.003, 0.004 로 그 값이 너무 적어서 그래프로 표현 시 아래처럼 촘촘한 화살촉 모양으로 표현 되었다.

[표 4-7] 특이한 케이스의 시간별 구간 전력사용량 패턴

이처럼 다양한 형태의 전력사용량 패턴들이 존재하는 것을 알 수 있었고, 이것들 이 전자식 전력량계나 데이터 집중장치의 오류로 인해서 발생할 수도 있다. 하지만 실제로 존재하는 데이터일 가능성이 더 크고 AMI시스템 또한 이러한 데이터 들이 수집되고 운영되고 있기 때문에 이렇게 비정상적인 데이터들도 고려해서 알고리즘 을 연구해야 한다. 그래서 총 1000개의 샘플 데이터들을 제거하지 않고 모두 테스 트하고 평가를 하려고 한다.

56

문서에서 저작자표시 (페이지 64-72)

관련 문서