• 검색 결과가 없습니다.

Construction and Application of Network Design System for Optimal Water Quality Monitoring in Reservoir

N/A
N/A
Protected

Academic year: 2021

Share "Construction and Application of Network Design System for Optimal Water Quality Monitoring in Reservoir"

Copied!
10
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

第44卷 第4號 2011年 4月 295 韓 國 水 資 源 學 會 論 文 集

第44卷 第4號 2011年 4月 pp. 295 ~304

저수지 최적수질측정망 구축시스템 개발 및 적용

Construction and Application of Network Design System for Optimal Water Quality Monitoring in Reservoir

이 요 상

*

/ 권 세 혁

**

/ 이 상 욱

***

/ 반 양 진

****

Lee, Yosang / Kwon, Sehyug / Lee, Sanguk / Ban, Yangjin

...

Abstract

For effective water quality management, it is necessary to secure reliable water quality information.

There are many variables that need to be included in a comprehensive practical monitoring network : representative sampling locations, suitable sampling frequencies, water quality variable selection, and budgetary and logistical constraints are examples, especially sampling location is considered to be the most important issues. Until now, monitoring network design for water quality management was set according to the qualitative judgments, which is a problem of representativeness. In this paper, we propose network design system for optimal water quality monitoring using the scientific statistical techniques. Network design system is made based on the SAS program of version 9.2 and configured with simple input system and user friendly outputs considering the convenience of users. It applies to Excel data format for ease to use and all data of sampling location is distinguished to sheet base. In this system, time plots, dendrogram, and scatter plots are shown as follows: Time plots of water quality variables are graphed for identifying variables to classify sampling locations significantly. Similarities of sampling locations are calculated using euclidean distances of principal component variables and dimension coordinate of multidimensional scaling method are calculated and dendrogram by clustering analysis is represented and used for users to choose an appropriate number of clusters. Scatter plots of principle component variables are shown for clustering information with sampling locations and representative location.

Keywords : water quality monitoring, statistical technique, network design system, reservoir ...

요 지

효과적인 수질관리를 위해서는 수질정보의 기대수준에 맞는 신뢰성 있는 수질자료가 확보되어야 한다. 이런 점에서 볼 때 수질모니터링은 조사지점, 수질항목, 측정주기 등이 성패의 중요한 요인이 되며, 이중에서 특히 조사지점은 가장 중요한 사항으로 판단된다. 그러나 지금까지 수질조사를 위한 관측지점은 대부분 정성적 판단에 따라 정해지고 있었기 때문에 수질대표성이 문제가 되기도 하였다. 본 논문에서는 이와같은 수질측정망 구축 시 문제점을 과학적인 통계기법을 적용하여 개선한 최적수질측정망 구축시스템으로 제시하였다. 구축된 최적수질측정망 구축시스템은 SAS 프로그램 버전

* 교신저자, K-water연구원 수자원연구소 책임연구원 (e-mail: [email protected]) Corresponding Author, Principal Researcher, K-water Institute, Daejeon 305-730, Korea

** 한남대학교 비즈니스 통계학과 교수

Professor, Department of Statistics, Hannam University, Daejeon 306-791, Korea

*** K-water연구원 수자원연구소 선임연구원 (e-mail: [email protected]) Senior Researcher, K-water Institute, Daejeon 305-730, Korea

**** K-water댐 유역관리처 수질환경팀장 (e-mail: [email protected])

Team leader, K-water Department of dam and watershed management, Daejeon 306-711, Korea

DOI: 10.3741/JKWRA.2011.44.4.295

296

9.2를 기반으로 만들었으며, 이용자의 사용편의성을 고려하여 간단한 입력으로 측정망을 구축할 수 있는 체계로 구성하 였다. 분석 데이터 형식은 자료 입출력 및 관리가 용이한 엑셀 데이터를 사용하도록 하였으며, 관측지점별 데이터는 시트 로만 구별하게 하였다. 시스템에서는 시계열분석과 유사성계산을 하여, 각 수질의 변화패턴을 고려할 수 있는 상관계수 를 활용한 다차원척도법을 적용하여 그 결과를 덴드로그램으로 제시하며, 그 결과를 활용하여 군집 개수를 결정한다.

이용자가 최종 산점도 출력시스템에 원하는 군집의 개수를 입력하면 수질 특성 파악이 가능한 주성분 산점도가 출력되 며, 군집 내 관측지점의 중심점을 대표지점으로 선정하면 된다.

핵심용어 : 수질측정, 통계기법, 측정망 구축시스템, 저수지

...

1. 서 론

수질관리에 있어서 무엇보다도 중요한 것이 신뢰성 있 는 수질자료를 확보하는 것이다. 따라서 수질측정망 설계 는 명확하게 심사숙고된 목적에 따라 합리적으로 이루어 져야 하며, 계획된 모니터링 활동은 실용적이고 수질관리 목적에 합치되도록 하여야 한다. 일반적으로 수질측정망 설계에서 고려해야 할 중요사항은 시행의 분명한 목표와 목적, 수질정보의 기대수준과 사용의도, 그리고 대표지점 선택여부 등이다. 이를 위해 조사대상지역에 대한 지형, 지질, 저수지 형상, 저류지역 종 횡단, 수질측정 대상 항 목, 수질측정 주기 및 시기 등을 고려하여 모니터링 지점 을 선정하게 된다. 보통 수질 모니터링에서 위치선정이 가장 중요한 이유는 수질 유사 지역을 중복 측정하거나 수질 특성이 상이한 지역을 누락하여 저수지 수질을 특성 을 적절하게 측정해야 하나, 많은 수질관측시설 설치나 수질분석을 위한 관측지점은 대부분 정성적 판단에 따라 정해지고 있기 때문에 수질대표성이 문제가 되기도 한다 (Jamie and Richard, 2007).

수질모니터링 체계 구축과 평가 프로그램은 수질의 공 간적 분포와 추이, 수생태 생물 등에 초점이 맞추어져야 한다. 이와 같은 개념은 논리적으로 가능하나 실현되기 위해서는 많은 비용이 요구된다. 결과적으로 기존 수질조 사체계의 타당성과 유용성을 평가하고 보다 개선된 대안 을 도출함으로서, 한정된 수질조사 체계의 효과를 극대화 할 수 있다. 즉 넓은 공간에서 대표지점에 의존한 수질조 사는 위치 선정에 따라 큰 차이를 보일 수 있으므로 조사 대상지역의 수질상태를 가장 잘 나타낼 수 있는 조사지점 의 배치에 대한 평가는 매우 중요하다(Robert and Paul, 2008).

수질모니터링 체계가 구축되면, 물이용 관리자나 관련 분야의 전문가는 의사결정에 필요한 가치있는 자료나 정 보를 취득하여 제공할 수 있어야 하며, 모니터링 체계로 부터 생산된 자료를 바탕으로 물과 관련된 다양한 의문에 대하여 답을 줄 수 있어야 한다. 평가프로그램을 통하여

댐이나 하천시설물 관리자 등 물이용이나 공급기관, 혹은 이와 유사한 기관은 수질관리에 필요한 의사결정 정보를 기대할 수 있게 된다. 이와 같이 다양한 사항들을 고려하 여 수질모니터링에 대한 설계가 이루어져야 하며 한번 설 정된 수질측정망은 장기적 관점에서 자료의 일관성을 확 보할 수 있도록 신뢰성을 높이는 전략이 필요하다. 본 연 구에서는 다목적댐 저수지에서 측정된 실측자료를 과학 적기법을 적용하여 평가하고 이를 바탕으로 평균적인 대 표수질을 평가할 수 있는 효율적인 수질측정망 구축방법 을 제시하려 하며 사용자가 적용하기 편리한 저수지 수질 측정망 구성시스템을 구축하여 제공하고자 한다.

2. 기본이론

저수지는 수체가 크고 계절변화에 따라 수질이 지속적 으로 변하는 특징이 있으며, 그 변화도 매년 상이한 경향 을 나타낸다. 따라서 저수지 수질을 대표하는 지점의 선 정은 쉽지 않다. 이런 문제를 극복하기 위해서는 많은 지 점에서 수질을 빈번히 조사하는 방법이 있으나 이는 비경 제적일 뿐만 아니라 경우에 따라서는 오히려 부정확한 결 과를 초래할 수도 있다. 따라서 본 연구에서는 수질 측정 대상이 되는 저수지나 하천에서 수질 유사 지점과 상이한 지점을 판단하여 적절한 수질 네트워크 구축에 대한 과학 적인 통계기법을 적용하여 이러한 문제를 해결해 보고자 한다.

앞에서도 언급했지만 저수지는 수체가 크기 때문에 조

사지점이 많을 수밖에 없으며, 수질 항목이 많고 년 중 조

사 빈도가 높기 때문에 자료의 개수가 대단위인 특성이

있다. 따라서 이렇게 많은 자료를 분석하여 수질 측정망

네트워크를 효율적으로 구성하려면 적절한 분석 시스템

이 필요하다. 수질 측정망 구성을 위한 분석 시스템은 다

양한 다변량통계 분석기법이 활용되는데, 필요에 따라 일

차 분석 결과를 이해·활용하여 향후 분석을 실시하여야

하므로 통계 전문가적 지식이 필요하게 된다. 그러므로

수질 전문가들이 용이하게 최적 수질 측정망을 구성할 수

(2)

第44卷 第4號 2011年 4月 295 韓 國 水 資 源 學 會 論 文 集

第44卷 第4號 2011年 4月 pp. 295 ~304

저수지 최적수질측정망 구축시스템 개발 및 적용

Construction and Application of Network Design System for Optimal Water Quality Monitoring in Reservoir

이 요 상

*

/ 권 세 혁

**

/ 이 상 욱

***

/ 반 양 진

****

Lee, Yosang / Kwon, Sehyug / Lee, Sanguk / Ban, Yangjin

...

Abstract

For effective water quality management, it is necessary to secure reliable water quality information.

There are many variables that need to be included in a comprehensive practical monitoring network : representative sampling locations, suitable sampling frequencies, water quality variable selection, and budgetary and logistical constraints are examples, especially sampling location is considered to be the most important issues. Until now, monitoring network design for water quality management was set according to the qualitative judgments, which is a problem of representativeness. In this paper, we propose network design system for optimal water quality monitoring using the scientific statistical techniques. Network design system is made based on the SAS program of version 9.2 and configured with simple input system and user friendly outputs considering the convenience of users. It applies to Excel data format for ease to use and all data of sampling location is distinguished to sheet base. In this system, time plots, dendrogram, and scatter plots are shown as follows: Time plots of water quality variables are graphed for identifying variables to classify sampling locations significantly. Similarities of sampling locations are calculated using euclidean distances of principal component variables and dimension coordinate of multidimensional scaling method are calculated and dendrogram by clustering analysis is represented and used for users to choose an appropriate number of clusters. Scatter plots of principle component variables are shown for clustering information with sampling locations and representative location.

Keywords : water quality monitoring, statistical technique, network design system, reservoir ...

요 지

효과적인 수질관리를 위해서는 수질정보의 기대수준에 맞는 신뢰성 있는 수질자료가 확보되어야 한다. 이런 점에서 볼 때 수질모니터링은 조사지점, 수질항목, 측정주기 등이 성패의 중요한 요인이 되며, 이중에서 특히 조사지점은 가장 중요한 사항으로 판단된다. 그러나 지금까지 수질조사를 위한 관측지점은 대부분 정성적 판단에 따라 정해지고 있었기 때문에 수질대표성이 문제가 되기도 하였다. 본 논문에서는 이와같은 수질측정망 구축 시 문제점을 과학적인 통계기법을 적용하여 개선한 최적수질측정망 구축시스템으로 제시하였다. 구축된 최적수질측정망 구축시스템은 SAS 프로그램 버전

* 교신저자, K-water연구원 수자원연구소 책임연구원 (e-mail: [email protected]) Corresponding Author, Principal Researcher, K-water Institute, Daejeon 305-730, Korea

** 한남대학교 비즈니스 통계학과 교수

Professor, Department of Statistics, Hannam University, Daejeon 306-791, Korea

*** K-water연구원 수자원연구소 선임연구원 (e-mail: [email protected]) Senior Researcher, K-water Institute, Daejeon 305-730, Korea

**** K-water댐 유역관리처 수질환경팀장 (e-mail: [email protected])

Team leader, K-water Department of dam and watershed management, Daejeon 306-711, Korea

DOI: 10.3741/JKWRA.2011.44.4.295

韓國水資源學會論文集 296

9.2를 기반으로 만들었으며, 이용자의 사용편의성을 고려하여 간단한 입력으로 측정망을 구축할 수 있는 체계로 구성하 였다. 분석 데이터 형식은 자료 입출력 및 관리가 용이한 엑셀 데이터를 사용하도록 하였으며, 관측지점별 데이터는 시트 로만 구별하게 하였다. 시스템에서는 시계열분석과 유사성계산을 하여, 각 수질의 변화패턴을 고려할 수 있는 상관계수 를 활용한 다차원척도법을 적용하여 그 결과를 덴드로그램으로 제시하며, 그 결과를 활용하여 군집 개수를 결정한다.

이용자가 최종 산점도 출력시스템에 원하는 군집의 개수를 입력하면 수질 특성 파악이 가능한 주성분 산점도가 출력되 며, 군집 내 관측지점의 중심점을 대표지점으로 선정하면 된다.

핵심용어 : 수질측정, 통계기법, 측정망 구축시스템, 저수지

...

1. 서 론

수질관리에 있어서 무엇보다도 중요한 것이 신뢰성 있 는 수질자료를 확보하는 것이다. 따라서 수질측정망 설계 는 명확하게 심사숙고된 목적에 따라 합리적으로 이루어 져야 하며, 계획된 모니터링 활동은 실용적이고 수질관리 목적에 합치되도록 하여야 한다. 일반적으로 수질측정망 설계에서 고려해야 할 중요사항은 시행의 분명한 목표와 목적, 수질정보의 기대수준과 사용의도, 그리고 대표지점 선택여부 등이다. 이를 위해 조사대상지역에 대한 지형, 지질, 저수지 형상, 저류지역 종 횡단, 수질측정 대상 항 목, 수질측정 주기 및 시기 등을 고려하여 모니터링 지점 을 선정하게 된다. 보통 수질 모니터링에서 위치선정이 가장 중요한 이유는 수질 유사 지역을 중복 측정하거나 수질 특성이 상이한 지역을 누락하여 저수지 수질을 특성 을 적절하게 측정해야 하나, 많은 수질관측시설 설치나 수질분석을 위한 관측지점은 대부분 정성적 판단에 따라 정해지고 있기 때문에 수질대표성이 문제가 되기도 한다 (Jamie and Richard, 2007).

수질모니터링 체계 구축과 평가 프로그램은 수질의 공 간적 분포와 추이, 수생태 생물 등에 초점이 맞추어져야 한다. 이와 같은 개념은 논리적으로 가능하나 실현되기 위해서는 많은 비용이 요구된다. 결과적으로 기존 수질조 사체계의 타당성과 유용성을 평가하고 보다 개선된 대안 을 도출함으로서, 한정된 수질조사 체계의 효과를 극대화 할 수 있다. 즉 넓은 공간에서 대표지점에 의존한 수질조 사는 위치 선정에 따라 큰 차이를 보일 수 있으므로 조사 대상지역의 수질상태를 가장 잘 나타낼 수 있는 조사지점 의 배치에 대한 평가는 매우 중요하다(Robert and Paul, 2008).

수질모니터링 체계가 구축되면, 물이용 관리자나 관련 분야의 전문가는 의사결정에 필요한 가치있는 자료나 정 보를 취득하여 제공할 수 있어야 하며, 모니터링 체계로 부터 생산된 자료를 바탕으로 물과 관련된 다양한 의문에 대하여 답을 줄 수 있어야 한다. 평가프로그램을 통하여

댐이나 하천시설물 관리자 등 물이용이나 공급기관, 혹은 이와 유사한 기관은 수질관리에 필요한 의사결정 정보를 기대할 수 있게 된다. 이와 같이 다양한 사항들을 고려하 여 수질모니터링에 대한 설계가 이루어져야 하며 한번 설 정된 수질측정망은 장기적 관점에서 자료의 일관성을 확 보할 수 있도록 신뢰성을 높이는 전략이 필요하다. 본 연 구에서는 다목적댐 저수지에서 측정된 실측자료를 과학 적기법을 적용하여 평가하고 이를 바탕으로 평균적인 대 표수질을 평가할 수 있는 효율적인 수질측정망 구축방법 을 제시하려 하며 사용자가 적용하기 편리한 저수지 수질 측정망 구성시스템을 구축하여 제공하고자 한다.

2. 기본이론

저수지는 수체가 크고 계절변화에 따라 수질이 지속적 으로 변하는 특징이 있으며, 그 변화도 매년 상이한 경향 을 나타낸다. 따라서 저수지 수질을 대표하는 지점의 선 정은 쉽지 않다. 이런 문제를 극복하기 위해서는 많은 지 점에서 수질을 빈번히 조사하는 방법이 있으나 이는 비경 제적일 뿐만 아니라 경우에 따라서는 오히려 부정확한 결 과를 초래할 수도 있다. 따라서 본 연구에서는 수질 측정 대상이 되는 저수지나 하천에서 수질 유사 지점과 상이한 지점을 판단하여 적절한 수질 네트워크 구축에 대한 과학 적인 통계기법을 적용하여 이러한 문제를 해결해 보고자 한다.

앞에서도 언급했지만 저수지는 수체가 크기 때문에 조

사지점이 많을 수밖에 없으며, 수질 항목이 많고 년 중 조

사 빈도가 높기 때문에 자료의 개수가 대단위인 특성이

있다. 따라서 이렇게 많은 자료를 분석하여 수질 측정망

네트워크를 효율적으로 구성하려면 적절한 분석 시스템

이 필요하다. 수질 측정망 구성을 위한 분석 시스템은 다

양한 다변량통계 분석기법이 활용되는데, 필요에 따라 일

차 분석 결과를 이해·활용하여 향후 분석을 실시하여야

하므로 통계 전문가적 지식이 필요하게 된다. 그러므로

수질 전문가들이 용이하게 최적 수질 측정망을 구성할 수

(3)

第44卷 第4號 2011年 4月 297

있도록 본 연구에서는 이를 시스템화 하는데 있다. 본 시

스템은 수질 관련 데이터 입력 장치, 시계열 도표 출력, 수 질 유사 지점 및 대표 지점 표현으로 구성되어 통계분석 을 통해 각 지점 간 수질변화 패턴이 유사한 지점을 묶는 방법으로 최적의 수질측정지점을 선정하게 된다.

본 시스템에 사용된 통계분석기법은 다음과 같다. 시간 을 수평 축으로, 관측치 값을 수직 축으로 하여 그린 시계 열 도표는 관측지점의 수질 변화 패턴을 보여주므로 관측 지점을 군집화를 위하여 선택한 수질 변수들이 군집화에 유의한 변수인지 판별할 수 있는 시각적 도움을 준다. 관 측지점 간 시계열 변화 패턴 차이가 많은 수질이 관측지 점 군집에 더 적합한 변수이다. 주성분분석은 원변수의 공분산행렬(혹은 상관계수행렬)로부터 고유치와 이에 대 응하는 고유벡터를 구하고, 고유벡터를 선형계수로 하여 원변수의 선형결합으로 주성분변수를 구하게 된다. 이렇 게 구한 주성분변수는 원변수의 개수만큼 존재하며 서로 독립이이므로 원변수의 변동을 독립적으로 설명한다. 주 성분변수들 중 고유치가 1 이상이거나 누적 변동설명기여 율이 80% 이상인 일부를 선택하여 데이터의 차원을 축소 하게 된다. 저수지의 특성을 나타내는 수질과 같이 측정 형 변수이고 상관관계가 높은 경우 원변수의 개수가 많더 라도 2~3개의 주성분만으로 원변수의 변동을 대부분 설 명하게 된다. 데이터의 차원을 축소하게 되면 산점도를 이용하여 개체에 대한 정보를 쉽게 파악할 수 있으며, 원 변수의 구조적 패턴을 대부분 설명하는 주요 변수를 얻게 된다(이요상과 권세혁, 2009).

계층적 군집분석은 개체의 유사성을 이용하여 유사성 이 높은 순으로 개체를 묶어가는 다변량기법으로 개체의 유사성은 일반적으로 유클리디안 거리에 의해 측정된다.

원변수들의 단위가 다른 경우 변수를 각각 표준화 한 후 개체 간 유클리디안 거리를 계산하는데, 이렇게 되면 변 수들의 분산까지 표준화되어 개체 간 유사성을 거리에 의 해 측정하는데 한계를 지니게 된다. 또한 상관관계가 높 은 변수들이 다수 포함되어 있으면 이들로 인하여 개체의 유사성이 중복 측정되므로 이를 고려하는 것이 적절하다.

그러므로 수질관련 측정 항목처럼 변수 간의 상관관계가 높고 측정 단위가 다른 경우 원변수의 주요 패턴을 반영 한 주성분변수는 평균은 0이나 분산은 상이하고, 서로 독 립이므로 이를 이용하여 유클리디안 거리를 계산하는 것 이 적절하다. 개체의 유사성 크기순으로 군집화 하는 과 정을 도식화 한 그림인 덴드로그램은 통계 비전문가라도 군집의 개수 결정이 용이하도록 시각적 도움을 준다. 유 사성 크기에 의해 개체나 군집을 결합하는 연결(linkage) 방법에는 단일연결, 원전연결, 중심연결, 평균연결, 중위 수 연결, Ward 최소분산 방법 등이 제안 사용되고 있으

며, 적용되는 연결방법에 따라 상이한 덴드로그램을 얻게 되며 개체 군집도 상이하게 된다(Johnson, 1998).

다차원척도법은 개체 간 유사성 행렬을 활용하여 개체 를 저차원 공간에 표현하는 기법이다. 개체의 특성을 측 정형 변수로 측정한 경우 유클리디안 거리 혹은 상관계수 행렬을 이용하여 개체 간 유사성 행렬을 구한다. 측정 단 위가 다르거나 각 관측치를 시간 평균으로 사용하게 되는 시계열 데이터의 경우에는 유클리디안 거리는 적절한 유 사성 측정 개념이 아니다. 이런 한계를 극복하기 위하여 개체 간 유사성을 우선순위나 리커트척도에 의한 응답 결 과를 활용하여 유사성 행렬을 계산한다. 권세혁과 이요상 (2010)은 변수들 간 상관관계를 활용하여 수질의 시계열 변화를 고려할 수 있는 유사성 행렬을 계산하는 방법을 제안하였다. 각 수질변수의 개체 간 피어슨 상관계수를 계산하고, 대응하는 행렬 원소의 가중평균으로 단일 상관 계수 행렬을 얻어 이를 유사성 행렬로 활용하는 방법을 제안하였다. 유사성 행렬의 값을 크기순으로 정렬한 후 개체 간 거리의 상대적 위치를 저차원, 일반적으로 2차원 공간에 표현한다. 2차원 공간좌표를 이용하여 유클리디안 거리를 계산하고, 이에 계층적 군집분석을 적용하여 개체 를 군집화 한다.

3. 시스템 구축

본 시스템은 최적 수질관측망 구성에 필요한 수질 시계 열 도표, 유사 관측지점 군집 결과와 군집 개수를 결정에 도움을 주는 덴드로그램, 그리고 군집 내 대표 관측지점 에 대한 정보를 제공한다. 본 시스템은 시계열 도표 출력 시스템(Fig. 1의 ①), 관측지점 간 수질 유사성을 계산하 여 유사한 순서대로 관측지점을 군집화 하는 과정을 보여 주는 덴드로그램 출력 시스템(Fig. 1의 ②와 ③), 그리고 시스템 사용자가 덴드로그램을 활용하여 설정한 군집의 개수에 따라 관측지점 위치와 대표 관측지점을 보여주는 주성분 변수 산점도 출력 시스템(Fig. 1의 ④)으로 구성 되어 있다. 각 수질에 대하여 관측지점별 시계열 도표를 한 그래프에 표현하여 어느 수질이 관측지점 간 차이를 많이 보이는지 판단할 수 있도록 하였다. 관측지점 간 차 이를 많이 보이는 수질이 관측지점의 군집화에 더 적절한 측정 항목이다.

관측지점 간 유사성은 수질 특성변수들로부터 얻은 주 성분변수(고유치 1이상인 주성분변수 사용)의 유클리디 안 거리, 혹은 수질의 상관계수행렬에 다차원척도법을 적 용하여 얻은 2차원 성분좌표의 유클리디안 거리로 측정하 였다. 계산된 유사성 크기순으로 관측지점을 계층적으로 군집화 하는 과정에서 개체와 군집, 군집 간 거리는 평균

298

Fig. 1. Flow Chart of Network Design System

시간도표 < Time_Plot.SAS [입력]

(1) 관측지점 개수

[결과]

(1) 군집분석 결과, 군집 이름 및 군집 내 관측지점 (텍스트 모드) (2) 수질별 관측지점 겹친 시간도표 (그래프)

(3) 수질별 변동계수 값 (텍스트 모드)

Fig. 2. Input Window of Time Serise Analysis 연결법에 의해 유사성을 계산하였고, 군집화 한 결과를

덴드로그램으로 화면 출력한다. 덴드로그램은 통계 비전문 가도 용이하게 군집의 개수를 결정할 수 있는 도구이므로, 이를 이용하여 군집의 개수를 결정하여 최종 산점도 출력 시스템에 입력하면 관측지점과 군집 결과, 그리고 대표 관 측지점이 주성분 변수 산점도가 출력된다. 주성분 산점도 는 관측지점의 군집 결과, 각 군집의 수질 특성 파악, 그리 고 군집을 대표하는 관측지점에 대한 정보를 제공한다.

4개의 세부 시스템으로 구성된 본 시스템은 각각 SAS 프로그램 버전 9.2를 기반으로 구축하였으므로 SAS 프로 그램 버전 9.2 이상이 설치된 컴퓨터에서 실행 가능하다.

본 시스템은 이용자들의 사용편의성을 고려해 간단한 입 력으로 결과를 얻을 수 있는 체계로 구성하였다. 분석 데 이터 형식은 자료 입출력 및 관리가 용이한 엑셀 데이터

를 사용하였으며, 관측지점별 데이터는 시트로만 구별하 면 된다. 관측지점별 시트 이름은 1, 2, 3 식으로 주어지면 된다. 즉, 대상지의 수질자료를 지점별로 생산순서에 따라 정리하여 분석 대상 관측지점 개수만큼 입력 시트를 구성 하면 된다. 시스템 상에서 관측지점 개수와 자료파일명을 입력하면 수질별 시계열 도표가 화면 출력된다(Fig. 2).

시계열 도표 출력 시스템에는 엑셀 데이터를 읽어 들이는 import 프로시져, 입력 데이터를 분석에 적합하도록 변형 하는 프로시져들, 그리고 산점도를 그리는 sgplot 프로시 져로 구성되어 있다.

시계열분석이 완료되면 각 관측지점 간 유사성을 계산 해야 하는데, 첫 번째 방법으로는 원변수들의 변동을 축 약한 주성분변수들의 유클리디안 거리를 계산하여 계층 적 군집분석을 적용하여 덴드로그램을 얻었다(Fig. 3).

Fig. 3의 시스템은 주성분 분석 프로시져 princomp와 계 층적 군집분석 프로시져 cluster, 그리고 덴드로그램을 그 리는 tree 프로시져로 구성되어 있다. 유사성을 계산한 다 른 방법은 각 수질의 변화패턴을 고려할 수 있는 상관계 수를 활용한 다차원척도법을 적용하여 얻은 성분 좌표에 의해 덴드로그램을 얻었다. Fig. 4는 상관분석 프로시져 corr, 다차원척도법을 위한 mds 프로시져, 그리고 tree 프 로시져로 구성되어 있다.

덴드로그램을 활용하여 군집 개수를 결정하여 최종 산

점도 출력 시스템에 이용자가 원하는 군집의 개수를 입력

하면 관측지점의 군집결과, 군집의 수질 특성 파악이 가

능한 주성분 산점도가 출력된다. 군집 내 관측지점의 개

수가 많을 경우에 대표지점의 선정에 혼란이 올수 있어

군집 내 관측지점의 중심점을 군집 대표 관측지점으로 제

시하여 대표지점 선정 시 활용될 수 있도록 하였다. 이 시

스템은 주성분 점수를 얻는 princomp 프로시져와 산점도

를 그리는 sgsctter 프로시저로 구성되어 있다.

(4)

第44卷 第4號 2011年 4月 297

있도록 본 연구에서는 이를 시스템화 하는데 있다. 본 시

스템은 수질 관련 데이터 입력 장치, 시계열 도표 출력, 수 질 유사 지점 및 대표 지점 표현으로 구성되어 통계분석 을 통해 각 지점 간 수질변화 패턴이 유사한 지점을 묶는 방법으로 최적의 수질측정지점을 선정하게 된다.

본 시스템에 사용된 통계분석기법은 다음과 같다. 시간 을 수평 축으로, 관측치 값을 수직 축으로 하여 그린 시계 열 도표는 관측지점의 수질 변화 패턴을 보여주므로 관측 지점을 군집화를 위하여 선택한 수질 변수들이 군집화에 유의한 변수인지 판별할 수 있는 시각적 도움을 준다. 관 측지점 간 시계열 변화 패턴 차이가 많은 수질이 관측지 점 군집에 더 적합한 변수이다. 주성분분석은 원변수의 공분산행렬(혹은 상관계수행렬)로부터 고유치와 이에 대 응하는 고유벡터를 구하고, 고유벡터를 선형계수로 하여 원변수의 선형결합으로 주성분변수를 구하게 된다. 이렇 게 구한 주성분변수는 원변수의 개수만큼 존재하며 서로 독립이이므로 원변수의 변동을 독립적으로 설명한다. 주 성분변수들 중 고유치가 1 이상이거나 누적 변동설명기여 율이 80% 이상인 일부를 선택하여 데이터의 차원을 축소 하게 된다. 저수지의 특성을 나타내는 수질과 같이 측정 형 변수이고 상관관계가 높은 경우 원변수의 개수가 많더 라도 2~3개의 주성분만으로 원변수의 변동을 대부분 설 명하게 된다. 데이터의 차원을 축소하게 되면 산점도를 이용하여 개체에 대한 정보를 쉽게 파악할 수 있으며, 원 변수의 구조적 패턴을 대부분 설명하는 주요 변수를 얻게 된다(이요상과 권세혁, 2009).

계층적 군집분석은 개체의 유사성을 이용하여 유사성 이 높은 순으로 개체를 묶어가는 다변량기법으로 개체의 유사성은 일반적으로 유클리디안 거리에 의해 측정된다.

원변수들의 단위가 다른 경우 변수를 각각 표준화 한 후 개체 간 유클리디안 거리를 계산하는데, 이렇게 되면 변 수들의 분산까지 표준화되어 개체 간 유사성을 거리에 의 해 측정하는데 한계를 지니게 된다. 또한 상관관계가 높 은 변수들이 다수 포함되어 있으면 이들로 인하여 개체의 유사성이 중복 측정되므로 이를 고려하는 것이 적절하다.

그러므로 수질관련 측정 항목처럼 변수 간의 상관관계가 높고 측정 단위가 다른 경우 원변수의 주요 패턴을 반영 한 주성분변수는 평균은 0이나 분산은 상이하고, 서로 독 립이므로 이를 이용하여 유클리디안 거리를 계산하는 것 이 적절하다. 개체의 유사성 크기순으로 군집화 하는 과 정을 도식화 한 그림인 덴드로그램은 통계 비전문가라도 군집의 개수 결정이 용이하도록 시각적 도움을 준다. 유 사성 크기에 의해 개체나 군집을 결합하는 연결(linkage) 방법에는 단일연결, 원전연결, 중심연결, 평균연결, 중위 수 연결, Ward 최소분산 방법 등이 제안 사용되고 있으

며, 적용되는 연결방법에 따라 상이한 덴드로그램을 얻게 되며 개체 군집도 상이하게 된다(Johnson, 1998).

다차원척도법은 개체 간 유사성 행렬을 활용하여 개체 를 저차원 공간에 표현하는 기법이다. 개체의 특성을 측 정형 변수로 측정한 경우 유클리디안 거리 혹은 상관계수 행렬을 이용하여 개체 간 유사성 행렬을 구한다. 측정 단 위가 다르거나 각 관측치를 시간 평균으로 사용하게 되는 시계열 데이터의 경우에는 유클리디안 거리는 적절한 유 사성 측정 개념이 아니다. 이런 한계를 극복하기 위하여 개체 간 유사성을 우선순위나 리커트척도에 의한 응답 결 과를 활용하여 유사성 행렬을 계산한다. 권세혁과 이요상 (2010)은 변수들 간 상관관계를 활용하여 수질의 시계열 변화를 고려할 수 있는 유사성 행렬을 계산하는 방법을 제안하였다. 각 수질변수의 개체 간 피어슨 상관계수를 계산하고, 대응하는 행렬 원소의 가중평균으로 단일 상관 계수 행렬을 얻어 이를 유사성 행렬로 활용하는 방법을 제안하였다. 유사성 행렬의 값을 크기순으로 정렬한 후 개체 간 거리의 상대적 위치를 저차원, 일반적으로 2차원 공간에 표현한다. 2차원 공간좌표를 이용하여 유클리디안 거리를 계산하고, 이에 계층적 군집분석을 적용하여 개체 를 군집화 한다.

3. 시스템 구축

본 시스템은 최적 수질관측망 구성에 필요한 수질 시계 열 도표, 유사 관측지점 군집 결과와 군집 개수를 결정에 도움을 주는 덴드로그램, 그리고 군집 내 대표 관측지점 에 대한 정보를 제공한다. 본 시스템은 시계열 도표 출력 시스템(Fig. 1의 ①), 관측지점 간 수질 유사성을 계산하 여 유사한 순서대로 관측지점을 군집화 하는 과정을 보여 주는 덴드로그램 출력 시스템(Fig. 1의 ②와 ③), 그리고 시스템 사용자가 덴드로그램을 활용하여 설정한 군집의 개수에 따라 관측지점 위치와 대표 관측지점을 보여주는 주성분 변수 산점도 출력 시스템(Fig. 1의 ④)으로 구성 되어 있다. 각 수질에 대하여 관측지점별 시계열 도표를 한 그래프에 표현하여 어느 수질이 관측지점 간 차이를 많이 보이는지 판단할 수 있도록 하였다. 관측지점 간 차 이를 많이 보이는 수질이 관측지점의 군집화에 더 적절한 측정 항목이다.

관측지점 간 유사성은 수질 특성변수들로부터 얻은 주 성분변수(고유치 1이상인 주성분변수 사용)의 유클리디 안 거리, 혹은 수질의 상관계수행렬에 다차원척도법을 적 용하여 얻은 2차원 성분좌표의 유클리디안 거리로 측정하 였다. 계산된 유사성 크기순으로 관측지점을 계층적으로 군집화 하는 과정에서 개체와 군집, 군집 간 거리는 평균

韓國水資源學會論文集 298

Fig. 1. Flow Chart of Network Design System

시간도표 < Time_Plot.SAS [입력]

(1) 관측지점 개수

[결과]

(1) 군집분석 결과, 군집 이름 및 군집 내 관측지점 (텍스트 모드) (2) 수질별 관측지점 겹친 시간도표 (그래프)

(3) 수질별 변동계수 값 (텍스트 모드)

Fig. 2. Input Window of Time Serise Analysis 연결법에 의해 유사성을 계산하였고, 군집화 한 결과를

덴드로그램으로 화면 출력한다. 덴드로그램은 통계 비전문 가도 용이하게 군집의 개수를 결정할 수 있는 도구이므로, 이를 이용하여 군집의 개수를 결정하여 최종 산점도 출력 시스템에 입력하면 관측지점과 군집 결과, 그리고 대표 관 측지점이 주성분 변수 산점도가 출력된다. 주성분 산점도 는 관측지점의 군집 결과, 각 군집의 수질 특성 파악, 그리 고 군집을 대표하는 관측지점에 대한 정보를 제공한다.

4개의 세부 시스템으로 구성된 본 시스템은 각각 SAS 프로그램 버전 9.2를 기반으로 구축하였으므로 SAS 프로 그램 버전 9.2 이상이 설치된 컴퓨터에서 실행 가능하다.

본 시스템은 이용자들의 사용편의성을 고려해 간단한 입 력으로 결과를 얻을 수 있는 체계로 구성하였다. 분석 데 이터 형식은 자료 입출력 및 관리가 용이한 엑셀 데이터

를 사용하였으며, 관측지점별 데이터는 시트로만 구별하 면 된다. 관측지점별 시트 이름은 1, 2, 3 식으로 주어지면 된다. 즉, 대상지의 수질자료를 지점별로 생산순서에 따라 정리하여 분석 대상 관측지점 개수만큼 입력 시트를 구성 하면 된다. 시스템 상에서 관측지점 개수와 자료파일명을 입력하면 수질별 시계열 도표가 화면 출력된다(Fig. 2).

시계열 도표 출력 시스템에는 엑셀 데이터를 읽어 들이는 import 프로시져, 입력 데이터를 분석에 적합하도록 변형 하는 프로시져들, 그리고 산점도를 그리는 sgplot 프로시 져로 구성되어 있다.

시계열분석이 완료되면 각 관측지점 간 유사성을 계산 해야 하는데, 첫 번째 방법으로는 원변수들의 변동을 축 약한 주성분변수들의 유클리디안 거리를 계산하여 계층 적 군집분석을 적용하여 덴드로그램을 얻었다(Fig. 3).

Fig. 3의 시스템은 주성분 분석 프로시져 princomp와 계 층적 군집분석 프로시져 cluster, 그리고 덴드로그램을 그 리는 tree 프로시져로 구성되어 있다. 유사성을 계산한 다 른 방법은 각 수질의 변화패턴을 고려할 수 있는 상관계 수를 활용한 다차원척도법을 적용하여 얻은 성분 좌표에 의해 덴드로그램을 얻었다. Fig. 4는 상관분석 프로시져 corr, 다차원척도법을 위한 mds 프로시져, 그리고 tree 프 로시져로 구성되어 있다.

덴드로그램을 활용하여 군집 개수를 결정하여 최종 산

점도 출력 시스템에 이용자가 원하는 군집의 개수를 입력

하면 관측지점의 군집결과, 군집의 수질 특성 파악이 가

능한 주성분 산점도가 출력된다. 군집 내 관측지점의 개

수가 많을 경우에 대표지점의 선정에 혼란이 올수 있어

군집 내 관측지점의 중심점을 군집 대표 관측지점으로 제

시하여 대표지점 선정 시 활용될 수 있도록 하였다. 이 시

스템은 주성분 점수를 얻는 princomp 프로시져와 산점도

를 그리는 sgsctter 프로시저로 구성되어 있다.

(5)

第44卷 第4號 2011年 4月 299

주성분 점수에 의한 유사성 < Similarity_PCA.SAS

[입력]

(1) 관측지점 개수 [결과]

(1) 덴드로그램

Fig. 3. Input Window of PCA

상관계수 행렬 및 다차원 척도 활용 유사성 < Similarity_CORRELATION.SAS [입력]

(1) 관측지점 개수

[결과]

(1) 덴드로그램

Fig. 4. Input Window of Correlation Analysis

Fig. 5. 10 Monitoring Stations 4. 적용 및 분석

4.1 연구지역

본 연구에서는 용담댐을 대상으로 구축한 시스템을 적 용해 보았다. 용담댐은 4지점의 수질측정망 조사지점이 운영되고 있으나, 조사지점간 수질 유사성 분석을 위해서 는 수질관측지점을 늘려 저수지 전역에 관측 위치가 고밀 도로 분포되도록 관측지점을 선정하고 조사를 실시하였 다. 이를 위해 용담저수지 내의 수질측정 지점은 Fig. 5와 같이 댐 앞에 1개(1번) 지점에서부터 시작하여 주자천 유 입 지류에 2개(2번, 3번) 지점 등 10개 지점에 대한 조사 를 실시하였으며, 이중 결측이 많은 10번 지점은 활용하 지 않았다. 각 지점별 수질변화 관측을 위해 2005년과 2006년에 걸쳐 1월부터 12월까지 월 1∼4회씩 각 관측지 점에서 19개 수질항목에 대한 수질 조사를 실시하였다(한 국수자원공사, 2005, 2006, 2007).

4.2 실측자료를 적용한 분석

저수지 전지점에 걸쳐 수집된 자료를 바탕으로 주요 7 개지표(SS, SD, COD

Mn

, TP, PO

4-

P, TN, chl-a)를 대상 으로 9지점간 유사성을 계산하였다. 각 수질항목의 시계 열 변화를 고려할 수 있는 통계량인 상관계수를 이용하여 관측지점의 유사성을 계산하는 방법을 적용하였다. 상관 계수행렬을 유사성행렬로 하여 다차원척도법을 적용하여 관측지점의 상대적 위치에 대한 좌표값을 이용하여 관측 지점간 유클리디안 거리를 계산하고 이를 유사성으로 활 용하여 완전연결법에 의해 관측지점에 대한 계층적 군집

분석을 실시하였다. Fig. 6은 다차원척도법 산점도와 완 전연결법에 의한 덴드로그램이다.

덴드로그램에 의해 유사한 관측지점을 군집화한 결과 (Fig. 7)에 의하면, 1번과 4번 지점의 유사성이 높았고, 5 번과 6번 지점이 유사하게 나타났으며 2번과 7번지점이 수질측정망으로 평가되었다. 반면, 3번과 8번, 9번은 유입 하천에 가까워 다른 지점과 달리 독립적으로 수질변화가 나타나는 것으로 평가되었다. 그런데 이상과 같이 1번과 4번, 5번과 6번이 군집화 되었을 때, 정확한 지점의 선정 이 애매한 결과가 도출되었으며, 2번과 7번도 해당지점의 대표성으로의 정확성에 의문이 제기될 수 있는 문제가 예 상되었다. 이를 해결하기 위해서는 보다 많은 지점의 자 료를 확보하여 군집분석을 실시하면 보다 객관적인 결과

300

Fig. 6. Dendrogram Fig. 7. Clustering of Network

Fig. 8. Segmentation of Reservoir Fig. 9. Monitoring Sites

를 이끌어 낼 수 있을 것으로 판단되어 수질자료의 증폭 방법으로 저수지 수질모델을 활용하기로 하였다.

4.3 자료의 증폭

저수지 수질측정망 평가와 설계방안 수립을 위해서는 보다 많은 자료를 적용하는 것이 효율적이며 이를 위한 방안으로 수질모델링 방법의 적용이 가능하다. 기존의 수 질자료는 시간과 비용의 한계로 인해 월 1~2회, 수개의 조사지점에서 조사가 이루어지나 수질모델링을 활용하면 저수지 분할에 따라 수십 개에서 백개 이상의 지점에서 일단위의 수질변화를 모의할 수 있기 때문에 그만큼 세밀 한 자료의 취득이 가능하다. 이를 위해 적용한 저수지 수

질모델은 미공병단에서 개발된 횡방향 평균화 2차원 수리 수질모델인 CE-QUAL-W2를 적용하였다. 지형조건은 대상댐의 담수전 1 : 5000 수치지도 정보를 바탕으로 CAD 상에서 지형을 구성하며 모델 격자는 연구자의 판단에 의 해 나눌 수 있다.

수질모의에 필요한 기상자료는 기상관측소에서 취득한

기온, 풍향, 풍속 등의 데이터를 모델에 입력하였고, 이슬

점온도, 운량 등의 데이터는 기상청 관측자료를 이용하였

다. 경계수질 조건은 댐 유입부 수질측정지점에서 측정한

월별 수질 자료를 입력하였으며, 경계조건으로 입력된 수

질 항목은 총 13 항목(탁도, COD

Mn

, SS, PO

4-

P, NH

4-

N,

NO

3-

N, NO

2-

N, BOD, DO, LDOM, RDOM, LPOM,

(6)

第44卷 第4號 2011年 4月 299

주성분 점수에 의한 유사성 < Similarity_PCA.SAS

[입력]

(1) 관측지점 개수 [결과]

(1) 덴드로그램

Fig. 3. Input Window of PCA

상관계수 행렬 및 다차원 척도 활용 유사성 < Similarity_CORRELATION.SAS [입력]

(1) 관측지점 개수

[결과]

(1) 덴드로그램

Fig. 4. Input Window of Correlation Analysis

Fig. 5. 10 Monitoring Stations 4. 적용 및 분석

4.1 연구지역

본 연구에서는 용담댐을 대상으로 구축한 시스템을 적 용해 보았다. 용담댐은 4지점의 수질측정망 조사지점이 운영되고 있으나, 조사지점간 수질 유사성 분석을 위해서 는 수질관측지점을 늘려 저수지 전역에 관측 위치가 고밀 도로 분포되도록 관측지점을 선정하고 조사를 실시하였 다. 이를 위해 용담저수지 내의 수질측정 지점은 Fig. 5와 같이 댐 앞에 1개(1번) 지점에서부터 시작하여 주자천 유 입 지류에 2개(2번, 3번) 지점 등 10개 지점에 대한 조사 를 실시하였으며, 이중 결측이 많은 10번 지점은 활용하 지 않았다. 각 지점별 수질변화 관측을 위해 2005년과 2006년에 걸쳐 1월부터 12월까지 월 1∼4회씩 각 관측지 점에서 19개 수질항목에 대한 수질 조사를 실시하였다(한 국수자원공사, 2005, 2006, 2007).

4.2 실측자료를 적용한 분석

저수지 전지점에 걸쳐 수집된 자료를 바탕으로 주요 7 개지표(SS, SD, COD

Mn

, TP, PO

4-

P, TN, chl-a)를 대상 으로 9지점간 유사성을 계산하였다. 각 수질항목의 시계 열 변화를 고려할 수 있는 통계량인 상관계수를 이용하여 관측지점의 유사성을 계산하는 방법을 적용하였다. 상관 계수행렬을 유사성행렬로 하여 다차원척도법을 적용하여 관측지점의 상대적 위치에 대한 좌표값을 이용하여 관측 지점간 유클리디안 거리를 계산하고 이를 유사성으로 활 용하여 완전연결법에 의해 관측지점에 대한 계층적 군집

분석을 실시하였다. Fig. 6은 다차원척도법 산점도와 완 전연결법에 의한 덴드로그램이다.

덴드로그램에 의해 유사한 관측지점을 군집화한 결과 (Fig. 7)에 의하면, 1번과 4번 지점의 유사성이 높았고, 5 번과 6번 지점이 유사하게 나타났으며 2번과 7번지점이 수질측정망으로 평가되었다. 반면, 3번과 8번, 9번은 유입 하천에 가까워 다른 지점과 달리 독립적으로 수질변화가 나타나는 것으로 평가되었다. 그런데 이상과 같이 1번과 4번, 5번과 6번이 군집화 되었을 때, 정확한 지점의 선정 이 애매한 결과가 도출되었으며, 2번과 7번도 해당지점의 대표성으로의 정확성에 의문이 제기될 수 있는 문제가 예 상되었다. 이를 해결하기 위해서는 보다 많은 지점의 자 료를 확보하여 군집분석을 실시하면 보다 객관적인 결과

韓國水資源學會論文集 300

Fig. 6. Dendrogram Fig. 7. Clustering of Network

Fig. 8. Segmentation of Reservoir Fig. 9. Monitoring Sites

를 이끌어 낼 수 있을 것으로 판단되어 수질자료의 증폭 방법으로 저수지 수질모델을 활용하기로 하였다.

4.3 자료의 증폭

저수지 수질측정망 평가와 설계방안 수립을 위해서는 보다 많은 자료를 적용하는 것이 효율적이며 이를 위한 방안으로 수질모델링 방법의 적용이 가능하다. 기존의 수 질자료는 시간과 비용의 한계로 인해 월 1~2회, 수개의 조사지점에서 조사가 이루어지나 수질모델링을 활용하면 저수지 분할에 따라 수십 개에서 백개 이상의 지점에서 일단위의 수질변화를 모의할 수 있기 때문에 그만큼 세밀 한 자료의 취득이 가능하다. 이를 위해 적용한 저수지 수

질모델은 미공병단에서 개발된 횡방향 평균화 2차원 수리 수질모델인 CE-QUAL-W2를 적용하였다. 지형조건은 대상댐의 담수전 1 : 5000 수치지도 정보를 바탕으로 CAD 상에서 지형을 구성하며 모델 격자는 연구자의 판단에 의 해 나눌 수 있다.

수질모의에 필요한 기상자료는 기상관측소에서 취득한

기온, 풍향, 풍속 등의 데이터를 모델에 입력하였고, 이슬

점온도, 운량 등의 데이터는 기상청 관측자료를 이용하였

다. 경계수질 조건은 댐 유입부 수질측정지점에서 측정한

월별 수질 자료를 입력하였으며, 경계조건으로 입력된 수

질 항목은 총 13 항목(탁도, COD

Mn

, SS, PO

4-

P, NH

4-

N,

NO

3-

N, NO

2-

N, BOD, DO, LDOM, RDOM, LPOM,

(7)

第44卷 第4號 2011年 4月 301

JDAY COD SS PO4-P NH4-N NO3-N BOD DO TN TP CHLA

1 4.2 4.6 3.0 3.0 1.0 1.8 12.0 1.6 18.5 0.897

2 4.2 4.6 3.0 4.4 1.0 1.8 12.0 1.6 18.5 0.886

3 4.2 4.6 3.0 5.8 1.0 1.8 12.0 1.6 18.4 0.876

4 4.2 4.6 3.1 7.1 1.0 1.8 11.9 1.6 18.4 0.869

5 4.2 4.6 3.1 8.4 1.0 1.8 11.9 1.6 18.4 0.864

6 4.2 4.6 3.1 9.7 1.0 1.8 11.9 1.6 18.4 0.86

7 4.2 4.6 3.1 10.9 1.0 1.8 11.9 1.6 18.4 0.853

8 4.2 4.6 3.2 12.1 1.0 1.8 11.9 1.6 18.4 0.846

9 4.2 4.6 3.2 13.3 1.0 1.8 11.9 1.6 18.4 0.839

: : : : : : : : : : :

Table 1. Water Quality Data at Monitoring Sites

Fig. 10. Dendrogram by Average Linkage with PC Score RPOM, Algae)이다. 이러한 과정을 거쳐 생산되는 자료

는 일자료로 사용이 가능하며 종축과 횡축으로 세분화된 지점에서 자료가 생산되므로 원자료에 비해 매우 많은 자 료가 생성되게 된다. 따라서 사용자는 원하는 지점에서 필요로 하는 자료를 추출하여 사용할 수 있으며 다양한 형태로 표현이 가능하다. Fig. 8은 저수지를 격자로 구분 한 것이며, Fig. 9는 모의 결과에서 수질측정망 평가에 사 용할 지점을 표시한 것이다.

4.4 증폭된 자료를 적용한 분석

본 연구에서는 수질모델을 적용하여 증폭된 수질자료 중 저수지적 수질특성을 나타내는 27지점의 자료를 추출 하여 사용하였다(Fig. 9). 사용된 자료는 수질관리에 중

요하면서 지점간 특성을 내포하고 있는 10가지 수질항목 (COD

Mn

, SS, PO

4-

P, NH

4-

N, NO

3-

N, BOD, DO, TN, TP, chl-a)에 대하여 추출하였다. 추출된 자료는 Table 1과 같 이 일별 자료이며 1월 1일부터 12월 말일까지 365일간 자 료이다. 시스템구축에서 설명한 바와 같이 시스템을 통하 여 시계열분석을 하고 유사성분석을 통해 군집분석을 실 시하여 조사지점을 그룹화하였다(Fig. 10). 그룹화 결과 9 개 지점을 대상으로 했을 때에 비해 지점이 많은 관계로, 몇몇 그룹에서는 최적지점의 선정에 어려움이 발생하여 중심점개념을 채용하여 산점도상에 최적지점을 제시하였 다(Fig. 11).

결과에 의하면 수질측정망 4지점을 선정할 경우에는 22번 지점, 4번 지점, 9번 지점, 12번 지점이 대표지점으로

302

Fig. 11. Scatter Plots with Representative Location

Fig. 12. 4 Representative Locations Fig. 13. 5 Representative Locations

선정(Fig. 12)되었으며, 5지점을 선정할 경우에는 2번 지 점, 23번 지점, 4번 지점, 8번 지점, 11번 지점이 대표지점 으로 선정되었다(Fig. 13). 이는 측정망 지점수가 변함에 따라 대상 지점이 변할 수 있음을 보여주는 것으로 수질 측정지점 개수가 변하면 전체 측정망에 대한 검토가 필요 함을 나타내는 것이다.

5. 결과 및 고찰

저수지 수질측정망 구축시스템을 적용한 바에 의하면,

제시되는 수질자료의 지점이 많을수록 좀 더 정확한 지점 을 제시할 수 있으므로 수질모델을 활용한 자료의 증폭 방법이 필요한 것으로 판단되었다. 또한 모의 시 수질자 료는 최소한 1년 단위로 적용해야 년 중 변화를 고려한 수 질측정망이 제시될 수 있는 것으로 평가되었다.

본 연구에서 구축한 저수지 수질측정망 구축시스템은

주어진 자료를 바탕으로 사용자가 원하는 수만큼의 대표

지점을 생성하여 제공한다. 저수지에서 수질측정망을 구

성할 때 처음에는 최적의 측정지점과 개수를 결정하는 것

이 쉽지 않다. 본 연구에서 적용한 용담댐의 경우 최적지

(8)

第44卷 第4號 2011年 4月 301

JDAY COD SS PO4-P NH4-N NO3-N BOD DO TN TP CHLA

1 4.2 4.6 3.0 3.0 1.0 1.8 12.0 1.6 18.5 0.897

2 4.2 4.6 3.0 4.4 1.0 1.8 12.0 1.6 18.5 0.886

3 4.2 4.6 3.0 5.8 1.0 1.8 12.0 1.6 18.4 0.876

4 4.2 4.6 3.1 7.1 1.0 1.8 11.9 1.6 18.4 0.869

5 4.2 4.6 3.1 8.4 1.0 1.8 11.9 1.6 18.4 0.864

6 4.2 4.6 3.1 9.7 1.0 1.8 11.9 1.6 18.4 0.86

7 4.2 4.6 3.1 10.9 1.0 1.8 11.9 1.6 18.4 0.853

8 4.2 4.6 3.2 12.1 1.0 1.8 11.9 1.6 18.4 0.846

9 4.2 4.6 3.2 13.3 1.0 1.8 11.9 1.6 18.4 0.839

: : : : : : : : : : :

Table 1. Water Quality Data at Monitoring Sites

Fig. 10. Dendrogram by Average Linkage with PC Score RPOM, Algae)이다. 이러한 과정을 거쳐 생산되는 자료

는 일자료로 사용이 가능하며 종축과 횡축으로 세분화된 지점에서 자료가 생산되므로 원자료에 비해 매우 많은 자 료가 생성되게 된다. 따라서 사용자는 원하는 지점에서 필요로 하는 자료를 추출하여 사용할 수 있으며 다양한 형태로 표현이 가능하다. Fig. 8은 저수지를 격자로 구분 한 것이며, Fig. 9는 모의 결과에서 수질측정망 평가에 사 용할 지점을 표시한 것이다.

4.4 증폭된 자료를 적용한 분석

본 연구에서는 수질모델을 적용하여 증폭된 수질자료 중 저수지적 수질특성을 나타내는 27지점의 자료를 추출 하여 사용하였다(Fig. 9). 사용된 자료는 수질관리에 중

요하면서 지점간 특성을 내포하고 있는 10가지 수질항목 (COD

Mn

, SS, PO

4-

P, NH

4-

N, NO

3-

N, BOD, DO, TN, TP, chl-a)에 대하여 추출하였다. 추출된 자료는 Table 1과 같 이 일별 자료이며 1월 1일부터 12월 말일까지 365일간 자 료이다. 시스템구축에서 설명한 바와 같이 시스템을 통하 여 시계열분석을 하고 유사성분석을 통해 군집분석을 실 시하여 조사지점을 그룹화하였다(Fig. 10). 그룹화 결과 9 개 지점을 대상으로 했을 때에 비해 지점이 많은 관계로, 몇몇 그룹에서는 최적지점의 선정에 어려움이 발생하여 중심점개념을 채용하여 산점도상에 최적지점을 제시하였 다(Fig. 11).

결과에 의하면 수질측정망 4지점을 선정할 경우에는 22번 지점, 4번 지점, 9번 지점, 12번 지점이 대표지점으로

韓國水資源學會論文集 302

Fig. 11. Scatter Plots with Representative Location

Fig. 12. 4 Representative Locations Fig. 13. 5 Representative Locations

선정(Fig. 12)되었으며, 5지점을 선정할 경우에는 2번 지 점, 23번 지점, 4번 지점, 8번 지점, 11번 지점이 대표지점 으로 선정되었다(Fig. 13). 이는 측정망 지점수가 변함에 따라 대상 지점이 변할 수 있음을 보여주는 것으로 수질 측정지점 개수가 변하면 전체 측정망에 대한 검토가 필요 함을 나타내는 것이다.

5. 결과 및 고찰

저수지 수질측정망 구축시스템을 적용한 바에 의하면,

제시되는 수질자료의 지점이 많을수록 좀 더 정확한 지점 을 제시할 수 있으므로 수질모델을 활용한 자료의 증폭 방법이 필요한 것으로 판단되었다. 또한 모의 시 수질자 료는 최소한 1년 단위로 적용해야 년 중 변화를 고려한 수 질측정망이 제시될 수 있는 것으로 평가되었다.

본 연구에서 구축한 저수지 수질측정망 구축시스템은

주어진 자료를 바탕으로 사용자가 원하는 수만큼의 대표

지점을 생성하여 제공한다. 저수지에서 수질측정망을 구

성할 때 처음에는 최적의 측정지점과 개수를 결정하는 것

이 쉽지 않다. 본 연구에서 적용한 용담댐의 경우 최적지

(9)

第44卷 第4號 2011年 4月 303

Fig. 14. Several Number of Representative Locations

점을 Fig. 14와 같이 2지점에서 6지점까지 선정할 수 있으 나, 이중에서 어느 것이 년 중 수질을 가장 잘 나타내는지 를 판단하여 최적수질측정망이 구축되는 것이다.

군집의 개수 결정은 덴드로그램에 의한 주관적 판단에 의존하거나 Hotelling T-통계량과 Cubic Clustering Criterion 통계량을 이용할 수 있다. 그러나 두 통계량도 유의성을 검정할 수 있는 통계량이 아니라 참고할 수 있 는 값이므로 덴드로그램에 의한 군집 개수 결정보다 더 합리적이라고 판단할 수는 없다. 개체의 군집이 잘 되어 있다면 군집 간 개체의 수질 관측치 차이는 크고, 군집 내 개체의 수질 관측치 차이는 적아야 한다. 그러므로 각 수 질의 군집 내 평균, 군집 간 평균을 이용하여 군집의 개수 를 결정할 수 있는 연구도 필요하다.

6. 결 론

효과적인 수질관리를 위해서는 수질정보의 기대수준에 맞는 신뢰성 있는 수질자료가 확보되어야 한다. 이런 점 에서 볼 때 수질모니터링은 조사지점, 수질항목, 측정주기 등이 성패의 중요한 요인이 되며, 이중에서 특히 조사지 점은 가장 중요한 사항으로 판단된다. 그러나 지금까지

수질조사를 위한 관측지점은 대부분 정성적 판단에 따라 정해지고 있었기 때문에 수질대표성이 문제가 되기도 하 였다. 본 논문에서는 이와같은 수질측정망 구축 시 문제 점을 과학적인 통계기법을 적용하여 개선한 최적수질측 정망 구축시스템으로 제시하였다.

구축된 최적수질측정망 구축시스템은 SAS 프로그램 버전 9.2를 기반으로 만들었으며, 이용자의 사용편의성을 고려하여 간단한 입력으로 측정망을 구축할 수 있는 체계 로 구성하였다. 분석 데이터 형식은 자료 입출력 및 관리 가 용이한 엑셀 데이터를 사용하도록 하였으며, 관측지점 별 데이터는 시트로만 구별하게 하였다. 시스템에서는 시 계열분석과 유사성계산을 하여, 각 수질의 변화패턴을 고 려할 수 있는 상관계수를 활용한 다차원척도법을 적용하 여 그 결과를 덴드로그램으로 제시하며, 그 결과를 활용 하여 군집 개수를 결정한다. 이용자가 최종 산점도 출력 시스템에 원하는 군집의 개수를 입력하면 수질 특성 파악 이 가능한 주성분 산점도가 출력되며, 군집 내 관측지점 의 중심점을 대표지점으로 선정하면 된다.

저수지 수질측정망 구축시스템을 용담댐에 적용해 본 결과, 제시되는 수질자료의 지점이 많으면 좀 더 정확한 지점을 결정할 수 있으므로 수질모델을 활용한 자료의 증

304

폭이 필요한 것으로 판단되었으며, 수질자료는 최소한 1년 단위로 적용해야 년중 변화를 고려한 수질측정망이 제시 될 수 있는 것으로 평가되었다. 본 시스템은 현장사용자들 이 활용하기 편리하게 구축되었으며, 사용자가 작성한 수 질자료의 크기에 따라 측정망지점의 선정을 객관화 할 수 있고, 다양한 조건별로 수질측정망을 구성하여 비교 평가 해 볼 수 있는 매우 과학적인 시스템으로 판단되었다.

참고문헌

권세혁, 이요상 (2010). “수질관측지점 유사성 측정방법 연구.” 한국통계학회논문집, 한국통계학회, 제17권, 제1호, pp. 39-45.

이요상, 권세혁 (2009), “다변량기법을 활용한 용담호 수 질측정지점 유사성 연구.” 한국환경영향평가학회지,

한국환경영향평가학회, Vol. 18, No. 6, pp. 401-409.

한국수자원공사(2005, 2006, 2007). 용담댐 일원 하천유 량측정 등 수문조사보고서.

Jamie, B., and Richard, B. (2007). “Water Quality Monitoring.” Taylor & Francis.

Johnson, D.E. (1998). “Applies Multivariate Methods for Data Analysis.” Duxbury Press.

Robert, O.S., Paul, D.R. (2008). “Network design for water quality monitoring of surface freshwaters.”

Journal of Environmental Management, 87, pp. 639- 648.

논문번호: 11-024 접수: 2011.02.22

수정일자: 2011.04.06 심사완료: 2011.04.06

(10)

第44卷 第4號 2011年 4月 303

Fig. 14. Several Number of Representative Locations

점을 Fig. 14와 같이 2지점에서 6지점까지 선정할 수 있으 나, 이중에서 어느 것이 년 중 수질을 가장 잘 나타내는지 를 판단하여 최적수질측정망이 구축되는 것이다.

군집의 개수 결정은 덴드로그램에 의한 주관적 판단에 의존하거나 Hotelling T-통계량과 Cubic Clustering Criterion 통계량을 이용할 수 있다. 그러나 두 통계량도 유의성을 검정할 수 있는 통계량이 아니라 참고할 수 있 는 값이므로 덴드로그램에 의한 군집 개수 결정보다 더 합리적이라고 판단할 수는 없다. 개체의 군집이 잘 되어 있다면 군집 간 개체의 수질 관측치 차이는 크고, 군집 내 개체의 수질 관측치 차이는 적아야 한다. 그러므로 각 수 질의 군집 내 평균, 군집 간 평균을 이용하여 군집의 개수 를 결정할 수 있는 연구도 필요하다.

6. 결 론

효과적인 수질관리를 위해서는 수질정보의 기대수준에 맞는 신뢰성 있는 수질자료가 확보되어야 한다. 이런 점 에서 볼 때 수질모니터링은 조사지점, 수질항목, 측정주기 등이 성패의 중요한 요인이 되며, 이중에서 특히 조사지 점은 가장 중요한 사항으로 판단된다. 그러나 지금까지

수질조사를 위한 관측지점은 대부분 정성적 판단에 따라 정해지고 있었기 때문에 수질대표성이 문제가 되기도 하 였다. 본 논문에서는 이와같은 수질측정망 구축 시 문제 점을 과학적인 통계기법을 적용하여 개선한 최적수질측 정망 구축시스템으로 제시하였다.

구축된 최적수질측정망 구축시스템은 SAS 프로그램 버전 9.2를 기반으로 만들었으며, 이용자의 사용편의성을 고려하여 간단한 입력으로 측정망을 구축할 수 있는 체계 로 구성하였다. 분석 데이터 형식은 자료 입출력 및 관리 가 용이한 엑셀 데이터를 사용하도록 하였으며, 관측지점 별 데이터는 시트로만 구별하게 하였다. 시스템에서는 시 계열분석과 유사성계산을 하여, 각 수질의 변화패턴을 고 려할 수 있는 상관계수를 활용한 다차원척도법을 적용하 여 그 결과를 덴드로그램으로 제시하며, 그 결과를 활용 하여 군집 개수를 결정한다. 이용자가 최종 산점도 출력 시스템에 원하는 군집의 개수를 입력하면 수질 특성 파악 이 가능한 주성분 산점도가 출력되며, 군집 내 관측지점 의 중심점을 대표지점으로 선정하면 된다.

저수지 수질측정망 구축시스템을 용담댐에 적용해 본 결과, 제시되는 수질자료의 지점이 많으면 좀 더 정확한 지점을 결정할 수 있으므로 수질모델을 활용한 자료의 증

韓國水資源學會論文集 304

폭이 필요한 것으로 판단되었으며, 수질자료는 최소한 1년 단위로 적용해야 년중 변화를 고려한 수질측정망이 제시 될 수 있는 것으로 평가되었다. 본 시스템은 현장사용자들 이 활용하기 편리하게 구축되었으며, 사용자가 작성한 수 질자료의 크기에 따라 측정망지점의 선정을 객관화 할 수 있고, 다양한 조건별로 수질측정망을 구성하여 비교 평가 해 볼 수 있는 매우 과학적인 시스템으로 판단되었다.

참고문헌

권세혁, 이요상 (2010). “수질관측지점 유사성 측정방법 연구.” 한국통계학회논문집, 한국통계학회, 제17권, 제1호, pp. 39-45.

이요상, 권세혁 (2009), “다변량기법을 활용한 용담호 수 질측정지점 유사성 연구.” 한국환경영향평가학회지,

한국환경영향평가학회, Vol. 18, No. 6, pp. 401-409.

한국수자원공사(2005, 2006, 2007). 용담댐 일원 하천유 량측정 등 수문조사보고서.

Jamie, B., and Richard, B. (2007). “Water Quality Monitoring.” Taylor & Francis.

Johnson, D.E. (1998). “Applies Multivariate Methods for Data Analysis.” Duxbury Press.

Robert, O.S., Paul, D.R. (2008). “Network design for water quality monitoring of surface freshwaters.”

Journal of Environmental Management, 87, pp. 639- 648.

논문번호: 11-024 접수: 2011.02.22

수정일자: 2011.04.06 심사완료: 2011.04.06

수치

Fig. 1. Flow Chart of Network Design System
Fig. 3. Input Window of PCA
Fig. 5. 10 Monitoring Stations4. 적용 및 분석4.1 연구지역본 연구에서는 용담댐을 대상으로 구축한 시스템을 적용해 보았다. 용담댐은 4지점의 수질측정망 조사지점이운영되고 있으나, 조사지점간 수질 유사성 분석을 위해서는 수질관측지점을 늘려 저수지 전역에 관측 위치가 고밀도로 분포되도록 관측지점을 선정하고 조사를 실시하였다
Fig. 10. Dendrogram by Average Linkage with PC ScoreRPOM, Algae)이다. 이러한 과정을 거쳐 생산되는 자료는 일자료로 사용이 가능하며 종축과 횡축으로 세분화된지점에서 자료가 생산되므로 원자료에 비해 매우 많은 자료가 생성되게 된다
+2

참조

관련 문서