• 검색 결과가 없습니다.

단어 클러스터링 분석(동시발생모형)

6. 새로운 정보체제의 방향

1.1 단어 클러스터링 분석(동시발생모형)

<그림 3-1> 공진화 모델의 개념도

1.1 단어 클러스터링 분석(동시발생모형)

물인적 복합 재난은 대표적인 위험사회문제로 이러한 위험사회문제의 분 석을 위해서는 위험의 가치사슬체계를 구성하고 현재 발생한 위험이슈분야 를 빅데이터 분석 등을 통해서 찾아내어 특정 이슈가 해당 분야의 가치사슬 체계내에 어디에 위치해 있고 그러한 이슈의 내용과 영향력을 분석할 수 있다.

언어학자 비트겐슈타인이 해결하고자 했던 문제는 “어떻게 언어가 세상 을 나타낼 수 있는가”하는 것이었으며, 언어는 세계에 대한 일종의 그림이 며, 그러한 한에 있어서 언어는 의미를 갖는다. 즉 그림과 세계의 관련방식 (양자 구성요소들간의 대응관계,구조 동일성의 가능성)을 언어에 적용하여, 언어가 실재를 표상할 수 있으려면, 문장과 문장이 표상하는 사태가 어떤 공통적인 구조를 가져야 하는데, 이것을 세월호 사건에 적용(2014. 4.16-5.28:

언론재단 사설 DB 활용)하여, 문장내에 단어간의 동시발생매트릭스 (Co-Occurrence Matrix)방법을 사용하여 재난요소( risk signal)간의 가치사슬 체계로 구성하였다. 석에 활용된 R-library는 KoNLP, arules, igraph, combinat 등을 사용하였다.

언론 DB의 빅데이터 분석결과(사건 이슈간 연결망구조)를 사건발생 이후 시계열(10일 간격)단계순으로 살펴보면 다음 <그림 5>와 같다. 1단계에서는 세월호, 인재, 참사의 단어들이 각각의 단어군을 연계하는 역할을 하였으나, 2단계 이후 각 단어군이 중심주제군을 가지고 파편화되어 지고 있음을 알 수 있다. 이는 최초 사고발생에서는 사건 자체를 통해서 주제가 형성되어

가다가 주제가 어느 정도 형성이 되면 각 주제별 논조로 전문화 됨을 보여준 다고 할 수 있다.

<그림 3-3> 빅데이터분석 결과 시계열 단어군간의 연계망 변화

한편 이러한 1단계서부터 3단계에 이르는 모든 데이터를 통합하여 전체 분석을 할 경우는 <그림3-4>과 같다. 여기서는 가운데 큰 클러스터군을 형성 하고 그 주변에 일정한 주제군이 형성된다. 오른쪽에 있는 수직 계통도는 각 단어군의 포함관계를 보여준다. 본 연구에서는 통합데이터군의 모형을 이용하여 위험분석을 위한 보타이 모델로의 변환을 시도하였다.

<그림 3-4> 통합단어군간의 연계망 및 수직계통도

1.2 보타이 모델 구성

상기한 분석결과를 보타이 모델의 형태로 재구성하면 다음 <그림 7>과 같다. 일반적으로 보타이 모델은 각 요소간의 관계 흐름에 주목한다. 즉 구성요소(노드)간에 지식을 주고받는 관계를 나타낸 네트워크인데, 나가는 방향의 링크는 지식을 주었다는 의미이고, 들어오는 방향의 링크는 지식을 받았다는 의미이다.

각 요소그룹간의 기능적인 의미를 살펴보면 크게는 6개의 부분으로 나눌 수 있다.

- SCC(Giant Strongly Connected Component) : 가장 강하게 서로 얽혀 있는 컴포넌트로, 지식관계에서는 지식이 순환하는 지점으로 Exchange Zone 이다.

- IN : SCC 그룹으로 들어가는 링크이며, 지식의 근원지인 Source Zone이다.

- OUT: SCC에서 나오는 링크이며, 지식의 도착점으로 Target Zone이다.

- Tube: 순환하는 중간지점을 거치지 않고 직접적으로 Source 그룹과 Target그룹을 연결하고 있는 그룹이다.

- Tendril : Source그룹 또는 Target 그룹에 의존적으로 관계하고 있는 Dependent 그룹이다.

- Disonnected Components: 어떤 그룹과도 관계를 주고받지 않고 동떨어져 있는 그룹이다.

<그림 3-5> 보타이 모델의 데이터 구성요소

그룹 a b 비고

상영역(Target Zone)에는 그룹6에서부터 그룹7까지가 포함된다. 한편 클러스 터 3에 포함되어 있는 그룹군은 원천영역에 의존적인 Tendril이고, 클러스터 4의 그룹들은 대상영역에 의존적인 Tendril이라고 할 수 있다.

<그림 3-6> 클러스터링 분석결과의 보타이 모델로의 전환

1.3 재난관리를 위한 복잡계 모델

위험분석모델은 사회위기를 일으키는 주요 위험요소에 대한 분석을 위한 것이다. 이모델에서의 각 노드는 사회리스크 발생의 주요 시그날을 나타낸 다. 여기서는 총 16개의 주요 인자를 추출하였다. 14개 그룹과 사건의 주요 연결점 2개를 포함한다.이러한 주요 요인간의 관계에 따라 새로운 창발 효과 를 규명하고자 한다.

사회혼란을 야기시키는 이러한 위험 인자들은 직접적으로 타 요인에 대 하여 영향을 미치는 상호 인과관계를 나타난다는 것을 가정하였다. 이는 이 미 심리적 현상에서 증명된바 있다(Borsboom, 2008). 예컨대, 한 요인의 진전 은 다른 요인의 likelihood 값을 상승시킨다. 그리고 역으로 한요인의 침체는 이웃한 타요인의 값을 떨어트리는 효과를 보인다. 만약 요인간에 결합관계 가 강하게 연결되어 있다면 약한 충격에도 그 효과는 큰 리스크를 만들어 내는 결과를 가져 온다. 반면에 약한 결합관계시에는 반대의 현상이 일어난 다. 즉 상기 모델에서는 사회적으로 취약한 고리에서는 심각한 리스크를 가 져올 수 있고, 이 문제가 해결되었다고 하더라도 그 폐해는 매우 크다는 것 이다. 반대로 리스크에 유연성(약한 연결고리)을 가지고 있는 경우는 약한 강도의 스트레스만으로는 연속적인 위기 상황을 발생시키기 어렵다. 즉 매

우 강한 자극은 강한 위기 상황을 초래하지만 강도가 낮아지면 그효과 역시 낮아진다. 이것이 후술할 히스테리시스 효과이다. 재난 및 위험관리를 위한 복잡계 모델은 각각의 위험 시그날(심리 혹은 물질) 사이의 부분 상관 관계 를 기반으로 하고 있는데, 각 시간 스텝에서, 위험시그날별 확률은 각각 계산 되어 지며, 이 확률은 특정 매개 변수뿐만 아니라 이전 시기에서의 이웃노드 들의 전체 활성화에 따라 달라지며, 개별 적용 파라미터는 각각의 위험요소 별 기울기와 절편에 따라 달라진다. 한편 각 위험요소별 활성화 확률은 다음 과 같이 표현할 수 있다.

    

여기서 c는 i에서 위험총량으로 “개별 시그날의 위험정도 (시그날 i의 슬 라이더 값) + 외부 활성화량(전체 네트워크상의 위험 시그날의 양) + 시그날 i의 이웃에 의해 영향을 받은 양”으로 나타낼 수 있다. 한편, 개별 위험요소에 적용되는 파라미터 a는 전술한 식에서 보듯이 확률 함수의 기울기를 나타내 며, 전체네트워크의 위험총량에 곱해져 전체 리스크 변화를 좌우 할 수 있다.

매개 변수 b 는 위험요소별 임계값(저항값)으로 더 높은 임계값을 가진 위험 요소들은 낮은 임계 값을 가진 시그날을 활성화하는데 보다 더 큰 강도의 충격(stress)가 필요하다.

<그림 3-7> ABM 툴인 NetLogo로 개발된 모형의 시뮬레이션 적용 화면

한편 히스테리시스(hysteresis)효과는 이력(履歷)현상을 말한다. 일반적으 로 탄성체는 외력을 가하면 변형하나, 이 외력을 제거하면 다시 본래의 모양 으로 된다. 그러나 어느 한계 이상의 힘을 가하면 본래의 모양으로 되돌아가 지 않고 변형한 그대로의 상태에 있으며, 변형의 정도도 외력의 크기에 따라 다르다. 이와 같이 물체의 성질이 현재의 상태만으로는 모르므로 과거의 이 력(履歷)이 어떠했는가에 따라 다른 현상을 히스테리시스 현상이라고 한다.

예컨대, 처음에는 약하게 걸어주면 강자성 자체가 가지는 힘이 너무 강해서 이 외력이 내부의 자력을 능가할 수가 없지만 이 외력이 점점 증가하면 강자 성체가 굴복을 하면서 외력의 방향과 점점 동일해지다가 나중에는 동일해지 는데 이 때 이것을 포화(Saturation)된다고 한다. 여기서 외력을 없애버릴 경 우, 이 때 처음에 외력을 가해줬을 때, 반응했던 방향과 크기에 대해서 그래 프가 형성이 되는데 강자성의 경우는 외력이 0이 되어도 처음에 이동했던 그 그래프와 동일한 경로로 따라오지 않게 된다. 즉 자신의 내부의 내재된 힘에 의해서 서서히 줄어들게 되면서 원래의 방향으로 돌아오는데 원래 경

로와 크게 벗어나 경로로 되돌아오는 것을 히스테리시스 루프라고 한다. 하 지만 약자성의 경우는 이 크기가 워낙 작기에 쉽게 반응을 하기에 원래 경로 와 거의 비슷하게 다시 감소를 하게 된다. 이 경우 히스테리시스 면적이 강 자성에 비해서 작은 경우이다.

이를 리스크 관점에서 보면 다음 <그림 10> 과 같다. 즉 시스템이 과거 어떠한 강도로 결속되어 있었는가에 따라 위기발생이후의 복원 경로가 상호 차이가 난다. 그림에서 a는 결속력이 작은 것의 경로를 의미하고 b는 결속력 이 큰 것에 대한 경로를 의미한다.

<그림 3-8> 히스테리시스 효과

한편, 개발된 복잡계 모형에서는 히스테리시스의 효과를 시뮬레이션 할 수 있도록 하였다. 즉 어떤 고정된 연결 강도와 외부 활성화를 변경하거나 그 반대로 시뮬레이션함으로써 위험요소 빈도의 변화와 비선형 패턴의 이력 을 알 수 있다. 그리고 모델에서는 가장 최근 1000회당 활성화된 각각의 위 험요소의 빈도를 표시하도록 하였다.

히스테리시스 효과분석을 위해서 먼저 특정 위험요소의 연결 강도를 선 택하며, 일정한 속도로 천천히 외부 충격의 강도를 증가시켜서 확인할 수 있다. 외부충격의 강도를 활성화시켜 어떤 수준에서 네트워크가 변화를 일

으키는지를 분석하였다. 역으로 같은 속도로 외부충격의 강도를 감소시킬 때 어떤 수준에서 네트워크가 전환되는지를 분석하였다. 다음의 경우는 여 러 가지 시나리오하에서 히스테리시스 효과분석결과이다.

(결과 1) : 위험요소간 연결의 강도를 변화시켰을 경우, 위험(재난)발생을 가정하는 위험임계값(cut-off:8)이상에서는 위험요소간 연결강도를 상승시켜 도 위험빈도수는 크게 변화하지 않았다. 역으로 위험임계값 이하에서의 연

(결과 1) : 위험요소간 연결의 강도를 변화시켰을 경우, 위험(재난)발생을 가정하는 위험임계값(cut-off:8)이상에서는 위험요소간 연결강도를 상승시켜 도 위험빈도수는 크게 변화하지 않았다. 역으로 위험임계값 이하에서의 연

관련 문서