• 검색 결과가 없습니다.

사회적 불안에 대한 온라인 빅데이터 분석

법으로 활용되었다. 질적 분석에서 우리 사회 구성원의 현재 불안 경험뿐 아니라 과거의 경험에 대해서도 질문한다. 그러나 회고에 의한 자료 수집 이 불안의 변화를 이해하는 데 한계를 가질 수 있으므로 온라인 빅데이터 로 사회적 불안의 변화와 현재를 파악하고자 하였다. 한편 질적 분석에서 불안의 경험과 연관된 사건이나 요인들을 분석하지만 온라인 빅데이터를 통하여 요인들의 관계에 대한 해석에 참고할 수 있는 연관어 관계를 파악 하고자 하였다. 온라인 빅데이터는 질적 분석의 한계를 일부 보완하면서 질적 분석 결과를 해석하는 데 도움을 주었다.

온라인 빅데이터 분석은 온라인의 주요 정보원을 대상으로 불안에 대 한 자료를 수집하고 이를 분석하는 방법이다. 얻어진 정보를 토대로 연관 어의 개념도를 구성하고 관련 요인을 파악하는 분석을 하였다. 대부분 기 술 분석과 관계 분석으로 결과를 얻었다.

연관어 분석이 가장 기본적인 분석 방법으로 활용되었다. 연관어 분석 은 사회적 불안과 연관하여 자주 온라인에서 언급되는 개념들을 파악, 그 변화를 살펴보는 것이다. 불안과 관련된 단어의 빈도(Term-Frequency) 를 파악한 후 주요 연관어를 중심으로 연관어를 활용한 네트워크 분석을

사회적 불안에 대한 온라인 빅데이터 분석 : 사회적 불안의 변화와 시사점

<<

4

실시하였다. 이러한 분석을 하자면 사회적 불안이라는 개념의 구성에 대

자료: 네이버 국어사전. https://ko.dict.naver.com/#/main에서 2019. 6. 5. 인출.

본 연구의 주된 연구 방법인 질적 연구에서는 사람들의 경험을 초점으 로 한다. 사람들의 정서에서 시작하여 경험을 이끌어 내는 과정을 고려하 여 온라인 빅데이터 분석에서도 온라인상의 개념들 중 관련 정서를 매개 로 연관어를 이끌어 내고자 하였다.

상기 개념들에 대하여 반복적으로 논의와 검토를 수행하여 사회적 불 안을 검색하는 주요 주제어를 설정하였다. 검색어 선정 과정을 간략하게 정리하면 관련 주제어를 여러 번 투입하여 분석을 실시한 후 최종 주제어 를 선정하는 방식을 전제로 우선 개인적 차원의 분노와 우울, 불안을 모 두 적용하여 실험적 분석을 한 후 사회와 불안을 공히 검색어로 입력하여 실험적 분석을 추가하였다. 이후 검색된 다양한 결과를 기초로 안정적인 결과라 판단된 사회와 불안, 그리고 개인적 차원의 스트레스와 불안을 불 안과 함께 주 검색어로 선정한 것이다.

온라인 빅데이터상 사회적 불안 대체어 성격의 검색어를 찾기 위하여 워드임베딩의 결과도 확인하였다. 워드임베딩은 특정 검색어를 중심으로 단어의 밀집을 나타내는 방법의 분석이라 할 수 있다. 제시된 개념들은 수집된 데이터에서 ‘불안’, ‘사회’, ‘스트레스’와 유사한 의미로 사용된 단 어 목록으로 이해하면 적절하다. 이 결과를 보면 앞서 선행연구에서 사회 적 불안과 함께 언급된 주요 개념들이 포함된 것을 알 수 있다.

<표 4-2> 불안 관련 개념들의 워드임베딩 분석 결과(2007년, 2015년, 2018년)

자료: 네이버. https://www.naver.com/; 다음. https://www.daum.net/.

2. 분석의 범위와 변화 비교

분석 자료 추출은 온라인 뉴스, 카페, 블로그를 정보 원천으로 하여 이 루어졌다. 뉴스는 언론사를 고르게 선택하는 것을 고려하였다. 뉴스와 달 리 블로그와 카페는 국민의 개인적 관리하의 온라인이어서 상대적으로 이용자 개인의 경험과 반응이 더 강하게 작용하였다. 뉴스 기사의 경우 네이버(www.naver.com)와 다음(www.daum.net)의 뉴스 탭을, 블로그 는 다음(www.daum.net)의 블로그 탭을, 카페는 다음(www.daum.net) 의 카페 탭을 정보원으로 하였다.

분석 기준 시점에 따른 변화를 파악하기에 적절한 세 개 시점을 선택하 였다. 불안 경험과 사회적 불안의 변화를 이해하기 위하여 비교 시점을 선택한 것으로 2007년, 2015년과 2018년을 기준 시점으로 설정하였다.

연도별 특성과 연도 간 변화를 분석하였다. 시점 선택에서 고려된 요소는

“첫째, 경제 불황 이전 시기를 포함한다. 둘째, 사회경제적 전환이라 판단 되는 급변 시기 전후를 비교할 수 있도록 한다. 셋째, 현 정부 출범 전후 를 가능한 선에서 고려한다. 넷째, 정보의 양이 일정 수준 이상으로 확보 되는 시점으로 한다”이다. 이러한 고려에서 세 개 시점은 첫째, 노무현 정 부 이후 2008~2009년 경제 불황 전을 대표하는 2007년, 둘째, 빈곤 불 평등 심화 전 시점인 2015년, 셋째, 현 정부 출범 이후인 2018년이다.

불안과 관련하여 수집된 데이터 건수는 2007년이 약 38만 건, 2015년 은 약 255만 건, 2018년은 약 496만 건으로, 총 789만 건이었다. 2007 년 자료는 2018년과 대비하여 매우 작은 규모이지만 2007년 이후에는 분석이 가능한 충분한 양의 정보가 있다고 판단하였다.

<표 4-3> 분석 대상 정보원과 시기별 정보 규모의 변화

네이버 뉴스 다음 뉴스 다음 블로그 다음 카페

2002 21,378 2,650 1,830 698,000

2003 36,854 8,020 5,460 664,000

2004 59,496 15,100 115,000 604,000

2005 53,535 19,800 184,000 514,000

2006 68,090 28,500 211,000 519,000

2007 87,237 33,000 264,000 524,000

2008 215,716 62,600 327,000 606,000

2009 139,208 53,100 336,000 642,000

2010 118,137 67,000 340,000 576,000

2011 255,539 130,000 351,000 525,000

2012 214,023 121,000 386,000 505,000

2013 225,817 133,000 475,000 434,000

2014 224,815 162,000 556,000 387,000

2015 285,336 223,000 691,000 350,000

2016 277,648 230,000 789,000 329,000

2017 507,777 223,000 822,000 307,000

2018 377,376 232,000 970,000 290,000

자료: 네이버. https://www.naver.com/; 다음. https://www.daum.net/.

3. 분석 결과의 제시와 한계

<참고> 온라인 빅데이터 분석 결과 제시의 순서

⧠ 연관어 분석 결과

○ 2007년(뉴스, 블로그‧카페) 연관어 분석 결과

○ 2015년(뉴스, 블로그‧카페) 연관어 분석 결과

○ 2018년(뉴스, 블로그‧카페) 연관어 분석 결과

○ (뉴스, 블로그‧카페) 연관어 변화 분석 결과

⧠ 연관어 네트워크 분석 결과

○ 2007년(뉴스, 블로그‧카페) 연관어 네트워크 분석 결과

○ 2015년(뉴스, 블로그‧카페) 연관어 네트워크 분석 결과

○ 2018년(뉴스, 블로그‧카페) 연관어 네트워크 분석 결과

○ (뉴스, 블로그‧카페) 연관어 네트워크 변화 분석 결과

온라인 빅데이터는 매우 방대한 정보를 기초로 사회적 불안과 관련된 사회적 이슈와 반응을 살펴볼 기회를 제공하며 변화를 파악할 수 있는 방 법이라는 점에서 상대적 강점을 가진다. 반면 온라인 빅데이터 분석은 아 래와 같은 한계를 가진다. 이러한 한계는 본 연구에서 주요 분석 방법으 로 선택한 질적 분석의 유용성을 뒷받침하는 것이기도 하다.

한계 중 첫 번째는 주요 연관어 분석과 딥러닝 모델을 활용하면서도 투 입하는 주요 개념이 사전적으로 설정되므로 연관어 검색이 개방적으로 이루어진다고 보기 어렵다. 한편 검색하는 범위에서 연관어를 추출하는 것도 검색 엔진의 주제어들이 중심이 되는 경향이 있어 연관어가 개방적 으로 검색되는 것은 아니다. 이 결과 사회적 불안의 요소를 발견하는 데 있어 새로운 탐색과는 거리가 있다. 오히려 연관어 변화, 연관어를 매개 로 고려하는 단서 등을 발견하는 데서 중요한 기여가 있을 것으로 기대 한다.