A Keyword Network Analysis on Health Disparity in Korea:
Focusing on News and its application to Physical Education
1)
Woo-Kyung Kim*
Abstract
This study aimed to analyze the keyword related to Health Disparity in Korea through the method of keyword network analysis and to establish a basic database for suggesting ideas for prospective studies in physical education. To achieve the goal, this study crawled co-occured keyword with
‘health’ and ‘disparity’ from news casted in 20 different channels. The duration of the news was 3 months, from September 11th, 2018 to December 11th. The results are as follows. First, among the news during recent 3 months, there were 1,383 keyword related to health disparity and this study selected 173 keyword which had co-occured over 3 times. Second, the inclusiveness of the network was 97.674% and the density was .038. Third, analyzing news related to health disparity, ‘mortality’
was the most co-occured keyword and ‘disparity’, ‘reinforcement’, ‘the most’, ‘health’, ‘6 times’,
‘Seoul’, ‘half’, ‘medicine’, and ‘local’ were shown similarly. And common keyword in 4 centrality were 13 keyword. Lastly, by analyzing eigenvector centrality, significantly different result has shown.
‘Disparity’ was the most co-occured keyword. Based on this result, this study showed the necessity for reinforcing the public physical education in public education system in Korea. In order to achieve it, the field of physical education must look beyond present elite-focused physical education to public physical activity.
▸Keyword: Health, Disparity, Keyword Analysis, News, Physical Education
I. Introduction
인간이 건강하게 자신의 삶을 영위한다는 것은 매우 중요한 일이지만, 동시에 지키기 어려운 것 중 하나이기도 하다. 기초적인 위생 규칙을 지키지 못해 많은 사람들이 죽어가는 상황을 극복하 기 위해, 전 세계가 하나가 되어 인간이 건강하게 살 수 있는 세상 을 구축하기 위한 노력을 위해 WHO가 설립된 것이 1948년이므 로, 인간 건강의 유지가 정부 그리고 세계적인 통제를 받을 수 있게 된 것 역시 그리 오래된 일이라고 하기는 어렵다. 이러한 인식을 반영하듯 Sen과 같은 보건학자들은 인간의 건강을 “인간 삶의 가장 중요한 조건 가운데 하나이며 인간능력의 핵심적인 구 성요소”[1]로 정의하고 인간의 건강이 인권의 차원에서 가장 기 초적이고 필수적인 요소라는 점을 강조한다. 이렇듯 건강은 인간 의 가장 기초적인 상태를 지향하는 욕구이며, 기본적인 권리라고
할 수 있다. 인간이 소유하고자 하는 물질적인 것에 대한 욕심과는 달리, ‘건강이 좋지 않다’는 표현에 담긴 의미는 그 사람의 생명을 유지하기 위한 조건과 관련되어 있기 때문에 적극적으로 보호받 아야 하는 권리라고 할 수 있다[2].
그러나 현실적으로 개인의 건강이 동등한 수준으로 유지되 는 것은 아니다. 오히려 개인의 건강 상태는 인구의 숫자만큼이 나 다양하다. 이러한 차이는 성별에 따른 차이일 수도 있고, 연 령이 증가함에 따른 자연스러운 차이일 수도 있다. 하지만 사회 경제적 지위 역시 건강에 영향을 미치는 한 요인이 될 수 있다 [3]. 현대의 국가들은 대부분 자본주의 경제체제를 도입하고 있기 때문에, 경제체제 내에서 구성원 간의 불가피한 격차는 있 을 수밖에 없고[4, 5], 이러한 경제적 격차가 건강상의 격차에
∙First Author: Woo-Kyung Kim, Corresponding Author: Woo-Kyung Kim
*Woo-Kyung Kim (wkkim@anyang.ac.kr), College of Liberal Art, AnYang University
∙Received: 2019. 01. 07, Revised: 2019. 02. 15, Accepted: 2019. 03. 04.
까지 이르러 사회적인 문제가 될 수 있다는 점이 몇몇 학자들 에 의해 연구된 바 있다[6, 7]. 따라서 현대 사회에서 건강 격 차를 줄이는 문제는 단순히 한 국가 내의 문제라기보다는 전 세계적인 문제라고 할 수 있다.
물론 과학기술의 발전과 더불어 현대인의 건강수준은 비약 적으로 향상되었다고 할 수 있다[8]. 그러나 여전히 잔존하는 경제적 격차 등으로 인해 실질적인 건강격차는 계속해서 보고 되고 있고[9], 이는 대한민국의 경우도 마찬가지이다. 최근의 지역 건강불평등 현황을 분석한 연구에 따르면 기대수명과 건 강수명, 소득 5분위 간 기대수명 및 건강수명 격차가 전국 252 개 시·군·구별로 큰 차이를 보이는 것으로 나타났다[10]. 이 연 구는 통계청 자료를 활용하여 지역별 연령표준화 사망률을 비 교하고 있는데, 수도권과 그 외의 지역의 사망률 격차가 여전히 줄어들지 않고 있고, 사망수준이 높은 지역과 낮은 지역이 뚜렷 하게 구분되는 현상이 나타났다는 연구와도 같은 맥락의 결과 를 보여주고 있다[11]. 이러한 연구들을 토대로 판단할 때, 그 동안 우리 사회가 많은 발전을 거듭해 왔음에도, 여전히 사람들 의 유전적인 개인차, 혹은 사회경제적 격차로 인한 건강 격차를 해결하지 못하고 있다는 사실을 알려주고 있다. 결국 이러한 건 강 격차는 사회, 경제, 제도 등의 구조적 요소들로 인해 개인, 집단, 지역 간의 건강에 차이가 발생하는 것을 말한다[12]. 따 라서 이러한 차이를 줄이기 위한 다양한 방면의 연구 및 정책 개발이 요구된다.
하지만 많은 논문들이 보건 및 사회복지 정책차원에서만 이 주제를 다루고 있을 뿐, 건강격차 문제는 지금까지 체육계에서 관심을 받지 못하였다. 오로지 신자유주의와 학교체육정책의 연관성을 논한 연구[13] 에서 신자유주의가 가지고 있는 몇몇 특성이 체육수업에 영향을 미쳐 건강격차를 발생시킬 수 있다 는 결과를 찾을 수 있을 뿐이었다. 그럼에도 해당 연구는 체육 학이 건강격차를 줄이는 데 중요한 역할을 수행할 수 있다는 단서를 제공해 준다. 건강격차 자체는 유전적인 요인 및 사회경 제적 요인을 통해 발생할 수 있으나, 정규 교육과정 내의 체육 수업을 통해 이러한 건강격차를 줄이는 데 공헌할 수 있다는 점이다. 결국 이러한 논리는 현재의 엘리트 체육 중심으로 투자 하고 있는 체육정책을 넘어, 생활체육을 대중화하는 것이 국민 의 건강격차를 줄이는 데도 기여할 수 있다는 점이다.
앞서 언급한 바와 같이 건강 격차를 다루는 체육학 연구가 거의 없는 실정에서, 사람들이 건강 격차에 대해서 어떤 의견을 가지고 있는지, 건강 격차는 어떤 키워드들과 함께 등장하는지 를 분석하는 것은 체육학 연구자들에게 새로운 연구 방향을 제 시해 줄 수 있을 것이다. 이에 본 연구에서는 국내 뉴스 속 건 강 격차가 어떤 관련 속에서 논의되고 있으며 어떤 키워드들이 중심성을 가지고 있는지에 대한 경향 분석을 통해 현대인들이 건강 격차를 해소하기 위한 기초자료를 제공하고자 한다.
Ⅱ. Materials and Method
1. Research Procedure
본 연구는 건강격차에 대한 국내 뉴스를 분석함으로써 체육 계가 건강격차 해소에 기여할 수 있는 연구를 수행하기 위한 기초자료를 구축하고자 하는 시도이다. 건강격차를 다루는 뉴 스들의 동향을 파악하기 위하여 키워드를 중심으로 구조화된 형태의 정보를 추출하여 건강격차와 관련된 주제들의 패턴과 의미체계를 드러내고자 하였다. 이를 위해 다음과 같은 연구문 제를 설정하였다.
첫째, 건강격차와 관련된 뉴스기사들은 어떠한 키워드의 노 출빈도가 높은가?
둘째, 추출된 키워드들 간에 어떠한 관계가 있는가?
상기의 목적을 달성하기 위해서 국내에서 많이 활용되는 텍 스톰을 활용하여, 20개 뉴스채널을 대상으로 텍스트를 수집하 고, 키워드를 정제 및 분석/시각화하여 연구를 수행하였다.
첫째, 20개의 뉴스채널을 활용하여 키워드를 수집(crawling) 하였고, 검색 대상은 내용전체(타이틀+바디)가 아닌 타이틀을 기준으로 하였다.
둘째, 수집된 데이터는 비정형데이터이기 때문에 이를 분석 에 적합한 데이터로 변환하기 위한 정제 과정을 수행하였다.
셋째, 정제 과정을 거친 키워드들을 matrix 방식으로 조합하 여 원모드 데이터(one-mode data)로 변환하였다.
넷째, 키워드들의 빈도분석 및 네트워크 분석을 실시하였다.
네트워크 분석은 Netminer 4.0를 활용하여 키워드 간에 발생 하는 중심성을 다양한 각도로 분석하였다.
2. Materials and samples
본 연구는 키워드 네트워크 분석을 적용하여 국내 뉴스에서 건강격차가 어떤 주제들과 관련하여 논의되고 있으며, 어떠한 키워드들의 중심성을 가지고 있는지에 대한 언론의 경향을 탐 색하려는 목적을 갖는다. 이를 위해 본 연구는 연구의 대상과 자료수집 방식은 다음과 같이 설정하였다..
첫째, 텍스톰에서 제공하고 있는 뉴스채널을 대상으로 키워 드를 추출하였다. 해당 프로그램에서 제공하고 있는 뉴스채널 은 KBS, MBC, SBS, YTN, 조선일보, 중앙일보, 동아일보, 한 겨레, 경향신문, 한국일보, 서울신문, 연합뉴스, NEWS1, NEWSIS, oh my News, 노컷뉴스, 매일경제, 한국경제, 전자신 문, ZDNet Korea 총 20개 채널이다.
둘째, 상기의 20개의 뉴스채널에서 키워드를 크롤링 (crawling)하였다. 키워드는 ‘건강격차’ 키워드와 공출현하는 키워드를 중심으로 하였고, 검색시점은 텍스톰에서 크롤링을 지원하는 최대 기간 즉, 3개월(2018년 9월 11일부터 12월 11 일까지)로 설정하였다.
셋째, 연구에 적합하지 않은 키워드를 삭제하고, 유사 키워
드를 통합하는 과정을 거쳤다. 명사를 제외한 조사 등은 삭제하
였고, 의미가 중첩되거나 유사한 키워드를 통합하였다.
넷째, 이렇게 정제한 키워드는 원 모드 데이터(one-mode data) 중 매트릭스(matrix)로 변환하였다.
3. Method
건강격차와 관련된 키워드 간 네트워크를 분석하기 위하여 NetMiner 4.0을 활용하였다. 키워드 네트워크 분석은 키워드 사이 의 관계를 분석하는 데 있어, 전체 네트워크 전체의 특성 및 개별 키워드들의 특성을 객관적으로 보여주는 분석방법이다[9]. 키워드 네트워크 분석의 항목은 결속(연결정도: degree, 밀도: density, 포괄성: inclusiveness, 연결강도: strength, 연결지속기간:
duration), 중심성(centrality), 등위성(equivalence), 구조적 공백 (structural hole) 등 다양하다[10]. 본 연구에서는 키워드의 밀도 와 중심성(연결, 근접, 매개, 위세)을 분석하였다.
밀도(density) 항목은 네트워크 내에서 키워드들이 연결된 정도, 다시 말해 네트워크에 포함된 키워드들이 모인 정도를 의미한다 [14]. 네트워크 내에 속한 키워드들이 상호 관계가 많을 때 밀도가 높다고 볼 수 있다. 네트워크 내의 키워드 밀도가 높으면 정보의 흐름이 빈번하게 발생한다는 것을 의미한다. 따라서 네트워크의 구조적 특성에서 밀도가 보여주는 것은 네트워크가 얼마나 완벽하 게 구축되어 있는지의 여부이다. 이러한 개념은 네트워크 소시오그 램 상에서 점들 간 라인(line)의 많고 적음으로 나타난다. 밀도는 네트워크 안에서 키워드들 사이의 가능한 모든 관계들 중, 실제로 연결되는 관계의 비율을 말하고, 0과 1사이의 값으로 이를 표현한 다. 0은 아무런 관계가 없다는 것이고, 1은 모든 키워드들과 관계를 갖고 있음을 나타낸다.
중심성(centrality)은 한 키워드가 전체 네트워크에서 중심에 위치하는 정도를 나타내는 지표이다. 이를 통해 어떤 노드(Node), 즉 어떤 키워드가 네트워크 내에서 가장 중요한 키워드인지 찾아내 고, 해당 네트워크 구조가 어떤 노드에 집중되어 있는지의 정도를 파악할 수 있는 개념이다[15]. 이러한 중심성은 연결정도중심성, 근접중심성, 매개중심성, 위세중심성으로 구분된다. 먼저 연결정도 중심성(degree centrality)은 다른 키워드와 연결된 정도가 네트워 크 내 중심에 얼마나 가까운지 파악하는 개념이다. 이는 한 키워드가 중심에 위치하는 정도를 계량화하는 것이다. 즉, 연결된 키워드가 많고 적음의 여부가 기준이 된다. 근접중심성(closeness centrality)은 한 키워드가 다른 키워드에 어느 정도 가깝게 있는지 를 말하는 개념이다. 근접중심성이 높다는 것은 네트워크 내에서 다른 키워드들보다 빠른 경로를 통하여 전체 네트워크 내에 내재된 정보를 확보하거나 정보에 접근하기 쉽다는 것이다. 매개중심성 (betweenness centrality)은 하나의 키워드가 최단거리 내에서 다른 키워드들을 매개하는 역할을 하고 있는 정도를 말한다[16].
이는 한 키워드가 네트워크 내에서 매개자역할을 어느 정도 수행하 는지를 측정하는 개념이다. 이 키워드는 전체 네트워크의 정보흐름 에 있어서 중요한 매개역할을 하기 때문에 매개중심성을 측정하는 것은 네트워크의 구조적 특성을 파악하는 데 매우 유리하다. 하나의 키워드가 다른 키워드들과 연계되는 빈도값이 1에 가까울수록 중심성이 높은 키워드이며, 이 키워드는 전체 네트워크에서 그만큼
영향력을 많이 행사하게 된다. 마지막으로 아이겐벡터 중심성 (Eigenvector centrality)은 하나의 노드에서 키워드가 다른 키워 드들과 많이 연결되어 있을수록 높아지는 중심성을 말한다. 이것은 아이겐벡터 중심성이 높은 노드로부터 어떤 변화가 발생할 때, 그곳에서 발생하는 파급효과가 크다는 것을 의미한다.[17]
본 연구에서는 키워드 간의 동시출현(co-occurrence) 빈도 를 근거로 삼아 키워드×키워드(1 mode) 매트릭스 데이터를 구 축하여 네트워크 분석을 실시하였다.
Ⅲ. Results
1. Result of the keyword analysis
20개의 뉴스채널에서 2018년 9월 11일부터 12월 11일까지 검색된 건강격차 키워드를 분석하였다. 수집 데이터인 비정형데이 터를 분석용 데이터로 활용하기 위하여 텍스트 정제 과정을 수행했 다. 이 과정에서 명사를 제외한 조사 등은 삭제하였고, 유사단어의 경우 데이터 정제를 통해 정리하였다. 이러한 데이터 정제를 통해 1,383개의 키워드를 도출하였다. 1,383개 키워드 중에서 10회 이상 공출현 하는 키워드는 7개(건강, 사망률, 격차, 한국, 삶, 개최, 6배)이었고, 9회 출현 키워드는 3개(불평등, 수준, 내년), 8회 출현 은 5개(강화, 환자, 종합, 1위, 비정규직), 3회 이상 7회 이하 키워드 는 164개로 확인되었다. 본 연구에서는 3회 이상 공출현 하는 키워드 173개를 분석 키워드로 설정하였다.
가장 높은 공출현 빈도를 보이는 키워드는 ‘건강’(14회)으로 분석되었고, ‘사망률’, ‘격차’, ‘한국’이 13회로 두 번째로 높은 빈도를 보였다. 세 번째로 높은 빈도를 보인 키워드는 ‘삶’(11 회)이었고, ‘개최’, ‘6배’(10회)의 순으로 분석되었다. 다음은 6 회 이상 출현한 키워드를 그림으로 나타낸 것이다<Fig. 1>.
13 14 13 13 10 11
9 10 9 9 8 8 8 8 7 8 7 7 7 7 7 7 7 7 7 7 6 7 6 6 6 6 6 6 6 6 6 6 6 6 6
0 2 4 6 8 10 12 14 16
건강 사망률격차한국개최6배삶 불평등수준내년강화환자종합1위 비정규직정규직 OECD최대국회필요 취약계층예산안절반여성미래의료서울 지역격차관련높다크다 해소AI 일본아동 창립정부 시정연구원복지경제이유