• 검색 결과가 없습니다.

A comparison of TF and TF-IDF analysis for trends of blockchain in health and welfare

N/A
N/A
Protected

Academic year: 2021

Share "A comparison of TF and TF-IDF analysis for trends of blockchain in health and welfare"

Copied!
12
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

2019, 30

(

5)

,

1025–1036

블록체인 기술의 보건·복지 분야 활용 동향 파악을 위한 TF와 TF-IDF 비교 분석

ᅬ은아

1

·한예은

2

·이상인

3

·오미애

4

12충북대학교 통계학과 ·3충남대학교 정보통계학과 ·4한국보건사회연구원

ᄌ ᅥ

ᆸᄉ ᅮ 2019ᄂ ᅧ ᆫ 8ᄋ ᅯ ᆯ 17ᄋ ᅵ ᆯ, ᄉ ᅮᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 9ᄋ ᅯ ᆯ 12ᄋ ᅵ ᆯ, ᄀ ᅦᄌ ᅢ ᄒ ᅪ ᆨᄌ ᅥ ᆼ 2019ᄂ ᅧ ᆫ 9ᄋ ᅯ ᆯ 17ᄋ ᅵ ᆯ

요 약

ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫᄋ ᅳ ᆫ 4ᄎ ᅡ ᄉ ᅡ ᆫᄋ ᅥ ᆸᄒ ᅧ ᆨᄆ ᅧ ᆼ ᄉ ᅵᄃ ᅢᄋ ᅴ ᄌ ᅮᄋ ᅭ ᄉ ᅵ ᆫᄀ ᅵᄉ ᅮ ᆯ ᄌ ᅮ ᆼ ᄒ ᅡᄂ ᅡᄋ ᅵᄃ ᅡ. ᄇ ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫ ᄀ ᅵᄉ ᅮ ᆯᄋ ᅳ ᆫ ᄇ ᅵᄐ ᅳᄏ ᅩᄋ ᅵ ᆫᄀ ᅪ ᄒ ᅡ ᆷᄁ ᅦ ᄆ ᅡ ᆭ ᄋ

ᅵ ᄋ ᅡ ᆯᄅ ᅧᄌ ᅧ ᆻᄌ ᅵᄆ ᅡ ᆫ, ᄉ ᅵ ᆯᄌ ᅦᄅ ᅩ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅡ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄂ ᅳ ᆫ ᄇ ᅮ ᆫ ᄋ ᅣᄀ ᅡ ᄆ ᅡ ᆭᄃ ᅡ. ᄇ ᅩᄀ ᅥ ᆫᄇ ᅩ ᆨ ᄌ ᅵ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦᄉ ᅥᄃ ᅩ ᄇ ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫ ᄀ ᅵᄉ ᅮ ᆯᄋ ᅳ ᆯ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄒ ᅡᄋ ᅧ ᄌ ᅥ

ᆼᄎ ᅢ ᆨ ᄒ ᅭᄀ ᅪᄋ ᅴ ᄒ ᅭᄋ ᅲ ᆯᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄂ ᅩ ᇁᄋ ᅵ ᆯ ᄉ ᅮ ᄋ ᅵ ᆻᄃ ᅡᄂ ᅳ ᆫ ᄎ ᅳ ᆨᄆ ᅧ ᆫᄋ ᅦᄉ ᅥ ᄃ ᅡᄀ ᅡ ᆨᄃ ᅩᄅ ᅩ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄀ ᅡᄂ ᅳ ᆼᄉ ᅥ ᆼᄋ ᅳ ᆯ ᄆ ᅩᄉ ᅢ ᆨᄒ ᅡᄀ ᅩ ᄋ ᅵ ᆻᄃ ᅡ. ᄀ ᅩ ᆼᄀ ᅩ ᆼᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦ ᄒ ᅪ

ᆯᄋ ᅭ ᆼ ᄀ ᅡᄂ ᅳ ᆼᄉ ᅥ ᆼᄋ ᅵ ᄂ ᅩ ᇁᄋ ᅳ ᆫ ᄇ ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫ ᄀ ᅵᄉ ᅮ ᆯ ᄀ ᅪ ᄇ ᅩᄀ ᅥ ᆫᄇ ᅩ ᆨ ᄌ ᅵ ᄃ ᅡ ᆫᄋ ᅥᄅ ᅳ ᆯ ᄉ ᅩᄉ ᅧ ᆯ ᄇ ᅵ ᆨᄃ ᅦᄋ ᅵᄐ ᅥᄅ ᅩ ᄇ ᅮ ᆫᄉ ᅥ ᆨᄒ ᅡᄂ ᅳ ᆫ ᄀ ᅥ ᆺᄋ ᅳ ᆫ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄃ ᅩ ᆼ ᄒ ᅣ ᆼᄋ ᅳ ᆯ ᄑ ᅡ ᄋ

ᆨᄒ ᅡᄂ ᅳ ᆫ ᄃ ᅦᄋ ᅦ ᄋ ᅴᄆ ᅵ ᄋ ᅵ ᆻᄃ ᅡ. ᄇ ᅩ ᆫ ᄋ ᅧ ᆫᄀ ᅮᄋ ᅦᄉ ᅥᄂ ᅳ ᆫ ᄇ ᅩᄀ ᅥ ᆫ · ᄇ ᅩ ᆨ ᄌ ᅵ ᄇ ᅮ ᆫ ᄋ ᅣᄋ ᅦᄉ ᅥ ᄇ ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫ ᄀ ᅵᄉ ᅮ ᆯ ᄋ ᅵ ᄋ ᅥᄄ ᅥ ᇂᄀ ᅦ ᄋ ᅵᄉ ᅲᄒ ᅪᄃ ᅬᄀ ᅩ ᄋ ᅵ ᆻ ᄂ

ᅳ ᆫ ᄌ ᅵᄅ ᅳ ᆯ ᄋ ᅡ ᆯᄋ ᅡᄇ ᅩᄀ ᅵ ᄋ ᅱᄒ ᅢ ᄇ ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫ ᄃ ᅡ ᆫᄋ ᅥᄋ ᅪ ᄇ ᅩᄀ ᅥ ᆫ·ᄇ ᅩ ᆨ ᄌ ᅵ ᄃ ᅡ ᆫᄋ ᅥ ᄀ ᅪ ᆫᄅ ᅧ ᆫ ᄒ ᅡ ᆫᄀ ᅳ ᆯ ᄆ ᅮ ᆫ ᄉ ᅥᄅ ᅳ ᆯ ᄉ ᅮᄌ ᅵ ᆸᄒ ᅡᄀ ᅩ ᄉ ᅮᄌ ᅵ ᆸᄒ ᅡ ᆫ ᄌ ᅡᄅ ᅭᄅ ᅳ ᆯ ᄒ ᅪ ᆯ ᄋ

ᆼ ᄒ ᅡᄋ ᅧ ᄃ ᅡ ᆫᄋ ᅥ-ᄆ ᅮ ᆫ ᄉ ᅥ ᄒ ᅢ ᆼᄅ ᅧ ᆯᄋ ᅳ ᆯ ᄆ ᅡ ᆫᄃ ᅳ ᆯᄋ ᅥ ᆻᄃ ᅡ. ᄀ ᅳᄅ ᅵᄀ ᅩ, TF (Term frequency)ᄋ ᅪ TF-IDF (Term frequency - inverse document frequency) ᄀ ᅡ ᆹᄋ ᅳ ᆯ ᄀ ᅮᄒ ᅡᄋ ᅧ ᄀ ᅡ ᆨᄀ ᅡ ᆨ ᄉ ᅡ ᆼᄋ ᅱ 100ᄀ ᅢᄋ ᅴ ᄃ ᅡ ᆫᄋ ᅥᄅ ᅳ ᆯ ᄎ ᅮᄎ ᅮ ᆯ ᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ. ᄎ ᅮᄎ ᅮ ᆯᄃ ᅬ ᆫ ᄃ ᅡ ᆫᄋ ᅥᄅ ᅩ ᄃ

ᅢᄋ ᅳ ᆼᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄆ ᅵ ᆾ CONCOR (Converage of iterated correlation) ᄇ ᅮ ᆫᄉ ᅥ ᆨᄋ ᅳ ᆯ ᄐ ᅩ ᆼ ᄒ ᅢ ᄒ ᅧ ᆫᄌ ᅢ ᄇ ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫ ᄀ ᅵᄉ ᅮ ᆯ ᄋ ᅴ ᄇ ᅩ ᄀ

ᅥ ᆫ · ᄇ ᅩ ᆨ ᄌ ᅵ ᄇ ᅮ ᆫ ᄋ ᅣ ᄒ ᅪ ᆯᄋ ᅭ ᆼ ᄃ ᅩ ᆼ ᄒ ᅣ ᆼᄋ ᅳ ᆯ ᄑ ᅡᄋ ᅡ ᆨᄒ ᅡᄀ ᅩ TFᄋ ᅪ TF-IDFᄋ ᅴ ᄇ ᅮ ᆫᄉ ᅥ ᆨ ᄀ ᅧ ᆯᄀ ᅪᄅ ᅳ ᆯ ᄇ ᅵᄀ ᅭᄒ ᅡᄋ ᅧ ᆻᄃ ᅡ.

ᅮᄋ ᅭᄋ ᅭ ᆼ ᄋ ᅥ: ᄃ ᅢᄋ ᅳ ᆼᄇ ᅮ ᆫᄉ ᅥ ᆨ, ᄃ ᅩ ᆼ ᄒ ᅣ ᆼ, ᄇ ᅩᄀ ᅥ ᆫ, ᄇ ᅩ ᆨ ᄌ ᅵ, ᄇ ᅳ ᆯᄅ ᅩ ᆨ ᄎ ᅦᄋ ᅵ ᆫ, CONCOR ᄇ ᅮ ᆫᄉ ᅥ ᆨ.

1. 서론

4차 산업혁명은미래 시대를열어갈 최대 화두이다 (Jung과 Lim, 2017). 4차 산업혁명의 기반 기술 ᄋ

ᅴ 하나로 알려진 블록체인은 ‘공공 거래장부’ 또는 ‘분산 거래장부’로 표현할 수 있다. 블록에는 일정 ᄉ

ᅵ간 동안 확정된거래 내역이 담긴다. 이 블록은 네트워크에 있는 모든 참여자에게 전송된다. 그리고 ᄀ

ᅵ존 장부 (블록)에 블록이 연결되면서 체인이 형성되어 블록체인이 만들어진다. 이러한 기술을 이용 ᄒ

ᅡ면 중앙집중식으로관리하던 데이터를탈중앙식·분산식으로 바꾸면서 업무 효율화를기대할 수 있다 (Ministry of Science and ICT, 2018).

ᅥᆫ저 설명한 원리에 의해 블록체인 구조에서는네트워크에 참여하고 있는모든사람이 동일한 정보를 ᄀ

ᆼ유한다. 그로 인해 모든정보가 투명하게 공유된다는장점이 있다. 또한 데이터를한 개라도 변경하 ᄀ

ᅵ 위해서는네트워크에관계되어 있는모든컴퓨터를 동시에 해킹하기 때문에 기존의 중앙집중식 시스 테

ᆷ 보다 보안성이 높다 (Jin과 Go, 2018). 따라서 데이터를위조하거나 변조하는것이 어려워 데이터를 ᄋ

ᅡᆫ전하게관리할 수 있고, 권한을가진 사람만 데이터에 접근할 수 있도록설정하여 편리하게 데이터 공

1

(28644)ᄎ ᅮ ᆼᄎ ᅥ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄎ ᅥ ᆼᄌ ᅮᄉ ᅵ ᄉ ᅥᄋ ᅯ ᆫ ᄀ ᅮ ᄎ ᅮ ᆼ ᄃ ᅢᄅ ᅩ 1, ᄎ ᅮ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ ᄉ ᅥ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.

2

(28644)ᄎ ᅮ ᆼᄎ ᅥ ᆼᄇ ᅮ ᆨ ᄃ ᅩ ᄎ ᅥ ᆼᄌ ᅮᄉ ᅵ ᄉ ᅥᄋ ᅯ ᆫ ᄀ ᅮ ᄎ ᅮ ᆼ ᄃ ᅢᄅ ᅩ 1, ᄎ ᅮ ᆼᄇ ᅮ ᆨ ᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ ᄉ ᅥ ᆨᄉ ᅡᄀ ᅪᄌ ᅥ ᆼ.

3

(34134)ᄃ ᅢᄌ ᅥ ᆫᄀ ᅪ ᆼᄋ ᅧ ᆨᄉ ᅵ ᄋ ᅲᄉ ᅥ ᆼᄀ ᅮ ᄃ ᅢᄒ ᅡ ᆨᄅ ᅩ 99, ᄎ ᅮ ᆼ ᄂ ᅡ ᆷᄃ ᅢᄒ ᅡ ᆨᄀ ᅭ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄒ ᅡ ᆨᄀ ᅪ, ᄌ ᅩᄀ ᅭᄉ ᅮ.

4

ᄀ ᅭᄉ ᅵ ᆫᄌ ᅥᄌ ᅡ : (30147)ᄉ ᅦᄌ ᅩ ᆼᄐ ᅳ ᆨᄇ ᅧ ᆯᄌ ᅡᄎ ᅵᄉ ᅵ ᄉ ᅵᄎ ᅥ ᆼᄃ ᅢᄅ ᅩ 370 ᄉ ᅡᄒ ᅬᄌ ᅥ ᆼᄎ ᅢ ᆨᄃ ᅩ ᆼ, ᄒ ᅡ ᆫᄀ ᅮ ᆨ ᄇ ᅩᄀ ᅥ ᆫᄉ ᅡᄒ ᅬᄋ ᅧ ᆫᄀ ᅮᄋ ᅯ ᆫ ᄌ ᅥ ᆼᄇ ᅩᄐ ᅩ ᆼ ᄀ ᅨᄋ ᅧ ᆫᄀ ᅮᄉ ᅵ ᆯ ᄇ ᅵ

ᆨᄃ ᅦᄋ ᅵᄐ ᅥ·ᄌ ᅥ ᆼᄇ ᅩᄋ ᅧ ᆫᄀ ᅮᄉ ᅦ ᆫᄐ ᅥᄉ ᅦ ᆫᄐ ᅥᄌ ᅡ ᆼ. E-mail : miaeoh@kihasa.re.kr

(2)

ᅲ를 할 수 있다. 위와 같은장점들때문에 현재금융뿐만 아니라 비금융 분야인 의료, 콘텐츠, 헬스케 ᄋ

ᅥ, 에너지 등다양한 분야로도 빠르게확산하고 있는 중이다. 특히, 의료 데이터는환자의 진료기록과 ᄎ

ᅥ방전, 입원기록과 경과보고 등 환자의 프라이버시와 생명을좌우할 수 있는 정보이기 때문에 민감하 ᄀ

ᅦ 보호될필요가 있다. 그렇기 때문에 의료 데이터는 특성상 신뢰성과 보안성이 강하게 요구될수 있다 (Kim, 2017; Yu 등, 2018). 의료데이터의 정보화가 진행되면서환자의 개인정보를보호하는점이 중요 ᄒ

ᅡᆫ관심사 중하나가 되었다. 만약 의료데이터가 유출된다면 개인의 사생활과 보험가입, 직업을선택하 느

ᆫ경제활동에 직접적으로 피해를 줄수 있고 의료기관에 대한환자의 신뢰가 깨질 수 있는가능성이 있 ᄃ

ᅡ. 이러한 위험성은 블록체인 기술을적용할 경우환자의 개인정보를 변경하는것이 불가능하므로 의 ᄅ

ᅭ데이터를보다 안전하고 편리하게활용하여 체계적인관리를할 수 있을것으로 기대된다.

ᅳᆯ록체인 기술은 공공행정업무에도 활용될 수 있다. 보건복지 분야의 공공행정시스템인 사회보장정 ᄇ

ᅩ시스템은관리 정보를기반으로 민원대응, 업무처리 및 복지사업설계 등효율적 복지행정업무를수행 ᄒ

ᅡ고, 복지 대상자에서 꼭 필요한 복지서비스를맞춤형으로 제공할 수 있도록 지원하기 위한 시스템이 ᄃ

ᅡ. 복지 대상자에게 맞춤형으로 복지서비스를제공하기 위해 다양한 기관의 데이터 결합에 대한 문제 ᄀ

ᅡ 해결되어야 하고, 업무 담당자가 민원을현장에서 실시간으로 처리할 수 있도록 개선되어야 한다는 ᄀ

ᅪ제가 남아있다 (Choo와 Park, 2017). 이런 문제점을해결하기 위한 대안으로 블록체인을이용한 스 ᄆ

ᅡ트 계약이 떠오르고 있다. 블록체인을이용한 스마트 계약은계약 이행 및 검정의 과정이 네트워크로 ᄌ

ᅡ동화 되고, 계약실행 조건을확인하는사람의 간섭, 추가 비용없이 직접 처리하게 만든것이다. 이는 ᄇ

ᆨ잡한 사업상의 계약을적은비용과 합의에 따른 신뢰를바탕으로 안전하게 계약을 실행할 수 있게 한 ᄃ

ᅡ. 블록체인 기술을활용한다면 공공행정업무에 해당하는기록들이 분산장부 내의 스마트 계약을 통해 ᄌ

ᆨ시 자동업데이트되어 정보를 종합적으로관리하는것을기대할 수 있다.

ᅵ렇듯, 블록체인 기술은보건·복지 분야에서활용가능성이 높은 신기술이다. 이 연구에서는 4차 산 어

ᆸ혁명 시대의 신기술이라고 할 수 있는 블록체인과관련하여 보건복지 분야의 이슈를살펴보고자 하였 ᄃ

ᅡ. 보건·복지 분야에서 블록체인 기술이 어떻게활용되고 있는지 알아보기 위해 블록체인 단어와 보건 미

ᆾ 복지 단어와관련된 문서를함께 수집하였다. 발췌한 문서를 기반으로 단어-문서 행렬 (Document- term matrix)를생성하여 TF (Term frequency)값과 TF-IDF (Term frequency - inverse document frequency)값를도출하고, 이를 통해 의미 있는 단어들을추출하였다. 그리고 추출한 단어로 대응분석 미

ᆾ CONCOR (Converage of iterated correlation)을 실시하여 TF와 TF-IDF 결과를비교분석하였다.

2. 연구방법

2.1. 자료수집 및 전처리 테

ᆨ스트분석은다양한 분야에서활용되고 있다(Kang 등, 2015; Kim 등, 2014). 여기에서는 보건·복 ᄌ

ᅵ 분야에서 블록체인과관련된 문서를수집하기 위해 웹크롤링 방법을사용하였다. 여기서 선정한 자 ᄅ

ᅭ원은 네이버 카페, 블로그, 뉴스, 학술정보와 arxiv에서 검색된 논문의 초록, ITNews, RISS 홈페이 ᄌ

ᅵ다. 자료 수집 기간은 2015년 1월 1일부터 2018년 5월 31일이다. 검색 단어는 “블록체인”과 “의료”,

“보건”, “건강”, “헬스” 또는 “복지” 단어가 들어간 내용을발췌하였다. 그리고 정확성 높은 보건·복지 부

ᆫ야와관련된 문서만을얻기 위해 “비트코인”이라는단어가 들어간 문서는제외하였다. 최종적으로 수 지

ᆸ된 문서는 8360건이완료되었으며 이 문서를가지고 Document-Term Matrix를만들어 분석을시행 ᄒ

ᅡ였다 (수집된 문서는 “Oh 등 (2018), Social big data trend analysis based on health and welfare issues in 2018”보고서 작성을위해활용된자료임.).

ᅮ요 단어를추출할 때 TF의 결과와 TF-IDF의 결과가 다를수 있다. 이 논문에서는 TF와 TF-IDF 겨

ᆯ과를탐색적으로 비교분석하기 위해 TF값과 TF-IDF값이 높은 순으로 단어 100개를각각 추출하여

(3)

ᅢ응분석과 CONCOR분석을 실행하였다.

ᅢ응분석을 실시할 때 보건복지분야의 주요 단어라고 할 수 있는‘건강’과‘의료’,‘헬스’,‘복지’ 이외의 ᄃ

ᅡᆫ어가 들어간 문서들을각각 합하여 총 4개의 행을만들었다.

2.2. TF-IDF 테

ᆨ스트 분석에서 단어 빈도 (Term frequency)가 높을수록 중요성이 높다고 가정하면 TF로 단어를 ᄎ

ᅮ출하여 분석할 수 있다. 단어 자체가 해당 문서군내에서 자주 사용되는경우에는오히려 상투어로 전 ᄅ

ᆨ하는 경우가 많으므로 이를반영하기 위해 TF-IDF를사용한다 (Woo와 Chang, 2016). TF-IDF는 ᄆ

ᅮᆫ서 내에서 특정 단어의 중요도를나타내는지표 중하나이다. 이 값이 클수록그 단어가 해당 문서의 ᄌ

ᅮ제나 의미를담고 있을가능성이 높다. 따라서 TF-IDF의 값이 높은단어는 문서의 중요한 단어가될 ᄉ

ᅮ 있다. 그리고 이 지표는 문서들에서 자주 언급되는단어들을추출하고 분석하는데 유용하게 쓰일 수 이

ᆻ다. TF와 TF-IDF의 개념 설명은다음과 같다.

TF란 특정한 단어가 문서 내에서 얼마나 자주 등장하는지 나타내는값으로, 이 값이 높을수록 문서에 ᄉ

ᅥ 중요한 단어일 수 있다. TF를구하는 식은다음과 같다.

T Fi,j= ni,j

P

knk,j

, (2.1)

ᅧ기서 ni,j는 문서 dj에서 단어 ti가 나오는횟수이며, P nk,j는 문서 dj에서 나오는모든단어의횟수 ᄋ

ᅵ다.

DF (Document Frequency)란 자주 등장하는단어가 몇 개의 문서에 등장하는지를나타낸다. 지표 DF를 구하는 식은다음과 같으며, 여기서 |D|는 문서 집합의 전체 문서의 수를나타낸다. |dj ∈ D : ti∈ d|는단어 ti를포함하는 문서의 수를나타낸다.

DFi= |dj∈ D : ti∈ dj|

|D| . (2.2)

DF값이큰 단어는 해당 단어가 여러 문서에서 등장하므로 중요한 단어가 아니라는 것을 나타낸다.

ᅡ라서 DF의 역수이며 로그를취해준값인 IDF (Inverse Document Frequency)값을사용하여 단어의 주

ᆼ요도를계산한다. IDF의 값이큰단어는희귀한 단어라고 할 수 있으며, IDF는다음과 같이 구할 수 이

ᆻ다.

IDFi= |D|

|d ∈ D : ti∈ d|. (2.3) TF-IDF값은 TF와 IDF를 곱하여 구할 수 있으며 식은아래와 같다. TF-IDF의 값이큰단어는 문서 ᄂ

ᅢ에서 단어의 출현 빈도는 높지만 문서의 집합에서 단어가 출현하는 문서들의 수가 적은단어가 중요한 ᄃ

ᅡᆫ어로 평가된다 (Lee 등, 2018; Park과 Suh, 2015; Lim과 Lee, 2019).

T F − IDFi,j= T Fi,j× IDFi. (2.4) 2.3. 대응분석

ᅢ응분석 (Correspondence analysis)이란 빈도로 구성된범주형 자료의 행과 열의 범주를저차원의 ᄀ

ᆼ간에 나타내어 행과 열의 범주간의관계와 특징을구체적으로 파악하고 연관패턴을탐구하려는탐색 ᄌ

ᅥᆨ 자료분석기법이다 (Choi, 2001).

(4)

Table 2.1 Two-dimensional partition table col 1 col 2 · · · col J row 1 n

11

n

12

· · · n

1J

row 2 n

21

n

22

· · · n

2J

. .

. . . .

. . .

. . .

. . . row I n

I1

n

I2

· · · n

IJ

Table 2.1과 같은 I×J 이차원 분할표 형태로 주어진 자료행렬 N = nij을 살펴보면 관찰 개체는 I×J개의 칸 (cell)들 중하나에 속하며 이 때 nij는 번째 i행, j번째 열에 해당하는관찰개체의 빈도를 ᄋ

ᅴ미한다. 이로부터 정의된대응행렬은다음과 같다.

F = {fij}, n..=X

i

X

j

nij,

fij= nij

n..

, i = 1, · · · , I; j = 1, · · · , J.

(2.5)

ᅡ차원의 정보를차원 축소하기 위해, 대응 행렬의 행 프로파일의 중심 r = F 1I과 열 프로파일의 중 시

ᆷ c = F1J을고려한 ¯F = F − rc에 특이값 분해를적용하면 다음과 같다.

S = D

1 r 2F D¯

1

c 2S = U DλV. (2.6) ᄋ

ᅵ 때, Dr = diag(f1+, · · · , fI+)과 Dc = diag(f+1, · · · , f+J)는 I × I, J × J 대각행렬이다. U는 V는 각각 SS과 SS의 고유벡터로 이루어진 행렬이고 Dλ는 특이값들을 대각원소로 하는 행렬이다.

ᄐ ᅳ

ᆨ이값 분해를 통해 얻어진 내림차순된 Dλ의 대각원소들을기준으로 그 고유값이 큰것들을 순서대로 ᄉ

ᅥᆫ택해서 차원을 축소할 수 있다. 그리고 저차원 그래프의 행 좌표점은 D−1/2r U Dλ이고 열 좌표점은 Dc−1/2V Dα로 구할 수 있다.

ᅧ기서 각 점 사이의 거리를 측정하기 위한 거리측도로서 카이제곱 거리를이용한다. 카이제곱거리 느

ᆫ카이제곱 통계량의 제곱근과 같고 카이제곱 통계량은다음과 같이 구해질 수 있다.

χ2=X

i

X

j

(Oij− Eij)2 Eij

. (2.7)

ᅳ림에서 점들이 서로 가까운거리에 위치해 있다면 유사도가 높다고 할 수 있다. 따라서 행 간의 유 ᄉ

ᅡ도, 열 간의 유사도뿐만 아니라 행과 열 사이의 연관성 (association)까지 파악할 수 있다 (Na, 2017).

2.4. CONCOR

CONCOR 분석이란 전체 단어를 중심으로 유사점을가진 단어들의 군집을찾아내 단어 동시출현 노 ᄃ

ᅳ들간의 형성된 관계를파악 것으로 구조적 등위성을만족하는 분석 방법이다.

ᄃ ᅳ

ᆼ위성 (equivalence)은네트워크 내의 노드들이 서로 얼마나 유사한 형태의관계 패턴을맺고 있는지 르

ᆯ나타낸다. 구조적 등위성은다른노드들과 직접적인관계는없지만 동일한관계 패턴을갖는경우를 ᄆ

ᆯ하며 구조적 등위성을갖는 집단 내의 노드들은서로 대체할 수 있다는 특징을갖는다 (Kwak, 2014).

ᅮ조적 등위성 분석은노드 간의 상관관계를바탕으로 규모가큰네트워크를단순한 형태로 축약하여 ᄇ

ᅩ다 쉽게 파악하는것에 목적이 있다.

(5)

Table 2.2 Adjacency matrix x

11

x

12

· · · x

1g

x

21

x

22

· · · x

2g

. . .

. . .

. . .

. . . x

g1

x

g2

· · · x

gg

ᅮ조적 등위성 분석을위해서 인접행렬을 이용하는데 인접행렬은 노드 간의관계를표현하는 행렬로 지

ᆨ접적으로 연결관계를표현한다. 인접 행렬의 xij는노드 i에서 노드 j로 가는간선의 수를표시한 것 ᄋ

ᅵ다.

ᅮ조적 등위성을 측정하는방법으로는유클리디안 거리 (Euclidean distance)와 상관계수 (Correla- tion coefficient)를사용할 수 있다. 관계의 동일성 여부에관심이 있는경우 유클리디안 거리를사용하 ᄆ

ᅧ 유클리디안 거리를구하는 식은다음과 같다.

dij= v u u t

g

X

k=1

[(xik− xjk)2+ (xki− xkj)2], i ̸= k, j ̸= k. (2.8) g는노드의 수를의미하며, 노드 i와 노드 j가 외부 노드인 k에 대해완전하게 동일한관계 패턴을갖 느

ᆫ다면 유클리디안 거리의 값은 0으로 나타난다.

ᅡᆼ관계수 또한 구조적 등위성을 측정하기 위해 자주 사용되는방법이다. 노드 i와 노드 j간의 상관관 ᄀ

ᅨ를구할 때 피어슨상관계수를이용하여 계산한다. 피어슨상관계수를구하는 식은다음과 같으며, 구 ᄌ

ᅩ적으로완전히 동일한 패턴을갖는다면 1의 값을갖는다.

rij=

Pg

k=1(xki− ¯x·i)(xkj− ¯x·j) +Pg

k=1(xik− ¯xi·)(xjk− ¯xj·) q

Pg

k=1(xki− ¯x·i)2+Pg

k=1(xik− ¯xi·)2 q

Pg

k=1(xkj− ¯x·j)2+Pg

k=1(xjk− ¯xj·)2

, (2.9)

i ̸= k, j ̸= k.

ᅮ조적 등위성을시각적으로 보여주고 단어 간의 관계를 분석하는 방법으로 CONCOR 등이 대표적 ᄋ

ᅳ로 사용된다.

CONCOR방법은 인접 행렬로부터 각 행과 열에 대한 피어슨상관계수를구하여 행렬화하는 분석 방 버

ᆸ이다. 상관계수 행렬의 값들이 1또는 -1의 값으로 수렴을 할 때까지 반복하여 상관계수 행렬을구한 ᄃ

ᅡ. 마지막 반복후 얻은 행렬의 각 값은 1과 -1의 값을갖으며 최종적인 상관관계 행렬은 1과 -1의 값 으

ᆯ갖는 2개의 집단으로 분할되어 나타난다. 이러한 과정을다시 반복하여 두개의 집단으로 분할한 것 ᄋ

ᅳᆯ각각 다시 두 개의 집단으로 분할하여 원하는개수가 나올때까지 분할 할 수 있다. 그리고 이 때 같 ᄋ

ᆫ그룹으로 분류된노드들을구조적으로 등위관계를가진다고 한다 (Son, 2010).

3. 분석결과

3.1. 대응분석

TF값과 TF-IDF값으로 추출된단어에 대해 대응분석을각각 적용해보았다. Table 3.1은보건복지분 ᄋ

ᅣ의 주요 단어들을 행으로 하고 TF로 순위가 100위 안에 드는단어들을 열로 하는 문서-단어 행렬을 ᄆ

ᅡᆫ든것이다. 다음과 같은 문서-단어 행렬을가지고 대응분석을시행하였다.

(6)

Table 3.1 Document-term matrix ᄀ

ᅡᄂ ᅳ ᆼ ᄀ ᅢᄇ ᅡ ᆯ · · · ᄇ ᅡ ᆯᄑ ᅭ ᄀ

ᅥ ᆫᄀ ᅡ ᆼ·ᄋ ᅴᄅ ᅭ 2089 2892 · · · 1670 ᄒ ᅦ

ᆯᄉ ᅳ 887 1320 · · · 726

ᄇ ᅩ

ᆨ ᄌ ᅵ 599 1487 . .

. 452

ᅵᄐ ᅡ 615 892 · · · 489

Figure 3.1은 Table 3.1의 문서-단어 행렬을가지고 ‘건강·의료’, ‘헬스’, ‘복지’ 그리고 이외의 단어와 ᄋ

ᅧᆫ관성이 있는단어를알아보기 위해 대응분석을 실시한 결과이다. 이를보았을때 건강, 의료, 네트워 ᄏ

ᅳ, 시스템, 산업혁명, 플랫폼, 데이터 등의 단어가 건강과 의료에관련된단어로 나타났고 헬스케어, 빅 ᄃ

ᅦ이터, 전망, 대표, 분야, 계획,투자, 규모, 시장, 사업,확대 등의 단어들이 헬스와관련된단어로 나타 ᄂ

ᆻ다. 복지와관련된단어로는 운영, 기능, 지원,개발, 정보,관리, 정책, 프로젝트 들이 나타났고 건강·

ᅴ료, 헬스, 복지와관련이 없는단어로는연구, 이유, 결과, 이용,방법, 영향, 사용, 생각, 방식 등이 나 ᄐ

ᅡ났다. 이를요약해보면 건강·의료와관련 있는 문서에서는주로 블록체인 기반 플랫폼에 대한 내용임 ᄋ

ᅳᆯ알 수 있었고, 헬스와관련된 문서에서는헬스케어 분야의 빅데이터 사업 투자와관련된내용임을유 ᄎ

ᅮ해 볼수 있었다. 그리고 복지에서는 복지관련 정책들과 연관이 있다고 할 수 있고 그 외 문서들에서 느

ᆫ 블록체인과관련된 연구와관련이 있다고 할 수 있다.

sep2 sep1

sep3

sep4





























! "

$#

$" %

$&

(

)' +*

-

필요

.,

가치

연구 제공 데이터 개선

정부 정책

방법 활용 참여

기능

분석 사용 환경

도입 방식 분야

관리 운영

규모 발전 문제

이용 강화 과정 산업

수준

금융 변화 한국 성장 상황 시작

영향 전략 플랫폼

혁신 사람 프로젝트

기타

미국 설명

결과 세계

의료

중국 지역

추진 기업

사업 주요 핵심 목표 빅데이터 산업혁명 확대

회사

이유 건강

공감

대표 계획 최대 생각 예정 제품 투자대상

서울 지원

헬스케어

기준 발표

억원

/0 12 /0 13 0 10 0 13 0 12

/014 /015 0 10

D6 7 89:;< =>?

@ABCECFGHIJ

K LMN OPQ RS

Figure 3.1 Correspondence analysis of TF

Figure 3.2는 TF-IDF값이 큰단어 100개를 가지고 대응분석을시각적으로 표현한 것이다. Figure 3.2에서 건강·의료와관련된단어로는계획,시장, 발표, 제공, 필요, 예정, 국내, 적용,기술,추진, 변화 ᄃ

ᆼ이 있었는데 이를보았을때 건강은 국내의 블록체인 사용현황과관련이 있는것을알 수 있었다. 헬 ᄉ

ᅳ와 관련된단어는헬스케어, 빅데이터, 인공지능, 플랫폼, 산업혁신, 스마트, 공유, 분야 등이 있었는 ᄃ

ᅦ 이를요약해보면 헬스케어 분야에서의 빅데이터 및 인공지능 플랫폼이라고 할 수 있다. 그리고 복지 ᄋ

ᅪ 연관있는단어는사람들, 혜택, 채용, 복지, 연봉 등이 있었는데 이는회사에서 시행하는 복지와관련 되

ᆫ 것이라고 할 수 있다. 그 외의 단어들은결과, 이유, 연구, 이용,확인, 방식 등이 나타났는데 이 단어

(7)

ᄃ ᅳ

ᆯ은 블록체인관련 연구와 연관성이 있다고 볼수 있다.

sep1 sep2

sep3 sep4



















 











"

!

$#

$ %

$&

(

)'

+*

- 

필요

.,

공유 연구 제공 데이터 보안 정부

고객 방법 활용 참여 분석 기능 도입 사용 방식 분야 관리 운영

발전 문제 이용

산업 금융 변화 시작 플랫폼

혁신 사람 암호화폐 소개 프로젝트 기타 미국

설명 결과 수정

세계

의료 추진

사업 기업 스타트업

주요 빅데이터

산업혁명 인공지능

확대 확인 회사 이유 블록

건강

공감 대표

혜택 계획

생각 예정 투자 시대

서울 대상 네이버 지원 메디블록

헬스케어 의료정보

뉴스 발표

복지 사람들 채용

연봉

/0 12 0 10

0 1

Dim1 (68.6%)

Dim2 (22.1%)

CA - Biplot

Figure 3.2 Correspondence analysis of TF-IDF

3.2. CONCOR

CONCOR 분석은 대응분석과 마찬가지로 TF값과 TF-IDF값으로 추출된단어에 대해 각각 적용하 ᄋ

ᅧ 결과를살펴보았다.

Figure 3.3 CONCOR of frequency

Figure 3.3은 TF로 순위가 100위 안에 드는 단어들을 가지고 CONCOR분석을 실시한 결과이다.

CONCOR분석 결과 8개의 그룹으로 형성되었다. 첫 번째 그룹에서는의료, 기술, 시스템, 서비스, 관 ᄅ

ᅵ,활용,프로젝트, 플랫폼 등의 단어가 하나의 그룹을형성하고 있는것으로 나타났으며, 이를의료 분 ᄋ

ᅣ의 블록체인 기반 프로젝트 및 플랫폼과관련이 있는것으로 보았다. 두 번째 그룹에서는기타, 기능,

(8)

ᅥᆫ강, 사용,회사의 단어가 나타났고 이를회사에서 사용하는 블록체인이라고 명명하였다. 세 번째 그룹 ᄋ

ᆫ헬스케어, 산업혁명, 분야, 빅데이터, 혁신, 연구 등의 단어로 형성되었으며 이를헬스케어 분야와 빅 ᄃ

ᅦ이터와 연관이 있는단어들이라고 해석할 수 있다. 네 번째 그룹은이유, 상황, 내용의 단어들이 있는 거

ᆺ으로 보아 정부의 블록체인 기술사용현황과관련이 있다고 보았다. 다섯 번째 그룹은도입, 강화, 추 ᄌ

ᅵᆫ, 중심, 정부, 정책 등의 단어들을보았을때 정부의 블록체인관련 정책과관련이 있는그룹으로 보았 ᄃ

ᅡ. 여섯 번째 그룹은 필요, 변화, 관심, 시간, 이용, 방법 등의 단어들이 있는것으로 보아 블록체인의 피

ᆯ요성과 연관있는그룹으로 보았으며 일곱번째 그룹은성장, 글로벌, 미국, 중국, 전망, 투자, 시장, ᄉ

ᅡ업 참여 등의 단어들로 형성되어 세계의 블록체인 사업의 투자 현황과관련 있는그룹으로 보았다. 마 ᄌ

ᅵ막 그룹은결과, 영향, 기준, 수준 등의 단어들이 있는것으로 보아 블록체인의 평가와관련이 있는그 ᄅ

ᅮᆸ으로 형성된 것을알 수 있었다.

Figure 3.4 CONCOR of TF-IDF

Figure 3.4는 TF-IDF값이큰상위100개 단어를가지고 CONCOR분석을 한 결과이다. 8개의 그룹 ᄋ

ᆫ정부의 블록체인 기술사용현황, 건강·의료 분야에서 블록체인관련 프로젝트 및 플랫폼, 채용, 회사 ᄋ

ᅴ 복지, 헬스케어 분야의 빅데이터 사업 투자 그리고 기타 등으로 이루어졌다.

저

ᆼ부의 블록체인 기술사용현황에서는연구, 정부, 사용, 이용, 도입, 필요, 확인 등의 단어들이 나타 ᄂ

ᆻ고 건강·의료 분야에서 블록체인관련 프로젝트 및 플랫폼은건강, 플랫폼,메디블록, 프로젝트, 의료 저

ᆼ보, 의료, 네트워크, 시스템 등의 단어들로 형성되었다. 헬스케어 분야의 빅데이터 사업 투자 그룹에 ᄉ

ᅥ는 헬스케어, 빅데이터, 스타트업, 인공지능, 산업혁명, 사업, 금융, 투자 등의 단어들이 포함되었다.

ᅳ리고 회사의 복지에는 복지와 연봉이라는단어가 존재했고 기타 그룹 3개에는 블록,가능,기능,기타, ᄀ

ᆼ감, 수정의 단어들이 존재했다.

3.3. TF와 TF-IDF 비교분석 결과 요약

Tabe 3.2는 TF값 TF-IDF값에 따른대응분석결과를요약한 표이다.

TF값과 TF-IDF값에 따라 대응분석을 시행한 결과를차례대로 비교해보면 건강·의료분야에서는 유 ᄉ

ᅡ점이 보이지 않았는데 이는 TF로 건강의료분야에서 빈도수를 적용한 결과로 뽑혔던 단어들이 TF- IDF값을적용한 분석에서는 헬스 분야에 속한다는차이점으로 인한 것으로 볼 수 있다. 이를 통해 건 ᄀ

ᅡᆼ·의료는 헬스 분야와도 유사한 그룹으로 생각할 수 있다. 이에 대한 근거로는스마트 헬스케어를 들 ᄉ

ᅮ 있는데 스마트 헬스케어란 개인의 건강과 의료에 관한 정보, 시스템, 플랫폼을 다루는 산업분야로

(9)

Table 3.2 Summary of correspondence analysis

TF TF-IDF summary

fitness

· medical

Platform based on Blockchain used in fitness and medical

Status of Blockchain usage in Korea

health

Big data business investment in health

care field

Fitness, medical, health care and Big data and Artificial

Intelligence platform

Big data in health care field

welfare Welfare-realted policy

Welfare in the company

The welfare policies of the state and the company other Study on Blockchain Study on Blockchain Study on Blockchain

ᅥ 건강관련 서비스와 의료 IT가 융합된 분야로 건강·의료분야와 헬스분야가 같이 포함된다 (Choi와 Hwang, 2016).

ᅡ음으로 헬스분야에서는헬스케어 분야와 빅데이터라는유사점이 보였다. 이를 통해 헬스케어 분야 ᄋ

ᅦ서 빅데이터를활용하고 있다는것을알 수 있는데 빅데이터를잘활용하면 보건분야에서 사용하고 있 느

ᆫ막대한 비용절감 효과를기대해 볼수 있다. 그리고 스마트 의료기기를 통해 개인의 데이터를쌓아 비

ᆨ데이터를구축하면 해당환자의 빅데이터를 통해 맞춤형 헬스케어를 진행할 수 있어 서비스의 혁신을 ᄋ

ᅵ룰수 있다 (Ministry of Food and Drug Safety, 2018). 하지만 의료데이터는 특성상 민감하기 때문 ᄋ

ᅦ 높은수준의 보안성이 필요하다. 이를해결하기 위해 블록체인을적용한다면 개인정보 유출가능성 으

ᆯ낮출수 있고 데이터의 변조가 거의 불가능하기 때문에 의료정보를효과적으로관리할 수 있어 의료 ᄒ

ᅧᆨ신을기대해볼수 있다 (Han, 2018).

ᄇ ᅩ

ᆨ지분야에서는 TF값을적용하였을때는 복지관련 정책과관련된단어들이 나왔지만 TF-IDF값을 ᄌ

ᆨ용했을때는회사와관련된 복지들에 대한 단어들이 나타났다. 블록체인을적용한 복지관련 정책으로 ᄇ

ᅩ건복지부에서 복지급여 부정수급방지를위해 일부 업무에 블록체인 기술도입 방안을마련하고 있고 ᄌ

ᅡᆼ애인 복지관련 업무에도 부처 또는 공단에 중복되지 않도록사회보장정보시스템의 일부 업무에 블록 ᄎ

ᅦ인을이용하는방안을추진할 것을밝혔다.

ᅳ 외의 분야에서는 블록체인 관련 연구라는 공통점이 보였다. 이를 통해 다양한 분야에서 블록체인 ᄀ

ᅪ관련된 연구가 시행되고 있다는것을유추해 볼수 있다.

Table 3.3 Summary of CONCOR

TF TF-IDF summary

fitness

· medical

Blockchain based projects and platforms

in the medical

Projects and platforms related to fitness, medical and Blockchain

(Mediblock)

Blockchain based projects and platforms in the medical

health Healthcare and Big data

Big data business investment of health care field

Healthcare and Big data

welfare Welfare

in the company

other

Current status of Blockchain

technology

Status of government’s use of Blockchain technology

Current status of Blockchain

technology

(10)

Table 3.3 TF값과 TF-IDF값에 따른 CONCOR결과를 요약한 표이다. 건강·의료분야는 블록체인 과

ᆫ련 프로젝트 및 플랫폼과관련이 있는것을파악할 수 있다. 의료분야에서 블록체인 플랫폼의 대표적 ᄋ

ᅵᆫ 예로는 메디블록이 있다. 메디블록은환자 개인이 직접 여러 의료기관에 분산된자신의 의료정보를 ᄐ

ᆼ합, 관리 및 유통을할 수 있게 하는 블록체인 기술이다. 이러한 플랫폼은환자 자신이 정보의 주인이 ᄃ

ᅬ어 의료정보를안전하게 유통시키는 탈중앙화 시스템을구축하는프로젝트이다. 따라서 이를활용하 ᄆ

ᅧᆫ 의료정보 시스템에서 개인정보보호 문제를해결할 수 있다.

ᅮ 번째 그룹인 헬스분야에서는헬스케어와 빅데이터가관련이 있는것을 볼수 있는데 이는대응분석 겨

ᆯ과에서도 나타난 것으로 헬스케어 분야에서 빅데이터를많이 이용하고 있는것을알 수 있다. 그 예로 ᄀ

ᆨ가정보화전략위원회의 ‘빅데이터를활용한 스마트정부 구현’에서 과학기술·의료 선진화계획을발표한 거

ᆺ이나 삼성과 KT에서 차세대 성장 동력사업으로 헬스케어를선정하여 투자한 것을 들수 있다 (Shin, 2015).

ᄇ ᅩ

ᆨ지 분야의 경우, TF값으로 분석한 결과를보면 복지와관련된그룹이 나타나지 않은것을 볼수 있 ᄃ

ᅡ. 이는단순 빈도수로만 단어를추출했기 때문인 것으로 보인다. 따라서 이를보완한 TF-IDF에서는 ᄇ

ᆨ지와관련된그룹이 생성된 것을 볼수 있다. 하지만 TF-IDF는기타그룹이 많다는단점이 있다. 이 느

ᆫ 불용어 처리와 문서 길이에 따라 가중치를다르게 적용한다는 TF-IDF의 단점으로 생각될수 있어 ᄋ

ᅵ에 대해 더 생각해 볼 필요가 있는 문제로 보인다.

ᅡ지막으로 그 외의 분야에서는 블록체인과관련된 연구가 유사점으로 묶인 것을 볼수 있다.

4. 결론 ᄋ

ᅱ와 같이 자료들을 분석한 결과, 보건·복지분야에서 블록체인 단어와 헬스케어 이슈관련 단어가 연 과

ᆫ성이 가장 높았다. 그리고 건강·의료분야에서는 블록체인 기술이 개인정보 보안을강화하기 위한 플 래

ᆺ폼과 밀접한관련이 있었다.

TF를이용해서 나타난 분석결과와 TF-IDF를이용해서 나타난 분석결과의 가장 큰차이점은 ‘복지’

ᅪ관련된주요 단어가 다르게 나타났다는점이다. 이는자료수집기간 동안 ‘복지’분야의 블록체인 기술 ᄀ

ᅪ관련된 문서가 ‘보건’분야에 비해 상대적으로 문서의 수가 부족하기 때문에 나타난 결과로 해석에 한 ᄀ

ᅨ가 존재한다. 그럼에도 불구하고, 본 연구는 탐색적 자료분석 차원에서 블록체인과 보건·복지분야의 ᄃ

ᆼ향을 TF와 TF-IDF를각각 적용하여 대응분석 및 CONCOR분석을비교·분석하였다는데에 의미가 이

ᆻ다.

브

ᆯ록체인은다른 분야에 비해 공공 분야에서 실행 가능성과 영향력이 꽤큰편에 속한다. 이는과학기 ᄉ

ᅮᆯ정보통신부가 블록체인의 보안성, 투명성 측면에서 블록체인이 산업과 사회를 혁신하는기반 기술로 4차 산업혁명의 핵심 산업이될가능성이 충분하다고 판단한 것과관련이 있다.

ᅵ 연구의 한계점은과학기술정보통신부가 ‘블록체인 기술발전전략’을발표(2018. 6. 21.)하기 전에 무

ᆫ서를수집한 결과라는것이다. 정부의 블록체인과관련된 정책이 이슈화된 문서를수집하여 위의 분 ᄉ

ᆨ을 실시한다면 다른결과가 나올수 있다.

ᅳ럼에도 소셜 빅데이터 분석은보건복지 정책 영역에서 국가적·사회적으로관심이 있는이슈에의 현 ᄉ

ᅡᆼ황을파악하는데 중요한 경쟁력으로 작용할 수 있으며, 앞으로 정책관련 이슈를도출하고 연구 전략 으

ᆯ세우는데근거 자료로활용될수 있다. 다양한 소셜 빅데이터 분석 기술을바탕으로 주요 보건복지 저

ᆼ책에관한 사회적관심도, 영향력 등을 분석하고 그 변화 과정을살펴본다면 시의성 높은보건복지 정 채

ᆨ 연구의 기반을마련할 수 있을것이다.

(11)

References

Choi, Y. S. (2001). Understanding and application of correspondence analysis using SAS , Freedom Academy, Pa-ju.

Choi, Y. H. and Hwang, W. S. (2016). Socio-economic effects and policy implications of smart health care industry, Korea Instritute for Industrial Economics & Trade.

Choo, B. J. and Park, S. M. (2017). The social security information system: Current state and challenges ahead. Health and Welfare Policy Forum, 253, 74-87.

Han, H. W. (2018). Current status and policy proposal of blockchain technology in the medical sector , Korea Health Industry Development Institute.

Jin, J. H. and Go, G. J. (2018). The direction for the application of blockchain technology in the health and welfare sector. Health and Welfare Policy Forum, 258, 96-106.

Jung, B. H. and Lim, D. H. (2017). Comparison analysis of big data integration models. Jounal of the Korean data & Information Science Sosiety, 28, 755-768.

Kang, B., Huh, M. and Choi, S. (2015). Performance analysis of volleyball games using the social network and text mining techniques. Jounal of the Korean data & Information Science Sosiety, 26, 619-630.

Kim, B. D., Kim, H. J., Lee, S. W. and Lee, J. Y. (2014). Major gene identification for FASN gene in Korean cattles by data mining. Jounal of the Korean data & Information Science Sosiety, 25, 1385-1395.

Kim, D. (2017). On the application of authorized certificate for cryptology. Jounal of the Korean data &

Information Science Sosiety, 28, 163-171.

Kwak, K. Y. (2014). Social netwrok analysis, Cheongram, Seoul.

Lee, Y. S., They Pheaktra., Lee, J. H. and Gil, J. M. (2018). A study on research paper classification using keyword clustering. KIPS Transactions on Software and Data Engineering, 7, 477-484.

Lim, S. S. and Lee, M. G. (2019). A study on military organizational tasks analysis methodology. Jounal of the Korean Data & Information Science Sosiety, 30, 139-157.

Ministry of Food and Drug Safety (2018). Smart healthcare medical devices technical and standard strategy report , Osong.

Ministry of Science and ICT (2018). Blockchain technology development strategies, Gwacheon.

Na, J. H. (2017). R applied multivariate analysis, Freedom Academy, Pa-ju.

Oh, M. A., Song, G. W., Jeon, J. J. and Cheon, M. K. (2018). Social big data trend analysis based on health and welfare issues in 2018 , Korea Institute for Health and Social Affairs.

Park, J. Y. and Suh, C. W. (2015). Analysis of changes in the housing market using TF-IDF weight model.

Korea Real Estate Academy, 63, 46-58.

Shin, S. Y. (2015). Current trends and issues in health care big data. Korea Information Processing Society, 22, 22-27.

Son, D. W. (2010). Social network analysis, Kyungmoonsa, Seoul.

Woo, S. W. and Chang, Y. J. (2016). An analysis of FOMC statements by text mining methods. Journal of the Korean Data Analysis Society, 18, 179-188.

Yu, H. W., Lee, E. S., Kho, W. K., Han, H. S. and Han, H. W. (2018). Blockchain techonology for healthcare

big data sharing. The Korea Journal of Bigdata, 3, 73-82.

수치

Table 2.1 Two-dimensional partition table col 1 col 2 · · · col J row 1 n 11 n 12 · · · n 1J row 2 n 21 n 22 · · · n 2J
Table 2.2 Adjacency matrix x 11 x 12 · · · x 1g x 21 x 22 · · · x 2g . . . ... ... ..
Figure 3.1 Correspondence analysis of TF
Figure 3.2 Correspondence analysis of TF-IDF
+3

참조

관련 문서

A A A A Study Study Study Study Analysis Analysis Analysis Analysis of of of of the the the the J. Bach, a representative composer in Baroque period. Composed

In this study, the existing material of the air conditioner compressor and Al6061 material were applied through structural analysis and fluid-structure coupling analysis using

This paper also analyzed the current status of the competitive power of 10 major ports in China using efficiency and SWOT analysis and sought the

Objectives: The purpose of this study was to investigate the relationship between mental health and experience of falling in some local elderly people using the 2013

For the analysis of the contents of the 'Energy and Transport Technology' section, the analysis frame was divided into 3 categories, including the ratio of

The purpose of this study was to examine the effects of a swimming program for 12 weeks on health-related physical fitness and growth hormone in

Based on the findings of this study, it was considered that the senior welfare centers should manage and operate various health promotion programs to

The purpose of this study was to explore research trends in child assessment system, to examine problems that were arose in process of child assessment, and