2020년 한 해는 국내외 모든 이슈가 COVID-19로 집중되었다. 2장, 3장 에서 보건, 복지, 사회보장 키워드로 수집된 문서(2020.1.1.-2020.11.31.) 들을 분석해본 결과, 전체 기간 동안 코로나, 확진, 지역, 환자, 바이러스, 지원, 감염, 신종, 검사, 정부, 서울, 방역, 보건, 발생, 마스크, 중국, 사 회, 격리, 병원, 확산 키워드 순으로 코로나 관련 이슈가 상위 키워드를 차지하였다. 연구진에서 선정한 주요 키워드인 ‘코로나’는 2월에 가장 높 은 빈도를 보였으며, ‘마스크’ 키워드는 2, 3월에 최대치로 나타났다. ‘백 신’ 관련해서는 ‘접종’ 키워드와 더불어 10월에 가장 높은 빈도를 나타냈 고, ‘예방’ 키워드는 2월에 가장 높은 빈도를 나타내다가 10월에 다시 증 가하였다. ‘지원금’, ‘지급’, ‘재난’ 모두 공통적으로 4월에 높은 편이며,

‘지원금’은 9월에 한 번 더 증가한 것으로 나타났다. 상반기에 집중된 키 워드는 ‘발병, 체온, 유증, 소독제, 본부장, 감시, 전염병, 증상’ 등이 있 고, 하반기에 집중된 키워드는 ‘내년, 대선, 결합, 백신’ 등의 키워드이다.

3장 클러스터링 분석 결과 각 월별 클러스터 명칭은 코로나 관련 국내외 정세, 코로나 확진 관련 조치, 코로나 지원 대책, 코로나 환자 확진에서 크게 벗어나지 않았다. 이는 코로나 19 관련 이슈가 각 월별로 차이가 없 음을 의미한다.

4장에서는 비정형 형태의 자료의 활용성을 기계학습과 딥러닝의 여러 모형 등을 살펴봄으로써 활용성을 확장하기 위한 방안을 모색해보았다.

최근 딥러닝 방법은 임베딩에 기반하여 다양한 측도를 융합하여 활용하

는 방법으로 발전되고 있다. 이러한 방법들 중 가장 성공적인 사례는 적

