• 검색 결과가 없습니다.

The Study on the Meaning Change of 'Startup' and 'Entrepreneurship' using the Bigdata-based Corpus Network Analysis

N/A
N/A
Protected

Academic year: 2021

Share "The Study on the Meaning Change of 'Startup' and 'Entrepreneurship' using the Bigdata-based Corpus Network Analysis"

Copied!
19
0
0

로드 중.... (전체 텍스트 보기)

전체 글

(1)

Ⅰ. 서론

1)

한국은 왜 수백 년 동안 장수하는 기업이 많이 없

* 이 논문은 2017년 대한민국 교육부와 한국연구재단의 지원 을 받아 수행된 연구임 (NRF-2017S1A5B5A07064049)

** 경상대학교 경영대학 경영정보학과 강사

*** 경남과학기술대학교 창업대학원 교수(교신저자)

을까? 현재 기업의 수명이 점점 짧아진다고 하는데 어떤 문제점이 있는 것일까? 한국의 경우 가장 오래 된 기업은 부채꼴 활명수를 생산하는 동화약품(주)이 . 1897년에 설립하여 지금까지 최장수 상품을 보유 한 한국 최고의 브랜드이다. 좋은 약을 만들어 국민 에게 봉사한다는 창업정신과 정도(正道)를 중시하는

빅데이터 기반 어휘연결망분석을 활용한 ‘창업’과 ‘기업가정신’의 의미변화연구

*

김 연 종**·박 상 혁**

The Study on the Meaning Change of ‘Startup’ and ‘Entrepreneurship’

using the Bigdata-based Corpus Network Analysis

Kim Yeonjong·Park Sanghyeok

<Abstract>

The purpose of this study is to extract keywords for 'startup' and 'entrepreneurship' from Naver news articles in Korea since 1990 and Google news articles in foreign countries, and to understand the changes in the meaning of entrepreneurship and entrepreneurship in each era It is aimed at doing.

In summary, first, in terms of the frequency of keywords, venture sprouting is a sample of the entrepreneurial spirit of the government-led and entrepreneurs' chairman, and various technology investments and investments in corporate establishment have been made. It can be seen that training for the development of items and items was carried out, and in the case of the venture re-emergence period, it can be seen that the youth-oriented entrepreneurship and innovation through the development of various educational programs were emphasized.

Second, in the result of vocabulary network analysis, the network connection and centrality of keywords in the leap period tended to be stronger than in the germination period, but the re-leap period tended to return to the level of germination.

Third, in topic analysis, it can be seen that Naver keyword topics are mostly business-related content related to support, policy, and education, whereas topics through Google News consist of major keywords that are more specifically applicable to practical work.

Key Words : Startup, Entrepreneurship, Corpus Network Analysis, Topic Analysis

(2)

경영원칙아래 역사에 비해 매출이 작지만 규모보다 가치 실현에 비중을 둔 한국형 장수기업의 대표적인 사례이다[1].

미국의 경우 3M과 듀퐁 등이 100년 넘은 대표적인 장수기업이다. 듀퐁은 나일론, 3M은 포스트잇으로 유 명한 기업으로 지금도 빠르게 성장하고 있고 미래에 도 지속적으로 성장할 것으로 예상한다. 3M은 핵심 비즈니스에 집중, 유망 시장으로 신속한 진입, M&A 를 통한 시장과 역량의 한계극복, 글로벌 사업의 성 과 향상, 지속적인 고성장 등을 비즈니스 미션으로 여긴다. R&D를 통한 사업화가속, M&A를 통한 성장 기회 포착, 협력을 통한 역량 극대화를 기반으로 성 장을 도모하며 지속적으로 변화를 추구하여 현재는 헬스케어, 디스플레이 소재사업으로 사업방향을 탈바 꿈했다. 또한 듀퐁사는 나일론을 세계 최초로 선보였 지만 2003년부터는 미래성장사업으로 성정된 디스플 레이, 전자재료, 농화학 사업에 역량을 집중하고 새로 운 성장의 중심축으로 여기고 있다[1].

장수하는 기업들의 공통점은 경영진의 정확한 판 단력과 의사결정력을 기반으로, 지속적으로 회사의 핵심 사업영역을 변화하였다는 것이다. 따라서 장수 기업들은 제품혁신 뿐만 아니라 프로세스혁신이 계 속 추진하며, 이에 따라 조직 구성원들의 의식변화를 추구했다. 이런 변화의 중심축에는 환경 변화를 인지 하고 대응방안을 수립하며 실행전략을 추진하는 최 고경영자가 존재한다. 하지만 환경의 불확실성이 높 은 현재의 시점에서는 최고경영자가 올바른 상황파 악과 실행전략을 추진하는 것은 어려워 몰락하는 기 업이 속출하고 있다. 이에 따라 최고경영자가 사업을 대하는 생각과 태도도 변화하고 있다.

따라서 본 연구는 기업가들이 기업가정신과 창업 에 관련된 인식변화가 시대가 흐름에 따라 어떻게 변 화하고 있는지 알아보고자 한다. 이를 검증하기 위해 기업가들의 흔적들이 기록되어 있는 뉴스 기사를 분 석하고자 한다. 뉴스 기사를 분석하면 기업가들이 얼

마나 많은 변화를 추구해왔음을 추적할 수 있을 것이 . 이에 본 연구자는 한국의 1990년 이후의 네이버 뉴스 기사와 외국의 구글 뉴스 기사를 통하여 ‘창업 (startup)’과 ‘기업가정신(entrepreneurship)’의 키워드 를 통해 추출된 기사의 내용 속 어휘들의 연결망을 분석하였다. 이들 어휘간의 관계를 통해 각 시대별로 기업가 정신과 창업에 대한 의미의 변화를 파악함으 로써 최고 경영자의 기업가 정신의 변화에 적응해가 는 과정을 조사하고자 한다.

Ⅱ. 이론적 배경

2.1 창업 환경 변화

현재 한국의 창업시장 환경은 활력이 떨어지고 창 업을 해도 오래 버티지 못한다. 신생기업의 90%이상 이 고용주만 있는 1인 기업이며, 10인 이상의 기업은 1% 초반대에 불과한 생계형 자영업 창업이 대부분이 . 반면 일자리 창출효과가 큰 부가가치 산업의 창 업이나 주력 제조업업의 신규창업도 상대적으로 저 조한 실정이다[2].

2011년에는 창업자의 평균 58.6%가 창업 5년 미만 에 폐업하였고, 2017년 53.1%, 2018년 28.5%에 불과 하여 OECD 평균 41.7%에도 못 미치는 수준이다[3].

업종별 폐업율도 차이가 많이 난다. 2018년 기준 전체 신설 법인수 대비 업종별 비중은 도소매업이 22.5%, 제조업이 18.5%이지만, 5년차 폐업률이 가장 높은 곳 은 숙박음식업, 예술스포츠, 여가서비스업(헬스장, 실 내경기장) 등이 80%이며, 청소, 경호, 여행사 등은 75.6%, 도소매업은 74.6%, 교육서비스업은 73.4%이 [4].

창업은 신규일자리 증대와 신산업 발전 측면에서 매우 중요하지만 현재 한국의 창업은 그 역할을 제대 로 하지 못하고 있다. 창의성과 연구개발이 실현되는

(3)

지식산업의 창업 비중은 15%에 불과하고 제조업 창 업은 50%가 저기술 분야에 집중되어 있다. 한국과 중 국의 산업의 변화에서 중국이 한국의 고기술분야에 는 아직도 한국을 따라오지 못하는 현실인데 한국의 창업시장에서는 고기술의 창업보다는 저기술 창업에 집중되어 있다. 지식산업 및 고기술분야의 창업 활성 화를 위해서는 창업펀드 조성, 지식자산 평가시스템 구축, 산․학․연 연계 창업 네트워크형성, 창업 코디네 이터(coordinator) 활성화 등의 지원정책도 요구된다.

또한 지식이전(knowledge transfer) 규모도 주요 선진 국에 비해 떨어지고 금융시장에서 조달되는 창업자 금 규모도 작아서 혁신적인 창업기업 육성에 장애요 인이 되고 있다.

4차 산업혁명이 대두되는 현재 기업 환경은 매우 변 동성이 높고, 불확실하고, 애매모호하며, 복잡하다. 기 업의 입장에서는 전략적 제휴, 벤치마킹, 원가우위 또 는 차별화 우위전략 선택, 다각화 등의 선택은 과거보 다 더 어려운 의사결정이 되었다. 새로운 기회창출이 , 적절하게 대응하지 못하는 경우는 몰락을 하거나 지속적인 침체현상에 직면하기 때문이다. 이렇듯 기업 환경은 복잡계에 해당하기 때문에 시장의 변화와 미래 를 이해한다는 것은 어려운 숙제이다[5]. 미래 세상은 고객이 직접 요구하는 것을 넘어 ‘원할 것 같은 것’을 미리 예측해 제공하고 그들도 인식하지 못하는 숨겨진 욕망을 추적해 제품이나 서비스를 제공하는 시대가 되 고 있다.

이런 측면에서 경영자들은 혁신의 가속도와 파괴 속도를 이해하고 예측하기 어렵다고 인식한다. 4차 산업혁명은 모든 산업에 엄청난 변화를 주고 있다. 클라우스 슈밥에 의하면, 4차 산업혁명은 비즈니스영 역에 있어서 소비자 욕구, 제품 개선, 협력적 혁신, 조 직형태 등에 급격한 변화를 가져다 줄 것으로 예측했 . 따라서 기업가는 변화하는 기업 환경을 이해하고, 새로운 기회에 도전하며, 지속적인 혁신을 추진할 필 요가 있다[6, 7]. 기업가는 변화된 경영환경에 적응하

기 위해 전략가가 되어야 하고, 전략을 수립할 때는 과거와는 다른 방식으로 접근해야한다. 이러한 전략 적인 역량은 4차 산업혁명의 환경에서는 보다 더 필 요한 현실이다. 변화가 심한 창업 환경 변화에 보다 신속하게 전략적으로 대응해야 하기 때문이다.

2.2 기업가정신 개념 변화

기업가정신은 창업분야 연구자들의 핵심 키워드로 중소기업과 기업가정신과의 관계연구가 주를 이룬다. 기업가정신 연구의 짧은 역사로 독립적인 연구로 자 리잡지 못하고 통일된 세부분류체계도 갖추지 못한 실정이다[8].

Low & MacMillan의 프로세스와 환경 관점을 바 탕으로 연구한 Ucbasaran et al.(2001)의 연구에서는 1) 기업가 정신 이론 2) 기업가의 유형 3) 기업가적 프로세스 4) 조직유형 5) 외부환경 6) 성과 등의 6가지 로 기업가정신 연구 분야를 제시하였다[9]. Campos et al.연구를 근거로 해서 진행된 김영환과 양태용 연 구에서는 기업가정신 관련 연구 주제를 크게 16가지 기준으로 세분화한 개념프레임워크를 <그림 1>과 같이 제시하였다[10, 11]. 이는 기업 내부환경과 외부환경, 사회적 환경 및 다양한 조직에서 발현되는 기업가정신 의 개념을 표현한 것이다.

<그림 1> 김영환, 양태용 연구의 기업가연구 개념프레임워크

(4)

Busenitz et al.의 연구에서는 기업가정신을 <그림 2>와 같이 A) 개인 및 팀, B) 기회, C) 조직화, D) 환경 차원과 이들의 중첩된 영역(E, F, G, H)으로 구분하여 제시하였다. 1999년 이전에 비해 2000년 이후에는 기 업가 개인의 측면보다는 기회의 포착에 더욱 비중을 주며 이를 비즈니스 모델로 발전시켜 창업으로 조직화 하는 과정으로 관심이 옮겨지는 것으로 나타났다[12].

중소기업 연구가 본격적으로 시작된 1970년대 전 후에는 벤처기업, 창업의 개념을 포함한 기업가정신 연구가 많이 나타났으며, 이에 따라 중소․벤처기업 경 , 창업 및 기업가정신에 초점을 맞춘 학술지들도 등장하게 되었다. 이 학술지에서는 기업가정신 특징 을 요약하면 <표 1>과 같다.

향후 기업가정신 연구는 주제 세분화가 심화될 것 으로 인식되며, 기업가의 윤리성, 사회적 자본과 네트 워킹 활동, 기업성과, 생태계적 관점에서 창업 준비- 창업단계-성장단계-회수 및 재도전(실패) 단계의 프로 세스를 분류하여 각 단계별 기업가정신의 발현, 교육, 자금, 규제, 지원정책 등의 다양한 환경적 요소, 조직 내부, 외부조직과의 관계에서 발생하는 갈등조절을 위한 기업가 정신의 측면, 고령화를 통한 고령 창업 자의 기업가정신, 농업기반의 다양한 창업에 대한 기 업가정신 등 다각적인 면을 고려된 기업가 정신이 요 구된다.

이전의 연구들에서 국내외 기업가 정신의 비교 및 사회적 기업가 정신 뿐만 아니라 사회적 자본이나 특

<그림 2> 기업가정신 개념 도메인

<표 1> 기업가정신 국제학술지의 특징

JBV ETP JSBM ERD SBE ISBJ

핵심 연구 분야

• 자금조달

• 기업가정신 일반

• 기업가적 전략

• 다양한 기업가

• 다양한 기업가

• 기업가정신 일반

• 경영이슈

• 기업가정신 연구

• 다양한 기업가

• 기업가적 전략

• 경영이슈

• 자금조달

• 창업환경

• 기업가 네트워크

• 다양한 기업가

• 공공정책

• 창업환경

• 자금조달

• 공공정책

• 기술경영과 혁신

• 다양한 기업가

• 경영이슈

• 기업가적 전략

• 창업환경

핵심 세부주제

• 벤처캐피탈

• 가족기업

• 벤처기업 성과

• 가족기업

• 연구동향

• 벤처캐피탈

• 전략, 계획

• 가족기업

• 자금조달

• 기업가 네트워크

• 클러스터

• 지역 관련 이슈

• 자금조달

• 벤처기업 성과

• 경제관련 이슈

• 기업가 네트워크

• 공공정책

• 전략, 계획

주요특징

• 기업가정신 관련

• 광범위한 주제

• 기업가정신에 대 한 이해

• 벤처캐피탈에 초

• 기업전략같은 미 시적 접근

• 가족기업에 대한 특별호

• 이론지향적, 학문

• 기업가정신 연구 경향 강조

• 기업가적 지향성 관련 연구

• 중소기업 관련 연 구에 초점

• 기업전략 분야 강

• 다양한 기업가 유 행연구

• 벤처기업 신용관 련 연구

• 창업 환경 관련 연구에 집중

• 기업가 네트워크 연구에 초점

• 클러스터와 지역 관련 이슈

• 소수 인종 기업가 연구

• 창업환경 관련 연 구에 집중

• 기업가의 경제발 전 역할 강조

• 기업가정신 정책 적용 가능성

• 연구개발 및 혁신 관련 이슈

• 다양한 연구 주제 포괄

• 미국과 유렵의 중 간형태

• 기업가정신 정책 적용 가능성

• 기술 관련 이슈에 관심

특징 키워드

• 벤처캐피탈

• 사모펀드

• 대학 기업가정신

• 기회평가

• 동시인용 연구

• 벤처기업 신용

• 수출

• 기업가정신 센터

• 벤처 컨설팅

• 공공 기업가정신

• 기술 센터

• 비즈니스 그룹

• 산업조직

• 사회적 자본

• 환경경영

JBV: Journal of Business Venturing, ETP: Entrepreneurship Theory and Practice, JSBM: Journal of Small Business Management, ERD: Entrepreneurship and Regional Development, SBE: Small Business Economics, ISBJ: International Small Business Journal

(5)

정 업종의 상위인증제도, 경영성과 및 에 따라서 다 른 유형의 기업가 정신이 필요함을 제시하였다 [13-16].

창업가들이 사업에 성공하기 위해서는 투철한 기 업가정신을 갖추고, 위험을 무릅쓰고 포착한 기회를 사업화하려는 시도를 지속적으로 추진한다. 이를 위 해 시장흐름에 대한 올바른 판단력과 논리적 분석력 을 기반으로 하는 의사결정을 필요로 한다. 시대의 흐름에 따라 창업자에게 요구되는 자질과 역량은 상 이하다. 지난 2~30년간 기업환경은 큰 변화가 있었기 때문이다. 이런 측면에서 시대마다 기업가정신과 창 업에 필요한 필요요소도 함께 변하였다. 이러한 변화 에 대응하는 방법으로 보다 세밀하고 분석적인 적용 가능한 기업가 정신의 교육이 필요하다. 이를 위해 기업이 창업할 수 있는 환경의 불확실성을 견뎌낼 수 있는 기업가 정신의 다양한 키워드 들을 현실에 맞게 또 미래지향적으로 찾아내고 그것을 바탕으로 창업 의 기회를 높이도록 해야 할 것이다.

2.3 어휘연결망 분석

어휘연결망 분석(corpus network analysis)은 단어 와 단어 간의 관계를 측정하고 수량화하여 핵심어의 의미를 파악하는 연구방법으로 사회연결망 분석 (social network analysis)을 변형해 사용한다. 사회연 결망 분석은 사회 시스템 구조에서 행위자 사이의 관 계를 중시하는 반면, 어휘연결망 분석에서는 행위자 대신 메시지의 구성요소인 단어들의 구조적 관계를 통해 의미를 분석한다[17-19].

전통적인 내용분석 방법은 노동집약적이고 연구자 의 주관적 해석을 배제할 수 없는 반면, 어휘연결망 분석은 컴퓨터 기반 메시지 분석 기법이라고 볼 수 있다[20, 21]. 나아가 개별 단어의 고정된 속성이나 개 념이 아니라 상호 작용하는 관계의 맥락 속에서 역동 적인 의미를 포착할 수 있는 장점이 있다[22].

어휘연결망 분석은 개별 단어의 조합에만 주목하 는 것이 아니라 전체 연결망 안에 어느 ‘위치’에 자리 하고 있는지, 어떠한 ‘구조’를 형성하고 있는지에 주 목함으로써 메시지 안에 숨어 있는 커뮤니케이션 송 신자의 의도를 계량화하고 구조적인 패턴을 추출할 수 있다[18, 22, 23]. 따라서 이 방법은 텍스트에 등장 하는 주요단어의 사용빈도, 주요단어(node) 사이의 연결(link) 상태, 그리고 네트워크의 연결구조 (structure)를 통해 텍스트에 담긴 의도적인 의미의 흐름을 파악하는데 유용한 방법론으로 활용되고 있 .

어휘연결망 분석은 세 가지 연구접근이 있다. 첫 , 어떤 사건이나 대상의 성격은 그 자체에 본질적 으로 내재된 것이 아니라 연결망 전체 구조 내 위치 로 결정된다는 사회연결망 연구접근이다. 둘째, 특정 단어의 빈도수 증감과 인접 단어와의 상호관계 고찰 을 통하여 그 단어의 의미구조와 변화를 추적하는 어 휘통계학적 연구접근이다, 셋째, 단어와 단어의 관련 성을 통계적 기법으로 구체화하여 연결망 연구에 경 험적 수단을 부여한 국어 정보학 연구접근이다[24].

인류가 언어가 생긴 이후 축적된 모든 텍스트를 빅데 이터로 변환이 가능하다면 어휘연결망 분석의 대상 이 된다. 이를 이용하면 인문학과 사회과학 영역에 새로운 연구도구로 각광받을 것이다.

구글의 엔그램(ngram) 서비스를 통하여 인류가 축 적한 기록물에 대한 단어 빈도분석을 이용해 새로운 관점의 인문학 또는 사회과학 연구가 가능해졌다. 인 문학적 관점으로 보는 빅데이터의 모습은 역사의 변 화를 수량화한다는 측면에서 새로운 종류의 관찰도구 와 컬처로믹스(culturemixs)로 불리는 언어와 문화, 역사에 대한 매력적인 연구 접근법이 생겨났다 [25-27].

하지만 빅데이터로 적절한 키워드를 추출하였다 할지라도 그 시대의 상황이나 숨어있는 의미를 찾아 내기는 매우 힘들다. 추출한 어휘들 간의 상관관계를

(6)

확인할 수 있으나 인과관계를 예측하기 힘들기 때문 이다. 하지만 지속적인 어휘 사용빈도변화의 추이를 확인함으로써 각 키워드간의 관련성을 추정하여 인 과관계를 예측하는 도구로도 활용할 수 있다.

Ⅲ. 연구방법

3.1 연구방법

‘창업’과 ‘기업가정신’ 키워드로 검색된 기사나 게 시물을 대상으로 어휘연결망 분석 결과를 통해 창업 가의 기업가 정신의 주요 변인을 추출하고, 추출된 어휘들을 중심으로 기업가 정신과 연결된 핵심요인 들을 파악하고자 한다. 연구 내용과 방법 및 범위는 다음과 같다.

네이버는 1920년대부터 현재까지 디지털화된 동아 일보, 경향신문, 매일경제신문, 한겨레신문의 기사서 비스 제공한다. 이를 중심으로 국어 정보화 사업으로 추진된 데이터베이스인 ‘21세기 세종기획’의 형태소 분석을 중심으로 코퍼스(corpus)를 이용한 어휘연결 망 분석을 실시한다. ‘21세기 세종기획’은 1989년부터

2004년까지 7년 동안 구축된 원시 말뭉치, 형태분석 말뭉치, 형태의미분석 말뭉치, 구분분석 말뭉치를 중심 으로 분석에 활용한다[28]. 이를 통해 년도별 ‘창업’과

‘기업가 정신’에 대한 어휘변화를 분류하여 두 키워드 의 의미변화의 흐름을 파악하고자 한다.

이 방법과 국외 신문기사에서 나타나는 ‘창업 (startup)’과 ‘기업가정신(Entrepreneurship)’ 관련 영 어 키워드를 중심으로 추출된 모든 기사를 대상으로 코퍼스 분석과 동일한 방법으로 분석한다. 특히 국외 기사는 구글 뉴스를 중심으로 자료를 수집하며, 모든 키워드는 영어로 분류한다. 외국어가 여러 종류이기 에 본 연구에서는 미국영어, 영국영어를 대표적 코퍼 스인 Brown Family의 4개의 코퍼스인 Brown, Frown, LOB, FLOB 코퍼스를 통하여 분석 적용하고 자 한다.

<표 2>와 같이 벤처기업을 세대별로 분류하고, 이 에 해당하는 ‘창업’과 ‘기업가정신’의 어휘의 변화를 국내․외 코퍼스 분석을 중심으로 상호보완적으로 적 용하여 구성한다. 이를 통해 창업과 기업가정신의 어 휘를 어휘연결망분석을 통해 의미변화를 예측하고 그 결과를 토대로 시각화하고자 한다.

<표 2> 벤처 창업가의 세대별 구분과 특징

시대특징 1983년~1997년 1998년~2008년 2008년 이후

벤처 발아기 벤처 도약 및 쇠퇴기 벤처 재도약기

창업가적 특질 몰입, 혁신성, 위험감수성, 도전정신 도전정신, 시장기회 인지능력, 창의력 시장기회 활용능력, 도전정신, 글로벌 마인드, 창의력

대표기업 메디슨, 휴맥스, 비트컴퓨터, 터보테크, 안랩, 한컴 등

다음, 네이버, 새롬기술, 넥슨, NC소프트, 컴투스 등

우아한 형제들, 엔써즈, 올라웍스, 비키, 선데이토즈 등

기회포착 정책 활용을 통한 기회 선점 국내 시장 지향적 기회 포착 글로벌 시장 지향적 기회 포착

혁신의 성격 신제품 혁신(수입대체형) 신사업 혁신(인터넷 혁명 대응형) 비즈니스 모델 혁신/시장혁신

창업 촉발요인 기존기업의 문화에 대한 반항/부적응 강요된 독립심/자신의 아이디어 검증을 통한 독립 욕구

사회 현상에 따른 내몰린 독립심/아이디어 검증을 통한 독립

요구 기술도입전략 기술제휴/Reverse Engineering 해외 유명 기술 탐색/

라이센싱을 통한 Fast Follower 자체개발/공동 특허 사용

(7)

3.2 자료처리방법

모든 분석은 R 프로그램을 이용하여 어휘연결망 분 석과 데이터 마이닝의 분류분석을 실시하고, Gephi를 통해 시각화한다. 어휘연결망 분석에서 각 어휘의 출 현빈도를 측정하고 다양한 변화영향요인에 맞게 코딩 하는 작업하여 비정형데이터의 자료를 계량화한다. 이 를 통해 어휘연결망의 구조와 연결강도를 파악하기 위 하여 프리만의 연결정도 중심성(degree centrality)과 매개중심성(betweenness centrality)을 산출한다[29].

연구의 모집단은 1990년대부터 현재까지 디지털화된 모든 신문기사를 전수조사한다. 이 중 해당 키워드가 있는 기사를 네이버뉴스와 구글뉴스에서 표본으로 추 출하여 기초자료로 선정한다. 본 연구는 분석도구로 TEXTOM, R, Gephi 등을 사용하여 토픽모델링을 실 시하였다[30, 31].

Ⅳ. 연구결과

4.1 구글 트렌드로 확인한 키워드 검색빈도 변화

구글 트렌드(https://trends.google.co.kr/)를 이

용하여 2004년부터 현재까지 ‘창업’과 ‘기업가정신’라 는 한글 키워드와 ‘startup’와 ‘entrepreneurship’라 는 영어 키워드로 조회한 결과, <표 3>과 같이 창업은 10,818개, 기업가정신은 5,415개, startup은 24,805 , entrepreneurship은 121,979개가 검색되었다.

창업과 기업가정신은 대한민국 내에서 검색한 빈 도이며, startup과 entrepreneurship은 전세계의 검색 빈도를 나타낸다.

<표 3>와 같이 창업은 이미지 > 뉴스 > 유튜브 검색 이 많은 반면 기업가정신은 이미지 > 웹 > 유튜브 검 색의 순으로 많았다. startup은 네가지 영역이 거의 비슷한 수준인데 비해 Entrepreneurship은 웹검색이 88.1%수준이며 그 외 이미지, 뉴스, 유튜브 검색은 그 비율이 낮았다2=73162.328, df=9, p=.000).

<표 3> 구글 트랜드를 통한 검색빈도

Web Image News Youtube

창업1) 993

(9.2) 3,962

(36.6) 3,045

(28.1) 2,818 (26.0) 기업가정신1) 1,595

(29.5) 2,500 (46.2) 345

(6.4) 975 (18.0) startup2) 5,967

(24.1) 6,934

(28.0) 5,171

(20.8) 6,733 (27.1) entrepreneurship2) 107,466

(88.1) 6,992

(5.7) 4,974

(4.1) 2,547 (2.1)

<표 4> 년도별 구글트렌드 키워드 검색변화

(8)

<표 4>와 같이 각 년도별 검색빈도는 창업과 기업가 정신은 뉴스에 대해서는 차이가 없었으나 그 외 모든 매체에 따라서는 검색빈도가 차이가 많으며 <표 4>와 같이 한국내의 검색보다는 세계의 검색에서는 그 검색 빈도가 점진적으로 늘어나는 것을 알 수 있다. 마지막 2020년에 다운된 경우는 6개월에 대한 데이터가 포함 된 이유이다.

따라서 국내의 경우는 창업이나 기업가 정신에 대 해서는 그 용어가 이슈화 되는 경우에만 증가하는 패 턴이지만 전 세계적으로 지속적으로 관심을 가지는 주 요 키워드임을 알 수 있다.

4.2 연구표본의 구성

네이버 뉴스와 구글 뉴스에서 창업과 기업가정신 관련 키워드의 검색한 결과, 1990년 1월 1일부터 부 2020년 6월 30일 까지 기사건수는 <표 5>와 같다.

각 기사는 본문과 타이틀을 중심으로 크롤링하였다.

<표 5>와 같이 1997년 이전의 영문자료는 없는 관계 로 네이버기사는 세 그룹으로 구글기사는 두 그룹으로 나누어서 분석하였다. 이하 분석결과에서는 네이버 1, 2, 3와 구글 2, 3으로 명명하였다.

4.3 네이버뉴스 기사를 통한 어휘연결망 변화

1990년 1월1일부터 2020년 6월 30일까지 ‘창업’과

‘기업가정신’의 키워드로 각각 그룹별로 네이버뉴스

를 중심으로 크롤링한 결과는 <표 6>와 <그림 3>에 그 결과를 도식화하였다.

벤처 발아기는 6,386개의 단어를 수집했다. ‘중소기 ’(408개, 6.39%)이 가장 많은 빈도를 차지하고 다음 으로 ‘기업’(286개, 4.48%), ‘지원’(269개, 4.21%), ‘벤처 기업’(264개, 4.13%), ‘회장’(201개, 3.15%), ‘그룹’(180 , 2.62%), ‘서울’(164개, 2.57%), ‘센터’(144개, 2.25%) 의 순이었다.

벤처도약 및 쇠퇴기는 8,678개 단어가 수집되었다.

‘기업’(1128개, 13.00%)이 가장 많은 빈도를 차지하며 다음으로 ‘정신’(977개, 11.26%), ‘경제’(334개, 3.85%),

‘회장’(287개, 3.31%), ‘시장’(274개, 3.16%), ‘창업 ’(251개, 2.89%), ‘사업’(215개, 2.48%), ‘투자’(198개, 2.28%)의 순이었다.

벤처 재도약기는 6,106개 단어가 수집되었다. ‘기 ’(725개, 11.87%)이 가장 많은 빈도를 차지하며 다 음으로 ‘정신’(489개, 8.01%), ‘교육’(428개, 7.01%), ‘청 ’(393개, 6.44%), ‘지원’(383개, 6.27%), ‘사업’(327개, 5.36%), ‘회장’(314개, 5.14%), ‘센터’(261개, 4.27%)의 순이었다.

특정문서에서 단어가 등장할 횟수를 나타내는 TF-IDF를 살펴보면, 벤처발아기는 최소 7.026에서 최 602.759로 분포하였고, 벤처도약 및 쇠퇴기는 최소 7.547에서 최대 1129.832로 분포하였으며, 벤처재도약 기는 최소 7.469에서 최대 924.142로 분포하였다.

발아기에 가장 많은 빈도로 나타난 ‘중소기업’은 벤처도약기, 쇠퇴기 및 재도약기에는 나타나지 않았 . 세가지 시기 모두 20위안에 나타난 단어는 ‘기 ’(2-1-1), ‘지원’(3-16-5), ‘회장’(5-4-7), ‘서울’(7-10-12),

‘사업’(9-7-6), ‘경제’(17-3-9), ‘창업자’(18-6-16), ‘정 ’(20-2-2)이었다. 특히 ‘지원’ 키워드는 벤처도약기 및 쇠퇴기에 매우 중요한 단어로 나타났고, ‘정신’ 키 워드는 벤처도약기 및 쇠퇴기, 재도약기에 매우 중요 한 단어로 나타났다.

벤처 도약기에 20위안에 나타난 단어 중 벤처도약

<표 5> 분석에 사용된 네이버뉴스와 구글뉴스의 기사건수 1990년

-1997년

1998년 -2007년

2008년

이후 전체

창업1) 960 990 871 2,821

기업가정신1) 136 935 882 1,953

startup2) 0 299 365 664

entrepreneurship2) 0 300 386 586 1) 대한민국 2) 전세계

(9)

기 및 쇠퇴기, 재도약기에 20위안에 나타나지 않은 단어는 ‘중소기업’을 비롯해서 ‘그룹’, ‘설립’, ‘기술’,

‘정부’, ‘회사’, ‘보육’, ‘대상’ 등의 키워드였고, 벤처도 약기 및 쇠퇴기에 다시 나타난 단어는 ‘시장’, ‘한국’,

‘설명회’, ‘세계’, ‘아이템’, ‘개최’, ‘사회’, ‘기자’, ‘교육’,

‘전문’ 등의 키워드였으며, 이중 ‘한국’, ‘개최’, ‘사회’

는 재도약기에도 지속적으로 나타난 키워드였다. 또 한 재도약기에는 ‘교육’, ‘청년’, ‘진주’, ‘모집’, ‘프로그 ’, ‘운영’, ‘혁신’ 등의 키워드가 추가적으로 2위안에 포함되었다.

키워드의 빈도를 중심으로 살펴보면, 벤처 발아기는 창업은 주로 정부주도 추진하고 대기업 회장의 기업

<표 6> 네이버 뉴스기사, 구글 뉴스기사에서 나타난 벤처 주기별 키워드 빈도수와 TF-IDF

네이버 뉴스 키워드 구글 뉴스 키워드

벤처발아기 벤처도약 및 쇠퇴기 벤처재도약기 벤처도약 및 쇠퇴기 벤처재도약기

단어 빈도수 순위 TF-IDF 단어 빈도수 순위 TF-IDF 단어 빈도수 순위 TF-IDF 단어 빈도수 순위 TF-IDF 단어 빈도수 순위 TF-IDF 중소기업 408 1 602.759 기업 1128 1 1129.832 기업 725 1 924.142 busy 222 1 478.947 busy 109 1 304.349 기업 286 2 481.650 정신 977 2 922.665 정신 489 2 803.468 technology 64 2 212.579 innovate 52 2 189.598 지원 269 3 477.247 경제 334 3 673.860 교육 428 3 782.032 company 63 3 212.282 company 51 3 178.260 벤처기업 264 4 508.612 회장 287 4 683.688 청년 393 4 883.750 finance 61 4 206.551 world 48 4 172.831 회장 201 5 448.358 시장 274 5 586.306 지원 383 5 706.660 media 55 5 191.020 tech 42 5 155.137 그룹 180 6 413.827 창업자 251 6 585.342 사업 327 6 693.886 new 50 6 178.420 women 41 6 154.559 서울 164 7 328.418 사업 215 7 513.403 회장 314 7 727.159 school 50 7 178.420 investor 40 7 150.789 센터 144 8 377.238 투자 198 8 490.658 센터 261 8 592.623 franchise 49 8 175.842 year 38 8 147.476 사업 129 9 316.271 한국 178 9 450.286 경제 251 9 574.112 day 48 9 173.243 student 36 9 139.714 설립 127 10 312.684 서울 175 10 443.859 개최 242 10 550.823 magazine 48 10 173.243 university 34 10 132.968 투자 123 11 309.415 경영 158 11 419.747 진주 241 11 702.565 strategy 43 11 159.927 business 31 11 123.173 기술 116 12 289.284 설명회 153 12 471.403 서울 240 12 500.301 subscription 40 12 151.662 found 30 12 121.201 정부 108 13 269.333 세계 153 13 408.782 모집 233 13 569.732 university 38 13 146.028 success 28 13 116.178 경영 102 14 263.545 아이템 152 14 414.457 벤처기업 232 14 525.498 opportunity 38 14 146.028 venture 27 14 111.010 회사 97 15 258.963 개최 149 15 412.410 사회 222 15 532.840 network 37 15 144.186 silicon 27 15 112.029 보육 85 16 266.442 지원 148 16 418.614 창업자 214 16 501.856 issue 36 16 156.418 fund 26 16 107.880 경제 85 17 236.124 사회 144 17 396.170 한국 188 17 462.188 service 36 17 140.289 valley 25 17 105.732 창업자 82 18 225.480 기자 140 18 370.879 프로그램 180 18 478.242 september 33 18 131.469 way 25 18 107.907 대상 81 19 222.731 교육 139 19 410.308 운영 179 19 441.260 custom 32 19 128.470 support 25 19 104.711 정신 79 20 217.231 전문 139 20 391.922 혁신 174 20 447.396 state 31 20 125.440 people 25 20 105.732

전체 6368 전체 8678 전체 6106 전체 2110 전체 2106

최소 7.026 7.547 7.469 7.480 7.407

최대 602.759 1129.832 924.142 478.947 304.350

<그림 3> 네이버뉴스에서 나타난 벤처 주기별 창업 및 기업가정신의 어휘 클라우드

(10)

가정신을 표본으로 진행된 경우가 많다면, 벤처 도약 기 및 쇠퇴기에서는 시장성을 강조하고, 투자회 개최 및 아이템 개발을 위한 교육들이 진행되었으며, 벤처 재도약기의 경우는 청년 창업이 중심을 이루며 다양 한 창업 교육프로그램개발이 제공되었다는 것을 알 수 있다.

네이버 1의 TF-IDF는 모두 20위안에 상위 20위안 에 동일하게 존재하였으나, 네이버 2에서는 ‘박람 ’(TF-IDF=437.299), ‘소상공’(TF-IDF=415.768), ‘여 ’(TF-IDF=400.951) 등이 TF-IDF가 높은 것으로 나 타났다.

네이버 3에서는 ‘스타트업’(TF-IDF=467.600), ‘창업 지원’(TF-IDF=465.830), ‘세계’ (TF-IDF=450.209), ‘창 업주’(TF-IDF=446.097), ‘예비’(TF-IDF=445.341), ‘프랜 차이즈’(TF-IDF=444.720) 등이 TF-IDF가 높은 것으로 나타났다.

4.4 구글 뉴스 기사를 통한 어휘연결망의 변화

1990년 1월1일부터 2020년 6월 30일까지 ‘startup’

‘entrepreneurship’의 키워드로 각각 그룹별로 구 글 뉴스를 중심으로 크롤링을 실시한 결과는 <표 6>과

<그림 4>로 표시하였다.

구글 뉴스에서 나타나 키워드를 중심으로 출현빈 도와 TF-IDF를 살펴보면, 도약기 및 쇠퇴기는 전체

2,110개의 단어가 나타났으며, 재도약기는 2,106개의 단어가 나타났다. 특히 이중 ‘busy’(222개, 10.52%, 1-1), ‘technology’(64개, 3.03%, 2-5), ‘company’(63개, 2.99%, 3-3), ‘university’(38개, 1.80%, 13-10) 만이 두 시기 모두 나타나 단어이며, 이중 가장 빈도가 높은 단어는 ‘busy’인 것으로 나타났다. 구글 뉴스의 경우 재도약기는 ‘silicon’, ‘valley’나 ‘student’, ‘women’,

‘people’과 같은 대상을 가리키는 단어와

‘innovation’, ‘support’, ‘fund’, ‘investor’, ‘success’,

‘way’와 같은 지원과 관련된 단어들이 출현하였다.

한글로 된 뉴스와는 달이 영문의 키워드에서는 두 시 기의 단어 양극화현상은 매우 두드러지게 나타났다.

구글 2에서는 20위까지의 단어가 TF-IDF의 순위가 거의 유사하였으나, 구글 3에서는 ‘school’

(TF-IDF=107.907)의 TF-IDF가 높은 것으로 나타났다.

4.5 키워드 네트워크분석에 의한 주요 키워드의 지수의 차이

정제된 키워드를 중심으로 네트워크를 시각화하였 으며, 계산된 네트워크 지수를 중심으로 어휘연결망 을 확인하였다. 네크워크지수는 기본적으로 연결중심 (degree centrality), 근접중심성(closeness centrality), 매개중심성(betweenness centrality)을 산 출하였다.

네크워크에 구성요소인 노드와 엣지의 빈도를 살펴 보면 <표 7>과 같다. 네이버의 경우 노드(Node)의수는 6,868 → 8,968 → 6,733으로 도약기 및 쇠퇴기에서 가장 많은 노드가 나타났으며 다시 재도약기에는 발아 기의 수준으로 낮아진 것을 알 수 있다. 구글의 경우는 3,513 → 3,713으로 비슷한 수준을 유지하였다.

엣지(edge)의 경우는 네이버는 13,198 → 23,726 → 19,567 로 구성되어 발아기에 비해 도약기 및 쇠퇴기 80%정도 증가한 것을 알 수 있으며, 구글의 경우 5,742,→ 6,323으로 증가수준은 10%수준이었다.

<그림 4> 구글뉴스에서 나타난 벤처 주기별 창업과 기업가정신의 어휘 클라우드

(11)

<그림 5>과 같이 (b) 도약기 및 쇠퇴기의 네크워크 (a) 발아기보다 복잡해지고 많은 노드로 구성됨을 알 수 있다.

연결중심성(Degree Centrality)은 가장 단순하지만 신뢰성 높은 지수로 각 노드가 그 노드가 상호작용하 는 이웃 노드(이웃과 연결된 엣지)의 개수를 의미한다.

<표 8, 9>에서 보면, 네이버는 발아기는 ‘IT’(395), 도약 기 및 쇠퇴기는 ‘IT’(901), 재도약기는 ‘기업’(438)이었 으며, 구글의 도약기 및 쇠퇴기는 ‘new’(201), 재도약기 ‘harvard’(149)로 나타났다. 발아기의 ‘IT’는 ‘정 ’(wgt=5)와 가장 연결성이 상하며, 다음으로 ‘기 ’(wgt=4)과 연결성이 높으며, ‘경제’, ‘사업’, ‘회 ’(wgt=3)의 순으로 연결성이 높은 수준이었다. 반면 도약기 및 쇠퇴기의 ‘IT’는 ‘정신’(wgt=30), ‘창업 ’(wgt=12), ‘교육’(wgt=10)의 순으로 연결성이 강하 며 최소 1까지 존재하였다. 재도약기의 ‘IT’는

‘CEO’(wgt=4)와 가장 높은 연결성이 가지는 키워드인 것으로 나타났다. 재도약기의 ‘기업’은 ‘정신’(wgt=14),

‘기술’(wgt=6), ‘글로벌’(wgt=5)의 연결성이 강하게 나 타났다. 구글의 도약기 및 쇠퇴기는 ‘new’는

‘york’(wgt=20), ‘money’(wgt=4)의 연결성이 강하며, 재도약기는 ‘harvard’(149)었으며, ‘business’ (wgt=15),

‘companies’(wgt=3), ‘job’(wgt=3)의 연결성이 강한 것

으로 나타났다.

근접중심성은 한노드가 다른 모든 노드들까지 도 달하는 경로가 짧을수록 중요한 노드로 네이버의 발 아기는 0~0.416(기업), 도약기와 쇠퇴기는 0.000~0.447(기업), 재도약기는 0.000~0.712(기업)의 범 위로 나타났으며 모든 시기에서 “기업”이 가장 근접 중신성이 높은 키워드로 나타났다. 구글은 도약기와 쇠퇴기는 0.000~0.667 (business), 재도약기는 0.000~1.0의 범위로 나타났으며 재도약기의 경우는 오직 하나의 단어로만 구성되어 있는 경우가 많아 1.0으로 나타났다.

매개중심성은 네트워크 상의 두 개의 노드사이의 최단경로를 이용하는 개념으로 네이버의 경우 발아 기는 ‘기업’이 2281771.488로 가장 높았으며, 도약기 및 쇠퇴기의 ‘기업’는 6119459.437로 가장 높았다. 재 도약기의 ‘기업’은 733.626이 가장 매개연결성이 높은 것으로 나타났다. 구글은 도약기 및 쇠퇴기는

‘business’는 141.995로 매개연결성이 강하며, 재도약 기는 ‘new’이 1091795.024 매개 연결성이 강한 것으 로 나타났다.

계산된 네트워크지수에 대해서 두 뉴스유형과 기간 별 차이를 <표 10>과 같이 알아보았다.

연결중심성은 매체간, 기간간에는 유의한 차이가 나타났으나 매체과 기간간의 상호작용효과는 존재하 지 않는 것으로 나타났다. 즉 매체별로는 네이버는 평균 4.818, 구글은 평균 3.339로 네이버의 연결중심 성이 높은 것으로 나타났으며(F=83.048, p<.001), 기간 별로는 발아기는 평균 3.843, 도약기 및 쇠퇴기는 평 4.674, 재도약기는 평균 4.568로 나타나 발아기의 연결중심성이 가장 낮았으며 도약기와 재도약기의 연 결중심성은 비슷한 수준이었다(F=22.315, p<.001).

근접중심성은 매체간, 기간간, 매체와 기간간의 상 호작용에서 통계적으로 유의한 차이가 나타났다. 즉 매체별로는 네이버는 평균 0.200, 구글은 평균 0.115 로 네이버의 근접중심성이 높은 것으로 나타났으며

<표 7> 키워드네트워크의 기본통계량 네이버 1

(a)

네이버2 (b)

네이버 3 (c)

구글2 (d)

구글3 (d) Nodes 6,868 8,960 6,733 3,513 3,713 Edges 13,198 23,726 19,567 5,742 6,323

Max Degree 395 901 438 201 149

Ave. Degree 3.843 5.296 5.845 3.269 3.406 Network

Diameter 7 6 3 5 13

Ave. Path

Length 3.872 3.7845 1.916 2.281 4.851 Graph Density 0.267 0.177 0.171 0.163 0.001 (a) 네이버 도약기, (b) 네이버 도약기 및 쇠퇴기 (c) 네이버 재도약기 (d) 구글 도약기 및 쇠퇴기 (e) 구글 재도약기

(12)

<그림 5> 네이버뉴스와 구글뉴스의 키워드 네트워크시각화

<표 8> 네이버 뉴스 키워드 네트워크 분석 결과

네이버 뉴스 키워드

벤처발아기 벤처도약 및 쇠퇴기 벤처재도약기

Word Degree Closeness Betweenneww Word Degree Closeness Betweenneww Word Degree Closeness Betweenneww

1 IT 395 0.385 2108934.072 IT 901 0.425 5752669.454 기업 438 0.712 733.626

2 중소기업 382 0.410 2256107.681 기업 692 0.447 6119459.437 청년 265 0.603 228.130

3 벤처기업 354 0.408 1954777.665 벤처 441 0.394 2628713.925 한국 233 0.624 344.810

4 대통령 229 0.369 1028402.269 정신 299 0.427 2850497.555 소자본 224 0.527 72.483

5 정부 227 0.390 1073663.791 한국 299 0.405 1635637.665 세계 218 0.597 148.647

6 창업투자 220 0.388 1123256.608 CEO 293 0.391 1299893.062 아산나눔재단 214 0.555 49.101

7 서울 210 0.389 1372805.384 경제 262 0.400 1328345.232 진주 201 0.581 70.572

8 기업 177 0.416 2281771.488 세계 248 0.392 1212813.276 중기 171 0.558 54.555

9 부총리 157 0.364 406326.692 기술 246 0.383 1098332.375 부산 156 0.543 26.811

10 경제 142 0.378 763952.762 프랜차이즈 244 0.363 883277.290 정신 154 0.627 314.860

11 초점 141 0.352 625759.256 이명박 243 0.384 1080821.737 제회 154 0.558 110.507

12 통산부 137 0.353 472836.938 기업가 182 0.382 754625.532 지원 152 0.630 404.279

13 올해 135 0.359 324747.914 부산 178 0.366 755829.438 진주시 152 0.555 60.228

14 중소 122 0.362 498280.603 정동영 169 0.352 655292.996 기업가 148 0.560 105.539

15 총리 119 0.360 280523.790 서울 159 0.384 946026.479 전경련 147 0.498 11.487

16 벤처 114 0.352 389190.785 대안민국 153 0.368 456230.153 프랜차이즈 142 0.527 47.253

17 재회 110 0.371 362694.253 삼성 150 0.366 545959.422 청소년 134 0.553 44.637

18 국민 107 0.347 403311.126 서울시 144 0.354 395257.442 재계 130 0.563 69.267

19 종합 103 0.369 515833.162 상의 134 0.368 394759.965 교육 129 0.612 258.251

20 지원 102 0.351 285965.195 투자 132 0.366 351200.730 대전 128 0.555 81.175

참조

관련 문서

As for the analysis result of ‘social network analysis’ with the whole data, group ‘0’ (6 players) and group ‘1’ (11 players) were partitioned. A point of view

Analysis of the Online Review Based on the Theme Using the Hierarchical Attention Network.. In Ho Jang*․Ki Yeon Park**․Zoon

Such changes in the environment have greatly affected ports according to the strategies of major liner alliances, and port centrality has shifted in response

And then we analyze the robustness of the graph by observing changes in the centrality of the random graph and the modified graph.. We study how

The aims of this study were to evaluate the RFA values of machined and HA-coated surface im- plants in patients immediately after implant place- ment, at healing abutment connection

In this research, author can find not only the trend of joint research but also the centrality of trade researchers in the excellent journals in Korea by use of Social

Analyzing the Degree Centrality of Korea Rural Community Corporation Business Using Network Analysis.. Hyang-Mi

This study analyzes the centrality of the Incheon port liner service network by using SNA (Social Network Analysis), which was introduced in the