J Intell Inform Syst 2021 September: 27(3): 1~27 http://dx.doi.org/10.13088/jiis.2021.27.3.001
COVID-19 팬데믹에서 Airbnb 호스트의 마케팅 전략의 변화가 공유성과에 미치는 영향*
김소영
국민대학교 데이터사이언스학과 ([email protected])
심지환
국민대학교 데이터사이언스학과 ([email protected])
정여진
국민대학교
․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․
전 세계적인 COVID-19의 유행으로 인해 관광산업 전반이 큰 타격을 받고 있다. 최근 공유경제의 확산으로 팽창되고 있는 Airbnb와 같은 숙박 공유서비스는 공급자와 수요자 간의 신뢰와 소통을 기반으로 거래가 이루어지기 때문에 팬데믹 으로 인한 영향을 특히 크게 받고 있다. 팬데믹 상황이 개인의 여행에 대한 인식과 행동을 변화시킴에 따라 이를 개선하 기 위한 전략에 대한 논의가 이루어지고 있지만 대부분의 연구는 전통적인 외식업, 숙박업 공급자와 정부 측면의 거시적 전략을 제시하고 있다. 본 연구는 Peer-to-Peer 거래 중심의 공유경제의 특수성을 고려하여 COVID-19 팬데믹 발생 전후 로 Airbnb 개별 호스트의 마케팅 전략의 변화가 공유성과에 미치는 영향을 실증적으로 분석함으로써 개별 호스트 측면의 팬데믹 전략에 대해 논한다. Airbnb의 호스트가 본인의 시설을 홍보하는 통로인 시설소개 텍스트를 수집하여 딥러닝 기반 특성추출방법인 Attention-based aspect extraction 모델로부터 9개의 주요 특성을 추출하였다. 추출된 특성이 해당 텍스트 에서 등장하는 빈도가 COVID-19 발생 전후 변화량을 측정하여 이것이 공유성과에 미치는 영향을 분석하였다. 또한 이러 한 영향을 숙박시설의 유형 간에 비교함으로써 시설 유형별 효과적으로 작용하는 특성을 관찰하였다. 회귀분석 결과 주방 시설, 정원, 호스트와의 교류 순으로 공유성과에 긍정적인 영향을 보이지만 시설 유형에 따라 공유성과에 미치는 영향은 다소 차이가 있었다. 특히 집 전체를 대여하는 경우 개인실 대여에 비해 주방시설에 대한 설명이 상당한 효과를 보여주었 다. 이를 통해 본 연구는 공유숙박 서비스의 개별 서비스 제공자가 시설의 종류에 따라 취할 수 있는 팬데믹 위기 대처 전략에 대한 아이디어를 제시한다.
주제어 : 코로나-19, 공유경제, 시설소개, 텍스트마이닝, 특성추출
․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․․
논문접수일:2021년 5월 13일 논문수정일:2021년 7월 29일 게재확정일:2021년 9월 14일 원고유형:일반논문 교신저자:정여진
* 본 연구는 산림청(한국임업진흥원) ‘산림과학기술 연구개발사업(2019150B10-2123-0301)’의 지원에 의하여 이루어진 것입니다.
1. 서론
2019년 12월 중국 우한시에서 코로나바이러스 (COVID-19)가 처음 발생된 이후 전세계적 대유 행이 시작되었다. 이 대유행을 억제하기 위한 지 역사회 봉쇄, 사회적 거리두기, 여행의 제한 등
의 대응에도 불구하고 보건위생 , 사회, 경제 등 많 은 분야의 산업은 큰 타격을 받았다. COVID-19는 이전의 보건 위기, 경제 위기와 다르게 복합적인 위기를 초래한 전례없는 사례로서 새로운 연구 과제가 되었다(Zenker and Kock, 2020).
접객업(hospitality)은 숙박 및 음식, 음료를 제
공하여 방문고객의 복지를 증진시키기 위한 목적 을 가진 업종을 일컬으며(Lashely and Morrison, 2013), 2017년 기준 미국 GDP의 약 20%를 공급 하고 미국 노동력의 약 30%를 고용하는 등 미국 경제 및 노동시장에서 필수적인 역할을 담당하 고 있다(Huang et al., 2020). 이 중, 여행업과 숙 박업은 역사적으로 재난과 위기상황, 공중보건 문제로부터 영향을 상대적으로 크게 받아왔다 (Blake and Sinclair, 2003; Jiang and Rithcie, 2017).
특히 이번 COVID-19으로 발생으로 인해 2020년 3월 미국 기준으로 국제 여행객 및 관광객 수가 전년대비 약 15% 이상 급감하였을 뿐만 아니라, 아시아 국가의 경우에는 약 35%의 급감률이라 는 막대한 타격을 입었다(UNWTO, 2020).
팬데믹과 같은 공중보건 문제는 개인의 여행 에 대한 인식과 행동에 영향을 미친다(Kuo et al.
2008). Cahyanto et al.(2016)는 Health Belief Model 을 바탕으로 여행에 대한 위험과 바이러스 전파 력이 개인의 여행 회피 정도에 미치는 영향을 에 볼라 팬데믹 사례를 통해 보여주었다. 팬데믹 초 기에는 여행 취소 및 변경이 나타나고, 이후 여 행자 간의 커뮤니케이션과 미디어가 여행의 위 험에 대한 논의에 집중됨에 따라 여행 자체를 회 피하고자 하는 행동 유형이 급격하게 증가한다 (Neuburger and Egger, 2020). 따라서 건강 및 안 전 조치에 대한 관심이 극대화되는 팬데믹 상 황에서 관광 및 숙박업계는 상황에 맞게 정책 및 행동요령을 적절하게 변경해야 할 필요성이 있다.
최근 공유경제의 확산에 따라 관광산업에서 새로운 형태의 온라인 플랫폼이 등장했고 IT 및 통신 기술의 급격한 발전과 함께 Airbnb와 같은 숙박 공유 서비스가 급격히 확장되었다 (Cheng et al., 2018). 공유경제는 낯선 사람과의 계약이 불
가피하기 때문에 계약 당사자 간의 유대감 형성 과 신뢰가 중요하며(Richardson, 2015; Ert et al., 2016), 이러한 특성으로 인해 여행자의 위험 인 식에 크게 영향을 주는 팬데믹에 특히 취약하다.
COVID-19 팬데믹 발생 이후 공유경제에서의 주 요 키워드가 ‘공유(Share)’, ‘협업(Collaborating)’
에서 ‘신뢰(Trust)’, ‘안전(Safety)’으로 변화한 것 은 이를 함축적으로 나타낸다. 따라서 숙박 공유 서비스는 관광산업의 위축과 함께 특히 그 수요 가 크게 감소할 수 있다(Ilhan and Ali, 2020).
팬데믹 상황에서 여행자의 인식 변화에 대처 하기 위해 숙박업, 외식업 서비스 공급자가 취할 수 있는 전략이 여러 연구를 통해 제안된 바 있 다. Tew et al.(2008)은 SARS 유행 당시 4단계 유 행 단계에 따라 숙박업이 취해야 할 대응전략을 논의하였고 Braun-LaTour et al.(2006)과 Alen et al.(2006)은 미디어 채널 등을 활용한 숙박업과 외식업의 고객 마케팅 전략에 대해 제시하였다.
하지만 공유경제 산업의 관점에서 팬데믹 대 응 전략에 대한 논의는 거의 이루어지지 않고 있 다. Airbnb와 같은 P2P 방식의 숙박공유업에서는 호스트가 제공하는 시설 정보가 게스트가 파악 할 수 있는 중요한 정보의 원천이므로 게스트는 이에 대해 민감하게 반응한다(wilson et al. 2012).
특히 공중 보건에 대한 위험이 존재하는 상황에 서는 신뢰성 있는 출처의 정보를 전달하는 것이 중요하므로(Slevitch and Sharama, 2008), 게스트 는 호스트에 의해 제공되는 정보를 보수적으로 평가할 것으로 예상된다. 또한 COVID-19 상황 에서 변화한 여행자의 위험 인식을 바탕으로 판 단할 때 호스트에게 요구하는 정보는 일반적인 상황과 다를 것이 기대된다.
따라서 본 연구는 COVID-19 팬데믹 상황에서
Airbnb의 호스트가 취할 수 있는 대처방안 및 마
케팅 전략을 실증적인 데이터 분석을 통해 파악 하고 제안하고자 한다. Airbnb의 개별 호스트가 본인의 숙박 시설을 홍보할 수 있는 유일한 통로 인 시설소개(listing description)의 텍스트를 딥러 닝 방법으로 분석하여 텍스트가 포함하고 있는 내용의 중요 특성(aspect)을 추출한다. 그리고 각 특성이 시설소개에 나타난 빈도의 변화와 공유 성과(listing performance) 간의 관계를 분석하여 성과를 높이는데 기여한 특성들을 파악한다. 여 기서 공유성과란 시설대여의 성공을 측정하는 개념으로써 공유경제 서비스에 대한 여러 연구 에서 사용되어 왔고 이는 예약 건수(Xie and Mao, 2017), 해당 시설에 대한 사용자 리뷰의 개수(Ye et al., 2011; Zhang, 2019) 등으로 측정되었다. 본 논문은 시설의 유형에 따라 시설소개와 공유성 과의 관계에서 도출할 수 있는 차이를 통계적으 로 비교, 검증함으로써 팬데믹 위기상황에 대비 하여 공유경제의 개별 서비스 제공자가 본인이 보유한 시설의 종류에 따라 취할 수 있는 위기대 처 전략에 대한 아이디어를 제시한다.
논문의 구성은 아래와 같다. 2절에서는 팬데 믹에 따른 관광업 및 접객업에서의 인식 및 행동 변화와 대응 사례에 대한 문헌과 텍스트마이닝 에 대한 이론적 배경을 조명하고, 3절에서는 본 연구의 연구방법론을 자세히 소개한다. 그리고 4 절에서 연구결과를 보고하고, 5절에서 연구결과 에 대한 결론과 한계점에 대해 논의한다.
2. 이론적 배경
2.1. 관광산업에서 공중보건 위기에 따른 여행객의 인식 및 행동 변화
관광산업은 세계의 많은 국가에서 외화를 벌
어들이는 주요 수입원으로서 자리매김 해왔으며 레스토랑, 교통, 숙박 시설 등과 같은 기반 산업 들과 상호의존적으로 연결되어 있다(Jiang and Ritchie, 2017). 이러한 관광산업은 타 산업과의 다중 종속성으로 인해 역사적 재난과 위기상황 에 대해 영향을 상대적으로 크게 받아왔다.
UNISDR(2009)에 의하면 재난은 공동체 혹은 사 회의 기능에 치명적인 장애가 발생하여 광범위 한 인적, 물적, 경제적 또는 환경적 손실을 유발 하고, 이로 인해 지역 사회가 자체 자원을 사용 하여 대처할 수 있는 능력을 초과하는 것으로 정 의되며, 그 예로 걸프전 및 미국의 9/11과 같은 안보위기 , 인도양 쓰나미 및 동일본 대지진 등과 같은 자연재해, SARS 및 MERS 그리고 현재 전 세계가 겪고 있는 COVID-19와 같은 바이러스 팬데믹이 있다. 관광업의 수요는 이 중 안보와 공중보건 문제에 매우 민감하게 반응하는 것으 로 알려져 있다(Blake and Sinclair, 2003).
하지만 관광객이 여행지를 선택할 때 고려하 는 안전에 대한 인식은 실제 위험 상황과 괴리가 존재할 가능성이 있다. 안전과 보안에 있어서, 여행지의 실제 위험과 마케팅 및 이미지 광고에 따라 인지되는 위험 간의 차이가 있을 수 있다 (Slevitch and Sharma, 2008). 또한 소셜미디어 상 의 건강정보에 대한 인지효과를 개개인의 유사 성과 전문성의 초점에서 살펴보았을 때, 전문가 보다는 유저가 제공하는 건강관련 정보가 인지 효과가 크다고 설명한다(Lin et al., 2016). 이는 공중보건에 대한 관광객들의 인식은 여행지에 직접적으로 관련되어 있는 유저들이 제공하는 건강정보에 대해 민감하게 반응할 수 있음을 암 시한다.
팬데믹 바이러스는 안전에 대한 인식 뿐 아니
라 개인의 여행에 대한 인식체계를 변화시켰다
는 여러 연구들이 존재한다. 특히, 다른 산업에 서보다 접객업에서의 공중보건 위기는 바이러스 의 영향을 받지 않은 지역에 대한 여행계획 또한 재고하게 하고, 더욱 광범위한 부정적 인식을 야 기하였다(Novelli et al., 2018). 여기서, 인식은 행 동 의도에 영향을 미치기 때문에(Ajzen and Fishbein, 1980) 접객업에서 여행객들의 인식개선 방안에 대한 고민은 더욱 중요하다.
최근 몇 년간 접객업은 공유경제 확산으로 인 해 Airbnb와 같은 새로운 형태의 온라인 플랫폼 이 등장하며 산업구조가 변화되어 왔으며 접객 업과 공유경제의 융합은 소비자와 서비스 제공 자 간의 비즈니스 트렌드와 행동을 변화시키고 있다. 공유경제는 계약 구조가 낯선 사람과의 만 남을 장려하기 때문에 서로 간의 신뢰가 필수적 이다(Richardson, 2015). 따라서 가격 및 편의성 뿐 아니라 신뢰를 기반으로 한 계약 당사자 간의 유대감 형성 또한 계약 성립에 중요한 역할을 한 다(Ert, Fleischer & Magen, 2016). 이는 COVID-19 팬데믹에 대응하기 위해서는 공유경제의 특성 을 고려한 대응 전략이 필요함을 내포한다.
COVID-19와 같은 바이러스 팬데믹 사례는 2002년~2004년 SARS, 2009년 H1N1 인플루엔 자, 2014년의 Ebola 등이 있다. 이러한 바이러스 팬데믹이 공중보건에 대한 인식변화 및 여행 의 도에 미치는 영향은 여러 연구자들에 의해 연구 되었다. Leggat et al.(2010)은 H1N1과 유사한 증 상을 보였더라도 바이러스에 대한 위험 인지 정 도가 낮아 여행을 연기하거나 계획을 변경하지 않는 것으로 나타났다고 보고하지만, Reisinger and Mavondo(2005)에서는 질병에 대한 인식이 여행 패턴의 변화를 파악할 수 있는 중요한 지표 임을 강조하고 있다. Cahyanto et al.(2016)은 위 험에 대한 인식과 주관적 지식이 많은 사람들에
게서 여행을 회피하는 경향이 더 강하게 나타나 는 반면 자기 효능감이 높은 사람들에게서는 여 행을 피하려는 경향이 더 낮게 나타난다고 보고 한다. 이와 같이 COVID-19 이전 팬데믹에 대한 많은 연구들은 소비자 인식과 행동에 관심을 두 고 있는 것을 알 수 있다.
2.2. 팬데믹 상황에서 접객업의 대처방안
소비자 측면 외에, 숙박업 및 외식업 서비스 제공자 측면에서 관광수요 회복을 위해 취해야 할 대응전략에 대해서 과거의 팬데믹 사례를 기 반으로 논의된 연구들도 다수 존재한다. Tew et al.(2008)은 SARS 대유행 당시 캐나다 토론토 지 역의 숙박 산업이 유행 단계별로 취해야 할 대처 에 대해 논의한다. 유행은 위기 이전 – 급성 진행 – 유행의 지속 – 복구 4개의 단계를 거치는데, 급 성 단계에서의 숙박업이 취해야 할 대응 방식 중 바이러스에 대한 직원의 정확한 인식과 위기 상 황을 통제할 수 있는 정보에 대한 공유를 강조한 다. 더불어 소비자 만족의 회복에 초점을 맞추어 커뮤니케이션 수단으로 미디어 채널을 적극적으 로 활용한 호텔 서비스의 마케팅이 제안되었다 (Braun-LaTour et al., 2006). Alan et al.(2006)은 홍콩의 레스토랑을 대상으로 팬데믹 상황에서 비용절감 및 수익향상을 위한 전략을 제시한다.
음식의 질과 서비스를 개선함으로써 잠재고객을 유인하고, 시설 내부 방역 및 위생 물품 사용을 통해 팬데믹 공포를 경감시킬 수 있다고 조언한 다. 위와 같이 고객과의 대면이 불가피한 서비스 산업에서는 외부로 보여지는 시설의 청결 및 직 원의 위생 관념과 같은 인지된 위험을 경감시키 는 데 공통적으로 초점을 두고 있다.
COVID-19로 인한 숙박업의 위기 대응에 대한
연구들은 다양한 기술과 정책의 도입을 통해 최 대한 접촉을 지양하면서 서비스 품질을 유지하 는 것을 제안하고 있다. 그리스 호텔 산업을 대 상으로 한 Pavlatos et al.(2021)의 연구는 팬데믹 상황을 관리하기 위해 최대의 안전을 제공한다 는 것을 잠재 고객에게 설득하는 것을 목표로 하 는 마케팅을 강조한다. 또한 호텔 직원 및 고객 의 위생과 안전을 보장하기 위해 운영에 변화를 주고 , 전자 체크인/체크아웃, 적외선 발열체크 등 의 새로운 기술에 투자하는 것을 목표로 해야 한 다고 주장한다. Shin and Kang(2020)은 모바일 서비스 및 키오스크 체크인, 로봇 청소시스템과 같은 기술 기반 서비스를 제공함으로써 위험 인 지 정도를 낮추는 것을 중요시한다. 또한, COVID-19 이후 호텔 예약 의도에 대한 시나리 오 설문을 통해서 호텔의 청결도가 예약 의도에 양의 영향을 미칠 수 있다는 것을 보여주고 있 다. 위의 연구들은 바이러스 전파의 불확실성과 경험적 연구가 부족한 실정에도 불구하고 경영, 기술, 인사 등 다양한 측면에서 호텔 산업에서 취해야 할 전략을 제시하고 있다.
2.3. COVID-19와 공유경제
COVID-19 예방을 위한 사회적 거리두기로 인 해 개인 간의 물리적 접촉이 최소화되고 소셜미 디어 플랫폼을 통한 커뮤니케이션이 대폭 늘어 나는 등 개인 간의 상호작용 방식의 변화가 일어 나고 있다. 소셜미디어를 통해 공유하는 내용 또 한 변화하였는데, 공중보건에 대한 인식이 강화 됨에 따라 외식 및 여행과 같은 일상에 대한 소 개는 부정적으로, 손 씻기 및 사회적 거리두기와 같은 예방수칙에 대한 논의는 긍정적으로 인식 되고 있다(Grover, Cheung and Thatcher, 2020).
또한, 소셜미디어 상의 커뮤니케이션에서 건강 에 대한 정보는 유저들 간에 순환을 거듭하면서 인지 효과가 커지는 경향이 있고(Lin et al., 2016), 전문가의 의견보다도 동일한 질환을 겪고 있는 사용자들의 경험 및 예방에 대한 정보의 인 지효과가 크게 나타난다(Paek et al., 2001). 소셜 미디어 상에서 발생되는 상호작용은 참여자들을 한데 모아 개방형 혁신에 활용되었고(Ooms et al., 2015; Turban et al., 2011), 공유경제라는 새 로운 패러다임의 서비스 시장을 등장시켰다. 반 면, 소셜미디어의 파괴적인 기술 변화로 인한 공 유경제의 등장에는 부정적인 측면도 존재한다.
공유경제의 거래 특성상 서비스 제공자와 사용 자 간의 경계가 흐리기 때문에, 이러한 모호한 경계는 합리적이기 보다는 감정적인 컨텐츠를 제공할 가능성이 크다(Al-Saggaf and Simmons, 2015).
위와 같이 공유경제에서는 거래당사자의 행동 과 인식에 왜곡을 일으킬 수 있는 위협이 항상 존재하기 때문에 거래당사자를 파악할 수 있는 한정된 정보에 대한 정확한 이해가 필요할 것이 다 . 특히, COVID-19와 같이 특수한 공중보건 위 기 상황에서는 제공되는 서비스에 대한 객관적이 고 합리적인 정보가 필수적일 것이다 . lhan(2020) 에 의하면 팬데믹 이전의 공유경제에서 강조되는 키워드는 “공유(Sharing)”, “협력(Collaborative)”
이었지만, 이후에는 “신뢰(Trust)”, “안전(Safety)”
에 대한 정보가 공유경제의 주요 차원으로 인식
되었다 . 위 연구에 따르면 실제로 숙박시설을 공
유하는 서비스는 사용률이 감소했으나, 이동수
단을 공유하는 서비스는 사회적 거리두기 시행
과 함께 오히려 사용률이 증가하였다. 이는 공유
서비스에서 신뢰와 안전에 대한 관심이 높아졌
음을 보여준다. COVID-19로 인해 혼란을 피한
기업은 거의 없지만, WHO가 COVID-19가 공중 보건의 비상사태라고 선언한 이후 공유경제는 상대적으로 더 강한 영향을 받았다(Zenker and Kock, 2020). 일반적으로 공유경제에서의 거래 는 원격으로 이루어지기 때문에 단순한 계약 내 용을 넘어서 고객과 서비스 제공자 간의 신뢰가 중요하지만 COVID-19 이후에는 서로 다른 이해 관계자들 사이에 불신이 더욱 쉽게 발생할 수 있다.
이처럼 개인의 여행에 대한 효용 측면에서 신 뢰와 안전에 대한 정보가 차지하는 비중이 증가 하고 있으나, 이러한 정보에 대한 개별 여행자의 반응은 개인의 성향에 따라 달라질 수 있다.
Airbnb를 통해 대여되는 숙박시설은 Entire home/
Private room/ Shared room으로 구분된다. Entire home은 침실, 욕실, 주방, 별도의 전용 출입구를 포함한 숙소 전체 공간을 대여하는 반면 Private room은 침실 외의 공간은 호스트 혹은 다른 게 스트들과 공유하는 시설을 일컫는다. Shared room은 침실을 포함한 모든 공간을 호스트 혹은 다른 게스트와 공동으로 사용하는 시설이다. 세 가지 유형의 시설 중 Entire home은 누구에게도 방해 받지 않는 편안함을 추구하는 여행객에게 적합하며 이를 선호하는 게스트의 경우 환경적 요인에 비교적 민감하고 주로 파트너 혹은 배우 자와 함께 여행하는 것으로 알려져 있다(Lutz and Newlands, 2018). 이는 Airbnb 시설의 유형에 따라 팬데믹에 대응하는 전략이 차별화되어야 함을 함축한다.
위와 같은 문헌적 연구들에 근거하여 공유경 제의 숙박업에서의 팬데믹 대처방안에 대한 깊 이 있게 논의될 필요성이 있다. 호텔과 외식업과 같이 단일 비즈니스 규모가 큰 접객업에 대해서 는 COVID-19 및 바이러스 팬데믹 상황에 대한
다양한 대응방안과 정책에 대한 논의가 이루어 지고 있음에도 불구하고, Airbnb와 같이 공유경 제에 기반한 개별 서비스 공급자 측면에서는 팬 데믹 대응방안에 대한 논의가 거의 이루어지지 않고 있다. 이에 본 연구는 COVID-19 전후의 Airbnb의 평점, 리뷰의 수 등의 메타 데이터와 시설에 대한 소개 텍스트로부터 개별 호스트의 홍보 전략이 가지는 효과를 시설 유형별로 비교 분석한다. 세 가지 시설 유형 중 대부분을 차지 하고 있는(Said, 2014) Entire home과 Private room의 결과를 집중적으로 비교함으로써 호스트 들이 강조해야 할 시설에 대한 정보를 탐색한다.
2.4. 관광업 및 접객업에서 텍스트마이닝의 활용
과거 관광업 및 접객업에서 고객만족도의 측 정 및 평가는 설문 혹은 인터뷰와 같은 대면질의 형식의 연구 방법론을 중심으로 이루어졌다 (Che et al., 2015; Liu and Lee, 2016; Stylos et al., 2017). 그러나 이러한 방식은 데이터를 수집하기 위해 많은 시간과 비용이 소요되는 것이 불가피 하고, 설문지를 작성하는데 있어 응답자가 질문 의 의도를 완전히 이해하지 못할 잠재적 위험이 있다. 그러나 소셜미디어의 발달과 상품 및 서비 스 중개 플랫폼 등의 발전으로 소비자가 해당 상 품 및 서비스에 대해 남긴 텍스트가 활용 가능하 게 되었고 이를 바탕으로 분석 기법을 통해 이러 한 문제를 일정 부분 해결할 수 있게 되었다.
최근 관광 및 접객업에서 User-Generated
Contents(UGC) 분석이 주목받고 있는데(Kim et
al., 2017), 이러한 추세에 따라 UGC 데이터를 바
탕으로 한 여행 목적지에 대한 연구는 그 중요성
을 더해가고 있다(Kim et al., 2014). Chang et
Study (Method)
Study context
(#ofobservation) Key study variables Key Findings
Literature on the perception and behavior of travelers on public health crisis Slevitch and
Sharma (2008) (Survey)
Undergraduate students with multiple majors (200respondents)
Eight types of perceived risk about information quality
Perceived risks may vary depending on marketing or image advertising at travel destinations classified as hazardous areas.
Lin et al. (2016) (Survey)
College students living in the metropolitan areas:
U.S., South Korea, Hong Kong (780respondents)
Trust in social media Uncertainty reduction actions
Uncertainty about health is offset by online self-disclosure and information retrieval.
Novelli et al. (2018) (Interview)
Reports on fieldwork undertaken in informal settings (19respondents)
Identifying core consistence and meanings from Interviewer
In a tourism crisis, no crisis management plans or delays in the establishment of isolation and recovery strategies can lead to negative image discoloration to a wider area.
Literature on the crisis management in the hospitality Alan et al. (2006)
(EventStudy)
Crisis management procedure to deal with crises like SARS
Cash flow problem on SARS
Active action on cleanliness and quarantine in restaurants in Pandemic situations may be a valid marketing point for customers.
Braun-LaTour et al.
(2008) (A/Btest)
Undergraduate students enrolled in an introductory psychology class (100respondents)
Semantic associations Memory reconstruction Demandeffects
Negative tourism experiences in tourist attractions tend to be distorted into positive experiences due to the influence of various media channels such as TV commercials and blog posts.
Pavlatos et al. (2021) (Pilottest&Survey)
Pilot test: 2 academics / 8 hotel manager Survey: Hotel mangers (217respondents)
Hotel characteristics:
Hotelcategory,Thenumbe rofbeds,Hotelmanagemen tstatus,Typeofhotel
The hotel's Pandemic Crisis Response Plan is designed to provide government support, marketing, operation, and cost reduction strategies, and suggests the use of new technologies (electronic check-in/check-out, infrared technologies) as representative countermeasures in terms of operation.
Shin and Kang (2020) (Online QualtricsSurvey)
Amazon Mechanical Turk users:
(159users)
Types of Check-in, Cleanliness
Innovation mitigates customer-aware health risks, and hotel cleanliness has a significant impact on hotel reservation intentions.
Zhang et al. (2020) (Multi-Dimensionali ty Scaling)
Yahoo Q&A (209records)
Politics & Government, Health, Society &
Culture
Public concern about international health issues focuses on prevention and protection in the early stages, but the longer the situation is, the more concerned the role of governments and health organizations.
Literature on tourism and hospitality during the Covid-19 Kim and Lee
(2020) (Survey, Stimuli test)
Amazon Mechanical Turk panel (812)
U.S. residents (199)
Perceived risk level and preference of personal restaurant(tables)
Consumers who are relatively aware of the threat and severity of COVID-19 prefer private restaurants or space-separated tables.
Neuburger and Egger (2021) (Survey, Hierarchical Clustering)
Tourists who visit Germany, Austria, Switzerland during the COVID-19 (212respondents)
‘The Anxious’, ‘The Nervous’, ‘The Reserved’
In the early days of the COVID-19 outbreak, there was a
"relaxing" cluster that did not significantly determine whether it was a risk, but as time went by, there was a "relaxing"
cluster that appeared rapidly.
Ihan et al. (2020) (Literaturereview)
Study Agenda Changes in critical value due to a pandemic impact
Due to the effects of the epidemic, the value of "trust" and
"safety" becomes important in addition to "sharing" and
"collaboration" used as major dimensions of the shared economy.
<Table 1> Comparison of Related Literature
Study (Method)
Study context
(#ofobservation) Key study variables Key Findings
Zenker and Kock (2020)
(Literaturereview)
Various changes caused by pandemics in terms of tourism
Tourism needs to be understood in a broader global economic and political context in understanding the tourism industry after COVID-19
Literature on text mining regarding tourism and hospitality Kim et al. (2017)
(Sentimentanalysis)
Virtual Tourist website (19,833reviews)
14 categories of travel experience
(Tourist level)
Sentiment analysis using UGC contents on destination marketing research could reduce research cost and time.
Chang et al. (2019) (Sentimentanalysis)
TripAdvisor (6,402reviews, focus on Hong Kong restaurants and hotels)
13 potential factors Location and accessibility, Price, Cleanliness, Emotional words are important in choosing a hotel.
He et al. (2013) Twitter official site, Dominos, PapaJohns, PizzaHut
5 major themes Pizza chains actively engage customers on social media such as Twitter and Facebook. Not only do they use social media to promote services, but they also form a bond with customers.
Bjorkelund et al.
(2012)
(Sentiment Analysis, Opinion Mining)
TripAdvisor, Booking.com (662,991reviews)
Breakfast, Staff, Service, Clean, Location,
SentiWordNet has high accuracy for opinion mining and can help detect hotel features and possible reasons for changes in opinions.
Alamanda et al.
(2019)
(Sentiment Analysis)
Instagram, Google (413,175reviews)
Local infrastructure, Accommodation, Information, Culture, Gastronomy, Transportation
For the 6 categories of tourism infrastructure, 5 categories are dominated by Google user, while the gastronomy category is dominated by user comments on Instagram.
al.(2019)은 여행객의 여행지 재방문 의도에 영향 을 미치는 특징을 추출하고 평가하는 과정에서 의사결정나무, 서포트벡터머신 등의 머신러닝 기법과 소셜미디어 상의 온라인 리뷰로부터 여 행객의 감성을 분석하였다. He et al.(2013)은 식 당경영의 측면에서 피자체인의 제품 및 서비스 에 대한 소비자 반응을 분석하기 위해 페이스북, 트위터와 같은 컨텐츠를 적극적으로 텍스트마이 닝 기법에 활용하였다. 호텔 서비스 평가 측면에 서도 텍스트마이닝 기법이 활용되는데, Bjorkelund et al.(2012)는 구글 지도에 남겨진 리뷰와 시각화 데이터를 분석하여 고품질의 호텔을 탐색하는데 도움을 줄 수 있는 방법을 제시하였다. 이와 같 이 UGC는 관광 및 접객업이라는 큰 산업을 구 성하고 있는 세부적인 분야들에서 다양하게 활 용될 수 있다.
UGC의 한 축을 담당하는 텍스트는 서비스 품
질 제고 차원에서 유효한 마케팅 전략을 제시하
기 위해 몇 가지 텍스트마이닝 기법을 채택할 수
있는데, 대표적으로 감성분석(Sentiment Analysis),
오피니언마이닝(Opinion mining), 문서연결망
(Text network)있다. Alamanda et al.(2019)는 인도
네시아 대표 관광지에 대한 여행객들의 반응을
분석하기 위해 인스타그램과 구글 리뷰를 사용
하였다. 연구결과 구글 리뷰가 6개의 여행지 기
반시설 카테고리(지역시설, 숙박시설, 안내시설,
문화, 식당, 교통) 중 5개 부분을 차지하고 있었
지만, 미식 카테고리의 경우 인스타그램 유저들
의 리뷰가 지배적이었다. Bruno et al.(2019)는 말
리 소재 바마코(Bamako) 지역의 관광산업의 특
성을 분석하기 위해 트립어드바이저와 페이스북
으로부터 2006년에서 2017년 4월까지의 바마코
호텔, 레스토랑에 대한 온라인 리뷰를 수집하였 다. 그리고 감성분석과 오피니언 마이닝 기법으 로 바마코를 방문하는 관광객들은 주로 비즈니 스 목적으로 방문하고, 호텔 및 레스토랑을 선택 하는 주요 요인으로 보안 수준과 호텔의 별점 및 스타일에 많은 관심을 기울인다는 사실을 밝혀 냈다.
2.5. 특성추출을 위한 텍스트마이닝 방법
텍스트 상에서 의미 있는 주제 및 특성을 추출 (aspect extraction)하기 위한 방법은 다양하게 연 구되어 왔다. 특성 추출은 문맥상 특징이 될 수 있는 단어를 식별하고, 해당 단어와 유사한 의미 를 내포하고 있는 단어들을 군집화한다. 예를 들 어, “There is also queen size air-mattress & baby travel bed (aka Pack and Play) available upon request.”이라는 문장에서 air-mattress, travel bed 와 같은 단어는 daybed, twin 등과 같은 단어들과 함께 침구 유형(bed type)의 의미를 갖는 특성으 로 형성된다. 특성추출 방법을 사용하면 사전에 알려져 있는 시설, 청결, 가격, 편의성 등의 숙박 업에 대한 평가요소 외에도 데이터에 기반하여 새로운 특성 혹은 보다 세분화된 특성을 추출할 수 있다는 장점이 있다.
특성 추출에 대한 이전 연구들은 크게 지도학 습(supervised learning) 기법과 비지도학습 (unsupervised learning) 기법 두 가지 접근법으로 분류된다. 지도학습 접근법에서의 특성은 순차 적으로 입력되는 문자(character) 혹은 단어(word) 들을 입력하여 핵심이 되는 카테고리를 예측하 는 전형적인 시퀀스 라벨링 문제(sequence labeling problem)로 간주된다(Jin & Ho, 2009).
더불어 딥러닝의 발전으로 심층 신경망, 합성곱
신경망 , 순환 신경망을 활용한 특성 추출 방법론 이 제안되었다(Poria et al., 2016; Wang et al., 2016). 이러한 딥러닝 기반 지도학습 모델이 특 성을 추출하는데 좋은 성능을 제공하는 것으로 알려져 있지만 이를 위해서는 특성이 부여된 방대한 양의 훈련 데이터가 필요하다는 제약이 있다.
반면 , 비지도학습 기반 특성 추출 기법은 훈련 데이터에 대한 제약이 없다는 점에서 실무적으 로 유용하다. 주로 토픽 모델링 기법이 적용되는 데 가장 일반적인 토픽 모델링 기법인 잠재 디리 클레 할당(Latent Dirichlet Allocation; LDA) 모델 (Blei et al, 2003)과 이를 확장한 다양한 모델 (Mimno & McCallum, 2008; Roberts, Stewart, &
Airoldi, 2016)이 사용되고 있다. 단어들의 동시 출현 빈도가 토픽 구성에 있어서 가장 중요한 정 보의 근원임에도 불구하고 LDA 모델은 이를 직 접적으로 반영하지 않고, 문서로부터 발생되는 단어의 패턴을 확률모형에 의해 간접적으로 파 악한다(Mimno et al., 2011). 또한 LDA 모델은 각 문서의 토픽의 분포를 추정해야 하기 때문에 문 서의 길이가 짧으면 그 성능이 저하되는 경향이 있다(He et al., 2017; Luo et al., 2019). 이러한 LDA 기반 모형의 한계를 He et al.(2017)과 Luo et al.(2019)은 벤치마크 예제를 활용하여 보여주 고 있다.
최근 제안된 Attention-Based Aspect Extraction (ABAE; He et al., 2017) 모델은 딥러닝 모델에서 흔히 차용되는 어텐션 메커니즘 (attention mechanism) 을 적용한 비지도학습 기반 특성 추출 기법이다.
ABAE 모델은 LDA와 달리 워드임베딩(word
embedding)을 사용하여 동시출현단어(word co-
occurrence) 분포가 반영된 벡터로 변환된 단어를
입력값으로 받는다. 어텐션 메커니즘을 활용하
<Figure 1> Research model
여 학습을 하는 동안 특성 구성에 관련성이 높은 단어만 강조함으로써 효율적으로 특징적인 단어 를 추출한다. 모델을 통해 각 특성에 해당하는 벡터가 학습이 되면, 코사인 유사도 행렬(Cosine similarity matrix)을 사용하여 임베딩 공간에서 해당 특성 벡터와 가장 가까운 단어들을 추출하 여 특성을 대표하는 단어로 사용한다. 확률적 모 형으로 토픽을 추출하는 LDA 모델과 달리 ABAE 모델은 워드임베딩을 통한 단어 벡터와 동일한 공간에서 직접적으로 특성 벡터를 학습 시키기 때문에 특징적인 단어를 추출하는데 좋 은 성능을 보이는 것으로 알려져 있다. 또한 텍 스트의 길이가 짧을 때 LDA가 성공적으로 토픽 을 추출하지 못하는 한계를 보완해 준다.
기존의 호텔업과 접객업에 관해 텍스트마이닝 을 활용한 연구의 대부분은 고객 리뷰 데이터에 대한 감성분석을 활용한다. 고객 리뷰에 비해 호 스트가 제공하는 시설 소개글은 일반적으로 많 은 문장으로 구성되어 있고, 해당 시설에 대한 충분한 정보를 제공하기 위해 다양한 요소를 포
함한다. 이러한 요소들을 효율적으로 반영하기 위해 본 연구에서는 ABAE 모형을 활용하여 문 장 단위의 특성을 추출하고 각 시설의 소개글이 포함하고 있는 특성의 수의 변화를 COVID-19 전후로 비교하는 모형을 사용한다.
3. 연구방법론
본 연구는 COVID-19 팬데믹이 발생에서 Airbnb
텍스트 데이터의 시설 소개글로부터 COVID-19
전후로 호스트가 소개하는 텍스트 특성의 변화
를 측정하여 공유 성과에 미치는 영향을 회귀모
형을 활용하여 분석하고자 한다. COVID-19 발
생 전과 후의 데이터 수집, 텍스트 데이터 전처
리 , 특성 추출, 변수 생성, 회귀모형 적합 및 해석
의 과정을 통해 분석이 진행되었으며 일련의 과
정은 <Figure 1>에 도식화되어 있다.
3.1. 데이터 수집 및 전처리
본 연구에서는 insideairbnb.com 웹사이트를 통 해 Airbnb에서 공개되는 각 숙박시설의 소개 및 메타정보를 수집하였다. COVID-19 발생 이전의 데이터는 2019년 6월에 수집된 데이터이고 COVID-19 이후의 데이터는 2020년 6월에 수집 된 데이터를 사용하였다. 2020년 3-6월에 미국 내에서 가장 COVID-19의 전파가 심각했던 미국 뉴욕, 저지시티, 보스턴 세 개의 도시에 위치한 Airbnb 숙소 데이터를 대상으로 분석하였다. 데 이터의 시설 소개글은 호스트가 공개하는 해당 시설에 대한 소개가 문자로 기록되어 있고, 이에 대한 원본 데이터는 COVID-19 이전은 총 57,925 개, COVID-19 이후는 총 55,460개의 리스트를 포함하고 있다.
COVID-19 전후 데이터의 시설 소개글에서 결 측값이 존재하는 리스트를 제거하고 각 시설소 개글은 문장 단위로 분리하였다. 각 문장을 토큰 화(tokenization)하여 문장 부호(예를 들면 ‘?’, ‘!’,
‘.’ 등)와 영어가 아닌 단어를 제거하고 대문자를 소문자로 변환하였다. 자연어를 분석하는데 의 미가 없는 토큰인 불용어(예를 들면, ‘a’, ‘an’, ‘ the’ 등)를 제거하여 유의미한 단어 토큰을 구성 한 뒤에 기본 사전형 단어인 표제어를 추출(예를 들면 ‘works’, ‘worked’, ‘working’ -> ‘work’)한다.
이 텍스트 전처리 과정은 파이썬 nltk(Bird et al., 2009) 패키지를 사용하였다. 전처리를 진행한 뒤 하나의 호스트가 제공한 시설이 2개 이상인 경 우를 제거하여 기업형 호스트들을 제외하였다.
COVID-19 전후 시설 소개글에 대한 각 특성의 변화를 측정하기 위하여 COVID-19 이전과 이후 에 둘 다 존재하는 시설만을 남겨두었다. 시설 유형이 Entire home나 Private room이 아닌 리스
트를 제거하고 COVID-19 전후 시설 유형이 변 경되지 않은 리스트만을 남겨두었다. 결과적으 로 데이터에 포함되는 총 listing ID는 17,651개이 고 시설 소개글의 문장은 COVID-19 이전에는 총 143,667개, COVID-19 이후에는 총 144,972개 이다. 시설 소개글 문장의 수는 COVID-19 이후 가 COVID-19 이전보다 많으며 호스트는 평균적 으로 8개의 문장의 시설 소개글을 작성하였다.
3.2. 텍스트 데이터의 특성추출
ABAE 기법을 사용하여 COVID-19 전후 시설 소개글의 각 문장이 포함하는 숙박 시설의 특성 을 추출하였다 . ABAE 모델의 입력 문자 벡터를 만들기 위해 파이썬의 gensim 패키지에서 제공 하는 Word2Vec의 Skip-gram(Mikolov et al., 2013)을 사용하여 200차원의 단어 임베딩을 학 습하였다. 특성의 개수를 7에서 12개로 설정하고 각 특성수에 대해 COVID-19 이전의 데이터를 ABAE 모델에 적합시켰다. 각 ABAE 모델은 32 batch-size, 15 epochs, 0.001 학습률인 Adam optimizer를 사용하여 학습하였다. 그리고 토픽분 석에서 토픽 개수를 정하기 위해 자주 사용되는 주제일관성 점수(coherence score; Mimno et al., 2011)를 기준으로 하여 최적의 특성의 개수를 선 택하였다. 주제일관성 점수는 주어진 z개의 특성 에서 상위 단어 N개를 가지는 집합을
라고 할 때 다음과 같이 정의된다 .
여기서
D (w)는 문서 내에서 단어 w의 빈도수이고
D (w1, w
2)는 하나의 문서에서 단어 w
1와
w2<Figure 2> Coherence score
가 동시 발생하는 빈도수이다. <Figure 2>는 각 특성의 개수에서 학습된 결과를 사용하여 상위 단어의 개수(N = 10,15,...,100)에 따라 달라지는 주제일관성 점수를 나타낸 그래프이다. 특성의 수가 9일 때 상위 단어의 개수가 평균적으로 가 장 많이 분포하여 높은 일관성 점수를 나타내고 있다. 따라서 본 연구에서는 9개의 특성을 사용 하여 추출된 결과물을 사용하였다. 각 특성에 해 당하는 상위 단어를 통해서 침실 유형(Bed Type), 건물 (Property), 주변환경(Garden), 인테리어(Interior), 관광지(Attraction), 주변 편의시설(Facility), 호스 트의 상호작용(Interaction), 교통(Transportation), 주방(Kitchen)으로 추론하여 명명하였고 이에 해 당하는 단어는 <표 3>에 수록되어 있다.
3.3. 특성 변화와 공유성과
본 연구는 COVID-19 전후 호스트 시설 소개 의 각 특성의 변화가 공유성과에 미치는 영향을 추정하기 위해 회귀모형을 활용하였다. <Figure 3>은 시설 소개글의 각 특성 변수를 생성하는 일 련의 과정을 나타내고 있다. COVID-19 전과 후 개별 시설 소개글로부터 각 특성에 해당하는 문 장의 개수를 구한다. COVID-19 전후 호스트 시 설 소개의 각 특성의 변화를 아래의 식으로 계산 하여 9개의 특성 변수를 생성하였다.
여기서 #Aspects in 2019와 #Aspects in 2020은
해당 listing이 각 2019, 2020년 시설 소개글에서
<Figure 3> Counting aspect sample
포함하고 있는 특성의 개수를 나타낸다. 이러한 방식으로 각 9개의 특성 변수(BedType, Property, Garden, Interior, Attraction, Facility, Interaction, Transportation, Kitchen)에 대해 특성의 개수 변 화량을 계산하여 설명변수로 사용하였다. 이는 COVID-19 발생 후에 호스트가 시설 소개를 변 경할 때 수정된 내용을 반영한다. 공유 성과와
특성 변화량 간의 관계에 시설 유형(Entire home, Private room)이 주는 영향을 함께 분석하기 위해 Private room에 대한 더미 변수(D
private Room)를 모 형에 함께 포함하였다.
각 시설의 공유성과는 아래의 식을 통해 계산
된 최근 12개월의 리뷰의 수로 측정하였다.
Variable Definition and Measure
Control variable
HostSince The number of days since a host’s listing in June 2019
HostResponseTime
Host response time in June 2019
(1=within an hour, 2=within a few hours, 3=within a day, 4=a few days or more)
Superhost Superhost status in June 2019 (1=superhost, 0=non-superhost) ReviewScoresRating Guest review score rating in June 2019
log (Price) Log-transformed accommodation price in June 2019 (unit: USD)
CancellationPolicy Host cancellation policy in June 2019 (0= flexible, 1= moderate, 2=strict)
Dummy variable DPrivateRoom A dummy variable (1= Private room, 0 = otherwise)
Aspect variable
BedType Changes in sentences about bedrooms Property Changes in sentences about property buildings Garden Changes in sentences about surrounding environment Interior Changes in sentences about interior decorations Attraction Changes in sentences about tourist attractions Facility Changes in sentences about nearby facilities Interaction Changes in sentences about interaction with the host Transportation Changes in sentences about transportations
Kitchen Changes in sentences about kitchens
<Table 2> Variable Description
Relative_#ReviewsLtm =
# ReviewsLtm in 2020+1
# ReviewsLtm in 2019+1
여기서 # ReviewsLtm in 2019과 # ReviewsLtm
in 2020은 각 2019년과 2020년 6월 기준 직전 12개월 리뷰의 수이다 . 이 값이 1인 경우 COVID-19 전후에 성과의 변화가 없는 리스트로 간주하여 제거하였다. 그 결과 회귀분석에 사용하는 데이 터에 포함되는 총 호스트 ID는 11,063개이다.
Relative_#ReviewsLtm의 히스토그램이 왼쪽으로
치우쳐진 그래프를 나타내므로 모형의 성능 향 상을 위하여 log 변환을 취한 후 종속변수로 사
용하였다.
통제변수로써 2019년 6월 기준으로 COVID-19 이전에 수집된 데이터로부터 호스트의 총 리스팅 기간 (HostSince), 호스트의 응답시간(HostResponseTime), 슈퍼호스트 여부(Superhost), 게스트의 평균 별점 (ReviewScoresRating), 숙소가격(log (Price)), 호스 트의 취소정책(CancellationPolicy)을 포함한다.
<Table 2>은 회귀분석을 할 때 사용되는 통제변 수의 정의 및 측정 방법을 나타낸다.
Model 1은 모든 통제변수와 시설 유형에 대한
더미변수, 특성 변화량 설명변수를 포함한 기저
모형(base model)으로써 해당 변수들이 공유성과
Inferred Aspects Representative Words
Bed Type
futon, daybed, twin, bed, airbed, convertible, fold, trundle, folding, pull, convert, topper, ottoman, pullout, comforter, cot, mattress, nightstand, double, folded, inflatable, size, dresser, firm, pillow, crib, bookcase, plush, smaller, sized
Property
lead, room, upstairs, backyard, balcony, terrace, porch, leading, adjacent, foyer, adjoining, courtyard, rear, patio, attached, communal, bedroom, hallway, staircase, shared, den, semi, deck, onto, spiral, downstairs, massive, separated, overlook, duplex
Garden
cardinal, foliage, pleasing, houseplant, song, hung, paneling, lantern, tank, succulent, floating, release, fox, framed, blooming, task, ivy, grow, incense, metal, recess, protect, floorboard, decorate, minimize, volume, dusty, festive, grandeur, moon
Interior
condominium, elegant, war, prewar, pristine, immaculate, classic, stylish, restored, styled, condo, traditional, luxurious, limestone, sophisticated, townhouse, elegance, boast, penthouse, charming, luxury, chic, awaits, finishing, triplex, modern, renovation, architectural, contemporary, historic
Attraction
wanting, adventure, visiting, getaway, anybody, exploring, anyone, sanctuary, explorer, vacation, explore, retreat, visit, budget, whether, trip, recharge, enjoying, looking, affordable, resting, relaxing, somewhere, touring, want, exploration, seeking, experiencing, simply, seek
Facility
eatery, pub, cafe, bookstore, bakery, sushi, boutique, diner, delicious, tavern, array, nightlife, restaurant, venue, cuisine, speakeasy, ethnic, brewery, dozen, club, tasty, joint, dive, jazz, variety, shop, pizza, nightclub, pizzeria, bistro
Interaction
issue, asked, problem, unless, physically, inquiry, discus, prompt, unavailable, arise, booked, arrange, communicate, present, however, contact, assist, concern, coordinate, require, emergency, regarding, advance, notice, prior, contacted, cellphone, availability, address, unfortunately
Transportation nearest, terminal, train, station, shuttle, metro, path, express, junction, bus, stop, transfer, min, cab, minute, tunnel, ace, ferry, closest, ten, route, av, taxi, minuet, subway, port, commuter, connects, authority
Kitchen
cookware, equipment, kitchenware, utensil, basic, cable, dishwasher, essential, supply, disposal, smart, tableware, ware, microwave, juicer, ventilator, condiment, cooking, toaster, wireless, oil, blender, complimentary, pantry, tool, internet, television, spice, machine, incl
<Table 3> Representative words for inferred aspects 의 변화율에 미치는 영향이 통계적으로 의미가
있는지를 검정하고 각 변수의 영향력을 모형화 한다. Model 2는 특성의 변화량이 공유 성과에 미치는 영향에 대한 시설 유형의 조절효과를 검 증하기 위하여 시설 유형에 대한 더미변수와 9 개의 특성 변화량 변수 간의 교호작용 항을 Model 1에 추가함으로써 구성된다. Model 2에서 유의하지 않은 교호작용 항을 후진제거법 (backward elimination)에 의해 제거하여 모수절 약원칙에 따른 최종모형을 도출하여 Model 3로 명명하였다.
Model 1
Model 2
<Figure 4> Correlation coefficient Model 3
4. 연구결과
4.1. 추출된 특성과 기술통계분석
<Table 3>는 ABAE 모델로부터 추출된 9개의
특성과 상위 대표 단어 30개를 나타낸다. 호스트 의 시설 유형별 수는 Entire home은 7,269개 (65.7%), Private room은 3,794개(34.3%)다.
<Figure 4>는 특성 변수들 사이의 상관 계수를 나타낸다 . 대부분의 경우 특성 간의 음의 상관관 계가 많으며 Bedtype과 Interaction은 크기가 – 0.1128인 가장 높은 음의 상관관계를 가진다.
Facility와 Transportation은 크기가 0.1107인 가장 높은 양의 상관관계를 가진다.
<Table 4>는 시설에 대한 리뷰 수, 시설 소개
를 구성하고 있는 문장의 개수, 각 특성을 나타
내는 문장의 개수의 평균이 COVID-19 전후로
Before COVID-19 After COVID-19
t-stat.
Mean (S.E.) Mean (S.E.)
# ReviewsLtm 15.7419 (0.1757) 12.4834 (0.1472) 27.9684 ***
# Sentences 8.5440 (0.0328) 8.6487 (0.0325) -9.8112 ***
Bed Type 0.7037 (0.0087) 0.7101 (0.0088) -1.9778 *
Property 1.5098 (0.0134) 1.5242 (0.0135)
Garden 0.4363 (0.0075) 0.4549 (0.0076)
Interior 0.8194 (0.0097) 0.8241 (0.0097)
Attraction 0.8282 (0.0097) 0.8396 (0.0097)
Facility 1.1220 (0.0104) 1.1208 (0.0105)
Interaction 1.1801 (0.0126) 1.2268 (0.0128)
Transportation 1.2153 (0.0119) 1.2162 (0.0120)
Kitchen 0.7292 (0.0092) 0.7321 (0.0092)
*** : p-value < 0.001, **:p-value<0.01,*:p-value<0.05
<Table 4> Summary statistics and paired t-test comparing before and after COVID-19
(n = 11,063)
- I have a high cleanliness rating already but will be working overtime to make sure that the space is clean and safe in these cautious times.
- In light of COVID19 and in order to best protect and provide for all guests as well as myself I am putting new - Additionally I have put a two day gap in between guests in order to let my home sit for a few days untouched
after disinfection before the next guests arrival.
- It has been cleaned in compliance with Airbnb's guidelines for Covid-19.
- (COVID-19) PROFESSIONALLY Disinfected - and has been vacant for over a month.
- Accepting bookings during Covid-19 with extra precautions in place to protects guests and hosts.
- Interaction will prob be minimal in person but via text or email I can be reached anytime.
- We have taken extra disinfecting precautions beyond CDC and AirBnB recommendations.
- Our place is completely private, clean and sanitized according to Airbnb's Advanced Cleaning Initiative.
- Cleaning and disinfectant products will also be available for your exclusive use (Website hidden by Airbnb) The front entrance is shared by me, my husband, our tena
- We want you to know that we’re doing our part to help our Airbnb guests stay safe by cleaning and disinfecting frequently touched surfaces (light switches, doorknobs, cabinet handles, remotes, etc.)
- Access to whole apt Available at your convenience via AirBnB app, phone call, text, or email.
<Table 5> Example sentences of the Interaction aspect after COVID-19
유의한 차이가 있는지를 검정하기 위해 11,063개 시설에 대해서 대응표본 t-검정(paired t-test)을
진행한 결과이다. 분석 결과, COVID-19 이후 각
시설에 대한 리뷰 수는 현저히 감소한 것으로 나
Model 1 Model 2 Model 3
0.1089 0.1104 0.1100
Adjusted 0.1076 0.1083 0.1084
Mean Squared Residual 0.9589 0.9585 0.9585
F statistics 84.37 54.76 71.81
P value < 0.001 < 0.001 < 0.001
DF 16 25 19
LogLik -15225.23 -15216.18 -15218.56
BIC 30618.07 30683.77 30632.65
Deviance 10157.26 10140.66 10145.01
DF residual 11046 11037 11043
Comparison with Model 1
Sum of Square 16.6040 12.2470
DF 9 3
F statistics 2.0079 4.4435
P value <0.05 <0.01
Comparison with Model 2
Sum of Square 4.3573
DF 6
F statistics 0.7904
P value 0.5773
<Table 6> Model summary and comparison
타난다. 이는 COVID-19 이후 전체적인 여행 산 업의 위축으로 인해 Airbnb의 시설의 공유성과 가 낮아진 것이 원인으로 보인다. 전체적인 시설 소개 문장의 개수는 COVID-19 이후 유의한 증 가가 있었다. 호스트가 시설에 대한 추가적인 더 해진 것으로 보이는 데 특히 Bed Type, Property, Garden, Attraction, Interaction에 대한 문장 개수 가 통계적으로 유의미하게 증가한 것으로 나타 난다.
특히 Interaction은 가장 유의한 문장 개수의 증가가 보이는데 이는 COVID-19의 특수성과 관 련하여 방역, 소독의 내용이 포함된 문장들이 Interaction 특성으로 구분된 것이 그 이유로 보인 다. <Table 5>는 COVID-19 발생 이후의 시설 소
개글 중 Interaction으로 구분된 문장의 예가 포함 되어 있다.
<Table 6>은 모형 간의 적합 결과를 비교하고 있다. Model 2와 Model 3은 Model 1과 비교했을 때 유의수준 0.05 하에서 통계적으로 유의한 차 이가 있다. 이를 통해 시설 유형에 대한 더미 변 수와 특성 간의 교호작용이 공유 성과를 설명하 는데 통계적으로 의미가 있음을 알 수 있다.
Model 2와 Model 3는 모형 간의 유의한 차이가
없지만 Adjusted 와 베이지안 정보지수(Bayes
Information Criterion, BIC)를 통해 Model 3가
Model 2에 비해 우월함을 알 수 있다. 따라서 본
연구는 모수 절약의 원칙에 의하여 추정 모수의
개수가 더 적고 상대적으로 양호한 통계량을 가
Variables Coef. (S.E.)
(Intercept) - 0.7885 *** (0.1706)
Control Variables
HostSince 0.0000 * (0.0000)
HostResponseTime - 0.2523 *** (0.0080)
Superhost - 0.3691 *** (0.0212)
ReviewScoresRating 0.0081 *** (0.0015)
log (Price) 0.0576 ** (0.0189)
CancellationPolicy 0.0230 . (0.0120)
Room Type DPrivateRoom - 0.0656 ** (0.0240)
Aspect
Bed Type 0.0794 ** (0.0271)
Property 0.0427 * (0.0179)
Garden 0.1337 *** (0.0333)
Interior 0.0535 . (0.0275)
Attraction 0.0877 *** (0.0258)
Facility 0.0564 * (0.0277)
Interaction 0.1011 *** (0.0153)
Transportation - 0.0006 (0.0204)
Kitchen 0.1518 *** (0.0306)
Interaction (Room Type *
Aspect)
DPrivateRoom:Garden 0.1163 * (0.0564)
DPrivateRoom:Facility - 0.0867 . (0.0488)
DPrivateRoom:Kitchen - 0.1252 * (0.0543)
*** : p-value < 0.001, **:p-value<0.01,*:p-value<0.05,.:p-value<0.1
<Table 7> Regression coefficient estimates: Model 3
지는 Model 3를 최종 모형으로 선택하였다. Model 3에 사용된 변수들의 분산팽창요인(Variance Inflation Factor)의 값이 2보다 작게 나타났고 따라서 변수 들 간의 다중공선성 문제는 없는 것으로 확인되 었다.
<Table 7>은 Model 3의 회귀계수 추정치를 보 여준다. Model 3의 통제변수의 회귀계수 추정치 에 의하면 호스트가 Airbnb 숙박 리스팅 일수가 많을수록, 게스트의 별점이 높을수록, 가격이 높 을수록, 취소 정책이 엄격할수록, 호스트의 응답 시간이 짧을수록 공유성과가 높은 것으로 나타 난다. 특성에 대한 변수들은 모두 양의 회귀계수 또는 유의하지 않은 회귀계수를 가짐으로써 특 성에 대한 설명이 증가할 때 대체적으로 공유 성 과가 향상되는 경향을 보였다.
변수선택을 통해 Garden, Facility, Kitchen과
Private room의 교호작용 항이 Model 3에 포함되
었다. Private room과 Garden의 교호작용 항이 양
의 값으로 유의하기 때문에 Entire home에 대한
Garden의 기울기보다 가파른 값(0.2500)임을 알
수 있다. 이는 숙박시설의 정원과 외부환경에 대
한 설명이 추가되었을 때 Entire home보다
Private room에서 더 긍정적으로 공유 성과에 영
향을 미쳤음을 의미한다. 반면에 Facility와의 교
호작용은 음의 값을 가진다. 유의성이 약하기는
하지만(p-value) 숙박시설 주변의 식당과 쇼핑시
설과 같은 편의시설에 대한 설명이 추가될 때
Private room보다 Entire home에게 더 긍정적인
효과가 있었음을 의미한다. <Table 8>을 참조하
면 Private room의 경우 시설 주변 편의시설에 대
한 설명의 증가는 공유 성과에 유의한 영향이 없
음을 알 수 있다. Kitchen에 대한 교호작용 역시
Room Type Aspect
Entire Home Private Room
Coef. (SE.) Coef. (SE.)
Bed Type 0.0794 ** (0.0271) 0.0794 ** (0.0271)
Property 0.0427 * (0.0179) 0.0427 * (0.0179)
Garden 0.1337 *** (0.0333) 0.2500 *** (0.0457)
Interior 0.0535 . (0.0275) 0.0535 . (0.0275)
Attraction 0.0877 *** (0.0258) 0.0877 *** (0.0258)
Facility 0.0564 * (0.0277) -0.0303 (0.0402)
Interaction 0.1011 *** (0.0153) 0.1011 *** (0.0153)
Transportation -0.0006 (0.0204) -0.0006 (0.0204)
Kitchen 0.1518 *** (0.0306) 0.0265 (0.0450)
*** : p-value < 0.001, **:p-value<0.01,*:p-value<0.05,.:p-value<0.1
<Table 8> Comparison regression slopes of aspects
음의 계수를 가지는데 이는 주방에 대한 설명이 증가할 때 Private room보다 Entire home에서 더 긍정적인 영향이 있는 것을 나타낸다. Facility와 마찬가지로 <Table 8>의 기울기를 보면 Private room에 대해 주방시설의 설명 증가는 공유 성과 에 유의한 영향을 미치지 못함을 알 수 있다.
시설 유형별로 살펴보면 Entire home의 경우 유의수준 0.05 하에서 Kitchen, Garden, Interaction, Attraction, Bed Type, Facility, Property의 순으로 공 유 성과에 긍정적인 영향을 강하게 미친다. Private room의 경우 Garden, Interaction, Attraction, Bed Type, Property의 순으로 공유 성과에 양의 영향 을 미치는 것으로 나타난다. Garden, Interaction, Attraction은 두 유형에서 공통적으로 매우 유의 하지만(p-value<0.001) Kitchen은 Entire home에 서만 강한 유의성을 보인다.
5. 결론 및 한계점
본 연구는 COVID-19 이후 공유 숙박업에서
시설 소개와 관련된 텍스트 내용에 따라 팬데믹 으로 인한 영향의 차이가 있는지 조사하기 위해 딥러닝 기법을 활용하여 실증 연구를 진행하였 다. He et al.(2017)에서 제안한 비지도학습 기반 의 특성 추출 기법인 ABAE 모델을 통해 시설에 대한 소개글로부터 최적의 주제일관성 점수를 보인 9개의 단어 군집을 통해 해당 단어들이 공 통적으로 내포하고 있는 의미를 추론하여 Bed type(침실 유형), Property(건물), Garden(주변환경), Interior(인테리어), Attraction(관광지), Facility(주 변 편의시설), Interaction(호스트의 상호작용), Transportation(교통), Kitchen(주방)로 요약할 수 있었다.
위 9개의 특성들이 공유 성과에 미치는 영향
을 검증하기 위해 회귀분석을 수행한 결과
Kitchen, Garden, Interaction 순으로 긍정적인 영
향을 보이나, 시설 유형에 따라 미치는 영향에는
다소 차이가 있음을 발견하였다. Entire room의
경우 Kitchen에 대한 설명은 공유 성과에 상당한
효과를 보이고 있지만, Private room의 경우에는
그렇지 않았다. 이러한 결과는 개인실(Private dining room)을 보유한 식당이 그렇지 않은 식당 보다 선호되는 경향이 있기 때문에 COVID-19와 같은 인지된 질병의 위험(Perceived diseases threat)은 접객업의 환경적 요인에 따른 고객의 심리적 영향을 중요성을 고려해야 한다는 Kim and Lee(2020)의 연구와 동일한 맥락을 보여준 다. 또한 가족단위의 여행객이 전체 이용객의 주 를 이루고 있다는 Lutz and Newlands(2018)의 연 구결과에서 알 수 있듯이, Entire room 이용객은 객실 내 취사시설을 적극적으로 사용할 의지가 있을 것이기에 Kitchen에 대한 설명에 더욱 민감 할 수 있다.
반면, Private room 이용객은 일반적으로 출장 의 목적으로 해당 지역을 방문하고 숙박만을 목 적으로 시설을 대여하는 경향이 있기 때문에 오 히려 Kitchen에 대한 내용이 Private room에서는 공유 성과에 별다른 영향을 미치지 않는 것으로 추측해볼 수 있다. 더불어 본 연구에서 실증 검 증한 Interaction 특성의 공유성과에 대한 긍정적 영향은 제공 서비스에 대한 친절한 설명 및 게스 트와의 커뮤니케이션에 최선을 다하고 있음을 보여주는 호스트의 태도는 공유 성과에 긍정적인 영향을 미친다는 연구결과를 보고한 Garcia(2019) 의 주장을 뒷받침하고 있다. 또한 Zhang et al.(2020)에서 호스트와 게스트의 정서적 교류는 비대면 계약에서 필연적으로 발생하는 심리적 거리를 줄이는 역할을 하고, 신뢰 구축에 영향을 미친다는 연구결과를 토대로 Interaction이 공유 성과에 정의 영향을 미치는 본 연구의 결과는 더
욱 설득력을 얻고 실무적으로 의미있는 결과로 활용될 수 있을 것이다.
본 연구는 다음과 같은 점에서 학술적 의의를 갖는다. 팬데믹 상황을 해석하는데 대부분의 선 행연구들은 사회의 전반적 반응 및 소비자(유저) 의 반응 측면에서 연구를 진행하였다(Zhang et al., 2020; Kim et al., 2015; Chuo 2007). 반면에 본 연구는 서비스 제공자 측면에서 의미 있는 속 성들을 추출, 검증함으로써 학술적 측면에서 새 로운 접근방식을 제안하였다. 더불어 서비스 및 제품 측면에서 소비자 반응을 살펴본 연구들은 설문조사에 의존하는 경향이 있었지만, 본 연구 는 공유경제 및 중고거래 등 소비자와 생산자의 구분이 없는 새로운 거래형태를 제공하는 플랫 폼에서 긱(gig) 유저
1)들의 반응을 텍스트마이닝 기법을 활용했다는 점에서 학술적 의의가 있다.
본 연구에서 공유성과를 측정하기 위해서 간 접적인 척도인 최근 12개월 간의 리뷰의 개수를 사용한 것은 한계점으로 여겨진다. 직접적인 척 도인 예약 건수 혹은 매출에 대한 데이터가 수집 가능하다면 COVID-19 전후의 성과 비교가 보다 정확하게 측정될 수 있을 것으로 기대한다. 또한 방역, 위생, 청결 등의 COVID-19와 관련된 특정 단어에 대한 발생 빈도를 변수화 하여 공유성과 에 대한 영향력을 모형화 한다면 특성 단위의 영 향에서 더 나아가 구체적인 단어의 영향력을 관 찰할 수 있을 것으로 보인다. 하지만 이러한 시 도는 해당 단어의 선정 방법과 모형의 복잡성 증 대와 관련하여 주의깊은 모델링이 필요하다 .
1) 긱 경제(gig economy)에서 활동하는 유저. 여기서 긱 경제는 일시적으로 혹은 임시적으로 서비스 제공 계약 체결하 거나, 독립적으로 활동하는 근로자를 고용할 수 있는 자유시장 시스템을 의미한다.