• 검색 결과가 없습니다.

한계점 및 적용 확대를 위한 대응 방향

코로나19 이후 더 많은 사람들이 온라인 쇼핑을 활용하게 되었으며, 이는 그동 안 신선도 유지와 같은 이유로 외면받던 식품 시장으로도 확대되었다. 동시에 온 라인 데이터를 수집하여 분석할 수 있는 빅데이터 데이터 수집 기술에 대한 접근 성 역시 높아지고 있지만, 온라인 시장에 대한 구체적인 현황 파악은 요원한 상황 이다. 이러한 변화 속에서 공공의 역할은 앞으로 확대될 것으로 예상되는 온라인 시장에 대한 데이터를 수집·분석하고 정보를 제공하여 온라인 시장을 보다 경쟁 적으로 만들어줌으로써 소비자와 생산자 후생, 그리고 더 나아가 시장의 효용을 높이는 것이라고 할 수 있다.

그러나 온라인 데이터 수집 및 활용은 이제 시작하는 단계로 장점만 있는 것은 아니다. 본 연구에서 파악한 한계점으로는 (1) 빅데이터 분석과 활용을 위한 전문 성 및 다양한 전문가들의 협력 증대, (2) 온라인 데이터 수집과 관련된 제도적 장 치 마련의 필요성, 그리고 (3) 온라인 데이터의 대표성 개선이다. 따라서, 이와 같 은 한계점을 이해하고 보완할 수 있는 방법을 제안하고자 한다.

2.1. 빅데이터 분석의 전문성 확보

온라인 데이터 수집은 전수조사에 가까운 형태로, 통계청에서 제시한 16개의 주요 온라인 유통채널을 통해 데이터를 수집할 경우 개별 품목별로 하루 10만 개 정도의 정보가 수집되는 빅데이터(하루 약 1GB)가 된다. 더불어 수집되는 데이 터의 경우 대부분 비정형 데이터로 데이터 수집 후에도 텍스트 마이닝과 형태소 분석 등을 수행하여야 원하는 정보를 추출하여 분석이 가능한 형태로 데이터를 정리할 수 있다. 따라서 이와 같은 빅데이터를 처리할 수 있는 분석의 전문성을 확 보해야 하며, 물리적으로도 데이터를 저장할 수 있는 데이터 저장 공간의 확보 역 시 필요하다.

하지만 분석 기술만으로 빅데이터 분석이 가능해지는 것은 아니다. 수집된 데 이터를 정리하고 가공할 수 있는 분석 기술을 갖추었다고 하더라도, 명확한 목표 설정을 바탕으로 체계적으로 데이터를 수집하고 관리하지 않는다면, 유용하게 활용할 수 있는 데이터의 수집이 불가능해질 수 있다. 특히 웹스크레이핑의 경우, 보편적으로 활용될 수 있는 범용 데이터보다는 특정 목적의 연구를 수행하는 데 에 유용한 맞춤형 데이터를 생성할 수 있다는 점에서 데이터 수집 전에 명확한 목 표 수립은 필수적이다.

이와 같은 명확한 목적 부재로 인해 애써 수집한 빅데이터의 활용성이 부족한 경우는 이미 나타나고 있다. 각 정부 부처 및 기관별로 수집·생성되는 공공데이터

의 종류와 양은 지속적으로 증가하고 있으나, 대국민 대상 정책 서비스 개선 및 발 굴 관점에서의 데이터 활용 노력은 부족한 상황이다. 즉, 공공 분야 데이터 개방 은 양적으로는 크게 증가하였으나, 데이터의 품질이나 민간에서 비즈니스화 하 여 활용할 만한 데이터는 부족할 뿐 아니라 상세 데이터는 공개되지 않아 민간 영 역에서의 데이터 융·복합의 저해요인으로 지적될 수 있다.

따라서 데이터 수집에 앞서, 명확한 목표를 설정하여야 한다. 특히 다양한 주체 의 활용 수요에 맞춰 데이터 수집·구축·개방·활용의 체계적인 지원을 할 수 있어 야 하며, 이를 위해 정부와 공공기관 간 역할 분담이 필요하다. 또한, 기관별로도 역할에 맞는 다양한 분야(컴퓨터 공학 전문가, 통계학 전문가, 경제 및 경영학 전 문가, 정책학 전문가 등)의 전문 인력으로 구성된 조직을 구성하여 진정한 융·복 합을 실현할 필요가 있다.

2.2. 정보 제공 활성화를 위한 제도적 기반 마련

빅데이터 수집과 분석은 이미 민간 영역에서는 활발하게 이루어지고 있지만, 아직 개인정보 침해 및 데이터 수집 권한에 대한 명확한 합의가 내려지지 않은 상 황으로 관련 제도의 기반이 마련되어야 한다.

빅데이터는 대량의 개인정보가 수집 및 관리되므로 개인정보 보안에 대한 각별 한 주의가 필요하다. 특히 고객정보 유출사태의 경우 사회적으로 큰 문제로 이어 질 수 있다. 현재 방송통신위원회의 ‘빅데이터 개인정보보호 가이드라인’이 존재 하지만, 이 또한 현행 「개인정보보호법」에 위배될 수 있고, 인권 침해의 가능성으 로 이어질 수 있어 시민단체들은 우려를 표하고 있다. 따라서 정보보안 기술 개발 과 더불어 체계적인 정보보안 전략의 수립이 필요하다.

명확하지 않은 데이터 수집 권한 역시 해결해야 할 과제이다. 2020년 8월 이른 바 「데이터3법」이 시행되기는 하였으나, 데이터 수집 단계에서부터 허용기준이

명확하지 않아 불확실성은 여전하다는 우려가 많다.32) 특히 불법이라고 판결이 확정된 숙박업소 플랫폼 “여기어때”의 “야놀자” 데이터 무단 복제 사례, “사람인 HR”의 “잡코리아” 채용공고 정보 수집 사례는 이들 회사가 경쟁사의 정보를 웹 스크레이핑을 활용하여 수집하다가 문제가 된 경우이다.33) 기업들은 이미 웹스 크레이핑을 활용하고 있지만, 이와 관련된 명확한 법규나 합의가 마련되지 않아, 그때그때 판결에 의존해야 하는 상황이다.

이에 대한 대안으로 각 업체별로 데이터 수집의 범위와 방법을 결정하여 표기 하자는 의견도 있다. 다만 이 경우, 기업들이 대부분 스크레이핑을 금지하도록 설 계할 가능성이 있는데, 이는 빅데이터가 가져올 수 있는 긍정적인 부분까지 포기 하는 “교각살우”의 상황으로 이어진다는 목소리도 있다. 특히, 데이터 수집 자체 를 금지하게 되면, 데이터 및 정보를 독점하고 있는 대형 온라인 사업자가 왜곡된 정보를 소비자에게 제공해 소비자의 후생과 시장의 효율을 저해할 수 있기 때문 이다. 따라서, 보호가 필요한 데이터와 사용이 가능한 데이터에 대한 명확한 기준 이 마련되어야 할 필요가 있으며, 이를 위해 적합한 법안 마련이 함께 되어야 한 다. 이를 통해 시장에 대한 적합한 정보를 수집·가공·제공하는 것은 시장을 경쟁 적으로 만들어 효율을 높이는 동시에 소비자와 생산자 후생을 증대하는 공익적 목적 달성에 기여할 수 있을 것으로 기대한다.

32) 조선비즈. 2020. 9. 23. “데이터 수집부터 겁나는 기업들...‘불법인지 합법인지 모르겠다.’” <https:

//biz.chosun.com/site/data/html_dir/2020/09/23/2020092300325.html>. 검색일: 2021.

3. 6.

33) 이와 관련된 법적/제도적 검토는 <부록>에 실린 “인터넷 데이터 수집 기술의 법적/제도적 한계”에서 자세하게 서술되어 있다.

2.3. 온라인 데이터의 대표성 검증

코로나19 이후 온라인 쇼핑의 증가하였지만, 온라인 쇼핑의 사용 계층은 연령, 소득 수준, 교육 수준, 인터넷 이용률 등에 따라 차이를 보이고 있어 온라인 데이 터의 대표성에 대한 확인이 필요하다. 이 연구에서 수행한 온라인 쇼핑몰 데이터 수집을 예로 들면, 온라인상에 공개되어 있는 가격과 구매량 데이터를 수집·분석 하였기 때문에 소비자 인구학적 특성은 고려되지 못하였다. 따라서, 온라인에서 수집한 데이터에 근거하여 분석할 경우, 분석의 결과가 일반적인 소비자의 소비 성향을 반영할 수 있는가에 대해서는 여전히 의문이 남는다. 대표성을 확보하지 못한 데이터에 근거한 부정확한 정보의 제공은 시장의 효용 증대에 도움이 되지 못하고 오히려 시장 교란의 위험성도 존재하기 때문에 온라인 데이터의 대표성 검증은 반드시 이루어져야 한다.

그러나 온라인 데이터의 대표성 검증은 민관 협력을 통하지 않고서는 이루어질 수 없다. 기업의 입장에서는 기업 경영 정보 보호 또한 중요한 부분이므로, 공공 의 이익만을 내세워 협력을 강요할 수는 없다. 따라서 온라인 데이터 수집의 명확 한 범위 설정의 필요성과 마찬가지로, 온라인 데이터 대표성 검증 또한 민관 협력 을 통한 명확한 기준 마련부터 시작할 것을 제안하고자 한다. 공공 기관의 투명한 정보 제공을 통한 시장 효용 증대와 최근 기업에서 자생적으로 일어나고 있는 ESG 경영 가치를 통한 공감대를 형성한다면, 온라인 데이터 검증 및 공개에 대한 기준과 범위 설정이 가능해질 것이라고 본다. 기업 또한 온라인에서 데이터를 수 집하고 분석하여 경영 활동에 활용하고 있는 만큼, 온라인 데이터의 대표성 검증 은 공공의 이익 증대는 물론, 공익을 위한 기업의 투자 수익률 측면에서도 도움이 될 수 있다는 ESG 경영 개념의 확장과도 흐름을 같이 할 수 있을 것이다.

인터넷 데이터 수집 기술의 법적/제도적 한계

곽환희(법무법인 오른하늘 파트너 변호사)34)

1. 검토의 배경

그동안 분석과 분류의 개념으로만 인식되었던 ‘데이터’가 4차 산업시대에 관한 논의가 활발히 이루어지고 있는 요즘 그 가치를 인정받아 산업화되고, 그 자체로 거래가 이루어지는 시장이 형성되고 있다. 때마침 이루어진 「데이터 3법」35)의 개 정으로 인하여 데이터 경제 산업이 활성화되는 데 필요한 법률적 해석의 틀까지 마 련된 상황이다.

데이터 거래와 유통 시장이 활성화되면서 해당 데이터의 분석을 통해 유의미한 경제적 가치를 창출하고자 하는 기업들이 늘어나게 되었고, 해당 기업들은 웹상에 산재해 있는 다양한 데이터(이른바 ‘빅데이터’)를 얻기 위하여 특정한 기술을 이용 하고 있다. 한편 해당 기술이 발전함에 따라 웹상에 산재해 있는 정보를 취득하는 행위가 ① 관련 법에 의하여 형사적으로 처벌되는 행위가 아닌지, 혹은 ② 정보 생

34) 연세대학교 법학과 졸업. 사법연수원 40기. 현(現) 법무법인 오른하늘 파트너 변호사.

35) 「개인정보보호법」(2020. 2. 4. 일부개정, 2020. 8. 5. 시행, 법률 제16930호), 「신용정보의 이용 및 보호에 관한 법률」(2020. 8. 4. 일부개정, 2020. 8. 5. 시행, 대통령령 제30893호, 이하 ‘신용 정보법’이라고 한다), 「정보통신망 이용 촉진 및 정보보호에 관한 법률」(2020. 2. 4. 일부개정, 2020. 8. 5. 시행, 법률 제16955호, 이하 ‘정보통신망법’이라고 한다)을 의미하며, 이하 통틀어 「데 이터 3법」이라고 한다.

부 록

관련 문서