공개데이터 크롤링, 합법과 불법의 경계는?
top of page
법률정보 상세

공개데이터 크롤링, 합법과 불법의 경계는?


국가 데이터 정책은 두 가지를 지향한다. 데이터 공유와 데이터 소유다. 데이터 공유와 데이터 소유란 반대 개념이다. 데이터 공유가 데이터를 여러 사람이 많이 활용할 수 있는 상태를 의미한다면 데이터 소유는 데이터의 생성이나 가치 형성에 기여한 사람에게 권리와 이익을 부여하는 것을 뜻한다.

데이터 공유를 강화하는 법률로는 공공데이터법 등이 있다. 데이터 소유를 강화하는 법률로는 부정경쟁방지법 또는 저작권법 등이 존재한다. 현재 상황을 볼 때 공공데이터의 경우 공유를 강화하는 체계, 민간데이터의 경우 소유를 강화하는 체계가 각각 갖춰져 있다.

그러나 민간데이터의 경우도 데이터 공유를 촉진할 필요도 있고, 이것이 국가 데이터 정책의 과제가 돼야 한다. 그러나 이러한 정책 방향을 실현하기 위해서는 매우 섬세한 접근이 필요하다. 자칫 무리한 공유 체계를 고집하게 되면 자유시장경제 질서를 침해하는 사태가 발생할 수 있기 때문이다.

민간데이터의 공유 체계를 강화하려면 몇 가지 전제가 있어야 한다. 첫째 해당 데이터의 공익성이나 공공성이 큰 경우에는 공유 체계를 강화할 명분이 있어야 한다. 둘째 해당 데이터의 공익성이나 공공성이 없더라도 데이터 공유로 얻는 이익이 큰 경우에는 공유 체계를 강화할 수 있어야 한다.

관련해서 중요한 쟁점이자 불법과 합법의 경계에 있는 것이 바로 공개데이터의 크롤링 사안이다. 공개데이터란 일반 공중이 누구든지 추가적인 기술적 조치 등이 없이 접근하고 열람할 수 있는 상태의 데이터를 의미한다. 크롤링이란 주로 공개데이터를 소프트웨어로 활용하는 등의 기계적인 방법으로 가져와서 데이터를 추출하는 행위를 의미한다.

공개데이터의 크롤링 사건은 2013년 리그베다위키 vs 엔하위키미러 사건에서 시작된다. 엔하위키미러는 리그베다위키의 동의 없이 리그베다위키의 데이터베이스(DB)를 통째로 옮기는 방법, 즉 미러링해서 서비스했다. 이러한 행위에 대해 법원은 데이터베이스권 침해 또는 부정경쟁행위로써 위법하다고 판단했다.

그 이후 잡코리아 vs 사람인 사건의 경우도 사람인이 잡코리아의 채용정보를 동의 없이 크롤링해서 서비스한 사건이다. 법원은 이러한 행위에 대해서도 데이터베이스권 침해 또는 부정경쟁행위로써 위법하다고 판단했다.

야놀자 vs 여기어때 사건의 경우는 공개데이터 이상의 크롤링한 사건이다. 이 역시 데이터베이스권 침해 또는 부정경쟁행위로써 위법하다는 판단을 받았다. 다만 형사 항소심에서는 형사적 관점을 반영해 무죄를 선고했고, 이는 현재 대법원에 계류돼 있다.

이들 세 사건의 경우 큰 범주에서는 크롤링 사건으로 볼 수 있지만 좀 더 세밀하게 들여다보면 동일한 사안은 아니라는 점을 알 수 있다. 즉 크롤링도 일의적인 것이 아니고 다양한 형태가 존재할 수 있다는 것이다.

리그베다위키 vs 엔하위키미러 사건의 경우에는 미러링이라는 방법, 잡코리아 vs 사람인 사건의 경우는 전형적인 크롤링 방법이 각각 사용됐다. 그러나 야놀자 vs 여기어때 사건의 경우는 일정한 조치를 해서 공개데이터 이상의 크롤링이 있은 사안으로, 일정한 조치가 취해졌다는 점에서 엄밀히 말하면 공개데이터 사안이 아니기에 본 논의에서 제외해야 한다고 본다.

최근 언론에 자주 나오는 사건이 있고, 자주 문의되는 사안이 또 있다. 그것이 바로 네이버 vs 다윈중개 사건이 있다. 이 사건은 다윈중개가 네이버의 부동산 매물정보를 부동산 매물정보의 링크 표시 목적으로 가져오긴 하지만 이용자는 링크를 타고 네이버 사이트에서 부동산 매물정보를 볼 수 있도록 하고 있다는 점에서 앞의 세 사건과는 전혀 다른 양상을 띠고 있어 이들 세 개의 크롤링 사안과 단순 비교하기에는 무리가 있다. 이 사건은 현재 법원에 묶여 있다.

참고로 이들 네 사건 모두에 대하여 필자는 관여했거나 관여하고 있고, 다음 주에는 공개 세미나에서 이와 관련된 발표도 할 예정이다. 이들 사건의 공통적인 쟁점은 공개데이터에 대한 법적 기준이 무엇이냐에 관한 것이다.

이와 관련해서 공개된 개인정보에 관해 대법원은 공개된 개인정보의 공공성·공익성, 공개된 개인정보에 관한 정보 주체의 공적인 존재성, 처리로 얻을 수 있는 공익성 등을 기초로 공개된 개인정보에 대한 처리에서 동의 의무를 면제해 줬다.

이들 사안은 공개된 개인정보 영역이 아니라 공개데이터 영역에서 데이터 공유와 데이터 소유의 경계선을 찾아가는 과정이라 할 수 있고, 사회적 합의에 도달하는 과정이라 할 수도 있다. 개인적으로는 '공유 vs 소유(재산권)'가 대립하는 공개데이터에서는 '공유 vs 개인정보자기결정권(인격권)'이 대립하는 공개된 개인정보보다는 완화된 기준이 적용돼야 하지 않을까 생각한다.

* 법무법인 민후 김경환 변호사 작성, 전자신문(2022. 5. 3.) 기고.

최근 게시물

​태그 모음

bottom of page