인공지능의 학습에 필요한 저작물의 수집에 저작권자의 허락이 없었다면 무단복제의 책임이 문제될 수 있다. 그러나 학습과 훈련을 마치고 완성된 인공지능 모델은 무단복제물로 볼 수 없다. 이것이 Getty Images v. Stability AI 사건에서 영국법원이 내린 결론이다.
인공지능기업이 언론사 등의 콘텐츠기업과 제휴 또는 포괄적협력 계약을 체결하고 인공지능 학습에 저작물을 활용한 경우에는, 계약범위를 벗어난 경우에 한하여 무단복제의 문제가 생길 수 있을 뿐이다. 이에 반하여 인터넷에 공개된 콘텐츠를 수집하여 저작권자의 허락없이 인공지능 학습에 활용한 경우에는, 그러한 무단복제가 공정이용에 해당하지 않는다면 저작권침해의 책임을 초래할 수 있다.
현재까지는 인공지능기업의 저작권침해의 책임을 인정한 사례가 많지 않고, 면책대상에 해당한다고 판단한 사례가 많다. 독일의 음악저작권협회(GEMA)가 OpenAI를 상대로 제기한 소송에서, 뮨헨법원은 학습단계에서 노래가사 자체를 ‘기억’하고 저장한 후 산출단계에서 원본 가사와 아주 유사한 가사를 생성해내는 것은 데이터 분석 (TDM)의 면책대상에 포함되지 않는다고 판단했다. 그러나, LAION이 58억개의 이미지에 대한 URL 목록과 해당 이미지에 포함된 '대체 텍스트(ALT texts)'로 구성된 데이터셋을 구축하여 인공지능기업들로 하여금 무상으로 이용할 수 있도록 제공한 사례에서, 함부르크법원은 LAION의 이미지 복제는 TDM 예외에 해당하여 저작권 침해로 볼 수 없다고 판단했다. Stability도 LAION의 이미지 데이터셋을 이용하여 모델의 학습을 추진했다.
또한, Anthropic이 인공지능모델 Claude를 개발하기 위하여 방대한 저작물을 무단이용한 사례에서, 캘리포니아북부지방법원은 그 학습과정과 콘텐츠생성은 고도로 ‘변형적인 이용 (transformative use)’에 해당하고 생산성 향상에 기여하는 공정이용에 해당한다고 판단했다. Meta를 상대로 제기한 저작권소송에서도 캘리포니아법원은 다소 다른 논리를 제시했지만 인공지능이 원저작물의 시장에 악영항을 미친다고 볼 수 없다고 판단하면서 적법한 공정이용에 해당한다고 결론내렸다. 캘리포니아법원의 판단은 공정이용의 쟁점에 관한 약식판결이다. 인공지능기업의 데이터수집과 이용 과정의 구체적 사실과 기술적 특징은 사건마다 다양하기 때문에, 인공지능의 저작물이용이 공정이용에 해당하는지 여부에 관하여 일률적으로 말하기는 어렵다.
영국판결은 우리나라에 많이 소개되지 못했지만 여러 가지 중요한 의미를 던져준 판결이다. Getty가 Stability를 상대로 제기한 소송에서, 영국 법원은 피고 Stability가 개발한 인공지능모델 Stable Diffusion은 무단복제물이 아니라고 판단했다. Getty는 Stability가 자사 이미지를 무단복제한 인공지능모델을 영국으로 수입하고 영국에서 배포/전송/판매했기 때문에 자사 저작권의 간접침해에 해당한다고 주장했다. 그러나, 사건을 담당한 Joanna Smith 판사는 인공지능모델은 방대한 이미지들을 학습하고 훈련과정을 거쳐 습득한 통계학적 패턴(pattern)과 가중치(weights)만으로 구성되어 있다고 판단했다. 모델에 저장된 패턴과 가중치들이 새로운 이미지를 생성해낼 수 있지만 그러한 모델이 원이미지들의 단순한 ‘기억’이나 ‘복제물’이라고 볼 수 는 없다고 판단한 것이다. 특히 Getty는 인공지능모델의 개발과정에 저작권자의 허락없이 이미지의 무단복제가 이루어졌기 때문에 인공지능모델이 자사 이미지의 무단복제물에 해당한다고 주장했다. 그러나, Smith 판사는 무단복제물에 해당하는지 여부가 인공지능모델 Stable Diffusion이 Getty 소유 이미지를 복제한 복제물인지 여부에 따라 판단할 문제라는 점을 중시하고, 인공지능모델 개발과정에 무단복제가 있었는지 여부와는 무관한 문제라고 지적했다. 원피고 양측의 전문가 의견 모두 인공지능모델은 방대한 분량의 학습 이미지를 분석하여 얻은 패턴과 수정과정을 거쳐서 확정한 가중치만으로 구성되어 있고 원고 소유 이미지는 전혀 포함되어 있지 않다고 진술했다. 특히 Smith 판사는 학습데이터로 활용된 LAION-5B 데이터셋이 약 220TB 규모의 이미지 데이터인데 반하여, Stable Diffusion 모델의 패턴과 가중치는 3.44GB 규모의 바이너리 파일로 다운로드할 수 있다고 하는 점을 중시했다. 피고의 인공지능모델이 원고 소유 이미지의 복제물에 해당하지 않는다면, 모델의 개발과정에서 무단복제가 있었는지 여부와 무관하게, 피고가 영국으로 인공지능모델을 수입 및 배포/전송하더라도 원고 저작권의 간접침해에 해당하지 않는다는 결론에 이르게 된다.
이번 영국 판결은 여러 가지로 중요한 의미를 갖는다. 첫째, Stable Diffusion이라는 모델이 원저작물의 무단복제물에 해당하지 않는다고 판단되었기 때문에, 그 개발 과정에서 이미지 무단복제 등의 저작권침해가 있었다 하더라도, Stable Diffusion의 운명에는 아무런 영향이 없다는 점이다. 따라서 누구든지 저작권침해의 위험에서 벗어나서 Stable Diffusion의 소스코드를 다운로드 받아서 이미지생성서비스를 제공할 수 있을 것이다. 현재 NightCafe Studio, Playground AI, Artbreeder 등이 Stable Diffusion 모델을 이용하여 이미지생성서비스를 제공하고 있다. 역동적으로 변하고 있는 예술산업에서 Stable Diffusion을 다운로드받아서 맞춤형으로 설정하고 더 창의적이고 경쟁적인 서비스를 제공할 수 있는 가능성이 많다.
둘째, 이번 영국 판결은 인공지능학습과 훈련을 하기 위한 데이터센터를 AI 친화적인 나라로 이전하는 것이 유리하다는 점을 잘 보여준다. Getty는 피고 Stability가 영국에서 이미지를 다운로드하고 이용했고 Stability가 저작권침해의 책임을 진다고 주장했다. 그러나, Stability의 모델 개발에 사용된 모든 컴퓨팅 자원과 활동은 미국 소재 아마존 웹 서비스(AWS)가 운영하는 데이터 센터에서 이루어졌다. Getty의 이미지를 무단복제한 행위가 미국에서 이루어졌다면 그러한 무단복제가 저작권침해인지 아니면 공정이용인지 여부의 판단을 할 수 있는 준거법은 영국이 아니라 미국 저작권법이 될 것이다. 따라서, Getty 모델 개발 과정의 무단복제로 인한 저작권침해 및 데이터베이스제작자권리침해에 관한 주장을 철회했고, 영국 법원은 오직 모델의 영국내 수입으로 인한 간접침해 여부에 관하여만 판단할 수 있게 되었다. 앞으로 인공지능 모델의 학습과 훈련은 강력한 저작권 보호 체계를 갖춘 나라 대신 널리 공정이용을 인정한 AI 친화적 국가로 옮겨가게 될 것이다. 첨단기업들은 '조세 피난처' 뿐만아니라 ‘저작권 피난처’로 절실히 필요하기 때문이다.
셋째, 국내문헌 가운데 영국고등법원의 판결로 소개한 문헌이 있지만, 이 사건을 담당한 영국 High Court of Justice는 제1심 법원으로 판결을 내린 것이기 때문에 이번 판결에 대한 불복은 다시 항소심에서 판단을 받게 될 것이다. 영국의 County Court는 각 지역의 사건을 관할하는 법원인데 반하여, High Court of Justice는 잉글랜드 및 웨일즈의 모든 중요 사건을 관할하는 법원이라는 의미에서 ’High’ Court of Justice라고 명명되어 있을 뿐이다. 미국과 영국 그리고 독일과 한국 등에서 저작권자와 인공지능기업들 사이에 벌어지고 있는 소송전은 아직 초기 단계에 있는 셈이다. 기업들은 저작권피난처가 어디인지 면밀하게 지켜볼 것이다. 각국의 저작권법 해석은 다를 수 있지만, 데이터센터를 유치하기 위한 각국의 노력에도 영향을 미칠 수 있다는 점은 명백하다. |