ChatGPT, Bard와 같은 인공지능 모델의 개발은 인간이 생성한 데이터의 활용을 전제로 합니다. 이러한 모델은 방대한 양의 정보를 활용하여 인간의 지능과 창의성을 시뮬레이션하도록 설계되었습니다. OpenAI와 Meta를 비롯한 AI 부문의 주요 주체들은 온라인 소스에서 얻은 방대한 양의 언어 데이터를 수집하고 처리하는 데 자원을 활용하여 이러한 언어 모델의 기능을 향상시켰습니다.

LLM과 그 학습 방법의 등장으로 저작권법 및 AI와 피할 수 없는 충돌이 발생했습니다. 코미디언 사라 실버맨 등이 저작권 위반 혐의로 OpenAI와 메타를 상대로 소송을 제기하면서 이러한 대립이 현실화되고 있습니다.

사라 실버먼과 다른 아티스트들이 OpenAI와 Meta를 소송하는 이유

캘리포니아에서 제기된 집단 소송 [PDF]에서 코미디언 사라 실버먼과 다른 작가(크리스토퍼 골든과 리처드 카드리)는 저작권 침해로 인해 OpenAI와 Meta에 손해배상을 청구합니다. 이 소송은 OpenAI와 Meta가 저작권이 있는 책을 해적판 웹사이트로부터 스크랩하여 AI 모델을 학습시켰다고 주장합니다. 이는 AI 모델이 저작자에게 보상하지 않고 해적판에서 훈련 데이터 세트를 다운로드한 것과 마찬가지입니다.

공교롭게도 OpenAI를 상대로 한 건의 개별 집단 소송 [PDF]에서는 이 회사가 무단으로 개인 정보를 사용하여 ChatGPT를 학습시켰다고 주장하고 있습니다. 구글도 구글 바드를 훈련시키는 데 도난당한 데이터를 사용했다는 혐의로 비슷한 소송에 직면해 있습니다. 퍼블리싱 작업과 사적인 개인 데이터는 다르지만, 개인 정보를 보호하는 습관을 들여야 하는 이유입니다.

사라 실버맨이 소송에서 승소할 가능성은 얼마나 되나요?

이미지 크레딧: freepik

실버먼과 다른 크리에이터들은 ChatGPT가 요청 시 정확한 책 요약을 제공할 수 있다고 주장해왔습니다. 이 주장은 AI 모델이 해당 저작물과 관련된 기사, 댓글 및 소셜 미디어 게시물을 포함하는 방대한 인터넷 기반 텍스트 데이터에 노출되었을 가능성이 높기 때문에 AI 모델이 학습 과정에서 저작권이 있는 자료에 어느 정도 접근했을 수 있는지에 대한 의문을 제기합니다.

또한 메타는 AI 모델 학습에 사용된 문헌의 출처를 공개했는데, 이 문헌은 전자책 토렌트 웹사이트로부터 제공된 것으로 밝혀졌습니다. 또한 OpenAI에 대한 집단 소송은 앞서 언급한 조직이 불법 웹사이트로부터 저작권이 있는 자료를 조달했을 수도 있음을 암시하지만, OpenAI는 아직 이러한 혐의를 확인하지 않았습니다.

이 글도 확인해 보세요:  AI 이미지 생성기가 '손'을 생성하는 데 어려움을 겪는 이유

OpenAI와 Meta가 불법 토렌트 사이트를 이용해 AI 모델 학습에 필요한 저작권이 있는 자료를 확보했다는 사실이 입증된다면 실버먼 씨는 법적 소송에서 성공할 가능성이 높습니다. 그러나 AI 모델은 법원이 AI 관련 저작권 위반에 대한 판단을 내릴 수 있는 판례가 없는 미지의 영역입니다. 이것이 바로 유럽 연합이 AI 법을 제안한 동기 중 하나입니다.

AI 모델과 저작권법의 미래는 무엇인가요?

인공지능에 대한 저작권법의 적용은 더 많은 탐구와 개발이 필요한 문제입니다. 인공지능 창작물에 대한 저작권 소유권은 더욱 복잡하게 판단해야 합니다. 그럼에도 불구하고 현행 규정은 보호 대상 저작물에 대한 무단 접근으로부터 인간 창작자를 보호하고 공정한 보상, 동의 및 인정을 보장합니다. 따라서 이러한 조항이 AI 모델에도 유사하게 적용될 수 있을지는 아직 불확실합니다.

유럽 연합 의회는 인공지능 모델이 저작권법을 준수하는 방식에 대한 통찰력을 제공하는 규정을 제안했습니다. 이 규정이 제정되면 ChatGPT 및 Bard와 같은 인공지능 시스템은 학습 목적으로 사용된 데이터 세트와 저작권이 있는 자료를 공개해야 할 의무가 있습니다. 이 법안은 이러한 AI 모델이 불법 해적판 웹사이트를 통해 책, 영화, 음악, 사진 등 저작권이 있는 저작물을 획득했는지 여부를 명확히 하기 위한 것입니다.

AI 집단 소송 판결, 법적 선례가 될 것

학습을 목적으로 인터넷의 다양한 소스에서 정보를 수집하기 위해 대규모 언어 모델을 활용하는 것은 일반적인 관행입니다. 그러나 이러한 데이터를 얻기 위해 불법 토렌트 웹사이트에 접속할 때 발생할 수 있는 잠재적인 저작권 위반에 대해 이러한 모델이 책임을 질 수 있는지에 대한 의문이 제기됩니다. 또한 이러한 행위가 문제가 될 경우 이를 입증하는 것도 문제가 될 수 있습니다.

주요 인공 지능 모델을 담당하는 기술 회사를 대상으로 한 집단 소송의 결과는 향후 몇 년 동안 영향을 미칠 중요한 선례가 될 것으로 예상됩니다.

By 최은지

윈도우(Windows)와 웹 서비스에 대한 전문 지식을 갖춘 노련한 UX 디자이너인 최은지님은 효율적이고 매력적인 디지털 경험을 개발하는 데 탁월한 능력을 발휘합니다. 사용자의 입장에서 생각하며 누구나 쉽게 접근하고 즐길 수 있는 콘텐츠를 개발하는 데 주력하고 있습니다. 사용자 경험을 향상시키기 위해 연구를 거듭하는 은지님은 All Things N 팀의 핵심 구성원으로 활약하고 있습니다.