주요 내용
인공지능으로 제작된 동영상의 발전은 눈부시지만, ‘언캐니 밸리’로 알려진 불안한 현상은 여전히 지속적인 문제로 남아 있습니다.
인공지능 기술의 발전으로 매우 사실적인 동영상 콘텐츠 제작 능력이 향상되었지만, 이러한 발전에도 불구하고 이러한 미디어를 시청할 때 느끼는 불안감이나 불편함은 여전히 존재합니다.
최근의 인공지능 생성기는 전례 없는 수준의 완성도를 달성하기 위해 노력하고 있지만, 이러한 추구는 생성된 콘텐츠에 생동감이 부족하고 무미건조한 결과를 초래할 수 있습니다.
다양한 인공지능 기반 텍스트-비디오 시스템을 실험하면서 저는 그 결과물에서 흥미로운 현상을 관찰했습니다. 이 기술의 놀라운 기능에도 불구하고 최종 결과물에는 불안한 느낌을 주는 품질이 있었습니다. 상당한 고민 끝에 저는 불안감의 근본 원인이 언캐니 밸리 가설의 영역에 있다는 것을 이해하게 되었습니다.
멀티미디어 작업에서 시각적 요소를 향상시키기 위해 특정 인공지능 기반 리소스를 활용하고 있지만, 미학적으로 공감을 얻지 못하는 기괴한 모습을 종종 보여주기 때문에 동영상 콘텐츠 제작에 인공지능 기술을 사용한다는 개념을 받아들이기 어렵습니다.
AI 텍스트-비디오 생성기의 가장 큰 문제점
딥러닝의 발전 덕분에 AI 비디오 생성은 단기간에 큰 발전을 이루었습니다. AI 동영상 생성 기술이 폭발적으로 발전한 2023년에 온라인에 접속해 있었다면 윌 스미스가 스파게티 를 먹는 이 클립을 기억하실 것입니다. 당시에는 획기적인 기술이었지만, 부자연스럽고 불안해 보였던 것은 부인할 수 없습니다.
2024년에는 이러한 생성 AI 비디오 도구가 더욱 정교해져 더욱 부드러운 비주얼과 사실적인 움직임을 만들어낼 것입니다. 2023년 런웨이 2세대로 제작한 동영상과 2024년 OpenAI가 공개한 소라 AI를 소개하기 위해 공개한 동영상의 차이점을 살펴보세요.
성능은 눈에 띄게 향상되었지만, 아직 공개적으로 사용할 수 없지만 이것이 우리가 약속받은 품질입니다. 소라를 아직 배포할 수 없기 때문에 윌 스미스의 동영상에 등장하는 스파게티를 연상시키는 섬뜩한 결과를 낳을 가능성이 있는 열등한 발전기에 의존해야 한다는 점에서 여전히 큰 한계가 남아 있습니다.
“화창한 날 공원을 산책하며 카메라를 향해 웃으며 손을 흔드는 사람”이라는 프롬프트를 사용하여 PixVerse 으로 만든 이 동영상을 보세요. 새들이 머리 위를 날고 나무들이 바람에 살랑살랑 흔들리고 있습니다.”
브라우저가 동영상 태그를 지원하지 않습니다.
처음에는 시각적 표현이 만족스러운 수준인 것처럼 보이지만, 인물의 숫자, 머리카락, 얼굴이 대기 속에서 액화되기 시작하면서 불안한 느낌이 시청자에게 스며듭니다. 영상 결과물에 사실감과 미적 매력을 더하는 소라와 같은 최첨단 시스템의 등장에도 불구하고, 인위적으로 생성된 인간 피사체와 자연 환경의 묘사는 관찰자들 사이에서 불안감을 계속 불러일으키고 있습니다.
AI 기술의 발전은 동영상 생성 기법에도 큰 변화를 가져왔습니다. 초기 모델에서는 클레이 애니메이션을 연상시키는 조잡한 애니메이션과 같이 인공적인 흔적이 뚜렷한 동영상을 제작하는 경우가 많았지만, 최근의 생성기는 출력 품질 측면에서 괄목할 만한 발전을 이루었습니다. 사실 이러한 발전으로 인해 지나치게 다듬어져 생동감과 활력이 없는 것처럼 보이는 완성도가 높아졌다고 주장하는 사람들도 있습니다.
언캐니 밸리 현상은 무언가가 거의, 그러나 완전히 인간은 아닌 것처럼 보일 때 발생하는 불안감이나 불편함이라고 설명할 수 있습니다. 이는 부자연스럽거나 인위적인 느낌을 불러일으키며, 전체적으로 부자연스럽고 불안하며 황량하고 생명이 없는 듯한 인상을 줍니다.
인공지능 기반 텍스트-비디오 생성기의 발전에도 불구하고 ‘언캐니 밸리’로 알려진 불안한 현상은 지속될 가능성이 높습니다. 꿈속의 풍경을 연상시키는 시각적으로 초현실적인 경험을 의도적으로 만들려는 것이 아니라면, 앞으로의 영상 작업에서 이러한 기술을 활용하는 것을 자제해야겠습니다.