AI 제너레이터는 무서운 속도로 눈앞에서 진화하고 있지만 여전히 결함이 있습니다. AI 이미지에서 이상한 디테일을 발견하는 것은 사실 꽤 재미있는 일입니다. 그래서 많은 엔진에서 공통적으로 발생하는 문제인 미드저니 핸드가 화제가 되었습니다.

손이 AI 이미지 생성기에 그토록 도전하는 이유를 분석해 봅시다. 프로그래머들은 이미 이 밈에 나올 만한 문제를 해결하고 있지만, 인공지능이 학습하는 방식에 대해 생각해보는 것은 흥미롭습니다.

인공지능이 생성한 손이 화제가 된 이유

인공지능 엔진을 사용해 이미지를 생성하는 사람이라면 손이 제대로 나오는 경우가 드물다는 사실을 알고 있을 텐데, 트위터에 ‘사진’이 대량으로 등장하면서 이 이슈가 주목을 받게 되었습니다.

자세히 살펴보니 사람들의 이상한 손이 AI가 생성한 이미지로 밝혀졌습니다. 이것이 미드저니가 시도한 손이라는 사실이 상황을 더욱 흥미롭게 만들었습니다.

최고의 AI 엔진 중 하나도 인간 손의 복잡성을 처리할 수 없었기 때문에 Midjourney와 경쟁사의 역량이 시험대에 올랐습니다. 사실, DALL-E조차도 손가락과 손톱이 비현실적인 경향이 있습니다.

AI로 생성된 손이 항상 문제가 되어 왔다는 점을 고려하면 과대 광고는 지나치지만, 이러한 관심 덕분에 Midjourney v5가 출시되어 v4보다 개선되었습니다.

새 버전은 손 디자인을 개선하는 데 중점을 두었는데, 이는 AI 엔지니어들이 이 재미있는 소동에 주목하고 소프트웨어의 기능을 업그레이드하기로 결정했다는 것을 분명히 나타냅니다.

다른 엔진은 Midjourney의 예를 따르는 속도가 느리기 때문에 Photoshop으로 AI 아트를 수정하는 것은 여전히 귀중한 기술입니다. 프로그래머에게 가장 큰 장애물은 인공 지능이 설득력 있는 손을 그리도록 훈련시키는 것이 얼마나 복잡한가 하는 점입니다.

AI 이미지 생성기가 손을 그리는 데 어려움을 겪는 이유는 무엇인가요?

AI 엔진은 생성적 적대 신경망(GAN) 또는 안정적 확산을 사용하여 이미지를 생성합니다. 두 기술 모두 가장 기본적인 작품이라도 만들어내기 위해서는 광범위한 소스 자료, 훈련, 처리 능력이 필요합니다.

기존 이미지가 AI 학습의 핵심이기 때문에, 프로그래머는 엔진이 특정 단어가 무엇을 의미하는지, 해당 물체를 어떻게 표현할지 이해할 때까지 이 과정을 반복해서 반복하면서 수백만 장은 아니더라도 수천 장의 사진을 프롬프트와 함께 소프트웨어에 제공해야 합니다.

이 글도 확인해 보세요:  제품 사진 촬영을 위한 창의적인 소품 아이디어 9가지(그리고 각 소품의 사용 시기)

하지만 AI가 학습하는 소스 이미지는 주로 손이 다양한 위치로 묘사된 2D 이미지입니다. 곧게 펴진 손이든 구부러진 손이든, 손가락이 다섯 개이든 세 개이든 상관없습니다.

결국 기계는 손의 개념을 실제로 이해하지 못하며, 기계가 학습하는 사진에 항상 손이 명확하거나 일관되게 그려져 있는 것은 아닙니다. 이것이 바로 미드저니의 손이 못생긴 이유입니다: 바로 AI 혼동입니다.

AI 개발에 대한 엘론 머스크의 우려는 타당하지만, 일부 기술에는 아직 배워야 할 부분이 많습니다. 그리고 그 장애물은 왜곡되어 그려진 ‘손’ 이미지 그 이상입니다.

AI 이미지 생성기의 개선 속도가 느린 다른 이유

미드저니의 모델을 보면 , v5는 텍스트 프롬프트와 생성된 이미지 간의 고급 일관성, 더 높은 해상도 및 추가 도구를 제공합니다. 그러나 이러한 성과는 비용이 많이 듭니다.

AI가 손을 더 잘 사용하도록 훈련하려면 특히 3D에서 더 나은 이미지를 제공해야 합니다. 즉, 소스 자료를 확보하는 것부터 코딩을 개선하고 AI가 올바르게 학습할 때까지 반복 학습하는 과정에 많은 시간과 인력이 투입됩니다.

그럼에도 불구하고 소프트웨어는 멋진 예술 작품에서 실수를 할 수 있습니다. 방대하고 복잡한 작업일 뿐만 아니라 비용도 많이 듭니다. 따라서 아직은 무료 AI 텍스트-이미지 생성기가 Midjourney의 수준을 따라잡을 것이라고 기대하지 마세요.

간단히 말해, AI 엔진의 문제는 컴퓨터 프로그램이 손과 발과 같은 인간의 특징이나 작동 방식을 완전히 이해하지 못한다는 것만이 아닙니다. 또한 3D 이미지와 머신 러닝 기술을 통해 주변 세계를 보다 사실적으로 파악하는 데 도움이 될 수 있는 기술의 비용과 접근성 문제도 있습니다.

인공지능 이미지 생성기, 영원히 고군분투하지는 않을 것

손은 인공지능이 이진법으로 머리를 감싸기에는 까다로운 개념이지만, 이 문제에 대한 해결책은 이미 개발 중입니다. 미드저니, DALL-E 2 및 기타 플랫폼은 결국 기발한 손가락을 완전히 없애지는 못하더라도 최소한으로 유지할 수 있을 것입니다.

다른 AI 분야의 발전으로 기술은 끊임없이 진화하고 있으며, 개발자는 항상 새로운 적용 및 개선 방법을 배우고 있습니다.

By 최은지

윈도우(Windows)와 웹 서비스에 대한 전문 지식을 갖춘 노련한 UX 디자이너인 최은지님은 효율적이고 매력적인 디지털 경험을 개발하는 데 탁월한 능력을 발휘합니다. 사용자의 입장에서 생각하며 누구나 쉽게 접근하고 즐길 수 있는 콘텐츠를 개발하는 데 주력하고 있습니다. 사용자 경험을 향상시키기 위해 연구를 거듭하는 은지님은 All Things N 팀의 핵심 구성원으로 활약하고 있습니다.