퀵 링크
⭐ 구글은 어떻게 Imagen AI 모델을 훈련시켰나요?
주요 내용
Google은 창의적인 감각으로 시각적으로 놀랍고 매우 사실적인 이미지를 생성할 수 있는 인상적인 인공지능(AI) 기반 텍스트-이미지 확산 모델인 Image 2를 개발했습니다. 이 혁신적인 기술은 고급 머신 러닝 알고리즘을 활용하여 서면 설명이나 문구를 매혹적인 시각적 표현으로 변환하여 사용자가 간단한 텍스트 입력을 통해 독특한 예술 작품이나 사진을 손쉽게 생성할 수 있도록 합니다. 그 결과물은 종종 놀랍고 디지털 아트와 디자인의 세계를 혁신하는 AI의 놀라운 잠재력을 보여줍니다.
이미지 2는 원본 이미지를 기반으로 한 배경 복원, 경계선 확장 및 참조 이미지를 새로운 이미지 제작을 위한 GID로 사용하는 등의 기능을 제공합니다.
무료 Google 클라우드 계정을 발급받으면 이 고급 이미지 생성 도구에 대한 액세스 권한을 부여하는 Vertex AI 플랫폼을 활용하여 이미지 2를 탐색할 수 있습니다.
Google에서 개발한 혁신적인 텍스트-이미지 변환 인공 지능인 Imagen을 소개합니다. 이 기술은 사용자가 작성한 설명에서 고품질 이미지를 생성할 수 있도록 지원합니다. 이 기술의 최신 버전인 Imagen은 더욱 사실적이고 시각적으로 매력적인 결과물을 생성하도록 설계된 고급 기능을 자랑합니다. 전문 개발자이든 비즈니스를 운영하든 관계없이 누구나 Google 클라우드 플랫폼을 통해 무료로 Imagen 2를 실험해 볼 수 있습니다. 시작하려면 다음의 간단한 단계를 따르세요.
Google의 이미지 2란 무엇인가요?
Imagen 2 는 Google에서 개발하고 2023년 12월 13일에 출시된 의 AI 텍스트-이미지 확산 모델입니다. 이 모델은 텍스트 설명에서 멋진 이미지를 즉시 생성할 수 있는 DALL-E 2, 미드저니, 스테이블 디퓨전 등 점점 늘어나는 AI 텍스트-이미지 생성기 목록에 추가되었습니다.
이미지 2는 이전 버전( 이미지 )에서 큰 도약을 이루었으며, 경쟁사처럼 예술적이고 사실적인 결과물을 만들 수 있는 완전한 기능의 AI 이미지 생성기를 제공합니다. 이 도구는 Google 클라우드 계정으로 액세스할 수 있는 Google의 Vertex AI 도구 제품군에서 호스팅됩니다.
이에 비해 2022년 5월부터 사용할 수 있는 Imagen의 첫 번째 버전은 AI 테스트 키친 이라는 앱을 통해 제한적으로 베타 버전이 출시되었습니다. 사용자는 픽사 애니메이션 영화에 나올 법한 도시 풍경이나 괴물 캐릭터를 생성하는 것만 할 수 있었습니다.
DALL-E 2와 같은 이미지 생성 모델은 사용자가 생성된 이미지를 쉽게 편집하고 확장할 수 있는 인페인팅 및 아웃페인팅 기술을 포함하여 처음부터 이미지를 생성할 수 있는 인상적인 기능을 제공합니다. 하지만 구글에서 개발한 대표적인 텍스트-이미지 생성기인 이미지
Imagen 2는 인공지능 알고리즘을 사용하여 사람의 손을 사실적인 이미지로 생성하는 인상적인 성능으로 인해 연구자와 개발자들로부터 큰 주목을 받고 있습니다. 생성된 결과물에는 몇 가지 제한 사항과 불완전함이 있을 수 있지만, Google은 고품질의 결과를 보장하기 위해 소프트웨어의 이러한 측면을 개선하기 위해 상당한 노력을 기울이고 있습니다.
Imagen 2를 직접 사용해 보는 방법
Imagen 2는 개발자와 기업을 대상으로 하지만, 개인인 경우에도 무료 Google 클라우드 계정 에 가입하여 사용해 볼 수 있습니다. 페이지 오른쪽 상단의 무료 시작 버튼을 클릭한 다음 안내에 따라 결제 계정을 설정하세요.
무료 평가판 기간이 만료되면 사용자가 서비스를 계속 이용할 수 있도록 유효한 결제 수단을 제공하도록 권장합니다. 그러나 평가판 기간 이후 추가 거래는 사용자의 명시적인 승인이 필요하므로 안심하시기 바랍니다. Google에서 명시한 이용약관에 따라 사전 동의 없이는 자동 청구가 발생하지 않습니다.
Google 클라우드 계정에 등록한 후 기본 대시보드로 이동하여 콘솔과 유사한 아이콘을 찾습니다. 이 아이콘을 클릭하여 왼쪽 상단 사분면에 가로로 정렬된 3개의 막대가 있는 확장 메뉴에 액세스합니다. 여기에서 원하는 대상으로 “Vertex AI Vision”을 선택합니다. 또는 선호도에 따라 화면 오른쪽에 있는 비슷한 위치의 ‘스튜디오’ 또는 ‘오픈 스튜디오’라는 옵션을 클릭할 수도 있습니다.
Google은 이미지 AI 모델을 어떻게 학습시켰나요?
기밀이 유지되는 환경에서 Imagen은 공개적으로 액세스할 수 있는 LAION-400M 데이터베이스와 Google의 독점 데이터 소스를 모두 활용하여 학습을 진행했습니다.
특히 온라인 소스에서 방대한 수의 이미지를 수집하는 것과 관련하여 데이터 세트의 활용을 둘러싼 논쟁이 계속되고 있으며, 일부 인공지능 회사에서는 DALL-E 2의 사례에서 볼 수 있듯이 이러한 세부 정보를 공개하지 않기로 결정했습니다.예술가들은 이미지와 예술 작품을 인공지능 시스템의 학습 과정에 포함시키기 전에 소유자의 허락을 얻지 않은 인공지능 기업에 대해 불만을 표출하고 있습니다.
자신의 시각적 콘텐츠에 대해 불안감을 느끼는 개인은 자신의 사진이 인공지능 모델의 학습에 포함되었는지 여부를 확인하고 참여하지 않을 수 있습니다.
재미있는 이미지 2
기술이 계속 발전함에 따라 Google과 같은 선도적인 기술 기업이 인공지능의 영역에 뛰어들어 혁신적인 인공지능 모델을 개발하는 것은 시간 문제였습니다. 이미지 생성은 여전히 흥미로운 탐구 영역으로 남아 있으며, 텍스트를 이미지로 변환하는 기능을 갖춘 모델 2는 창의성과 엔터테인먼트에 무한한 가능성을 제공할 것을 약속합니다.
Google 클라우드 서비스를 실험해 보려면 웹사이트를 방문하여 무료 계정을 만들 수 있습니다. 또한 새로운 개발에 대한 업데이트를 신청하고 Google에서 AI 테스트 키친 애플리케이션을 다운로드하여 현재 프로젝트가 공개되기 전에 독점 미리 보기에 액세스하세요.