AI 이미지 생성 도구들이 오랜 시간 동안 우리를 기쁘게(혹은 불안하게) 해왔습니다. OpenAI, Imagen, Adobe Firefly, DALL-E-3 등이 그 주역입니다. 기술의 발전에 따라 우리는 결과를 더욱 세밀하게 조정할 수 있는 옵션들이 늘어나고 있습니다. 이제 Google Labs는 이미지를 텍스트 대신 가이드로 사용할 수 있게 하는 도구인 Whisk를 출시했습니다.
Google Labs의 Whisk: 이미지에서 이미지를 생성합니다
미국에 거주하고 계신 분들은 이제 Google Labs의 Whisk를 이용하실 수 있습니다. Google은 이 도구를 "생성형 AI 실험"이라고 소개하고 있습니다.Google 블로그에서 확인하실 수 있습니다. Whisk는 텍스트 대신 이미지를 참조로 사용할 수 있게 해줍니다. 플랫폼은 주제, 장면, 스타일이라는 세 가지 핵심 특성을 요구합니다. 그 후 도구가 이 요소들을 섞어 ‘휘저어’ 새로운 이미지를 생성해 줍니다.
Whisk는 Google의 최신 이미지 생성 모델인 Imagen 3을 기반으로 합니다. Google의 새로운 도구 Whisk는 주로 텍스트 프롬프트 없이 작동하지만, 세 가지 카테고리에 대한 특정 지시사항을 입력하거나 전체적인 설명을 추가할 수 있습니다. 또한 사용자는 초기 결과를 확인한 후 이미지를 수정하고 조정할 수도 있습니다. 예를 들어, 눈 속에서 편안히 누워 있는 고양이가 새겨진 빈티지 크리스마스 카드를 생성하려고 할 때, 첫 번째 버전을 보고 미세한 눈송이를 추가하여 마무리를 짓는 것이 가능합니다. 완료하기 ——— Whisk의 세 가지 지정된 카테고리 중 어느 곳에서든 이미지를 포함하거나 생성할 경우 플랫폼은 자동으로 상세한 텍스트 설명을 생성합니다. 따라서 이미지 수정이나 개선이 필요하다면, 관련된 텍스트를 조정하면 됩니다. ![](https://static1.makeuseofimages.com/wordpress/wp-content/uploads/2024/12/whisk-edit-text.png)마지막으로, 창조적인 구성에 무작위 요소를 추가하고 싶다면 주사위 아이콘을 선택할 수 있습니다. 또한 더 복잡한 층화된 구성물을 생성하려면 여러 개체, 장면 또는 스타일 참조를 포함시킬 수도 있습니다. 아트워크가 만족스러운 결과물로 완성되면 플랫폼 내에서 보관하거나 오프라인으로 다운로드하여 사용할 수 있습니다. Worth the Whisk? —————– 오늘날 다양한 고급 AI 기반 이미지 향상 및 생성 도구들이 존재하는 상황에서 Google의 최신 제품인 Whisk는 단순한 유행품으로 여겨질 수도 있습니다. 그러나 Whisk는 시각적 참조를 활용해 이미지를 생성하는 혁신적인 접근법을 통해 창의적이고 전문적인 맥락에서 큰 가치가 있다고 생각합니다. 예를 들어, 피치 데크를 만들 때 기존 참조와 유사한 시각 요소를 찾고 있다면, 언어로만 참조 내용을 설명하는 것보다 원본 파일과 함께 간단한 텍스트 설명을 제공하는 것이 더 효율적일 수 있습니다. Whisk는 정밀한 편집 및 향상에 특화된 경쟁 플랫폼들과 달리 창의적인 아이디어 생성과 실험을 위한 탐색 도구로 설계되었습니다. Google은 이 도구를 “빠른 시각적 탐색”을 위한 것이지 정밀한 편집을 위한 것은 아니라고 강조합니다. > “이 도구는 빠르고 창의적인 아이디어 생성을 돕기 위해 설계되었으며, 사용자가 다양한 가능성들을 탐색하고 선호하는 결과물을 내보낼 수 있도록 합니다.” 솔직히 말하자면, 때로는 우리의 생각을 정확하게 표현하기가 어렵습니다. 저는 종종 자신의 아이디어를 정확히 전달할 수 있는 단어를 찾지 못해 고민합니다. 이때 Whisk와 같은 도구의 가치가 드러납니다. 특히 언어보다 예시를 통해 의도를 더 명확하게 표현하는 상황에서 더욱 그렇습니다.