MusicGen은 메타에서 개발한 혁신적인 인공 지능 애플리케이션으로, 사용자가 텍스트 설명에서 음악 작곡을 생성할 수 있습니다. 이 프로그램의 데모는 온라인으로 액세스 할 수 있으며 모든 웹 브라우저를 사용하여 경험할 수 있습니다. 결과물도 훌륭하지만, AI 음악 생성 기술의 놀라운 발전을 보여줍니다.

MusicGen은 사용자가 알고리즘을 통해 음악 작곡을 만들 수 있는 소프트웨어 프로그램입니다. 이 도구를 활용하려면 코드 진행, 멜로디 구조 및 리듬 패턴과 같은 기본 음악 이론 원리를 이해해야 합니다. 또한 생성된 음악의 매개변수를 효과적으로 조작하기 위해서는 변수, 루프, 함수와 같은 프로그래밍 개념에 대한 지식도 필요합니다. MusicGen을 사용하여 음악을 생성하는 과정에는 일반적으로 원하는 장르 또는 스타일을 선택하고, 가사를 입력하고(해당되는 경우), 작곡의 길이를 지정하고, 기타 다양한 음악 매개 변수를 설정하는 과정이 포함됩니다. 이러한 설정이 완료되면 사용자는 “생성” 버튼을 클릭하여 완전한 형태의 음악 작품을 만들 수 있습니다.

뮤직젠이란?

2023년 6월, 메타는 뮤직젠이라는 혁신적인 AI 음악 생성 모델을 공개했습니다. 이 획기적인 기술은 처음이 아니며, OpenAI 및 MusicLM과 같은 다른 회사에서도 이미 텍스트 설명을 사용하여 음악을 생성하는 데 큰 진전을 이루었습니다. 뮤직젠을 통해 사용자는 간단한 서술만 입력하면 다양한 음악을 작곡할 수 있습니다.

앞서 언급한 이 단체는 코드를 오픈소스로 공개하여 최소 16기가바이트의 메모리를 갖춘 그래픽 처리 장치(GPU)만 있으면 개인용 컴퓨터에서 프로그램을 작동할 수 있도록 하는 선구자가 되었습니다. 실제로 테스트 결과, 이 소프트웨어는 메모리가 11기가바이트에 불과한 GPU에서도 효율적으로 작동하는 것으로 나타났습니다.

적절한 하드웨어가 없어도 브라우저를 통해 무료로 MusicGen 웹 애플리케이션을 사용할 수 있으므로 걱정할 필요가 없습니다. 기능 데모는 온라인에서 확인할 수 있으며, 약 12초 길이의 오디오 샘플을 생성하는 데 약 1분 정도 소요됩니다.

뮤직젠의 사운드는 어떤가요?

메타의 정보에 따르면 MusicGen은 고품질의 음악 작곡을 생성할 수 있는 것으로 보고되었습니다.그러나 자세히 살펴보면

이 글도 확인해 보세요:  블루투스 LC3 코덱이란? SBC보다 더 나은 코덱인가요?

오디오가 라디오 또는 스트리밍 콘텐츠에 대한 일반적인 기대치를 충족하지 못할 수도 있지만 현재 사용 가능한 다른 인공 지능 음악 생성 도구와 비교하면 여전히 합리적인 음질을 보여줍니다. 파일 내 노이즈 레벨도 비교적 낮습니다.

제공된 오디오 샘플을 검토하여 음악이 주어진 가이드라인을 준수하는 정도를 측정할 수 있습니다. 일반적으로 유사한 음악을 생성하려는 이전 시도와 비교할 때 더 식별 가능한 음악 구조를 보유하면서 널리 알려진 음악 장르를 준수하는 능력을 보여줍니다.

MusicGen을 사용하여 음악을 생성하는 방법

MusicGen 플랫폼은 등록 절차가 필요 없는 간편한 사용자 경험을 자랑합니다. 그래픽 인터페이스는 직관적이어서 여가 목적으로 실험을 쉽게 할 수 있습니다.

MusicGen을 통한 음악 생성은 다음 단계에 따라 수행할 수 있습니다:

MusicGen 웹 앱 열기 .

“생성” 버튼을 클릭하면 프로세스가 시작되고 1~2분 이내에 화면 오른쪽의 “생성된 음악” 섹션에 오디오 플레이어가 나타납니다.

모듈 위로 마우스를 가져가 플레이어 컨트롤을 표시하여 인터페이스를 관찰하거나 화면 오른쪽 상단에 있는 다운로드 아이콘을 클릭하여 파일을 컴퓨터에 저장하세요. 현재 다운로드 옵션은 .mp4 형식으로 제한되어 있다는 점에 유의하세요.

기존 멜로디를 활용하여 결과를 조절하는 옵션은 텍스트 입력 필드 옆에 있는 모듈을 통해 사용할 수 있습니다. 또한 사용자는 “마이크” 옵션을 선택하여 마이크를 사용하여 새 멜로디를 녹음할 수도 있습니다.

음악 반주, 노래 가사 및 제공된 멜로디를 고려하여 MusicGen에서 생성된 출력을 조절하는 기초 역할을 합니다. 이 기술을 사용하여 MusicGen에서 얻은 결과를 개선할 수 있습니다.

MusicGen 오디오 사용에 대한 제한 사항은 무엇인가요?

MusicGen의 코드는 MIT 라이선스에 따라 몇 가지 제한 사항 없이 무료로 배포됩니다. 이 모델을 사용하여 생성하는 오디오에 대해서는 법적 가이드라인이 있는지 여부가 불분명합니다. 대신 MusicGen 사용에 대한 메타의 경고 :

개인에게 불쾌하거나 편협한 분위기를 조성할 수 있는 음악 작곡을 생성하거나 유포하는 데 이 모델을 사용하지 말아야 합니다.이러한 음악에는 정서적 고통이나 불편함을 유발할 수 있는 음악뿐만 아니라 유해한 고정관념을 조장하거나 부정적인 역사적 내러티브를 영속화하는 음악이 포함될 수 있습니다.

MusicGen은 앞서 언급한 음악 작곡을 온라인 스트리밍 서비스를 통해 배포하는 등의 후속 응용 프로그램보다는 인공지능으로 생성된 음악의 영역을 탐구하고자 하는 학자들을 위해 주로 설계되었습니다.

이 글도 확인해 보세요:  Canva를 사용하여 애니메이션 트위치 오버레이를 만드는 방법

적절한 동의 획득, 창작자에 대한 공정한 보상 및 신용 보장, 잠재적인 법적 책임 회피 등 데이터를 활용한 인공지능 예술 생성에 관한 몇 가지 윤리적 고려사항이 있습니다. 이러한 요인들로 인해 Meta는 이 기술의 활용으로 인해 발생할 수 있는 잠재적인 도덕적 또는 법적 영향을 완화하기 위해 신중한 접근 방식을 채택하게 되었습니다.

이 모델을 엔터테인먼트 목적으로 활용하는 데는 큰 위험이 없는 것으로 보이지만, 상업 음악 영역에 적용하는 것은 더 어려운 것으로 판명될 수 있습니다. 대중음악 분야에 인공지능이 등장하면서 많은 사람들이 앞으로 이 장르의 잠재적 궤도에 대해 고민하고 있습니다.

메타, 또 다른 인공지능 음악 생성기 추가

메타는 단순화된 설명 텍스트 입력을 기반으로 원시 음악 작곡을 생성하는 기능을 갖춘 오픈소스 인공지능 모델인 MusicGen을 공개했습니다. 이 혁신의 실험에 관심이 있는 분들은 웹 브라우저만으로 데모를 체험할 수 있습니다.

By 최은지

윈도우(Windows)와 웹 서비스에 대한 전문 지식을 갖춘 노련한 UX 디자이너인 최은지님은 효율적이고 매력적인 디지털 경험을 개발하는 데 탁월한 능력을 발휘합니다. 사용자의 입장에서 생각하며 누구나 쉽게 접근하고 즐길 수 있는 콘텐츠를 개발하는 데 주력하고 있습니다. 사용자 경험을 향상시키기 위해 연구를 거듭하는 은지님은 All Things N 팀의 핵심 구성원으로 활약하고 있습니다.