오픈 소스 동영상 편집기 Kdenlive의 개발자들이 2023년 새 버전에 openAI의 Whisper 음성-텍스트 변환 엔진을 추가하여 AI 학습 기능을 도입했습니다. 이 외에도 몇 가지 새로운 텐트폴 기능이 추가되어 새로 출시된 23.04 버전의 Kdenlive는 더욱 흥미진진해졌습니다.
Kdenlive 23.04 출시
Kdenlive는 소프트웨어의 최신 릴리스에서 많은 사람들이 기대하는 몇 가지 새로운 기능을 발표했습니다. 23.04는 2022년 초 성공적인 모금 캠페인 이후 첫 번째 주요 릴리스인 만큼 개발자들에게는 다사다난한 한 해였습니다.
중첩 타임라인, 향상된 음성-텍스트 변환, 즉석 영어 번역, 기타 버그 수정 및 코드 개선 등 이번 릴리스에서 달성하고자 하는 야심찬 자체 목표가 있었습니다.
다운로드: Windows, Mac 및 Linux용 Kdenlive 23.04 (무료)
Kdenlive 23.04에서 사용해 볼 새로운 기능
이번 릴리스에는 기대할 만한 기능이 많이 있습니다. 가장 큰 기대는 중첩 타임라인과 OpenAI Whisper 음성 엔진의 추가입니다.
중첩 타임라인
중첩 타임라인은 새로운 기능이 아니며, 편집자들은 한동안 Premiere Pro에서 중첩 시퀀스를 사용해 왔습니다. 이제 23.04를 통해 Kdenlive 사용자도 이와 유사하게 작업을 간소화할 수 있습니다.
기본적으로 중첩 타임라인을 사용하면 편집자는 하나의 긴 타임라인이 아닌 작은 청크(시퀀스라고 함)로 프로젝트를 작업할 수 있습니다. 중첩 타임라인이 등장하기 전에는 편집자가 특정 시퀀스를 편집하고 렌더링하여 마무리한 다음 완성된 시퀀스를 다시 프로젝트에 임포트할 수 있었습니다.
하지만 여기에는 대가가 따랐습니다. 시퀀스를 마무리하는 것은 말 그대로 말 그대로입니다. 시퀀스를 렌더링하고 리임포트한 후에는 더 이상 편집할 수 없습니다.
중첩 타임라인으로 이 문제를 해결했습니다. 이제 각 개별 시퀀스를 마무리한 다음 다시 임포트할 필요가 없습니다. 각 시퀀스에 대해 별도의 타임라인을 생성할 수 있으며, 메인 타임라인은 개별 클립이 아닌 해당 시퀀스로 구성됩니다.
개별 시퀀스는 자체 중첩 타임라인에서 계속 편집할 수 있을 뿐만 아니라, 해당 시퀀스에 대한 변경 사항이 메인 프로젝트 전체에 자동으로 반영됩니다.
OpenAI Whisper 음성-텍스트 변환
Whisper는 ChatGPT를 담당하는 OpenAI 팀에서 만든 음성-텍스트 변환 도구입니다. 무료이며 딥 러닝과 신경망으로 구동되는 이 프로젝트는 음성-텍스트 변환 애플리케이션에서 사용할 수 있는 보다 자연스럽고 정확한 언어 처리 시스템을 약속합니다. Kdenlive 개발자는 자동 자막 기능을 지원하기 위해 23.04에 이 기능을 추가했습니다.
Kdenlive에는 기존 자막 엔진이 있지만 VOSK에서는 Whisper 음성-텍스트 프로토콜이 추가되어 현저한 개선을 약속합니다. 위스퍼의 주요 판매 기능 중 하나는 향상된 정확도뿐만 아니라 오디오를 즉석에서 영어로 번역하는 기능입니다.
편집자가 자막이 필요한 외국어가 포함된 장면이 있는 경우 이론적으로 Whisper는 한 비트도 놓치지 않고 자막을 처리할 수 있어야 합니다.
개발자들은 설정 화면을 통해 필요한 파일을 다운로드하는 것만으로 Whisper를 간단하게 설정할 수 있도록 노력했습니다. 프로젝트에서 자막 트랙을 생성한 다음 마술 지팡이를 선택하고 지시에 따라 최대한 간단하게 사용할 수 있습니다.
타이머
새로운 타이머 효과는 23 버전 발표에서 가장 큰 주목을 받은 기능으로, 겉보기에는 간단해 보이지만 실제로는 지금까지 다소 복잡한 수동 절차가 필요했던 유용한 기능입니다.
물론 대부분의 NLE와 마찬가지로 Kdenlive에는 프로젝트의 타임 코드를 볼 수 있는 기능이 포함되어 있지만, 사용자 지정할 수 없으며 프로젝트 전체에만 동기화됩니다. 자동으로 카운트 업 또는 카운트 다운되고 단일 클립 또는 단일 트랙에 동기화되는 타이머를 만드는 것은 여러 단계가 포함된 심층적인 프로세스였습니다.
이번 업데이트를 통해 타이머는 다른 효과처럼 드래그 앤 드롭으로 추가할 수 있으며, 옆에 있는 효과/컴포지션 스택을 통해 빠르고 쉽게 편집할 수 있습니다.
조정 가능한 매개변수에는 글꼴, 크기, 색상, 위치 및 기타 예상되는 모든 항목이 포함됩니다.
로드맵의 다음 단계는 무엇인가요?
새로운 기능뿐만 아니라 2023년 출시를 위한 일반적인 버그 수정 및 개선 사항도 포함되어 있습니다. 여기에는 타임라인의 클립 성능 개선, 파일 크기가 큰 클립 가져오기 개선, 자막 처리 개선, 편집자가 다양하게 활용할 수 있는 새로운 트랜지션 등이 포함됩니다.
개발자들은 발표에서 다음 릴리스에서는 효과 워크플로우를 개선하는 동시에 GPU 지원을 개선할 계획이라고 언급했습니다.