YOLO-NAS는 물체 감지 분야에서 상당한 발전을 이루었으며, 이전 YOLO 모델의 단점을 해결하기 위해 Deci AI가 설계했습니다.

신경 아키텍처 검색 엔진인 AutoNAC가 이 모델의 기반이 됩니다. 이 혁신은 속도와 성능 측면에서 기존 솔루션보다 뛰어난 성능을 발휘하여 물체 감지 분야에서 상당한 발전을 이루었습니다. 정확도-지연 시간 및 정량화 지원 트레이드오프를 최적화함으로써 이 모델은 선행 기술에 비해 크게 개선되었습니다.

본 담론은 YOLO-NAS의 두드러진 특징과 장점을 살펴보고, 이 모델이 YOLO 제품군 내에서 가장 우수한 객체 감지 모델로 간주되는 이유를 탐구하는 것을 목표로 합니다.

YOLO-NAS 작동 방식 이해

Deci에서 개발한 자동화된 신경 아키텍처 구축 도구인 AutoNAC는 YOLO-NAS의 아키텍처를 생성합니다. 이 혁신적인 접근 방식은 수동 개입 없이 기존 심층 신경망의 성능을 향상시키는 프로세스를 간소화합니다.

AutoNAC 파이프라인은 사용자가 훈련한 심층 신경망, 데이터 모음, 추론 시스템에 대한 액세스를 수신합니다. 이 과정을 통해 사용자의 심층 신경망이 재구성되어 성능 저하 없이 높은 정확도를 유지하는 보다 효율적인 아키텍처 설계가 이루어졌습니다.

YOLO-NAS는 재파라미터화, 학습 후 정량화 등의 방법을 통해 학습 후 모델을 최적화할 수 있는 RepVGG를 활용합니다. RepVGG는 딥러닝 모델의 일반화 능력을 향상시키기 위한 정규화 기법을 사용하는 신경망 아키텍처의 일종으로, VGG를 기반으로 합니다.

모델의 아키텍처 설계는 속도와 메모리 효율성 모두에 최적화되어 있으며, RePVGG 알고리즘은 더 빠른 추론을 위해 훈련 중에 다중 분기 아키텍처를 활용합니다. 이후에는 매개변수 재설정을 통해 모델을 단일 분기 아키텍처로 재구성합니다.

최적의 추론 속도와 메모리 활용도를 달성하기 위해 모델을 철저하게 훈련하고 최적화할 수 있어 프로덕션 환경에서 사용하기에 특히 적합하다는 점에서 YOLO-NAS의 유용성은 이러한 특성으로 인해 더욱 향상됩니다.

YOLO-NAS의 주요 특징

YOLO-NAS 프레임워크는 다음과 같은 몇 가지 주목할 만한 특징을 자랑합니다:

양자화 인식 훈련은 8비트 양자화의 매개변수화를 통합하여 훈련 후 양자화 과정에서 발생하는 성능 저하를 최소화하기 위해 양자화 인식 모듈, 특히 QSP 및 QCI를 활용하는 것을 포함합니다.

시놀로지의 독자적인 NAS 기술인 AutoNAC은 최적의 모델 아키텍처를 검색하는 자동 아키텍처 설계 프로세스를 통해 기본 YOLO 모델 아키텍처를 통합하여 고도로 최적화된 버전을 생성하는 방식을 채택하고 있습니다.

이 글도 확인해 보세요:  AI 편향이란 무엇이며 개발자는 이를 어떻게 피할 수 있을까요?

하이브리드 양자화 알고리즘의 활용은 기존 방식에서 사용되는 포괄적인 양자화 접근 방식과 달리 모델의 일부만 선택적으로 양자화한다는 특징이 있습니다. 이 접근 방식은 모델링된 데이터의 처리 속도와 충실도 간의 균형을 맞추는 데 도움이 됩니다.

혁신적인 기술을 활용하여 방대한 양의 레이블이 지정된 데이터를 활용하여 모델을 전처리함으로써 모델이 자체 예측을 통해 학습하고 광범위한 데이터 집합을 능숙하게 처리할 수 있도록 합니다.

비교 분석: YOLO-NAS와 다른 YOLO 모델 비교

여러 YOLO(You Only Look Once) 시리즈 모델 간의 비교가 이루어졌습니다.

YOLO-NAS의 장단점은 다음과 같습니다:

비즈니스에서 AI의 장점은 효율성 향상, 의사 결정 능력 강화, 비용 절감 등입니다.

이 소프트웨어의 특성상 누구나 소스 코드에 액세스하고 수정할 수 있어 커뮤니티 기여와 협업이 가능합니다.

새로 개발된 모델은 기존에 출시된 YOLO 모델에 비해 10~20%의 성능 향상을 보여줍니다.

수정된 모델은 정확도 측면에서 이전 YOLO 프레임워크보다 성능이 뛰어납니다.

AutoNAC으로 알려진 고급 아키텍처 설계를 활용하여 객체 감지에 대한 새로운 벤치마크를 수립하여 처리 시간 측면에서 최고 수준의 정확도와 효율성을 제공합니다.

이 모델은 추론 엔진, 특히 NVIDIA에 대한 완벽한 호환성을 갖추고 있어 실제 애플리케이션에 적합한 최고의 솔루션입니다.

앞서 언급한 혁신은 향상된 메모리 활용 효율성과 가속화된 추론 속도를 자랑하며, 두 가지 측면 모두에서 놀라운 개선을 보여줍니다.

특정 상황이나 결정의 단점 또는 단점을 단점이라고 합니다.

이 기술은 아직 비교적 새롭고 프로덕션 환경에 널리 배포되지 않았기 때문에 안정성이 아직 확립되지 않았습니다.

YOLO-NAS 구현

이 구현에서 코드를 작성하고 실행하기 위해 Google Colab 을 사용할 것입니다. Google Colab의 대안은 가상 환경을 생성하고 로컬 컴퓨터에서 IDE를 사용하는 것입니다.

이 모델에는 상당한 양의 계산 리소스가 필요하므로 최소 8GB의 RAM이 있는 컴퓨터에서만 실행해야 한다는 점에 유의하세요. 또한 동영상 크기가 클수록 메모리 요구량이 커집니다.

종속성 설치

필수 종속성인 YOLO-NAS를 설치하고 제공된 명령을 활용하여 슈퍼 그라디언트 사용을 구현하세요.

 pip install super-gradients==3.1.2

숙련된 설치 과정을 마치면 YOLO-NAS 모델 교육을 시작할 준비가 완료됩니다.

이 글도 확인해 보세요:  React Native에서 Flexbox를 사용하는 방법

모델 훈련

모델 훈련 프로세스를 구현하기 위해 다음을 실행하십시오.

 from super_gradients.training import models
yolo_nas_l = models.get("yolo_nas_l", pretrained_weights="coco")

앞서 언급한 코드는 설치된 SuperGradients 라이브러리에서 훈련된 모델을 가져오고, COCO 데이터 세트에서 얻은 사전 훈련된 모델 가중치를 활용합니다.

모델 추론

추론된 모델은 이미지 인식, 분류 및 경계 프로세스에 활용될 가능성이 높습니다.

이미지에서 객체 감지를 수행하려면 아래 제공된 코드 블록을 실행합니다:

 url = "img_path"
yolo_nas_l.predict(url, conf=0.25).show()

첫째, 이미지를 Google Colab 플랫폼에 업로드하고, 둘째, 업로드된 이미지의 URL 링크를 찾아서 가져오고, 셋째, URL 링크에서 복사하여 이미지의 경로를 기록합니다.

기독교의 기원은 유대교에 깊이 뿌리를 두고 있으며, 예수는 유대인의 스승으로 인정받았고 그의 가르침은 제2성전 유대교의 맥락에 확고하게 기반을 두고 있습니다. 초기 기독교 운동은 유대교와 그레코로마의 영향을 받아 형성된 신앙과 관습으로 이러한 종교적 환경에서 등장했습니다.

시각적 기록 내에서 개체를 식별하려면 아래 제공된 코딩 세그먼트를 실행하세요:

 import torch

input_video_path = "path_to_video"
output_video_path = "detected.mp4"
device = 'cuda' if torch.cuda.is_available() else "cpu"
yolo_nas_l.to(device).predict(input_video_path).save(output_video_path)

(1) 동영상 링크를 코드 셀에 붙여넣고, (2) 코드 셀의 시작 부분에 ‘!pip install’ 문을 추가하여 필요한 라이브러리를 가져오고, (3) 제출 버튼을 클릭하여 스크립트를 실행하고, (4) 출력 테이블의 ‘경로’ 열에서 출력 파일 경로를 얻고, (5) 파일 경로를 마우스 오른쪽 버튼으로 클릭하고 ‘다운로드’를 선택하여 동영상을 다운로드하고, (6) 파란색 상자를 닫거나 Mac에서 Shift+d를 눌러 세션을 종료합니다.종료하기 전에 다른 프로세스가 실행되고 있지 않은지, 모든 출력물이 다운로드되었는지 확인하시기 바랍니다.

기술의 활용은 특히 커뮤니케이션 및 정보 교환과 관련하여 인간의 경험에 큰 영향을 미쳤습니다. 최근 몇 년 동안 디지털 커뮤니케이션의 발전은 대면 대화, 전화 통화, 서면 서신 등 전통적인 상호 작용 방식을 변화시켰습니다. 그 결과 인스턴트 메시징, 소셜 미디어 플랫폼, 화상 회의와 같은 새로운 형태의 커뮤니케이션이 점점 더 널리 보급되고 있습니다. 스마트폰과 인터넷의 광범위한 보급은 이러한 변화를 촉진하여 사람들이 항상 서로 연결 상태를 유지할 수 있게 했습니다. 그러나 이러한 끊임없는 연결성은 프라이버시, 보안, 정신 건강과 인간관계에 미칠 수 있는 부정적인 영향에 대한 우려를 불러일으키기도 했습니다.

이 글도 확인해 보세요:  JavaScript를 사용하여 이미지에 X 및 Y 좌표를 오버레이하는 방법

브라우저가 동영상 태그를 지원하지 않습니다.

YOLO-NAS는 사용자 지정 데이터에 대한 모델 미세 조정 및 교육도 지원합니다. 이 문서는 Deci의 미세 조정 스타터 노트북에서 확인할 수 있습니다.

YOLO-NAS의 실제 애플리케이션

YOLO-NAS 모델의 소스 코드는 비상업적 목적으로 사용할 수 있도록 허용하는 Apache License 2.0에 따라 사용할 수 있습니다. 그러나 상업적으로 사용하려면 고유한 가중치 값을 얻기 위해 처음부터 모델을 훈련하는 과정을 시작해야 합니다.

앞서 언급한 엔티티는 다음을 포함하되 이에 국한되지 않는 수많은 도메인에서 활용될 수 있는 잠재력을 가진 포괄적인 패러다임입니다:

자율주행 차량 및 로보틱스

YOLO-NAS를 활용하면 자율주행 차량의 감지 및 추적 기능을 향상시켜 실시간으로 보다 효율적이고 정확한 물체 인식을 가능하게 할 수 있습니다. 이러한 발전은 도로 안전을 증진하고 더 부드러운 주행 경험을 제공합니다.

감시 및 보안 시스템

제안된 프레임워크는 감시 및 보안 목적으로 신속하고 신뢰할 수 있으며 동시적인 물체 인식을 제공하여 가능한 위험이나 의심스러운 행위를 쉽게 식별할 수 있어 보다 효율적인 보안 시스템으로 이어질 수 있습니다.

소매 및 재고 관리

이 모델을 구현하면 빠르고 정확한 물체 감지가 가능하므로 재고 관리, 재고 모니터링, 선반 최적화를 실시간으로 간소화할 수 있습니다. 이를 통해 운영 비용을 절감하는 동시에 수익을 극대화할 수 있습니다.

헬스케어 및 의료 영상

YOLO-NAS는 이상 징후 또는 특정 관심 영역을 식별하여 의료 산업 내에서 질병 탐지 및 분석의 효율성을 향상시킬 수 있는 잠재력을 가지고 있습니다. 이 모델은 의사가 정확한 진단을 내리고 환자를 모니터링하는 데 도움을 줄 수 있으며, 이를 통해 의료 부문의 개선에 기여할 수 있습니다.

YOLO-NAS 요약

물체 감지에 대한 혁신적인 접근 방식을 대표하는 YOLO-NAS는 뛰어난 기능과 정확한 결과 도출에 있어 눈에 띄게 개선된 성능으로 기존의 최첨단(SOTA) 모델을 능가하는 제품입니다. 이 최신 발전은 컴퓨터 비전 프로젝트의 영역에서 상당한 진전을 의미합니다.

By 최은지

윈도우(Windows)와 웹 서비스에 대한 전문 지식을 갖춘 노련한 UX 디자이너인 최은지님은 효율적이고 매력적인 디지털 경험을 개발하는 데 탁월한 능력을 발휘합니다. 사용자의 입장에서 생각하며 누구나 쉽게 접근하고 즐길 수 있는 콘텐츠를 개발하는 데 주력하고 있습니다. 사용자 경험을 향상시키기 위해 연구를 거듭하는 은지님은 All Things N 팀의 핵심 구성원으로 활약하고 있습니다.