Contents

Czym jest wizja maszynowa i jak ważna jest dla autonomicznych samochodów?

Kluczowe wnioski

Pojazdy autonomiczne wykorzystują zaawansowane możliwości percepcji wzrokowej jako sposób na zrozumienie otoczenia, umożliwiając im dostrzeganie przeszkód, rozpoznawanie oznakowania i bezpieczne poruszanie się po drogach dzięki wykorzystaniu technologii widzenia maszynowego.

Widzenie maszynowe wykorzystywane przez pojazdy autonomiczne wykorzystuje połączenie kamer, obliczeń brzegowych i technik sztucznej inteligencji do pozyskiwania danych wizualnych, ich natychmiastowej analizy oraz rozpoznawania form i podmiotów w środowisku.

Postępy w dziedzinie sztucznej inteligencji, obliczeń brzegowych i technologii kamer są niezbędne do osiągnięcia pełnej autonomii w samojezdnych samochodach dzięki wizji maszynowej. Zdolność ta pozwala na klasyfikację obiektów, wykrywanie pasów ruchu i sygnałów, identyfikację znaków i rozpoznawanie wzorców ruchu drogowego.

Koncepcja samojezdnych pojazdów wzbudziła z czasem duże zainteresowanie. Pomimo faktu, że obecnie nie możemy posiadać całkowicie autonomicznych samochodów, nowoczesne pojazdy są wyposażone w najnowocześniejsze zaawansowane systemy wspomagania kierowcy (ADAS), które mogą wykonywać takie funkcje, jak automatyczne kierowanie, korekta odchylenia pasa ruchu, operacje parkowania i adaptacyjna regulacja prędkości w odpowiedzi na panujące warunki drogowe.

Samojezdny pojazd opiera się na wielu czujnikach, aby skutecznie funkcjonować jako zaawansowany system wspomagania kierowcy (ADAS). Widzenie maszynowe służy jako dominująca metoda postrzegania, rozpoznawania i określania położenia i kontekstu różnych elementów w środowisku. Brak wizji maszynowej sprawiłby, że autonomiczne pojazdy wyposażone tylko w tempomat i autopilota byłyby wysoce nieprawdopodobne.

Czym jest widzenie maszynowe?

/pl/images/machine-vision-1.jpg

Widzenie maszynowe, znane również jako przetwarzanie obrazu ze sztuczną inteligencją, odnosi się do zdolności maszyn do interpretowania informacji wizualnych z ich otoczenia poprzez rozpoznawanie i identyfikowanie określonych obiektów lub wzorów. Technologia ta ma wiele zastosowań przemysłowych w systemach automatyki, takich jak robotyka i pojazdy samojezdne, gdzie umożliwia tym maszynom postrzeganie i nawigację w ich otoczeniu za pomocą algorytmów komputerowych zaprojektowanych w celu naśladowania ludzkiego wzroku.

Obecny stan widzenia maszynowego opiera się w dużej mierze na technikach sztucznej inteligencji, w szczególności tych wywodzących się z architektur głębokiego uczenia, takich jak konwolucyjne sieci neuronowe (CNN). Te zaawansowane algorytmy umożliwiają opracowanie wysoce odpornych i uniwersalnych modeli zdolnych do rozpoznawania obiektów z dużą dokładnością w szerokim zakresie scenariuszy operacyjnych.W rezultacie systemy te są coraz częściej wykorzystywane do zastosowań o wysokiej stawce w branżach od produkcji i rolnictwa po robotykę i pojazdy autonomiczne, gdzie niezawodna wydajność jest najważniejsza.

Jak działa system wizyjny w samochodach autonomicznych?

układ kamery, przetwarzanie obliczeniowe (odbywające się na krawędzi) i algorytmy sztucznej inteligencji. Elementy te ułatwiają działanie autonomicznego samochodu, umożliwiając mu postrzeganie otoczenia, podejmowanie świadomych decyzji w oparciu o te informacje oraz rozróżnianie różnych obiektów i potencjalnych zagrożeń występujących na jego drodze. Aby zrozumieć sposób, w jaki te aspekty technologiczne łączą się, tworząc spójny system widzenia maszynowego dla samojezdnego samochodu, przyjrzyjmy się szczegółowo każdemu komponentowi.

/pl/images/cameras.jpg

System kamer

Widzenie maszynowe wykorzystuje systemy kamer do pozyskiwania danych wizualnych dotyczących otaczającego środowiska. Pojazdy autonomiczne korzystają z wielu kamer rozmieszczonych wokół pojazdu, aby gromadzić kompleksową ilość informacji wizualnych w celu zwiększenia świadomości sytuacyjnej i podejmowania decyzji.

Complementary Metal-Oxide Semiconductor (CMOS) i Charge-Coupled Device (CCD). W kontekście pojazdów autonomicznych, CMOS jest często preferowany ze względu na dużą szybkość odczytu, solidną elektronikę pokładową i możliwości przetwarzania równoległego, co czyni go bardziej praktyczną opcją, mimo że jest podatny na zakłócenia lub zniekształcenia. Można jednak zastosować różne strategie w celu złagodzenia tych kwestii, w tym regulowane ustawienia oświetlenia, cyfrowe zdjęcia nocne i techniki filtrowania obrazu, które zwiększają wydajność czujnika CMOS w nieoptymalnych scenariuszach oświetleniowych.

Widzenie stereoskopowe, które wynika z połączenia wielu sygnałów wizualnych, zapewnia postrzeganie głębi lub trójwymiarowości obiektów i otaczającego środowiska. Aby osiągnąć ten efekt w pojazdach autonomicznych, kamery są strategicznie rozmieszczone w określonych odstępach, umożliwiając im obliczenie przybliżonej odległości między obiektem a pojazdem za pomocą trilateracji.

Stereopsja, czyli zdolność do postrzegania głębi poprzez widzenie obuoczne, jest cenną zaletą przyznaną ludziom ze względu na posiadanie dwojga oczu. Zjawisko to można zweryfikować eksperymentalnie, zamykając jedno oko i wybierając drobny przedmiot znajdujący się na obszarze roboczym. Umieszczając dłoń wzdłuż obwodu obiektu, upewniając się, że jego koniec znajduje się w odległości nie mniejszej niż dwa cale, osoba może spróbować oszacować odległość, utrzymując wzrok nieruchomo przez kilka chwil.Następnie ponowne otwarcie obu oczu ujawni znacznie zwiększoną zdolność do postrzegania relacji przestrzennych, co można przypisać zwiększonej w ten sposób stereoskopowej ostrości widzenia.

Komputer brzegowy

Komputer pokładowy, wykorzystujący możliwości przetwarzania brzegowego, natychmiast aktualizuje system autonomicznego pojazdu o informacje zbierane w czasie rzeczywistym przez system kamer. Pomimo potencjalnych oszczędności związanych z przetwarzaniem w chmurze dla standardowych aplikacji widzenia maszynowego, nieodłączne ryzyko związane z podłączeniem autonomicznych pojazdów do Internetu wymaga alternatywnych rozwiązań.

Wykorzystanie rozproszonego systemu obliczeniowego, takiego jak komputer brzegowy, do obsługi przychodzących danych może złagodzić obawy związane z opóźnieniami i umożliwić przekazywanie informacji w czasie rzeczywistym. W przypadku pojazdów autonomicznych, systemy te integrują zaawansowane procesory graficzne (GPU) od producentów takich jak NVIDIA, które zawierają takie funkcje jak Tensor Core i CUDA Cores w celu zwiększenia wydajności.

Algorytmy sztucznej inteligencji

Wykorzystanie algorytmów niezmiennie odgrywa nieodzowną rolę w dziedzinie widzenia maszynowego. Algorytmy te umożliwiają komputerom rozróżnianie i rozpoznawanie różnych elementów wizualnych, takich jak wzory, kontury i odcienie, które są rejestrowane przez kamery. Wykorzystując sztuczną inteligencję (AI) zamiast polegać na konwencjonalnych technikach widzenia maszynowego, pojazdy autonomiczne mogą znacznie poprawić swoją zdolność do dokładnego identyfikowania obiektów, znaków drogowych, oznaczeń pasów ruchu i sygnałów drogowych. Szereg algorytmów sztucznej inteligencji jest obecnie wykorzystywanych do edukacji samojezdnych samochodów, a niektóre z najbardziej rozpowszechnionych obejmują:

YOLO, czyli “You Only Look Once”, to algorytm wykrywania obiektów w czasie rzeczywistym, zaprojektowany do identyfikacji i śledzenia obiektów w zasięgu wzroku samochodu.

Wykorzystanie transformacji SIFT (Scale-Invariant Feature Transform) ma kluczowe znaczenie dla wyodrębniania cech, które umożliwiają pojazdowi identyfikację istotnych punktów orientacyjnych i obiektów w otaczającym go środowisku.

Wykorzystanie histogramów zorientowanych gradientów (HOG) jest szeroko stosowaną techniką w dziedzinie analizy obrazu, szczególnie ukierunkowaną na identyfikację obiektów w oparciu o ekstrakcję lokalnych wzorców i informacji o gradientach obecnych w obrazach wizualnych.

TextonBoost to model obliczeniowy zaprojektowany w celu poprawy percepcji wzrokowej i poprawy możliwości rozpoznawania obiektów poprzez badanie skomplikowanych wzorów tekstur w kontekście środowiskowym. To innowacyjne podejście wykorzystuje moc zaawansowanych technik uczenia maszynowego, takich jak głębokie sieci neuronowe, do analizy informacji wizualnych w wielu skalach i w różnych modalnościach obrazu.Wykorzystując te najnowocześniejsze technologie, TextonBoost ma potencjał, aby znacznie pogłębić nasze zrozumienie tego, jak ludzie postrzegają i interpretują swoje otoczenie, torując drogę do nowych przełomów w badaniach nad wizją komputerową.

AdaBoost to potężny algorytm wykorzystywany do zwiększania dokładności klasyfikacji danych poprzez integrację kilku nieefektywnych klasyfikatorów w solidny model predykcyjny zdolny do skutecznej identyfikacji zarówno obiektów, jak i potencjalnych zagrożeń w otaczającym środowisku pojazdu.

Znaczenie wizji maszynowej w samochodach autonomicznych

/pl/images/32751264885_97ef7205c6_b.jpg Image Credit:Automobile Italia/ Flickr

Poleganie na wizji maszynowej ma kluczowe znaczenie dla umożliwienia autonomicznym pojazdom postrzegania ich otoczenia, czyniąc ją niezbędną do ułatwienia działania autonomicznych samochodów na wyższych poziomach spektrum autonomii pojazdów. Brak tej zdolności spowodowałby, że pojazdy te zostałyby zdegradowane do niższych poziomów autonomii, utrudniając ich postęp w kierunku pełnej automatyzacji.

Dzięki postępom w technologii widzenia maszynowego, pojazdy autonomiczne stały się biegłe w klasyfikowaniu obiektów na drodze, wykrywaniu pasów ruchu i sygnałów, identyfikowaniu znaków i rozpoznawaniu wzorców w ruchu drogowym.

Pomimo polegania na szeregu systemów czujników, w tym LiDAR, RADAR i SONAR, do nawigacji i świadomości sytuacyjnej, współczesne pojazdy autonomiczne nadal w dużym stopniu zależą od wizji maszynowej w celu postrzegania ich otoczenia, rozpoznawania obiektów w nich i zrozumienia znaczenia przydrożnych oznakowań i sygnałów drogowych. Włączenie dodatkowych modalności sensorycznych służy jedynie zwiększeniu możliwości widzenia maszynowego, a tym samym promowaniu zwiększonego bezpieczeństwa pieszych, zwierząt domowych i mienia.

Z pewnością widzenie maszynowe ewoluowało do poziomu, na którym jest w stanie funkcjonować autonomicznie bez konieczności dodatkowego wsparcia ze strony innych zmysłów. Na przykład najnowsze samojezdne pojazdy Tesli wyeliminowały użycie technologii RADAR na rzecz polegania wyłącznie na wizji maszynowej w celu ułatwienia działania ich systemów Autopilota.

Chociaż może to nie podważać zalet alternatywnych systemów sensorycznych w pojazdach autonomicznych, podkreśla znaczenie i siłę widzenia maszynowego w dziedzinie samojezdnych samochodów.

Przyszłość widzenia maszynowego w pojazdach autonomicznych

Widzenie maszynowe służy jako kamień węgielny pod rozwój autonomicznych samochodów, umożliwiając tym pojazdom postrzeganie otoczenia z taką samą ostrością jak ludzcy kierowcy.Chociaż wciąż istnieją przeszkody, które należy pokonać, nie ulega wątpliwości, że korzyści oferowane przez wizję maszynową w kwestiach bezpieczeństwa i nawigacji są znaczące. Patrząc w przyszłość autonomicznego transportu, ciągły postęp w dziedzinie sztucznej inteligencji, obliczeń brzegowych i technologii obrazowania niewątpliwie doprowadzi do zwiększenia kompetencji ze strony samojezdnych samochodów, co doprowadzi do podniesienia ich poziomu autonomii.