Contents

什麼是機器視覺以及它對自動駕駛汽車有多重要?

要點

自動駕駛車輛利用先進的視覺感知能力作為理解環境的一種手段,使它們能夠透過機器視覺技術辨別障礙物、識別標誌並安全地沿著道路行駛。

自動駕駛汽車使用的機器視覺結合了攝影機、邊緣運算和人工智慧技術來獲取視覺數據、立即分析數據並識別環境中的形式和實體。

人工智慧、邊緣運算和攝影機技術的進步對於透過機器視覺實現自動駕駛汽車的完全自主至關重要。此功能允許對物件進行分類、偵測車道和號誌、識別標誌以及識別交通模式。

隨著時間的推移,自動駕駛汽車的概念引起了人們的極大興趣。儘管我們目前可能還沒有完全自動駕駛的汽車,但現代車輛都配備了尖端的高級駕駛輔助系統(ADAS),可以執行自動轉向、車道偏離修正、停車操作和自適應速度調節等功能以響應當時的交通狀況。

自動駕駛車輛依靠大量感測器來有效發揮高級駕駛輔助系統 (ADAS) 的作用。機器視覺是感知、識別和確定環境中各種元素的位置和背景的主要方法。如果沒有機器視覺,自動駕駛汽車就不可能只配備巡航控制和自動駕駛儀。

什麼是機器視覺?

/bc/images/machine-vision-1.jpg

機器視覺,也稱為人工智慧影像處理,是指機器透過識別和識別特定物體或模式來解釋周圍環境視覺訊息的能力。這項技術在機器人和自動駕駛車輛等自動化系統中具有許多工業應用,它使這些機器能夠透過旨在模仿人類視覺的電腦演算法來感知和導航其環境。

機器視覺的當前狀態在很大程度上依賴人工智慧技術,特別是那些源自深度學習架構(如卷積神經網路(CNN))的技術。這些先進的演算法有助於開發具有高度彈性和普遍適用的模型,能夠在各種操作場景中高精度地識別物體。因此,這些系統越來越多地被用於從製造、農業到機器人和自動駕駛汽車等行業的高風險應用,在這些行業中,可靠的性能至關重要。

機器視覺在自動駕駛汽車中如何運作?

相機佈置、運算處理(發生在邊緣)和人工智慧演算法。這些元素使自動駕駛汽車能夠感知周圍環境,根據這些資訊做出明智的決策,並區分沿途存在的各種物體和潛在危險,從而促進自動駕駛汽車的操作。為了理解這些技術方面如何結合起來為自動駕駛汽車創建一個有凝聚力的機器視覺系統,讓我們詳細研究每個組件。

/bc/images/cameras.jpg

相機系統

機器視覺利用攝影機系統來獲取有關周圍環境的視覺資料。自動駕駛汽車利用位於車輛周圍的多個攝影機來收集全面的視覺訊息,以增強態勢感知和決策。

互補金屬氧化物半導體 (CMOS) 和電荷耦合元件 (CCD)。在自動駕駛汽車中,CMOS 因其快速的讀出速度、強大的車載電子設備和並行處理能力而經常受到青睞,這使其成為更方便的選擇,儘管容易受到雜訊或失真的影響。然而,可以採用各種策略來緩解這些問題,包括可調節的照明設定、數位夜間影像和影像過濾技術,這些技術可增強 CMOS 感測器在次優照明場景下的效能。

立體視覺是多種視覺輸入組合的結果,賦予物體和周圍環境的深度或三維感。為了在自動駕駛汽車上實現這一目標,攝影機會按照特定的間隔進行策略性定位,使它們能夠透過三邊測量計算物體與車輛之間的近似距離。

立體視覺,或者說透過雙眼視覺感知深度的能力,是人類因為擁有兩隻眼睛而獲得的寶貴優勢。這種現象可以透過閉上一隻眼睛並選擇位於工作空間上的微小物品來進行實驗驗證。將手放在物體的外圍,同時確保其末端距離不小於兩英寸,個人可能會嘗試透過凝視一段時間來估計距離。隨後,重新睜開雙眼將顯示出理解空間關係的能力顯著增強,這一結果可歸因於由此獲得的增強的立體視覺敏銳度。

邊緣計算機

車載電腦利用邊緣處理功能,利用攝影機系統收集的即時資訊即時更新自動駕駛車輛的系統。儘管標準機器視覺應用的雲端運算可能節省成本,但將自動駕駛車輛連接到網路所涉及的固有風險需要替代解決方案。

利用分散式運算系統(例如邊緣電腦)來處理傳入資料可以減輕延遲問題並實現資訊的即時通訊。對於自動駕駛汽車,這些系統整合了 NVIDIA 等製造商的先進圖形處理單元 (GPU),這些單元結合了 Tensor Core 和 CUDA Core 等功能來增強性能。

人工智慧演算法

演算法的使用在機器視覺領域一直發揮著不可或缺的作用。這些演算法使電腦能夠辨別和識別相機捕獲的各種視覺元素,例如圖案、輪廓和色調。透過採用人工智慧(AI)而不是依賴傳統的機器視覺技術,自動駕駛汽車可以顯著提高準確識別物體、路標、車道標記和交通號誌的能力。目前正在採用一系列人工智慧演算法來教育自動駕駛汽車,其中一些最受歡迎的演算法包括:

YOLO(即「You Only Look Once」)是一種即時物體偵測演算法,旨在識別和追蹤汽車視覺範圍內的物體。

尺度不變特徵變換 (SIFT) 的利用對於提取特徵至關重要,這些特徵使車輛能夠識別周圍環境中的顯著地標和物體。

定向梯度直方圖 (HOG) 的使用是影像分析領域廣泛採用的技術,特別適合基於提取視覺影像中存在的局部圖案和梯度資訊來識別物件。

TextonBoost 是一種計算模型,旨在透過檢查環境背景下複雜的紋理圖案來增強視覺感知並提高物件辨識能力。這種創新方法利用深度神經網路等先進機器學習技術的力量來分析多個尺度和各種影像模式的視覺資訊。透過利用這些尖端技術,TextonBoost 有可能顯著增進我們對人類如何感知和解釋周圍環境的理解,為電腦視覺研究的新突破鋪平道路。

AdaBoost 是一種強大的演算法,用於透過將幾個表現不佳的分類器整合到強大的預測模型中來提高資料分類的準確性,該模型能夠有效識別車輛周圍環境中的物體和潛在危險。

機器視覺在自動駕駛汽車中的重要性

/bc/images/32751264885_97ef7205c6_b.jpg 圖片來源:Automobile Italia/Flickr

對機器視覺的依賴對於自動駕駛汽車感知環境至關重要,這使得機器視覺對於促進自動駕駛汽車在車輛自主範圍內實現更高水準的操作不可或缺。如果缺乏這種能力,這些車輛將被降級到較低的自動化水平,從而阻礙其向完全自動化的發展。

由於機器視覺技術的進步,自動駕駛汽車已經能夠熟練地對道路上的物體進行分類、檢測車道和信號、識別標誌以及識別交通流模式。

儘管依靠一系列感測器系統(包括光達、雷達和聲納)來進行導航和態勢感知,當代自動駕駛車輛仍然嚴重依賴機器視覺來感知周圍環境、識別其中的物體並理解路邊的重要性標誌和交通號誌。附加感官方式的結合僅用於增強機器視覺的能力,從而提高行人、家養動物和財產等的安全性。

當然,機器視覺已經發展到能夠自主運作而無需其他感官輸入的額外支持的水平。例如,特斯拉最新的自動駕駛汽車已經不再使用雷達技術,而是完全依賴機器視覺來輔助其自動駕駛系統。

雖然這可能不會削弱自動駕駛汽車中替代感測系統的優點,但它強調了機器視覺在自動駕駛汽車領域的重要性和效力。

自動駕駛汽車機器視覺的未來

機器視覺是自動駕駛汽車開發的基石,使這些車輛能夠以與人類駕駛員同等的敏銳度感知周圍環境。儘管仍然存在必須克服的障礙,但毫無疑問,機器視覺在安全和導航方面提供的優勢是巨大的。展望自動駕駛交通的未來,人工智慧、邊緣運算和成像技術的持續進步無疑將增強自動駕駛汽車的能力,從而提高自動駕駛水平。