Machine Vision คืออะไร และมีความสำคัญต่อรถยนต์ที่ขับเคลื่อนด้วยตนเองอย่างไร?
ประเด็นที่สำคัญ
ยานพาหนะที่ขับเคลื่อนด้วยตนเองใช้ความสามารถในการรับรู้ภาพขั้นสูงเพื่อทำความเข้าใจสภาพแวดล้อม ช่วยให้มองเห็นสิ่งกีดขวาง จดจำป้าย และเดินทางไปตามถนนได้อย่างปลอดภัยผ่านการใช้เทคโนโลยีวิชันซิสเต็ม
วิชันซิสเต็มที่ใช้โดยยานยนต์ไร้คนขับใช้การผสมผสานระหว่างกล้อง การประมวลผลแบบเอดจ์ และเทคนิคปัญญาประดิษฐ์เพื่อรับข้อมูลภาพ วิเคราะห์ได้ทันที และจดจำรูปแบบและเอนทิตีภายในสภาพแวดล้อม
ความก้าวหน้าในด้านปัญญาประดิษฐ์ การประมวลผลแบบเอดจ์ และเทคโนโลยีกล้องถือเป็นสิ่งสำคัญเพื่อให้เกิดความเป็นอิสระเต็มรูปแบบในรถยนต์ที่ขับเคลื่อนด้วยตนเองผ่านวิชันซิสเต็ม ความสามารถนี้ช่วยให้สามารถจำแนกประเภทของวัตถุ การตรวจจับช่องทางและสัญญาณ การระบุป้าย และการรับรู้รูปแบบการจราจร
แนวคิดของยานพาหนะที่ขับเคลื่อนด้วยตนเองได้รับความสนใจอย่างมากเมื่อเวลาผ่านไป แม้ว่าในปัจจุบันเราอาจไม่ได้มีรถยนต์ขับเคลื่อนอัตโนมัติทั้งหมด แต่ยานพาหนะสมัยใหม่ได้รับการติดตั้งระบบช่วยเหลือผู้ขับขี่ขั้นสูง (ADAS) ที่ทันสมัย ซึ่งสามารถทำหน้าที่ต่างๆ เช่น การบังคับเลี้ยวอัตโนมัติ การแก้ไขการเบี่ยงเบนเลน การจอดรถ และการควบคุมความเร็วแบบปรับได้ เพื่อตอบสนองต่อสภาพการจราจรในปัจจุบัน
ยานพาหนะที่ขับเคลื่อนด้วยตนเองอาศัยเซ็นเซอร์จำนวนมากเพื่อให้ทำงานได้อย่างมีประสิทธิภาพในฐานะระบบช่วยเหลือผู้ขับขี่ขั้นสูง (ADAS) วิชันซิสเต็มทำหน้าที่เป็นวิธีการหลักในการรับรู้ รับรู้ และกำหนดตำแหน่งและบริบทขององค์ประกอบต่างๆ ภายในสภาพแวดล้อม การไม่มีวิชันซิสเต็มจะทำให้ยานยนต์ไร้คนขับที่ติดตั้งระบบควบคุมความเร็วคงที่และระบบขับเคลื่อนอัตโนมัติไม่น่าจะเป็นไปได้สูง
วิชันซิสเต็มคืออะไร?
การมองเห็นเครื่องหรือที่เรียกว่าการประมวลผลภาพด้วยปัญญาประดิษฐ์ หมายถึงความสามารถของเครื่องจักรในการตีความข้อมูลภาพจากสภาพแวดล้อมโดยการจดจำและระบุวัตถุหรือรูปแบบเฉพาะ เทคโนโลยีนี้มีการใช้งานทางอุตสาหกรรมมากมายสำหรับใช้ในระบบอัตโนมัติ เช่น หุ่นยนต์และยานพาหนะไร้คนขับ ซึ่งช่วยให้เครื่องจักรเหล่านี้รับรู้และนำทางสภาพแวดล้อมผ่านอัลกอริธึมคอมพิวเตอร์ที่ออกแบบมาเพื่อเลียนแบบการมองเห็นของมนุษย์
สถานะปัจจุบันของแมชชีนวิชั่นต้องอาศัยเทคนิคปัญญาประดิษฐ์เป็นอย่างมาก โดยเฉพาะอย่างยิ่งเทคนิคที่ได้มาจากสถาปัตยกรรมการเรียนรู้เชิงลึก เช่น โครงข่ายประสาทเทียม (CNN) อัลกอริธึมขั้นสูงเหล่านี้ช่วยให้สามารถพัฒนาแบบจำลองที่มีความยืดหยุ่นสูงและใช้งานได้ในระดับสากล ซึ่งสามารถแยกแยะวัตถุได้อย่างแม่นยำด้วยความแม่นยำสูงในสถานการณ์การปฏิบัติงานที่หลากหลาย เป็นผลให้ระบบเหล่านี้ถูกนำไปใช้มากขึ้นสำหรับการใช้งานที่มีเดิมพันสูงในอุตสาหกรรมตั้งแต่การผลิตและการเกษตรไปจนถึงหุ่นยนต์และยานพาหนะอัตโนมัติ ซึ่งประสิทธิภาพที่เชื่อถือได้เป็นสิ่งสำคัญยิ่ง
Machine Vision ทำงานอย่างไรในรถยนต์ที่ขับเคลื่อนด้วยตนเอง?
การจัดเรียงกล้อง การประมวลผลทางคอมพิวเตอร์ (เกิดขึ้นที่ขอบ) และอัลกอริธึมปัญญาประดิษฐ์ องค์ประกอบเหล่านี้อำนวยความสะดวกในการทำงานของรถยนต์ขับเคลื่อนอัตโนมัติโดยทำให้สามารถรับรู้สภาพแวดล้อมรอบตัว ทำการตัดสินใจโดยใช้ข้อมูลโดยอาศัยข้อมูลนั้น และแยกแยะระหว่างวัตถุต่างๆ และอันตรายที่อาจเกิดขึ้นตามเส้นทาง เพื่อให้เข้าใจลักษณะที่แง่มุมทางเทคโนโลยีเหล่านี้รวมตัวกันเพื่อสร้างระบบวิชันซิสเต็มสำหรับรถยนต์ที่ขับเคลื่อนด้วยตนเอง เราจะมาเจาะลึกแต่ละส่วนประกอบโดยละเอียด
ระบบกล้อง
วิชันซิสเต็มใช้ระบบกล้องเพื่อรับข้อมูลภาพเกี่ยวกับสภาพแวดล้อมโดยรอบ ยานพาหนะขับเคลื่อนอัตโนมัติใช้กล้องหลายตัวที่ตั้งอยู่รอบๆ รถเพื่อรวบรวมข้อมูลภาพที่ครอบคลุมเพื่อเพิ่มการรับรู้สถานการณ์และการตัดสินใจ
สารกึ่งตัวนำโลหะออกไซด์เสริม (CMOS) และอุปกรณ์ชาร์จคู่ (CCD) ในบริบทของยานพาหนะขับเคลื่อนอัตโนมัติ CMOS มักได้รับความนิยมเนื่องจากมีความเร็วในการอ่านข้อมูลที่รวดเร็ว ระบบอิเล็กทรอนิกส์ออนบอร์ดที่แข็งแกร่ง และความสามารถในการประมวลผลแบบขนาน ซึ่งทำให้เป็นตัวเลือกที่สะดวกยิ่งขึ้น แม้ว่าจะไวต่อสัญญาณรบกวนหรือการบิดเบือนก็ตาม อย่างไรก็ตาม สามารถใช้กลยุทธ์ต่างๆ เพื่อลดปัญหาเหล่านี้ได้ รวมถึงการตั้งค่าความสว่างที่ปรับได้ ภาพดิจิทัลในเวลากลางคืน และเทคนิคการกรองภาพที่เพิ่มประสิทธิภาพการทำงานของเซนเซอร์ CMOS ภายใต้สถานการณ์แสงที่ไม่เหมาะสม
การมองเห็นสามมิติ ซึ่งเป็นผลมาจากการรวมกันของอินพุตภาพหลาย ๆ อัน ให้การรับรู้ความลึกหรือสามมิติบนวัตถุและสภาพแวดล้อมโดยรอบ เพื่อให้บรรลุเป้าหมายนี้สำหรับยานยนต์ไร้คนขับ กล้องจะถูกจัดตำแหน่งอย่างมีกลยุทธ์ตามช่วงเวลาที่กำหนด ซึ่งช่วยให้สามารถคำนวณระยะห่างใกล้เคียงระหว่างวัตถุและยานพาหนะผ่านการแยกส่วน
ภาพสามมิติหรือความสามารถในการรับรู้ความลึกผ่านการมองเห็นแบบสองตาเป็นข้อได้เปรียบอันมีค่าที่มนุษย์ได้รับเนื่องจากการครอบครองดวงตาทั้งสองข้าง ปรากฏการณ์นี้อาจได้รับการตรวจสอบโดยการทดลองโดยการหลับตาข้างหนึ่งแล้วเลือกรายการเล็กๆ น้อยๆ ที่อยู่ในพื้นที่ทำงานของตน การวางมือข้างหนึ่งไว้ข้างขอบของวัตถุโดยตรวจสอบให้แน่ใจว่าส่วนปลายสุดของมันอยู่ห่างจากกันไม่น้อยกว่า 2 นิ้ว บุคคลอาจพยายามประมาณระยะทางโดยจับจ้องจ้องอยู่ครู่หนึ่ง ต่อจากนั้น การเปิดตาทั้งสองข้างอีกครั้งจะเผยให้เห็นความสามารถที่เพิ่มขึ้นอย่างเห็นได้ชัดในการเข้าใจความสัมพันธ์เชิงพื้นที่ ซึ่งเป็นผลมาจากความสามารถในการมองเห็นแบบสามมิติที่ได้รับการปรับปรุงให้ดีขึ้น
เอดจ์คอมพิวเตอร์
คอมพิวเตอร์ออนบอร์ดซึ่งใช้ความสามารถในการประมวลผลแบบเอดจ์ จะอัปเดตระบบของรถยนต์ไร้คนขับทันทีด้วยข้อมูลแบบเรียลไทม์ที่รวบรวมโดยระบบกล้อง แม้จะมีการประหยัดต้นทุนที่เกี่ยวข้องกับการประมวลผลแบบคลาวด์สำหรับแอปพลิเคชันวิชันซิสเต็มมาตรฐาน แต่ความเสี่ยงโดยธรรมชาติที่เกี่ยวข้องกับการเชื่อมต่อยานพาหนะที่ขับเคลื่อนด้วยตนเองกับอินเทอร์เน็ตจำเป็นต้องมีโซลูชันทางเลือก
การใช้ระบบคอมพิวเตอร์แบบกระจาย เช่น คอมพิวเตอร์ Edge เพื่อจัดการข้อมูลขาเข้าสามารถลดข้อกังวลด้านเวลาแฝง และทำให้สามารถสื่อสารข้อมูลแบบเรียลไทม์ได้ สำหรับรถยนต์ขับเคลื่อนอัตโนมัติ ระบบเหล่านี้จะรวมหน่วยประมวลผลกราฟิก (GPU) ขั้นสูงจากผู้ผลิตเช่น NVIDIA ซึ่งรวมคุณสมบัติต่างๆ เช่น Tensor Core และ CUDA Cores เพื่อเพิ่มประสิทธิภาพ
อัลกอริทึม AI
การใช้อัลกอริธึมมีบทบาทที่ขาดไม่ได้อย่างต่อเนื่องในขอบเขตของวิชันซิสเต็ม อัลกอริธึมเหล่านี้ช่วยให้คอมพิวเตอร์มองเห็นและจดจำองค์ประกอบภาพต่างๆ เช่น รูปแบบ รูปทรง และเฉดสีที่กล้องจับภาพได้ ด้วยการใช้ปัญญาประดิษฐ์ (AI) แทนที่จะอาศัยเทคนิควิชันซิสเต็มแบบเดิมๆ ยานพาหนะอัตโนมัติสามารถปรับปรุงความสามารถในการระบุวัตถุ ป้ายถนน เครื่องหมายช่องทางเดินรถ และสัญญาณไฟจราจรได้อย่างแม่นยำ ปัจจุบันมีการใช้อัลกอริธึม AI มากมายเพื่อให้ความรู้แก่รถยนต์ไร้คนขับ โดยอัลกอริธึมที่แพร่หลายมากที่สุดได้แก่:
YOLO หรือ “คุณมองเพียงครั้งเดียว” เป็นอัลกอริธึมการตรวจจับวัตถุแบบเรียลไทม์ที่ออกแบบมาเพื่อระบุและติดตามวัตถุภายในระยะการมองเห็นของรถยนต์
การใช้การแปลงคุณลักษณะที่ไม่แปรผันตามมาตราส่วน (SIFT) เป็นสิ่งสำคัญสำหรับการแยกคุณลักษณะที่ช่วยให้ยานพาหนะสามารถระบุจุดสังเกตและวัตถุเด่นภายในสภาพแวดล้อมโดยรอบได้
การใช้ฮิสโตแกรมของการไล่ระดับสีเชิงทิศทาง (HOG) เป็นเทคนิคที่ใช้กันอย่างแพร่หลายในขอบเขตของการวิเคราะห์ภาพ โดยมุ่งเน้นที่การระบุวัตถุโดยเฉพาะโดยอาศัยการดึงข้อมูลลวดลายเฉพาะจุดและข้อมูลการไล่ระดับสีที่มีอยู่ในจินตภาพ
TextonBoost เป็นแบบจำลองการคำนวณที่ออกแบบมาเพื่อปรับปรุงการรับรู้ทางสายตาและปรับปรุงความสามารถในการจดจำวัตถุโดยการตรวจสอบรูปแบบที่ซับซ้อนของพื้นผิวภายในบริบทด้านสิ่งแวดล้อม แนวทางที่เป็นนวัตกรรมนี้ควบคุมพลังของเทคนิคการเรียนรู้ของเครื่องขั้นสูง เช่น โครงข่ายประสาทเทียมเชิงลึก เพื่อวิเคราะห์ข้อมูลภาพในหลายระดับและผ่านรูปแบบรูปภาพต่างๆ ด้วยการใช้ประโยชน์จากเทคโนโลยีล้ำสมัยเหล่านี้ TextonBoost มีศักยภาพในการพัฒนาความเข้าใจของเราอย่างมากเกี่ยวกับวิธีที่มนุษย์รับรู้และตีความสภาพแวดล้อมของพวกเขา ซึ่งปูทางไปสู่ความก้าวหน้าครั้งใหม่ในการวิจัยการมองเห็นด้วยคอมพิวเตอร์
AdaBoost เป็นอัลกอริธึมอันทรงพลังที่ใช้เพื่อเพิ่มความแม่นยำของการจำแนกข้อมูลโดยการรวมตัวแยกประเภทที่มีประสิทธิภาพต่ำหลายตัวเข้ากับแบบจำลองการคาดการณ์ที่มีประสิทธิภาพ ซึ่งสามารถระบุทั้งวัตถุและอันตรายที่อาจเกิดขึ้นภายในสภาพแวดล้อมโดยรอบของยานพาหนะได้อย่างมีประสิทธิภาพ
ความสำคัญของวิชันซิสเต็มในรถยนต์ที่ขับเคลื่อนด้วยตนเอง
เครดิตรูปภาพ: รถยนต์อิตาลี/Flickr
การพึ่งพาวิชันซิสเต็มเป็นสิ่งสำคัญในการทำให้ยานยนต์ไร้คนขับสามารถรับรู้สภาพแวดล้อมได้ ทำให้เป็นสิ่งที่ขาดไม่ได้ในการอำนวยความสะดวกในการทำงานของรถยนต์ที่ขับเคลื่อนด้วยตนเองในระดับที่สูงขึ้นตามสเปกตรัมของความเป็นอิสระของยานพาหนะ การขาดความสามารถนี้จะส่งผลให้ยานพาหนะเหล่านี้ถูกลดระดับลงสู่ระดับล่างของความเป็นอิสระ ขัดขวางความก้าวหน้าไปสู่ระบบอัตโนมัติโดยสมบูรณ์
ด้วยความก้าวหน้าของเทคโนโลยีวิชันซิสเต็ม รถยนต์ขับเคลื่อนอัตโนมัติจึงมีความเชี่ยวชาญในการจำแนกวัตถุบนถนน การตรวจจับช่องทางและสัญญาณ การระบุป้าย และการจดจำรูปแบบการไหลของการจราจร
แม้จะอาศัยระบบเซ็นเซอร์ต่างๆ มากมาย รวมถึง LiDAR, RADAR และ SONAR สำหรับการนำทางและการรับรู้สถานการณ์ แต่ยานยนต์ไร้คนขับร่วมสมัยยังคงพึ่งพาการมองเห็นของเครื่องจักรอย่างมากในการรับรู้สภาพแวดล้อม แยกแยะวัตถุภายใน และเข้าใจความสำคัญของริมถนน ป้ายและสัญญาณไฟจราจร การนำวิธีการทางประสาทสัมผัสเพิ่มเติมมาใช้เพียงเพื่อเพิ่มขีดความสามารถของการมองเห็นของเครื่องจักร และด้วยเหตุนี้จึงส่งเสริมความปลอดภัยที่เพิ่มขึ้นสำหรับคนเดินถนน สัตว์เลี้ยงในบ้าน และทรัพย์สิน
แน่นอนว่า แมชชีนวิชันได้พัฒนาไปสู่ระดับที่สามารถทำงานได้โดยอัตโนมัติ โดยไม่ต้องอาศัยการสนับสนุนเพิ่มเติมจากปัจจัยทางประสาทสัมผัสอื่นๆ ตัวอย่างเช่น รถยนต์ไร้คนขับรุ่นล่าสุดของ Tesla ได้ยกเลิกการใช้เทคโนโลยีเรดาร์ โดยหันมาใช้วิชันซิสเต็มเพื่ออำนวยความสะดวกให้กับระบบออโตไพลอต
แม้ว่าสิ่งนี้อาจไม่บ่อนทำลายข้อดีของระบบประสาทสัมผัสทางเลือกในรถยนต์ขับเคลื่อนอัตโนมัติ แต่ก็ตอกย้ำความสำคัญและประสิทธิภาพของการมองเห็นเครื่องจักรภายในขอบเขตของรถยนต์ที่ขับเคลื่อนด้วยตนเอง
อนาคตของแมชชีนวิชั่นในยานยนต์อัตโนมัติ
การมองเห็นเครื่องจักรทำหน้าที่เป็นรากฐานที่สำคัญสำหรับการพัฒนารถยนต์ที่ขับเคลื่อนด้วยตนเอง ช่วยให้ยานพาหนะเหล่านี้รับรู้สภาพแวดล้อมรอบตัวด้วยระดับความรุนแรงที่เท่ากันกับคนขับ แม้ว่ายังคงมีอุปสรรคที่ต้องเอาชนะ แต่ก็เถียงไม่ได้ว่าข้อดีที่ได้รับจากการมองเห็นเครื่องจักรในเรื่องความปลอดภัยและการนำทางนั้นมีมากมาย ในขณะที่เรามองไปสู่อนาคตของการขนส่งแบบอัตโนมัติ ความก้าวหน้าอย่างต่อเนื่องในด้านปัญญาประดิษฐ์ เอดจ์คอมพิวติ้ง และเทคโนโลยีการถ่ายภาพจะนำไปสู่ความสามารถที่เพิ่มขึ้นในส่วนของรถยนต์ที่ขับเคลื่อนด้วยตนเองอย่างไม่ต้องสงสัย ส่งผลให้ระดับความเป็นอิสระของพวกเขาสูงขึ้น