Contents

Zero Shot Learning คืออะไร และจะปรับปรุง AI ได้อย่างไร

ประเด็นที่สำคัญ

เพื่อรับประกันการคาดการณ์ที่แม่นยำเมื่อพบกับข้อมูลใหม่ จำเป็นอย่างยิ่งที่อัลกอริธึมการเรียนรู้เชิงลึกจะต้องดำเนินการสรุปข้อมูลอย่างมีประสิทธิภาพ เทคนิคการเรียนรู้แบบ Zero-Shot ช่วยอำนวยความสะดวกในวัตถุประสงค์นี้โดยการทำให้ระบบปัญญาประดิษฐ์ใช้ความรู้ที่มีอยู่แล้วและสร้างการคาดการณ์ที่เชื่อถือได้เกี่ยวกับหมวดหมู่ที่ยังไม่เคยสังเกตมาก่อน โดยไม่ต้องใช้ข้อมูลที่มีป้ายกำกับใดๆ

การเรียนรู้แบบ Zero-shot ขั้นสูงจะประมาณกระบวนการรับรู้ของมนุษย์ผ่านการป้อนความหมายเสริม ช่วยให้สามารถจำแนกประเภทใหม่ๆ ได้อย่างแม่นยำด้วยความช่วยเหลือของแบบจำลองที่ผ่านการฝึกอบรมก่อนหน้านี้ คล้ายกับความสามารถของมนุษย์ในการจดจำกีตาร์ที่มีลำตัวกลวงตามคุณลักษณะที่กำหนด แนวทางนี้ทำให้สามารถระบุตัวตนได้อย่างแม่นยำในโดเมนที่หลากหลาย

การเรียนรู้แบบ Zero-shot เป็นแนวทางใหม่ที่ช่วยเพิ่มความสามารถด้านปัญญาประดิษฐ์โดยเพิ่มความสามารถในการสรุป ปรับขนาด หลีกเลี่ยงการติดตั้งมากเกินไป และลดต้นทุน วิธีการนี้ช่วยให้สามารถฝึกฝนโมเดลด้วยชุดข้อมูลที่กว้างขึ้น อำนวยความสะดวกในการถ่ายโอนการเรียนรู้เพื่อรับความรู้เพิ่มเติม ให้ความเข้าใจในบริบทที่ดีขึ้น และลดการพึ่งพาข้อมูลที่ติดป้ายกำกับอย่างกว้างขวาง เมื่อพิจารณาถึงความก้าวหน้าของการพัฒนา AI การเรียนรู้แบบ Zero-Shot จะมีความสำคัญมากขึ้นในการแก้ไขปัญหาที่ซับซ้อนในโดเมนที่หลากหลาย

วัตถุประสงค์สำคัญของการเรียนรู้เชิงลึกคือการปลูกฝังแบบจำลองที่สามารถมีความเข้าใจที่นำไปใช้ในระดับสากลได้ ความสำเร็จของความพยายามนี้มีความสำคัญอย่างยิ่ง เนื่องจากแบบจำลองนั้นได้เข้าใจรูปแบบที่มีคุณค่า และจะสร้างการอนุมานหรือการตัดสินที่แม่นยำอย่างเชี่ยวชาญเพื่อตอบสนองต่อข้อมูลใหม่หรือข้อมูลที่ยังไม่เคยสังเกตมาก่อน โดยทั่วไปแล้ว การสร้างแบบจำลองประเภทนี้จำเป็นต้องใช้วัสดุที่มีป้ายกำกับจำนวนมาก อย่างไรก็ตาม การได้มาซึ่งทรัพยากรดังกล่าวอาจต้องเสียค่าใช้จ่ายจำนวนมาก ต้องใช้ความพยายามอย่างมาก และในบางครั้งอาจไม่สามารถทำได้ด้วยซ้ำเนื่องจากข้อจำกัดในทางปฏิบัติ

เพื่อแก้ไขปัญหาดังกล่าว การเรียนรู้แบบ Zero-shot จึงถูกนำมาใช้เป็นแนวทางที่ใช้ฐานความรู้ที่มีอยู่แล้วของ AI เพื่อสร้างการอนุมานที่สมเหตุสมผล แม้ว่าจะไม่มีข้อมูลที่มีป้ายกำกับเพียงพอก็ตาม

การเรียนรู้แบบ Zero-Shot คืออะไร?

การเรียนรู้แบบ Zero-shot เป็นตัวอย่างหนึ่งของการถ่ายโอนการเรียนรู้ ซึ่งเกี่ยวข้องกับการใช้ประโยชน์จากโมเดลที่ได้รับการฝึกอบรมมาก่อนหน้านี้เพื่อจดจำหมวดหมู่ที่ไม่คุ้นเคยผ่านรายละเอียดเสริมที่เกี่ยวข้องกับหมวดหมู่ใหม่เหล่านั้น

ด้วยการใช้ประโยชน์จากความคุ้นเคยอย่างกว้างขวางของโมเดลกับหัวข้อเฉพาะ และการให้บริบทเพิ่มเติมเกี่ยวกับคุณสมบัติที่เกี่ยวข้องที่จะมุ่งเน้น เราจึงสามารถแยกแยะเป้าหมายที่ต้องการได้อย่างมีประสิทธิภาพด้วยความแม่นยำอย่างยิ่ง

ในกรณีที่ไม่มีแบบจำลองเฉพาะสำหรับการระบุม้าลาย เราอาจใช้แบบจำลองที่มีอยู่ซึ่งออกแบบมาเพื่อรับรู้ว่าม้าเป็นตัวแทน ด้วยการแจ้งแบบจำลองนี้ว่าม้าลายเป็นม้าลายจริงๆ จึงสามารถจำแนกทั้งม้าลายและม้าตามลักษณะการมองเห็นได้อย่างมีประสิทธิภาพ วิธีการนี้ช่วยเพิ่มโอกาสในการระบุตัวตนที่แม่นยำ เมื่อใช้แบบจำลองกับข้อมูลภาพที่แสดงถึงทั้งสองสายพันธุ์นี้

การเรียนรู้แบบ Zero-shot เป็นเทคนิคที่คล้ายคลึงกับวิธีที่มนุษย์ได้รับความรู้ตามธรรมชาติ ความสามารถของมนุษย์ในการเข้าใจแนวคิดใหม่ๆ อย่างรวดเร็วโดยไม่ต้องมีคำสั่งที่ชัดเจนนั้นเป็นที่รู้จักกันดีในชื่อ “การเรียนรู้แบบ Zero-shot” เช่น ถ้ามีคนขอให้คุณหากีตาร์ตัวกลวงที่ร้านขายอุปกรณ์ดนตรี มันอาจจะเป็นเรื่องที่ท้าทาย อย่างไรก็ตาม หากพวกเขาให้ข้อมูลเพิ่มเติม เช่น รูรูปร่าง F ที่มีลักษณะเฉพาะซึ่งพบที่ด้านใดด้านหนึ่ง การค้นหาเครื่องมือที่ต้องการก็จะกลายเป็นเรื่องง่าย

/th/images/viktor-forgacs-nurl2wveb6w-unsplash-muo.jpg

เพื่อแสดงให้เห็นแนวคิดนี้ด้วยอินสแตนซ์จริง เราจะใช้แอปพลิเคชัน Zero-Shot Classification ที่ได้รับจากแพลตฟอร์มโอเพ่นซอร์ส Large Language Model (LLM) อย่าง Hugging Face ซึ่งใช้โมเดล Clip-ViT-Large

/th/images/zero-shot-learning-example.jpg

ภาพถ่ายแสดงให้เห็นขนมปังที่วางอยู่ภายในถุงช้อปปิ้ง ซึ่งยึดไว้อย่างแน่นหนากับเก้าอี้สูงโดยใช้เข็มขัดนิรภัย เนื้อหาของภาพได้รับการเปิดเผยอย่างกว้างขวางในฐานข้อมูลภาพที่ครอบคลุมระหว่างกระบวนการฝึกอบรม ทำให้สามารถจดจำและจำแนกองค์ประกอบต่างๆ ที่มีอยู่ในฉากได้อย่างแม่นยำ รวมถึงแต่ไม่จำกัดเฉพาะขนมปัง ของจิปาถะ เฟอร์นิเจอร์ที่นั่ง และ อุปกรณ์ควบคุม

เพื่อให้แบบจำลองสามารถจำแนกภาพได้อย่างถูกต้องตามหมวดหมู่ที่ไม่รู้จักก่อนหน้านี้ เช่น “ขนมปังผ่อนคลาย” “ขนมปังปลอดภัย” “ขนมปังนั่ง” “ร้านขายของชำในการขับขี่” และ “ร้านขายของชำที่ปลอดภัย” ก่อนอื่นจะต้องได้รับการฝึกอบรมเกี่ยวกับความหลากหลาย ชุดข้อมูลที่มีตัวอย่างจากหมวดหมู่ใหม่เหล่านี้ สิ่งนี้จะช่วยให้โมเดลสามารถสรุปได้ดีเมื่อนำเสนอด้วยอินสแตนซ์ใหม่และทำนายป้ายกำกับที่เกี่ยวข้องได้อย่างถูกต้อง

เป็นที่น่าสังเกตว่าเพื่อแสดงให้เห็นถึงความสามารถของการจำแนกประเภทซีโร่ช็อต เราได้จงใจเลือกคลาสที่ไม่ค่อยพบบ่อยและไม่เคยพบเห็นมาก่อน รวมถึงรูปภาพสำหรับการสาธิตนี้

/th/images/huggingface-image-classification.jpg

จากการอนุมานจากแบบจำลอง ทำให้มีระดับความเชื่อมั่นประมาณ 80% ในการจัดหมวดหมู่ภาพเป็น"ขนมปังปลอดภัย"สามารถคาดเดาได้ว่าความมุ่งมั่นนี้เกิดจากการรับรู้ของโมเดลที่ว่าเก้าอี้ที่มีไว้เพื่อความปลอดภัยมีความสำคัญมากกว่าเก้าอี้ที่ออกแบบมาเพื่อความสะดวกสบาย การพักผ่อน หรือแม้แต่การขับขี่

แน่นอนว่าเป็นเรื่องน่ายินดีที่ได้พบความสอดคล้องกันระหว่างความคาดหวังของเรากับผลลัพธ์ของแบบจำลอง อย่างไรก็ตาม อาจมีคนสงสัยเกี่ยวกับกระบวนการที่แบบจำลองมาถึงข้อสรุปนี้ ความเข้าใจคร่าวๆ เกี่ยวกับการเรียนรู้แบบ Zero-Shot สามารถให้ข้อมูลเชิงลึกเกี่ยวกับกลไกของมันได้

การเรียนรู้แบบ Zero-Shot ทำงานอย่างไร

การเรียนรู้แบบ Zero-shot ช่วยให้โมเดลที่มีอยู่แล้วสามารถจดจำหมวดหมู่ใหม่ๆ ได้โดยใช้ความรู้ที่ได้รับมาก่อนหน้านี้ โดยไม่ต้องให้ข้อมูลเพิ่มเติมที่มีคำอธิบายประกอบ กระบวนการนี้ประกอบด้วยสามขั้นตอนพื้นฐาน:

การตระเตรียม

/th/images/data-types.jpg

การเรียนรู้แบบ Zero-shot เริ่มต้นด้วยการสร้างข้อมูลรูปแบบที่โดดเด่นสามรูปแบบ

ข้อมูลที่จัดทำโดยแบบจำลองที่ได้รับการฝึกอบรมล่วงหน้าประกอบด้วยข้อมูลที่ถูกใช้ในระหว่างขั้นตอนการฝึกอบรมเริ่มต้น โดยเกี่ยวข้องกับชั้นเรียนที่เห็นที่ได้รับการยอมรับ สิ่งสำคัญคือต้องทราบว่าโมเดลเหล่านี้มีรากฐานสำหรับการจดจำคลาสบางคลาสโดยไม่ต้องป้อนข้อมูลหรือคำสั่งเพิ่มเติม เพื่อให้บรรลุผลลัพธ์ที่ดีที่สุดจากการเรียนรู้แบบ Zero-Shot ขอแนะนำอย่างยิ่งให้เลือกแบบจำลองที่ได้รับการฝึกอบรมล่วงหน้าซึ่งมีชุดข้อมูลการฝึกอบรมประกอบด้วยคลาสที่มีความคล้ายคลึงอย่างใกล้ชิดกับคลาสเฉพาะที่ตั้งใจจะจดจำ

ชุดข้อมูลประกอบด้วยข้อมูลที่ยังไม่เคยถูกนำมาใช้สำหรับกระบวนการฝึกอบรมอัลกอริธึมมาก่อน ในการเข้าถึงและวิเคราะห์ข้อมูลที่ยังไม่ได้ใช้ ผู้ใช้มีหน้าที่ระบุและรวบรวมข้อมูลด้วยตนเอง เนื่องจากไม่สามารถรับข้อมูลดังกล่าวได้โดยตรงผ่านโมเดลการเรียนรู้ของเครื่อง

ข้อมูลความหมายเพิ่มเติมอาจถูกนำมาใช้เพื่อช่วยแบบจำลองในการจดจำหมวดหมู่ที่ไม่เคยเห็นมาก่อน ข้อมูลเสริมดังกล่าวอาจมีรูปแบบต่างๆ เช่น คำแต่ละคำ วลี การฝังคำ หรือแม้แต่ป้ายกำกับชั้นเรียน

การทำแผนที่ความหมาย

/th/images/semantic-mapping-illustration-1.jpg

เพื่อระบุลักษณะของคลาสที่ไม่รู้จัก เราสร้างการฝังคำและสร้างเครือข่ายความหมายที่เชื่อมโยงคุณลักษณะเหล่านี้กับข้อมูลเพิ่มเติมที่มีอยู่ ด้วยการใช้ความรู้ที่มีอยู่แล้วจากผู้เรียนก่อนหน้าในด้านปัญญาประดิษฐ์ หรือที่เรียกว่า"การเรียนรู้แบบถ่ายโอน AI"เราสามารถเร่งกระบวนการนี้ได้อย่างมีนัยสำคัญ เนื่องจากคุณลักษณะหลายประการที่เกี่ยวข้องกับคลาสใหม่ได้ถูกสร้างขึ้นก่อนหน้านี้

การอนุมาน

/th/images/inferencing-model-illustration.jpg

การอนุมานเกี่ยวข้องกับการใช้แบบจำลองที่ได้รับการฝึกอบรมล่วงหน้าเพื่อสร้างการคาดการณ์หรือเอาต์พุตตามอินสแตนซ์อินพุต การจำแนกประเภทภาพแบบ Zero-shot เกี่ยวข้องกับการฝังคำจากภาพที่ให้มา และการเปรียบเทียบแบบกราฟิกกับข้อมูลสนับสนุนเพิ่มเติม ระดับของการรับประกันจะขึ้นอยู่กับความคล้ายคลึงกันระหว่างข้อมูลนำเข้าและข้อมูลเสริมที่นำเสนอ

การเรียนรู้แบบ Zero-Shot ช่วยปรับปรุง AI ได้อย่างไร

การเรียนรู้แบบ Zero-shot นำเสนอวิธีแก้ปัญหาอุปสรรคต่างๆ ที่มีอยู่ในการเรียนรู้ของเครื่อง เช่น:

ความสามารถทั่วไปที่เพิ่มขึ้น: การจำกัดการพึ่งพาข้อมูลที่ติดป้ายกำกับช่วยให้โมเดลได้รับการฝึกอบรมภายในชุดข้อมูลที่กว้างขึ้น ซึ่งจะเป็นการเพิ่มความสามารถทั่วไปและเสริมสร้างความน่าเชื่อถือ เมื่อแบบจำลองมีความรู้และความสามารถที่หลากหลายมากขึ้น พวกเขาอาจมีสามัญสำนึกแทนที่จะยึดติดกับวิธีการวิเคราะห์ข้อมูลแบบเดิมๆ

ด้วยกระบวนการที่เรียกว่าการเรียนรู้แบบถ่ายโอน โมเดลภาษา AI สามารถรับความรู้เพิ่มเติมและมีความเชี่ยวชาญมากขึ้นเมื่อเวลาผ่านไป สิ่งนี้ช่วยให้บริษัทและนักวิจัยแต่ละรายสามารถเพิ่มขีดความสามารถของโมเดลที่เกี่ยวข้องได้อย่างต่อเนื่อง ดังนั้นจึงมั่นใจได้ว่าพวกเขายังคงสามารถปรับขนาดและปรับตัวได้เมื่อเผชิญกับความท้าทายและโอกาสใหม่ ๆ

การใช้การเรียนรู้แบบ Zero-shot ในการฝึกโมเดลช่วยลดความเสี่ยงในการติดตั้งมากเกินไป ซึ่งเกิดขึ้นเมื่อฝึกโมเดลด้วยข้อมูลที่หลากหลายไม่เพียงพอ ส่งผลให้การแสดงรูปแบบอินพุตที่เป็นไปได้ไม่สมบูรณ์ ด้วยการใช้วิธีการนี้ โมเดลจึงมีความเข้าใจตามบริบทที่ได้รับการปรับปรุงของวิชาต่างๆ ดังนั้นจึงลดโอกาสที่จะเกิดความพอดีมากเกินไป

การใช้การเรียนรู้การถ่ายโอนแบบ Zero-shot ช่วยให้สามารถพัฒนาแนวทางที่มีประสิทธิภาพและคุ้มค่าในการสร้างแบบจำลองที่แข็งแกร่ง โดยการใช้ประโยชน์จากแบบจำลองที่ได้รับการฝึกอบรมล่วงหน้า และใช้ข้อมูลที่ติดป้ายกำกับจำนวนน้อยลงเมื่อเปรียบเทียบกับวิธีการแบบเดิม

ในขณะที่ปัญญาประดิษฐ์ยังคงก้าวหน้าต่อไป วิธีการต่างๆ เช่น การเรียนรู้แบบ Zero-Shot จะมีความเกี่ยวข้องและมีความสำคัญมากขึ้นในการนำไปประยุกต์ใช้

อนาคตของการเรียนรู้แบบ Zero-Shot

การเรียนรู้แบบ Zero-shot กลายเป็นองค์ประกอบสำคัญของการเรียนรู้ของเครื่อง ซึ่งช่วยให้โมเดลสามารถระบุและจัดหมวดหมู่ชั้นเรียนที่ไม่คุ้นเคยได้โดยไม่ต้องมีคำสั่งเฉพาะใดๆ ในขณะที่ความคืบหน้ายังคงดำเนินต่อไปเกี่ยวกับสถาปัตยกรรมแบบจำลอง วิธีการตามคุณลักษณะ และการบูรณาการหลายรูปแบบ การเรียนรู้แบบ Zero-Shot ได้รับการคาดหวังที่จะเพิ่มความยืดหยุ่นของระบบปัญญาประดิษฐ์อย่างมาก เมื่อจัดการกับปัญหาที่ซับซ้อนในสาขาต่างๆ เช่น หุ่นยนต์ การดูแลสุขภาพ และการมองเห็นของคอมพิวเตอร์