เหตุใดบริบทโทเค็นหนึ่งล้านโทเค็นของ Gemini 1.5 จึงเป็นตัวเปลี่ยนเกม

Alicia Brunner included in Technology Explained Artificial Intelligence Chatbot Chatgpt Google

2024-02-23 235 words 2 minutes

Contents

ลิงค์ด่วน

⭐หน้าต่างบริบทคืออะไร?

⭐ ทำไมหน้าต่างบริบทของ Gemini 1.5 จึงเป็นเรื่องใหญ่

⭐ Gemini 1.5 จะเป็นไปตามความคาดหวังหรือไม่

ประเด็นที่สำคัญ

การทำซ้ำล่าสุดของแพลตฟอร์มโฆษณาที่ขับเคลื่อนด้วย AI ของ Google หรือที่เรียกว่า Gemini 1.5 ได้นำเสนอคุณสมบัติที่น่าประทับใจซึ่งทำให้แตกต่างจากคู่แข่งในอุตสาหกรรม โดยเฉพาะอย่างยิ่ง เวอร์ชันใหม่นี้มีหน้าต่างบริบทโทเค็นหนึ่งล้านอันที่น่าทึ่ง ซึ่งใหญ่กว่าแพลตฟอร์มอื่น ๆ เช่น Claude และ ChatGPT ที่นำเสนอในปัจจุบันอย่างมาก การปรับปรุงนี้ช่วยให้สามารถวิเคราะห์และกำหนดเป้าหมายได้อย่างครอบคลุมมากขึ้นภายในแคมเปญโฆษณาที่จัดการผ่านแพลตฟอร์ม ซึ่งนำไปสู่การปรับปรุงประสิทธิภาพและผลลัพธ์สำหรับผู้ใช้ในท้ายที่สุด

การเพิ่มขนาดของหน้าต่างบริบทสามารถนำไปสู่ประสิทธิภาพที่ดีขึ้นสำหรับโมเดลปัญญาประดิษฐ์ ในขณะที่ลดโอกาสที่จะเกิดข้อผิดพลาด อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่าสิ่งนี้ไม่ได้รับประกันความสำเร็จโดยรวมเสมอไป

Gemini 1.5 มีศักยภาพที่จะเพิ่มระดับความแม่นยำได้อย่างมากโดยการใช้หน้าต่างบริบทที่ใหญ่ขึ้น ส่งผลให้เกิดข้อผิดพลาดน้อยลง และปรับปรุงความเข้าใจโดยรวม

การทำซ้ำล่าสุดของแพลตฟอร์ม Gemini ของ Google เวอร์ชัน 1.5 มีหน้าต่างบริบทโทเค็นที่น่าประทับใจหนึ่งล้าน ซึ่งเหนือกว่าคู่แข่งเช่น ChatGPT, Claude และแชทบอทที่ขับเคลื่อนด้วย AI อื่น ๆ

การปรับปรุงที่นำเสนอนี้ดูเหมือนจะแสดงถึงการปรับปรุงที่สำคัญ ซึ่งมีศักยภาพในการสร้างความแตกต่างให้กับ Gemini จากคู่แข่ง แม้ว่าการเข้าใจถึงขนาดของความก้าวหน้านี้อาจนำมาซึ่งความท้าทายบางประการ แต่ก็เป็นไปได้ที่หน้าต่างบริบทที่ขยายออกไปอย่างมีนัยสำคัญที่ Gemini นำเสนอสามารถพิสูจน์ได้ว่าสามารถเปลี่ยนแปลงได้โดยธรรมชาติ

หน้าต่างบริบทคืออะไร?

เมื่อให้คำตอบ เช่น การชี้แจงแนวคิดหรือย่อข้อความ โมเดล AI จะถูกจำกัดโดยขอบเขตของข้อมูลที่สามารถนำมาพิจารณาในการสร้างคำตอบ ซึ่งเรียกว่า “หน้าต่างบริบท”

อีกมุมมองหนึ่งที่ต้องพิจารณาเกี่ยวข้องกับการเยี่ยมชมตลาดเพื่อหาข้อกำหนดโดยไม่มีรายการตรวจสอบสินค้าคงคลังที่กำหนดไว้ล่วงหน้า ในสถานการณ์นี้ ขอบเขตของความทรงจำจะกำหนด"หน้าต่างบริบท"ซึ่งส่งผลกระทบโดยตรงต่อแนวโน้มที่จะซื้อสินค้าตามเป้าหมายได้สำเร็จ ด้วยเหตุนี้ การเพิ่มขีดความสามารถของหน่วยความจำของระบบปัญญาประดิษฐ์จึงทำให้สามารถเก็บข้อมูลที่จำเป็นทั้งหมดได้ และเพิ่มความเป็นไปได้ในการให้ผลลัพธ์ที่ดีที่สุดในขณะที่ยังคงยึดถือความต้องการของผู้ใช้

ปัจจุบัน Claude 2.1 ของ Anthropic มีหน้าต่างบริบทที่กว้างขวางที่สุดในบรรดาโมเดล AI ที่เข้าถึงได้ง่ายทั้งหมด โดยวัดได้ที่โทเค็น 200,000 โทเค็น การติดตามอย่างใกล้ชิดคือ GPT-4 Turbo ซึ่งมีขนาดหน้าต่างบริบทเท่ากับ 128,000 โทเค็น อย่างไรก็ตาม Google Gemini 1.5 พร้อมที่จะเปิดตัวหน้าต่างบริบทโทเค็นหนึ่งล้านอันที่น่าอัศจรรย์ ซึ่งเหนือกว่าข้อเสนอที่มีอยู่ทั้งหมดในตลาดด้วยส่วนต่างที่สำคัญ การเกิดขึ้นของหน้าต่างบริบทขนาดใหญ่ดังกล่าวทำให้เกิดคำถามที่สำคัญเกี่ยวกับผลกระทบที่อาจเกิดขึ้นและความสำคัญภายในอุตสาหกรรม

เหตุใดหน้าต่างบริบทของ Gemini 1.5 จึงเป็นเรื่องใหญ่

สมาร์ทม็อคอัพ

พูดง่ายๆ ก็คือ Claude AI มีความสามารถในการประมวลผลประมาณ 150,000 คำภายในหน้าต่างบริบท 200,000 คำ ซึ่งค่อนข้างน่าประทับใจ ในทางกลับกัน Gemini 1.5 ของ Google มีความสามารถที่กว้างขวางยิ่งขึ้น เนื่องจากสามารถรองรับคำศัพท์ได้มากถึง 700,000 คำพร้อมกัน

การรวมข้อมูลจำนวนมหาศาลภายในขอบเขตของแชทบอท AI เช่น ChatGPT หรือ Gemini นั้นไม่สามารถทำได้เสมอไป เนื่องจากข้อจำกัดที่กำหนดโดยหน้าต่างบริบท ความล้มเหลวในการพิจารณาสิ่งนี้อาจส่งผลให้มีการพยายามประมวลผลข้อมูลมากกว่าที่ระบบสามารถจัดการได้อย่างมีประสิทธิภาพ ซึ่งนำไปสู่ปัญหาที่อาจเกิดขึ้นระหว่างการแลกเปลี่ยน

จินตนาการถึงสถานการณ์ที่คุณได้รับมอบหมายให้สรุปภาพยนตร์ขนาดเต็มหลังจากดูเพียงยี่สิบนาทีแรกเท่านั้น ผลลัพธ์ของความพยายามดังกล่าวไม่น่าจะน่าพอใจ เนื่องจากการอธิบายโครงเรื่องและการพัฒนาตัวละครของภาพยนตร์อย่างครอบคลุมนั้นเป็นเรื่องที่ท้าทายอย่างยิ่ง ในสถานการณ์นี้ จะสมเหตุสมผลหากปฏิเสธที่จะให้คำอธิบายใดๆ เลย หรือสร้างเรื่องราวที่สมมติขึ้นเนื่องจากข้อจำกัดโดยธรรมชาติของปัญญาประดิษฐ์ในการสร้างการตอบสนองที่สอดคล้องกันโดยอาศัยข้อมูลที่จำกัด ด้วยเหตุนี้ เรื่องราวที่สร้างขึ้นเหล่านี้จึงอาจก่อให้เกิดการรับรู้ลวงตาอันเกิดจากการที่ AI ไม่สามารถเข้าใจความซับซ้อนของการสื่อสารของมนุษย์ได้อย่างเต็มที่

สิ่งสำคัญคือต้องทราบว่าบริบทของการสนทนาขยายไปไกลกว่าแค่การจัดหาข้อความจำนวนมากเพื่อป้อนข้อมูลให้กับโมเดล AI ภายในพร้อมท์เดียว โมเดล AI จะพิจารณาบทสนทนาทั้งหมดที่เกิดขึ้นระหว่างเซสชันการแชท เพื่อสร้างคำตอบที่มีทั้งความเหมาะสมและตรงประเด็น มุมมองบริบทที่กว้างขึ้นนี้ช่วยให้แน่ใจว่าผลลัพธ์ที่สร้างขึ้นสอดคล้องกับความหมายและความตั้งใจที่ตั้งใจไว้เบื้องหลังการสื่อสารของผู้ใช้

ลักษณะแบบไดนามิกของการแลกเปลี่ยนของเรากับโมเดลภาษา AI มีส่วนช่วยให้เข้าใจบริบท แม้ว่าเราจะไม่ได้ส่งข้อความยาวๆ ให้พวกเขา แต่การโต้ตอบของเราและการตอบกลับที่พวกเขาสร้างขึ้นจะช่วยเพิ่มคุณค่าให้กับหน้าต่างบริบท ปรากฏการณ์ของระบบเหล่านี้ดูเหมือนจะไม่คำนึงถึงหัวข้อที่กล่าวถึงก่อนหน้านี้ อาจมีสาเหตุมาจากความจุเกินความจุของหน้าต่างบริบทในการจัดเก็บข้อมูล ข้อมูลสำคัญจึงถูกละทิ้ง ส่งผลให้ความจำเสื่อม

กรอบงานบริบทที่กว้างขวางมากขึ้นมีความสำคัญอย่างยิ่งเมื่อต้องจัดการกับงานที่จำเป็นต้องมีความเข้าใจบริบทที่ซับซ้อน เช่น การย่อบทความที่มีความยาว การจัดการกับคำถามที่ซับซ้อน หรือการรักษาความต่อเนื่องที่ราบรื่นภายในวาทกรรมที่เกิดขึ้น ปรารถนาที่จะเขียนนวนิยายที่มีเนื้อหาครอบคลุมห้าหมื่นคำพร้อมเนื้อเรื่องที่เป็นหนึ่งเดียวหรือไม่? กำลังมองหาแบบจำลองที่สามารถตรวจสอบและตอบคำถามเกี่ยวกับการนำเสนอวิดีโอความยาวหนึ่งชั่วโมงได้หรือไม่? ในทั้งสองกรณี หน้าต่างบริบทที่กว้างขึ้นจะขาดไม่ได้

โดยพื้นฐานแล้ว ขอบเขตบริบทที่ขยายออกไปของ Gemini 1.5 มีศักยภาพในการเพิ่มประสิทธิภาพอย่างมากของโมเดลปัญญาประดิษฐ์ ลดกรณีของการบิดเบือนความจริง และเพิ่มความแม่นยำและการปฏิบัติตามคำแนะนำอย่างเห็นได้ชัด

Gemini 1.5 จะเป็นไปตามความคาดหวังหรือไม่

จากประสบการณ์ในอดีตของ Google ในการพัฒนาโมเดล AI ที่ไม่เสถียร จึงควรระมัดระวังในการใช้ความยับยั้งชั่งใจ และไม่คิดว่าการเพิ่มหน้าต่างบริบทจะส่งผลให้ประสิทธิภาพที่เหนือกว่าสำหรับ Gemini 1.5 เสมอไป แม้ว่าเวอร์ชันใหม่นี้จะมีโอกาสสูงกว่ามาตรฐานอุตสาหกรรมในปัจจุบัน แต่เราก็ต้องระมัดระวังและพิจารณาปัจจัยอื่นๆ นอกเหนือจากการปรับพารามิเตอร์ง่ายๆ

ตลอดประสบการณ์ของฉันในการใช้หน้าต่างบริบท 200,000 ของ Claude 2.1 นับตั้งแต่เปิดตัว เห็นได้ชัดว่าหน้าต่างบริบทที่ขยายสามารถเพิ่มความไวของบริบทได้ อย่างไรก็ตาม ข้อบกพร่องในประสิทธิภาพของโมเดลพื้นฐานอาจทำให้หน้าต่างบริบทที่เพิ่มขึ้นกลายเป็นอุปสรรคแทนที่จะเป็นสินทรัพย์

Google Gemini 1.5 จะทำให้เราเปลี่ยนเกมหรือไม่? ขณะนี้โซเชียลมีเดียเต็มไปด้วยบทวิจารณ์ที่เร่าร้อนของ Gemini 1.5 จากผู้ใช้ที่ทดลองใช้ก่อนเปิดตัว อย่างไรก็ตาม บทวิจารณ์ระดับ 5 ดาวส่วนใหญ่มาจากกรณีการใช้งานที่เร่งรีบหรือเรียบง่าย ที่ที่ดีในการตรวจสอบว่า Gemini 1.5 จะทำงานอย่างไรเมื่อใช้งานจริงอยู่ใน รายงานทางเทคนิค Gemini 1.5 ของ Google [PDF] รายงานแสดงให้เห็นว่าแม้ในระหว่าง"การทดสอบที่มีการควบคุม"โมเดลก็ไม่สามารถดึงรายละเอียดเล็กๆ น้อยๆ ทั้งหมดของเอกสารภายในขนาดของหน้าต่างบริบทได้

แท้จริงแล้ว แม้ว่าการบรรลุหน้าต่างบริบทของโทเค็นหนึ่งล้านนั้นแสดงถึงความสำเร็จทางเทคโนโลยีที่น่าสังเกต แต่ประโยชน์ในทางปฏิบัติก็อาจลดลงหากการดึงข้อมูลเฉพาะของเอกสารที่เชื่อถือได้ไม่สามารถทำได้อย่างสม่ำเสมอ ในทางกลับกัน ข้อจำกัดดังกล่าวอาจส่งผลให้ความแม่นยำลดลงและเกิดการคาดเดาหรือการคาดเดาที่ไม่สมเหตุสมผล