Contents

เหตุใดบริบทโทเค็นหนึ่งล้านโทเค็นของ Gemini 1.5 จึงเป็นตัวเปลี่ยนเกม

ลิงค์ด่วน

⭐หน้าต่างบริบทคืออะไร?

⭐ ทำไมหน้าต่างบริบทของ Gemini 1.5 จึงเป็นเรื่องใหญ่

⭐ Gemini 1.5 จะเป็นไปตามความคาดหวังหรือไม่

ประเด็นที่สำคัญ

การทำซ้ำล่าสุดของแพลตฟอร์มโฆษณาที่ขับเคลื่อนด้วย AI ของ Google หรือที่เรียกว่า Gemini 1.5 ได้นำเสนอคุณสมบัติที่น่าประทับใจซึ่งทำให้แตกต่างจากคู่แข่งในอุตสาหกรรม โดยเฉพาะอย่างยิ่ง เวอร์ชันใหม่นี้มีหน้าต่างบริบทโทเค็นหนึ่งล้านอันที่น่าทึ่ง ซึ่งใหญ่กว่าแพลตฟอร์มอื่น ๆ เช่น Claude และ ChatGPT ที่นำเสนอในปัจจุบันอย่างมาก การปรับปรุงนี้ช่วยให้สามารถวิเคราะห์และกำหนดเป้าหมายได้อย่างครอบคลุมมากขึ้นภายในแคมเปญโฆษณาที่จัดการผ่านแพลตฟอร์ม ซึ่งนำไปสู่การปรับปรุงประสิทธิภาพและผลลัพธ์สำหรับผู้ใช้ในท้ายที่สุด

การเพิ่มขนาดของหน้าต่างบริบทสามารถนำไปสู่ประสิทธิภาพที่ดีขึ้นสำหรับโมเดลปัญญาประดิษฐ์ ในขณะที่ลดโอกาสที่จะเกิดข้อผิดพลาด อย่างไรก็ตาม สิ่งสำคัญคือต้องทราบว่าสิ่งนี้ไม่ได้รับประกันความสำเร็จโดยรวมเสมอไป

Gemini 1.5 มีศักยภาพที่จะเพิ่มระดับความแม่นยำได้อย่างมากโดยการใช้หน้าต่างบริบทที่ใหญ่ขึ้น ส่งผลให้เกิดข้อผิดพลาดน้อยลง และปรับปรุงความเข้าใจโดยรวม

การทำซ้ำล่าสุดของแพลตฟอร์ม Gemini ของ Google เวอร์ชัน 1.5 มีหน้าต่างบริบทโทเค็นที่น่าประทับใจหนึ่งล้าน ซึ่งเหนือกว่าคู่แข่งเช่น ChatGPT, Claude และแชทบอทที่ขับเคลื่อนด้วย AI อื่น ๆ

การปรับปรุงที่นำเสนอนี้ดูเหมือนจะแสดงถึงการปรับปรุงที่สำคัญ ซึ่งมีศักยภาพในการสร้างความแตกต่างให้กับ Gemini จากคู่แข่ง แม้ว่าการเข้าใจถึงขนาดของความก้าวหน้านี้อาจนำมาซึ่งความท้าทายบางประการ แต่ก็เป็นไปได้ที่หน้าต่างบริบทที่ขยายออกไปอย่างมีนัยสำคัญที่ Gemini นำเสนอสามารถพิสูจน์ได้ว่าสามารถเปลี่ยนแปลงได้โดยธรรมชาติ

หน้าต่างบริบทคืออะไร?

เมื่อให้คำตอบ เช่น การชี้แจงแนวคิดหรือย่อข้อความ โมเดล AI จะถูกจำกัดโดยขอบเขตของข้อมูลที่สามารถนำมาพิจารณาในการสร้างคำตอบ ซึ่งเรียกว่า “หน้าต่างบริบท”

อีกมุมมองหนึ่งที่ต้องพิจารณาเกี่ยวข้องกับการเยี่ยมชมตลาดเพื่อหาข้อกำหนดโดยไม่มีรายการตรวจสอบสินค้าคงคลังที่กำหนดไว้ล่วงหน้า ในสถานการณ์นี้ ขอบเขตของความทรงจำจะกำหนด"หน้าต่างบริบท"ซึ่งส่งผลกระทบโดยตรงต่อแนวโน้มที่จะซื้อสินค้าตามเป้าหมายได้สำเร็จ ด้วยเหตุนี้ การเพิ่มขีดความสามารถของหน่วยความจำของระบบปัญญาประดิษฐ์จึงทำให้สามารถเก็บข้อมูลที่จำเป็นทั้งหมดได้ และเพิ่มความเป็นไปได้ในการให้ผลลัพธ์ที่ดีที่สุดในขณะที่ยังคงยึดถือความต้องการของผู้ใช้

ปัจจุบัน Claude 2.1 ของ Anthropic มีหน้าต่างบริบทที่กว้างขวางที่สุดในบรรดาโมเดล AI ที่เข้าถึงได้ง่ายทั้งหมด โดยวัดได้ที่โทเค็น 200,000 โทเค็น การติดตามอย่างใกล้ชิดคือ GPT-4 Turbo ซึ่งมีขนาดหน้าต่างบริบทเท่ากับ 128,000 โทเค็น อย่างไรก็ตาม Google Gemini 1.5 พร้อมที่จะเปิดตัวหน้าต่างบริบทโทเค็นหนึ่งล้านอันที่น่าอัศจรรย์ ซึ่งเหนือกว่าข้อเสนอที่มีอยู่ทั้งหมดในตลาดด้วยส่วนต่างที่สำคัญ การเกิดขึ้นของหน้าต่างบริบทขนาดใหญ่ดังกล่าวทำให้เกิดคำถามที่สำคัญเกี่ยวกับผลกระทบที่อาจเกิดขึ้นและความสำคัญภายในอุตสาหกรรม

เหตุใดหน้าต่างบริบทของ Gemini 1.5 จึงเป็นเรื่องใหญ่

/th/images/gemini-app-running-on-an-android-phone.jpg สมาร์ทม็อคอัพ

พูดง่ายๆ ก็คือ Claude AI มีความสามารถในการประมวลผลประมาณ 150,000 คำภายในหน้าต่างบริบท 200,000 คำ ซึ่งค่อนข้างน่าประทับใจ ในทางกลับกัน Gemini 1.5 ของ Google มีความสามารถที่กว้างขวางยิ่งขึ้น เนื่องจากสามารถรองรับคำศัพท์ได้มากถึง 700,000 คำพร้อมกัน

การรวมข้อมูลจำนวนมหาศาลภายในขอบเขตของแชทบอท AI เช่น ChatGPT หรือ Gemini นั้นไม่สามารถทำได้เสมอไป เนื่องจากข้อจำกัดที่กำหนดโดยหน้าต่างบริบท ความล้มเหลวในการพิจารณาสิ่งนี้อาจส่งผลให้มีการพยายามประมวลผลข้อมูลมากกว่าที่ระบบสามารถจัดการได้อย่างมีประสิทธิภาพ ซึ่งนำไปสู่ปัญหาที่อาจเกิดขึ้นระหว่างการแลกเปลี่ยน

จินตนาการถึงสถานการณ์ที่คุณได้รับมอบหมายให้สรุปภาพยนตร์ขนาดเต็มหลังจากดูเพียงยี่สิบนาทีแรกเท่านั้น ผลลัพธ์ของความพยายามดังกล่าวไม่น่าจะน่าพอใจ เนื่องจากการอธิบายโครงเรื่องและการพัฒนาตัวละครของภาพยนตร์อย่างครอบคลุมนั้นเป็นเรื่องที่ท้าทายอย่างยิ่ง ในสถานการณ์นี้ จะสมเหตุสมผลหากปฏิเสธที่จะให้คำอธิบายใดๆ เลย หรือสร้างเรื่องราวที่สมมติขึ้นเนื่องจากข้อจำกัดโดยธรรมชาติของปัญญาประดิษฐ์ในการสร้างการตอบสนองที่สอดคล้องกันโดยอาศัยข้อมูลที่จำกัด ด้วยเหตุนี้ เรื่องราวที่สร้างขึ้นเหล่านี้จึงอาจก่อให้เกิดการรับรู้ลวงตาอันเกิดจากการที่ AI ไม่สามารถเข้าใจความซับซ้อนของการสื่อสารของมนุษย์ได้อย่างเต็มที่

สิ่งสำคัญคือต้องทราบว่าบริบทของการสนทนาขยายไปไกลกว่าแค่การจัดหาข้อความจำนวนมากเพื่อป้อนข้อมูลให้กับโมเดล AI ภายในพร้อมท์เดียว โมเดล AI จะพิจารณาบทสนทนาทั้งหมดที่เกิดขึ้นระหว่างเซสชันการแชท เพื่อสร้างคำตอบที่มีทั้งความเหมาะสมและตรงประเด็น มุมมองบริบทที่กว้างขึ้นนี้ช่วยให้แน่ใจว่าผลลัพธ์ที่สร้างขึ้นสอดคล้องกับความหมายและความตั้งใจที่ตั้งใจไว้เบื้องหลังการสื่อสารของผู้ใช้

ลักษณะแบบไดนามิกของการแลกเปลี่ยนของเรากับโมเดลภาษา AI มีส่วนช่วยให้เข้าใจบริบท แม้ว่าเราจะไม่ได้ส่งข้อความยาวๆ ให้พวกเขา แต่การโต้ตอบของเราและการตอบกลับที่พวกเขาสร้างขึ้นจะช่วยเพิ่มคุณค่าให้กับหน้าต่างบริบท ปรากฏการณ์ของระบบเหล่านี้ดูเหมือนจะไม่คำนึงถึงหัวข้อที่กล่าวถึงก่อนหน้านี้ อาจมีสาเหตุมาจากความจุเกินความจุของหน้าต่างบริบทในการจัดเก็บข้อมูล ข้อมูลสำคัญจึงถูกละทิ้ง ส่งผลให้ความจำเสื่อม

กรอบงานบริบทที่กว้างขวางมากขึ้นมีความสำคัญอย่างยิ่งเมื่อต้องจัดการกับงานที่จำเป็นต้องมีความเข้าใจบริบทที่ซับซ้อน เช่น การย่อบทความที่มีความยาว การจัดการกับคำถามที่ซับซ้อน หรือการรักษาความต่อเนื่องที่ราบรื่นภายในวาทกรรมที่เกิดขึ้น ปรารถนาที่จะเขียนนวนิยายที่มีเนื้อหาครอบคลุมห้าหมื่นคำพร้อมเนื้อเรื่องที่เป็นหนึ่งเดียวหรือไม่? กำลังมองหาแบบจำลองที่สามารถตรวจสอบและตอบคำถามเกี่ยวกับการนำเสนอวิดีโอความยาวหนึ่งชั่วโมงได้หรือไม่? ในทั้งสองกรณี หน้าต่างบริบทที่กว้างขึ้นจะขาดไม่ได้

โดยพื้นฐานแล้ว ขอบเขตบริบทที่ขยายออกไปของ Gemini 1.5 มีศักยภาพในการเพิ่มประสิทธิภาพอย่างมากของโมเดลปัญญาประดิษฐ์ ลดกรณีของการบิดเบือนความจริง และเพิ่มความแม่นยำและการปฏิบัติตามคำแนะนำอย่างเห็นได้ชัด

Gemini 1.5 จะเป็นไปตามความคาดหวังหรือไม่

/th/images/gemini-advanced.PNG

จากประสบการณ์ในอดีตของ Google ในการพัฒนาโมเดล AI ที่ไม่เสถียร จึงควรระมัดระวังในการใช้ความยับยั้งชั่งใจ และไม่คิดว่าการเพิ่มหน้าต่างบริบทจะส่งผลให้ประสิทธิภาพที่เหนือกว่าสำหรับ Gemini 1.5 เสมอไป แม้ว่าเวอร์ชันใหม่นี้จะมีโอกาสสูงกว่ามาตรฐานอุตสาหกรรมในปัจจุบัน แต่เราก็ต้องระมัดระวังและพิจารณาปัจจัยอื่นๆ นอกเหนือจากการปรับพารามิเตอร์ง่ายๆ

ตลอดประสบการณ์ของฉันในการใช้หน้าต่างบริบท 200,000 ของ Claude 2.1 นับตั้งแต่เปิดตัว เห็นได้ชัดว่าหน้าต่างบริบทที่ขยายสามารถเพิ่มความไวของบริบทได้ อย่างไรก็ตาม ข้อบกพร่องในประสิทธิภาพของโมเดลพื้นฐานอาจทำให้หน้าต่างบริบทที่เพิ่มขึ้นกลายเป็นอุปสรรคแทนที่จะเป็นสินทรัพย์

Google Gemini 1.5 จะทำให้เราเปลี่ยนเกมหรือไม่? ขณะนี้โซเชียลมีเดียเต็มไปด้วยบทวิจารณ์ที่เร่าร้อนของ Gemini 1.5 จากผู้ใช้ที่ทดลองใช้ก่อนเปิดตัว อย่างไรก็ตาม บทวิจารณ์ระดับ 5 ดาวส่วนใหญ่มาจากกรณีการใช้งานที่เร่งรีบหรือเรียบง่าย ที่ที่ดีในการตรวจสอบว่า Gemini 1.5 จะทำงานอย่างไรเมื่อใช้งานจริงอยู่ใน รายงานทางเทคนิค Gemini 1.5 ของ Google [PDF] รายงานแสดงให้เห็นว่าแม้ในระหว่าง"การทดสอบที่มีการควบคุม"โมเดลก็ไม่สามารถดึงรายละเอียดเล็กๆ น้อยๆ ทั้งหมดของเอกสารภายในขนาดของหน้าต่างบริบทได้

แท้จริงแล้ว แม้ว่าการบรรลุหน้าต่างบริบทของโทเค็นหนึ่งล้านนั้นแสดงถึงความสำเร็จทางเทคโนโลยีที่น่าสังเกต แต่ประโยชน์ในทางปฏิบัติก็อาจลดลงหากการดึงข้อมูลเฉพาะของเอกสารที่เชื่อถือได้ไม่สามารถทำได้อย่างสม่ำเสมอ ในทางกลับกัน ข้อจำกัดดังกล่าวอาจส่งผลให้ความแม่นยำลดลงและเกิดการคาดเดาหรือการคาดเดาที่ไม่สมเหตุสมผล