Google PaLM 2 กับ OpenAI GPT-4: อะไรคือความแตกต่าง?
Google เปิดตัว Pathways Language Model (PaLM 2) รุ่นต่อไปในวันที่ 10 พฤษภาคม 2023 ที่ Google I/O โมเดลภาษาขนาดใหญ่ (LLM) ใหม่มีการปรับปรุงอย่างมากจากรุ่นก่อน (PaLM) และในที่สุดก็อาจพร้อมที่จะ เผชิญหน้ากับคู่แข่งที่ใหญ่ที่สุด GPT-4 ของ OpenAI
อันที่จริงขอบเขตที่ Google มีความก้าวหน้ายังคงเป็นเรื่องของการพิจารณา PaLM 2 สามารถพิสูจน์ได้ว่าเป็นปัจจัยสำคัญที่ Google จินตนาการไว้หรือไม่ นอกจากนี้ เมื่อพิจารณาถึงความสามารถที่เทียบเคียงได้มากมายในตลาด อะไรที่ทำให้ PaLM 2 แตกต่างจาก GPT-4 ของ OpenAI
PaLM 2 กับ GPT-4: ภาพรวมประสิทธิภาพ
PaLM 2 มีคุณสมบัติที่เป็นนวัตกรรมมากมายที่ทำให้แตกต่างจากรุ่นก่อนๆ รวมถึงความคล่องตัวในการเสนอในรูปแบบขนาดเล็กที่ปรับแต่งให้เหมาะสมกับงานเฉพาะที่ต้องใช้ทรัพยากรในการคำนวณน้อยกว่า GPT-4
แต่ละมิติที่กล่าวมาข้างต้นมีตัวจิ๋วที่คล้ายกันซึ่งเรียกว่า Gecko, Otter, Bison และ Unicorn โดยที่ Gecko เป็นตัวแทนของการทำซ้ำที่เล็กที่สุด ตามมาด้วย Otter, Bison และสุดท้ายคือยูนิคอร์น ซึ่งใหญ่ที่สุดในทั้งหมด
Google ยืนยันว่าได้ปรับปรุงทักษะการใช้เหตุผลเมื่อเปรียบเทียบกับ GPT-4 ทั้งใน WinoGrande และ DROP ซึ่งได้รับชัยชนะเล็กน้อยใน ARC-C นอกจากนี้ยังมีความก้าวหน้าที่สำคัญในทุกด้านที่เกี่ยวข้องกับ PaLM และ SOTA
PaLM 2 ยังเก่งคณิตศาสตร์มากกว่าอีกด้วย ตามรายงาน 91 หน้าของ Google รายงานการวิจัย PaLM 2 [PDF] อย่างไรก็ตาม วิธีที่ Google และ OpenAI จัดโครงสร้างผลการทดสอบทำให้ยากต่อการเปรียบเทียบทั้งสองรุ่นโดยตรง Google ละเว้นการเปรียบเทียบบางอย่าง อาจเป็นเพราะ PaLM 2 ทำงานได้ไม่ดีพอๆ กับ GPT-4
MMLU, HellaSwag และ ARC-E ผลลัพธ์เผยให้เห็นว่า GPT-4 มีประสิทธิภาพเหนือกว่า PaLM 2 ในทุกกรณี ยกเว้นกรณีเดียวที่พวกเขาได้คะแนนเท่ากัน โดยเฉพาะใน MMLU นั้น GPT-4 ได้คะแนน 86.4% ในขณะที่ PaLM 2 ได้คะแนน 81% ในทำนองเดียวกัน เมื่อพิจารณาโมเดล HellaSwag GPT-4 มีคะแนนที่น่าประทับใจ 95.3% ในขณะที่ประสิทธิภาพของ PaLM 2 ค่อนข้างต่ำกว่าที่ 86.8% สุดท้ายในรุ่น ARC-E ทั้งสองรุ่นใช้งานได้
รุ่นที่ใหญ่ที่สุดในตระกูล PaLM 2 คือ PaLM 2-L แม้ว่าเราจะไม่ทราบขนาดที่แน่นอน แต่เรารู้ว่ามันเล็กกว่ารุ่น PaLM ที่ใหญ่ที่สุดอย่างมาก แต่ใช้การประมวลผลในการฝึกมากกว่า ตามข้อมูลของ Google PaLM มีพารามิเตอร์ 540 พันล้านพารามิเตอร์ ดังนั้น"เล็กลงอย่างเห็นได้ชัด"ควรใส่ PaLM 2 ที่ใดก็ได้ระหว่าง 10 พันล้านถึง 300 พันล้านพารามิเตอร์ โปรดทราบว่าตัวเลขเหล่านี้เป็นเพียงสมมติฐานจากสิ่งที่ Google ได้กล่าวไว้ในรายงาน PaLM 2
เนื่องจากหากตัวเลขดังกล่าวอยู่ในบริเวณใกล้เคียง 100 พันล้านหรือน้อยกว่า มีความเป็นไปได้สูงที่ PaLM 2 จะแสดงพารามิเตอร์น้อยกว่าเมื่อเทียบกับ GPT-3 ความคิดที่ว่าโมเดลที่มีศักยภาพซึ่งมีข้อจำกัดในด้านขนาดอาจมีความสามารถในการแข่งขันและเหนือกว่า GPT-4 ในบางงานนั้นเป็นสิ่งที่น่าสังเกตอย่างยิ่ง ในทางกลับกัน GPT-3.5 มีประสิทธิภาพที่ไม่มีใครเทียบได้ตั้งแต่แรก แม้จะเหนือกว่า PaLM แต่ PaLM 2 ก็ได้แสดงให้เห็นการกลับมาอย่างน่าชื่นชม
PaLM 2 มีข้อได้เปรียบที่โดดเด่นเหนือ GPT-4 ในด้านความหลากหลายในแง่ของขนาดที่มีให้เลือก ซึ่งช่วยให้สามารถใช้โมเดลเวอร์ชันต่างๆ เช่น Gecko บนอุปกรณ์เคลื่อนที่ได้ แม้ว่าจะไม่มีการเชื่อมต่ออินเทอร์เน็ตก็ตาม ดังนั้นจึงมอบความสามารถด้านปัญญาประดิษฐ์ในเครื่องซึ่งยังไม่เคยเห็นใน GPT-4 ความสามารถในการประมวลผลบนอุปกรณ์ช่วยเพิ่มการเข้าถึงและการใช้งานจริงของ PaLM 2 เมื่อเทียบกับ GPT-4
ความแตกต่างในข้อมูลการฝึกอบรม GPT-4 และ PaLM 2
Google ยังไม่ได้เปิดเผยขนาดของชุดข้อมูลการฝึกอบรมที่ใช้กับ PaLM 2 แต่ก็เห็นได้จากรายงานการวิจัยของพวกเขาว่าโมเดลภาษาขนาดใหญ่ใหม่นี้ได้รับการฝึกอบรมบนชุดข้อมูลที่ครอบคลุมมากกว่ารุ่นก่อนมาก ในทำนองเดียวกันเปิด
เพื่อให้บรรลุความเข้าใจที่ลึกซึ้งมากขึ้นเกี่ยวกับแนวคิดทางคณิตศาสตร์ ตรรกะ และวิทยาศาสตร์ Google ได้เน้นย้ำประเด็นเหล่านี้ภายในชุดข้อมูลการฝึกอบรมสำหรับ PaLM 2 ตามที่ระบุไว้ในรายงานการวิจัย คลังข้อมูลก่อนการฝึกอบรมของ PaLM 2 ประกอบด้วยแหล่งข้อมูลต่างๆ เช่น เว็บไซต์ วรรณกรรม ภาษาโปรแกรม ข้อความทางคณิตศาสตร์ และบันทึกการสนทนา ส่งผลให้ได้รับการปรับปรุงให้ดีขึ้นกว่ารุ่นดั้งเดิมหลายประการ
เมื่อพิจารณาจากความสามารถทางภาษาที่กว้างขวางซึ่งครอบคลุมกรอบงานทางภาษามากกว่า 100 กรอบ PaLM 2 ได้รับการคาดหวังให้แสดงความสามารถในการสนทนาที่ยอดเยี่ยม โดยได้รับความอนุเคราะห์จากความเข้าใจในบริบทที่ได้รับการปรับปรุงและการแปลที่ราบรื่น การใช้ข้อมูลที่ลดลงในระหว่างการฝึกอบรมส่งผลให้การสร้างเนื้อหาที่เป็นอันตรายลดลง โดยการหลีกเลี่ยงไซต์ที่มีวาทกรรมแสดงความเกลียดชังหรือพฤติกรรมที่เป็นอันตราย โดยเฉพาะอย่างยิ่ง พื้นที่เก็บข้อมูลที่เป็นข้อความจำนวนมาก เช่น Reddit ถูกแยกออกจากกระบวนการเรียนรู้ ส่งผลให้ผลลัพธ์มีลักษณะเป็นมารยาทและความสุภาพในระดับที่สูงขึ้น
สำหรับข้อมูลการฝึกอบรมของ GPT-4 นั้น OpenAI ได้บอกเราว่าได้ฝึกอบรมโมเดลโดยใช้ข้อมูลที่เปิดเผยต่อสาธารณะและข้อมูลที่ได้รับอนุญาต หน้าการวิจัยของ GPT-4 ระบุว่า “ข้อมูลเป็นคลังข้อมูลขนาดเว็บ รวมถึงวิธีแก้ปัญหาทางคณิตศาสตร์ที่ถูกต้องและไม่ถูกต้อง การใช้เหตุผลที่อ่อนแอและชัดเจน ตนเอง-ข้อความที่ขัดแย้งและสอดคล้องกัน และเป็นตัวแทนของอุดมการณ์และแนวคิดที่หลากหลาย”
ด้วยการใช้การเรียนรู้แบบเสริมกำลังและผสมผสานข้อมูลจากมนุษย์ OpenAI ได้ปรับปรุงประสิทธิภาพของ GPT-4 เพื่อให้มั่นใจว่าการตอบสนองที่สร้างขึ้นนั้นสอดคล้องกับวัตถุประสงค์ที่ตั้งใจไว้เบื้องหลังการสอบถามที่ให้มาอย่างใกล้ชิดยิ่งขึ้น กระบวนการนี้ช่วยกรองเอาต์พุตที่ไม่เกี่ยวข้องหรือไม่เกี่ยวข้องที่ระบบสร้างขึ้น ส่งผลให้ผู้ใช้ได้รับคำตอบที่แม่นยำและน่าพึงพอใจมากขึ้นสำหรับคำถามของพวกเขาในท้ายที่สุด
สิ่งสำคัญคือต้องทราบว่าข้อมูลการฝึกอบรมเฉพาะที่ใช้โดยแต่ละรุ่นยังไม่ทราบ อย่างไรก็ตาม สามารถอนุมานได้ว่าวัตถุประสงค์ที่ตั้งใจไว้เบื้องหลังการฝึกอบรมนั้นแตกต่างกันอย่างมาก ผลลัพธ์สุดท้ายของความคลาดเคลื่อนดังกล่าวจะปรากฏชัดเจนเมื่อมีการปรับใช้ทั้งสองรุ่นภายในสภาพแวดล้อมการทำงานจริงเท่านั้น
เมื่อพิจารณาจากข้อมูลการฝึกอบรมจำนวนมากที่ใช้โดย GPT-4 GPT-4 จึงอยู่ในตำแหน่งที่ดีที่จะเข้าใจรายละเอียดปลีกย่อยของภาษาได้อย่างมีประสิทธิภาพมากกว่ารุ่นก่อนๆ จึงสร้างผลลัพธ์ที่มีคุณภาพที่เหนือกว่า อย่างไรก็ตาม การใช้งานที่กว้างขวางดังกล่าวจำเป็นต้องมีข้อจำกัดที่เข้มงวดในแบบจำลองเพื่อป้องกันพฤติกรรมที่ไม่ดีใดๆ ซึ่งไม่สามารถใช้ได้กับ Google เนื่องจากพวกเขาตัดสินใจที่จะแยกเนื้อหาที่เป็นอันตรายออกจากกระบวนการฝึกอบรม
PaLM 2 และ GPT-4 Chatbots และบริการ
ด้วยการใช้แชทบอทของแต่ละรุ่นภาษา ผู้ใช้สามารถเข้าสู่ทั้งสองช่องทางผ่านสองพอร์ทัลที่แยกจากกัน อย่างไรก็ตาม การเข้าถึงของ GPT-4 นั้นจำกัดเฉพาะสมาชิกบริการระดับพรีเมียมอย่าง ChatGPT Plus เท่านั้น ในขณะที่ผู้ที่ไม่ยินดีจ่ายเงินยังสามารถโต้ตอบกับ GPT-3 ได้ ในทางกลับกัน Bard ของ PaLM 2 นั้นไม่มีค่าใช้จ่ายและสามารถเข้าถึงได้ทั่วโลกในกว่า 180 ประเทศ
แม้ว่าอาจเป็นเรื่องจริงที่สามารถเข้าถึง GPT-4 ได้โดยไม่มีค่าใช้จ่าย แต่เราควรจำไว้ว่า Bing AI Chat ของ Microsoft ใช้เทคโนโลยีนี้และทุกคนสามารถเข้าถึงได้โดยอิสระ อันที่จริงมันตั้งอยู่ใกล้กับ Bing Search ซึ่งเป็นคู่แข่งสำคัญของ Google ในโดเมนเดียวกัน
ในระหว่างการปรับปรุง Google I/O ครั้งล่าสุดในปี 2023 มีการเปิดเผยว่าความก้าวหน้าที่สำคัญทั้ง PaLM 2 และการนำ AI ทั่วไปมาใช้ ได้รับการกำหนดให้ปรับปรุงประสบการณ์ผู้ใช้โดยรวมภายในระบบนิเวศของ Google Workspace อย่างมีนัยสำคัญ การบูรณาการเชิงนวัตกรรมนี้ขยายไปสู่บริการมากมายจากยักษ์ใหญ่ด้านเทคโนโลยี เช่น Google เอกสาร, ชีต, สไลด์, Gmail และอื่นๆ นอกจากนี้ เป็นที่น่าสังเกตว่า Google ได้ตรวจสอบแล้วว่าปัจจุบัน PaLM 2 ได้รับการผสานเข้ากับแอปพลิเคชันที่แตกต่างกันมากกว่า 25 รายการในกลุ่มผลิตภัณฑ์ของตนได้อย่างราบรื่น ครอบคลุมระบบปฏิบัติการมือถือยอดนิยม Android และแพลตฟอร์มแชร์วิดีโอ YouTube
Microsoft ได้รวมความสามารถด้าน AI ไว้ในชุดแอปพลิเคชัน Microsoft Office และบริการมากมาย ปัจจุบัน ผู้ใช้มีโอกาสได้เห็นการแข่งขันระหว่างเทคโนโลยี AI ที่นำเสนอโดยบริษัทคู่แข่งสองแห่งที่แย่งชิงอำนาจในสาขานี้
จากการเปิดตัวครั้งแรกและความพยายามอย่างขยันขันแข็งเพื่อหลีกเลี่ยงข้อผิดพลาดที่เกิดขึ้นจากรุ่นก่อน GPT-4 ได้กลายเป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่โดดเด่นในหมู่นักพัฒนาบุคคลที่สาม บริษัทสตาร์ทอัพ และผู้ที่ต้องการบูรณาการโซลูชัน AI ขั้นสูงภายใน บริการของพวกเขา เพื่ออธิบายประเด็นนี้ ฉันได้รวบรวมชุดแอปพลิเคชันที่ใช้ GPT-4 ซึ่งสามารถตรวจสอบได้ตามความสะดวกของคุณ
ควรสังเกตว่าในขณะที่นักพัฒนาอาจทดลองหรือนำ PaLM 2 มาใช้ Google จะต้องทำงานอย่างหนักเพื่อแข่งขันกับ OpenAI ในเรื่องนี้ ข้อดีอย่างหนึ่งที่ PaLM 2 มีเหนือ GPT-4 คือความพร้อมใช้งานในฐานะแพลตฟอร์มโอเพ่นซอร์ส ซึ่งอาจนำไปสู่การนำไปใช้ในวงกว้างมากขึ้นเมื่อเทียบกับ API แบบชำระเงินที่เป็นกรรมสิทธิ์
ทุกสิ่งที่พิจารณาในขณะนี้ Bard ที่ขับเคลื่อนด้วย PaLM 2 ดูเหมือนจะเป็นตัวเลือกที่ดีกว่าเมื่อพูดถึงการค้นคว้า เนื่องจากเป็นการดีกว่าในการตอบคำถามด้วยข้อมูลที่เกี่ยวข้องและเข้าถึงข้อมูลล่าสุดบนอินเทอร์เน็ตเกี่ยวกับหัวข้อใดก็ตาม ตามการอัปเดตล่าสุดของ Bard ซึ่งเผยแพร่เมื่อวันที่ 19 กันยายน 2023 ขณะนี้ Bard กำลังใช้"โมเดลที่มีความสามารถมากที่สุด"พร้อมรองรับอีก 40 ภาษา การเขียนโค้ดเชิงลึก ความช่วยเหลือ ความสามารถในการนำเสนอมุมมองที่แตกต่างกันในหัวข้อที่กำหนด และการปรับปรุงคุณภาพและความแม่นยำโดยทั่วไป
แม้ว่าจะเป็นไปได้ที่จะอ้างอิงโยงคำตอบของ Bard โดยใช้เครื่องมือค้นหาภายนอกเช่น Google แต่ระบบยังคงล้าหลังคู่แข่งในแง่ของการสร้างคำตอบอย่างรวดเร็วเมื่อเปรียบเทียบกับ ChatGPT ที่ใช้ GPT-4 หรือ Bing Chat ของ Microsoft
PaLM 2 สามารถเอาชนะ GPT-4 ได้หรือไม่?
PaLM 2 ซึ่งเป็นความก้าวหน้าที่ค่อนข้างใหม่ ยังไม่ได้แสดงให้เห็นถึงความสามารถในการแข่งขันกับ GPT-4 อย่างไรก็ตาม ตามแผนการอันทะเยอทะยานของ Google และความพยายามในการส่งเสริมการขายที่แข็งแกร่ง มีข้อบ่งชี้ว่า PaLM 2 อาจเสนอความท้าทายที่สำคัญสำหรับ GPT-4 นอกจากนี้ Google กำลังพัฒนาโมเดล AI ต่อเนื่องหลายรูปแบบชื่อ Gemini ซึ่งเพิ่มแรงกดดันเพิ่มเติมให้กับ OpenAI เพื่อยกระดับเกมของพวกเขา
แม้ว่า GPT-4 จะยังคงแข็งแกร่ง แต่ PaLM 2 ก็มีข้อได้เปรียบที่สำคัญเนื่องจากมีการใช้โมเดลขนาดเล็กหลายรุ่น โดยเฉพาะอย่างยิ่ง ส่วนประกอบ Gecko ของ PaLM 2 ทำงานด้วยประสิทธิภาพที่โดดเด่น ทำให้สามารถทำงานบนอุปกรณ์เคลื่อนที่ได้แม้ในขณะออฟไลน์ ด้วยเหตุนี้ ความเก่งกาจนี้จึงทำให้ PaLM 2 สามารถรองรับอุปกรณ์และแอปพลิเคชันที่หลากหลายขึ้นซึ่งอาจเผชิญกับความท้าทายในการเข้าถึง GPT-4
การแข่งขัน AI กำลังร้อนแรง
การเปิดตัว PaLM2 ได้เพิ่มการแข่งขันที่รุนแรงในหมู่นักพัฒนาปัญญาประดิษฐ์ โดยบางคนมองว่าเป็นคู่แข่งที่น่าเกรงขามในการท้าทาย GPT นอกจากนี้ มีรายงานว่า Google กำลังเตรียมโมเดล AI หลายรูปแบบชื่อ Gemini ซึ่งแสดงให้เห็นถึงความมุ่งมั่นในการพัฒนาภาคสนามให้ก้าวหน้ายิ่งขึ้น