Contents

ChatGPT กับ Claude AI: Claude AI เป็น Chatbot ที่ดีกว่าหรือไม่

นับตั้งแต่เปิดตัวในเดือนพฤศจิกายน 2022 ChatGPT ยังคงเป็นกำลังสำคัญในกลุ่มแชทบอท AI แม้ว่าบริษัท AI หลายแห่งจะมีความพยายามในวงกว้าง แต่ก็ไม่มีใครสามารถสร้างแชทบอทที่ท้าทาย ChatGPT ในด้านคุณภาพการตอบสนองโดยรวมได้อย่างแท้จริง กวีของ Google? Bing AI ของ Microsoft? ไม่ ไม่จริงๆ

ในขณะที่มีคู่แข่งจำนวนมากในขอบเขตของแชทบอทที่ขับเคลื่อนด้วยปัญญาประดิษฐ์ Claude AI ซึ่งพัฒนาโดยบริษัทนวัตกรรม Anthropic ก็ได้รับความสนใจและคำชื่นชมอย่างมากจากผู้ใช้จำนวนเพิ่มมากขึ้น บางคนถึงกับอ้างว่ามันเหนือกว่าคู่แข่ง ChatGPT ในแง่ของฟังก์ชั่นและประสิทธิผล เพื่อประเมินการกล่าวอ้างเหล่านี้โดยสมบูรณ์ ให้เราทำการเปรียบเทียบที่ครอบคลุมระหว่างบอททั้งสองตัว

ChatGPT กับ Claude AI: การใช้เหตุผลสามัญสำนึกและตรรกะ

ในการประเมินแชทบอท AI ของเรา การสังเกตความสามารถที่แตกต่างที่พวกมันแสดงออกมาเป็นเรื่องที่น่าสนใจ ในขณะที่แชทบอท AI บางตัวสามารถแก้ไขปัญหาที่ซับซ้อนได้อย่างรวดเร็ว ซึ่งอาจต้องใช้เวลามากสำหรับผู้เชี่ยวชาญที่เป็นมนุษย์ในการจัดการ แชทบอทอื่นๆ ดูเหมือนจะต่อสู้กับปัญหาพื้นฐานที่ต้องใช้เพียงตรรกะง่ายๆ หรือความเข้าใจทั่วไป ดังนั้นเราจึงทดสอบ ChatGPT และ Claude AI ที่ออกแบบมาเพื่อประเมินความสามารถในการแสดงวิจารณญาณที่ดีและความสามารถในการคิดอย่างมีเหตุผล

/th/images/logical-and-commonsense-problem.jpg

ด้วยการใช้กลยุทธ์แบบกระจัดกระจาย ChatGPT แก้ไขปัญหาได้สำเร็จในระหว่างการพยายามครั้งแรก ในขณะเดียวกัน Claude AI ก็ใช้วิธีการทางเลือกเพื่อแก้ไขปัญหาอย่างมีประสิทธิภาพ

/th/images/claude-ai-solving-a-commonsense-and-logical-reasoning-problem.jpg

แชทบอททั้งสองแก้ปัญหาความท้าทายเบื้องต้นได้สำเร็จ ซึ่งแสดงให้เห็นถึงความสามารถในการตอบคำถามที่ตรงไปตรงมา ต่อมา เราได้ทดสอบความสามารถของพวกเขาในการจัดการกับคำถามที่ซับซ้อนและละเอียดยิ่งขึ้น โดยเฉพาะการวางปริศนาหรือปริศนาที่ต้องใช้ทักษะการคิดอย่างมีวิจารณญาณ

/th/images/chatgpt-answers-trick-question-1.jpg

ChatGPT แสดงให้เห็นถึงความเข้าใจในอุบายนี้ทันที กล่าวคือ ไม่มีใครสามารถขัดขวางคนเป็นได้ เนื่องจากพวกเขายังไม่ตาย ในทางตรงกันข้าม Claude AI ดูเหมือนจะเข้าใจว่ามันเกี่ยวข้องกับกลอุบาย แต่ก็สะดุดเมื่อมองเห็นข้อเท็จจริงที่ประจักษ์ชัดในตัวเองว่าบุคคลที่รอดชีวิตไม่ควรถูกฝัง

ในทางตรงกันข้าม ข้อความค้นหาได้วิเคราะห์คำถามดังกล่าวมากเกินไป และได้ข้อสรุปว่าจะไม่มีใครเหลืออยู่เพื่อเข้าไปแทรกแซงด้วยเหตุผลที่ว่าการสืบเชื้อสายมาจากดาวอังคารมายังโลกจะส่งผลให้เกิดการตายอย่างแน่นอน คำตอบนี้อาจไม่สอดคล้องกับผลลัพธ์ที่เราคาดหวัง แต่เมื่อตรวจสอบผ่านมุมมองอื่น ก็ยังมีความถูกต้องอยู่เล็กน้อย

/th/images/claude-ai-answers-trick-question.jpg

ด้วยการใช้ความสามารถของ ChatGPT เรายังพิจารณาข้อดีที่เป็นไปได้ของวิธีการของ Claude AI ในการจัดการกับความท้าทายเฉพาะนี้อีกด้วย ในขั้นตอนสรุปสำหรับการประเมินประสิทธิภาพตามมิติเฉพาะนี้ เราได้นำเสนอตัวแทนการสนทนาทั้งสองด้วยสถานการณ์สมมติที่เกี่ยวข้องกับต้นแอปเปิ้ล โดยเฉพาะอย่างยิ่ง เราตั้งข้อสังเกตว่าผลหนึ่งเริ่มต้นด้วยแอปเปิ้ลจำนวน 10 ผล ซึ่งต่อมา 5 ผลจะถูกแกะสลักในขณะที่ยังคงติดอยู่กับต้นไม้ จากนั้นเราขอให้แต่ละระบบประเมินจำนวนผลไม้ที่เหลืออยู่บนต้นไม้ภายหลังเหตุการณ์เหล่านี้ คำตอบที่ได้รับจาก ChatGPT ระบุว่าแอปเปิ้ลทั้งสิบลูกจะยังคงอยู่

/th/images/chatgpt-birds-commonsense-logic.jpg

แม้ว่าโมเดลปัญญาประดิษฐ์บางรุ่นไม่สามารถเข้าใจคำถามหรือให้คำตอบที่ไม่เกี่ยวข้องได้ แต่ Claude AI ก็แสดงให้เห็นถึงความเข้าใจในทางปฏิบัติโดยรับทราบถึงความน่าจะเป็นที่จะเน่าเปื่อยของแอปเปิลทั้ง 5 ชิ้นที่หั่นเป็นชิ้น ๆ เนื่องจากการสัมผัสกับอากาศและความชื้น

/th/images/claude-ai-common-sense-reasoning-with-apple-rotting.jpg

จากการทดลองของเรา Claude AI แสดงให้เห็นถึงความสามารถในการแก้ไขปัญหาที่เกิดขึ้น มีความพยายามในการนำเสนอสถานการณ์ที่ซับซ้อนมากขึ้น ส่งผลให้เกิดผลลัพธ์ที่ประสบความสำเร็จและไม่สำเร็จสำหรับแชทบอททั้งสอง จากการค้นพบเหล่านี้ อาจเป็นที่ถกเถียงกันอยู่ว่าแม้ว่า ChatGPT จะแสดงข้อได้เปรียบบางประการ แต่ความแตกต่างระหว่างสามัญสำนึกและความสามารถในการให้เหตุผลเชิงตรรกะนั้นค่อนข้างน้อย

ChatGPT กับ Claude AI: ทักษะทางคณิตศาสตร์

แม้ว่าจะไม่ได้ตั้งใจที่จะใช้ ChatGPT หรือ Claude AI ในการแก้ปัญหาการมอบหมายพีชคณิต แต่ความสามารถทางคณิตศาสตร์ของระบบเหล่านี้ยังมีการแตกสาขาที่สำคัญ คณิตศาสตร์ทำหน้าที่เป็นรากฐานที่สำคัญสำหรับแชทบอทปัญญาประดิษฐ์ ช่วยให้พวกเขาสามารถเข้าใจการใช้เหตุผลเชิงปฏิบัติ รับรู้ถึงการคิดที่ผิดพลาด และรับทราบข้อผิดพลาด

โดยพื้นฐานแล้ว ความสามารถทางคณิตศาสตร์ทำหน้าที่เป็นเกณฑ์มาตรฐานพื้นฐานของปัญญาประดิษฐ์ ดังนั้น เมื่อเปรียบเทียบ ChatGPT กับ Claude AI ตัวใดแสดงความสามารถทางคณิตศาสตร์ได้ดีกว่ากัน เพื่อระบุสิ่งนี้ เราได้นำเสนอแชทบอทแต่ละตัวด้วยความท้าทายด้านประสิทธิภาพทางคณิตศาสตร์ที่ซับซ้อน ในตอนแรก เราได้ทดสอบ Claude AI ซึ่งแก้ไขปัญหาตรงหน้าได้สำเร็จ

/th/images/claude-ai-solves-maths-problem-on-productivity.jpg

ChatGPT ก็แก้ปัญหาได้เช่นกัน

/th/images/chatgpt-solves-maths-problem-on-productivity.jpg

ก้าวไปสู่งานต่อไป เราได้นำเสนอตัวแทนการสนทนาทั้งสองด้วยสมการ 8/a-1=20/3a-1 ซึ่งเป็นปัญหาทางคณิตศาสตร์ที่ค่อนข้างไม่ซับซ้อน แต่ก็ยังแสดงให้เห็นถึงระดับความยากที่ไม่คาดคิดสำหรับระบบแชทปัญญาประดิษฐ์หลายระบบ โชคดีที่ ChatGPT แก้ไขปัญหานี้ได้สำเร็จ และได้รับการตอบสนองที่ถูกต้องเป็น-3 ทันที

/th/images/chatgpt-solves-a-math-problem.jpg

ในตอนแรก Claude AI ล้มเหลวในความพยายาม แต่เมื่อได้รับคำสั่งให้จัดการกับความท้าทายอย่างค่อยเป็นค่อยไปและเป็นระบบ (ดังนั้นจึงจำเป็นต้องพิจารณาแต่ละองค์ประกอบของกระบวนการให้เหตุผลอย่างพิถีพิถัน) ก็แก้ไขปริศนาได้สำเร็จ

/th/images/claude-ai-solves-a-math-problem-step-by-step.jpg

ในบางกรณี ประสิทธิภาพของ Claude AI และ ChatGPT ถูกเปรียบเทียบโดยคำนึงถึงความสามารถในการแก้ปัญหาทางคณิตศาสตร์ แม้ว่าพวกเขาจะแสดงให้เห็นถึงความเชี่ยวชาญในบางกรณีโดยการให้คำตอบที่ถูกต้องทันที แต่ก็มีสถานการณ์อื่นๆ ที่ Claude AI ต้องใช้ความพยายามเพิ่มเติมก่อนที่จะให้คำตอบที่ถูกต้อง ดังนั้น เมื่อพิจารณาถึงความสามารถทางคณิตศาสตร์ ChatGPT จึงเป็นตัวเลือกที่เหนือกว่า

ChatGPT กับ Claude AI: ความคิดสร้างสรรค์

Claude AI ได้รับการยกย่องในด้านความสามารถที่โดดเด่นในการสร้างเนื้อหาที่เป็นนวัตกรรม แต่เมื่อเปรียบเทียบกับ ChatGPT แล้ว มันมีความโดดเด่นในเรื่องนี้อย่างแท้จริงหรือไม่ มันจะมีประสิทธิภาพเหนือกว่าหรือเกินระดับความคิดสร้างสรรค์ของคนรุ่นหลังได้หรือไม่? เพื่อประเมินความสามารถของตน เราได้นำเสนอบอทแต่ละตัวด้วยแบบฝึกหัดที่กำหนดให้พวกมันต้องแต่งท่อนสำหรับเพลงฮิปฮอปที่ยึดตามรูปแบบสัมผัสที่เข้มงวด

เราเลือกใช้การทดสอบการร้องแร็พแบบคล้องจอง เนื่องจากถือเป็นความท้าทายอย่างมากสำหรับโมเดลภาษาต่างๆ โดยทั่วไปแล้ว โมเดลเหล่านี้เผชิญกับความยากลำบากในการสร้างรูปแบบสัมผัสอย่างแม่นยำ ขณะเดียวกันก็ผลิตเนื้อเพลงที่สอดคล้องและมีความหมายไปพร้อมๆ กัน นอกจากนี้เรายังเลือกที่จะมุ่งเน้นไปที่หัวข้อการปลูกแตงกวา ซึ่งเพิ่มความซับซ้อนอีกชั้นให้กับความพยายามนี้

ตามคำขอของเรา เราได้ขอความช่วยเหลือจากทั้ง ChatGPT และ Claude AI ในการสร้างบทกวีที่เกี่ยวข้องกับการปลูกแตงกวาในฐานะชาวนาและสะสมความมั่งคั่งมากมายผ่านความพยายามนี้ ตามที่คาดไว้ ChatGPT ได้นำเสนอชุดบทกลอนที่น่าประทับใจซึ่งกระตุ้นความตื่นเต้น

/th/images/chatgpt-composes-a-rap-lyrics.jpg

ต่อมาเราได้นำเสนอข้อความที่เหมือนกันแก่ Claude AI สำหรับการประเมิน

/th/images/claude-ai-composes-a-rap-lyrics.jpg

ChatGPT แสดงให้เห็นถึงความสามารถในการแต่งเพลงในระดับที่เหนือกว่าเมื่อเปรียบเทียบกับ Claude AI แบบแรกให้ผลลัพธ์ที่น่าพอใจในความพยายามครั้งแรก ในขณะที่แบบหลังต้องใช้ความพยายามหลายครั้งก่อนที่จะได้ผลลัพธ์ที่พึงประสงค์ เห็นได้ชัดว่า ChatGPT มีประสิทธิภาพมากกว่าในการตอบสนองความคาดหวังของเรา ดังนั้นจึงได้รับความพึงพอใจมากกว่า Claude AI สำหรับงานนี้โดยเฉพาะ

Claude AI แสดงให้เห็นถึงความสามารถที่น่าประทับใจในการสร้างเนื้อหาที่ฟังดูเป็นธรรมชาติผ่านความสามารถในการทำงานที่เกี่ยวข้องกับการเขียนต่างๆ ให้สำเร็จลุล่วงได้ง่ายกว่า ChatGPT แม้ว่า ChatGPT จะแสดงให้เห็นถึงความเหนือกว่าในการจัดการกับความท้าทายด้านการสร้างสรรค์ที่ซับซ้อนมากขึ้น แต่ก็มีบางกรณีที่ผลลัพธ์ขาดคุณภาพที่ราบรื่นของข้อความที่มนุษย์สร้างขึ้น ท้ายที่สุดแล้ว โมเดล AI ทั้งสองรุ่นแสดงความคิดสร้างสรรค์ที่โดดเด่น แม้ว่าจะมีจุดแข็งและจุดอ่อนที่แตกต่างกันก็ตาม

ChatGPT กับ Claude AI: ทักษะการเขียนโค้ด

แน่นอนว่า เช่นเดียวกับความเฉียบแหลมทางคณิตศาสตร์ที่มีความสำคัญในการประเมินความสามารถของแชทบอทปัญญาประดิษฐ์ ความถนัดในการเขียนโปรแกรมก็มีความสำคัญในเรื่องนี้เช่นกัน แม้ว่าจะสันนิษฐานได้ว่าผู้ใช้ปลายทางส่วนใหญ่จะไม่ใช้ตัวแทนการสนทนาเหล่านี้เพื่อจุดประสงค์ในการเขียนโค้ด แต่ความสามารถในการทำความเข้าใจและสร้างโค้ดคอมพิวเตอร์ที่สอดคล้องกันอย่างมีประสิทธิภาพยังคงเป็นปัจจัยกำหนดที่สำคัญของความสามารถโดยรวมของพวกเขา

แม้ว่าแชทบอทในปัจจุบันจะมีความซับซ้อนในระดับสูง แต่ศักยภาพในการพัฒนาก้าวหน้านั้นถูกจำกัดด้วยการไม่สามารถใช้ความสามารถในการเขียนโปรแกรมได้อย่างมีประสิทธิภาพ เพื่อให้แชทบอทปัญญาประดิษฐ์ก้าวหน้าไปไกลกว่าการสร้างข้อความพื้นฐานและกลายเป็นผู้ช่วย AI ที่มีความสามารถสูง จำเป็นอย่างยิ่งที่แชทบอทจะต้องมีความสามารถในการเขียนโค้ดที่จัดการกับปัญหาที่ซับซ้อนตามความจำเป็น แนวคิดนี้ได้รับการสำรวจโดยละเอียดในคำอธิบายล่ามรหัส ChatGPT ของเรา

ด้วยการใช้ความสามารถของโมเดลภาษาขั้นสูง ChatGPT เราทำการทดลองโดยมอบหมายให้สร้างแอปพลิเคชันรายการสิ่งที่ต้องทำที่มีฟังก์ชันเต็มรูปแบบ ด้วยความสามารถที่โดดเด่น ChatGPT จึงทำงานนี้สำเร็จตั้งแต่ครั้งแรกที่ลอง ด้วยการให้คำแนะนำที่จำเป็น เราสามารถรวมโค้ดที่สร้างขึ้นเข้ากับเว็บเบราว์เซอร์ได้อย่างราบรื่น ส่งผลให้การดำเนินการไม่มีที่ติโดยไม่มีอุปสรรคหรือความยุ่งยากใดๆ ผลลัพธ์ที่แสดงไว้ด้านล่างนี้เพื่อให้คุณตรวจวิเคราะห์ได้

/th/images/to-do-list-app-by-chatgpt.jpg

Claude AI แสดงให้เห็นถึงความเชี่ยวชาญในการสร้างโค้ดที่มีโครงสร้างสอดคล้องกันและมีโครงสร้างที่ดีในระหว่างการประเมินของเรา อย่างไรก็ตาม เราไม่สามารถรันโปรแกรมบนเว็บเบราว์เซอร์ได้สำเร็จ เนื่องจากมีการกำกับดูแลที่ชัดเจนในตรรกะที่สำคัญซึ่งจำเป็นสำหรับการดำเนินการ ด้วยเหตุนี้ จึงเป็นเรื่องน่าเสียดายที่ Claude AI ไม่สามารถให้ผลลัพธ์ที่น่าพอใจในเรื่องนี้

เราพยายามท้าทายการเขียนโปรแกรมประเภทอื่นหลังจากประสิทธิภาพก่อนหน้าของ Claude AI โดยเน้นที่การวิเคราะห์โค้ดมากกว่าการสร้าง เราจัดเตรียมไฟล์ PHP ห้าไฟล์ที่แสดงถึงโครงสร้างพื้นฐานแบ็กเอนด์ทั้งหมดของเว็บไซต์ และขอข้อมูลจากทั้ง Claude AI และ ChatGPT เกี่ยวกับการแก้ไขที่จำเป็นภายในไฟล์เหล่านี้ เพื่อรับประกันการส่งอีเมลอัตโนมัติเมื่อผู้ใช้ลงทะเบียนใหม่

/th/images/claude-ai-analyzing-multiple-php-files.jpg

โดยเฉพาะอย่างยิ่ง ChatGPT ซึ่งดูเหมือนจะมีความสามารถในการเขียนโปรแกรมที่ยอดเยี่ยม ประสบปัญหาในการแก้ไขปัญหาแม้จะทดลองใช้มาหลายครั้งแล้วก็ตาม ในทางตรงกันข้าม Claude AI แสดงให้เห็นถึงความสามารถในการตรวจสอบโค้ดและระบุตำแหน่งที่แม่นยำซึ่งจำเป็นต้องมีการแก้ไขเพื่อให้ได้ผลลัพธ์ที่คาดหวังอย่างแม่นยำ

แท้จริงแล้ว การทดลองของเราขยายออกไปมากกว่าอินสแตนซ์เดียว เนื่องจากเราใช้การทดสอบเดียวกันกับซอร์สโค้ดอื่นๆ มากมาย อย่างไรก็ตาม ChatGPT ประสบปัญหาในหลายกรณี ในขณะที่ Claude AI แสดงให้เห็นประสิทธิภาพที่ยอดเยี่ยมอย่างต่อเนื่อง การกำหนดความเชี่ยวชาญในทักษะการเขียนโปรแกรมจะชัดเจนน้อยลงเมื่อประเมินเพิ่มเติม

ChatGPT แสดงให้เห็นถึงความสามารถที่ไม่มีใครเทียบได้ในการสร้างโค้ดใหม่และการนำทางงานการเขียนโปรแกรมที่ซับซ้อนอย่างเชี่ยวชาญ ในทางกลับกัน Claude AI แสดงให้เห็นถึงความเฉียบแหลมเป็นพิเศษในการตรวจสอบคลังโค้ดที่กว้างขวาง โดยดึงข้อมูลเชิงลึกอันมีค่าจากคอลเลกชันโค้ดที่ขยายออกไปซึ่งครอบคลุมหลายไฟล์ได้อย่างมีประสิทธิภาพ ดังนั้น เมื่อต้องการนำเสนอแนวคิดเชิงนวัตกรรมผ่านการเชื่อมโยงโค้ดที่ปฏิบัติการได้ ChatGPT จึงเป็นตัวเลือกที่ต้องการ ในทางกลับกัน เพื่อจุดประสงค์ในการวิเคราะห์โค้ดเบสขนาดใหญ่และรูปแบบที่ชาญฉลาดภายในนั้น Claude AI จึงเป็นตัวเลือกที่เหมาะสมที่สุด

Claude AI เป็นคู่แข่งที่มีศักยภาพในบล็อก

Claude AI สร้างความท้าทายที่น่ากลัวให้กับ ChatGPT โดยมีศักยภาพในการจับคู่และเกินขีดความสามารถในอนาคต ความจริงที่ว่า Claude AI ประสบความสำเร็จในฐานะผู้ที่เพิ่งเข้ามาในสาขานี้ บ่งบอกถึงการแข่งขันที่ทวีความรุนแรงมากขึ้น ประสิทธิภาพที่โดดเด่นเป็นหลักฐานของแนวโน้มนี้