ChatGPT so với Claude AI: Claude AI có phải là Chatbot tốt hơn không?

Alicia Brunner included in Internet Chatgpt Artificial Intelligence Chatbot

2023-09-05 2598 words 13 minutes

Contents

Kể từ khi phát hành vào tháng 11 năm 2022, ChatGPT vẫn là thế lực thống trị trong không gian chatbot AI. Bất chấp những nỗ lực sâu rộng của một số công ty AI, chưa ai thực sự có thể xây dựng một chatbot thực sự thách thức ChatGPT về chất lượng phản hồi tổng thể. Bard của Google? Bing AI của Microsoft? Không thật sự lắm.

Trong khi có rất nhiều đối thủ trong lĩnh vực chatbot hỗ trợ trí tuệ nhân tạo, Claude AI, được phát triển bởi công ty đổi mới Anthropic, đã thu hút được sự chú ý và khen ngợi đáng kể từ số lượng người dùng ngày càng tăng. Một số người thậm chí còn cho rằng nó vượt qua đối thủ cạnh tranh ChatGPT về chức năng và hiệu quả. Để đánh giá đầy đủ những tuyên bố này, chúng ta hãy tiến hành so sánh toàn diện giữa hai bot.

ChatGPT so với Claude AI: Lý luận logic và thông thường

Trong đánh giá của chúng tôi về các chatbot AI, thật thú vị khi quan sát các khả năng khác nhau mà chúng thể hiện. Trong khi một số chatbot AI có khả năng giải quyết nhanh chóng các vấn đề phức tạp mà các chuyên gia con người sẽ tốn thời gian đáng kể để giải quyết, thì một số khác lại dường như phải vật lộn với các vấn đề thô sơ chỉ cần logic đơn giản hoặc hiểu biết thông thường. Do đó, chúng tôi đã cho ChatGPT và Claude AI thực hiện một loạt bài kiểm tra được thiết kế để đánh giá trình độ của họ trong việc thể hiện khả năng phán đoán hợp lý và tư duy hợp lý.

Bằng cách sử dụng chiến lược phân mảnh, ChatGPT đã giải quyết thành công vấn đề trong lần thử đầu tiên. Đồng thời, Claude AI đã áp dụng một phương pháp thay thế để giải quyết vấn đề một cách hiệu quả.

Cả hai chatbot đều giải quyết thành công thử thách ban đầu, qua đó chứng tỏ năng lực của chúng trong việc giải quyết các câu hỏi đơn giản. Sau đó, chúng tôi tiến hành kiểm tra khả năng xử lý các câu hỏi phức tạp và nhiều sắc thái hơn của họ, đặc biệt là đặt cho họ một câu đố hoặc câu đố đòi hỏi kỹ năng tư duy phản biện.

ChatGPT đã chứng tỏ sự hiểu biết ngay lập tức về âm mưu-cụ thể là, người ta không thể can thiệp vào người sống vì họ chưa chết. Ngược lại, Claude AI dường như hiểu rằng nó liên quan đến một mưu mẹo, nhưng lại chùn bước khi nhận ra sự thật hiển nhiên rằng những cá nhân sống sót không nên bị chôn vùi.

Ngược lại, câu hỏi đã thực hiện quá nhiều phân tích về cuộc điều tra và đi đến quyết định rằng sẽ không còn ai để can thiệp vì lý do việc đi xuống từ Sao Hỏa xuống Trái đất sẽ dẫn đến cái chết nhất định. Phản hồi này có thể không phù hợp với kết quả dự đoán của chúng tôi, tuy nhiên khi xem xét dưới một góc độ khác, nó vẫn có một chút giá trị.

Bằng cách sử dụng các khả năng của ChatGPT, chúng tôi cũng đã xem xét giá trị tiềm năng của phương pháp của Claude AI trong việc giải quyết thách thức cụ thể này. Trong giai đoạn kết thúc để đánh giá hiệu suất theo khía cạnh cụ thể này, chúng tôi đã trình bày cho cả hai tác nhân đàm thoại một tình huống giả định liên quan đến một cây táo. Cụ thể, chúng tôi khẳng định rằng người ta bắt đầu với một kho mười quả táo, năm quả trong số đó sau đó được cắt ra khi chúng vẫn còn gắn trên cây. Sau đó, chúng tôi yêu cầu mỗi hệ thống ước tính số lượng quả còn lại trên cây sau những sự kiện này. Phản hồi do ChatGPT cung cấp chỉ ra rằng tất cả mười quả táo sẽ tồn tại.

Trong khi một số mô hình trí tuệ nhân tạo không thể hiểu câu hỏi hoặc đưa ra những câu trả lời không liên quan, thì Claude AI đã chứng minh sự hiểu biết thực tế bằng cách thừa nhận khả năng thối rữa của 5 quả táo cắt lát do tiếp xúc với không khí và độ ẩm.

Dựa trên thử nghiệm của chúng tôi, Claude AI đã thể hiện sự thành thạo trong việc giải quyết vấn đề trước mắt. Các nỗ lực đã được thực hiện để đưa ra các kịch bản phức tạp hơn, dẫn đến kết quả thành công và không thành công cho cả hai chatbot. Dựa trên những phát hiện này, có thể lập luận rằng mặc dù ChatGPT thể hiện một số lợi thế nhưng sự khác biệt giữa nhận thức chung và khả năng suy luận logic của chúng là tương đối nhỏ.

ChatGPT vs. Claude AI: Kỹ năng toán học

Ngay cả khi một người không có ý định sử dụng ChatGPT hoặc Claude AI để giải các bài tập đại số, thì trình độ toán học của các hệ thống này vẫn có tác động đáng kể. Toán học đóng vai trò là nền tảng quan trọng cho các chatbot trí tuệ nhân tạo, giúp chúng hiểu được lý luận thực tế, nhận ra lối suy nghĩ sai lầm và nhận lỗi.

Về bản chất, năng lực toán học đóng vai trò là chuẩn mực cơ bản cho trí tuệ nhân tạo. Do đó, khi so sánh ChatGPT và Claude AI, ai thể hiện năng khiếu toán học cao hơn? Để xác định điều này, chúng tôi đã đưa ra cho mỗi chatbot một thử thách toán học phức tạp về năng suất. Ban đầu, chúng tôi đã thử nghiệm Claude AI, người đã giải quyết thành công vấn đề hiện tại.

ChatGPT cũng đã giải quyết được vấn đề.

Chuyển sang nhiệm vụ tiếp theo, chúng tôi đã trình bày cho cả hai tác nhân đàm thoại phương trình 8/a-1=20/3a-1, đây là một vấn đề toán học tương đối phức tạp nhưng lại thể hiện mức độ khó không ngờ đối với nhiều hệ thống trò chuyện trí tuệ nhân tạo. May mắn thay, ChatGPT đã giải quyết thành công vấn đề này và ngay lập tức đưa ra phản hồi chính xác là-3.

Claude AI ban đầu đã chùn bước trong nỗ lực của mình, nhưng sau khi được hướng dẫn giải quyết thử thách một cách tuần tự và có hệ thống (do đó buộc nó phải xem xét tỉ mỉ từng thành phần trong quá trình suy luận của mình), nó đã giải quyết thành công câu hỏi hóc búa.

Trong một số trường hợp nhất định, hiệu suất của Claude AI và ChatGPT được so sánh dựa trên khả năng giải quyết các vấn đề toán học của chúng. Mặc dù họ đã thể hiện sự thành thạo trong một số trường hợp bằng cách đưa ra câu trả lời chính xác ngay lập tức, nhưng có những tình huống khác trong đó Claude AI cần phải nỗ lực thêm trước khi đưa ra câu trả lời chính xác. Do đó, khi xem xét năng lực toán học của họ, ChatGPT nổi lên như một lựa chọn ưu việt.

ChatGPT vs. Claude AI: Sáng tạo

Claude AI đã được khen ngợi vì khả năng đặc biệt trong việc tạo ra nội dung sáng tạo, nhưng khi so sánh với ChatGPT, liệu nó có thực sự vượt trội về mặt này không? Nó có thể vượt trội hơn hoặc thậm chí vượt quá mức độ sáng tạo của người sau không? Để đánh giá tài năng tương ứng của chúng, chúng tôi đã đưa ra cho mỗi bot một bài tập yêu cầu chúng sáng tác các câu cho một ca khúc hip-hop tuân thủ các sơ đồ vần điệu nghiêm ngặt.

Chúng tôi đã chọn tham gia bài kiểm tra rap có vần điệu vì nó đưa ra một thách thức đáng kể đối với nhiều mô hình ngôn ngữ. Thông thường, những mô hình này gặp khó khăn trong việc tái tạo chính xác sơ đồ vần điệu đồng thời tạo ra lời bài hát mạch lạc và có ý nghĩa. Hơn nữa, chúng tôi đã quyết định tập trung vào chủ đề trồng dưa chuột, điều này làm tăng thêm mức độ phức tạp cho nỗ lực này.

Theo yêu cầu của chúng tôi, chúng tôi đã kêu gọi sự hỗ trợ của cả ChatGPT và Claude AI trong việc tạo ra một câu thơ có nhịp điệu liên quan đến việc trồng dưa chuột với tư cách là một nông dân và tích lũy được khối tài sản đáng kể thông qua nỗ lực này. Đúng như dự đoán, ChatGPT đã mang đến một bộ câu thơ đầy ấn tượng, khơi gợi sự phấn khích.

Sau đó, chúng tôi đã đưa ra lời nhắc tương tự cho Claude AI để đánh giá.

ChatGPT đã thể hiện mức độ thành thạo vượt trội trong việc tạo vần so với Claude AI. Cái trước mang lại kết quả khả quan trong lần thử đầu tiên trong khi cái sau yêu cầu nhiều lần thử trước khi mang lại kết quả mong muốn. Do đó, rõ ràng là ChatGPT đã hoạt động hiệu quả hơn trong việc đáp ứng mong đợi của chúng tôi, do đó khiến chúng tôi ưu tiên hơn Claude AI cho nhiệm vụ cụ thể này.

Claude AI đã chứng tỏ khả năng thành thạo ấn tượng trong việc tạo ra nội dung có âm thanh tự nhiên thông qua khả năng hoàn thành các nhiệm vụ liên quan đến viết khác nhau một cách dễ dàng hơn ChatGPT. Mặc dù ChatGPT thể hiện tính ưu việt trong việc xử lý các thách thức sáng tạo phức tạp hơn nhưng vẫn có những trường hợp đầu ra của nó thiếu chất lượng liền mạch của văn bản do con người tạo ra. Cuối cùng, cả hai mô hình AI đều thể hiện sự sáng tạo vượt trội, mặc dù có những điểm mạnh và điểm yếu riêng biệt.

ChatGPT vs. Claude AI: Kỹ năng viết mã

Chắc chắn, giống như sự nhạy bén về toán học là rất quan trọng trong việc đánh giá khả năng của chatbot trí tuệ nhân tạo, thì năng khiếu lập trình cũng rất quan trọng trong vấn đề này. Mặc dù có thể giả định rằng hầu hết người dùng cuối sẽ không sử dụng các tác nhân đàm thoại này cho mục đích mã hóa, khả năng hiểu và tạo mã máy tính mạch lạc một cách hiệu quả vẫn là yếu tố quyết định quan trọng đối với năng lực tổng thể của họ.

Mặc dù các chatbot hiện tại thể hiện mức độ phức tạp cao nhưng tiềm năng phát triển của chúng bị hạn chế do không thể sử dụng hiệu quả các khả năng lập trình. Để các chatbot trí tuệ nhân tạo phát triển vượt ra ngoài khả năng tạo văn bản cơ bản và trở thành trợ lý AI có năng lực cao, điều quan trọng là chúng phải có khả năng soạn mã giải quyết các vấn đề phức tạp khi cần thiết. Khái niệm này đã được khám phá chi tiết trong phần giải thích về Trình thông dịch mã ChatGPT của chúng tôi.

Bằng cách sử dụng các khả năng của mô hình ngôn ngữ nâng cao của chúng tôi, ChatGPT, chúng tôi đã tiến hành một thử nghiệm trong đó chúng tôi giao nhiệm vụ cho nó tạo ra một ứng dụng danh sách việc cần làm đầy đủ chức năng. Với trình độ thông thạo vượt trội, ChatGPT đã hoàn thành xuất sắc nhiệm vụ này trong lần thử đầu tiên. Bằng cách cung cấp các hướng dẫn cần thiết, chúng tôi có thể tích hợp liền mạch mã được tạo vào trình duyệt web, dẫn đến việc thực thi hoàn hảo mà không gặp bất kỳ trở ngại hoặc biến chứng nào. Kết quả đã được chứng minh được hiển thị bên dưới để bạn xem xét.

Claude AI đã thể hiện sự thành thạo trong việc tạo mã mạch lạc và có cấu trúc tốt trong quá trình đánh giá của chúng tôi. Tuy nhiên, chúng tôi không thể thực thi thành công chương trình trên trình duyệt web do có sự giám sát rõ ràng về logic quan trọng cần thiết để thực thi. Vì vậy, thật đáng tiếc khi Claude AI đã không thể mang lại kết quả khả quan về mặt này.

Chúng tôi đã thử một loại thử thách lập trình khác sau màn trình diễn trước đó của Claude AI, tập trung nhiều hơn vào phân tích mã hơn là sáng tạo. Chúng tôi đã cung cấp năm tệp PHP đại diện cho toàn bộ cơ sở hạ tầng phụ trợ của trang web và yêu cầu đầu vào từ cả Claude AI và ChatGPT về những sửa đổi cần thiết trong các tệp này để đảm bảo gửi email tự động khi người dùng mới đăng ký.

Đáng chú ý, ChatGPT, dường như sở hữu khả năng lập trình vượt trội, đã gặp khó khăn trong việc giải quyết vấn đề ngay cả sau nhiều lần thử nghiệm. Ngược lại, Claude AI đã thể hiện năng lực trong việc kiểm tra mã và xác định chính xác các vị trí cần sửa đổi để đạt được kết quả mong đợi.

Thật vậy, thử nghiệm của chúng tôi đã mở rộng ra ngoài một trường hợp duy nhất, vì chúng tôi áp dụng thử nghiệm tương tự cho nhiều mã nguồn khác nhau. Tuy nhiên, ChatGPT gặp khó khăn trong nhiều trường hợp, trong khi Claude AI luôn thể hiện hiệu suất vượt trội. Việc xác định mức độ thành thạo các kỹ năng lập trình trở nên kém rõ ràng hơn khi được đánh giá sâu hơn.

ChatGPT thể hiện năng khiếu vô song trong việc tạo mã mới và điều hướng khéo léo các tác vụ lập trình phức tạp. Ngược lại, Claude AI thể hiện sự nhạy bén đặc biệt trong việc kiểm tra các kho mã mở rộng, trích xuất một cách hiệu quả những hiểu biết có giá trị từ các bộ sưu tập mã phong phú trải dài trên nhiều tệp. Do đó, khi tìm cách đưa ra những ý tưởng đổi mới thông qua việc trình bày rõ ràng mã thực thi, ChatGPT nổi lên như một lựa chọn ưu tiên. Mặt khác, với mục đích mổ xẻ các cơ sở mã khổng lồ và nhận ra các mẫu bên trong chúng, Claude AI nổi bật là lựa chọn phù hợp nhất.

Claude AI là đối thủ tiềm năng trong khối

Claude AI đặt ra một thách thức ghê gớm đối với ChatGPT, có tiềm năng sánh ngang và thậm chí vượt quá khả năng của nó trong tương lai. Việc Claude AI đã đạt được thành công như vậy khi mới tham gia vào lĩnh vực này nói lên nhiều điều về sự cạnh tranh ngày càng gay gắt. Hiệu suất vượt trội của nó là bằng chứng cho xu hướng này.