ChatGPT vs. Claude AI: Är Claude AI den bättre chatboten?

Leonard Strauss included in Internet Chatgpt Artificial Intelligence Chatbot

2023-09-04 1667 words 8 minutes

Contents

Sedan lanseringen i november 2022 har ChatGPT varit den dominerande kraften inom AI-chattbotar. Trots långtgående ansträngningar från flera AI-företag har ingen riktigt lyckats bygga en chatbot som verkligen utmanar ChatGPT i övergripande svarskvalitet. Googles Bard? Microsofts Bing AI? Nej, inte riktigt.

Även om det finns många utmanare inom området artificiell intelligens-drivna chatbots, har Claude AI, som utvecklats av det innovativa företaget Anthropic, fått betydande uppmärksamhet och beröm från ett ökande antal användare. Vissa hävdar till och med att det överträffar sin konkurrent, ChatGPT, när det gäller funktionalitet och effektivitet. För att fullt ut utvärdera dessa påståenden, låt oss göra en omfattande jämförelse mellan de två robotarna.

ChatGPT vs. Claude AI: Common-Sense och Logical Reasoning

I vår utvärdering av AI-chatbots är det fascinerande att observera de divergerande förmågor de uppvisar. Medan vissa AI-chatbots snabbt kan lösa komplicerade frågor som annars skulle ta lång tid för mänskliga experter att ta itu med, verkar andra kämpa med rudimentära frågor som bara kräver enkel logik eller allmän förståelse. Följaktligen utsatte vi ChatGPT och Claude AI för en rad tester utformade för att bedöma deras förmåga att visa gott omdöme och rationellt tänkande.

Med hjälp av en fragmenterad strategi lyckades ChatGPT ta itu med problemet under sitt första försök. Samtidigt använde Claude AI en alternativ metod för att lösa problemet på ett effektivt sätt.

Båda chatbotarna lyckades lösa den inledande utmaningen och visade därmed sin kompetens när det gäller att hantera enkla förfrågningar. Därefter testade vi deras förmåga att hantera mer komplexa och nyanserade frågor genom att ge dem en gåta eller ett pussel som krävde kritiskt tänkande.

ChatGPT visade en omedelbar förståelse för knepet - nämligen att man inte kan avlyssna de levande, eftersom de inte är avlidna. Däremot verkade Claude AI förstå att det rörde sig om ett knep, men misslyckades med att urskilja det självklara faktum att individer som har överlevt inte bör begravas.

Däremot utförde frågeställaren en alltför omfattande analys av frågan och kom fram till att det inte skulle finnas några individer kvar att interagera med eftersom nedstigningen från Mars till jorden skulle resultera i en säker död. Detta svar kanske inte överensstämmer med vårt förväntade resultat, men när det granskas ur ett alternativt perspektiv innehåller det ett minimum av giltighet.

Med hjälp av ChatGPT:s kapacitet har vi också övervägt de potentiella fördelarna med Claude AI:s metodik för att hantera denna specifika utmaning. I vår avslutande fas för att utvärdera prestanda längs denna specifika dimension presenterade vi båda konversationsagenterna med ett hypotetiskt scenario som involverade ett äppelträd. Specifikt antog vi att man börjar med ett lager på tio äpplen, varav fem sedan skärs upp medan de fortfarande är fästa vid trädet. Vi bad sedan varje system att uppskatta antalet frukter som fanns kvar på trädet efter dessa händelser. Svaret från ChatGPT indikerade att alla tio äpplen skulle finnas kvar.

Medan vissa av AI-modellerna inte kunde förstå frågan eller gav irrelevanta svar, visade Claude AI en praktisk förståelse genom att erkänna sannolikheten för förfall för de fem skivade äpplena på grund av deras exponering för luft och fukt.

Baserat på våra experiment visade Claude AI skicklighet i att ta itu med det aktuella problemet. Försök gjordes att presentera mer komplicerade scenarier, vilket resulterade i en kombination av lyckade och misslyckade resultat för båda chattrobotarna. Mot bakgrund av dessa resultat kan man hävda att även om ChatGPT uppvisar vissa fördelar, är skillnaden mellan deras förmåga till sunt förnuft och logiskt resonemang relativt minimal.

ChatGPT vs. Claude AI: Matematiska färdigheter

Även om man inte har för avsikt att använda ChatGPT eller Claude AI för att lösa algebraiska uppgifter, har dessa systems färdigheter i matematik betydande konsekvenser. Matematik är en viktig grund för chatbotar med artificiell intelligens, som gör det möjligt för dem att förstå praktiska resonemang, känna igen felaktigt tänkande och erkänna fel.

I grund och botten är matematisk kompetens ett grundläggande riktmärke för artificiell intelligens. Följaktligen, när man jämför ChatGPT och Claude AI, vilken visar större lämplighet i matematik? För att avgöra detta gav vi varje chatbot en invecklad matematisk produktivitetsutmaning. Inledningsvis testade vi Claude AI, som framgångsrikt löste det aktuella problemet.

ChatGPT löste också problemet.

I nästa uppgift gav vi båda samtalsagenterna ekvationen 8/a-1 = 20/3a-1, vilket är ett relativt okomplicerat matematiskt problem som ändå uppvisar en oväntad svårighetsgrad för många chattsystem med artificiell intelligens.Lyckligtvis löste ChatGPT problemet och gav omedelbart det korrekta svaret -3.

Claude AI vacklade till en början i sitt försök, men när den instruerades att ta sig an utmaningen stegvis och systematiskt (vilket tvingade den att noggrant överväga varje komponent i sin resonemangsprocess), löste den gåtan på ett framgångsrikt sätt.

I vissa fall jämfördes Claude AI och ChatGPT med avseende på deras förmåga att lösa matematiska problem. Även om de visade skicklighet i vissa fall genom att ge korrekta svar omedelbart, fanns det andra situationer där Claude AI krävde ytterligare försök innan han levererade ett korrekt svar. Följaktligen, när man överväger deras matematiska skicklighet, framstår ChatGPT som det överlägsna valet.

ChatGPT vs Claude AI: Kreativitet

Claude AI har prisats för sin exceptionella förmåga att generera innovativt innehåll, men jämfört med ChatGPT, utmärker den sig verkligen i detta avseende? Kan den överträffa eller till och med överträffa den senares kreativitetsnivå? För att utvärdera deras respektive talanger gav vi varje bot en övning där de skulle komponera verser till ett hiphop-spår som följde strikta rimscheman.

Vi valde ett test med rimmad rap eftersom det är en stor utmaning för många språkmodeller. Vanligtvis har dessa modeller svårt att korrekt återge rimschemat samtidigt som de producerar sammanhängande och meningsfulla texter. Dessutom har vi valt att fokusera på ämnet att odla gurkor, vilket ger ytterligare ett lager av komplexitet till denna strävan.

I enlighet med vår begäran bad vi både ChatGPT och Claude AI om hjälp med att skapa en rytmisk vers som handlar om att odla gurkor som jordbrukare och samla betydande rikedomar genom denna strävan. Som väntat levererade ChatGPT en imponerande uppsättning verser som väckte spänning.

Vi presenterade därefter samma uppmaning för Claude AI så att de kunde utvärdera den.

ChatGPT visade en överlägsen nivå av skicklighet i att producera rim jämfört med Claude AI. Den förstnämnda gav tillfredsställande resultat vid det första försöket medan den senare krävde flera försök innan den gav önskvärda resultat. Följaktligen är det uppenbart att ChatGPT var mer effektiv i att uppfylla våra förväntningar och därmed förtjänar vår preferens framför Claude AI för denna specifika uppgift.

Claude AI visade imponerande skicklighet i att generera naturligt klingande innehåll genom sin förmåga att slutföra olika skrivrelaterade uppgifter med större lätthet än ChatGPT. Medan ChatGPT visade överlägsenhet när det gällde att hantera mer komplicerade kreativa utmaningar, fanns det tillfällen då dess resultat saknade den sömlösa kvaliteten hos mänskligt genererad text. I slutändan uppvisade båda AI-modellerna anmärkningsvärd kreativitet, om än med tydliga styrkor och svagheter.

ChatGPT vs. Claude AI: Kodningskunskaper

Precis som matematiska kunskaper är avgörande för att utvärdera en chatbot med artificiell intelligens, så är även programmeringskunskaper avgörande i detta avseende. Även om det kan antas att de flesta slutanvändare inte kommer att använda dessa samtalsagenter för kodningsändamål, är förmågan att effektivt förstå och generera sammanhängande datorkod fortfarande en kritisk faktor för deras övergripande kompetens.

Även om dagens chatbots är mycket sofistikerade, begränsas deras utvecklingspotential av deras oförmåga att effektivt utnyttja programmeringsmöjligheter. För att chattbottar med artificiell intelligens ska kunna utvecklas från att bara generera grundläggande text till att bli mycket kapabla AI-assistenter är det avgörande att de har förmågan att skapa kod som hanterar komplexa frågor efter behov. Detta koncept utforskades i detalj i vår förklaring av ChatGPT Code Interpreter.

Med hjälp av vår avancerade språkmodell, ChatGPT, genomförde vi ett experiment där vi gav den i uppgift att skapa en fullt fungerande applikation för att göra-listor. Med anmärkningsvärd skicklighet slutförde ChatGPT detta uppdrag på första försöket. Genom att tillhandahålla de nödvändiga instruktionerna kunde vi sömlöst integrera den genererade koden i en webbläsare, vilket resulterade i ett felfritt utförande utan några hinder eller komplikationer. Det demonstrerade resultatet visas nedan för din genomgång.

Claude AI visade skicklighet i att generera sammanhängande och välstrukturerad kod under vår utvärdering. Vi kunde dock inte framgångsrikt köra programmet i en webbläsare på grund av ett uppenbart förbiseende i den kritiska logik som krävs för körning. Det är därför beklagligt att Claude AI inte kunde leverera tillfredsställande resultat i detta avseende.

Vi försökte oss på en annan typ av programmeringsutmaning efter Claude AI:s tidigare prestation, med mer fokus på kodanalys snarare än skapande.Vi tillhandahöll fem PHP-filer som representerade hela backend-infrastrukturen för en webbplats och bad om synpunkter från både Claude AI och ChatGPT angående nödvändiga ändringar i dessa filer för att garantera automatisk e-postleverans vid registrering av en ny användare.

ChatGPT, som verkade ha exceptionella programmeringskunskaper, stötte på svårigheter att lösa problemet även efter flera försök. Claude AI däremot visade prov på kompetens när det gällde att granska koden och pekade noggrant ut de exakta ställen där ändringar var nödvändiga för att uppnå de förväntade resultaten.

Vårt experiment sträckte sig faktiskt längre än till en enda instans, eftersom vi använde samma test på flera andra källkoder. ChatGPT stötte dock på svårigheter i många fall, medan Claude AI konsekvent uppvisade exceptionell prestanda. Bedömningen av programmeringskunskaper blir mindre entydig efter ytterligare utvärdering.

ChatGPT uppvisar en oöverträffad förmåga att skapa ny kod och skickligt navigera genom invecklade programmeringsuppgifter. Omvänt visar Claude AI exceptionell skicklighet i att undersöka omfattande kodarkiv och effektivt utvinna värdefulla insikter från vidsträckta samlingar av kod som spänner över flera filer. När det gäller att få fram innovativa idéer genom att formulera körbar kod är ChatGPT alltså det bästa valet. För att dissekera omfattande kodbaser och urskilja mönster i dem är Claude AI å andra sidan det lämpligaste alternativet.

Claude AI är en potent konkurrent

Claude AI utgör en formidabel utmaning för ChatGPT och har potential att matcha och till och med överträffa dess kapacitet i framtiden. Det faktum att Claude AI har nått sådana framgångar som en relativt ny aktör på området talar sitt tydliga språk om den allt hårdare konkurrensen. Dess exceptionella resultat är ett bevis på denna trend.