ChatGPT vs. Claude AI: Is Claude AI de betere chatbot?

Alicia Brunner included in Internet Chatgpt Artificial Intelligence Chatbot

2023-09-05 1815 words 9 minutes

Contents

Sinds de lancering in november 2022 is ChatGPT de dominante kracht gebleven in de AI-chatbotruimte. Ondanks verregaande inspanningen van verschillende AI-bedrijven is niemand er echt in geslaagd om een chatbot te bouwen die ChatGPT echt uitdaagt in algehele responskwaliteit. Googleâ€™s Bard? Microsoftâ€™s Bing AI? Nee, niet echt.

Hoewel er veel kanshebbers zijn op het gebied van chatbots met kunstmatige intelligentie, heeft Claude AI, ontwikkeld door het innovatieve bedrijf Anthropic, veel aandacht en lof geoogst van een toenemend aantal gebruikers. Sommigen beweren zelfs dat het zijn concurrent ChatGPT overtreft in functionaliteit en effectiviteit. Om deze beweringen volledig te evalueren, laten we een uitgebreide vergelijking maken tussen de twee bots.

ChatGPT vs. Claude AI: Gezond verstand en logisch redeneren

Bij onze evaluatie van AI-chatbots is het fascinerend om te zien hoe verschillend hun capaciteiten zijn. Terwijl sommige AI-chatbots in staat zijn om snel ingewikkelde zaken op te lossen die anders veel tijd zouden kosten voor menselijke experts om aan te pakken, lijken andere te worstelen met rudimentaire kwesties die alleen eenvoudige logica of gezond verstand vereisen. Daarom onderwierpen we ChatGPT en Claude AI aan een reeks tests die ontworpen waren om hun vaardigheid in het tonen van gezond oordeel en rationeel denkvermogen te beoordelen.

Met behulp van een gefragmenteerde strategie pakte ChatGPT het probleem met succes aan tijdens zijn eerste poging. Tegelijkertijd gebruikte Claude AI een alternatieve methode om het probleem effectief op te lossen.

Beide chatbots losten de eerste uitdaging met succes op en toonden daarmee aan dat ze eenvoudige vragen kunnen beantwoorden. Vervolgens testten we hun vermogen om complexere en genuanceerdere vragen te beantwoorden, door ze een raadsel of puzzel voor te leggen die kritisch denkvermogen vereiste.

ChatGPT bleek de truc onmiddellijk te begrijpen, namelijk dat je niet kunt interfereren met levenden, omdat ze niet dood zijn. Claude AI daarentegen leek te begrijpen dat het om een list ging, maar haperde bij het doorzien van het vanzelfsprekende feit dat individuen die hebben overleefd niet moeten worden begraven.

In tegenstelling hiermee voerde de vraag een buitensporige hoeveelheid analyse uit op het onderzoek en kwam tot de vaststelling dat er geen mensen zouden overblijven om te interfereren om de reden dat de afdaling van Mars naar de Aarde zou resulteren in een zekere dood. Dit antwoord komt misschien niet overeen met onze verwachte uitkomst, maar als je het vanuit een alternatief perspectief bekijkt, bevat het toch een zekere geldigheid.

Door gebruik te maken van de mogelijkheden van ChatGPT hebben we ook gekeken naar de potentiële voordelen van de methodologie van Claude AI om deze specifieke uitdaging aan te gaan. In onze afsluitende fase om de prestaties op dit specifieke gebied te evalueren, hebben we beide gespreksagenten een hypothetisch scenario voorgelegd over een appelboom. We stelden dat je begint met een voorraad van tien appels, waarvan er vervolgens vijf in stukken worden gesneden terwijl ze aan de boom blijven hangen. Vervolgens vroegen we elk systeem om een schatting te maken van het aantal vruchten dat na deze gebeurtenissen nog aan de boom zat. Het antwoord van ChatGPT gaf aan dat alle tien appels zouden blijven zitten.

Hoewel sommige kunstmatige intelligentie modellen de vraag niet begrepen of irrelevante antwoorden gaven, toonde Claude AI een praktisch begrip door te erkennen dat de vijf gesneden appels waarschijnlijk zouden bederven door blootstelling aan lucht en vocht.

Gebaseerd op onze experimenten toonde Claude AI vaardigheid in het aanpakken van het probleem. Er werden pogingen gedaan om meer ingewikkelde scenario’s voor te leggen, wat resulteerde in een combinatie van succesvolle en onsuccesvolle resultaten voor beide chatbots. In het licht van deze bevindingen kan worden gesteld dat hoewel ChatGPT enig voordeel vertoont, het verschil tussen hun gezond verstand en logisch redeneervermogen relatief minimaal is.

ChatGPT vs. Claude AI: Wiskundevaardigheden

Zelfs als men niet van plan is om ChatGPT of Claude AI te gebruiken voor het oplossen van algebraïsche opdrachten, heeft de vaardigheid van deze systemen in wiskunde belangrijke gevolgen. Wiskunde vormt een cruciale basis voor chatbots met kunstmatige intelligentie, omdat het ze in staat stelt praktische redeneringen te begrijpen, denkfouten te herkennen en fouten te erkennen.

In wezen is wiskundige competentie een fundamentele maatstaf voor kunstmatige intelligentie. Als we ChatGPT en Claude AI met elkaar vergelijken, welke van de twee is dan beter in wiskunde? Om dit te bepalen, legden we elke chatbot een ingewikkelde wiskundige productiviteitsuitdaging voor. In eerste instantie testten we Claude AI, die het probleem met succes oploste.

ChatGPT wist het probleem ook op te lossen.

Bij de volgende taak legden we beide conversatieagenten de vergelijking 8/a-1 = 20/3a-1 voor. Dit is een relatief ongecompliceerd wiskundig probleem dat desondanks een onverwachte moeilijkheidsgraad heeft voor veel chatsystemen met kunstmatige intelligentie.Gelukkig loste ChatGPT dit probleem met succes op en gaf onmiddellijk het nauwkeurige antwoord van -3.

Claude AI haperde aanvankelijk in zijn poging, maar toen hij de opdracht kreeg om de uitdaging stapsgewijs en systematisch aan te pakken (waardoor hij gedwongen werd om elk onderdeel van zijn redeneerproces nauwkeurig te overwegen), loste hij het raadsel met succes op.

In bepaalde gevallen werden de prestaties van Claude AI en ChatGPT vergeleken met betrekking tot hun vermogen om wiskundige problemen op te lossen. Hoewel ze in sommige gevallen vaardigheid toonden door direct correcte antwoorden te geven, waren er andere situaties waarin Claude AI extra pogingen nodig had om een accuraat antwoord te geven. Als we kijken naar hun wiskundige bekwaamheid, komt ChatGPT dus als beste uit de bus.

ChatGPT vs. Claude AI: Creativiteit

Claude AI wordt geprezen om zijn uitzonderlijke vermogen om innovatieve inhoud te genereren, maar blinkt het in vergelijking met ChatGPT echt uit in dit opzicht? Kan het het niveau van creativiteit van ChatGPT overtreffen of zelfs overtreffen? Om hun respectievelijke talenten te evalueren, legden we elke bot een oefening voor waarbij ze verzen moesten schrijven voor een hiphopnummer volgens strikte rijmschema’s.

We kozen voor een rap-rijmtest omdat dit een aanzienlijke uitdaging vormt voor veel taalmodellen. Meestal hebben deze modellen moeite om het rijmschema nauwkeurig te reproduceren en tegelijkertijd coherente en betekenisvolle teksten te produceren. Bovendien hebben we ervoor gekozen om ons te richten op het onderwerp komkommers kweken, wat een extra laag complexiteit toevoegt aan deze inspanning.

In overeenstemming met ons verzoek vroegen we de hulp van zowel ChatGPT als Claude AI bij het maken van een ritmische vers met betrekking tot het kweken van komkommers als een boer en het vergaren van aanzienlijke rijkdom door deze inspanning. Zoals verwacht leverde ChatGPT een indrukwekkende reeks verzen die opwinding opriepen.

Vervolgens legden we dezelfde prompt ter evaluatie voor aan Claude AI.

ChatGPT toonde een grotere vaardigheid in het produceren van rijmen dan Claude AI. De eerste leverde bevredigende resultaten bij de eerste poging, terwijl de tweede meerdere pogingen nodig had voordat het gewenste resultaat werd bereikt. Het is dus duidelijk dat ChatGPT effectiever was in het voldoen aan onze verwachtingen, waardoor het onze voorkeur verdiende boven Claude AI voor deze specifieke taak.

Claude AI toonde een indrukwekkende vaardigheid in het genereren van natuurlijk klinkende inhoud door het vermogen om verschillende schrijfgerelateerde taken met meer gemak uit te voeren dan ChatGPT. ChatGPT toonde superioriteit in het afhandelen van meer ingewikkelde creatieve uitdagingen, maar in sommige gevallen miste de output de naadloze kwaliteit van door mensen gegenereerde tekst. Uiteindelijk vertoonden beide AI-modellen opmerkelijke creativiteit, zij het met verschillende sterke en zwakke punten.

ChatGPT vs. Claude AI: Codeervaardigheden

Net zoals wiskundig inzicht van vitaal belang is bij het evalueren van de capaciteiten van een chatbot met kunstmatige intelligentie, is programmeervaardigheid in dit opzicht ook van cruciaal belang. Hoewel kan worden aangenomen dat de meeste eindgebruikers deze gespreksagenten niet zullen gebruiken voor codering, blijft het vermogen om effectief coherente computercode te begrijpen en te genereren een kritieke determinant van hun algehele bekwaamheid.

Hoewel de huidige chatbots een hoog niveau van geavanceerdheid vertonen, wordt hun potentieel voor vooruitgang beperkt door hun onvermogen om effectief gebruik te maken van programmeermogelijkheden. Om ervoor te zorgen dat chatbots met kunstmatige intelligentie verder komen dan het genereren van basistekst en zeer capabele AI-assistenten worden, is het cruciaal dat ze de mogelijkheid hebben om code samen te stellen die complexe problemen op een incidentele basis aanpakt. Dit concept is in detail onderzocht in onze ChatGPT Code Interpreter uitleg.

Door gebruik te maken van de mogelijkheden van ons geavanceerde taalmodel, ChatGPT, voerden we een experiment uit waarbij we het model opdroegen een volledig functionerende to-do lijst applicatie te maken. Met opmerkelijke vaardigheid voltooide ChatGPT deze opdracht bij de eerste poging. Door de nodige instructies te geven, konden we de gegenereerde code naadloos integreren in een webbrowser, wat resulteerde in een vlekkeloze uitvoering zonder hindernissen of complicaties. Het gedemonstreerde resultaat zie je hieronder.

Claude AI toonde zich tijdens onze evaluatie vaardig in het genereren van coherente en goed gestructureerde code. We waren echter niet in staat om het programma succesvol uit te voeren op een webbrowser door een kennelijke vergissing in de kritieke logica die nodig is voor uitvoering. Het is daarom jammer dat Claude AI in dit opzicht geen bevredigende resultaten kon leveren.

Na de eerdere prestaties van Claude AI hebben we een ander type programmeeruitdaging geprobeerd, waarbij we ons meer richtten op code-analyse dan op het maken van code.We verstrekten vijf PHP-bestanden die de volledige backend-infrastructuur van een website vertegenwoordigen en vroegen zowel Claude AI als ChatGPT om input met betrekking tot de noodzakelijke wijzigingen binnen deze bestanden om de automatische aflevering van e-mail bij registratie door een nieuwe gebruiker te garanderen.

Met name ChatGPT, dat over uitzonderlijke programmeercapaciteiten leek te beschikken, ondervond moeilijkheden bij het aanpakken van het probleem, zelfs na meerdere pogingen. Claude AI daarentegen toonde bekwaamheid in het onderzoeken van de code en wees nauwkeurig de locaties aan waar aanpassingen nodig waren om de verwachte resultaten te bereiken.

Sterker nog, ons experiment ging verder dan één instantie, want we pasten dezelfde test toe op verschillende andere broncodes. ChatGPT ondervond echter in veel gevallen problemen, terwijl Claude AI consistent uitzonderlijke prestaties liet zien. Het bepalen van de vaardigheid in programmeren wordt minder duidelijk na verdere evaluatie.

ChatGPT vertoont een ongeëvenaarde vaardigheid in het maken van nieuwe code en het behendig navigeren door ingewikkelde programmeertaken. Omgekeerd toont Claude AI een uitzonderlijk scherpzinnigheid in het onderzoeken van uitgebreide codebestanden, waarbij waardevolle inzichten efficiënt worden geëxtraheerd uit uitdijende verzamelingen code die meerdere bestanden beslaan. Dus als het gaat om het naar voren brengen van innovatieve ideeën door middel van uitvoerbare code, is ChatGPT de beste keuze. Aan de andere kant, voor het ontleden van omvangrijke codebestanden en het onderscheiden van patronen daarin, is Claude AI de meest geschikte optie.

Claude AI is een krachtige concurrent op het blok

Claude AI vormt een formidabele uitdaging voor ChatGPT en heeft de potentie om de capaciteiten van ChatGPT te evenaren en in de toekomst zelfs te overtreffen. Het feit dat Claude AI zo’n succes heeft geboekt als relatief recente nieuwkomer op dit gebied, spreekt boekdelen over de toenemende concurrentie. Zijn uitzonderlijke prestaties dienen als bewijs voor deze trend.