Contents

ChatGPT vs. Claude AI: Claude AI é o melhor chatbot?

Desde o seu lançamento em novembro de 2022, o ChatGPT tem-se mantido como a força dominante no espaço dos chatbots de IA. Apesar dos esforços de longo alcance de várias empresas de IA, ninguém foi realmente capaz de construir um chatbot que realmente desafie o ChatGPT na qualidade geral da resposta. O bardo do Google? A IA do Bing da Microsoft? Não, nem por isso.

Embora existam inúmeros concorrentes no domínio dos chatbots alimentados por inteligência artificial, o Claude AI, desenvolvido pela empresa inovadora Anthropic, tem atraído uma atenção significativa e elogios de um número crescente de utilizadores. Alguns afirmam mesmo que ultrapassa o seu concorrente, o ChatGPT, em termos de funcionalidade e eficácia. Para avaliar completamente essas afirmações, vamos fazer uma comparação abrangente entre os dois bots.

ChatGPT vs. Claude AI: senso comum e raciocínio lógico

Na nossa avaliação dos chatbots com IA, é fascinante observar as capacidades divergentes que exibem. Enquanto alguns chatbots de IA são capazes de resolver rapidamente questões complexas que, de outra forma, consumiriam um tempo considerável dos especialistas humanos, outros parecem ter dificuldades com questões rudimentares que exigem apenas uma lógica simples ou uma compreensão de senso comum. Consequentemente, submetemos o ChatGPT e o Claude AI a uma série de testes concebidos para avaliar a sua proficiência na demonstração de um bom julgamento e de capacidades de pensamento racional.

/pt/images/logical-and-commonsense-problem.jpg

Utilizando uma estratégia fragmentada, o ChatGPT abordou com sucesso a questão durante a sua tentativa inicial. Simultaneamente, Claude AI adoptou uma metodologia alternativa para resolver o problema de forma eficaz.

/pt/images/claude-ai-solving-a-commonsense-and-logical-reasoning-problem.jpg

Ambos os chatbots resolveram com êxito o desafio inicial, demonstrando assim a sua competência na resolução de questões simples. Posteriormente, testámos a sua capacidade de lidar com questões mais complexas e matizadas, apresentando-lhes especificamente um enigma ou quebra-cabeças que exigia capacidades de pensamento crítico.

/pt/images/chatgpt-answers-trick-question-1.jpg

ChatGPT demonstrou uma compreensão imediata do estratagema - nomeadamente, não se pode interrogar os vivos, uma vez que não estão mortos. Em contraste, Claude AI pareceu compreender que se tratava de um estratagema, mas hesitou em discernir o facto evidente de que os indivíduos que sobreviveram não devem ser sepultados.

Por outro lado, a pergunta efectuou uma análise excessiva do inquérito e chegou à conclusão de que não restariam indivíduos para enterrar, porque a descida de Marte à Terra resultaria numa morte certa. Esta resposta pode não estar de acordo com o resultado esperado, mas quando examinada através de uma perspetiva alternativa, contém um mínimo de validade.

/pt/images/claude-ai-answers-trick-question.jpg

Utilizando as capacidades do ChatGPT, também considerámos os potenciais méritos da metodologia da Claude AI na abordagem deste desafio específico. Na nossa fase final de avaliação do desempenho ao longo desta dimensão específica, apresentámos a ambos os agentes de conversação um cenário hipotético envolvendo uma macieira. Especificamente, propusemos que se começa com um stock de dez maçãs, cinco das quais são posteriormente cortadas enquanto permanecem presas à árvore. Em seguida, pedimos a cada sistema que estimasse o número de frutos restantes na árvore após esses eventos. A resposta fornecida pelo ChatGPT indicou que as dez maçãs persistiriam.

/pt/images/chatgpt-birds-commonsense-logic.jpg

Embora alguns dos modelos de inteligência artificial não tenham conseguido compreender a pergunta ou tenham dado respostas irrelevantes, a IA Claude demonstrou uma compreensão prática ao reconhecer a probabilidade de deterioração das cinco maçãs cortadas devido à sua exposição ao ar e à humidade.

/pt/images/claude-ai-common-sense-reasoning-with-apple-rotting.jpg

Com base na nossa experimentação, a IA do Claude demonstrou proficiência na resolução do problema em causa. Foram feitas tentativas para apresentar cenários mais complexos, o que resultou numa combinação de resultados bem e mal sucedidos para ambos os chatbots. À luz destes resultados, pode argumentar-se que, embora o ChatGPT apresente alguma vantagem, a disparidade entre as suas capacidades de senso comum e de raciocínio lógico é relativamente mínima.

ChatGPT vs. Claude AI: Competências matemáticas

Mesmo que não se pretenda utilizar o ChatGPT ou o Claude AI para resolver tarefas algébricas, a proficiência destes sistemas em matemática tem ramificações significativas. A matemática serve de base crucial para os chatbots de inteligência artificial, permitindo-lhes compreender o raciocínio prático, reconhecer pensamentos falaciosos e reconhecer erros.

Na sua essência, a competência matemática serve de referência fundamental para a inteligência artificial. Consequentemente, ao comparar o ChatGPT e o Claude AI, qual deles demonstra maior aptidão para a matemática? Para o determinar, apresentámos a cada chatbot um intrincado desafio de produtividade matemática. Inicialmente, testámos o Claude AI, que resolveu o problema com sucesso.

/pt/images/claude-ai-solves-maths-problem-on-productivity.jpg

O ChatGPT também resolveu o problema.

/pt/images/chatgpt-solves-maths-problem-on-productivity.jpg

Passando à tarefa seguinte, apresentámos a ambos os agentes de conversação a equação 8/a-1 = 20/3a-1, que é um problema matemático relativamente simples, mas que, no entanto, apresenta um grau de dificuldade inesperado para muitos sistemas de conversação com inteligência artificial.Felizmente, o ChatGPT resolveu com sucesso esta questão e forneceu imediatamente a resposta exacta de -3.

/pt/images/chatgpt-solves-a-math-problem.jpg

A IA do Claude vacilou inicialmente na sua tentativa, mas ao ser instruída para enfrentar o desafio de forma incremental e sistemática (obrigando-a assim a considerar meticulosamente cada componente do seu processo de raciocínio), resolveu com sucesso o enigma.

/pt/images/claude-ai-solves-a-math-problem-step-by-step.jpg

Nalguns casos, o desempenho da IA do Claude e do ChatGPT foi comparado em relação à sua capacidade de resolver problemas matemáticos. Embora tenham demonstrado proficiência em alguns casos, dando respostas correctas imediatamente, houve outras situações em que o Claude AI precisou de tentativas adicionais antes de dar uma resposta correcta. Consequentemente, quando se considera a sua proeza matemática, o ChatGPT surge como a escolha superior.

ChatGPT vs. Claude AI: Criatividade

O Claude AI tem sido elogiado pela sua excecional capacidade de gerar conteúdos inovadores, mas, quando comparado com o ChatGPT, será que é realmente excelente neste aspeto? Será que consegue superar ou mesmo ultrapassar o nível de criatividade deste último? Para avaliar os seus respectivos talentos, apresentámos a cada bot um exercício que os obrigava a compor versos para uma faixa de hip-hop que obedecia a esquemas de rima rigorosos.

Optámos por um teste de rimas de rap porque representa um desafio considerável para muitos modelos de linguagem. Normalmente, estes modelos têm dificuldade em reproduzir com exatidão o esquema de rimas e, simultaneamente, produzir letras coerentes e com significado. Além disso, optámos por nos concentrar no tema do cultivo de pepinos, o que acrescenta uma camada adicional de complexidade a este esforço.

De acordo com o nosso pedido, solicitámos a ajuda do ChatGPT e do Claude AI para criar um verso rítmico relativo ao cultivo de pepinos como agricultor e à acumulação de riqueza substancial através deste esforço. Como previsto, ChatGPT entregou um conjunto impressionante de versos que evocaram entusiasmo.

/pt/images/chatgpt-composes-a-rap-lyrics.jpg

Subsequentemente, apresentámos a mesma pergunta à IA do Claude para avaliação.

/pt/images/claude-ai-composes-a-rap-lyrics.jpg

O ChatGPT demonstrou um nível superior de proficiência na produção de rimas em comparação com o Claude AI. O primeiro apresentou resultados satisfatórios na primeira tentativa, enquanto o segundo necessitou de várias tentativas antes de produzir resultados desejáveis. Consequentemente, é evidente que o ChatGPT foi mais eficaz em satisfazer as nossas expectativas, ganhando assim a nossa preferência em relação ao Claude AI para esta tarefa em particular.

A IA do Claude demonstrou uma proficiência impressionante na criação de conteúdos com um som natural, graças à sua capacidade de realizar várias tarefas relacionadas com a escrita com maior facilidade do que o ChatGPT. Embora o ChatGPT tenha mostrado superioridade no tratamento de desafios criativos mais complexos, houve casos em que o seu resultado não tinha a qualidade perfeita do texto gerado por humanos. Em última análise, ambos os modelos de IA demonstraram uma criatividade notável, embora com pontos fortes e fracos distintos.

ChatGPT vs. Claude AI: Competências de programação

Certamente que, tal como a perspicácia matemática é vital para avaliar as capacidades de um chatbot de inteligência artificial, também as aptidões de programação são cruciais a este respeito. Embora se possa assumir que a maioria dos utilizadores finais não utilizará estes agentes de conversação para fins de codificação, a capacidade de compreender e gerar eficazmente código informático coerente continua a ser um fator determinante da sua competência global.

Embora os chatbots actuais apresentem um elevado nível de sofisticação, o seu potencial de avanço é limitado pela sua incapacidade de utilizar eficazmente as capacidades de programação. Para que os chatbots de inteligência artificial progridam para além da geração de texto básico e se tornem assistentes de IA altamente capazes, é crucial que possuam a capacidade de compor código que trate de questões complexas numa base de necessidade. Este conceito foi explorado em pormenor na nossa explicação do ChatGPT Code Interpreter.

Utilizando as capacidades do nosso modelo de linguagem avançado, ChatGPT, realizámos uma experiência em que lhe pedimos para criar uma aplicação de lista de tarefas totalmente funcional. Com uma proficiência notável, o ChatGPT completou com sucesso esta tarefa na sua primeira tentativa. Ao fornecer as instruções necessárias, conseguimos integrar perfeitamente o código gerado num navegador Web, resultando numa execução impecável sem quaisquer obstáculos ou complicações. O resultado demonstrado é apresentado abaixo para sua leitura.

/pt/images/to-do-list-app-by-chatgpt.jpg

O Claude AI demonstrou proficiência na geração de código coerente e bem estruturado durante a nossa avaliação. No entanto, não conseguimos executar o programa com sucesso num navegador da Web devido a uma aparente omissão na lógica crítica necessária para a execução. Como tal, é lamentável que o Claude AI não tenha conseguido apresentar resultados satisfatórios a este respeito.

Tentámos um tipo diferente de desafio de programação após o desempenho anterior do Claude AI, centrando-nos mais na análise do código do que na criação.Fornecemos cinco ficheiros PHP que representavam toda a infraestrutura de backend de um sítio Web e solicitámos a Claude AI e o ChatGPT que fizessem as modificações necessárias nesses ficheiros para garantir a entrega automática de correio eletrónico após o registo de um novo utilizador.

/pt/images/claude-ai-analyzing-multiple-php-files.jpg

Nomeadamente, o ChatGPT, que parecia possuir capacidades de programação excepcionais, teve dificuldades em resolver o problema, mesmo depois de várias tentativas. Em contrapartida, Claude AI demonstrou competência na análise do código e identificou com precisão os locais exactos onde eram necessárias modificações para atingir os resultados esperados.

De facto, a nossa experiência foi além de uma única instância, pois aplicámos o mesmo teste a vários outros códigos-fonte. No entanto, o ChatGPT encontrou dificuldades em muitos casos, enquanto o Claude AI demonstrou consistentemente um desempenho excecional. A determinação da proficiência em competências de programação torna-se menos clara após uma avaliação mais aprofundada.

O ChatGPT exibe uma aptidão incomparável para criar código novo e navegar habilmente em tarefas de programação complexas. Por outro lado, Claude AI demonstra uma perspicácia excecional na análise de repositórios de código extensos, extraindo eficientemente informações valiosas de colecções extensas de código que abrangem vários ficheiros. Assim, quando se procura trazer à luz ideias inovadoras através da articulação de código executável, o ChatGPT surge como a escolha preferida. Por outro lado, para dissecar bases de código volumosas e discernir padrões dentro delas, o Claude AI destaca-se como a opção mais adequada.

A IA do Claude é um potente concorrente no bloco

A IA do Claude representa um desafio formidável para o ChatGPT, tendo o potencial de igualar e até exceder as suas capacidades no futuro. O facto de a Claude AI ter alcançado tal sucesso como um concorrente relativamente recente neste campo diz muito sobre a intensificação da concorrência. O seu desempenho excecional serve como prova desta tendência.