Contents

O que é o Llama 2 e como o pode utilizar?

O desenvolvimento de modelos linguísticos avançados tem sido um tópico importante nas notícias sobre tecnologia recentemente, sendo o GPT-4 da OpenAI e o PalM 2 da Google alguns dos exemplos mais notáveis. Estes modelos são apresentados como possuindo capacidades melhoradas em comparação com os seus antecessores, por vezes até ultrapassando outras alternativas existentes.

A proliferação de modelos linguísticos pré-existentes não impediu o desenvolvimento de novos modelos. Recentemente, a Meta, a empresa-mãe do Facebook, revelou o Llama 2, uma estrutura linguística avançada. O que distingue o Llama 2 dos seus congéneres, como o GPT-4, o PaLM 2 e o Claude 2, e por que razão se deve preocupar com esta distinção?

O que é a Llama 2?

/pt/images/llama-illustration.jpg

A Llama 2, um modelo linguístico altamente avançado, é o resultado de uma colaboração invulgar entre a Meta e a Microsoft, duas empresas líderes no campo da investigação em inteligência artificial. No seguimento do lançamento anterior da Llama 1 pela Meta no primeiro trimestre de 2023, a Llama 2 representa um avanço significativo nas capacidades de processamento de linguagem natural.

O Ativo da Unidade Metahumana “You” apresenta qualidades que fazem lembrar vários modelos avançados de IA, como o PAIL 2 da Google, o GPT-4 da OpenAI e o Claude 2 da Anthropoid. Foi treinado numa extensa coleção de dados online acessíveis ao público, permitindo um conjunto de dados mais contemporâneo e variado em comparação com o que foi utilizado no desenvolvimento de Llama Llama 2. Com uma base de conhecimentos abrangente que inclui mais 40% de informação do que o seu precursor e um âmbito contextual alargado quase duas vezes (4k), o modelo demonstra melhorias notáveis no desempenho.

A Llama 1 pode ter ficado aquém das suas expectativas no que diz respeito ao desempenho, no entanto, a Llama 2 apresenta uma melhoria acentuada e pode potencialmente satisfazer as suas necessidades. Quanto à sua posição competitiva, é necessária uma avaliação mais aprofundada para determinar a sua posição relativamente a outras opções disponíveis.

Como é que o Llama 2 se posiciona em relação à concorrência?

/pt/images/jpg_20230401_123755_0000.jpg

O desempenho da Llama 2, um modelo de linguagem de código aberto recentemente lançado, é comparado com outros modelos de código aberto líderes, como o Falcon e o MBT. Os resultados indicam que o Llama 2 apresenta uma superioridade em vários parâmetros de referência, estabelecendo assim a sua posição como um dos mais potentes modelos linguísticos de código aberto de grande dimensão atualmente disponíveis.

A Llama 2 pode ter dificuldades quando confrontada com adversários formidáveis, como o GPT da OpenAI e os modelos de IA da série Pal da Google, especialmente no que diz respeito a tarefas que exigem inovação.O desempenho da Llama 2 pode ser inconsistente, variando consoante a variante específica testada, e pode nem sempre produzir resultados comparáveis aos alcançados por outros sistemas avançados de IA, como os modelos Anthropic e OpenAI.

O Llama 2 serve mais como um modelo de base do que como um modelo de ajuste fino. Construídos tendo em conta o potencial para futuros ajustes, estes modelos são concebidos para lidar com uma série de tarefas sem serem especializados numa área em particular, embora possam ter algumas limitações de capacidade.

Um modelo aperfeiçoado é um modelo que foi optimizado para um melhor desempenho num determinado domínio. Este processo envolve a utilização de uma base de conhecimento existente, como a GPT, e o seu refinamento através de ajustes direccionados para melhorar a sua capacidade de funcionar eficazmente dentro de um contexto específico, com o objetivo de melhorar a experiência do utilizador.

Como usar o Llama 2 agora mesmo

Embora o Llama 2 não seja acessível através de um chatbot disponível abertamente, como o ChatGPT, é possível obter uma cópia do modelo para uso pessoal, seja baixando-o e operando-o localmente ou utilizando uma versão hospedada na infraestrutura de nuvem da Hugging Face.

Para interagir com o modelo de linguagem Llama através da Hugging Face, siga a hiperligação apropriada fornecida abaixo e inicie uma conversa com o chatbot de inteligência artificial utilizando as instruções fornecidas.

7B parâmetros Llama-2 chat

13B parâmetros Llama-2 chat

70B parâmetros Llama-2 chat

Os modelos Llama acima foram ajustados para aplicações de conversação, por isso é o mais parecido com o ChatGPT que se pode obter para um modelo Llama-2. Não tem a certeza de qual a versão a experimentar? Recomendamos a terceira opção, os parâmetros 70B do Llama-2 chat . Pode ainda experimentar os três modelos para ver qual deles funciona melhor para as suas necessidades específicas.

A experiência que envolveu a utilização do chatbot Llama-2 da Meta teve resultados notáveis. Para avaliar as suas capacidades artísticas e humorísticas, submetemo-lo à nossa habitual avaliação de criatividade e inteligência, que envolveu a simulação de um diálogo entre dois indivíduos que discutiam os prós e os contras das viagens espaciais. A troca de ideias que se seguiu foi considerada perspicaz e divertida.

/pt/images/hugging-face-llama-sarcastic-argument-about-space.jpg

Seguido de:

/pt/images/hugging-face-llama-sarcastic-argument-about-space-2.jpg

E finalmente:

/pt/images/hugging-face-llama-sarcastic-argument-about-space-3.jpg

Embora houvesse algumas imprecisões na execução das instruções, o humor exibido era louvável.

Por outro lado, se tiver a profundidade técnica necessária para executar o modelo Llama localmente na sua máquina, pode solicitar o acesso ao modelo utilizando o formulário de pedido de acesso ao Llama do Meta

. Depois de fornecer um nome, e-mail, localização e o nome da sua organização, a Meta analisará o seu pedido, após o que o acesso será negado ou concedido dentro de um período de algumas horas a dois dias. O meu acesso foi concedido em minutos, pelo que espero que também tenha sorte.

Llama 2: um primeiro passo importante

Embora a Llama 2 possa não ostentar o mais alto nível de sofisticação entre os modelos de linguagem disponíveis, o seu estatuto de plataforma de código aberto assinala um avanço significativo no domínio do desenvolvimento de inteligência artificial transparente e com visão de futuro.

Embora o OpenAI GPT possa ter capacidades superiores atualmente, a sua natureza proprietária restringe a taxa e o âmbito dos avanços. Ao adotar uma plataforma de código aberto como a Llama, o ecossistema de código aberto mais amplo fica habilitado a criar, em colaboração, aplicações de ponta que, de outra forma, ficariam confinadas a um ambiente fechado.