Home Tecnologia O mais novo chatbot Claude da Anthropic supera o GPT-4o da OpenAI...

O mais novo chatbot Claude da Anthropic supera o GPT-4o da OpenAI em alguns benchmarks

31
0


Antrópico lançado seu mais novo modelo de linguagem de IA na quinta-feira, Claude 3.5 Sonnet. O chatbot atualizado supera o modelo anterior de primeira linha da empresa, Claude 3 Opus, enquanto trabalha com o dobro da velocidade. Os usuários do Claude (incluindo aqueles com contas gratuitas) podem conferir a partir de hoje.

Sonnet, que tende a ser o modelo mais equilibrado da Anthropic, é o primeiro lançamento da família Claude 3.5. A empresa afirma que Claude 3.5 Haiku (o mais rápido de cada geração) e Claude 3.5 Opus (o mais poderoso) chegarão ainda este ano. (Enquanto isso, esses modelos permanecerão na versão 3.) A atualização do Sonnet chega apenas alguns meses após a chegada da família Claude 3, mostrando a velocidade vertiginosa que as empresas de IA estão trabalhando para lançar o que há de melhor e mais recente.

Gráfico mostrando comparações de benchmarks entre modelos recentes de chatbot de IA: Claude 3.5 Sonnet, Claude 3 Opus, GPT-4o, Gemini 1.5 Pro e Llama-400b.

Antrópico

Reivindicações antrópicas O Soneto Claude 3.5 marca um passo à frente na compreensão das nuances, do humor e das instruções complicadas, e pode escrever em um tom mais natural. Os benchmarks (acima) mostram o novo modelo quebrando recordes do setor em raciocínio em nível de pós-graduação, conhecimento em nível de graduação e proficiência em codificação. Ele supera o GPT-4o da OpenAI em muitos dos benchmarks publicados pela Anthropic. No entanto, os modelos mais recentes de Claude, ChatGPT, Gemini e Llama tendem a pontuar alguns pontos percentuais um do outro na maioria dos testes, ressaltando a competição acirrada.

A empresa afirma que o Claude 3.5 Sonnet também é melhor na interpretação de informações visuais do que o Claude 3.0 Opus. A Anthropic afirma que o novo modelo pode “transcrever com precisão texto de imagens imperfeitas”, uma habilidade que espera atrair clientes de varejo, logística e serviços financeiros que precisam captar dados de tabelas, gráficos e outras dicas visuais.

A atualização de Claude também traz um novo espaço de trabalho que a empresa chama de Artefatos (acima). Quando você solicita que o chatbot gere conteúdo como código, documentos de texto ou designs web, uma janela dedicada aparece à direita do chat. A partir daí, você pode solicitar que Claude faça alterações e isso manterá a janela Artefatos atualizada com sua saída mais recente.

A empresa vê o Artifacts como um primeiro passo para tornar Claude um espaço para uma colaboração mais ampla em equipe. “Num futuro próximo, as equipes – e eventualmente organizações inteiras – serão capazes de centralizar com segurança seus conhecimentos, documentos e trabalho contínuo em um espaço compartilhado, com Claude atuando como companheiro de equipe sob demanda”, escreveu a empresa em comunicado à imprensa. .

Claude 3.5 Sonnet já está disponível para qualquer pessoa com uma conta experimentar seu sitebem como no Aplicativo Claude iOS. (Em ambas as plataformas, os assinantes do Claude Pro e do Team obtêm contagens de tokens mais altas.) Você também pode acessá-lo por meio da API Anthropic, Amazon Bedrock e Vertex AI do Google Cloud. Custa US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída – o mesmo que o modelo anterior.



Source link