Lançamento do Modelo Claude Opus 4.7 da Anthropic

Por Autor Redação TNRedação TN

[Anthropic lança Claude Opus 4.7 para destacar o Mythos]. Reprodução: Gizmodo

Lançamento do Modelo Claude Opus 4.7 da Anthropic

A Anthropic anunciou nesta quinta-feira o lançamento de seu mais recente modelo de inteligência artificial, o Claude Opus 4.7. A empresa se refere a ele como uma "melhoria significativa" em relação ao Opus 4.6, embora com capacidades "menos abrangentes" em comparação ao modelo altamente avançado e ainda não liberado ao público, o Claude Mythos Preview.

Esse novo modelo parece ser uma reafirmação das competências que os modelos da Anthropic já dominam. Segundo a empresa, a nova versão do seu produto principal apresenta melhorias notáveis em desempenho em áreas como programação, engenharia e tarefas complexas envolvendo múltiplas etapas. O Claude Opus 4.7 é descrito como "mais minucioso e consistente em trabalhos difíceis, com resultados melhorados em conhecimento profissional".

Assim como em todos os lançamentos de novos modelos, o Claude Opus 4.7 é acompanhado por um novo conjunto de testes de referência para demonstrar suas capacidades. Este modelo voltou a conquistar a liderança no que se refere à programação agentiva entre os modelos disponíveis publicamente, obtendo 64,3% nos testes SWE-bench Pro e SWE-bench Verified, que avaliam a habilidade dos modelos em lidar com tarefas de engenharia complexas.

Além disso, o Claude Opus 4.7 também superou os padrões do 4.6 em uso de computador de forma autônoma (isto é, navegar por um sistema operacional para realizar tarefas) e no raciocínio em nível de pós-graduação, entre outras categorias. Entretanto, vale ressaltar que o Claude Opus 4.7 apresenta uma leve queda em relação ao Opus 4.6 em reprodução de vulnerabilidades de cibersegurança. O novo modelo obteve 73,1% em testes de benchmarking, comparado ao 73,8% da versão anterior.

CONTINUA DEPOIS DA PUBLICIDADE

De acordo com a Anthropic, o novo modelo introduz "safeguardes que detectam e bloqueiam automaticamente pedidos que indicam usos proibidos ou de alto risco em cibersegurança", o que pode ter influenciado a leve queda de desempenho observado.

É difícil não notar que o lançamento do Claude Opus 4.7 soa como uma promoção ao Claude Mythos Preview, o modelo da empresa que é tão poderoso que atualmente está convidando apenas organizações específicas para usá-lo. Os testes de benchmarking mostram que o Mythos supera todos os outros modelos principais em quase todos os testes em que participou. A Anthropic frequentemente compara suas novas versões com o Mythos, mesmo à custa de minimizar o destaque ao seu lançamento mais recente.

"Declaramos que manteríamos o lançamento do Claude Mythos Preview limitado e testaremos novas salvaguardas cibernéticas em modelos menos capazes primeiro. O Opus 4.7 é o primeiro modelo desse tipo: suas capacidades cibernéticas não são tão avançadas quanto as do Mythos Preview", afirmou a empresa em seu post no blog sobre a atualização do modelo.

Em outro momento, a empresa descreve o Opus 4.7 como "menos capaz do que nosso modelo mais poderoso, Claude Mythos Preview".

Segundo a Anthropic, o Claude Opus 4.7 estará disponível a partir de hoje em todos os produtos Claude e através da API da empresa, sem alteração de preço em relação aos modelos anteriores. Portanto, se você deseja utilizar uma versão mais acessível do produto, essa é a oportunidade ideal.

Tags: Inteligência Artificial, tecnologia, Modelos de IA, Engenharia, Análise de Desempenho Fonte: gizmodo.com