Lançamento do Modelo Claude Opus 4.7 da Anthropic

A Anthropic anunciou nesta quinta-feira o lançamento de seu mais recente modelo de inteligência artificial, o Claude Opus 4.7. A empresa se refere a ele como uma "melhoria significativa" em relação ao Opus 4.6, embora com capacidades "menos abrangentes" em comparação ao modelo altamente avançado e ainda não liberado ao público, o Claude Mythos Preview.

Esse novo modelo parece ser uma reafirmação das competências que os modelos da Anthropic já dominam. Segundo a empresa, a nova versão do seu produto principal apresenta melhorias notáveis em desempenho em áreas como programação, engenharia e tarefas complexas envolvendo múltiplas etapas. O Claude Opus 4.7 é descrito como "mais minucioso e consistente em trabalhos difíceis, com resultados melhorados em conhecimento profissional".

Assim como em todos os lançamentos de novos modelos, o Claude Opus 4.7 é acompanhado por um novo conjunto de testes de referência para demonstrar suas capacidades. Este modelo voltou a conquistar a liderança no que se refere à programação agentiva entre os modelos disponíveis publicamente, obtendo 64,3% nos testes SWE-bench Pro e SWE-bench Verified, que avaliam a habilidade dos modelos em lidar com tarefas de engenharia complexas.

Além disso, o Claude Opus 4.7 também superou os padrões do 4.6 em uso de computador de forma autônoma (isto é, navegar por um sistema operacional para realizar tarefas) e no raciocínio em nível de pós-graduação, entre outras categorias. Entretanto, vale ressaltar que o Claude Opus 4.7 apresenta uma leve queda em relação ao Opus 4.6 em reprodução de vulnerabilidades de cibersegurança. O novo modelo obteve 73,1% em testes de benchmarking, comparado ao 73,8% da versão anterior.

CONTINUA DEPOIS DA PUBLICIDADE

De acordo com a Anthropic, o novo modelo introduz "safeguardes que detectam e bloqueiam automaticamente pedidos que indicam usos proibidos ou de alto risco em cibersegurança", o que pode ter influenciado a leve queda de desempenho observado.

É difícil não notar que o lançamento do Claude Opus 4.7 soa como uma promoção ao Claude Mythos Preview, o modelo da empresa que é tão poderoso que atualmente está convidando apenas organizações específicas para usá-lo. Os testes de benchmarking mostram que o Mythos supera todos os outros modelos principais em quase todos os testes em que participou. A Anthropic frequentemente compara suas novas versões com o Mythos, mesmo à custa de minimizar o destaque ao seu lançamento mais recente.

"Declaramos que manteríamos o lançamento do Claude Mythos Preview limitado e testaremos novas salvaguardas cibernéticas em modelos menos capazes primeiro. O Opus 4.7 é o primeiro modelo desse tipo: suas capacidades cibernéticas não são tão avançadas quanto as do Mythos Preview", afirmou a empresa em seu post no blog sobre a atualização do modelo.

Em outro momento, a empresa descreve o Opus 4.7 como "menos capaz do que nosso modelo mais poderoso, Claude Mythos Preview".

Segundo a Anthropic, o Claude Opus 4.7 estará disponível a partir de hoje em todos os produtos Claude e através da API da empresa, sem alteração de preço em relação aos modelos anteriores. Portanto, se você deseja utilizar uma versão mais acessível do produto, essa é a oportunidade ideal.

Lançamento do Modelo Claude Opus 4.7 da Anthropic

Lançamento do Modelo Claude Opus 4.7 da Anthropic

Blue Origin enfrenta revés com explosão do New Glenn em Cape Canaveral

Microsoft provoca novas inovações em hardware Surface e promete ‘uma nova era de PC’

Como a Ferrari errou no design de seu primeiro EV

Sony 1000X The Collexion: Um Luxo Para Fãs da Marca

BMW usará robôs humanoides em fábricas pela primeira vez