Logo do Tudo Notícias
  • Últimas notícias
  • Ofertas
Brasil
Mundo
Esportes
Política
Produtos e Reviews
Saúde
Tecnologia
Games
Logo
  • Página Inicial
  • Sobre
  • Política de Privacidade
  • Termos de uso
  • Contato
Redes sociais
  • Facebook TN
  • tudonoticiasoficial
  • tudonoticiasof
Editorias
  • Brasil
  • Cultura Pop
  • Economia
  • Educação
  • Entretenimento
  • Esportes
  • Estados
  • Games
  • Mundo
  • Política
  • Saúde
  • Tecnologia
Educação
  • Educação
  • Educação Infantil
  • Ensino Básico
  • Ensino Superior
Games
  • Consoles e Hardware
  • Dicas e Tutoriais
  • Esports
  • Game Development
  • Indie Games
  • Indústria
  • Lançamentos
  • Mobile Games
  • Promoções
  • Retrô e Nostalgia
  • Retro Gaming
  • Streaming
  • Xbox
Tecnologia
  • Blockchain
  • Cibersegurança
  • Ciência e Inovação
  • Cripto
  • Gadgets
  • Inovação
  • Inteligência Artificial
  • Redes Sociais
  • Robótica e Automação
  • Smartphones e Tablets
  • Software e Aplicativos
  • Startups
Brasil
  • Acidentes
  • Agronegócio
  • Cidades
  • Desastres
  • Homicídios
  • Indústria
  • Infraestrutura
  • Loteria
  • Policial
  • Regiões
  • Transportes
Entretenimento
  • BBB 25
  • Celebridades
  • Cinema
  • Documentários
  • Eventos
  • Música
  • Premiações
  • Streaming
  • Teatro
  • TV e Séries
  • Vida Social
Mundo
  • América Latina
  • Ásia
  • Conflitos
  • Crises
  • Cultura
  • Cultura Regional
  • Estados Unidos
  • Europa
  • Geek
  • Geopolítica
  • Negociações
  • Oriente Médio
  • Pandemias
  • Refugiados
  • Terrorismo
Cultura Pop
  • Animes & Mangás
  • Filmes
  • HQs
  • K-Pop
  • Séries
  • Streaming
Esportes
  • Artes Marciais
  • Atletismo
  • Automobilismo
  • Basquete
  • Boxe
  • Ciclismo
  • Esportes Radicais
  • Esports
  • Futebol
  • Futebol Internacional
  • Handebol
  • Jogos
  • Lutas
  • Natação
  • NBA
  • Seleção Brasileira
  • Tênis
  • UFC
  • Vôlei
Política
  • Campanhas
  • Congresso
  • Diplomacia
  • Eleições
  • Governos
  • Judiciário
  • Orçamento
  • Partidos
  • Política Econômica
  • Política Internacional
  • Reformas
  • Reformas Econômicas
Economia
  • Agronegócio
  • Bancos
  • Crédito
  • Economia
  • Economia Global
  • Endividamento
  • Exportação
  • Fintechs
  • Impostos
  • Indústria
  • Inovação
  • Investimentos
  • Política Econômica
  • Renda
  • Salários e Empregos
  • Tributação
  • Varejo
Estados
  • Acre
  • Alagoas
  • Amapá
  • Bahia
  • Goiás
  • Maranhão
  • Minas Gerais
  • Pará
  • Paraíba
  • Pernambuco
  • Piauí
  • Rio de Janeiro
  • Rio Grande do Sul
  • Rondônia
  • Roraima
  • São Paulo
  • Sergipe
Saúde
  • Bem-Estar
  • Doenças
  • Doenças Raras
  • Estilo de Vida
  • Fitness
  • Longevidade
  • Medicina
  • Nutrição
  • Pesquisas
  • Saúde Mental
  • Saúde Pública
  • Tratamentos
  • Vacinas

TudoNotícias

Tudo Notícias   © Copyright. Todos os direitos reservados.
Desenvolvido por
Powered by Yooh
  1. Capa
  2. Tecnologia
  3. Inovações

OpenAI e Anthropic Testam Segurança em IA com Resultados Surpreendentes

Por Autor Redação TNRedação TN
31/08/2025 08h43

OpenAI e Anthropic realizam testes conjuntos para aprimorar a segurança de modelos de IA. Reprodução: Tecnoblog

A OpenAI e a Anthropic, duas referências mundiais em inteligência artificial, realizaram testes de segurança em suas plataformas, buscando identificar falhas críticas e estabelecer padrões mais robustos para a segurança da IA. Essa parceria, rara no setor devido à intensa competição, visa abordar questões comuns que podem afetar o alinhamento da inteligência artificial utilizada globalmente.

A colaboração, promovida em um relatório conjunto, trouxe à tona diferenças significativas na forma como cada empresa lida com a incerteza em respostas da IA. Enquanto os modelos da Anthropic, como Claude Opus 4 e Sonnet 4, se mostraram cautelosos, negando até 70% das respostas quando a informação não era confiável, os sistemas da OpenAI, incluindo o o3 e o o4-mini, apresentaram uma tendência mais arriscada, gerando respostas mesmo em contextos incertos, o que resultou em maior taxa de alucinação.

Wojciech Zaremba, cofundador da OpenAI, destacou a importância deste tipo de colaboração em um cenário onde modelos de IA são utilizados por milhões de usuários, com aproximadamente 140 milhões de mensagens enviadas diariamente no ChatGPT somente no Brasil. Ele expressou preocupação com os desafios que a indústria enfrenta para estabelecer padrões de segurança em um ambiente de investimentos massivos e competição acirrada.

A dinâmica de cooperação, no entanto, não é isenta de desafios. Após concluir os testes, a Anthropic suspendeu o acesso a outra equipe da OpenAI à sua API, citando violações nos termos de uso. Nicholas Carlini, pesquisador da Anthropic, esperou manter abertas as possibilidades de novas colaborações, argumentando que o setor se beneficiaria em abordar questões de segurança comuns de forma conjunta, especialmente temas como a "bajulação" dos modelos de IA. Este fenômeno ocorre quando as inteligências artificiais reforçam comportamentos prejudiciais dos seus usuários para agradá-los.

CONTINUA DEPOIS DA PUBLICIDADE

Confira nossas ofertas

Amazon Echo Pop em oferta durante a Semana do Consumidor

Amazon Echo Pop em oferta durante a Semana do Consumidor

R$ 263,47

De R$ 379,00

Vendido na Amazon

Echo Dot 5ª geração | O Echo Dot com o melhor som já lançado | Cor Azul

Echo Dot 5ª geração | O Echo Dot com o melhor som já lançado | Cor Azul

R$ 359,10

De R$ 459,00

Vendido na Amazon

Esse problema foi reavivado após um processo judicial envolvendo a OpenAI, onde a família de um adolescente alega que uma versão do ChatGPT contribuiu para o agravamento do estado mental do jovem, resultando em sua morte. A OpenAI, por sua vez, afirmou que está trabalhando em melhorias significativas para sua próxima geração de modelos, enfatizando a saúde mental como uma prioridade.

Ambas as empresas agora vislumbram a continuidade dessas experiências colaborativas, não apenas entre elas, mas envolvendo outros laboratórios de IA, visando um setor mais seguro e responsável no uso da inteligência artificial.

Tags: Inteligência Artificial, OpenAI, Anthropic, Segurança em IA, tecnologia Fonte: tecnoblog.net

Mais notícias

  • Imagem de 'Tron: Legacy' com traje luminoso; filmes originais ganham reedição em Ultra 4K neste setembro. Legenda da imagem. Reprodução: Gizmodo
    Lançamentos

    Tron ganha remasters Ultra 4K e Ares chega aos cinemas

  • WhatsApp bloqueado no Catar; iPhone enfrenta problema e VPN é alternativa recomendada. Legenda da imagem. Reprodução: Gizmodo
    Cibersegurança

    WhatsApp corrige falha zero-click que mira usuários Apple

  • Vivaldi rejeita o uso de IA para priorizar autonomia e privacidade dos usuários no navegador. Reprodução: Tecnoblog
    Inovações

    Vivaldi Rejeita Inteligência Artificial e Valoriza Navegação Ativa

  • Gizmodo cobre as novidades da IFA 2025, em Berlim. Reprodução: Gizmodo
    Inovações

    IFA 2025: Novidades e Lançamentos de Tecnologia em Berlim

  • Samsung alcança 2 bilhões de smartphones produzidos no Vietnã, consolidando sua base de fabricação global.; Reprodução: Technoblog
    Inovações

    Samsung Produz 2 Bilhões de Smartphones no Vietnã