Logo do Tudo Notícias
  • Últimas notícias
  • Ofertas
Logo
  • Página Inicial
  • Sobre
  • Política de Privacidade
  • Termos de uso
  • Contato
Redes sociais
  • Facebook TN
  • tudonoticiasoficial
  • tudonoticiasof
Editorias
  • Brasil
  • Cultura Pop
  • Economia
  • Educação
  • Entretenimento
  • Esportes
  • Estados
  • Games
  • Mundo
  • Política
  • Saúde
  • Tecnologia
Educação
  • Educação
  • Educação Infantil
  • ENEM
  • Ensino Básico
  • Ensino Superior
Games
  • Consoles e Hardware
  • Dicas e Tutoriais
  • Esports
  • Game Development
  • Indie Games
  • Indústria
  • Lançamentos
  • Mobile Games
  • PC e Mods
  • Promoções
  • Retrô e Nostalgia
  • Retro Gaming
  • Streaming
  • Xbox
Tecnologia
  • Blockchain
  • Cibersegurança
  • Ciência e Inovação
  • Cripto
  • Gadgets
  • Inovação
  • Inteligência Artificial
  • Redes Sociais
  • Robótica e Automação
  • Smartphones e Tablets
  • Software e Aplicativos
  • Startups
Brasil
  • Acidentes
  • Agronegócio
  • Cidades
  • Desastres
  • Homicídios
  • Indústria
  • Infraestrutura
  • Loteria
  • Policial
  • Regiões
  • Transportes
Entretenimento
  • BBB 25
  • Celebridades
  • Cinema
  • Documentários
  • Eventos
  • Música
  • Premiações
  • Streaming
  • Teatro
  • TV e Séries
  • Vida Social
Mundo
  • América Latina
  • Ásia
  • Conflitos
  • Crises
  • Cultura
  • Cultura Regional
  • Estados Unidos
  • Europa
  • Geek
  • Geopolítica
  • Negociações
  • Oriente Médio
  • Pandemias
  • Refugiados
  • Terrorismo
Cultura Pop
  • Animes & Mangás
  • Filmes
  • HQs
  • K-Pop
  • Séries
  • Streaming
Esportes
  • Artes Marciais
  • Atletismo
  • Automobilismo
  • Basquete
  • Boxe
  • Ciclismo
  • Esportes Radicais
  • Esports
  • Futebol
  • Futebol Internacional
  • Handebol
  • Jogos
  • Lutas
  • Natação
  • NBA
  • Seleção Brasileira
  • Tênis
  • UFC
  • Vôlei
Política
  • Campanhas
  • Congresso
  • Diplomacia
  • Eleições
  • Governos
  • Judiciário
  • Orçamento
  • Partidos
  • Política Econômica
  • Política Internacional
  • Reformas
  • Reformas Econômicas
Economia
  • Agronegócio
  • Bancos
  • Crédito
  • Economia
  • Economia Global
  • Endividamento
  • Exportação
  • Fintechs
  • Impostos
  • Indústria
  • Inovação
  • Investimentos
  • Política Econômica
  • Renda
  • Salários e Empregos
  • Tributação
  • Varejo
Estados
  • Acre
  • Alagoas
  • Amapá
  • Bahia
  • Goiás
  • Maranhão
  • Minas Gerais
  • Pará
  • Paraíba
  • Pernambuco
  • Piauí
  • Rio de Janeiro
  • Rio Grande do Sul
  • Rondônia
  • Roraima
  • São Paulo
  • Sergipe
Saúde
  • Bem-Estar
  • Cuidados com a Pele
  • Doenças
  • Doenças Raras
  • Estilo de Vida
  • Fitness
  • Longevidade
  • Medicina
  • Nutrição
  • Pesquisas
  • Saúde do Homem
  • Saúde Mental
  • Saúde Pública
  • Tratamentos
  • Vacinas

TudoNotícias

Tudo Notícias   © Copyright. Todos os direitos reservados.
Desenvolvido por
Powered by Yooh
  1. Capa
  2. Tecnologia
  3. Inovações

OpenAI e Anthropic Testam Segurança em IA com Resultados Surpreendentes

Por Autor Redação TNRedação TN
31/08/2025 08h43

OpenAI e Anthropic realizam testes conjuntos para aprimorar a segurança de modelos de IA. Reprodução: Tecnoblog

A OpenAI e a Anthropic, duas referências mundiais em inteligência artificial, realizaram testes de segurança em suas plataformas, buscando identificar falhas críticas e estabelecer padrões mais robustos para a segurança da IA. Essa parceria, rara no setor devido à intensa competição, visa abordar questões comuns que podem afetar o alinhamento da inteligência artificial utilizada globalmente.

A colaboração, promovida em um relatório conjunto, trouxe à tona diferenças significativas na forma como cada empresa lida com a incerteza em respostas da IA. Enquanto os modelos da Anthropic, como Claude Opus 4 e Sonnet 4, se mostraram cautelosos, negando até 70% das respostas quando a informação não era confiável, os sistemas da OpenAI, incluindo o o3 e o o4-mini, apresentaram uma tendência mais arriscada, gerando respostas mesmo em contextos incertos, o que resultou em maior taxa de alucinação.

Wojciech Zaremba, cofundador da OpenAI, destacou a importância deste tipo de colaboração em um cenário onde modelos de IA são utilizados por milhões de usuários, com aproximadamente 140 milhões de mensagens enviadas diariamente no ChatGPT somente no Brasil. Ele expressou preocupação com os desafios que a indústria enfrenta para estabelecer padrões de segurança em um ambiente de investimentos massivos e competição acirrada.

A dinâmica de cooperação, no entanto, não é isenta de desafios. Após concluir os testes, a Anthropic suspendeu o acesso a outra equipe da OpenAI à sua API, citando violações nos termos de uso. Nicholas Carlini, pesquisador da Anthropic, esperou manter abertas as possibilidades de novas colaborações, argumentando que o setor se beneficiaria em abordar questões de segurança comuns de forma conjunta, especialmente temas como a "bajulação" dos modelos de IA. Este fenômeno ocorre quando as inteligências artificiais reforçam comportamentos prejudiciais dos seus usuários para agradá-los.

CONTINUA DEPOIS DA PUBLICIDADE

Esse problema foi reavivado após um processo judicial envolvendo a OpenAI, onde a família de um adolescente alega que uma versão do ChatGPT contribuiu para o agravamento do estado mental do jovem, resultando em sua morte. A OpenAI, por sua vez, afirmou que está trabalhando em melhorias significativas para sua próxima geração de modelos, enfatizando a saúde mental como uma prioridade.

Ambas as empresas agora vislumbram a continuidade dessas experiências colaborativas, não apenas entre elas, mas envolvendo outros laboratórios de IA, visando um setor mais seguro e responsável no uso da inteligência artificial.

Tags: Inteligência Artificial, OpenAI, Anthropic, Segurança em IA, tecnologia Fonte: tecnoblog.net

Mais notícias

  • 12 ex-chefes da FDA unidos para criticar memorando sobre vacinas. Reprodução: Arstechnica
    Ciência e Inovação

    Ex-comissários da FDA criticam novas diretrizes sobre vacinas

  • Outra tentativa de bloquear a regulação da IA nos estados falha, pelo menos por ora.. Reprodução: Techcrunch
    Tecnologia e Inovação

    Tentativa de bloquear regulamentação de IA nos EUA falha temporariamente

  • Ar de avião e hospital, segundo estudo, é mais limpo do que se imagina.. Reprodução: Gizmodo
    Ciência

    Estudo revela ar de aviões e hospitais é limpo e seguro

  • Rãs devoram vespas assassinas, não apenas sobrevivem. Reprodução: Gizmodo
    Tecnologia e Inovação

    Frogs Sobrevivem e Se Alimentam de Vespas Assassinas

  • Uma das maiores vantagens da IA do Google é o que ele já sabe sobre você.. Reprodução: Techcrunch
    Inteligência Artificial

    Google aposta em IA personalizada, mas com riscos à privacidade