Logo do Tudo Notícias
  • Últimas notícias
  • Ofertas
Brasil
Mundo
Esportes
Política
Produtos e Reviews
Saúde
Tecnologia
Games
Logo
  • Página Inicial
  • Sobre
  • Política de Privacidade
  • Termos de uso
  • Contato
Redes sociais
  • Facebook TN
  • tudonoticiasoficial
  • tudonoticiasof
Editorias
  • Brasil
  • Cultura Pop
  • Economia
  • Educação
  • Entretenimento
  • Esportes
  • Estados
  • Games
  • Mundo
  • Política
  • Saúde
  • Tecnologia
Educação
  • Educação
  • Educação Infantil
  • ENEM
  • Ensino Básico
  • Ensino Superior
Games
  • Consoles e Hardware
  • Dicas e Tutoriais
  • Esports
  • Game Development
  • Indie Games
  • Indústria
  • Lançamentos
  • Mobile Games
  • PC e Mods
  • Promoções
  • Retrô e Nostalgia
  • Retro Gaming
  • Streaming
  • Xbox
Tecnologia
  • Blockchain
  • Cibersegurança
  • Ciência e Inovação
  • Cripto
  • Gadgets
  • Inovação
  • Inteligência Artificial
  • Redes Sociais
  • Robótica e Automação
  • Smartphones e Tablets
  • Software e Aplicativos
  • Startups
Brasil
  • Acidentes
  • Agronegócio
  • Cidades
  • Desastres
  • Homicídios
  • Indústria
  • Infraestrutura
  • Loteria
  • Policial
  • Regiões
  • Transportes
Entretenimento
  • BBB 25
  • Celebridades
  • Cinema
  • Documentários
  • Eventos
  • Música
  • Premiações
  • Streaming
  • Teatro
  • TV e Séries
  • Vida Social
Mundo
  • América Latina
  • Ásia
  • Conflitos
  • Crises
  • Cultura
  • Cultura Regional
  • Estados Unidos
  • Europa
  • Geek
  • Geopolítica
  • Negociações
  • Oriente Médio
  • Pandemias
  • Refugiados
  • Terrorismo
Cultura Pop
  • Animes & Mangás
  • Filmes
  • HQs
  • K-Pop
  • Séries
  • Streaming
Esportes
  • Artes Marciais
  • Atletismo
  • Automobilismo
  • Basquete
  • Boxe
  • Ciclismo
  • Esportes Radicais
  • Esports
  • Futebol
  • Futebol Internacional
  • Handebol
  • Jogos
  • Lutas
  • Natação
  • NBA
  • Seleção Brasileira
  • Tênis
  • UFC
  • Vôlei
Política
  • Campanhas
  • Congresso
  • Diplomacia
  • Eleições
  • Governos
  • Judiciário
  • Orçamento
  • Partidos
  • Política Econômica
  • Política Internacional
  • Reformas
  • Reformas Econômicas
Economia
  • Agronegócio
  • Bancos
  • Crédito
  • Economia
  • Economia Global
  • Endividamento
  • Exportação
  • Fintechs
  • Impostos
  • Indústria
  • Inovação
  • Investimentos
  • Política Econômica
  • Renda
  • Salários e Empregos
  • Tributação
  • Varejo
Estados
  • Acre
  • Alagoas
  • Amapá
  • Bahia
  • Goiás
  • Maranhão
  • Minas Gerais
  • Pará
  • Paraíba
  • Pernambuco
  • Piauí
  • Rio de Janeiro
  • Rio Grande do Sul
  • Rondônia
  • Roraima
  • São Paulo
  • Sergipe
Saúde
  • Bem-Estar
  • Cuidados com a Pele
  • Doenças
  • Doenças Raras
  • Estilo de Vida
  • Fitness
  • Longevidade
  • Medicina
  • Nutrição
  • Pesquisas
  • Saúde do Homem
  • Saúde Mental
  • Saúde Pública
  • Tratamentos
  • Vacinas

TudoNotícias

Tudo Notícias   © Copyright. Todos os direitos reservados.
Desenvolvido por
Powered by Yooh
  1. Capa
  2. Tecnologia
  3. Inteligência Artificial

Novo Teste de AGI Desafia Modelos de IA Modernos

Por Autor Redação TNRedação TN
25/03/2025 09h06

Em março de 2025, a Arc Prize Foundation, co-fundada pelo renomado pesquisador François Chollet, lançou um novo teste revolucionário para avaliar a inteligência geral de modelos de IA, denominado ARC-AGI-2. Este teste promete desafiar as capacidades dos principais modelos de IA, incluindo aqueles desenvolvidos por gigantes como Anthropic, Google e DeepSeek.

O ARC-AGI-2 foi cuidadosamente projetado para medir não apenas a eficácia dos modelos em resolver problemas, mas também sua capacidade de adaptação a novas situações de maneira eficiente. Ao contrário dos testes anteriores, os problemas visuais do ARC-AGI-2 exigem uma abordagem mais estratégica e menos dependente da força bruta computacional. Modelos conhecidos por seu raciocínio, como o o1-pro da OpenAI e o R1 da DeepSeek, tiveram um desempenho surpreendentemente baixo, com notas entre 1% e 1.3%. Já modelos reconhecidos por não serem raciocínio, como o GPT-4.5, Claude 3.7 Sonnet e Gemini 2.0 Flash, conseguiram pontuações em torno de 1%.

Para estabelecer um padrão de referência, mais de 400 participantes humanos se submeteram ao teste ARC-AGI-2, alcançando uma média de 60% de acerto. Este resultado põe em evidência a grande disparidade entre o desempenho humano e o dos modelos de IA contemporâneos. François Chollet, em suas declarações, afirmou que o ARC-AGI-2 apresenta uma medição mais precisa da verdadeira inteligência dos modelos de IA se comparado ao seu antecessor, o ARC-AGI-1, que foi superado em dezembro de 2024 pelo modelo o3 da OpenAI.

O surgimento do ARC-AGI-2 não apenas levanta questões sobre as limitações das IA atuais, mas também convida à reflexão sobre o futuro do desenvolvimento da inteligência artificial geral. À medida que os testes se tornam mais exigentes, a indústria pode ser impelida a reavaliar as metodologias de treino e a concepção de novos modelos que possam, de fato, competir com a inteligência humana em sua essência. A busca incessante por um AGI verdadeiramente funcional continua, e o ARC-AGI-2 pode ser um divisor de águas nesse processo.

CONTINUA DEPOIS DA PUBLICIDADE

Confira nossas ofertas

Amazon Echo Pop em oferta durante a Semana do Consumidor

Amazon Echo Pop em oferta durante a Semana do Consumidor

R$ 263,47

De R$ 379,00

Vendido na Amazon

Echo Dot 5ª geração | O Echo Dot com o melhor som já lançado | Cor Azul

Echo Dot 5ª geração | O Echo Dot com o melhor som já lançado | Cor Azul

R$ 359,10

De R$ 459,00

Vendido na Amazon

Tags: AGI, Modelos de IA, Desempenho Humano, tecnologia, Inteligência Artificial Fonte: techcrunch.com

Mais notícias

  • No novo livro, Steve Ramirez explora manipulação de memórias como tratamento para depressão. Reprodução: Retorno do item 11
    Ciência e Inovação

    Neurocientista Revela Como Manipular Memórias Pode Transformar Vidas

  • Perfil de Donald Trump no Truth Social em smartphone; Truth Predict permitirá apostas em eventos futuros. Reprodução: 'Retorno do item 11'
    Tecnologia e Inovação

    Trump Lança Plataforma de Apostas na Verdade Social

  • Celular exibe selo de verificação em chamadas, conforme regra da Anatel. Reprodução: Retorno do item 11
    Segurança Digital

    A partir de novembro, selo de verificação para chamadas de empresas

  • Arattai, app indiano, ganha popularidade na Índia, competição com o WhatsApp se intensifica. Legenda da imagem. Reprodução: Retorno do item 11
    Apps e Aplicativos

    Arattai: O novo rival indiano do WhatsApp em ascensão

  • Screenshot do TrumpRX: IA na arte como estética de grifters e fascistas. Reprodução: Retorno do item 11
    Apps e Aplicativos

    TrumpRx: A Nova Iniciativa Que Desafia a Saúde Pública