Deprecated: Calling get_class() without arguments is deprecated in /var/www/vhosts/localhost/html/wp-content/plugins/integracao-rd-station/includes/events/rdsm_plugin_uninstalled.php on line 12 Deprecated: Calling get_class() without arguments is deprecated in /var/www/vhosts/localhost/html/wp-content/plugins/integracao-rd-station/rdsm_assets_loader.php on line 14 Deprecated: Calling get_class() without arguments is deprecated in /var/www/vhosts/localhost/html/wp-content/plugins/integracao-rd-station/rdsm_assets_loader.php on line 15 Deprecated: Calling get_class() without arguments is deprecated in /var/www/vhosts/localhost/html/wp-content/plugins/integracao-rd-station/rdsm_assets_loader.php on line 16 Deprecated: Calling get_class() without arguments is deprecated in /var/www/vhosts/localhost/html/wp-content/plugins/integracao-rd-station/rdsm_assets_loader.php on line 17 Warning: Trying to access array offset on false in /var/www/vhosts/localhost/html/wp-content/plugins/schema/includes/integrations/amp.php on line 29 CEO da Anthropic quer “escanear o cérebro” dos modelos de IA até 2027 IT Forum
All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Negócios
Notícias

CEO da Anthropic quer “escanear o cérebro” dos modelos de IA até 2027

Imagem: Shutterstock

Dario Amodei, CEO da Anthropic, defendeu publicamente um objetivo ousado. Até 2027, sua empresa pretende ser capaz de detectar a maioria dos problemas em modelos de IA avançados, abrindo caminho para uma compreensão mais profunda de como essas tecnologias tomam decisões.

A proposta aparece em um ensaio publicado nesta quinta-feira (24), intitulado The Urgency of Interpretability, no qual Amodei alerta sobre os riscos de se implantar sistemas autônomos sem entender como eles operam.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Segundo o CEO, mesmo com os avanços recentes, a indústria ainda tem pouca clareza sobre os mecanismos internos desses modelos. Ele destaca que, enquanto modelos como o o3 e o o4-mini da OpenAI mostram melhor desempenho em algumas tarefas, também apresentam mais alucinações, e ninguém sabe ao certo o motivo. Amodei considera isso inaceitável diante do impacto potencial dessas tecnologias na economia, segurança nacional e sociedade em geral.

Leia também: IA generativa já domina trabalho corporativo, mas falta treinamento

Interpretabilidade mecanicista

A Anthropic tem se destacado pela aposta na chamada “interpretabilidade mecanicista”, um ramo da pesquisa em IA que busca desvendar, camada por camada, como os modelos chegam às suas conclusões.

Entre os avanços da empresa, está a identificação de circuitos responsáveis por tarefas específicas, como compreender relações geográficas entre cidades e estados dos EUA. No entanto, esses circuitos ainda são poucos perto dos milhões estimados.

O plano de longo prazo da Anthropic, segundo o TechCrunch, é realizar verdadeiros “scans cerebrais” de modelos de IA, analogia com exames de imagem como ressonâncias magnéticas, para mapear padrões de comportamento, como tendências à mentira ou busca de poder. Esse tipo de diagnóstico seria um requisito para lançar sistemas futuros, e pode levar de cinco a dez anos para se tornar realidade.

Amodei também sugeriu medidas para estimular a pesquisa em interpretabilidade, incluindo regulações leves que exijam maior transparência por parte das empresas quanto às práticas de segurança de seus modelos. Ele pediu ainda que governos imponham controles de exportação de chips para a China, como forma de evitar uma corrida global descontrolada por IA avançada.

Diferentemente de empresas como OpenAI e Google DeepMind, que priorizam performance e escala, a Anthropic diz focar em segurança e ética. A companhia, por exemplo, apoiou com ressalvas o projeto de lei SB 1047 na Califórnia, nos Estados Unidos, que propunha padrões de reporte de segurança para desenvolvedores de IA de fronteira.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Next IBM anuncia investimento de US$ 150 bilhões para impulsionar tecnologia e fabricação nos EUA »
Previous « Falha no WhatsApp para Windows permitia invasão usando imagens falsas
Share
Published by
Pamela Sousa
Tags: AnthropicIA
1 ano ago

    Related Post

  • Novos executivos da semana: Uncover, Tech for Humans, Diebold Nixdorf, Unico e mais
  • Se o Brasil não organizar seus dados culturais, outro fará isso por nós, alerta Jorge Brivilati
  • CBYK nomeia Maurício Matsuda como novo CEO

Recent Posts

  • Notícias

83% dos CIOs já adiaram projetos estratégicos por restrições de orçamento

A pressão por controle de custos vem alterando a dinâmica das áreas de tecnologia nas…

1 semana ago
  • Estudos

Fintechs brasileiras captam US$ 2,77 bi em 2025 e entram em nova fase de maturidade

O mercado brasileiro de fintechs passou por uma transformação no perfil dos investimentos em 2025.…

1 semana ago
  • Notícias

Sioux aposta em IA e dados para nova fase de experiências digitais e expande atuação para a Europa

O avanço da inteligência artificial e o uso estratégico de dados vêm transformando a forma…

1 semana ago
  • Artigos

Qual é o risco do desenvolvimento de software com IA?

Por Ramon Ribeiro Quase metade do código produzido por assistentes de inteligência artificial contém vulnerabilidades…

1 semana ago
  • Notícias

Se o Brasil não organizar seus dados culturais, outro fará isso por nós, alerta Jorge Brivilati

Peça a um modelo de inteligência artificial que gere a imagem de uma cidade, sem…

1 semana ago
  • Notícias

Novos executivos da semana: Uncover, Tech for Humans, Diebold Nixdorf, Unico e mais

O IT Forum apresenta, semanalmente, os novos executivos e os principais anúncios de contratações, promoções e mudanças…

1 semana ago
All Rights ReservedView Non-AMP Version
  • L