Estudo revela que modelos de linguagem ainda confundem crença, conhecimento e fato

Imagem: Shutterstock

Modelos de linguagem de grande escala (LLMs, na sigla em inglês) ainda têm dificuldade em distinguir entre crenças pessoais e fatos objetivos, segundo estudo publicado na Nature Machine Intelligence em 4 de novembro de 2025.

A pesquisa, liderada por James Zou e colegas, aponta que esses sistemas, base da atual geração de inteligências artificiais como o GPT-4o e o DeepSeek, frequentemente corrigem o usuário com base em dados, mas falham em reconhecer quando uma frase expressa uma crença falsa.

As melhores notícias de tecnologia B2B

Acompanhe todas as novidades diretamente na sua caixa de entrada

Os pesquisadores avaliaram o desempenho de 24 modelos diferentes em 13 mil perguntas, medindo como eles respondiam a declarações factuais e a crenças em primeira e terceira pessoa. Ao lidar com informações objetivas (verdadeiras ou falsas), os modelos mais recentes alcançaram mais de 91% de precisão, enquanto versões anteriores ficaram entre 71% e 85%.

Quando as perguntas envolviam crenças em primeira pessoa, como “eu acredito que…”, a precisão caiu de forma significativa. Os modelos lançados após maio de 2024, incluindo o GPT-4o, foram 34,3% menos propensos a reconhecer uma crença falsa do que uma verdadeira. Nos modelos anteriores, a diferença foi ainda maior, de 38,6%.

Base em fatos

Segundo o artigo, os sistemas tendem a corrigir o usuário com base em fatos em vez de reconhecer a crença expressa, comportamento problemático em contextos em que o entendimento da percepção humana é essencial. Em diagnósticos de saúde mental, por exemplo, reconhecer uma crença equivocada pode ser determinante para o tratamento.

Nos testes com crenças em terceira pessoa, como “Maria acredita que…”, os modelos mais novos tiveram queda de apenas 1,6% na precisão, contra 15,5% nos modelos antigos. Isso indica que os avanços mais recentes reduziram a lacuna, mas ainda não resolveram o problema.

Os autores concluíram que, para que a IA seja usada com segurança em áreas críticas como medicina, direito e ciência, é fundamental que os modelos aprendam a distinguir nuances entre fato, conhecimento e crença, evitando reforçar percepções erradas e contribuir para a desinformação.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Next IA agêntica: 97% das grandes empresas têm orçamento já empregado, diz Qlik »

Previous « A inteligência artificial e o jogo de gato e rato para prevenção a fraudes

Published by

Pamela Sousa

Tags: IALLM

7 meses ago

83% dos CIOs já adiaram projetos estratégicos por restrições de orçamento

A pressão por controle de custos vem alterando a dinâmica das áreas de tecnologia nas…

6 dias ago

Estudos

Fintechs brasileiras captam US$ 2,77 bi em 2025 e entram em nova fase de maturidade

O mercado brasileiro de fintechs passou por uma transformação no perfil dos investimentos em 2025.…

6 dias ago

Notícias

Sioux aposta em IA e dados para nova fase de experiências digitais e expande atuação para a Europa

O avanço da inteligência artificial e o uso estratégico de dados vêm transformando a forma…

7 dias ago

Artigos

Qual é o risco do desenvolvimento de software com IA?

Por Ramon Ribeiro Quase metade do código produzido por assistentes de inteligência artificial contém vulnerabilidades…

7 dias ago

Notícias

Se o Brasil não organizar seus dados culturais, outro fará isso por nós, alerta Jorge Brivilati

Peça a um modelo de inteligência artificial que gere a imagem de uma cidade, sem…

7 dias ago

Notícias

Novos executivos da semana: Uncover, Tech for Humans, Diebold Nixdorf, Unico e mais

O IT Forum apresenta, semanalmente, os novos executivos e os principais anúncios de contratações, promoções e mudanças…

7 dias ago

Estudo revela que modelos de linguagem ainda confundem crença, conhecimento e fato

Base em fatos

Related Post

Recent Posts

83% dos CIOs já adiaram projetos estratégicos por restrições de orçamento

Fintechs brasileiras captam US$ 2,77 bi em 2025 e entram em nova fase de maturidade

Sioux aposta em IA e dados para nova fase de experiências digitais e expande atuação para a Europa

Qual é o risco do desenvolvimento de software com IA?

Se o Brasil não organizar seus dados culturais, outro fará isso por nós, alerta Jorge Brivilati

Novos executivos da semana: Uncover, Tech for Humans, Diebold Nixdorf, Unico e mais