IT Forum Instituto Itaqui Distrito Itaqui IT Invest Grupo Itaqui

DeepSeek lança modelo de IA com “atenção esparsa” que reduz custos de API em até 50%

Nova arquitetura prioriza trechos relevantes de contexto e promete eficiência para operações de longa duração

Publicado: 30/09/2025 às 09:33

Redação

Leitura 2 minutos

A imagem mostra um smartphone com a tela exibindo o logotipo da "deepseek" sobre um fundo azul. O logotipo consiste em uma baleia estilizada em branco, acompanhada do nome da empresa em letras minúsculas. O aparelho tem um design moderno, com bordas finas e um entalhe na parte superior da tela. A imagem transmite uma estética tecnológica e minimalista, possivelmente relacionada a inteligência artificial, pesquisa ou desenvolvimento de software, microsoft

Imagem: Shutterstock

A chinesa DeepSeek apresentou nesta segunda-feira (29) o V3.2-exp, modelo experimental de inteligência artificial que adota a técnica Sparse Attention, capaz de cortar pela metade os custos de inferência em operações de longo contexto. O anúncio foi feito na plataforma Hugging Face, acompanhado de artigo científico publicado no GitHub, segundo o TechCrunch.

O sistema combina dois módulos: o “lightning indexer”, que seleciona trechos relevantes da janela de contexto, e o “fine-grained token selection system”, que filtra tokens específicos dentro desses trechos. Essa estratégia permite ao modelo lidar com grandes volumes de informação sem sobrecarregar servidores.

As melhores notícias de tecnologia B2B

Acompanhe todas as novidades diretamente na sua caixa de entrada

Testes preliminares indicam que o custo de uma chamada simples de API pode cair até 50% em cenários de contexto extenso. Como o modelo é de código aberto, pesquisadores independentes poderão validar os resultados em breve.

Contexto do avanço

A busca por eficiência no uso de modelos pré-treinados tem crescido, já que os custos de inferência, diferentes do custo de treinamento, se tornaram barreira para a escalabilidade de serviços de IA. O trabalho da DeepSeek mostra que ainda há espaço para otimizar a arquitetura transformer.

Fundada na China, a empresa ganhou notoriedade no início do ano com o modelo R1, treinado com uso intensivo de reinforcement learning a custos bem menores que concorrentes americanos. Embora não tenha causado a revolução esperada, a iniciativa posicionou a companhia como peça singular na corrida global da IA.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

DeepSeek
IA

Sobre o Autor

Redação

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Ver publicações deste autor

Notícias relacionadas

Ver mais

DeepSeek lança modelo de IA com “atenção esparsa” que reduz custos de API em até 50%

Contexto do avanço

Mais lidas

Novos executivos da semana: Uncover, Tech for Humans, Diebold Nixdorf, Unico e mais

IA muda entrevistas para programadores e força revisão dos processos de contratação

W-Aura busca parcerias

83% dos CIOs já adiaram projetos estratégicos por restrições de orçamento

Fintechs brasileiras captam US$ 2,77 bi em 2025 e entram em nova fase de maturidade

Sobre o Autor

Redação

Notícias relacionadas

83% dos CIOs já adiaram projetos estratégicos por restrições de orçamento

Fintechs brasileiras captam US$ 2,77 bi em 2025 e entram em nova fase de maturidade

Sioux aposta em IA e dados para nova fase de experiências digitais e expande atuação para a Europa

Qual é o risco do desenvolvimento de software com IA?