All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Inteligência Artificial
Notícias

DeepSeek lança modelo de IA com “atenção esparsa” que reduz custos de API em até 50%

Imagem: Shutterstock

A chinesa DeepSeek apresentou nesta segunda-feira (29) o V3.2-exp, modelo experimental de inteligência artificial que adota a técnica Sparse Attention, capaz de cortar pela metade os custos de inferência em operações de longo contexto. O anúncio foi feito na plataforma Hugging Face, acompanhado de artigo científico publicado no GitHub, segundo o TechCrunch.

O sistema combina dois módulos: o “lightning indexer”, que seleciona trechos relevantes da janela de contexto, e o “fine-grained token selection system”, que filtra tokens específicos dentro desses trechos. Essa estratégia permite ao modelo lidar com grandes volumes de informação sem sobrecarregar servidores.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Testes preliminares indicam que o custo de uma chamada simples de API pode cair até 50% em cenários de contexto extenso. Como o modelo é de código aberto, pesquisadores independentes poderão validar os resultados em breve.

Leia também: Digibee vive momento de virada na era dos agentes de IA

Contexto do avanço

A busca por eficiência no uso de modelos pré-treinados tem crescido, já que os custos de inferência, diferentes do custo de treinamento, se tornaram barreira para a escalabilidade de serviços de IA. O trabalho da DeepSeek mostra que ainda há espaço para otimizar a arquitetura transformer.

Fundada na China, a empresa ganhou notoriedade no início do ano com o modelo R1, treinado com uso intensivo de reinforcement learning a custos bem menores que concorrentes americanos. Embora não tenha causado a revolução esperada, a iniciativa posicionou a companhia como peça singular na corrida global da IA.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Next YouTube paga US$ 24,5 milhões para encerrar processo de Trump sobre suspensão de conta »
Previous « Califórnia aprova primeira lei de segurança em IA nos EUA
Share
Published by
Pamela Sousa
Tags: DeepSeekIA
9 meses ago

    Related Post

  • Movida lança agente de IA no WhatsApp em parceria com a Meta e aposta em nova experiência de locação
  • Oracle nomeia Marcelle Paiva como nova VP de vendas, Data&AI Hub na América Latina
  • Mercado de IPOs de tecnologia ganha força com avanço da IA

Recent Posts

  • Notícias

Movida lança agente de IA no WhatsApp em parceria com a Meta e aposta em nova experiência de locação

A plataforma de locação de automóveis Movida lançou um agente de inteligência artificial integrado ao…

2 dias ago
  • Notícias

Oracle nomeia Marcelle Paiva como nova VP de vendas, Data&AI Hub na América Latina

A Oracle anunciou Marcelle Paiva como nova vice-presidente de vendas, Go-to-Market (GTM) e ecossistema para…

2 dias ago
  • Notícias

Mercado de IPOs de tecnologia ganha força com avanço da IA

O mercado de ofertas públicas iniciais voltou a ganhar tração em 2026, impulsionado principalmente pelo…

2 dias ago
  • Notícias

Oracle adiciona US$ 85 bilhões em contratos de IA e encerra trimestre com carteira recorde de US$ 638 bilhões

A Oracle encerrou o quarto trimestre e o ano fiscal de 2026 com resultados recordes,…

2 dias ago
  • Notícias

Disputa entre Anthropic e OpenAI expõe divergências sobre o futuro da inteligência artificial

A disputa entre Anthropic e OpenAI ganhou novos contornos e se tornou um dos principais…

2 dias ago
  • Notícias

Marketing B2B precisa se reorganizar para atender compradores mais autônomos, diz Forrester

As áreas de marketing B2B precisam rever sua estrutura operacional para acompanhar a transformação do…

2 dias ago
All Rights ReservedView Non-AMP Version
  • L