All Rights ReservedView Non-AMP Version
IT Forum
  • Homepage
  • Inteligência Artificial
Notícias

DeepSeek cria método que promete turbinar a “memória” da IA

Imagem: Shutterstock

A startup chinesa DeepSeek apresentou uma nova técnica que pode transformar a forma como os modelos de inteligência artificial armazenam e lembram informações. Em vez de processar o texto em pequenas unidades chamadas tokens, como fazem sistemas tradicionais, a empresa passou a converter dados escritos em imagens, o que permite compactar muito mais conteúdo em menos espaço computacional.

O avanço foi detalhado em um artigo técnico divulgado na última semana e analisado pela MIT Technology Review. O estudo mostra que o novo modelo de reconhecimento óptico de caracteres (OCR) da DeepSeek, voltado a extrair e converter textos de imagens, foi usado como base para testar essa nova arquitetura de “memória visual”.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Segundo os pesquisadores, armazenar informações como imagens, em vez de apenas texto fragmentado, ajuda o modelo a “lembrar” mais dados sem exigir o mesmo volume de processamento e armazenamento. Essa mudança pode aliviar um dos maiores gargalos da IA moderna: o custo energético e financeiro para manter o contexto de conversas longas com usuários, o que leva ao fenômeno conhecido como “context rot” (quando a IA esquece informações anteriores).

Leia também: Francieli Pietsch, da BBM Logística: “é preciso ser incansável”

O sistema também utiliza um mecanismo de compressão em camadas, que funciona de forma semelhante à memória humana: conteúdos mais antigos ou menos relevantes são guardados em uma versão mais difusa, economizando espaço, mas permanecendo acessíveis caso sejam necessários novamente.

Por que essa novidade importa?

A proposta chamou atenção de nomes de peso no setor. Andrej Karpathy, ex-líder de IA da Tesla e cofundador da OpenAI, elogiou a inovação nas redes sociais, dizendo que “as imagens podem ser uma forma mais eficiente de entrada para modelos de linguagem”, já que o uso de tokens textuais é “desperdiçador”.

Especialistas ouvidos pela reportagem destacaram que a pesquisa abre uma nova frente de experimentação para o campo da IA. Manling Li, professora de ciência da computação da Northwestern University, afirmou que “embora o uso de tokens visuais não seja totalmente inédito, é a primeira vez que se prova que o método realmente pode funcionar em larga escala”. Já o pesquisador Zihan Wang, também da Northwestern, destacou que a abordagem pode tornar os agentes de IA mais úteis e capazes de reter informações em interações contínuas.

Além de aprimorar a memória, a técnica pode gerar novos conjuntos de dados para treinar modelos, um recurso valioso em um momento de escassez de material de qualidade para alimentar sistemas de IA. O estudo indica que o sistema da DeepSeek é capaz de produzir mais de 200 mil páginas de dados por dia em uma única GPU, ampliando de forma significativa a base de treinamento disponível.

Apesar dos resultados promissores, a própria equipe da DeepSeek reconhece que a tecnologia ainda está em fase inicial. O próximo passo será testar o uso das imagens não apenas para memória, mas também para raciocínio e aprendizado, aproximando o funcionamento dos modelos de IA de um processo cognitivo mais humano, que sabe distinguir entre o que é importante e o que pode ser esquecido.

Sediada em Hangzhou, na China, a DeepSeek tem se destacado como um dos nomes mais inovadores do país em pesquisa de IA. No início de 2025, a empresa já havia surpreendido o setor com o lançamento do DeepSeek-R1, um modelo de raciocínio aberto que rivalizou com sistemas ocidentais de ponta, utilizando muito menos poder computacional.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Next Após aprovação na Câmara, Brasscom defende PL que desonera dispositivos IoT até 2030 »
Previous « SEK conclui compra da Netbr com aprovação do Cade
Share
Published by
Pamela Sousa
Tags: DeepSeekIA
7 meses ago

    Related Post

  • Com a IA, setor de saúde vive revolução que o marketing digital proporcionou há dez anos
  • UE ordena que Meta reabra WhatsApp a chatbots rivais
  • IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

Recent Posts

  • Artigos

Com a IA, setor de saúde vive revolução que o marketing digital proporcionou há dez anos

por Eduardo Barros A transformação da inteligência artificial (IA) nos negócios lembra o que aconteceu…

1 hora ago
  • Inovação

Snowflake registra crescimento de 33% na receita e eleva projeções para o ano fiscal de 2027

A Snowflake anunciou os resultados financeiros do primeiro trimestre do ano fiscal de 2027, encerrado…

13 horas ago
  • Notícias

UE ordena que Meta reabra WhatsApp a chatbots rivais

A Comissão Europeia determinou que a Meta reestabeleça o acesso de assistentes de inteligência artificial…

16 horas ago
  • Notícias

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

As negociações com as ações da SpaceX têm início nesta quinta-feira, 12, em uma oferta…

17 horas ago
  • Notícias

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

A ascensão dos agentes de inteligência artificial (IA) está criando uma oportunidade para plataformas de…

17 horas ago
  • Notícias

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação

Continuam abertas as inscrições para o prêmio Executivo de TI do Ano 2026. A iniciativa,…

18 horas ago
All Rights ReservedView Non-AMP Version
  • L