Pesquisadores criam alternativa ao modelo de ‘raciocínio’ da OpenAI por menos de US$ 50

Imagem: Shutterstock

Pesquisadores das universidades de Stanford e Washington, nos Estados Unidos, conseguiram treinar um modelo de inteligência artificial (IA) focado em raciocínio gastando menos de US$ 50 em créditos de computação em nuvem, segundo uma reportagem do The Next Web.

Batizado de s1, o modelo apresentou um desempenho semelhante a sistemas avançados como o o1, da OpenAI, e o R1, da DeepSeek, em testes que avaliam habilidades matemáticas e de programação. O código e os dados usados no treinamento estão disponíveis no GitHub.

As melhores notícias de tecnologia B2B

Acompanhe todas as novidades diretamente na sua caixa de entrada

Como o modelo foi criado

Os pesquisadores partiram de um modelo-base já existente e o refinaram utilizando distilação, técnica que permite extrair habilidades de raciocínio de outro modelo de IA treinado, com base em suas respostas. No caso do s1, o conhecimento foi extraído do Gemini 2.0 Flash Thinking Experimental, da Google.

Esse mesmo método já foi usado recentemente por pesquisadores de Berkeley, que conseguiram criar um modelo similar por aproximadamente US$ 450.

A possibilidade de reproduzir funcionalidades avançadas com um investimento tão baixo levanta questões sobre a comoditização da IA. Afinal, se um grupo de pesquisadores pode replicar um modelo que custou milhões para ser desenvolvido com poucos recursos, qual será o diferencial competitivo das grandes empresas?

O que diz a indústria

Grandes laboratórios de IA estariam incomodados com essa nova tendência. A OpenAI, por exemplo, já acusou a DeepSeek de coletar dados de sua API de maneira inadequada para treinar seus próprios modelos usando distilação.

O estudo sobre o s1 mostra que modelos de raciocínio podem ser refinados com pequenos conjuntos de dados e utilizando um processo chamado supervised fine-tuning (SFT).

Diferentemente do aprendizado por reforço em larga escala, empregado pela DeepSeek para treinar o R1, o SFT exige menos investimento computacional.

Embora o Gemini 2.0 Flash Thinking Experimental seja acessível gratuitamente via Google AI Studio, há restrições sobre seu uso, como limites diários e a proibição de engenharia reversa para criar produtos concorrentes.

IA acessível para todos?

O s1 foi baseado em um modelo de código aberto desenvolvido pelo laboratório de IA chinês Qwen, pertencente ao grupo Alibaba. Para treiná-lo, os pesquisadores criaram um conjunto de apenas 1.000 perguntas cuidadosamente selecionadas, combinadas com respostas e o “processo de pensamento” por trás delas, obtido do Gemini 2.0 Flash Thinking Experimental.

O treinamento durou menos de 30 minutos em 16 GPUs Nvidia H100, e segundo um dos pesquisadores envolvidos no projeto, o custo para rodar esse treinamento hoje seria de apenas US$ 20.

Um detalhe interessante foi a estratégia usada para aumentar a precisão do s1: os pesquisadores adicionaram a palavra “wait” (“espere”) no raciocínio do modelo, o que permitiu que ele revisasse suas respostas antes de entregá-las.

Futuro da inovação em IA

Gigantes como Meta, Google e Microsoft planejam investir centenas de bilhões de dólares em infraestrutura de IA nos próximos anos, visando aprimorar a próxima geração de modelos. No entanto, abordagens como a distilação mostram que não é sempre necessário um investimento massivo para alcançar avanços significativos.

Embora esse método não crie modelos radicalmente superiores aos atuais, ele demonstra que a IA está se tornando mais acessível e que o futuro da inovação pode estar tanto nos grandes laboratórios quanto nas mãos de pesquisadores independentes.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Next EUA indiciam engenheiro chinês por suposto roubo de tecnologia de IA do Google »

Previous « Chefe de força-tarefa tecnológica DOGE renuncia ao cargo

Published by

Pamela Sousa

Tags: IAopenai

1 ano ago

Com a IA, setor de saúde vive revolução que o marketing digital proporcionou há dez anos

por Eduardo Barros A transformação da inteligência artificial (IA) nos negócios lembra o que aconteceu…

3 dias ago

Inovação

Snowflake registra crescimento de 33% na receita e eleva projeções para o ano fiscal de 2027

A Snowflake anunciou os resultados financeiros do primeiro trimestre do ano fiscal de 2027, encerrado…

4 dias ago

Notícias

UE ordena que Meta reabra WhatsApp a chatbots rivais

A Comissão Europeia determinou que a Meta reestabeleça o acesso de assistentes de inteligência artificial…

4 dias ago

Notícias

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

As negociações com as ações da SpaceX têm início nesta quinta-feira, 12, em uma oferta…

4 dias ago

Notícias

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

A ascensão dos agentes de inteligência artificial (IA) está criando uma oportunidade para plataformas de…

4 dias ago

Notícias

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação

Continuam abertas as inscrições para o prêmio Executivo de TI do Ano 2026. A iniciativa,…

4 dias ago

Pesquisadores criam alternativa ao modelo de ‘raciocínio’ da OpenAI por menos de US$ 50

Como o modelo foi criado

O que diz a indústria

IA acessível para todos?

Futuro da inovação em IA

Related Post

Recent Posts

Com a IA, setor de saúde vive revolução que o marketing digital proporcionou há dez anos

Snowflake registra crescimento de 33% na receita e eleva projeções para o ano fiscal de 2027

UE ordena que Meta reabra WhatsApp a chatbots rivais

IPO da SpaceX chega ao mercado como aposta de US$ 1,75 trilhão em IA, não em foguetes

IA muda jornada de compra e devolve relevância aos sites de avaliação B2B, diz Forrester

Prêmio Executivo de TI do Ano 2026: conheça os critérios de avaliação