Google utiliza Gemini AI para aprimorar robôs em tarefas cotidianas

A DeepMind do Google está utilizando o Gemini AI para treinar robôs em navegação e execução de tarefas, avançando na interação entre humanos e máquina

Publicado:

Leitura 2 minutos

Prédio corporativo do Google com fachada de vidro refletindo o céu e árvores ao redor. O logotipo colorido do Google está em destaque na parte superior do edifício (agentspace, IA generativa, carbono)
Imagem: Shutterstock

O Google anunciou que está utilizando o Gemini AI, desenvolvido pela DeepMind, para aprimorar a capacidade de seus robôs em ambientes complexos. A tecnologia permite que os robôs aprendam a navegar e a completar tarefas cotidianas de maneira mais eficiente. Pesquisadores da DeepMind obtiveram resultados promissores, com robôs usando o Gemini alcançando uma alta taxa de sucesso em diversas instruções em um amplo espaço operacional.

Um dos principais destaques do Gemini 1.5 Pro é sua capacidade de processar comandos em linguagem natural, permitindo que os robôs executem ações complexas com base em instruções verbais e visuais, conforme explicado pela equipe de robótica da DeepMind.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

Leia também: Educação em tecnologia: 3 programas que geram impacto social 

Os pesquisadores da DeepMind observaram resultados promissores durante os testes, com robôs equipados com o Gemini alcançando uma taxa de sucesso de 90% em mais de 50 instruções dadas em um espaço operacional de mais de 9.000 pés.

Além da navegação, o Gemini 1.5 Pro também demonstrou habilidades avançadas de planejamento, permitindo que os robôs não apenas sigam instruções simples, mas também antecipem e executem tarefas mais complexas, como buscar objetos específicos em um ambiente familiar.

Por exemplo, quando um usuário perguntou ao robô com várias latas de Coca-Cola em sua mesa se sua bebida favorita estava disponível, a equipe destacou que o Gemini permitiu que o robô determinasse a necessidade de ir até a geladeira, verificar a presença de Coca-Cola e informar o usuário sobre o resultado.

Apesar dos avanços, há desafios a superar, segundo a pesquisa, como o tempo necessário para processamento de instruções, que pode variar entre 10 e 30 segundos por comando. Ainda assim, a DeepMind planeja continuar investigando esses resultados e melhorando a eficiência operacional dos robôs equipados com Gemini AI.

*Com informações do The Verge

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!   

Sobre o Autor

A redação contempla textos de caráter informativo produzidos pela equipe de jornalistas do IT Forum.

Ver publicações deste autor

Notícias relacionadas

Ver mais Seta para direita