Google utiliza Gemini AI para aprimorar robôs em tarefas cotidianas

A DeepMind do Google está utilizando o Gemini AI para treinar robôs em navegação e execução de tarefas, avançando na interação entre humanos e máquina

Publicado: 12/07/2024 às 14:20

Redação

Leitura 2 minutos

Prédio corporativo do Google com fachada de vidro refletindo o céu e árvores ao redor. O logotipo colorido do Google está em destaque na parte superior do edifício (agentspace, IA generativa, carbono)

Imagem: Shutterstock

O Google anunciou que está utilizando o Gemini AI, desenvolvido pela DeepMind, para aprimorar a capacidade de seus robôs em ambientes complexos. A tecnologia permite que os robôs aprendam a navegar e a completar tarefas cotidianas de maneira mais eficiente. Pesquisadores da DeepMind obtiveram resultados promissores, com robôs usando o Gemini alcançando uma alta taxa de sucesso em diversas instruções em um amplo espaço operacional.

Um dos principais destaques do Gemini 1.5 Pro é sua capacidade de processar comandos em linguagem natural, permitindo que os robôs executem ações complexas com base em instruções verbais e visuais, conforme explicado pela equipe de robótica da DeepMind.

As melhores notícias de tecnologia B2B

Acompanhe todas as novidades diretamente na sua caixa de entrada

Os pesquisadores da DeepMind observaram resultados promissores durante os testes, com robôs equipados com o Gemini alcançando uma taxa de sucesso de 90% em mais de 50 instruções dadas em um espaço operacional de mais de 9.000 pés.

Além da navegação, o Gemini 1.5 Pro também demonstrou habilidades avançadas de planejamento, permitindo que os robôs não apenas sigam instruções simples, mas também antecipem e executem tarefas mais complexas, como buscar objetos específicos em um ambiente familiar.

Por exemplo, quando um usuário perguntou ao robô com várias latas de Coca-Cola em sua mesa se sua bebida favorita estava disponível, a equipe destacou que o Gemini permitiu que o robô determinasse a necessidade de ir até a geladeira, verificar a presença de Coca-Cola e informar o usuário sobre o resultado.

Apesar dos avanços, há desafios a superar, segundo a pesquisa, como o tempo necessário para processamento de instruções, que pode variar entre 10 e 30 segundos por comando. Ainda assim, a DeepMind planeja continuar investigando esses resultados e melhorando a eficiência operacional dos robôs equipados com Gemini AI.

*Com informações do The Verge

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!