Corrida por modelos mais avançados compromete estabilidade da IA, diz pesquisadora do MIT

Ana Trišović, do MIT CSAIL, defende código aberto como proteção contra atualizações que comprometem pesquisa e dados corporativos

Publicado:

Leitura 5 minutos

Ana Trišović, cientista de pesquisa do MIT CSAIL. Imagem: Divulgação/StartSe. IA
Ana Trišović, cientista de pesquisa do MIT CSAIL. Imagem: Divulgação/StartSe

“Ninguém pode introduzir uma atualização silenciosa e comprometer todo o seu fluxo de dados.” A afirmação é de Ana Trišović, cientista de pesquisa do MIT CSAIL, o Laboratório de Ciência da Computação e Inteligência Artificial do Instituto de Tecnologia de Massachusetts, em entrevista ao IT Forum nesta quinta-feira (14), durante o AI Festival, evento promovido pela StartSe. Para Ana, é também o risco menos debatido da crescente dependência corporativa de modelos proprietários de inteligência artificial (IA).

A esteira que nunca para

Ana cunhou uma expressão para descrever o ritmo atual de evolução dos modelos de inteligência artificial: esteira de capacidades. A imagem é precisa. Há alguns anos, um modelo competitivo como o GPT-1 permanecia em uso por longos períodos. Hoje, o ciclo de substituição se mede em meses.

As melhores notícias de tecnologia B2B
Acompanhe todas as novidades diretamente na sua caixa de entrada

“Estamos nessa esteira em que apenas queremos usar modelos melhores e passamos de um para outro muito rapidamente”, observa. “Isso cria um problema enorme para a reprodutibilidade e para a infraestrutura de pesquisa.”

O risco é concreto. Uma análise conduzida com determinado modelo em janeiro pode produzir resultados impossíveis de replicar em junho, não porque a metodologia mudou, mas porque o modelo foi atualizado sem aviso, o preço subiu ou o fornecedor simplesmente descontinuou o produto. Para a ciência, que depende da verificação independente de resultados, trata-se de um problema estrutural.

Ana propõe reduzir a dependência de modelos proprietários em favor dos de código aberto. Modelos abertos podem ser controlados, personalizados com dados próprios e mantidos estáveis no tempo, sem que nenhum fornecedor externo possa alterar seu comportamento ou seu custo unilateralmente.

“Ninguém pode aumentar o preço para você. Ninguém pode introduzir uma atualização silenciosa e comprometer todo o seu fluxo de dados”, afirma. “Muitas vezes, um modelo de código aberto é suficientemente bom para o seu caso de uso. E é o que vai tornar a sua operação mais competitiva a longo prazo.”

Essa defesa do código aberto, porém, não deve ser confundida com resistência à adoção. Nesse ponto, Ana é explicitamente otimista.

Leia também: “Brasil já está à frente de muitos países no comércio agêntico”, diz professor de Harvard no AI Festival

Otimismo sem ingenuidade

Questionada sobre o que a preocupa mais, a rapidez com que os modelos se disseminam ou a dificuldade de construir mecanismos de governança que acompanhem esse ritmo, Ana rejeitou a premissa.

“Não estou preocupada. Sou positiva. Gosto da velocidade de adoção dos modelos”, diz. “Quem não adotar ficará para trás em muitos aspectos. Quem adotar terá vantagem competitiva.”

Para a pesquisadora, a inteligência artificial já não é apenas uma ferramenta auxiliar da ciência. É parte do método científico. Nos laboratórios e nas publicações acadêmicas, a curva de adoção é exponencial e abrange praticamente todos os campos do conhecimento.

Esse otimismo não dispensa o trabalho técnico. Ana aponta que ainda há muito a construir em termos de marcos de referência para reprodutibilidade, personalização de modelos e criação de infraestrutura própria para cada caso de uso. A diferença entre sua posição e a dos céticos está no diagnóstico: para ela, esses são problemas a resolver, não razões para frear a adoção. Há, contudo, um domínio em que traça uma linha mais nítida.

Quando a máquina entrevista pessoas

O recrutamento. Ana acompanhou casos em que empresas tentaram substituir entrevistadores humanos por modelos de inteligência artificial, e o resultado, na maioria das vezes, foi problemático.

“Empresas querem otimizar tudo que podem otimizar. Pensam: talvez não precisemos de tantas pessoas no setor de recursos humanos, podemos usar um modelo. E então isso pode se voltar contra elas”, pondera. “Terão de se ajustar.”

Para a pesquisadora, o aprendizado ainda está em curso e não há uma resposta definitiva sobre onde os modelos vão se estabelecer nesse processo. Ela acredita que versões futuras serão mais capazes de avaliar candidatos, mas defende que a decisão final precisa continuar com pessoas.

O trabalho colaborativo envolve dimensões que nenhum currículo registra e que modelos de linguagem não conseguem capturar: como alguém se comporta presencialmente, com que facilidade integra uma equipe, que tipo de criatividade demonstra em situações imprevistas.

“O trabalho colaborativo não é apenas o que está em um currículo. É como a pessoa se apresenta pessoalmente, como é trabalhar com ela, o quanto é criativa”, afirma. “Isso é algo que um modelo não consegue avaliar. É algo que um ser humano precisa avaliar.”

Ana encerra com uma expectativa: que a curva de aprendizado atual leve as organizações a um equilíbrio em que a inteligência artificial amplie a capacidade humana de selecionar talentos, sem substituí-la. Para ela, esse é um dos poucos pontos em que a cautela é necessária.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Sobre o Autor

Pamela Sousa é editora-assistente no IT Forum, graduada em Jornalismo pela Universidade Federal de Santa Maria (UFSM). Especializa-se na cobertura de tecnologia, inteligência artificial e inovação, desenvolvendo reportagens aprofundadas e artigos analíticos sobre o impacto dessas tecnologias nos negócios e na sociedade.

Ver publicações deste autor

Notícias relacionadas

Ver mais Seta para direita