Realizar inferências em um grande modelo de linguagem (LLM) com um trilhão de parâmetros terá redução de custos de mais…