Conquistando o Não-Determinismo na Inferência de LLMs

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Conquistando o Não-Determinismo na Inferência de LLMs

2025-09-11

A irreprodutibilidade dos resultados de inferência de modelos de linguagem grandes (LLMs) é um problema persistente. Esta publicação investiga a causa raiz, revelando que não é simplesmente a não-associatividade de ponto flutuante e a execução concorrente, mas sim a falta de "invariância de lote" nas implementações do kernel. Mesmo que kernels individuais sejam determinísticos, variações não determinísticas no tamanho do lote (devido à carga do servidor) afetam a saída final. Os autores analisam os desafios de alcançar a invariância de lote em RMSNorm, multiplicação de matrizes e mecanismos de atenção, propondo um método para eliminar o não-determinismo, modificando as implementações do kernel. Isso leva a uma inferência de LLM totalmente reprodutível e impactos positivos no treinamento de aprendizado por reforço.

(thinkingmachines.ai)

DataFrame Leve em MicroHs: Uma Aventura Haskell 2010

Intel Mount Morgan IPU: Um Monstro de Processador de Infraestrutura em Nuvem