Custos de inferência de IA: Não tão caros quanto você pensa

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Custos de inferência de IA: Não tão caros quanto você pensa

2025-08-28

Este artigo contesta a narrativa de que a inferência de IA é proibitivamente cara e insustentável. Ao calcular os custos de execução da inferência de IA em GPUs H100, o autor demonstra que o processamento de entrada é incrivelmente barato (frações de centavo por milhão de tokens), enquanto a geração de saída é significativamente mais cara (dólares por milhão de tokens). Essa assimetria de custo explica a lucratividade de alguns aplicativos (como assistentes de codificação) e o alto custo de outros (como geração de vídeo). O autor argumenta que essa disparidade de custo é frequentemente ignorada, levando a uma superestimação dos custos de inferência de IA, o que pode beneficiar os incumbentes e sufocar a competição e a inovação.

(martinalderson.com)

IA custo de inferência de IA economia de modelos

Leitura por prazer cai 40% nos EUA: um alerta da era digital?

Renderização em tempo real de jogo ASCII com IA: Desafios e avanços