Webtagr - Technology News Summarizer

Popular：

Virtualization DNS security formal verification reachability analysis compiler errors macro conflict web extension development framework Bitmap Graphics API inconsistencies All Tags

Costes de inferencia de IA: No tan caros como crees

2025-08-28

Este artículo cuestiona la narrativa de que la inferencia de IA es prohibitivamente cara e insostenible. Al calcular los costes de ejecutar la inferencia de IA en GPUs H100, el autor demuestra que el procesamiento de entrada es increíblemente barato (fracciones de un centavo por millón de tokens), mientras que la generación de salida es significativamente más cara (dólares por millón de tokens). Esta asimetría de costes explica la rentabilidad de algunas aplicaciones (como los asistentes de codificación) y el alto coste de otras (como la generación de vídeo). El autor argumenta que esta disparidad de costes a menudo se pasa por alto, lo que lleva a una sobreestimación de los costes de inferencia de IA, lo que puede beneficiar a los incumbentes y sofocar la competencia y la innovación.

(martinalderson.com)

IA coste de inferencia de IA economía de modelos