DeepSeek V3: Desempenho de ponta com recursos limitados

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

DeepSeek V3: Desempenho de ponta com recursos limitados

2025-01-23

O novo modelo V3 da DeepSeek, treinado em apenas 2.048 GPUs H800 - uma fração dos recursos usados por gigantes como OpenAI - iguala ou supera o GPT-4 e o Claude em vários benchmarks. Seu custo de treinamento de US$ 5,5 milhões é muito menor do que os estimados US$ 40 milhões para o GPT-4. Esse sucesso, em parte impulsionado pelos controles de exportação dos EUA que limitam o acesso a GPUs de alta performance, destaca o potencial de inovação arquitetônica e otimização de algoritmos em relação à pura capacidade de computação. É um argumento convincente de que restrições de recursos podem, paradoxalmente, impulsionar avanços inovadores no desenvolvimento de IA.

(www.vincentschmalbach.com)

IA treinamento de modelo de IA limitações de GPU eficiência de computação

Liberux NEXX: O Telefone Linux focado em Privacidade que você esperava

A Corrida Subterrânea pelo Hidrogênio: Uma Nova Era de Energia