DeepSeek: O Gigante Silencioso Liderando a Corrida da IA na China

2024-12-31

A DeepSeek, uma startup chinesa de IA de baixo perfil, tornou-se uma força importante, com seu modelo R1 superando o da OpenAI em vários benchmarks de raciocínio. Totalmente financiada pelo fundo de hedge quantitativo High-Flyer, a DeepSeek prioriza a tecnologia fundamental em detrimento de aplicações comerciais, comprometendo-se a tornar seus modelos de código aberto e provocando uma guerra de preços na China com suas APIs acessíveis. Isso é impulsionado pelo acesso aos vastos recursos de computação do High-Flyer. O objetivo ambicioso da DeepSeek é alcançar a Inteligência Artificial Geral (AGI), focando em inovações arquitetônicas e algorítmicas inovadoras, como a atenção latente multi-cabeça (MLA) e a mistura esparsa de especialistas (DeepSeekMoE), reduzindo drasticamente os custos de inferência. Seu sucesso decorre da inovação abrangente na arquitetura do modelo e da utilização eficaz de talentos domésticos, contrastando fortemente com muitas empresas chinesas focadas na comercialização e replicação. O fundador Liang Wenfeng, um idealista tecnológico, prioriza princípios sobre lucros, impulsionando a inovação original e objetivando posicionar a China como uma contribuidora significativa para o avanço tecnológico global.

Leia mais
IA