DeepSeek : Un modèle linguistique open source économique qui défie ChatGPT

2025-02-08
DeepSeek : Un modèle linguistique open source économique qui défie ChatGPT

DeepSeek, un grand modèle linguistique (LLM) open source développé par une entreprise chinoise de recherche en IA, défie ChatGPT grâce à son architecture unique de mélange d'experts (MoE). Son efficacité provient de l'activation uniquement des paramètres nécessaires, ce qui se traduit par des vitesses plus rapides et des coûts plus faibles. Des fonctionnalités telles que l'attention multi-têtes et la prédiction multi-jetons permettent des performances supérieures dans les conversations longues et le raisonnement complexe. Malgré les préoccupations concernant ses sources de données, le rapport coût-efficacité de DeepSeek et son style de sortie direct en font une alternative convaincante à ChatGPT.

IA