DeepSeek: Der stille Riese im chinesischen KI-Wettlauf

2024-12-31

DeepSeek, ein unauffälliges chinesisches KI-Startup, hat sich als wichtiger Akteur etabliert, dessen R1-Modell OpenAIs Modelle in mehreren Reasoning-Benchmarks übertrifft. Vollständig finanziert vom quantitativen Hedgefonds High-Flyer, priorisiert DeepSeek grundlegende Technologien über kommerzielle Anwendungen, verpflichtet sich, seine Modelle Open Source bereitzustellen und löst mit seinen erschwinglichen APIs einen Preiskrieg in China aus. Dies wird durch den Zugang zu den umfangreichen Rechenressourcen von High-Flyer ermöglicht. DeepSeeks ehrgeiziges Ziel ist die Erreichung Künstlicher Allgemeiner Intelligenz (AGI), wobei der Fokus auf bahnbrechenden Architektur- und Algorithmusinnovationen wie Multi-Head Latent Attention (MLA) und Sparse Mixture-of-Experts (DeepSeekMoE) liegt, die die Inferenzkosten drastisch reduzieren. Der Erfolg basiert auf umfassender Modellarchitekturinnovation und der effektiven Nutzung heimischer Talente, im Gegensatz zu vielen chinesischen Unternehmen, die sich auf Kommerzialisierung und Replikation konzentrieren. Gründer Liang Wenfeng, ein technologischer Idealist, stellt Prinzipien über Profit, fördert originäre Innovation und zielt darauf ab, China als wichtigen Beitrag zum globalen technologischen Fortschritt zu positionieren.

KI