vLLM V1: Effizientes Serving von LLMs im großen Maßstab

2025-06-29
vLLM V1: Effizientes Serving von LLMs im großen Maßstab

Der Open-Source-Cloud-Service von Ubicloud nutzt vLLM V1, um Large Language Models (LLMs) effizient zu bedienen. Dieser Beitrag beschreibt detailliert die Architektur von vLLM V1 und den Ablauf einer Inferenzanfrage von der Annahme, über die Planung und die Modell-Ausführung bis zur Ausgabeverarbeitung. Schlüsseltechnologien wie asynchrone IPC, kontinuierliches Batching und KV-Cache-Management werden erläutert. vLLM V1 maximiert die GPU-Auslastung durch asynchrone Verarbeitung, einen Algorithmus für kontinuierliches Batching und parallele GPU-Berechnung, wodurch eine hochperformante Textgenerierung im großen Maßstab ermöglicht wird. Dies bietet wertvolle Einblicke für KI-Ingenieure, die LLMs bereitstellen, und alle, die daran interessiert sind, zu verstehen, wie LLMs effizient bedient werden.

Mehr lesen

Lokale NVMe-SSDs: Die Zukunft von Cloud-Datenbanken?

2025-06-02
Lokale NVMe-SSDs: Die Zukunft von Cloud-Datenbanken?

Cloud-Speicher wurde ursprünglich aufgrund der Einschränkungen älterer Hardware entwickelt und verwendete netzwerkangeschlossene Festplatten, um die Langlebigkeit und Skalierbarkeit zu verbessern. Heutige kostengünstige NVMe-SSDs bieten jedoch eine deutlich höhere Leistung. Dieser Artikel zeigt, dass PostgreSQL-Datenbanken mit lokalen NVMe-SSDs AWS RDS und Aurora in den Benchmarks TPC-C und TPC-H um ein Vielfaches übertreffen. Obwohl netzwerkbasierter Speicher Vorteile in Bezug auf Elastizität und Langlebigkeit bietet, gleichen die Zuverlässigkeit und die Erschwinglichkeit von NVMe-SSDs dies jetzt weitgehend aus, was lokale NVMe-SSDs zu einer attraktiven Option für die Zukunft von Cloud-Datenbanken macht.

Mehr lesen

Ubiclouds Burstbare VMs: CPU-Slicing mit cgroups v2

2025-05-02
Ubiclouds Burstbare VMs: CPU-Slicing mit cgroups v2

Ubicloud, eine Open-Source-Alternative zu AWS, hat burstbare VMs eingeführt, um Cloud-Kosten zu senken. Mit Linux cgroups v2 laufen diese VMs auf einem Bruchteil gemeinsam genutzter CPU-Ressourcen und erhöhen die Auslastung bei Lastspitzen. Der Artikel beschreibt detailliert die Konfiguration und Verwendung von cgroups v2, einschließlich der cpuset- und cpu-Controller, sowie die Verwaltung über das virtuelle Dateisystem oder systemd. Tests zeigten, dass burstbare VMs bei geringer Last eine Leistungssteigerung von etwa 30% erreichen, dies ist jedoch durch die Mikrointervallbeschränkungen von cgroups v2 begrenzt.

Mehr lesen
Entwicklung burstbare VMs

Hetzner AX162 Server-Zuverlässigkeit: Ein schmerzhafter Debugging-Trip

2025-02-19
Hetzner AX162 Server-Zuverlässigkeit: Ein schmerzhafter Debugging-Trip

Ubicloud stieß bei der Verwendung der neuen Hetzner AX162 Server auf gravierende Zuverlässigkeitsprobleme: Die Absturzrate war 16-mal höher als beim Vorgängermodell AX161. Nach monatelangem Debugging vermuteten sie eine Leistungsbegrenzung durch Hetzner und fehlerhafte Motherboards als Hauptursachen. Mehrere Hardware-Upgrades, insbesondere der Austausch der Motherboards, behoben das Problem schließlich. Diese Erfahrung lehrte sie die Risiken der frühen Adoption und führte zu Prozessverbesserungen, darunter gründlichere Tests und schrittweise Einführung neuer Hardware.

Mehr lesen

Tief eintauchen in die Cloud-Virtualisierung: Interne Strukturen von Red Hat, AWS Firecracker und Ubicloud

2025-01-24
Tief eintauchen in die Cloud-Virtualisierung: Interne Strukturen von Red Hat, AWS Firecracker und Ubicloud

Dieser Blogbeitrag untersucht die Kernarchitekturen der Cloud-Virtualisierung anhand von Red Hat, AWS Firecracker und Ubicloud als Fallstudien, um deren Unterschiede in virtuellen Maschinenmonitoren (VMM), Kernel-Virtualisierung und Ressourcenisolierung zu vergleichen. Er erklärt die Rollen wichtiger Komponenten wie KVM, QEMU und libvirt und analysiert die Verwendung von Technologien wie cgroups, nftables und seccomp-bpf zur Erreichung von Ressourcen- und Sicherheitsisolierung. Der Autor vergleicht auch das AWS Nitro-System und fasst die Entwicklung der Cloud-Virtualisierungstechnologie und die Bedeutung von Open-Source-Technologie in diesem Bereich zusammen.

Mehr lesen