vLLM V1 : Servir les LLMs efficacement à grande échelle

2025-06-29
vLLM V1 : Servir les LLMs efficacement à grande échelle

Le service cloud open source d'Ubicloud utilise vLLM V1 pour servir efficacement les grands modèles de langage. Cet article explore en détail l'architecture de vLLM V1, décrivant le parcours d'une requête d'inférence depuis sa réception, son ordonnancement et l'exécution du modèle jusqu'au traitement de la sortie. Les technologies clés telles que l'IPC asynchrone, le traitement par lots continu et la gestion du cache KV sont expliquées. vLLM V1 maximise l'utilisation du GPU grâce au traitement asynchrone, à un algorithme de traitement par lots continu et au calcul parallèle sur GPU, permettant une génération de texte haute performance à grande échelle. Ceci fournit des informations précieuses aux ingénieurs IA qui déploient des LLMs et à ceux qui s'intéressent à la manière dont les grands modèles de langage sont servis efficacement.

Lire plus

SSDs NVMe locaux : l’avenir des bases de données cloud ?

2025-06-02
SSDs NVMe locaux : l’avenir des bases de données cloud ?

Le stockage cloud a été initialement conçu autour des limitations du matériel ancien, utilisant des disques connectés au réseau pour améliorer la durabilité et l’évolutivité. Cependant, les SSD NVMe économiques d’aujourd’hui offrent des performances significativement supérieures. Cet article montre que les bases de données PostgreSQL utilisant des SSD NVMe locaux surpassent AWS RDS et Aurora de plusieurs fois dans les benchmarks TPC-C et TPC-H. Bien que le stockage connecté au réseau conserve des avantages en termes d’élasticité et de durabilité, la fiabilité et le coût abordable des SSD NVMe compensent désormais largement, ce qui fait des SSD NVMe locaux une option attrayante pour l’avenir des bases de données cloud.

Lire plus

Machines Virtuelles Burstables d'Ubicloud : découpage CPU avec cgroups v2

2025-05-02
Machines Virtuelles Burstables d'Ubicloud : découpage CPU avec cgroups v2

Ubicloud, une alternative open source à AWS, a introduit des machines virtuelles burstables pour réduire les coûts du cloud. En utilisant Linux cgroups v2, ces VMs s'exécutent sur une fraction de ressources CPU partagées, augmentant leur utilisation lors des pics de charge. L'article détaille la configuration et l'utilisation de cgroups v2, incluant les contrôleurs cpuset et cpu, et la gestion via le système de fichiers virtuel ou systemd. Les tests ont montré que les VMs burstables atteignent environ 30% d'augmentation de performance sous faibles charges, mais ceci est limité par les restrictions de micro-intervalles de cgroups v2.

Lire plus

Cauchemar de fiabilité du serveur Hetzner AX162 : Un voyage de débogage douloureux

2025-02-19
Cauchemar de fiabilité du serveur Hetzner AX162 : Un voyage de débogage douloureux

Ubicloud a rencontré de sérieux problèmes de fiabilité avec les nouveaux serveurs Hetzner AX162 : un taux de plantages 16 fois supérieur à celui de son prédécesseur, l’AX161. Après des mois de débogage, ils ont suspecté une limitation de puissance par Hetzner et des défauts de carte mère comme causes principales. Plusieurs mises à niveau matérielles, en particulier le remplacement des cartes mères, ont finalement résolu le problème. Cette expérience leur a appris les risques de l’adoption précoce et a conduit à des améliorations des processus, notamment des vérifications plus approfondies et des déploiements progressifs du matériel.

Lire plus

Plongez au cœur de la virtualisation cloud : architecture interne de Red Hat, AWS Firecracker et Ubicloud

2025-01-24
Plongez au cœur de la virtualisation cloud : architecture interne de Red Hat, AWS Firecracker et Ubicloud

Cet article explore en profondeur les architectures principales de la virtualisation cloud, en prenant Red Hat, AWS Firecracker et Ubicloud comme études de cas pour comparer leurs différences en matière de moniteurs de machines virtuelles (VMM), de virtualisation du noyau et d’isolation des ressources. Il explique le rôle des composants clés tels que KVM, QEMU et libvirt, et analyse l’utilisation de technologies telles que cgroups, nftables et seccomp-bpf pour assurer l’isolation des ressources et la sécurité. L’auteur compare également le système AWS Nitro, résumant ainsi l’évolution de la technologie de virtualisation cloud et l’importance de la technologie open source dans ce domaine.

Lire plus