vLLM V1: Sirviendo LLMs de manera eficiente a gran escala

2025-06-29
vLLM V1: Sirviendo LLMs de manera eficiente a gran escala

El servicio en la nube de código abierto de Ubicloud utiliza vLLM V1 para servir modelos de lenguaje grandes de manera eficiente. Este artículo profundiza en la arquitectura de vLLM V1, detallando el recorrido de una solicitud de inferencia desde la recepción, la programación y la ejecución del modelo hasta el procesamiento de la salida. Se explican tecnologías clave como IPC asincrónica, procesamiento por lotes continuo y gestión de caché KV. vLLM V1 maximiza el uso de la GPU mediante el procesamiento asincrónico, un algoritmo de procesamiento por lotes continuo y la computación paralela en la GPU, lo que permite la generación de texto de alto rendimiento a gran escala. Esto proporciona información valiosa para los ingenieros de IA que implementan LLMs y para aquellos interesados en comprender cómo se sirven los modelos de lenguaje grandes de manera eficiente.

Leer más

SSDs NVMe locales: ¿El futuro de las bases de datos en la nube?

2025-06-02
SSDs NVMe locales: ¿El futuro de las bases de datos en la nube?

El almacenamiento en la nube se diseñó inicialmente en torno a las limitaciones del hardware antiguo, utilizando discos conectados en red para mejorar la durabilidad y la escalabilidad. Sin embargo, los SSD NVMe económicos de hoy ofrecen un rendimiento significativamente superior. Este artículo demuestra que las bases de datos PostgreSQL que utilizan SSD NVMe locales superan al AWS RDS y Aurora varias veces en los benchmarks TPC-C y TPC-H. Si bien el almacenamiento conectado en red mantiene ventajas en elasticidad y durabilidad, la fiabilidad y la asequibilidad de los SSD NVMe ahora compensan en gran medida, lo que convierte a los SSD NVMe locales en una opción atractiva para el futuro de las bases de datos en la nube.

Leer más

Máquinas Virtuales Burstables de Ubicloud: Partición de CPU con cgroups v2

2025-05-02
Máquinas Virtuales Burstables de Ubicloud: Partición de CPU con cgroups v2

Ubicloud, una alternativa de código abierto a AWS, introdujo máquinas virtuales burstables para reducir los costos en la nube. Aprovechando Linux cgroups v2, estas VMs se ejecutan en una fracción de los recursos de CPU compartidos, aumentando el uso durante los picos de carga. El artículo detalla la configuración y el uso de cgroups v2, incluyendo los controladores cpuset y cpu, y la administración a través del sistema de archivos virtual o systemd. Las pruebas mostraron que las VMs burstables logran un aumento de rendimiento de alrededor del 30% en cargas ligeras, pero esto está limitado por las restricciones de microintervalos de cgroups v2.

Leer más

Pesadilla de confiabilidad del servidor Hetzner AX162: Un doloroso viaje de depuración

2025-02-19
Pesadilla de confiabilidad del servidor Hetzner AX162: Un doloroso viaje de depuración

Ubicloud encontró serios problemas de confiabilidad con los nuevos servidores Hetzner AX162: una tasa de fallos 16 veces mayor que su predecesor, AX161. Después de meses de depuración, sospecharon que la limitación de energía por parte de Hetzner y los defectos de la placa base eran las causas principales. Varias actualizaciones de hardware, especialmente las sustituciones de la placa base, finalmente resolvieron el problema. Esta experiencia les enseñó los riesgos de la adopción temprana y llevó a mejoras en los procesos, incluyendo verificaciones más exhaustivas e implementaciones graduales de hardware.

Leer más

Inmersión en la virtualización en la nube: aspectos internos de Red Hat, AWS Firecracker y Ubicloud

2025-01-24
Inmersión en la virtualización en la nube: aspectos internos de Red Hat, AWS Firecracker y Ubicloud

Esta entrada de blog profundiza en las arquitecturas centrales de la virtualización en la nube, utilizando Red Hat, AWS Firecracker y Ubicloud como estudios de caso para comparar sus diferencias en los monitores de máquina virtual (VMM), la virtualización del kernel y el aislamiento de recursos. Explica las funciones de componentes clave como KVM, QEMU y libvirt, y analiza el uso de tecnologías como cgroups, nftables y seccomp-bpf para lograr el aislamiento de recursos y la seguridad. El autor también contrasta el sistema AWS Nitro, resumiendo la evolución de la tecnología de virtualización en la nube y la importancia de la tecnología de código abierto en este campo.

Leer más