vLLM V1: Servindo LLMs de forma eficiente em grande escala

2025-06-29
vLLM V1: Servindo LLMs de forma eficiente em grande escala

O serviço de nuvem de código aberto da Ubicloud utiliza o vLLM V1 para servir modelos de linguagem grandes de forma eficiente. Este artigo mergulha na arquitetura do vLLM V1, detalhando a jornada de uma solicitação de inferência desde a recepção, agendamento e execução do modelo até o processamento de saída. Tecnologias-chave como IPC assíncrona, processamento contínuo em lote e gerenciamento de cache KV são explicadas. O vLLM V1 maximiza a utilização da GPU por meio de processamento assíncrono, um algoritmo de processamento contínuo em lote e computação paralela na GPU, permitindo a geração de texto de alta taxa de transferência em grande escala. Isso fornece insights valiosos para engenheiros de IA que implantam LLMs e aqueles interessados em entender como os modelos de linguagem grandes são servidos de forma eficiente.

Leia mais

SSDs NVMe locais: O futuro dos bancos de dados na nuvem?

2025-06-02
SSDs NVMe locais: O futuro dos bancos de dados na nuvem?

O armazenamento em nuvem foi inicialmente projetado em torno das limitações de hardware mais antigo, usando discos conectados à rede para melhorar a durabilidade e a escalabilidade. No entanto, os SSDs NVMe econômicos de hoje oferecem desempenho significativamente superior. Este artigo demonstra que bancos de dados PostgreSQL usando SSDs NVMe locais superam o AWS RDS e o Aurora em várias vezes em benchmarks TPC-C e TPC-H. Embora o armazenamento conectado à rede mantenha vantagens em elasticidade e durabilidade, a confiabilidade e a acessibilidade dos SSDs NVMe agora compensam em grande parte, tornando os SSDs NVMe locais uma opção atraente para o futuro dos bancos de dados na nuvem.

Leia mais

Máquinas Virtuais Burstáveis da Ubicloud: Fatiamento de CPU com cgroups v2

2025-05-02
Máquinas Virtuais Burstáveis da Ubicloud: Fatiamento de CPU com cgroups v2

A Ubicloud, uma alternativa de código aberto à AWS, introduziu VMs burstáveis para reduzir custos na nuvem. Aproveitando o Linux cgroups v2, essas VMs rodam em uma fração de recursos de CPU compartilhados, atingindo maior utilização durante picos de carga. O artigo detalha a configuração e o uso do cgroups v2, incluindo os controladores cpuset e cpu, e a administração via sistema de arquivos virtual ou systemd. Testes mostraram que as VMs burstáveis alcançam cerca de 30% de aumento de desempenho em cargas leves, mas isso é limitado pelas restrições de micro-intervalos do cgroups v2.

Leia mais
Desenvolvimento VMs burstáveis

Pesadelo de confiabilidade do servidor Hetzner AX162: Uma jornada de depuração dolorosa

2025-02-19
Pesadelo de confiabilidade do servidor Hetzner AX162: Uma jornada de depuração dolorosa

A Ubicloud encontrou sérios problemas de confiabilidade com os novos servidores Hetzner AX162: uma taxa de falhas 16 vezes maior do que seu antecessor, AX161. Após meses de depuração, eles suspeitaram que a limitação de energia pela Hetzner e defeitos na placa-mãe eram as causas principais. Várias atualizações de hardware, especialmente substituições da placa-mãe, finalmente resolveram o problema. Essa experiência os ensinou os riscos da adoção precoce e levou a melhorias nos processos, incluindo verificações mais completas e implantações graduais de hardware.

Leia mais

Imersão na Virtualização em Nuvem: Internos do Red Hat, AWS Firecracker e Ubicloud

2025-01-24
Imersão na Virtualização em Nuvem: Internos do Red Hat, AWS Firecracker e Ubicloud

Este artigo mergulha nas arquiteturas centrais da virtualização em nuvem, usando Red Hat, AWS Firecracker e Ubicloud como estudos de caso para comparar suas diferenças em monitores de máquina virtual (VMMs), virtualização de kernel e isolamento de recursos. Ele explica os papéis de componentes importantes como KVM, QEMU e libvirt, e analisa o uso de tecnologias como cgroups, nftables e seccomp-bpf na obtenção de isolamento de recursos e segurança. O autor também contrasta o sistema AWS Nitro, resumindo a evolução da tecnologia de virtualização em nuvem e a importância da tecnologia de código aberto neste campo.

Leia mais