vLLM V1: 대규모로 효율적인 LLM 서빙

2025-06-29
vLLM V1: 대규모로 효율적인 LLM 서빙

Ubicloud의 오픈소스 클라우드 서비스는 대규모 언어 모델을 효율적으로 제공하기 위해 vLLM V1을 사용합니다. 이 기사에서는 vLLM V1 아키텍처를 자세히 설명하고, 요청 수신, 스케줄링, 모델 실행에서 출력 처리에 이르기까지 추론 요청의 전체 과정을 설명합니다. 비동기 IPC, 연속 배치 처리, KV 캐시 관리와 같은 중요한 기술도 설명합니다. vLLM V1은 비동기 처리, 연속 배치 처리 알고리즘, GPU 병렬 계산을 통해 GPU 사용률을 극대화하여 대규모 고 처리량 텍스트 생성을 가능하게 합니다. 이는 LLM을 배포하는 AI 엔지니어와 대규모 언어 모델의 효율적인 제공 방법에 관심 있는 사람들에게 귀중한 통찰력을 제공합니다.

더 보기

로컬 NVMe SSD: 클라우드 데이터베이스의 미래?

2025-06-02
로컬 NVMe SSD: 클라우드 데이터베이스의 미래?

클라우드 스토리지는 처음에 구형 하드웨어의 한계를 고려하여 설계되었으며, 내구성과 확장성을 향상시키기 위해 네트워크 연결 디스크를 사용했습니다. 그러나 오늘날 비용 효율적인 NVMe SSD는 훨씬 더 뛰어난 성능을 제공합니다. 이 기사는 로컬 NVMe SSD를 사용하는 PostgreSQL 데이터베이스가 TPC-C 및 TPC-H 벤치마크에서 AWS RDS 및 Aurora를 여러 배 능가함을 보여줍니다. 네트워크 연결 스토리지는 여전히 탄력성과 내구성 측면에서 이점이 있지만, NVMe SSD의 안정성과 경제성으로 인해 이제 크게 상쇄되고 있으며, 로컬 NVMe SSD는 클라우드 데이터베이스의 미래에 매력적인 선택이 되고 있습니다.

더 보기
기술

Ubicloud의 버스트 가능한 VM: cgroups v2를 사용한 CPU 슬라이싱

2025-05-02
Ubicloud의 버스트 가능한 VM: cgroups v2를 사용한 CPU 슬라이싱

AWS의 오픈 소스 대안인 Ubicloud는 클라우드 비용 절감을 위해 버스트 가능한 VM을 도입했습니다. Linux cgroups v2를 활용하여 이러한 VM은 공유 CPU 리소스의 일부에서 작동하며, 피크 부하 시 더 높은 CPU 사용률로 버스트합니다. 이 기사에서는 cpuset 컨트롤러와 cpu 컨트롤러를 포함한 cgroups v2의 구성 및 사용 방법, 가상 파일 시스템 또는 systemd를 통한 관리 방법에 대해 자세히 설명합니다. 테스트 결과, 버스트 가능한 VM은 가벼운 부하 시 약 30%의 성능 향상을 달성했지만, 이는 cgroups v2의 마이크로 인터벌 제한으로 인해 제한됩니다.

더 보기

Hetzner AX162 서버의 신뢰성 악몽: 고통스러운 디버깅 여정

2025-02-19
Hetzner AX162 서버의 신뢰성 악몽: 고통스러운 디버깅 여정

Ubicloud는 Hetzner의 새로운 AX162 서버에서 심각한 신뢰성 문제를 겪었습니다. 이전 세대인 AX161보다 16배나 높은 충돌률을 보였습니다. 몇 달 동안의 디버깅 끝에 Hetzner의 전력 제한과 마더보드 결함이 근본 원인일 것이라고 추측했습니다. 마더보드 교체를 중심으로 여러 번의 하드웨어 업그레이드를 통해 문제가 해결되었습니다. 이 경험을 통해 조기 도입의 위험성을 인지하고, 보다 철저한 검증 및 단계적 하드웨어 도입 등 프로세스 개선을 진행했습니다.

더 보기
하드웨어 서버 신뢰성

클라우드 가상화 심층 분석: Red Hat, AWS Firecracker, Ubicloud 내부 구조

2025-01-24
클라우드 가상화 심층 분석: Red Hat, AWS Firecracker, Ubicloud 내부 구조

이 블로그 게시물은 Red Hat, AWS Firecracker, Ubicloud를 사례 연구로 사용하여 클라우드 가상화의 핵심 아키텍처를 심층적으로 파헤치고, 가상 머신 모니터(VMM), 커널 가상화, 리소스 격리의 차이점을 비교합니다. KVM, QEMU, libvirt와 같은 주요 구성 요소의 역할을 설명하고, cgroups, nftables, seccomp-bpf와 같은 기술이 리소스 및 보안 격리에 어떻게 기여하는지 분석합니다. 또한 AWS Nitro 시스템과 비교하여 클라우드 가상화 기술의 발전과 이 분야에서 오픈소스 기술의 중요성을 요약합니다.

더 보기