Gemini API의 배치 모드: 고처리량 워크로드 지원
2025-07-11

Google의 Gemini API에 배치 모드가 추가되었습니다. 지연 시간이 중요하지 않은 고처리량 작업에 이상적인 비동기 엔드포인트입니다. 대량의 작업을 제출하고 시스템이 처리하도록 하며, 동기 API와 비교하여 50% 할인된 가격으로 24시간 이내에 결과를 가져올 수 있습니다. 미리 준비된 데이터로 즉각적인 응답이 필요 없는 작업에 적합하며, 비용 절감, 처리량 증가, API 호출 간소화를 제공합니다. Reforged Labs는 이를 사용하여 대량의 동영상 광고를 처리하여 효율성을 크게 높이고 비용을 절감했습니다. Google GenAI Python SDK를 사용하면 쉽게 시작할 수 있습니다.
개발
비동기 처리