PostgreSQL a Escala en OpenAI: Mejores Prácticas y Desafíos

2025-05-23

En PGConf.dev 2025, OpenAI compartió sus mejores prácticas para el uso de PostgreSQL, ofreciendo información sobre el uso de la base de datos en una de las principales empresas de IA del mundo. Utilizan una arquitectura sin sharding, con un solo escritor y múltiples lectores, manejando con éxito cargas masivas de lectura para sus 500 millones de usuarios activos. Sin embargo, las solicitudes de escritura se convirtieron en un cuello de botella, lo que provocó optimizaciones que incluyen el control de carga en la base de datos principal (descargando escrituras, escrituras perezosas), la optimización de consultas (evitando transacciones largas, optimizando consultas complejas), el tratamiento de puntos únicos de falla (priorizando solicitudes de alta prioridad) y la gestión cuidadosa de esquemas (restringiendo los cambios de esquema). A pesar de estos esfuerzos, OpenAI encontró desafíos relacionados con la gestión de índices, la capacidad de observación y el historial de cambios de esquema, lo que llevó a sugerencias de mejoras para PostgreSQL. El experto en PostgreSQL, Lao Feng, proporcionó información basada en su experiencia, mostrando que muchos problemas podrían resolverse con herramientas o métodos existentes, o incluso utilizando su sistema Pigsty de código abierto. Finalmente, el clúster PostgreSQL de OpenAI procesó con éxito más de un millón de QPS, demostrando el potencial de PostgreSQL en aplicaciones a gran escala.

Leer más