OpenAIにおけるPostgreSQLの大規模利用:ベストプラクティスと課題

2025-05-23

PGConf.dev 2025で、OpenAIはPostgreSQLの利用に関するベストプラクティスを共有し、世界有数のAI企業におけるデータベース利用に関する知見を明らかにしました。彼らは、単一ライター、マルチリーダーの非シャードアーキテクチャを採用し、5億人のアクティブユーザーに対する大量の読み込み要求を成功裏に処理しています。しかし、書き込み要求がボトルネックとなり、主データベースの負荷制御(書き込みのオフロード、遅延書き込み)、クエリ最適化(長時間トランザクションの回避、複雑なクエリの最適化)、単一障害点の解決(高優先度リクエストの優先処理)、慎重なスキーマ管理(スキーマ変更の制限)などの最適化が行われました。これらの努力にもかかわらず、OpenAIはインデックス管理、可観測性、スキーマ変更履歴に関する課題に直面し、PostgreSQLへの改善提案を行いました。ベテランPostgreSQLエンジニアのLao Feng氏は、自身の経験に基づいて洞察を提供し、多くの問題が既存のツールや方法、あるいは彼のオープンソースシステムであるPigstyで解決できることを示しました。最終的に、OpenAIのPostgreSQLクラスタは100万QPSを超える処理に成功し、大規模アプリケーションにおけるPostgreSQLの可能性を実証しました。

開発