Checkly 团队通过优化 AWS ECS 容器的启动时间,成功将每个 pod 的启动时间缩短了 300 毫秒,每月节省了约 5500 美元的成本。文章详细介绍了他们如何使用 Grafana Loki 监控 pod 启动时间、发现 AWS SDK 版本问题以及通过统一版本号解决问题的过程。
Checkly 工程团队利用 OpenTelemetry 监控 Node.js 服务并使用 Coralogix 仪表板分析数据,发现并解决了 AWS SDK 中一个导致身份验证重复请求的问题。这一修复显著减少了任务处理时间,每月节省数千小时的执行时间,体现了可观测性工具和微优化在提升系统性能和降低成本方面的巨大价值。