Hetzner AX162服务器的可靠性噩梦:一次痛苦的调试之旅

Ubicloud公司在使用Hetzner新一代AX162服务器时遭遇了严重的可靠性问题:崩溃率比前代AX161高出16倍。经过数月的调试,他们发现问题根源可能与Hetzner对服务器功耗的限制以及主板缺陷有关。最终,通过多次硬件升级,特别是更换主板,才解决了这个问题。这次经历使他们深刻认识到,尽早采用新硬件可能存在风险,并改进流程,包括更彻底的验收测试和逐步引入新硬件。
阅读更多
Ubicloud公司在使用Hetzner新一代AX162服务器时遭遇了严重的可靠性问题:崩溃率比前代AX161高出16倍。经过数月的调试,他们发现问题根源可能与Hetzner对服务器功耗的限制以及主板缺陷有关。最终,通过多次硬件升级,特别是更换主板,才解决了这个问题。这次经历使他们深刻认识到,尽早采用新硬件可能存在风险,并改进流程,包括更彻底的验收测试和逐步引入新硬件。
阅读更多
本文深入探讨了云虚拟化技术的核心架构,分别以Red Hat、AWS Firecracker和Ubicloud为例,比较了它们在虚拟机监控器(VMM)、内核虚拟化以及资源隔离方面的差异。文章阐述了KVM、QEMU、libvirt等关键组件的作用,并分析了cgroups、nftables、seccomp-bpf等技术在实现资源和安全隔离中的作用。作者还对比了AWS Nitro系统,总结了云虚拟化技术的发展历程以及开源技术在该领域中的重要性。
阅读更多
文章讨论了为自己和为他人运行PostgreSQL数据库的区别,特别是在管理服务方面的差异。文章重点介绍了四个方面:配置、备份/恢复、高可用性和安全性,并详细解释了为他人管理PostgreSQL时需要考虑的额外步骤和挑战,例如配置扩展、证书管理、DNS记录、数据库池、WAL文件管理、故障转移和安全隔离等。
阅读更多
本文讲述了Ubicloud平台启用ARM64虚拟机的过程,包括标准化CPU架构名称、自动识别和存储CPU架构、更新虚拟机分配逻辑以及添加新的ARM64二进制文件等步骤。此外,文章还探讨了在启用ARM64虚拟机过程中遇到的挑战,例如硬件配置缺乏灵活性以及二进制文件构建和版本控制问题,并提出了一些解决方案。
阅读更多