本文是面向需要租赁 NVIDIA H100 集群用户的指南,着重介绍了选择集群时需要考虑的关键因素,包括成本、互连可靠性、备用节点、存储和流数据、支持、GPU 所有权、裸金属与虚拟机、购买前的测试、GPU 利用率监控、电力来源和二氧化碳排放等。文章还分享了作者团队在选择供应商和集群类型方面的经验,并强调了环保的重要性。