亚马逊将EB级数据处理从Apache Spark迁移到Amazon EC2上的Ray

2024-07-31

本文介绍了亚马逊零售商业数据技术(BDT)团队如何将EB级的Apache Spark数据处理工作负载迁移到Ray。由于数据规模的扩大,原有的Apache Spark方案在成本和效率方面已无法满足需求。Ray凭借其灵活的编程模型、高效的任务调度和自动扩展等特性,为亚马逊提供了更优的解决方案。迁移后,Ray在成本效率上提升了82%,数据处理速度提升了13倍。尽管取得了显著成果,但亚马逊仍在持续优化Ray,以期实现更高的效率和稳定性。

未分类 Ray