鲜为人知的Polars与Pandas差异

2024-11-16

本文探讨了Polars和Pandas在分组聚合操作上的关键区别。Pandas的API在处理非基本分组聚合时存在局限性,例如“查找'sales'大于其平均值时,'views'的最大值”。用户通常需要使用低效的Python lambda函数或复杂的变通方法。Polars通过允许在GroupBy.agg中传递表达式来解决这个问题,从而实现更简洁和高效的非基本分组聚合操作。作者认为,新的数据框架库不应盲目复制Pandas API,而应关注API创新,以实现更强大的功能和性能。

阅读更多
未分类 数据框架

支持自由线程的CPython已准备好进行试验

2024-07-12

CPython 3.13将引入一个实验性特性——自由线程,它允许在同一个解释器内并行运行多个线程,从而显著提高多线程性能。然而,这也带来了一些挑战,例如需要确保代码的线程安全性以及处理ABI不兼容问题。文章介绍了自由线程的优势和挑战,并提供了一些应对挑战的策略,例如改进测试方法和逐步迁移到支持自由线程的软件包。

阅读更多