本文介绍了Polars团队为何重写字符串数据类型。旧的字符串类型在处理大量字符串数据时效率低下,尤其是在进行过滤和聚合操作时。为此,Polars采用了Hyper/Umbra数据库系统的设计方案,将字符串存储为16字节的视图,短字符串内联存储,长字符串存储在二级缓冲区中。这种新的数据结构解决了旧版本的性能瓶颈,并提供了更高的内存效率。