富文本,穷文本:字符编码的隐痛

2025-04-05

本文探讨了富文本编辑中字体样式(粗体、斜体等)的存储方式问题。作者认为,这些样式并非简单的“修饰”,而是语言表达的一部分,类似于标点符号。然而,早期的字符编码标准(如ASCII)并未包含这些样式信息,导致需要使用嵌入式标记来表示,这使得文本数据“污染”,并影响了文本处理的效率和一致性。作者建议采用更宽字符编码方案,将样式信息直接编码到字符中,以解决这一问题。

开发 富文本