搜索技巧 海洋云增白 开源地图 AI 搜索答案 沙丘魔堡2 压缩机站 自由职业 policy 小团队 颈挂空调 Chumby 个人电脑 极端主义 团队 PostgreSQL AI工具 证券 DirectX DrawingPics 化学 KDE 披萨农场 多动症 植物学 分析化学 Three.js 大会 残疾人学校 初创 QB64 更多

区分大小写,但既非大写也非小写的字符是什么? (devblogs.microsoft.com)

本文探讨了Unicode中一种特殊情况:标题大小写(Title case)。某些Unicode字符,例如dz (U+01F1 LATIN SMALL LETTER DZ),表示两个图形符号的组合,但占用单个代码点。这些字符主要出现在匈牙利语等语言中,被视为字母表中的单个字母。Unicode包含四个这样的双字母组合,它们具有大写、标题大小写和小写三种形式。文章指出,dz双字母组合的存在源于塞尔维亚-克罗地亚语中拉丁字母和西里尔字母的转换需求。文章还讨论了这种特殊字符在文本搜索中可能导致的问题,例如搜索"mad"不会匹配"madzag",因为"dz"被视为单个字母。