Texte riche, texte pauvre : la douleur cachée de l'encodage des caractères

2025-04-05

Cet article explore la question du stockage des styles de police (gras, italique, etc.) dans l'édition de texte enrichi. L'auteur soutient que ces styles ne sont pas de simples « décorations », mais des éléments intégraux de l'expression linguistique, similaires à la ponctuation. Cependant, les premiers standards d'encodage de caractères (comme ASCII) n'incluaient pas ces informations de style, conduisant à l'utilisation de balisage incorporé. Cela « pollue » les données textuelles, affectant l'efficacité et la cohérence du traitement de texte. L'auteur propose un schéma d'encodage de caractères plus large pour encoder directement les informations de style dans les caractères, résolvant ainsi ce problème.