Texto Riqueza, Texto Pobre: A Dor Oculta da Codificação de Caracteres
2025-04-05
Este artigo aprofunda a questão de como os estilos de fonte (negrito, itálico, etc.) são armazenados na edição de texto enriquecido. O autor argumenta que esses estilos não são meros 'decorações', mas partes integrais da expressão da linguagem, semelhantes à pontuação. No entanto, os padrões iniciais de codificação de caracteres (como ASCII) não incluíam essas informações de estilo, levando ao uso de marcação embutida. Isso 'contamina' os dados de texto, afetando a eficiência e a consistência no processamento de texto. O autor propõe um esquema de codificação de caracteres mais amplo para codificar diretamente as informações de estilo nos caracteres, resolvendo esse problema.
Leia mais