Texto Rico, Texto Pobre: El Dolor Oculto de la Codificación de Caracteres
2025-04-05
Este artículo profundiza en el problema de cómo se almacenan los estilos de fuente (negrita, cursiva, etc.) en la edición de texto enriquecido. El autor argumenta que estos estilos no son meras 'decoraciones', sino partes integrales de la expresión lingüística, similares a la puntuación. Sin embargo, los primeros estándares de codificación de caracteres (como ASCII) no incluían esta información de estilo, lo que llevó al uso de marcado incrustado. Esto 'contamina' los datos de texto, afectando la eficiencia y la consistencia en el procesamiento de texto. El autor propone un esquema de codificación de caracteres más amplio para codificar directamente la información de estilo en los caracteres, resolviendo este problema.
Desarrollo
codificación de caracteres