Las trampas del límite de longitud de cadena

2025-04-30

Esta publicación profundiza en las complejidades de la limitación de la longitud de la cadena. Las diferentes codificaciones de caracteres (UTF-8, UTF-16, puntos de código Unicode, grupos de grafemas) dan lugar a diferentes métodos de cálculo de la longitud, lo que provoca fácilmente inconsistencias entre el front-end, el back-end y las capas de la base de datos, dando como resultado errores. El autor sugiere utilizar el recuento de puntos de código Unicode con normalización NFC, aunque no es perfecto, como el mejor enfoque. El artículo también explora las ventajas y desventajas del recuento de grupos de grafemas, el recuento de bytes UTF-8 y el recuento de unidades de código UTF-16, y proporciona un ejemplo de código para un método de recuento híbrido.

Leer más
Desarrollo longitud de cadena