UTF-8 : Un design brillant

L'élégance de UTF-8 réside dans sa compatibilité ascendante avec ASCII tout en prenant en charge des millions de caractères. Cet article explique clairement le fonctionnement de UTF-8 : il utilise les bits de tête pour indiquer la longueur du caractère (1 à 4 octets), les caractères ASCII ne nécessitant qu'un seul octet. Des exemples montrent le codage et le décodage de texte avec des caractères ASCII et des emojis. Comparé à d'autres encodages, l'équilibre de UTF-8 entre compatibilité et extensibilité est un chef-d'œuvre de conception.
Lire plus