sandbox
Sandbox UTF-8 (décodage)
Convertis une suite d'octets UTF-8 en code point Unicode.
Hex (avec ou sans 0x), séparé par espaces / virgules / sans séparateur.
U+00E9é
2 octetsDécimal
233
Octets
0xC3 0xA9
Binaire
11000011
10101001
Étapes détaillées
- 01
Identifier le nombre d'octets
Premier octet
110xxxxx(deux1puis0) - format 2 octets.2 octets · U+0080 → U+07FF - 02
Extraire les bits de données
Pour chaque octet, on enlève le marqueur du format (
110/1110/11110pour le leader,10pour la continuation) - il reste les bits de données.00011 | 101001 - 03
Reconstituer le binaire
On concatène les groupes pour reformer le binaire complet du code point (11 bits significatifs).
00011101001 - 04
Convertir en code point
Le binaire vaut
233en décimal, soitU+00E9en notation Unicode.U+00E9