charset.school
Encoder en UTF-8

sandbox

Sandbox UTF-8 (encodage)

Convertis un code point Unicode en UTF-8.

Accepte U+XXXX, 0xXX, décimal, ou un caractère unique.

U+00E9é
2 octets

Décimal

233

Hexadécimal

0xC3 0xA9

Binaire

11000011
10101001

Étapes détaillées

  1. 01

    Choisir le format UTF-8

    Plage U+0080U+07FF - 11 bits utiles, au-delà de l'ASCII.

    2 octets · U+0080 → U+07FF
  2. 02

    Convertir en binaire

    Le code point U+00E9 tient sur 11 bits significatifs (paddés à la longueur du format).

    00011101001
  3. 03

    Découper en chunks

    Découpage selon les emplacements payload du format (5 + 6 bits).

    00011 | 101001
  4. 04

    Insérer les marqueurs

    Le premier octet porte le marqueur 110 (3 bits) ; le suivant porte 10 (continuation).

    byte 1
    11000011
    byte 2
    10101001
  5. 05

    Convertir en hexadécimal

    Chaque octet binaire devient sa valeur hex sur 2 chiffres.

    0xC3 0xA9
charset.school

Outil pédagogique. Pas de tracking, pas de pub.

Développé par Florent Sorel