charset.school
Décoder UTF-8

sandbox

Sandbox UTF-8 (décodage)

Convertis une suite d'octets UTF-8 en code point Unicode.

Hex (avec ou sans 0x), séparé par espaces / virgules / sans séparateur.

U+00E9é
2 octets

Décimal

233

Octets

0xC3 0xA9

Binaire

11000011
10101001

Étapes détaillées

  1. 01

    Identifier le nombre d'octets

    Premier octet 110xxxxx (deux 1 puis 0) - format 2 octets.

    2 octets · U+0080 → U+07FF
  2. 02

    Extraire les bits de données

    Pour chaque octet, on enlève le marqueur du format (110/1110/11110 pour le leader, 10 pour la continuation) - il reste les bits de données.

    00011 | 101001
  3. 03

    Reconstituer le binaire

    On concatène les groupes pour reformer le binaire complet du code point (11 bits significatifs).

    00011101001
  4. 04

    Convertir en code point

    Le binaire vaut 233 en décimal, soit U+00E9 en notation Unicode.

    U+00E9
charset.school

Outil pédagogique. Pas de tracking, pas de pub.

Développé par Florent Sorel