charset.school
Décoder UTF-32

sandbox

Sandbox UTF-32 (décodage)

Convertis 4 octets UTF-32 en code point Unicode, en précisant l'endianness.

Hex (avec ou sans 0x). UTF-32 prend exactement 4 octets par code point.

Endianness
U+1F389🎉
4 octets

Décimal

127881

Octets

0x89 0xF3 0x01 0x00

Binaire

10001001
11110011
00000001
00000000

Étapes détaillées

  1. 01

    Endianness précisée

    On lit les 4 octets avec l'octet de poids faible en premier (Little Endian). On inverse mentalement l'ordre des octets avant d'assembler le nombre.

    Little Endian (LE)
  2. 02

    Reconstituer le binaire

    On concatène les 4 octets (réordonnés en Big Endian) pour reformer le binaire complet sur 32 bits.
    En UTF-32 ce binaire EST le code point - pas de marqueur à retirer, pas de surrogate à recombiner.

    00000000000000011111001110001001
  3. 03

    Convertir en code point

    Le binaire vaut 127881 en décimal, soit U+1F389 en notation Unicode.

    U+1F389
charset.school

Outil pédagogique. Pas de tracking, pas de pub.

Développé par Florent Sorel