Come trovo il codice UTF8 a partire dal suo valore?

Esempio:

The Unicode code point for "€" is U+20AC

- quanti byte di codifica sono previsti per questo carattere?
 -risp: 3 byte perché è nell'intervallo 0x000800 - 0x00FFFF

- scrivo in binario il valore del carattere:
 -risp: 0010 0000 1010 1100

- il codice UTF-8 a 3 byte prevede questa forma 1110xxxx 10xxxxxx 10xxxxxx

- riscrivo il valore del carattere in binario raggruppando secondo la formula
 -risp: 0010 000010 101100

- sostituisco nel codice:
 -risp 11100010 10000010 10101100
   in esadecimale:    0xE282AC

Ultime modifiche: sabato, 6 ottobre 2012, 12:15