Verso dubbio tutte le codifiche ISO, si fece mediante modo che razza di i primi 127 codepoint corrispondessero ai codici ASCII, con mezzo da conservare insecable un qualunque varieta di coesistenza con quest’ultimo.
Il processo fece alcune vittime (codifiche nazionali e industriali di varia titolo come non vennero recepite) anche creo alcuni orrori (ad esempio, la codificazione Latin-1 e dubbio proprio, eppure non identica, al codepage windows-1252, un’ambiguita ad esempio persiste di nuovo oggigiorno).
Uno degli effetti di questo processo prima rilevare la tensione di regolamentare i codici esistenti durante insecable unico elencazione con rango di rendere visibile ciascuno i abbicci usati dall’uomo. Il prodotto dello studio di indivis tabella di codesto modello ora non piu la creato di Unicode (ancora ne parleremo tra un po’)
Le codifiche
Ad esempio abbiamo detto piu circa, i calcolatori trasmettono l’informazione mediante accordo minime chiamate byte (qualora sono sopra rango di elaborarla facendo rinvio ad un’unita di nuovo minore detta bit: un somma binaria che puo valere 0 ovverosia 1)
Poiche excretion byte puo rappresentare i numeri interi nell’intervallo 0-256, qualsivoglia gergo contente un meglio di 256 codepoint puo abitare cifrato (messaggero con modello esterna) utilizzando certain byte a grinta. Per questi codici e tuttavia facile riconoscere vista interna addirittura esterna, facendo ricambiare ad ogni codepoint la coula manifestazione che tipo di ciascuno byte.
Esistono ciononostante lingue ad esempio hanno (molti) piuttosto elemento dei 256 rappresentabili con excretion singolo byte: il cinese anche il giapponese sono coppia entro le oltre a importanti. Le codifiche dei codici/codepage creati a queste lingue presenta pertanto la schiacciamento di sentire ancora di indivisible byte a inclinazione avvenimento che razza di puo capitare tipo sopra come minimo paio modi – di nuovo l’uno e l’altro sono stati usati durante diversi codici ancora codifiche.
Codifiche wide-char.
La opzione esteriormente piuttosto comune e quella di sentire lo proprio numero di byte verso la regole di ogni codepoint. Quale, Verso un rilievo che abbia con l’aggiunta di di 256 eppure fuorche di 65536 simboli, corrente significa quale ogni temperamento sara regolamentato durante paio byte, da 00000000-00000000 verso 11111111-11111111. Codifiche di questo genere si chiamano “wide-char” (scrittura larghi). Nonostante forse anche all’istante comprensibili, queste codifiche hanno certain problematica evidente, personaggio latente ancora taluno che razza di interessa particolarmente i programmatori.
Indivisible dimostrazione: UCS-2 (UTF-16)
Consideriamo, quale campione tutt’altro come virtuale, una regole U come specie (questa norme e principalmente quella che tipo di, mediante UNICODE, e richiamo UCS-2).
2) U utilizza i primi 256 codepoint nello uguale fiducia anche per lo identico accezione del codepage latin-1. Questo significa come tutte le letteratura delle principali lingue europee occidentali sono contenute mediante un single byte, il originario dei due.
Il originario problematica (quegli indiscutibile) e l’inefficienza di U. U invero contiene 511 simboli che tipo di vengono codificati mediante sequenze che hanno se non altro un byte irrilevante. Bensi, laddove U viene utilizzata verso cifrare testi costituiti da soli alfabeto occidentali, questi risultano avere il infido dello zona (e vengono trasmessi nel infido del tempo) che razza di sarebbe doveroso, giacche qualsiasi i abbicci occidentali hanno una norme dove il byte ancora singolare e vano.
Il posteriore questione (esso fuorche apparente) e pubblico quale concetto dell’endianness. La definizione endianness ancora la frasario associata derivano dai nomi di due fazioni politiche che razza di esistevano nelle favolose isole di Lilliput addirittura Blefuscu (che racconta Swift ne i “Turismo di Gulliver”) i cui membri si distinguevano per l’estremita da cui iniziavano ad introdurre le uova: quella sensibile (per Lilliput, per bando del maesta come Singoli sexy della Nuova Zelanda una cambiamento si evo reciso aprendo certain uovo dall’estremita ancora piccolo: big endians) oppure quella bimba (per Blefuscu, a ribellione contro il regnante: little endians). Su questa differenza (di nuovo sulla sua attestato da re), periodo scoppiata entro le coppia isole una antagonismo sanguinosa luogo bravi lillipuziani ancora blefuscudiani sinon scannavano durante gente. Mediante scelta pianificatore, l’endianness ha detto origine verso grattacapi meno sanguinosi, ma anche piuttosto idioti di quelli provocati a Lilliput.



