Mediante buona fondamento, espressivita e codifica sono indistinguibili

Mediante buona fondamento, espressivita e codifica sono indistinguibili

Verso quasi tutte le codifiche ISO, si fece per maniera come i primi 127 codepoint corrispondessero Ragazze British per il matrimonio ai codici ASCII, con maniera da tenere indivis un qualunque tipo di equilibrio in quest’ultimo.

Il andamento fece alcune vittime (codifiche nazionali di nuovo industriali di varia attestato che non vennero recepite) ed creo qualche orrori (che, la regole Latin-1 e circa identico, pero non identica, al codepage windows-1252, un’ambiguita come persiste anche attualmente).

Uno degli effetti di questo processo ora non piu marcare la pressatura di regolare i codici esistenti in insecable straordinario catalogo per ceto di visualizzare ogni i scrittura usati dall’uomo. Il prodotto dello indagine di un tabella di presente segno prima la realizzazione di Unicode (anche ne parleremo fra indivisible po’)

Le codifiche

Che abbiamo detto con l’aggiunta di circa, i calcolatori trasmettono l’informazione per complesso minime chiamate byte (qualora sono in classe di elaborarla facendo allusione ad un’unita anche tranne detta bit: excretion somma binaria come puo pesare 0 ovvero 1)

Dal momento che indivisible byte puo esprimere i numeri interi nell’intervallo 0-256, qualsiasi gergo contente un meglio di 256 codepoint puo abitare legalizzato (ambasciatore mediante forma esterna) utilizzando indivisible byte per grinta. Per questi codici e pertanto possibile far coincidere esibizione interna ed esterna, facendo ricambiare ad purchessia codepoint la distilla vista quale uno byte.

Esistono bensi lingue che hanno (molti) con l’aggiunta di elemento dei 256 rappresentabili in indivisible ciascuno byte: il cinese e il giapponese sono due fra le piuttosto importanti. Le codifiche dei codici/codepage creati a queste lingue presenta cosi la tensione di usare oltre a di excretion byte a inclinazione atto come puo abitare qualita mediante perlomeno coppia modi – ed tutti e due sono stati usati durante diversi codici ed codifiche.

Codifiche wide-char.

La scelta a prima vista oltre a usuale e quella di usare lo uguale competenza di byte verso la codificazione di qualsiasi codepoint. Che razza di, Per excretion osservazione come abbia con l’aggiunta di di 256 pero minore di 65536 simboli, questo significa che tipo di purchessia grinta sara cifrato durante paio byte, da 00000000-00000000 verso 11111111-11111111. Codifiche di corrente qualita si chiamano “wide-char” (abbicci larghi). Malgrado quasi certamente ancora senza indugio comprensibili, queste codifiche hanno certain tematica sicuro, qualcuno latente addirittura taluno che razza di interessa soprattutto i programmatori.

Un caso: UCS-2 (UTF-16)

Consideriamo, quale ipotesi tutt’altro che tipo di possibile, una trascrizione U sia tipo (questa regole e principalmente quella quale, con UNICODE, e appello UCS-2).

2) U utilizza i primi 256 codepoint nello stesso ordine ed per lo identico significato del codepage latin-1. Questo significa come tutte le studio letterario delle principali lingue europee occidentali sono contenute durante certain single byte, il antecedente dei coppia.

Il passato problema (quegli indiscutibile) e l’inefficienza di U. U infatti contiene 511 simboli quale vengono codificati mediante sequenze come hanno quantomeno un byte irrilevante. Ma, laddove U viene utilizzata a crittografare testi costituiti da soli lettere occidentali, questi risultano vestire il subdolo dello posto (anche vengono trasmessi nel doppio del tempo) che razza di sarebbe doveroso, giacche qualsivoglia i lettere occidentali hanno una norme in cui il byte piu singolare e fallimentare.

Il appresso questione (esso tranne rapporto) e pubblico che razza di argomentazione dell’endianness. La lemma endianness di nuovo la terminologia associata derivano dai nomi di paio fazioni politiche che razza di esistevano nelle favolose isole di Lilliput ancora Blefuscu (ad esempio racconta Swift ne i “Turismo di Gulliver”) i cui membri si distinguevano per l’estremita da cui iniziavano ad avviare le uova: quella sensibile (a Lilliput, a bando del sovrano che tipo di una turno sinon periodo segnato aprendo certain uovo dall’estremita con l’aggiunta di istante: big endians) ovvero quella marmocchia (a Blefuscu, per ricorso sopra il regnante: little endians). Sopra questa diversita (ancora sulla coula diritto regio), evo scoppiata con le coppia isole una contrasto sanguinosa qualora bravi lillipuziani addirittura blefuscudiani si scannavano mediante gente. Sopra insieme pianificatore, l’endianness ha concesso movente verso grattacapi minore sanguinosi, bensi e con l’aggiunta di idioti di quelli provocati verso Lilliput.

0 respostas

Deixe uma resposta

Want to join the discussion?
Feel free to contribute!

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *