Breadcrumbs

 

Glossario parole informatiche  <clicca qui

 

 

Il codice ASCII (si pronuncia "askii"), che sta per American Standard Computer Information Exchange è la tabella più usata

universalmente per la codifica dei dati alfanumerici. Proposto dall'ANSI nel 1963 (definitivo nel 1968) è divenuto uno

standard ISO 646. Il codice ASCII standard `e codificato su 7 bit, e quindi può rappresentare al massimo 27 = 128 simboli

diversi. Esiste una versione del codice ASCII che usa un byte. Tale codice viene detto Codice ASCII esteso e permette la

rappresentazione di 28=256 caratteri, (128 di base con le varianti relative alle diverse lingue + i caratteri speciali e grafici).

Caratteristica comune ai due codici è la presenza dei primi 31 caratteri, chiamati caratteri di controllo, che producono

un'azione e non sono stampabili. Come si potrà notare il set di caratteri a disposizione non e' poi così ampio, infatti, essendo

stata concepita in America, la tabella ASCII standard non comprende le lettere accentate (sconosciute all'ortografia inglese).

L'alfabeto latino, usato nella scrittura di molte lingue nel mondo, presenta una grande quantità di varianti grafiche: si va dalle

semplici vocali accentate (accento grave à, acuto á, circonflesso â, dieresi ä, tilde ã) a lettere modificate (lettere con barrette,

cediglie, segni), lettere speciali usate solo in una lingua, segni di punteggiatura particolari (il punto interrogativo ed il punto

esclamativo capovolti usati nello spagnolo), simboli di valuta, e così via, del tutto assenti nell'ortografia inglese. Per questo

motivo esistono diverse estensioni della tabella ASCII: lo standard ISO 8859 prevede 15 diverse estensioni, comprese quelle

per gli alfabeti diversi dal latino, ma esistono anche ulteriori estensioni non riconosciute dall'ISO e create per esempio

dalla Microsoft per i sistemi Windows o dalla Apple per i Macintosh. La tabella ASCII estesa tipicamente utilizzata in Italia è

quella dell'Europa occidentale, creata per le lingue germaniche e neolatine (escluso il rumeno). Altre estensioni usate

in Europa sono la Centro Europea per i paesi dell'Europa orientale (lingue slave, ungherese, rumeno), la Turca, la Cirillica e

la Greca. Di seguito è riortata la tabella ASCII standard (US ASCII ISO 646 International Reference Version).

 

 

 

Dal n° 0 al n° 31 sono dei caratteri di controllo per periferiche,

dal n° 32 al n° 47 vari caratteri,

dal n° 48 al n° 57 cifre decimali,

dal n° 58 al n° 64 vari caratteri,

dal n° 65 al n° 90 lettere maiuscole dell'alfabeto,

dal n° 91 al n° 96 vari caratteri,

dal n° 97 al n° 122 lettere minuscole dell'alfabeto,

dal n° 123 al n° 127 vari caratteri.

Con 1 byte (28=256) è possibile realizzare 256 diverse combinazioni, quantità sovrabbondante per la descrizione dei vari

caratteri della tabella standard (un bit di troppo). Questa ridondanza puo essere sfrutttata per sottrarre l'ultimo bit alla

descrizione del carattere, dedicandolo a quello che si chiama controllo di parità (parity check). Se il risultato è un numero

pari, il bit di parità viene posto a 1, mentre se sono dispari viene posto a 0:

 

 

La tabella ASCII estesa varia come già accennato in base alla zona geografica di utilizzo e al softwere utilizzato. Le 15

estensioni previste dall'ISO 8859 sono:

 

 

Per ottenere un carattere in codifica HTML ("entità") basta scriverne il numero preceduto da &# e succeduto da ;

La tabella ASCII (American Standard Code for Information Interchange) è un codice convenzionale usato
per la rappresentazione dei caratteri di testo attraverso i byte: ad ogni byte viene fatto corrispondere un
diverso carattere della tastiera (lettere, numeri, segni). In realtà lo standard ASCII copre solo i primi 128 byte
(da 00000000 a 01111111), i successivi byte fino al 256° costituiscono la tabella ASCII estesa che presenta
varie versioni a carattere nazionale.


Nella tabella ASCII standard si trovano le cifre numeriche, le lettere maiuscole e minuscole (maiuscole e
minuscole hanno codici ASCII differenti) la punteggiatura, i simboli aritmetici e altri simboli ($, &, %, @, #,
ecc.). Essendo stata concepita in America, la tabella ASCII standard non comprende le lettere accentate
(sconosciute all'ortografia inglese). I primi 32 byte della tabella standard sono inoltre riservati per segnali di
controllo e funzioni varie.
I Byte da 0 a 31 sono riservati per dei segnali di controllo. Se si sta usando Windows si può ottenere ogni
carattere ASCII tenendo premuto il tasto Alt e digitando il codice decimale corrispondente col tastierino
numerico (se il tastierino numerico non fosse attivo, premere prima il tasto Num lock o Bloc Num per
attivarlo). per esempio la chiocciola @ si ottiene digitando 64 mentre si tiene premuto il tasto Alt. Nella
tastiera inglese sono già presenti tutti i caratteri della tabella standard; nella tastiera italiana invece mancano
l'apice (96), le parentesi graffe (123,125) e la tilde (126).


L'alfabeto latino, usato nella scrittura di molte lingue nel mondo, presenta una grande quantità di varianti
grafiche: si va dalle semplici vocali accentate (accento grave à, acuto á, circonflesso â, dieresi ä, tilde ã) a
lettere modificate (lettere con barrette, cediglie, segni), lettere speciali usate solo in una lingua, segni di
punteggiatura particolari (il punto interrogativo ed il punto esclamativo capovolti usati nello spagnolo), simboli
di valuta, e così via, senza considerare poi che gran parte di questi segni presentano le due forme maiuscola
e minuscola.


Le varianti sono talmente numerose che i 128 byte della tabella estesa non sono purtroppo sufficienti a
rappresentarle tutte, per questo motivo esistono diverse estensioni della tabella ASCII: lo standard ISO 8859
prevede 15 diverse estensioni, comprese quelle per gli alfabeti diversi dal latino, ma esistono anche ulteriori
estensioni non riconosciute dall'ISO e create per esempio dalla Microsoft per i sistemi Windows o dalla
Apple per i Macintosh. Persino l'MS-DOS usava un'estensione diversa da quella di Windows. La tabella
ASCII estesa tipicamente utilizzata in Italia è quella dell'Europa occidentale, creata per le lingue germaniche
e neolatine (escluso il rumeno). Altre estensioni usate in Europa sono la Centro Europea per i paesi
dell'Europa orientale (lingue slave, ungherese, rumeno), la Turca, la Cirillica e la Greca.


Per cercare di ovviare al problema è stato creato un nuovo standard internazionale detto Unicode, definito
dalla Unicode Consortium e dalla International Organization for Standardization (ISO 10646), che
rappresenta i caratteri usando 2 byte (16 bit). Con 2 byte il numero di combinazioni possibili diventa 256x256
= 65.536, perciò Unicode supporta 65.536 diversi segni, al posto dei 256 del set ASCII. Si riescono così a
rappresentare non solo tutte le varianti dell'alfabeto latino, ma anche tutti gli altri alfabeti (greco, cirillico,
arabo, ebraico...) oltre all'insieme degli ideogrammi cinesi e giapponesi (che sono in tutto circa 30.000,
anche se poi ne vengono effettivamente utilizzati solo poche migliaia). Lo standard definitivo è ancora in
corso di definizione, ma i codici disponibili sono così numerosi, che pare verranno inseriti in Unicode persino
gli alfabeti di fantasia come l'Elfico di Tolkien o il Klingon di Star Trek. Lo svantaggio dell'Unicode, rispetto
all'ASCII, è che le dimensioni dei file di testo risultano comunque raddoppiate (vengono usati 2 byte per
carattere, invece di 1 solo).

 

La tabella riportata di seguito è quella usata da Windows italiano; già la versione inglese di Windows
usa tabella diversa. I caratteri si ottengono tenendo premuto il tasto Alt e digitando col tastierino numerico il
codice decimale corrispondente (se il tastierino numerico non fosse attivo, premere il tasto Num lock o Bloc
Num per attivarlo). Per esempio la ß (doppia "s" tedesca) si ottiene digitando 225 mentre si tiene premuto il
tasto Alt. Sulla tastiera italiana sono comunque già disponibili alcune delle lettere accentate (ma non le
lettere accentate maiuscole).
Si osservi come nella tabella estesa si trovino ripetuti più volte alcuni segni (per esempio: + - _ ) che peraltro
sono pure compresi nella tabella standard. Si tratta in effetti di Byte non definiti a cui è stato assegnato un
simbolo più o meno a caso.

 

Il calcolatore, nato per trattare numeri, col passare degli anni ha trovato impiego anche in quelle attività che devono trattare

caratteri, frasi, parole, ecc. Nasce, quindi, l'esigenza di individuare dei meccanismi che realizzino una corrispondenza tra la

rappresentazione dell'informazione più vicina all'uomo con quella propria degli elaboratori digitali. A tale scopo, vengono

create delle tabelle che fanno corrispondere ad ogni carattere una sequenza di bit. Mediante l'utilizzo di queste tabelle di

conversione, qualsiasi elaboratore può codificare in binario le informazioni ricevute, memorizzarle, manipolarle e trasmetterle

(con un processo inverso detto di decodifica) in formato comprensibile all'uomo. Da notare che elaboratori diversi (da diversi

costruttori) possono avere tabelle di conversione diverse, di conseguenza le informazioni non possono essere scambiate tra

elaboratori diversi. Per evitare questi inconvenienti, oggi, vengono utilizzati delle tabelle di codifica standard. Tra queste

citiamo:

 

  • Il codiece CCITT N°5

  • Il codice BCD

  • Il codice EBCDIC

  • Codice ASCII

  • Il codice UNICODE

Privacy Policy