Comments
Transcript
Quante informazioni posso rappresentare con n bit?
INFORMATICA SETTEMBRE- 2015 1ASA Docente Salvatore Mosaico Codifica dell’informazione: A causa delle caratteristiche del computer, per comunicare con esso disponiamo di due soli simboli: lo zero e l’uno. La codifica è la tecnica che permette di rappresentare i vari tipi di informazione (numeri, caratteri, istruzioni, immagini, suoni) usando soltanto i simboli 0 e 1. Per questo utilizziamo il sistema binario (base 2) La cifra, nel sistema binario, che può valere soltanto 0 oppure 1, si chiama BIT (Binary Digit) Quante informazioni posso rappresentare con n bit? NUMERO BIT 1 bit 2 bit 3 bit n bit NUMERO INFORMAZIONI 2 (0,1) 4 (00,01,10,11) 8 (000,001,010,011,100,101,110,111) 2n 1 INFORMATICA SETTEMBRE- 2015 1ASA Docente Salvatore Mosaico Multipli e sotto multipli 1B ( BYTE) 1kB (KAPPA) 1MB (MEGA) 1GB (GIGA) 1TB (TERA) 8 BIT 1024 B 1024 KB 1024 MB 1024 GB 210 220 230 240 Un byte corrisponde ad un carattere Esempio quanti caratteri corrispondono a 640kb? 1024 B 640kB = =640 *1024 B = 665.360 B 1kb 2 INFORMATICA SETTEMBRE- 2015 1ASA Docente Salvatore Mosaico Codifica caratteri La codifica US-ASCII consente quindi la rappresentazione numerica dei caratteri alfanumerici, simboli di punteggiatura e altri simboli. La rappresentazione mediante codifica numerica è necessaria in quanto il computer può "capire" solo sequenze di bit. Per esempio il carattere "@" e' rappresentato dal codice ASCII "64", "Y" dall'"89", "+" dal "43", ecc. Quando qualcuno richiede delle informazioni in formato ASCII (per esempio il vostro curriculum, oppure un articolo, ecc) significa che richiede un testo salvato in una modalità standard facilmente leggibile da qualsiasi sistema operativo e programma. Infatti il formato ASCII e' universalmente riconosciuto da tutti i computer, cosa non e' vera nel caso di testi "formattati", cioè quelli che presentano caratterizzazioni tipografiche come la sottolineature, stili, grassetti, etc. TABELLA CODICI ASCII standard 0-127 (7 bit) 65 66 …. 90 A (premere ALT 65) B (premere ALT 66) 97 …. 122 a 48 …. 49 0 Z z 1 0 1 10 14 20 .. ☺ ◙ ♫ ¶ TABELLA CODICI ASCII ESTESA (8 bit) I caratteri ASCII estesi sono stati introdotti quando i computer, e le persone che li utilizzavano, hanno sentito il bisogno di nuovi simboli, quindi e' stata estesa la tabella originaria aggiungendo segni grafici e nuovi caratteri che, utilizzati insieme, davano la possibilità di creare dei motivi grafici, per esempio tabelle, cornici, semplici riempimenti, simboli matematici e scientifici, eccetera. 3 INFORMATICA SETTEMBRE- 2015 1ASA Docente Salvatore Mosaico Poiché il numero dei simboli usati nelle lingue naturali è di molto più grande dei caratteri codificabili col vecchio ASCII è stato necessario espanderne il set di codifica. Negli anni nei paesi che non utilizzano l'alfabeto latino (o comunque caratteri non presenti nel set ASCII), come i paesi dell'estremo oriente o nel mondo slavo, sono nati metodi di codifica per i caratteri non-standard afflitti però da seri problemi di compatibilità verso gli altri set. Poiché la codifica ASCII utilizza 7 bit, molti dei set di estensione usavano i 128 caratteri aggiuntivi codificabili usando l'ottavo bit disponibile in ogni byte. ■ ÷ ¸ 254 246 247 4 INFORMATICA SETTEMBRE- 2015 1ASA Docente Salvatore Mosaico TABELLA UNICODE (8 bit) Unicode era stato originariamente pensato come una codifica a 16 bit (quattro cifre esadecimali) che dava la possibilità di codificare 65.536 caratteri. Tanto si riteneva essere sufficiente per rappresentare i caratteri impiegati in tutte le lingue scritte del mondo. Ora invece lo standard Unicode, che tendenzialmente è perfettamente allineato con la norma ISO/IEC 10646, prevede una codifica fino a 21 bit e supporta un repertorio di codici numerici che possono rappresentare circa un milione di caratteri. Ciò appare sufficiente a coprire anche i fabbisogni di codifica di scritti del patrimonio storico dell'umanità, nelle diverse lingue e negli svariati sistemi di segni utilizzati. Pian Intervallo Descrizione o 0 000000-00FFFF Basic Multilingual Plane 1 010000-01FFFF Supplementary Multilingual Plane 2 020000-02FFFF Supplementary Ideographic Plane Designato preliminarmente come Tertiary 3 030000-03FFFF Ideographic Plane (TIP), ma nessun carattere gli è stato assegnato al momento[5]. 4-13 040000-0DFFFF Attualmente non assegnati 14 0E0000-0EFFFF Supplementary Special-purpose Plane 15 0F0000-0FFFFF Supplementary Private Use Area-A 16 100000-10FFFF Supplementary Private Use Area-B Alcune Alfabeto arabo ص ṣād Abbreviazione BMP SMP SIP TIP SSP س ش ز ر ذ د ث ج ح خ ت ب ا šīn zāy rāʼ ḏāl dāl ḫāʾ tāʼ bāʼ ʾalif ع غ ف ق ك ل ظ ط ض lām ẓāʼ ṭāʼ ḍād sīn ي و ه ن م yāʼ wāw hāʼ nūn mīm kāf qāf ḥāʾ fā ǧīm ġayn ṯāʼ ʿayn Alcune Lettere dell'alfabeto cirillico А Б В Г Ґ Д Ђ Ѓ Е Ё Є A Be Ve Ge Ge capovolta De Ðje Gje Je Jo Je Ucraina Љ Ж З Ѕ И І Ї Й Ј К Л Že Ze Dze I I ucraina Ji I breve I lunga Ka El 5