Compresia Datelor

Previzualizare curs:

Extras din curs:

1. INTRODUCERE

Un sistem de compresie este alcatuit dintr-un bloc de codare (codor) şi un bloc de decodare (decodor). Codorul formeaza cuvantul de cod pe baza distributiilor de probabilitate asignate si a datelor emise de sursa, iar decodorul reconstruieste datele iniţiale pe baza datelor comprimate.

Fig. 1.1. Sistem de compresie de date

În practică se întâlnesc două tipuri de sisteme de compresie a datelor:

• sisteme de compresie fără pierderi

• sisteme de compresie cu pierderi

Pentru evaluarea performanţelor sistemelor de compresie este necesară o modalitate de a măsura compresia. O metrică des utilizată este raportul de compresie (raportul dintre dimensiunea datelor emise de sursa [biti] si dimensiunea datelor comprimate [biti])

Compresia fara pierderi se aplica in general in cazul fisierelor text (documente, coduri sursa, etc). Raportul de compresie obtinut in acest caz este modest: 2:1, maxim 8:1 (uzual 4:1).

Compresia cu pierderi se aplica cu precadere in cazul imaginilor (foto digitizat, video digitizat), semnalelor (vocal, muzical, senzor). In acest caz se poate obtine un raport de compresie mare.

1.1 COMPRESIE FĂRĂ PIERDERI

În figura 1.2 este reprezentat un sistem de compresie fără pierderi. Sistemele de compresie fără pierderi conservă entropia sursei, decodorul este în măsură să reconstruiască perfect datele emise de sursă. Informaţia de la o sursă fără redundanţă nu poate fi comprimată fără pierderi

Fig. 1.2. Sistem de compresie fără pierderi

Secvenţa X = (x1,x2, ... ,xn) reprezinta datele emise de sursă, simbolurile xi ce formează secvenţa aparţin unui alfabet finit A. Se presupune că lungimea n a secvenţei X este fixă, dar că ea poate fi oricât de mare.

Secvenţa binara B(X) = (b1 , b2 , ... , bk ) se numeşte cuvântul de cod, k reprezintă lungimea secvenţei B(X) şi valoarea ei depinde de secvenţa X.

Raportul de compresie pentru un sistem de codare fără pierderi este "r la 1", unde r este dat de (1.1).

(1.1)

unde |A| reprezintă mărimea alfabetului.

O metrică des utilizată este rata de compresie dată de (1.2). Unitatea de măsură pentru R este ”biţi de cod per dimensiune eşantion date”.

(1.2)

Un sistem de compresie cu raport de compresie r mare este echivalent cu un sistem de compresie cu rată de compresie R mică.

EXEMPLUL 1.1

Considerăm o sursă de date care furnizează datele sub forma unor imagini 4  4, reprezentate pe 4 culori R = “roşu”, O = “orange”, G = “galben”, V = “verde”: în figura 1.3 este reprezentată o astfel de imagine

R R O G

R O O G

O O G V

G G G V

Fig. 1.3 Imagine 4x4 codată

Dacă se scanează această imagine orizontal, asignând intensităţile R  3 , O  2 , G  1 , V  0 , atunci imaginea poate fi reprezentată sub forma următoarei secvenţe de date X = (3, 3, 2, 1, 3, 2, 2, 1, 2, 2, 1, 0, 1, 1, 1, 0).

Se comprimă X utilizând un codor definit de tabelul de codare 1.1.

Download gratuit

Documentul este oferit gratuit,
trebuie doar să te autentifici in contul tău.

Structură de fișiere:
  • Cap1_2011.doc
  • Cap2_2011.doc
  • Cap3_2011.doc
  • Cap4_2011.doc
  • Cap5_2011.doc
  • Cap6_2011.doc
  • Cap7_2011.doc
  • Cap8_2011.doc
  • Cap9_2011.doc
Alte informații:
Tipuri fișiere:
doc
Nota:
10/10 (1 voturi)
Nr fișiere:
9 fisiere
Pagini (total):
266 pagini
Imagini extrase:
267 imagini
Nr cuvinte:
64 422 cuvinte
Nr caractere:
358 280 caractere
Marime:
2.96MB (arhivat)
Publicat de:
NNT 1 P.
Nivel studiu:
Facultate
Tip document:
Curs
Domeniu:
Automatică
Predat:
la facultate
Materie:
Automatică
Sus!