Tehnici de Codare a Semnalului Vocal

Previzualizare curs:

Extras din curs:

Aplicatii multimedia care folosesc compresia semnalului vocal

Una dintre cele mai naturale forme de comunicare dintre fiintele umane este comunicarea prin intermediul vorbirii. Prin intermediul ei se transmit gindurile (in forma cea mai importanta de informatie: mesajul lingvistic), personalitatea si starea de emotivitate a locutorului. Mesajul lingvistic este transmis prin intermediul semnalului vocal, unda acustica ce are proprietati bine definite, dar a carei producere si intelegere inca nu a fost descifrata complet. Totusi, exista modele pentru producerea si intelegerea acestui tip de semnal la nivel cerebral.

Revolutia aplicatiilor multimedia include in mod inevital transmiterea si a semnalului vocal, pe linga alte tipuri de semnale: video, text, imagini, muzica, etc. Dar, data fiind capacitatea limitata a canalelor de comunicatie si nevoia de a transmite cit mai multa informatie intr-un timp limitat a condus la necesitatea de compresie a acestor semnale.

In Tabelul 1.1.1. sunt prezentate debitele necesare pentru a transmite diferite tipuri de semnale audio. Se observa ca in toate cele trei cazuri date ca exemplu, debitul este mult mai mare decit debitul de 64 Kbps asigurat de un sistem PCM clasic. Vom vedea putin mai departe ca exista sisteme de compresie capabile de transmisia semnalului vocal la debite sub 2400 bps, deci cu rapoarte de compresie mai mari de 5000 (cresterea raportului de compresie este totusi platita prin pierderea unor informatii de finete din semnalul audio). In mod cert, sistemele multimedia necesita astfel de rapoarte de compresie, deci prelucrari suplimentare ale semnalului vocal.

Tabelul 1.1.1. Debitele binare corespunzatoare diferitelor tipuri de semnal audio

Tip semnal Banda Frecventa de esantionare Biti/esantion Debit binar fara compresie

Semnal vocal de banda limitata 200 - 3200 Hz 8 KHz 16 128 Kbps

Semnal vocal de banda larga 50 – 7000Hz 16 KHz 16 256 Kbps

Audio CD 20 –20000Hz 44.1 KHz 16 x 2 canale 1.41 Mbps

Tipurile de aplicatii multimedia care utilizeaza transmisia semnalului vocal pot fi analizate in Tabelul 1.1.2

Tabelul 1.1.2. Aplicatii multimedia ce folosesc transmisia semnalului vocal

Aplicatie multimedia Conversational ? Retea de comunicatii in timp real?

Videotelefonie, videoconferinta Da Da

Conferinta de afaceri cu distribuire de date Da Da

Educatie la distanta Nu Da

Jocuri cu un singur utilizator Nu Posibil

Jocuri cu mai multi utilizatori sI acces de la distanta Posibil Da

Mesaje multimedia Nu Posibil

Documente adnotate vocal Nu Nu

1.2. Atributele sistemelor de compresie a semnalului vocal

In cele mai multe cazuri sistemele pentru compresia semnalului vocal sunt implementate in concordanta cu cerintele unei anumite aplicatii. Din acest unghi de vedere este important de discutat atributele unor astfel de sisteme de compresie cu scopul de a le optimiza pentru cazul aplicatiilor reale. Principalele atribute ale unui sistem de compresie a semnalului vocal sunt:

• debitul binar

• calitatea semnalului reconstituit la receptie

• complexitatea (timp de calcul sau memorie necesara)

• intirzierea

• imunitatea la erorile din canalul de comunicatie

• banda necesara transmiterii

a) debitul binar

Reducerea debitului binar este principala motivatie in realizarea compresiei de semnal. In functie de aplicatie si de constringerile de proiectare, debitul poate fi fix sau variabil. Sistemele de compresie adesea au un debit fix din cauza ca sunt mai usor de realizat, nu necesita definirea unor criterii pentru modificarea debitului intr-un anumit interval de timp, iar daca linia de comunicatii are o capacitate fixa in principiu se recomanda selectarea unui codec cu un debit de iesire egal cu cel al canalului (incluzind bitii de protectie la erori). Sistemele cu debit variabil se bazeaza pe utilizarea a doua debite: debit mai mare pentru transmisia vocii, debitul mic pentru transmiterea unor informatii specifice - pe durata portiunilor de liniste sau a pauzelor dintre cuvinte. Pentru viitor se estimeaza utilizarea pe scara din ce in ce mai mare a sistemelor de compresie cu debit variabil.

Debite binare fixe se folosesc in:

• comunicatii telefonice militare la debit redus: 0.8 - 4.8 Kbps

• comunicatii celulare sau prin satelit: 3.3 - 13 Kbps

• comunicatii pe linie telefonica: debit mai mare de 16 Kbps

Debite binare variabile sunt foarte importante in:

• comunicatii mobile folosind CDMA (la debit redus capacitatea sistemului creste)

• aplicatii care nu necista timp real (de exemplu memorarea)

b) calitatea semnalului reconstituit

Evaluarea calitatii semnalului reconstituit este una din cele mai dificile probleme, deoarece nu a fost posibila gasirea unui criteriu obiectiv de masurare prin care sa poata fi corelat semnalul sintetizat cu semnalul de intrare si cu larga varietate de sisteme de compresie. Mai mult, descresterea debitului binar face dificila estimarea comportarii codecului in aplicatii reale. De aceea s-au stabilit criterii subiective de evaluare, bazate pe un mare numar de codari/decodari pentru care, in mod subiectiv se stabileste calitatea semnalului de iesire.

Exista urmatoarele criterii subiective pentru aprecierea calitatii sistemelor de compresie:

• DRT (Diagnistic Rhyme Test) pentru aprecierea inteligibilitatii

• DAM (Diagnostic Acceptability Measure), pentru aprecierea calitatii in conditii variate de distorsiune a semnalelor

• MOS (Mean Opinion Score), pentru aprecierea globala a calitatii, prin intermediul unui numar, obtinut ca medie a evaluarilor a 20 - 60 ascultatori. Numarul este intre 1 (calitate inacceptabila) si 5 (calitate excelenta).

c) complexitatea

Complexitatea ca timp de calcul si necesar de memorie determina in principal costul si energia consumata de echipamentul hardware care realizeaza compresia. Cu exceptia citorva aplicatii, cum ar fi sistemele de informare sau transmiterea unor mesaje, compresia trebuie realizata in timp real. Pentru indeplinirea cerintelor de mai sus solutia este implementarea algoritmului de compresie pe un procesor de semnal.

In cazul sistemelor comerciale de uz individual (telefoane mobile, sisteme de raspuns automat), se aleg procesoare mai ieftine, care opereaza in virgula fixa. Pentru sisteme in care mai multi utilizatori au acces la resursele hardware se prefera procesoare in virgula mobila, deoarece costul sistemului este mai putin important fata de costul dezvoltarii aplicatiilor. In plus, procesoarele de semnal pot avea memorie inclusa, iar un acelasi procesor poate efectua atit functiile sitemului de compresie cit si cele ale sistemului de transmisie (modem).

d) intirzierea

Intirzierea datorata prelucrarilor care se efectueaza asupra semnalului in vederea compresiei au importanta majora in special in cazul comunicatiilor in ambele directii. Exista doua praguri pentru intirzierea unui sistem de compresie.

Primul prag (de valoare aproximativ 150 ms) este cel care afecteaza continuitatea unei comunicari bidirectionale. Pentru comunicatii intr-un singur

sens o intirziee de 400 - 500 ms este acceptabila.

Al doilea prag este determinat de prezenta ecoului, de aceea se impun restrictii importante asupra sistemului de compresie daca ecoul nu este eliminat. Pragul depinde de tipul canalului de comunicatie.

Intirzierea unui sistem de compresie are urmatoarele 4 componente:

• intirzierea algoritmului: majoritatea algoritmilor lucreaza pe cadre de semnal; prelucrarea nu poate incepe pina cind un cadru de semnal nu s-a acumulat in bufferul de prelucrare. In plus, unii algoritmi au nevoie de esantioane suplimentare, adica de un extra-cadru (timp numit "look-ahead"). Astfel, intirzierea algoritmului este data de dimensiunea unui cadru plus dimensiunea unui extra-cadru.

• intirzierea cauzata de timpul de prelucrare: este timpul necesar prelucrarii unui cadru. In majoritatea sistemelor acest timp este mai mic decit fereastra de analiza, astfel procesorul ramine liber pina la sosirea unui nou cadru

• intirzierea cauzata de multiplexare: de obicei bitii rezultati din compresie sunt protejati la erorile din canalul de comunicatie prin introducerea de biti de corectie. Timpul necesar "asamblarii" bitilor de informatie cu bitii de corectie este timpul de multiplexare. Operatia este necsara si la receptie.

• intirzierea cauzata de tansmisie: este timpul necesar transmisiei fluxului de date. Adesea, o anumita sursa vocala este multiplexata cu alte informatii sau poate ocupa un intreg canal. In principiu timpul de transmisie este mai mic decit durata unui cadru.

Download gratuit

Documentul este oferit gratuit,
trebuie doar să te autentifici in contul tău.

Structură de fișiere:
  • Tehnici de Codare a Semnalului Vocal.doc
Alte informații:
Tipuri fișiere:
doc
Nota:
9/10 (2 voturi)
Nr fișiere:
1 fisier
Pagini (total):
45 pagini
Imagini extrase:
45 imagini
Nr cuvinte:
16 875 cuvinte
Nr caractere:
97 722 caractere
Marime:
1.15MB (arhivat)
Publicat de:
NNT 1 P.
Nivel studiu:
Facultate
Tip document:
Curs
Domeniu:
Calculatoare
Predat:
la facultate
Materie:
Calculatoare
Sus!