Aspecte privind recunoșterea dintr-un dialog a actelor de vorbire

Previzualizare licența:

Cuprins licența:

1 INTRODUCERE
2 NOTIUNI REFERITOARE LA DIALOG
3 ACTE DE VORBIRE
3.1 ADNOTAREA ACTELOR DE VORBIRE
3.2 INTERPRETAREA ACTELOR DE VORBIRE
3.3 IDENTIFICAREA ACTELOR DE VORBIRE PE BAZA UNUI MODEL MARKOV ASCUNS (HIDDEN MARKOV MODEL - HMM)
3.4 RECUNOASTEREA ACTELOR DE VORBIRE FOLOSIND ALGORITMUL VITERBI
4 NETEZIREA MATRICEI HMM FOLOSIND METODA LUI KATZ
5 PREZENTAREA APLICATIEI
6 SCHEMA BLOC A APLICATIEI
7 PREZENTAREA DETALIATA A FIECARUI PAS IN PARTE
7.1 ADNOTARE
7.2 ADNOTARE MANUALA (ADNOTARE STAR)
7.3 INVATARE
7.4 RECUNOASTERE
7.5 STATISTICA
8 RULAREA APLICATIEI
8.1 LINUX
8.2 WINDOWS
9 CALCULUL DE COMPLEXITATE
10 PREZENTAREA REZULTATELOR
11 CONCLUZII
12 BIBLIOGRAFIE
13 PREZENTAREA SURSELOR

Extras din licența:

Limbajul natural este un fenomen extrem de complicat. El se dezvolta incet si treptat de-a lungul unei perioade indelungate de timp, aparent pentru a optimiza comunicarea dintre oameni. In limbajul natural, apare o mare incidenta a variatiei si incertitudinii. Cea mai mare sursa a variatiei este data de continutul mesajelor. In plus, fiecare mediu de transmisie a limbajului natural este supus la zgomote, distorsiuni si pierderi. Datorita acestor incertitudini se naste nevoia unui model lingvistic. Cea mai importanta utilizarea a modelelor lingvistice este aplicarea in recunoasterea automata a actelor de vorbire, unde un computer este folosit pentru a pune textul intr-o forma acceptabila. Limbajul natural poate fi vazut ca un proces stohastic. Fiecare cuvant, enunt, document sau alt nivel al vorbirii este tratat ca fiind o variabila aleatoare cu o anumita probabilitate de distributie. Daca W=w1w2 wn reprezinta o secventa de n cuvinte, scopul modelului lingvistic este de a calcula probabilitatea P (W). O metoda de a calcula aceasta probabilitate este de a considera o regula de tip lant, in care cuvintele de la un anumit moment depind de cele dinaintea lui. In lucrarea de fata se inceaca o abordare de acest gen. Se doreste sa se ajunga la recunoasterea actelor de vorbire din texte de tip chat care au un anumit format, recunoastere bazata pe identificarea unor modele lingvistice ale textelor si pe gasirea unor cuvinte-cheie specifice fiecarui act de vorbire in parte.

Initial se incearca obtinerea unui model lingvistic prin aplicarea unor tehnici de invatare asupra unor texte adnotate manual si prin folosirea unui model Markov ascuns, iar dupa aceea se incearca recunoasterea actelor de vorbire din texte neadnotate pe baza modelului obtinut in pasul anterior si a identificarii unor cuvinte-cheie specifice pentru fiecare act de vorbire in parte.

Intelegerea limbajului natural din transcrierea dialogurilor ridica probleme specifice fata de textele obisnuite, deoarece dialogul are cateva caracteristici care ingreuneaza acest lucru. Una din principalele caracteristici ale dialogului este structura sa bazata pe replici (turn-taking), fiecarui participant venindu-i randul la un moment dat sa spuna ceva. Problema este cum isi dau seama participantii cand este randul lor sa vorbeasca. Pentru aceasta, exista o regula care sa modeleze aportul participantilor la un dialog: daca in timpul replicii curente, cel ce vorbeste specifica faptul ca un anumit participant la dialog trebuie sa vorbeasca in continuare, atunci acela este cel ce va urma; daca vorbitorul curent nu specifica nici o persoana ca fiind urmatorul vorbitor, atunci oricine poate sa continue; daca nimeni nu preia rolul de vorbitor in momentul in care vorbitorul curent a terminat ceea ce avea de spus, atunci vorbitorul curent poate sa continue.

Prima parte a regulii are o importanta deosebita, deoarece subliniaza faptul ca exista anumite tipuri de replici prin care un vorbitor poate sa selecteze cine va ...

Bibliografie:

JURAVSKY AND MARTIN - "SPEECH AND LANGUAGE PROCESSING"

ALLEN J. , CORE M. - "DRAFT OF DAMSL: DIALOG ACT MARKUP IN SEVERAL LAYERS"

MIRJAM SEPESY MAUCEC - "STATISTICAL LANGUAGE MODELING BASED ON AUTOMATIC CLASSIFICATION OF WORDS"

Descarcă licența

Pentru a descărca acest document,
trebuie să te autentifici in contul tău.

Structură de fișiere:
  • Aspecte privind recunosterea dintr-un dialog a actelor de vorbire
    • Bibliografie.doc
    • Cuprins.doc
    • Diploma.doc
Alte informații:
Tipuri fișiere:
doc
Diacritice:
Nu
Nota:
8/10 (2 voturi)
Anul redactarii:
2004
Nr fișiere:
3 fisiere
Pagini (total):
114 pagini
Imagini extrase:
107 imagini
Nr cuvinte:
19 795 cuvinte
Nr caractere:
127 785 caractere
Marime:
114.30KB (arhivat)
Publicat de:
Anonymous A.
Nivel studiu:
Facultate
Tip document:
Licența
Domeniu:
Calculatoare
Predat:
la facultate din Bucuresti
Specializare:
-
Materie:
Calculatoare
Sus!