Modalități de adnotare a unităților de discurs și a coreferințelor

Previzualizare licența:

Cuprins licența:

1 INTRODUCERE
2 TEORII DE MODELARE A DISCURSULUI
2.1 DIRECTII ACTUALE IN MODELAREA DISCURSULUI
2.1.1 GROSZ & SIDNER
2.1.2 MODELUL CACHE
2.1.3 TEORIA STRUCTURII RETORICE
2.2 TEORIA CENTRELOR
2.2.1 DESCRIERE
2.2.2 VARIATII LA TEORIA CENTRELOR
2.3 TEORIA NERVURILOR - UN MODEL AL ORGANIZARII IERARHICE A DISCURSULUI
2.3.1 DEFINITII
2.3.2 CONJECTURI
3 FENOMENE ANAFORICE IN DISCURS
3.1 DEFINITII
3.2 TIPURI DE REFERINTE
3.2.1 REFERINTE PRONOMINALE
3.2.2 NUME PROPRII
3.2.3 EXPRESII INDEFINITE
3.2.4 EXPRESII DEFINITE
3.2.5 ANAFORE EVENIMENTIALE
3.2.6 ANAFORE FUNCTIONALE
3.3 REZOLVAREA FENOMENELOR ANAFORICE
3.3.1 INTRODUCERE
3.3.2 SURSE DE CUNOASTERE IN DEPISTAREA ANAFORELOR
3.3.3 IDEI PENTRU UN ALGORITM DE REZOLVARE A REFERINTELOR
4 UN ALGORITM DE REZOLUTIE A ANAFORELOR
4.1 PRIVIRE GENERALA
4.2 REPREZENTAREA CENTRELOR
4.3 ADNOTAREA TEXTULUI
4.3.1 GENERALITATI
4.3.2 CE SECVENTE DE TEXT SE ADNOTEAZA
4.3.3 CE CATEGORII MORFOLOGICE SE ADNOTEAZA
4.3.4 EXEMPLU DE TEXT ADNOTAT
4.4 MARCAREA REZULTATELOR
4.4.1 MARCAREA COREFERINTELOR
4.4.2 MARCAREA RELATIILOR FUNCTIONALE
4.5 DESCRIEREA ALGORITMULUI
4.5.1 PRINCIPII DE FUNCTIONARE A ALGORITMULUI
4.5.2 REZULTATE ADITIONALE
4.5.3 INCADRAREA APLICATIEI INTR - UN PARSER DE DISCURS
4.5.4 DETALII DE IMPLEMENTARE
5 CONCLUZII
6 REFERINTE BIBLIOGRAFICE
7 ANEXA

Extras din licența:

Lucrarea are drept scop analiza fenomenelor anaforice si identificarea mijloacelor prin care se poate face rezolvarea referintelor in discurs.

Algoritmul propus realizeaza o tratare uniforma a tuturor tipurilor de referinte si se bazeaza pe integrarea mai multor surse de cunoastere care colaboreaza la dezambiguizarea textului.

Aplicatia este parte integranta a unui parser de discurs, constituind un modul care pe baza unui proces de rezolvare a referintelor calculeaza un scor al arborelui de discurs, dar poate fi privita si ca o aplicatie independenta, care realizeaza depistarea legaturilor referentiale si marcarea acestora prin adnotarea textului de intrare in maniera SGML.

Procesul functioneaza incremental, in sensul procesarii textului unit cu unit, pentru a satisface cerintele de proiectare a parserului de discurs, dar in cazul rularii independente a aplicatiei textul este preluat integral, deoarece se considera ca aceasta maniera de prelucrare ofera informatii suplimentare fata de prelucrarea incrementala. Un rezultat aditional al aplicatiei il constituie validarea Teoriei Nervurilor, in sensul realizarii unor statistici privind corectitudinea predictiilor sale.

O caracteristica a aplicatiei o constituie posibilitatea ca aceasta sa functioneze chiar in lipsa unora din informatiile folosite de modulele programului; fireste, efectul este diminuarea preciziei rezultatelor. Prin modul de proiectare a aplicatiei este posibila adaptarea acesteia in sensul adaugarii altor surse de cunoastere la cele existente in prezent fara a fi necesara reevaluarea strategiei de lucru. Introducerea unor noi module are ca efect rafinarea procesului de rezolutie a anaforelor si ameliorarea rezultatelor. Capitolul I prezinta directiile principale in modelarea discursului, si anume modelul starilor atentionale Grosz&Sidner, teoria structurii retorice, modelul cache si Teoria Centrelor, cu variatiile sale.

Se insista asupra Teoriei Nervurilor, deoarece aceasta constituie un punct important in economia algoritmului.

Capitolul II sintetizeaza caracteristicile fenomenelor anaforice in discurs, precum si modalitatile de abordare a rezolutiei anaforelor.

Sunt prezentate diverse surse de cunoastere si posibilitatile de integrare a lor intr-un astfel de proces; se fac referiri la cateva abordari cunoscute ale problemei rezolutiei anaforelor.

Capitolul III prezinta un algoritm de rezolutie a anaforelor bazat pe integrarea mai multor surse de cunoastere, dintre care un rol important il are Teoria nervurilor.

Sunt prezentate principiile generale de lucru ale algoritmului, scopul sau si rezultatele obtinute.

In anexe se prezinta ierarhia de clase care au fost folosite pentru implementarea algoritmului si un exemplu de text adnotat SGML in care au fost marcate coreferintele, asa cum au rezultat in urma rularii programului.

2. 1 DIRECTII ACTUALE IN MODELAREA DISCURSULUI 2. 1. 1 GROSZ & SIDNER Teoria structurii discursului elaborata de Grosz si Sidner [Grosz, Sidner-1986] distinge ...

Bibliografie:

CRISTEA DAN, IDE NANCY, ROMARY LAURENT - DI EUGENIO BARBARA - "CENTERING IN ITALIAN" - IN "CENTERING IN DISCOURSE", OXFORD ACADEMIC PRESS, 1996

FOX BARBARA - "DISCOURSE STRUCTURE AND ANAPHORA", 1987

GROSZ BARBARA J. , SIDNER CANDACE - "ATTENTIONS" - INTENTIONS AND THE STRUCTURE OF DISCOURSE, 1986

GROSZ BARBARA J. , JOSHI ARAVIND, WEINSTEIN SCOTT - "CENTERING: A FRAMEWORK FOR MODELLING THE LOCAL COHERENCE OF DISCOURSE" - COMPUTATIONAL LINGUISTICS 21(2):203 - 225, 1995

KENNEDY C. , BOGURAEV B. - "ANAPHORA FOR EVERYONE: PRONOMINAL ANAPHORA RESOLUTION WITHOUT A PARSER" - PROCEEDINGS OF THE 16TH INTERNATIONAL CONFERENCE ON COMPUTATIONAL LINGUISTICS COLING96, COPENHAGEN, DENMARK, 5 - 9 AUGUST 1994

LAPPIN SH. , LEASS SH. - "AN ALGORITHM FOR PRONOMINAL ANAPHORA RESOLUTION" - COMPUTATIONAL LINGUISTICS, 20(4), 1994

STRUBE MICHAEL, HAHN UDO - "FUNCTIONAL CENTERING" - IN PROCEEDINGS OF ACL96, PAG. 270 - 277, 1996

STRUBE MICHAEL, HAHN UDO - "PARSETALK ABOUT SENTENCE AND TEXT - LEVEL ANAPHORA" - IN PROCEEDINGS OF EACL95, PAG. 237 - 244, 1996

STRUBE MICHAEL - "PROCESSING COMPLEX SENTENCES IN THE CENTERING FRAMEWORK" - IN PROCEEDINGS OF ACL96, 1996

STRUBE MICHAEL - "INCREMENTAL CENTERING AND CENTER AMBIGUITY" - IN PROCEEDINGS OF THE 18TH ANNUAL CONF. OF THE COGNITIVE SCIENCES SOCIETY, 1996

VIEIRA RENATA, POESIO MASSIMO - "PROCESSING DEFINITE DESCRIPTION IN CORPORA"

WALKER MARILYN - "LIMITED ATTENTION AND DISCOURSE STRUCTURE" - COMPUTATIONAL LINGUISTICS, 22(2), PAG. 255 - 264, 1996

WALKER MARILYN - "CENTERING" - ANAPHORA RESOLUTION AND DISCOURSE STRUCTURE, 1994

WALKER MARILYN, MASAYO IIDA, SHARON COTE - "JAPANESE DISCOURSE AND THE PROCESS OF CENTERING" - COMPUTATIONAL LINGUISTICS, 20(2), PAG. 193 - 233, 1994

Descarcă licența

Pentru a descărca acest document,
trebuie să te autentifici in contul tău.

Structură de fișiere:
  • Modalitati de adnotare a unitatilor de discurs si a coreferintelor
    • Bibliografie.doc
    • Cuprins.doc
    • Diploma.doc
Alte informații:
Tipuri fișiere:
doc
Diacritice:
Da
Nota:
9/10 (1 voturi)
Anul redactarii:
1998
Nr fișiere:
3 fisiere
Pagini (total):
51 pagini
Imagini extrase:
61 imagini
Nr cuvinte:
12 810 cuvinte
Nr caractere:
68 931 caractere
Marime:
83.48KB (arhivat)
Publicat de:
Anonymous A.
Nivel studiu:
Facultate
Tip document:
Licența
Domeniu:
Calculatoare
Predat:
la facultate din Iasi
Materie:
Calculatoare
Sus!