Proiectarea și înregistrarea unei baze de date verbal-emoțională pentru o culegere de texte de sinteză în limba bască

Previzualizare referat:

Extras din referat:

Abstract

Aceasta lucrare descrie o baza de date verbale- emotionale inregistrata pentru limba Basca standard. Baza de date a fost proiectatã cu scopul dublu de a fi folositã pentru culegerea de texte de sintezade baza, si de asemenea pentru a permite studiul de modelele prozodice pentru emotii. Baza de date este astfel vasta, pentru a avea o buna calitate a sintezei de baza a codicelui si contine aceleasi texte inregistrate pentru cele sase emotii de baza plus stilul neutru. Inregistrarile au fost efectuate de doi actori vocali profesionisti, un barbat si o femeie. Lucarea explica intregul proces de creere, incepand cu faza de design, urmata de creerea culegerii de texte si faza inregistrarilor, si terminand cu niste lectii si sugestii

2.1 Introducere

In ultimii ani, progresul in domeniul sintezei lingvistice a trecut in mare masura de punctul de rascruce al inteligibilitatii, impingand eforturile de cercetare inspre zona fluentei si a naturaletii. Aceste caracteristici devin din ce in ce mai necesare pe masura ce sarcinile de sinteza devin din ce in ce mai complaexe: sunetul natural, fluenta si intonatie buna sunt obilgatorii pentru ca un text lung sintetizat sa fi inteles.

Cautand naturalete, metodele de sinteza bazate pe un codice au aparut pe la jumatatea secolului trecut. Aceste metode folosesc tehnici concatenative de sinteza lingvistica si incearca sa minimizeze manipularea semnalului. In acest fel se pastreaza naturaletea originala a limbajului micsorand numarul de legaturi dintre fragmentele verbale prin folosirea algoritmilor de selectie a blocurilor, care avantajaza blocurile mari.

Pe de alta parte scopul imbunatatirii fluentei si al intonatiei a dus la dezvoltarea a numeroase domenii de cercetare. Unul dintre cele mai importante este includerea vorbirii emotionale in vorbirea sintetica. In prezent grupul nostru de cercetare studiaza caracteristicile vorbirii emotionale Basce. Pentru a avansa in acest domeniu este necesara o baza de date vasta special creata.

Aceasta lucare descrie efectele dorite ale bazei de date, mai intai detaliind problemele aduse de munca de modelare a creerii emotiilor si apoi cele create de obiectivele de sinteza ale selectiei blocurilor. Apoi procesul de creere al codicelui si descrierea trasaturilor lui finale, in continuare va fi explicata faza inregistrarilor acoperind si faza selectiei vocilor, a echipamentelor si detaliile efectuarii sesiuniilor de inregistrari. In sfarsit vom prezenta niste concluzii.

2.1 Cerintele pentru modelarea emotiilor

Studiul modelelor emotiilor prozodice necesita mostre inregistrate al tuturor emotiilor de baza. Am luat in consiterare setul de emotii cunoscut si ca „Marele sase” (Cowie & Cornelius, 2003): tristete, fericire, furie, frica, surpriza si desgust. In plus s-a luat in considerare si stilul neutru

Stiluri diferite de codice au fost folosite pentru studiul emotiilor in scris, in incercarea de a obtine cea mai buna autenticitate a emotiilor. Altii au folosit emotii deduse prin punerea vorbitorului in situatii care sa nasca o anumit emotie. O a treia optiune a fost folosirea unui interpret cu studii de actorie ce putea simula emotii. Desi acesta din urma tindea sa exagereze emotiile, totusi acestea sunt recunoscute , astfel incat modelarea practica poate fi derivata din ele. In aceasta munca am folosit codicele de vorbire jucat deoarece el este singurul care permite control complet asupra textului inregistrat.

Întrucât folosirea textelor diferite pentru fiecare emotie implicã dificultãti mari pentru a gãsi codicele continând textele corespunzãtoare, si, mai mult, el impiedica compararea caracteristicilor diferitelor emotii, s-a decis sa nu se foloseasca astfel de texte, inregistreand acelasi text independent de emotii pentru toate acestea. In plus, studii anterioare au aratat ca un interpret iscusit poate exprima emotii natural chiar daca continutul textului nu are legatura cu emotia .

2.1 . Controlul variatiilor interpretului

Studii anterioare ne-au invatat de asemenea ca este imposibil pentru interpreti sa mentina un nivel de referinta constant pentru ritmul, tonul si volomul lor intr-o sesiune de inregistrari de lunga durata. Timpul estimat pentru inregistrarea acestei baze de date s-a intins pe mai multe sesiuni de inregistrari, deci efectele acestor variatii trebuiau sa fie chiar mai insemnate. Pentru a cuantifica aceste deviatii si a fi in continuare capabil sa comparm parametrii prosodici intre emotii, s-a creat si un text de control.

Acest text de control consta inr-un scurt text continuu (lung de 400 de cuvinte), ce a trebuit citit cu stilul neutru, la inceputul, mijlocul si sfarsitul fiecarei sesiuni. In acest fel nivelele de referinta in parametrii prosodici pentru fiecare sesiune vor fi extrasi din acest text de control si datele fiecarei emotii vor fi normalizate conform acestor nivele de referinta.

2.2. Nivelul prosodic al supra-sintaxei

Ultimul factor al studiilor prosodice care are un impact asupra cerintelor creerii bazei de date, era necesitatea de a studia prosodia de limbaj aplicata nivelului propozitiei. Dupa cum se va arata in urmatoarea sectiune, partea principala de text interpretat avea sa fie compusa din propozitii izolate, ceea ce este foarte convenabil pentru extragerea modelelor prosodice la nivel de propozitie ( cu exceptia modelului cu pauza), cat si pentru a servi la alte scopuri ale activarii selectiei de blocuri. Totusi, este de asemenea necesar sa studiem diferite stiluri de vorbire cu ar fi dialogurile, partile declarative, pauzele de paragraf etc. Ce necesita text continuu.

De aceea s-a mai adaugat o noua piesa bazei de date : un text continuu de marime medie: (1,047 cuvinte), care acoperea stiluri de vorbire diferite precum dialoguri si descrieri. Acest text se intentiona a fi citit in toate cele 6 emotii plus stilul neutru , toate inregistrate dintr-o data.

2.3. Structura bazei de date

Tinand seama de cele de mai sus structura bazei de date este definita de tabelul de mai jos:

Tabel 1. Structura bazei de date

Sectiune Nr. De Inregistrari Continut

Codicele Principal O data / emotie + stilul neutru Propozitii izolate

Textul Continuu O data / emotie + stilul neutru Un singur text continuu cu stiluri variate de vorbire

Textul de Control De trei ori / sesiune de unregistrari O singura bucata de text continuu

3. Cerintele tehnicilor de selectare a blocurilor

In sectiunea anterioara am vazut ca studiul prosodic a pus probleme ce afectau structura externa a bazei de date. In aceasta sectiune vom vedea ca obiectivul sintezei selectiei blocurilor va seta cerintele pentrul continutul textului bazei de date: structura „interna”.

Observații:

Facultatee de Matematică şi Informatică a Universităţii Bucureşti.

Descarcă referat

Pentru a descărca acest document,
trebuie să te autentifici in contul tău.

Structură de fișiere:
  • Proiectarea si Inregistrarea unei Baze de Date Verbal-Emotionala pentru o Culegere de Texte de Sinteza in Limba Basca.doc
Alte informații:
Tipuri fișiere:
doc
Nota:
8/10 (2 voturi)
Nr fișiere:
1 fisier
Pagini (total):
6 pagini
Imagini extrase:
6 imagini
Nr cuvinte:
3 383 cuvinte
Nr caractere:
19 078 caractere
Marime:
124.56KB (arhivat)
Publicat de:
NNT 1 P.
Nivel studiu:
Facultate
Tip document:
Referat
Domeniu:
Limbaje de Programare
Predat:
la facultate
Materie:
Limbaje de Programare
Profesorului:
Dinu Liviu
Sus!