Teste neparametrice

Previzualizare referat:

Extras din referat:

INTRODUCERE

Procesul de matematizare a economiei, biologiei, geneticii, lingvisticii, medicinei, psihologiei, demografiei, a studiului mediului înconjurător, apariţia calculatoarelor din ce în ce mai performante, au deschis o nouă eră în domeniul matematicilor aplicate şi impune necesitatea studiului metodelor statisticii matematice, la baza cărora stă teoria probabilităţilor.

Primele preocupări statistice datează din antichitate, când se culegeau şi se ,,preocupau” date referitoare la populaţie, recolte, cadastru, în scopul unei mai bune colectări a ipotezelor. Începutul tratării ştiinţifice a datelor statistice s-a făcut în Germania secolelor XVII-XVIII.

Statistica este o ramură a matematicii aplicate care se ocupă cu extragerea informaţiilor relevante din date. Informaţiile pot fi folosite pentru a înţelege datele disponibile (statistică descriptivă) sau pentru a descoperi noi informaţii despre evenimente şi relaţile dintre ele (statistică inferenţială).

Statistica este mai mult decât un set de instrumente. Ca utilizatori potenţiali rebuie să învăţăm să utilizăm corect aceste instrumente. Utilizarea adecvată a metodelor statistice ne permite: să descriem cu acurateţe descoperirile cercetării ştiinţifice; să luăm decizii; să facem estimări.

Procesul de cunoaştere statistică, se poate schematiza în felul următor: pornind de la

observarea statistică se trece la prelucrarea statistică iar apoi se face analiza şi interpretarea ştiinţifică, se varifică unele ipoteze privin legea de probabilitate urmate de caracteristica studiată, se formulează concluzii asupra cercetării. Există mai multe metode de verificare a ipotezelor statistice, care în principal se clasifică în două mari tipuri, parametrice şi neparametrice. Din punct de vedere istoric căt şi al aplicaţiilor lor cele care au apărut primele sunt cele parametrice. Totişi, în ultima perioadă au primit o largă dezvoltare şi cele neparametrice, mult mai uşor de aplicat, chiar şi de nespecialişti.

Lucrarea de faţă, în mare măsură, tratează în principal metodele neparametrice. Totuşi pentru comparaţie, în capitolul I sunt prezentate concepte de bază privind ipotezele statistice şi unele teste parametrice folosite în verificarea acestora.

Capitolul II prezintă testele neparametrice şi aplicaţiile acestora. Testele neparametrice au o putere mai micâ decât cele clasice, deoarece înlocuirea valorilor cu rangurile lor semnificâ pierderea a o parte din informaţie. De exemplu am spune ca doi boxeri sunt de aceiasi valoare deoarece fiecare a câştigat câte 5 meciuri din 10 întâlniri dintre ei. În condiţia în care în ultima întâlnire A l-a omorât pe B, concluzia trebuie schimbată, deoarece diferenţa de valoare între ei la ultimul meci a fost cu mult mai mare decât celelate diferente.

Această pierdere de informaţie este reală în cazul testelor neparametrice atunci când efectiv variabilele aleatoare sunt repartizate normal şi au dispersiile egale. În caz contrar se poate întâmpla ca un test neparametric sa fie chiar mai eficient decât cele parametrice.

În altă ordine de idei, aplicarea testelor neparametrice în cazul selecţiilor de volume mari, este foarte laborioasă. Ca urmare, conduiţa de urmat în alegerea unui tip sau altul de test ar fi după cum urmează:

1. În cazul eşantioanelor mici sunt de preferat testele neparametrice deoarece calculele sunt mai rapide şi eficientă este comparabilă cu cea a testelor clasice.

2. Când se ştie că selecţiile aparţin la populaţii repartizate normal şi cu dispersii egale, testele clasice sunt mai eficiente.

3. Când nu se cunosc repartiţiile variabilelor, alegerea si concluziile se vor face în funcţie de alte informaţii privitoare la experiment.

4. Când se ştie că variabilele aleatoare testate nu sunt repartizate normal sau este vorba de variabile care se bazează pe o scală arbitrară (“scoruri”) sau clasificări pe criterii preponderant calitative (de exemplu “ameliorarea” stării subiecţilor trataţi) se apelează la testele neparametrice.

Capitolul III se referă la corelaţii, determinarea coeficienţilor de corelaţie ( Pearson şi raportul de corelaţie) respectiv corelaţia rangurilor ( Spearman şi Kendall) înzestrate cu exemple.

În ultimul capitol (capitolul IV) sunt prezentate aplicaţii implementate în MATLAB.

CAPITOLUL I

VERIFIVAREA IPOTEZELOR STATISTICE.

TESTE PARAMETRICE

§1.1. Noţiuni generale

ln geometria euclidiandă poate fi luată ca ipoteză afirmaţia că suma unghiurior unui triunghi este . Cu procedee general acceptate de demonstraţie se verifică dacă această ipoteză este adevărată sau falsă. În acest caz avem de-a face cu o demonstraţie matematică a ipotezei şi dacă demonstraţia este riguoasă, suntem siguri că ipoteza este adevărată sau falsă. În alte ştiinţe dacât matematica, pot fi propuse ipoteze sau teorii referitoare la un anumit univers sau la o anumită populaţie. Aceste ipoteze le vom numi ipoteze statistice şi singură cale de a fi absolut siguri de adevărul sau falsitatea lor este de a cerceta întreaga populaţie. Acest procedeu nu este practic şi suntem nevoiţi să considerăm o selecţie şi să o utilizăm pentru a decide asupra valabilităţii sau falsificăţii ipotezei.

Procedeul de a folosi o selecţie pentru a verifica dacă o ipoteză este adevărată (sau falsă) este numit test statistic asupra valabilităţii (sau falsitcăţii) ipotezei.

Nu există nici o certitudine că nu vom comite o eroare. Întradevăr, există două tipuri de erori pe care le putem face. Dacă se întâmplă ca ipoteza cercetată să fie adevărată şi noi decidem că este falsă, facem o eroare de ordin I . Probabilitatea acestei erori se notează cu ; dacă dimpotrivă, ipoteza este falsă şi noi decidem că este adevărată, facem o eroare de ordin II, probabilitatea acestei erori notându-se cu . Frecvenţa cu care facem o greşeală este, desigur, foarte importantă şi vom vedea că această frecvenţă poate fi controlată până la un anumit grad.

Deciziza dacă ipoteza va fi acceptată sau respinsă se va baza pe informaţia pe care o deţinem făcând observaţii şi riscul pe care suntem dispuşi să-l acceptăm în a doua decizie greşită.

Stabilim, de exemplu, ipoteză că un anumit parametru al unei populaţii are o anumită valoare. Din populaţia studiată considerăm o selecţie şi cercetăm dacă rezultatele obţinute pot fi considerate ca provenind sau nu din populaţia stabilită pe baza ipotezei făcute. Dacă există o concordanţă strânsă între ipoteza emisă şi rezultatele obţinute, acceptăm ipoteza. Decizia dacă concordanţa este strânsă sau nu revine la calcularea unei anumite statistici şi la compararea valorii particulare obţinute cu repartiţia de selecţie pentru această statistică, în cazul cănd considerăm că ipoteza este adevărată.

Descarcă referat

Pentru a descărca acest document,
trebuie să te autentifici in contul tău.

Structură de fișiere:
  • Teste Neparametrice.doc
Alte informații:
Tipuri fișiere:
doc
Nota:
8/10 (1 voturi)
Nr fișiere:
1 fisier
Pagini (total):
78 pagini
Imagini extrase:
78 imagini
Nr cuvinte:
12 765 cuvinte
Nr caractere:
87 268 caractere
Marime:
799.43KB (arhivat)
Publicat de:
NNT 1 P.
Nivel studiu:
Facultate
Tip document:
Referat
Domeniu:
Matematică
Predat:
la facultate
Materie:
Matematică
Profesorului:
Dr. Conf. Pop S. Maria
Sus!