Teoria informației - informația statistică

Previzualizare curs:

Extras din curs:

4. Informatia statistica

(traducere si adaptare dupa Jérôme Segal, Le Zéro et le Un. Histoire de la notion scientifique d'information au 20° siècle, Paris, Éditions Syllepse, 2003)

Statisticile si informatia lui Fisher

„(...) obiectul metodei statistice este reducerea datelor. O masa de date, pe cât de importanta pe atât de neinteligibila, trebuie înlocuita cu un numar relativ mic de cantitati care trebuie sa reprezinte corect aceasta masa sau, altfel spus, care trebuie sa contina cea mai mare parte posibila, daca nu totalitatea informatiei pertinente continuta în datele de origine”.

Iata cum, în 1922, Ronald Aylmer Fisher (1890-1962) introducea în scrierile sale notiunea stiintifica de informatie. Fisher va preciza aceasta notiune pâna în 1935 pentru a ajunge, de-a lungul publicatiilor sale, la o definitie matematica. El arata ca o statistica este o transformare de date ale esantionului pe care ea îl rezuma, dar totodata îl si simplifica. Despre o statistica se spune ca este exhaustiva daca rezumatul pe care-l realizeaza nu suprima nimic din „informatia” (în sens de „informare”) continuta de esantion. De la început notiunile de informatie si exhaustivitate se gasesc astfel legate.

Retrasând modul cum informatia - care este la început utilizata într-un sens apropiat de sensul comun - devine un concept stiintific, vom insista de asemenea asupra posteritatii lucrarilor sale, nu fara a aminti mai înainte în ce context teoriile statistice ale lui Fisher au vazut lumina zilei si cum statistica a putut participa la unificarea stiintelor.

Numeroase sunt articolele sau monografiile consacrate lui Fisher. În mod voit, fara grija exhaustivitatii, nu vom invoca aici decât câteva repere din biografia sa, aflate în raport cu subiectul nostru, Fisher având publicate de altfel mai mult de o suta de lucrari.

Diplomat la Cambridge, el a studiat dupa aceea matematicile si fizica teoretica, puternica sa miopie interzicându-i fizica experimentala. Dupa ce publica în 1922 în Philosophical Transactions of the Royal Society, devine la trei ani responsabil de departamentul de statistica de la statia experimentala din Rothamsted, având sarcina de a obtine profit din miile de date privind - referitor la o perioada de vreo saizeci de ani - deopotriva diversele probe de îngrasamânt si conditiile meteorologice corespunzatoare. Din grija de a fi independent, preferase acest post celui de la Galton Laboratory, unde ar fi trebuit sa munceasca sub conducerea lui Karl Pearson (1857-1936), cu care avusese diferende referitoare la publicatiile lor din Biometricka. Pâna în 1933 va ramâne la Rothamsted unde îsi elaboreaza principalele lucrari, având ca obiect mai ales problema planurilor de experienta. Îi va succeede apoi lui Pearson la University College de Londres în calitate de profesor de Eugenie.

Dar sa revenim mai întâi la acea publicatie din 1922 privitoare la „fundamentele matematice ale statisticii teoretice”. Fisher pare motivat de propria-i respingere a notiunii de probabilitate inversa - sau probabilitate bayesiana - careia întelege sa-i substituie un nou concept, cel de „verosimilitudine” („plauzibilitate”). Ori, se stie ca probabilitatile bayesiene sunt cele care i-au permis lui van der Waals sa regaseasca si, în acelasi timp, sa justifice cel de-al doilea principiu al termodinamicii. Bineînteles ca Fisher îsi introduce propriul concept de informatie printr-un alt gen de abordare, plecând de la probleme concrete vizând analiza esantioanelor statistice avute în vedere în cultura agronomica. Eliberându-se de traditia ce dorea sa utilizam teorema lui Bayes ca arhetip al rationamentului inductiv formalizat, Fisher se lanseaza într-un proiect inevitabil de mare anvergura pe care-l inaugureaza cu cercetarea testelor obiective care-i justifica practica. Dar tocmai conceptul de verosimilitudine, si nu cel de probabilitate inversa, este cel care-i permisese sa determine înca din prima lucrare publicata, cea din 1922, alegerea pe care statisticianul o poate face între multele modele statistice gratie „principiului maximului de verosimilitudine”, principiu ce are pentru el înca de la început o importanta valoare euristica.

Problema care si-o pune Fisher în lucrarea din 1922 scoate în evidenta teoria estimarii (evaluarii): e vorba de a putea „estima”, pornind de la esantioanele relevate, valorile parametrilor caracteristici ai distributiilor de probabilitate ale unei populatii ipotetice (de exemplu, pentru calculul parametrilor m si s ai unei legi normale). El propune în acest cadru o „tratare cantitativa a informatiei aduse de un esantion” care, chiar daca nu se aplica înca la toate cazurile, permite deja realizarea unor aplicatii de alegere a curbelor de eroare ce ne lasa posibilitatea de a considera esantionul ca fiind cel mai reprezentativ posibil pentru populatia avuta în vedere.

Calificativul „pertinent” („relevant”), pe care-l utilizeaza pentru a califica informatia ce încercam sa o izolam din masa de date, tine de interesul sau pentru genetica, interes care îl determina, începând cu 1918, sa studieze „genele relevante”. Aceasta disciplina, genetica, creata printre altii de catre William Bateson (1861-1926) care-i da si numele în 1905, este istoric legata de eugenism, miscare stiintifica, politica si filosofica ce marcheaza a doua jumatate a secolului XIX si ai carui principali reprezentanti iesiti din Scoala statistica britanica sunt Francis Galton (1822-1911), verisor de-al lui Darwin, sau Karl Pearson (1857-1936).

Foarte schematic, dupa publicarea Originilor speciilor a lui Darwin (în 1859), Bateson si primii geneticieni credeau ca ar exista o contradictie între darwinism si genetica, deoarece selectia naturala parea sa presupuna ca micile variatii ar avea o mare importanta pentru fenomenele de adaptare, ceea ce li se parea a veni împotriva legilor lui Mendel. Sprijinindu-se pe cartea publicata de Darwin în 1871, Descendenta omului, eugenistii l-au prezentat adesea pe Darwin ca fiind unul de-al lor. Astazi mai persista înca o controversa asupra interpretarii ce poate fi data acestor scrieri. Daca S. Tort înlatura orice suspiciune eugenista fata de Darwin opunând teoria lui Darwin diferitelor „darwinisme” care se reclama de la ea, Lemaine si Matalon estimeaza de asemenea, citând îndeosebi cartea sa din 1871, ca Darwin nu rezista „(...) la presiunea ideilor timpului sau, nici la concluziile discipolilor sai cei mai ferventi, atât despre reproducerea idiotilor, infirmilor si bolnavilor în natiunile civilizate, cât si despre inferioritatea de natura a popoarelor salbatice”. Ei conchid ca „Darwin nu este nevinovat în ceea ce priveste ideea de exploatare a omului ce poate fi trasa din teoria sa”.

Observații:

predat la masterat in mass-media si relatii publice

curs 4

Download gratuit

Documentul este oferit gratuit,
trebuie doar să te autentifici in contul tău.

Structură de fișiere:
  • Teoria Informatiei - Informatia Statistica.doc
Alte informații:
Tipuri fișiere:
doc
Nota:
7/10 (1 voturi)
Nr fișiere:
1 fisier
Pagini (total):
6 pagini
Imagini extrase:
6 imagini
Nr cuvinte:
4 124 cuvinte
Nr caractere:
20 894 caractere
Marime:
20.95KB (arhivat)
Publicat de:
NNT 1 P.
Nivel studiu:
Facultate
Tip document:
Curs
Domeniu:
Științele Comunicării
Predat:
la facultate
Materie:
Științele Comunicării
Profesorului:
Gheorghe Clitan
Sus!