Analiza statistică a utilizatorilor unui site

Previzualizare referat:

Extras din referat:

1. Definirea problemei

S-a luat în analiză situl www.hattrick.org datorită numărului din ce în ce mai mare de utilizatori care accesează zilnic acest site. Ne propunem să urmărim aspectele legate de sex (cine accesează mai des acest site), vârstă, ocupaţie, stare civilă.

Obiectivele cercetării

1.2. Obiectivele problemei

Ne propunem să verificăm normalitatea distribuţiilor variabilelor analizate, să efectuăm descrierea statistică a acestora prin procedeele oferite de SPSS, separat pentru variabilele nominale şi separat pentru variabilele cantitative. Un alt obiectiv este de a depista dacă există o legătură între variabilele cantitative, iar dacă da, ce tip de legătură, să verificăm şi să testăm corelaţia dintre variabile, să estimăm o variabilă dependentă în funcţie de o variabilă independentă printr-un model de regresie (liniară), testând ulterior semnificaţia coeficientului de regresie, semnificaţia modelului de regresie ales.

ANOVA va determina dacă diferenţele dintre mediile grupelor unei variabile cantitative grupate după o variabilă nominală diferă semnificativ, cu o anumită probabilitate.

În continuare vom estima prin interval de încredere media şi proporţia unor variabile, diferenţele dintre două medii şi diferenţele dintre 2 proporţii. Ulterior vom testa egalitatea unei medii, respectiv a unei proporţii, cu o anumită valoare, precum şi diferenţa dintre două medii şi două proporţii.

2. Construirea bazei de date

2.1. Alegerea variabilelor

Variabile nominale:

- sex - m/f

- ocupatie

- loc_conect - locul de unde se conectează (servici, şcoală, acasa, internet cafe, altundeva)

Variabile numerice:

- vârsta

- luni - numărul de luni de utilizare a sitului

Variabilă ordinală:

- ore_zi - numărul de ore de utilizare pe zi (mai putin de 1 ora, intre 1 ora si 3 ore, intre 3 ore si 5 ore, peste 5 ore).

3. Verificarea bazei de date

3.1. Depistarea outlierilor

verificarea valorilor lipsă cu ajutorul tabelului de frecvenţă

Se observă că pentru fiecare variabilă nu sunt valori lipsă, tabelul Frequencies afişând:

Valid = 37

Missing = 0, pentru toate cele 7 variabile.

Diagramele Boxplot pentru vârsta şi luni de utilizare.

Diagramele Boxplot permit compararea fiecărui grup utilizând: mediana, percentilele a 25-a şi a 75-a şi minimum şi maximum observat, care nu sunt din punct de vedere statistic outliers. Pentru outlieri şi valori extreme este necesară o atenţie sporită. Linia neagră din centrul box-ului marchează mediana distribuţiei respective.

Observații:

Universitatea „Alexandru Ioan Cuza“ Iaşi

Master FIBAS

Specializare: Economie şi gestiune financiar-bancară

Descarcă referat

Pentru a descărca acest document,
trebuie să te autentifici in contul tău.

Structură de fișiere:
  • Analiza Statistica a Utilizatorilor unui Site.doc
Alte informații:
Tipuri fișiere:
doc
Nota:
9/10 (1 voturi)
Nr fișiere:
1 fisier
Pagini (total):
42 pagini
Imagini extrase:
42 imagini
Nr cuvinte:
2 372 cuvinte
Nr caractere:
13 757 caractere
Marime:
153.77KB (arhivat)
Publicat de:
NNT 1 P.
Nivel studiu:
Facultate
Tip document:
Referat
Domeniu:
Statistică
Predat:
la facultate
Materie:
Statistică
Sus!