Data mining cu Weka Preprocesarea Datelor
Seminar 2
Cuprins
Necesitatea preprocesarii datelor
Etape în preprocesarea datelor
Colectarea datelor
Descrierea datelor
Verificarea calitatii datelor
Finalizarea etapei de preprocesare
Necesitatea preprocesarii datelor
Principalul criteriu pentru asigurarea calitatii rezultatelor unui proces de data mining este asigurarea calitatii datelor
Calitatea rezultatelor depinde de calitatea datelor introduse în prelucrare
Datele reale au o calitate scazuta
Exercitiu 1
Integrarea datelor din 2 surse diferite
Fisier excel: ex1_dateBanca.xls
Fisier text: ex1_datePers.txt
Integrati datele din cele doua fisiere într-un singur fisier excel
Exportati fisierul sub forma csv trasformându-l ulterior în .arff
Obs: se considera ca id-ul este unic pentru ambele fisiere
statistica
Documentul este oferit gratuit,
trebuie doar să te autentifici in contul tău.