Tehnici de grupare a datelor

Previzualizare referat:

Extras din referat:

1. INTRODUCERE

În această prezentare, am elaborat un proiect care prezintă un program ce demonstrează gruparea datelor provenind din măsurătorile lungimii și latimii ciocului la trei specii de pinguini. Prima problemă pe care am abordat-o a implicat implementarea algoritmului k-means. Problema a doua a proiectului implică implementarea algoritmului K-Means cu o inițializare a centrului clusterelor folosind algoritmul K-Means++.

2.1 IMPLEMENTAREA ALGORITMULUI K-MEANS CE UTILIZEAZA EM CU MODEL GMM

2.1.1 INFORMATII GENERALE IN LEGATURA CU ALGORITMUL K-MEANS

Algoritmul K-means este o tehnică de clustering iterativă care împarte un set de date în K clustere distincte, fără suprapuneri. Obiectivul este de a minimiza variațiile interne ale clusterelor și de a maximiza diferențele între clustere. Fiecare punct de date este atribuit unui cluster astfel încât suma distanțelor pătratice între punctele de date și centroidul clusterului să fie minimizată, ceea ce duce la o omogenitate crescută în interiorul fiecărui cluster.

Algoritmul K-means urmeaza pașii de mai jos:

Se stabilește numărul K de clustere.

Se aleg K puncte aleatoare ca centroizi inițiali.

Se iterează până când centroizii nu se mai schimbă:

- Se calculează distanța fiecărui punct de date față de centroizi.

- Fiecare punct este atribuit clusterului cu centroidul cel mai apropiat.

- Se recalculază centroizii fiecărui cluster.

K-means urmează metoda Expectation-Maximization, unde pasul de "Expectation" atribuie punctele de date la cel mai apropiat centroid, iar pasul de "Maximization" recalculază centroizii. În MATLAB, funcția kmeans(X,k) este folosită pentru a aplica acest algoritm, returnând etichetele clusterelor și locațiile centroizilor.

Problema de optimizare specifică Kmeans este formulată în relația :

Bibliografie:

1. M.-B. Radac, Tehnica k-means pentru probleme de grupare, Lucrarea de laborator I la disciplina Învățare Automată, Universitatea Politehnica Timișoara, 2023.

2. https://www.geeksforgeeks.org/k-means-clustering-introduction/ accesat la data de 18.11.2023

3. https://www.analyticsvidhya.com/blog/2020/10/a-simple-explanation-of-k-means-clustering/#:~:text=,see%20different%20kinds%20of%20vegetables accesat la data de 18.11.2023

4. https://machinelearningmastery.com/expectation-maximization-em-algorithm/#:~:text=The%20expectation,these%20two%20steps%20until%20convergence accesat la data de 18.11.2023

5. https://archive.ics.uci.edu/ accesat la data de 18.11.2023

6. https://www.mathworks.com/help/stats/kmeans.html%23buefthh-2 accesat la data de 18.11.2023

Descarcă referat

Pentru a descărca acest document,
trebuie să te autentifici in contul tău.

Structură de fișiere:
  • Tehnici de grupare a datelor.docx
Alte informații:
Tipuri fișiere:
docx
Diacritice:
Da
Nota:
7/10 (1 voturi)
Nr fișiere:
1 fisier
Pagini (total):
10 pagini
Imagini extrase:
10 imagini
Nr cuvinte:
2 244 cuvinte
Nr caractere:
13 336 caractere
Marime:
873.65KB (arhivat)
Publicat de:
Andreea Urian
Nivel studiu:
Facultate
Tip document:
Referat
Domeniu:
Inteligența Artificială
Predat:
Facultatea de Automatica si Calculatoare , Universitatea "Politehnica" din Timisoara din Timisoara
Specializare:
ingineria sistemelor
Materie:
Inteligența Artificială
An de studiu:
IV
Sus!