unsupervised learning (apprendimento non supervisionato)
Definizione
Metodi che imparano pattern direttamente dai dati senza etichette. Obiettivo: comprendere la struttura e proprietà geometriche dei dati .
Riduzione della Dimensionalità
PCA (Principal Component Analysis)
- Diagonalizza matrice di covarianza
- Trova direzioni di massima varianza ()
- Perché: Visualizzazione, Compressione, Rumore
Clustering
Raggruppare dati in cluster basati su similarità.
Cos’è un Cluster?
- Connettività: punti connessi
- Centroide: distanza da centroidi
- Densità: regioni dense
- Non esiste definizione unica
Tipi di Clustering
- Partizionamento (K-Means)
- Gerarchico
- Density-Based (DBSCAN)
- Fuzzy