unsupervised learning (apprendimento non supervisionato)

Definizione

Metodi che imparano pattern direttamente dai dati senza etichette. Obiettivo: comprendere la struttura e proprietà geometriche dei dati .

Riduzione della Dimensionalità

PCA (Principal Component Analysis)

  • Diagonalizza matrice di covarianza
  • Trova direzioni di massima varianza ()
  • Perché: Visualizzazione, Compressione, Rumore

Clustering

Raggruppare dati in cluster basati su similarità.

Cos’è un Cluster?

  • Connettività: punti connessi
  • Centroide: distanza da centroidi
  • Densità: regioni dense
  • Non esiste definizione unica

Tipi di Clustering

  • Partizionamento (K-Means)
  • Gerarchico
  • Density-Based (DBSCAN)
  • Fuzzy

Risorse