data space (dati di addestramento)

Definizione

I dati di addestramento sono coppie di input , dove è un’istanza (input instance) e è l’etichetta (label) associata a quell’input.

Il spazio dei dati di addestramento è definito come

dove:

  • è lo spazio delle istanze (instance space) d-dimensionale
  • è il vettore di input dell’i-esima istanza
  • è l’etichetta associata all’i-esima istanza
  • è l’insieme delle etichette (label space)

I punti seguono una distribuzione di probabilità ignota . Vogliamo trovare una funzione talce che per una nuova coppia , abbiamo con alta probabilità (oppure ).

Esempi di e

  • : immagini, testo, audio, video, dati tabellari
  • : etichette di classi, valori numerici, sequenze

Esempi di

  • Binary classification: o
  • Multi-class classification:
  • Regression:

Risorse