Uitgebreide Uitleg
Regressie en classificatie zijn de twee hoofdtaken binnen supervised learning. Regressie voorspelt continue waarden (getallen): huizenprijzen, temperatuur, verkoopvolume, verwachte klantenwaarde. Classificatie voorspelt discrete categorieën: spam/niet-spam, kat/hond/vogel, creditwaardigheid (goed/neutraal/slecht).
Bij regressie is de output een getal op een schaal - er zijn oneindig veel mogelijke antwoorden. Bij classificatie kies je uit voorgedefinieerde opties - er zijn beperkte mogelijke antwoorden. Beiden gebruiken vergelijkbare algoritmen (linear regression, logistic regression, decision trees, neural networks) maar met andere loss functions.
In de praktijk zie je vaak beide: een klantsysteem gebruikt classificatie om te voorspellen of iemand gaat churnen (ja/nee), en regressie om te voorspellen hoeveel ze zullen uitgeven (bedrag). De keuze tussen regressie en classificatie bepaalt je hele model setup.
Praktijkvoorbeeld
Een Nederlandse verzekeraar gebruikt beide: classificatie om te voorspellen of een claim frauduleus is (ja/nee/mogelijk), en regressie om het verwachte schadebedrag te voorspellen (€500, €2000, etc.). Samen geven deze modellen een compleet beeld voor risico-evaluatie.