Uitgebreide Uitleg
Unsupervised Learning is een vorm van machine learning waarbij het model geen labels of juiste antwoorden krijgt. In plaats daarvan moet het zelf structuur en patronen in de data vinden. Dit is vergelijkbaar met hoe mensen leren categoriseren zonder expliciete instructie.
De belangrijkste toepassingen zijn clustering (groeperen van vergelijkbare items), dimensionaliteitsreductie (vereenvoudigen van complexe data), en anomaliedetectie (vinden van afwijkende datapunten). Het k-means algoritme bijvoorbeeld groepeert datapunten in k clusters op basis van gelijkenis.
Unsupervised learning is waardevol wanneer labelen onpraktisch is, of wanneer je verborgen patronen wilt ontdekken die mensen misschien over het hoofd zien. Het is ook vaak een eerste stap in data-analyse om inzicht te krijgen.
Praktijkvoorbeeld
Een Nederlandse retailer gebruikt unsupervised learning om klantsegmenten te identificeren op basis van aankoopgedrag. Het algoritme ontdekt 5 groepen zoals "budget-bewuste gezinnen" en "premium early adopters", zonder dat deze categorieën vooraf gedefinieerd waren.