Uitgebreide Uitleg
Feature Engineering is de kunst van het creëren van de juiste input variabelen voor je model. Ruwe data is vaak niet direct bruikbaar - je moet het transformeren, combineren, en verrijken tot features die patronen blootleggen. Dit is vaak belangrijker dan het algoritme zelf.
Voorbeeld: voor een huizenprijzen model is "adres" niet bruikbaar. Maar je kan het transformeren naar features zoals: "afstand tot centrum", "gemiddelde inkomen buurt", "aantal scholen binnen 1km", "criminaliteit score". Deze engineered features hebben veel meer voorspellende kracht.
Goede feature engineering vereist domein kennis - je moet begrijpen wat belangrijk is in je probleem. Bij kredietscoring bijvoorbeeld: niet alleen huidige inkomen, maar ook inkomensstabiliteit, schuld-tot-inkomen ratio, betalingsgeschiedenis trends. Deze gecreëerde features maken het verschil tussen een mediocre en excellent model.
Praktijkvoorbeeld
Een Nederlandse e-commerce bedrijf voorspelt product returns. Hun data scientist creëert features zoals: "verschil tussen eerste en laatste product bekeken", "tijd op product pagina", "aantal size guides geopend", "historisch return percentage per customer". Deze features verhogen accuracy van 65% naar 84%.