Rob Peters - Business Intelligence Consultant

Text Box: 26/1/2008
Text Box: Gericht informatie zoeken

Bedrijven krijgen steeds eenvoudiger toegang tot steeds meer data. Dat maakt het lastig die data efficiënt aan te wenden voor vernieuwende informatie. Bijvoorbeeld bij marktonderzoek: in welke regio, in welke seizoen, met welke marketing technieken, aan welke klantengroep en voor welke prijs kunnen we product A afzetten. Hoe meer data hoe lastiger juist die interessante niches te vinden. Met behulp van Data Mining tools wordt dat vereenvoudigd.

 

Bijvoorbeeld, een bedrijf verkoopt tuinmeubilair via verschillende filialen in Nederland. De winstgevendheid varieert van filiaal tot filiaal. Sommige filialen presteren goed en andere filialen slecht. Het management wil de slecht presterende filialen verbeteren. Daartoe gaat men onderzoeken wat de relevante eigenschappen van de goed presterende filialen zijn zodat de slecht presterende filialen daaraan gespiegeld kunnen worden. Het bepalen van de relevante eigenschappen is een lastige klus. De filiaaleigenschappen worden vergeleken: type (alleen meubilair of meubilair plus planten), de oppervlakte, het aantal verkopers. Ook de eigenschappen van de verkopers worden meegenomen. Het aantal jaren werkervaring speelt een rol, en misschien ook de leeftijd. Er zijn grote verschillen in de locatie van de filialen. Daarom wordt per filiaal de afstand tot de zee (zilte invloed op duurzaamheid meubilair), stedelijke omgeving en de afstand tot een ander filiaal bepaald. Voor zover mogelijk wordt per filiaal het gemiddeld inkomen en de gemiddelde leeftijd van de klanten bepaald. Verwacht wordt dat het bestedingspatroon van de klant daardoor wordt beïnvloed. Daarnaast is er ook een verschil in producten. De producten worden geclassificeerd naar type (tafel, stoel), materiaal, kleur en prijs. De productsamenstelling per filiaal zal zeker een invloed hebben op de winstgevendheid. Het bedrijf komt zo aan vijf invalshoeken – filiaal, verkoper, locatie, klant en product – met 14 factoren. Het bedrijf is niet alleen geïnteresseerd in de individuele invloed van elk van die 14 factoren maar ook in de mogelijke combinaties. Het aantal combinaties wordt bepaald aan de hand van het aantal categorieën per factor. Bijvoorbeeld twee typen filialen plus twee filiaal oppervlakcategorieën plus drie verkoper ervaringscategorieën plus vier productkleuren plus vijf producttypen leidt tot 2 x 2 x 3 x 4 x 5 = 240 combinaties voor vijf factoren. Met 14 factoren kunnen dat er meer dan 100000 zijn. Dat is onmogelijk te onderzoeken.

 

Daarom moet een Data Mining tool worden ingezet. Een Data Mining tool kan met behulp van een beslisboom algoritme combinaties van eigenschappen bepalen die grote winstgevendheid opleveren (zie figuur 1). Bijvoorbeeld de combinatie van “meubilair” type filiaal met twee verkopers en kunststof producten kan een winstgevende combinatie zijn. De Data Mining tool kan zo een aantal winstgevende combinaties bepalen. Daarmee wordt het grote aantal mogelijke combinaties gereduceerd tot een beperkt aantal winstgevende combinaties. Deze combinaties moeten dan verder onderzocht worden. Door het beperkte aantal is dat al handmatig mogelijk. Dit is een voorbeeld waarin een Data Mining tool helpt bij het vinden van informatie in grote en diverse datasets.

 

 

Reacties? Mail naar info@rob-peters.nl

Reacties? Mail naar info@rob-peters.nl