Rob Peters - Business Intelligence Consultant

Text Box: 5/1/2008
Text Box: Data Overflow

Voorheen was het een uitdaging om medewerkers toegang te geven tot bedrijfsdata voor rapportage en onderzoek. Het succes daarvan heeft geleid tot een overdaad aan data, een “data overflow” (zie “Wanneer ontstaat data overflow?”. Nu is het een uitdaging om medewerkers de weg te wijzen naar relevante informatie. Dat kan door een focus op stuurinformatie en toepassing van technologieën waarmee informatie kan worden gezocht.

 

Steeds meer bedrijven zijn in staat hun bedrijfsdata geautomatiseerd te reorganiseren voor rapporten of onderzoek. Daartoe wordt de bedrijfsdata uit verschillende toepassingen (financieel, logistiek, operationeel) geschoond, samengevoegd en eenduidig gedefinieerd. Zo ontstaat er een centrale bedrijfsdata “bak”, ook wel Data Warehouse genoemd. Bedrijven slagen hier steeds beter in en het Data Warehouse wordt steeds groter en uitgebreider.

 

Aanvankelijk heerst er euforie onder de gebruikers van dit Data Warehouse. Eindelijk heeft men toegang tot alle bedrijfsdata. En die data is ook nog geschoond, samengevoegd en eenduidig gedefinieerd. Men kan direct verkoopcijfers met budgetcijfers vergelijken. Voorheen koste het veel handwerk om data uit verschillende toepassingen samen te brengen in een rapport. Dat was foutgevoelig. Nu gebeurt dat geautomatiseerd en foutloos.

 

Echter, het Data Warehouse wordt steeds groter en uitgebreider. De omvang loopt op van gigabyte naar terabyte, zodat de noodzakelijke rekenkracht om relevante informatie uit het Data Warehouse steeds groter wordt. Daarnaast wordt steeds meer data aan elkaar gekoppeld. Vanuit steeds meer invalshoeken wordt de data geanalyseerd. Bijvoorbeeld verkoopcijfers worden geanalyseerd vanuit de invalshoeken klant, product, winkel en tijd. Alle eigenschappen van klant, product, winkel en tijd kunnen worden gecombineerd. Een rapport kan de verkoopcijfers per provincie (klant), per leeftijd (klant), per kleur (product), per filiaalgroep (winkel) en per maand (tijd) tonen. Iedere eigenschap heeft een aantal categorieën, bijvoorbeeld kleur: rood, groen. Afhankelijk van het aantal categorieën per eigenschap wordt het aantal mogelijke combinaties enorm groot. Het is niet ongebruikelijk dat in een Data Warehouse 10 eigenschappen van een klant zijn opgeslagen. Als er daarnaast nog 10 product-, 5 filiaal- en 5 tijdeigenschappen zijn opgeslagen dan zijn er bij, twee categorieën per eigenschap, 900 combinaties. Bij gemiddeld drie categorieën per eigenschap zijn het al 27000 combinaties. Hoewel het aantal voor de hand liggende combinaties logisch beredeneerd minder zal zijn, is dat aantal nog steeds zeer groot. Het is onmogelijk dat te overzien of op regelmatige basis de interessante combinaties te analyseren. Daarom maakt de omvang van het Data Warehouse het steeds lastiger om relevante informatie uit de data te halen.

 

Om toch relevante informatie uit de data te halen zal een bedrijf twee uitgangspunten moeten hanteren: sturing en vernieuwing. Het bedrijf gebruikt informatie om te sturen. Daartoe wordt bepaald welke informatie nodig is ter ondersteuning van de strategie, de koers die het bedrijf heeft uitgezet. Die informatie wordt dan weer vertaald naar benodigde data zodat gericht die data uit het Data Warehouse kan worden gehaald. Daarnaast gebruikt het bedrijf informatie om te vernieuwen. Dat kan door de inzet van technologieën die je in staat stellen dat omvangrijke Data Warehouse te doorzoeken op relevante informatie. Data Mining software is een voorbeeld van een dergelijke technologie. Bijvoorbeeld Data Mining software kan uit alle mogelijke combinaties van invalshoeken de meest relevante combinatie naar voren halen. Zo kan blijken dat filialen in wijken met veel 65+ klanten veel babyvoeding verkopen. Dat wordt nader onderzocht en kan leiden tot een aangepast assortiment. Verdwalen in informatie door data overflow is een probleem, maar dit probleem kan worden voorkomen door een focus op informatie voor sturing en vernieuwing.

Zie ook “Beperk je rapportage voor optimale besturing”, “Gericht informatie zoeken

Reacties? Mail naar info@rob-peters.nl

Reacties? Mail naar info@rob-peters.nl