Rob Peters - Business Intelligence Consultant

Text Box: 3/5/2008
Text Box: Wat is de waarde van metadata van een BI omgeving?

De informatie die de eigenschappen van data beschrijft worden vaak metadata genoemd. In een BI omgeving gaat het om de beschrijving van de inhoud en van de omgeving zelf. De inhoud betreft de gegevens die zich in de BI omgeving bevinden. De definitie van die gegevens wordt in de metadata vastgelegd. De omgeving omvat de processen die gegevens in de BI omgeving laden, het gebruik, en ook de architectuur en infrastructuur. De waarde van de metadata kan het best worden beoordeeld wanneer ze ontbreekt.

 

Beheer – Een BI omgeving wordt gevuld met data uit een logistiek systeem. Één van de bronnen is een subsysteem waarin wekelijks de balans van verkooporders wordt bepaald. Zo worden o.a. het aantal backorders en het aantal openstaande orders berekend. Dit orderbalans subsysteem wordt al enige tijd niet meer gebruikt en men overweegt het wekelijkse proces stop te zetten. Tevens gaat men er vanuit dat de data uit het orderbalans subsysteem ook in de BI omgeving niet meer relevant is. Daarnaast verwacht men dat het stopzetten kan worden teruggedraaid indien blijkt dat er toch gebruik wordt gemaakt van de orderbalans data. En inderdaad komt er drie weken na het stopzetten een klacht over ontbrekende data binnen. Het orderbalans subsysteem wordt weer geactiveerd, en het wekelijkse proces loopt weer. Echter, er ontbreken data van drie weken en de gebruiker vraagt dit te herstellen. Dat blijkt twee dagen werk te zijn. Dat werk was te voorkomen indien informatie over bronnen en frequentie van gebruik voorhanden was.

 

Gebruik – Een BI omgeving bevat data die wordt omgezet in stuurinformatie. Zo is een aantal prestatie indicatoren gedefinieerd voor het beheer van de voorraad. Men streeft naar een voorraadvolume dat gelijk is aan het verkoopvolume van tussen de twee en drie maanden. Door een definitiefout wordt een derde van de voorraad niet meegenomen in de berekening van het voorraadvolume. Bijgevolg lijkt de voorraad lager dan hij in werkelijkheid is. Daardoor wordt gestuurd op een te hoge voorraad en zijn de voorraadkosten fors hoger dan noodzakelijk. Indien de gebruiker direct toegang had tot de definities dan was deze fout snel ontdekt.

 

De kosten die worden gemaakt door het ontbreken van metadata variëren van directe kosten door extra werk tot indirecte kosten door verkeerde interpretatie van data. Extra werk zit in herstel van fouten, maar ook in uitzoekwerk iedere keer wanneer onderhoud aan de BI omgeving nodig is. Verkeerde interpretatie van data ontstaat doordat gebruikers beperkte kennis hebben van de data en niet beschikken over de definities die ten grondslag liggen aan de BI omgeving. Een inventarisatie binnen de eigen organisatie van kosten die ontstaan door ontbreken van metadata zal duidelijk maken dat de investering in metadata snel wordt terugverdiend.

 

Zie ook: Metadata in een BI omgeving

Reacties? Mail naar info@rob-peters.nl

Reacties? Mail naar info@rob-peters.nl