Insights & Data Blog

Insights & Data Blog

Meningen op deze blog weerspiegelen de opvattingen van de schrijver en niet per definitie die van de Capgemini Group

Industry Data Modellen

Aanleiding
In de afgelopen tien jaar heb ik nogal wat klussen gedaan waarbij ik een data model moest maken dat was gebaseerd op een Industry Data Warehouse Model. Een bekend voorbeeld is het IBM Banking Data Warehouse Model. Een ander voorbeeld is het Teradata Manufacturing Logical Data Model. In deze bijdrage wil ik graag een paar “lessons learned” met de lezer delen.
 
De opzet van de Industry Data Modellen.
IBM, met in zijn kielzog Teradata en Oracle hebben voor diverse bedrijfstakken template data modellen gemaakt. Het idee is simpel en doeltreffend. Organisaties als IBM zijn kind aan huis bij de IT afdelingen van veel grote bedrijven. Zij zien dat in een bedrijfstak, (industry), de data structuren niet zo verschrikkelijk veel verschillen. Uiteindelijk hebben alle grote banken te maken met financiële producten, klanten, onderpanden, overeenkomsten. De data structuren zullen allemaal wel op een soortgelijke manier gemodelleerd kunnen worden. Daarmee kun je een data model opstellen dat voor alle banken bruikbaar is – aldus de gedachtegang van IBM. Idem ditto voor andere bedrijfstakken. Teradata heeft zoiets voor de maakindustrie gemaakt. Dat heeft geleid tot het Teradata Manufacturing Logical Data Model.
Door een slimme combinatie van kennis die is opgedaan bij verschillende bedrijven in een bedrijfstak (industry) kun je op die manier een template maken van een data model dat voor de meeste bedrijven binnen die bedrijfstak ongeveer bruikbaar is. De logische claim die IBM c.s. dan ook doen is dat je op die manier sneller de business applicaties kunt ontwikkelen omdat je minder tijd hoeft te steken in het opzetten van een data model: daarvoor bieden IBM c.s. nu een goed voorbeeld.
 
Voordelen van Data Model Templates
Het gebruik van dergelijke templates heeft inderdaad een aantal voordelen. Ik wil er twee noemen.
Ten eerste dwingt het gebruik van een template een bepaald begrippenkader af. Een mooi voorbeeld vind ik het gebruik van het woord “agreement”. Daarmee wordt dan een overeenkomst in algemene zin bedoeld, zonder dat we direct ingaan op een concrete situatie van de overeenkomst. Maar we weten direct al dat er bij een overeenkomst meerdere partijen betrokken zijn. Dat betekent dat we voor iedere overeenkomst direct al weten dat er een verband is met meerdere partijen. Vervolgens kunnen de agreement verder gaan omschrijven naar soort van overeenkomst (juridisch afdwingbaar of niet, financieel of niet etc.). Het voordeel is dat we een mooi gestructureerde opzet kunnen maken van allerlei soorten overeenkomsten. Een ander voordeel is dat we als ITers een taal hanteren, die ook voor de gebruikers te herkennen is. De gebruikers denken en praten immers ook in termen van “overeenkomsten” en “juridisch afdwingbaar”.
Ten tweede zorgt het gebruik van een template ervoor dat een data model volgens een bepaalde structuur wordt opzet. Data modellen kun je op verschillende manieren opzetten: derde normaalvorm, data vault, dimensioneel model. Verschillende structuren zijn mogelijk, maar de aanschaf van een template zorgt ervoor dat er tenminste consequent volgens een techniek gewerkt wordt. Bovendien heb je al modelleur direct al een hoop voorbeelden van oplossingen voor problemen waar je tegenaan loopt.
 
Echte coaching is belangrijk.
De meest efficiënte werkwijze heb ik meegemaakt bij een groot productiebedrijf waar de implementatie van een data model template samenhing met goede coaching van de data modelleurs. De betreffende coach was goed bekend met de  template (Teradata Manufacturing Logical Data Model) maar hij had ook goed begrip van de praktische problemen waar een data modelleur tegenaan loopt. De data modelleur moet immers zijn werk in redelijk korte tijd doen, terwijl hij anderzijds geconfronteerd met een complexe template waar hij niet goed weet welke onderdelen voor hem van dit template voor hem het meest relevant zijn. De betreffende coach wist dan heel slim de belangrijke elementen eruit te pikken. Dit hielp de data modelleur om optimaal te profiteren van de voordelen van de template.
De betreffende coach was bovendien erg gemakkelijk toegankelijk; het was een combinatie van aanwezigheid van de coach op de werkvloer en een prettige persoonlijkheid. Hij snapte dat je complexe begrippen niet in een keer snapte en hij was niet te beroerd om een bepaald kern onderdeel voor de tigste maal uit te leggen.
Hier ligt een uitdaging voor de opdrachtgever. Hij moet accepteren dat data model templates geen silver bullets zijn; het vereist nogal wat inspanning om echt te kunnen profiteren van de voordelen van data model templates. Je moet investeren in coaching; je moet bereid zijn om data modelleurs te helpen in het gebruik van templates. Doe je dat niet, dan ga je het voordeel van dergelijke templates missen.
 
Zijn er alternatieven?
De industry data modellen van IBM zijn niet de enige templates die de data modelleurs kunnen gebruiken. Er zijn ook alternatieven voorhanden. Een voorbeeld is het werk van Silverston (The Data Model Resource Book, Vol. 1-3: A Library of Universal Data Models for All Enterprises), waarin ook data modellen voor afzonderlijke bedrijfstakken zijn opgenomen. Een ander voorbeeld is Data Model Patterns van David Hay.
Vergelijking van Silverston met bijvoorbeeld het IBM Banking Data Warehouse Model laat zien dat de modellen van Silverston minder details bevatten. Dat kan een nadeel zijn, maar het heeft ook wel weer het voordeel dat je niet overweldigd wordt door de enorm hoeveelheid (lichtelijk ongestructureerde) informatie, zodat je maar steeds het gevoel blijft houden dat je het nog niet helemaal begrepen hebt.
Maar ook al besluit je te kiezen voor een opzet waarbij je uitgaat van het boek van Silverston, dan nog zul je aandacht moeten geven aan centrale coaching.
Data modelleurs zijn soms net een kudde kikkers: ze springen alle kanten op. Dat is lastig omdat hun werk uiteindelijk  op elkaar moet aansluiten. Dat vereist dan een duidelijke coach die iedereen bij de les kan houden. Daar valt niet aan te ontkomen - niet met een IBM/ Teradata template of met een goed boek. Ook hier is de menselijke factor in de vorm van een goede coach onontbeerlijk.


 
 
 

Over de auteur

Tom van Maanen
Tom van Maanen
Tom van Maanen is managing consultant bij Capgemini. Hij werkt er nu al weer een jaar of 12. Daarvoor heeft hij in verschillende andere IT organisaties gewerkt. Sinds 1997 werkt hij op gebied van Business Intelligence. Hij heeft in zo’n 20 organisatie in de BI keuken kunnen kijken. Hij schrijft regelmatig over zijn ervaringen in de BI keuken.

Plaats een reactie

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *.