Insights & Data Blog

Insights & Data Blog

Meningen op deze blog weerspiegelen de opvattingen van de schrijver en niet per definitie die van de Capgemini Group

Hebben we metadata nog nodig?

In mijn vorige blog heb ik geschreven over autoclassificatie en wat dat voor een organisatie kan betekenen. Dit keer ga ik eens nadenken over automatische metadatering. Vorige maand was ik aanwezig bij de eerste meeting van de nieuwe IBM ECM GebruikersGroep bijeenkomst. Dit is een initiatief van “een aantal grootgebruikers en system integrators van IBM Content Management technologie“om uitwisselen van inhoudelijke informatie tussen specialisten te stroomlijnen. Deze eerste sessie werden een drietal presentaties gegeven en nieuwe contacten gelegd, maar ook oude opgehaald. Een erg interessant initiatief om op de hoogte te blijven wat er gebeurt binnen de Nederlandse IBM ECM markt.
Er werd onder andere een presentatie gegeven door IBM Design Product Director Dana Morris over de toekomst van IBM ECM. Ik wil in deze post niet zozeer ingaan op wat er verteld werd door Dana, maar door iets wat impact had op zijn presentatie. Immers, zijn presentatie werd deels ingehaald door het feit dat IBM de nacht er voor een partnership had aangekondigd met Box.

Korte Box introductie

Box is van origine een EFSS, een Enterprise File Sharing System. Ik denk dat een groot deel van de gebruikers wel eens gebruik heeft gemaakt van OneDrive, Google Drive of misschien het bekendste voorbeeld Dropbox. Met deze software is het mogelijk makkelijk allerlei bestanden op te slaan in de cloud en deze over meerdere devices te benaderen. Daarnaast kun je deze bestanden ook delen met anderen.

Box onderscheidt zich, naar eigen zeggen, doordat het zich meer richt op ondernemingen. Zij zorgen voor een betere naleving van privacy, waarbij je kunt bepalen welke collega’s de bestanden kunnen inzien, wie ze mag wijzigen of er commentaar aan toe mag voegen. Samenwerking en privacy zijn de twee speerpunten van Box als je het product vergelijkt met de concurrenten.

Box transformatie

Daar waar Box je eerder enkel bestanden liet opslaan en delen is men bezig met een transformatie naar een volwaardig ECM systeem. Drie weken geleden werd er een nieuw feature aangekondigd… Tromgeroffel… Metadata! Ik hoop dat de echte ECM-ers hun lachen kunnen inhouden, want dit is natuurlijk een al oud principe wat toegepast wordt om de vindbaarheid van bestanden te vergroten. Reacties op internet van oude rotten in het vak geven aan dat dit al decennia lang een drijvend kracht is van ECM-systemen.

Relevante documenten vinden

Maar laten we nu eens een stap verder gaan. Laten we eens out-of-the-box (pun intended) denken, met alle technologieën die tot onze beschikking staan in het achterhoofd.
Want waarom gebruiken we die metadata eigenlijk?  Om relevante documenten te vinden! Er is geen “feeling lucky” knop voor je eigen werkzaamheden. Maar als de techniek ons toestaat om full-text te zoeken, waarom is het dan nodig om ook op metadata te zoeken. Zeker, als het opstellen van een metadata model erg veel tijd kost en het systeem minder flexibel maakt. Het toevoegen van velden betekent vaak ook dat er data–verrijking moet plaats vinden. Alle oude documenten moeten bijgewerkt worden met een waarde voor dit veld, voordat ze bruikbaar zijn.

Feeling lucky, punk?

Ik wacht en hoop op een (Analytics) platform waarbij de zoekresultaten zullen leiden tot het metadata model. Een gebruiker zoekt bijvoorbeeld op “543235” naar documenten en vind alles gerelateerd aan dit nummer, wat ook een polisnummer blijkt te zijn in de administratie systemen van het bedrijf. Deze twee gegevens worden aan elkaar gekoppeld. Wordt er dan in korte tijd meerdere malen gezocht op dit gegeven, dan zal het systeem hiervoor een zoekveld aanmaken. Omdat het  systeem weet in welk type documenten op welke locatie dit voorkomt, kan er zodoende meer gericht gezocht worden naar documenten met dit kenmerk.

Dit principe zou wel eens de doodssteek van “traditionele (metadata-heavy)” ECM-systemen kunnen zijn, want die leunen hevig op het principe van metadata. Maar ook een redding, mocht een van de vendors dit principe kunnen toevoegen aan hun producten. Ik hoop dan ook dat zoiets uit het partnership tussen IBM en Box ontstaat, waarbij IBM met Content Analytics een sterk Analytics engine heeft en Box de Cloud opslag voor haar rekening kan nemen.
Dit zou betekenen dat eindgebruikers niet meer lastig gevallen worden met het opvoeren van kenmerken bij hun documenten, maar wel met alle gemakt hun documenten kunnen vinden. Dat metadatamodellen niet opgesteld hoeven te worden en derhalve de implementatie van een oplossing sneller verloopt. En dat het platform meer toekomst gericht is, doordat het sneller kan anticiperen op een veranderende (zoek)vraag.

Ik hang bewust geen naamkaartje aan dit platform, omdat het platform een samenvoeging zal zijn van verschillende technieken die we nu al kennen: Analytics, BI en ECM. Capgemini heeft deze technieken dan ook samengevoegd onder de titel “Insights & Data”. Wij zijn de experts die, samen met onze klanten, laten ervaren hoe uit deze gecombineerde kennis synergie valt te halen. En om terug te komen naar mijn inleiding: je kunt de beste en mooiste plannen hebben, maar je weet nooit hoe de wereld in een nacht kan veranderen...

 Afbeelding via Box.com, Afbeelding via Google
 

Over de auteur

Patrick van der Horst
Patrick van der Horst
2 Reacties Plaats een reactie
Duidelijk verhaal en ja, het zou een zegen zijn als je niet meer metadatering hoeft aan te brengen aan een document. Als een product als analytics dit allemaal voor je kan oplossen. Voor b2b lijkt dit ideaal. Echter daar waar je met handgeschreven brieven e.d. te maken hebt zal het niet helemaal lukken. De techniek is er wel, maar niet helemaal goed genoeg en relatief duur. Ook zijn er nog systemen die vanuit het verleden nog image gerelateerde documenten hebben. Die zul je hoe dan ook op basis van metadata moeten ontsluiten. Maar voor een nieuw systeem zonder verleden lijkt dit ideaal.
phorst's picture
Hi Pitojo, dank voor je reactie en invalshoek. Deze "systemen uit het verleden" zoals jij ze noemt kunnen prima mij in deze cyclus. De image gerelateerde documenten kunnen prima omgezet worden in platte tekst door middel van OCR. Deze platte tekst kan vervolgens gebruikt worden voor de hierbovengenoemde tekst analyse. Met het gebruik van machine learning zal de kwaliteit van het omzetten van de image naar tekst toenemen, evenals de kwaliteit van de 'metadatering'.

Plaats een reactie

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *.