Insights & Data Blog

Insights & Data Blog

Meningen op deze blog weerspiegelen de opvattingen van de schrijver en niet per definitie die van de Capgemini Group

ECM & Artificial Intelligence

Onlangs heb ik mee mogen doen aan een Hackathon met als thema Artificial Intelligence (AI). In twee dagen moesten verschillende teams binnen iets meer dan 40 uur een applicatie ontwikkelen dat intelligent gedrag vertoonde. Het onderdeel waar mijn focus met name op lag was een schaalbare applicatie in IBM Bluemix wat het verwerken van data voor zijn rekening nam. Dit had niet direct te maken met mijn specialisatie in Enterprise Content Management (ECM), maar de mogelijkheden die ik zag wilde ik krijg in de context van ECM plaatsen.

In huidige ECM systemen wordt zitten een groot aantal slimme features, maar deze kunnen nog niet direct artificial intelligent genoemd worden. Denk bijvoorbeeld aan automatische classificatie van documenten, waar op basis van metadata wordt bepaald om wat voor document klasse het gaat. Een stapje verder is om hetzelfde te doen op basis van de inhoud van het document.

Het systeem wordt al wat slimmer als het de mogelijkheid heeft te leren. Dit komt erop neer dat naast nieuwe documentklassen herkennen het ook mogelijk moet zijn om fout geclassificeerde documenten te corrigeren. Handmatig een fout geclassificeerd document corrigeren moet in de toekomst voorkomen dat dezelfde fout opnieuw wordt gemaakt. Een iteratie over eerder geclassificeerde documenten kan ervoor zorgen dat fouten die in het verleden zijn gemaakt ook direct ‘even’ meegenomen worden.

Voorbeelden van nog meer intelligentie binnen het ECM systeem zijn concept expansion. Concept expansion houdt in dat er voor een term (bijvoorbeeld: parlement) gerelateerde termen worden bepaald (bijvoorbeeld: rechtstaat) en op basis van deze termen alsook synoniemen (bijvoorbeeld: volksvertegenwoordiging) gerelateerde documenten erbij worden gezocht. Automatisch!

Andere concepten waar we misschien al meer bekend mee zijn: vertalen van tekst, Optical Character Recognition (OCR) voor het bepalen van tekst in afbeeldingen, het omzetten van tekst naar audio en ook het omzetten van spraak naar tekst. Verschillende voorbeelden van intelligent gedrag waar volwassenen (met misschien wat training uiteindelijk) geen moeite mee hebben. Computers worden steeds beter in dezelfde taken en nemen dit meer en meer over.

Nu hebben we het vooral gehad over documenten en tekst, maar de mogelijkheden zijn er om objecten in foto’s en video’s te herkennen. Ook typisch iets wat geen probleem is voor een persoon, maar wat een lange tijd lastig was om te laten doen door een computer. De theorie rondom beeld herkenning is er al meer dan twintig jaar. Inmiddels is dit gebied zo volwassen geworden dat het ook makkelijk gebruikt kan worden.

Om beeldherkenning toe te passen is er wel wat geheugen en rekenkracht nodig en is typisch iets wat je niet graag binnen het eigen ECM platform wilt doen. Zo zou het kunnen zijn dat er gevolgen zijn voor de performance wanneer er teveel beelden tegelijk verwerkt moeten worden.

Ondanks dat er nog steeds verzet is tegen het onderbrengen van data in de cloud is het juist de cloud die hier uitkomst in kan bieden. Het heeft namelijk verschillende voordelen op het gebied van performance, beheer en onderhoud. Dit zijn sowieso de voordelen die worden genoemd voor het onderbrengen van applicaties in de cloud.

Het gebruik van resources kan worden afgerekend per gebruik. Dit betekent dus dat er enkel wordt betaald wanneer er daadwerkelijk werk moet worden verzet voor deze complexe taken. Daarnaast kan je je voorstellen dat verschillende nieuwe technologieën, waaronder beeldherkenning, behoorlijk complex zijn om te onderhouden en verbeteren. Wanneer gebruik gemaakt kan worden van API’s en dus resources in de cloud, valt deze complexiteit niet onder eigen beheer.

Een hybride cloud oplossing is dus een oplossing die interessant kan zijn voor bedrijven. Zo houdt men de bedrijfskritische data zoveel mogelijk binnenshuis, waar zware taken realtime in de cloud uitgevoerd kunnen worden.

Over de auteur

Dion Jansen
Dion Jansen

Plaats een reactie

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd met *.