ABBYY is typisch een bedrijf dat aantoont zowel in de zakelijke markt als in de consumentenmarkt relevant te kunnen zijn. Dit door allerlei verschillende soorten herkenningssoftware (recognition) te leveren. Kunstmatige intelligentie (AI) speelt hierin een belangrijke rol, aangezien deze technologie het vermogen om bijvoorbeeld objecten en tekst te herkennen flink verbetert. We gingen over de impact van AI op de zakelijke oplossingen in gesprek met Cédric Hubert, Head of Global Enterprise Sales Europe bij ABBYY.
Met verschillende soorten herkenningssoftware bedoelen we in dit geval de wat bekendere technologieën optical character recognition (OCR) en optical mark recognition (OMR). ABBYY spreekt zelf ook over een andere soort, te weten intelligent character recognition (ICR). In eerste instantie klinkt dit misschien als een mooie marketingtruc om AI in het traditionele OCR-begrip te verwerken, maar dat is wat kort door de bocht. ICR is namelijk een methodiek om Robotic Process Automation (RPA)-software een stukje slimheid te bieden dat RPA zelf niet heeft.
Binnen de drie genoemde technologieën is een stukje kunstmatige intelligentie eigenlijk altijd belangrijk geweest, zelfs ruim voor de AI-hype van de afgelopen jaren. Tien jaar geleden was het al het doel om tekst, documenten en data op een zelfde manier te verwerken zoals een mens dat zou kunnen. Dan kun je niet om AI heen. ABBYY heeft ook andere typen software in huis dan OCR, ICR en OMR die net zo goed afhankelijk zijn van AI. Feit is hoe dan ook dat kunstmatige intelligentie verbetert, waardoor ABBYY eveneens zijn mogelijkheden ziet groeien.
OCR kan alleen maar beter worden
Om het kopiëren van menselijke handelen wat duidelijker te maken, kunnen we het best de manier waarop OCR werkt toelichten. Het kijkt in eerste instantie naar de structuur van een document, door snel op simpele zaken als alinea’s, afbeeldingen en tabellen te scannen. Daarna analyseert het stap voor stap de regels, woorden en cijfers, letters en leestekens. Bij het herkennen van die factoren wordt er aanspraak gedaan op het vermogen van de software, aangezien de symbolen per lettertype en handschrift variëren. De software wordt hierin bijgestaan door de tientallen ondersteunde talen, waardoor het soms wat kan corrigeren bij bijvoorbeeld een onherkenbare letter.
Voor beide vormen van analyse geldt dus in principe dat er nog slimheid te winnen valt. De eerste analysevorm waarbij tekens herkend moeten worden, is namelijk afhankelijk van hypotheses. Het moet er vanuit gaan dat de cijfers, letters en leestekens overeenkomen met de tekens die eerder al geanalyseerd zijn. Bovendien vormen nieuwe lettertypen en handschriften voor extra bagage in de toekomst. Op het gebied van taal kan de software net zo goed leren. Dit bijvoorbeeld door straattaal te leren of woorden te herkennen die officieel in een woordenboek opgenomen worden.
Integreren in enterprise-applicaties
Door deze twee analyse-lagen is de OCR-technologie in staat om fysieke documenten en PDF’jes om te zetten in doorzoekbare documenten. Naar eigen zeggen levert het bedrijf hiervoor één van de accuraatste technologieën op de markt, waar het moet concurreren met Kofax. De twee bedrijven leveren in ieder geval allebei krachtige technologieën, waarbij het verschil hem met name zit in de features van de producten.
Uiteindelijk is het voor zowel ABBYY als Kofax zaak om de software bij zoveel mogelijk gebruikers te brengen, zodat zij een veel eenvoudigere ervaring krijgen. Om dit te realiseren stelt ABBYY bijvoorbeeld een OCR-engine voor enterprise-organisaties ter beschikking, die zij kunnen implementeren in hun applicaties. In de praktijk komt dit van pas in een veelvoud situaties, zoals het invullen van een digitaal registratieformulier. Je kan dan een video-opname in real-time of foto van een fysiek document maken. De OCR herkent de relevante data en vult die in het formulier in. Hierin is een sleutelrol weggelegd voor snelheid. De handeling moet immers sneller zijn dan het handmatig invoeren van het formulier.
RPA als nieuwe markt
Dergelijke functionaliteiten werken allemaal prima en realiseren ook echt eenvoud bij de klant, maar ABBYY zoekt tegelijkertijd naar manieren om wat meer van zijn traditionele business model af te stappen. Dit door een bepaalde vorm van intelligentie naar RPA te brengen. ABBYY heeft natuurlijk ook gezien dat RPA een vorm van automatisering is die in populariteit groeit dankzij het vermogen om repetitieve taken over te nemen. De softwarerobots kopiëren menselijk handelen door workflows in zakelijke applicaties te observeren.
Het ding met pure RPA is dat het echt legacy processen te lijf gaat. Dat wil zeggen dat het workflows in zakelijke applicaties observeert, zoals een bepaald gedeelte in een procurement-proces, en het eenvoudige repetitieve handelen aanneemt als iets wat de robot zelf kan doen. Als RPA dan daadwerkelijk toegepast wordt, leest het het scherm om de taak precies zo uit te voeren zoals het altijd gebeurt.
ABBYY wil wat OCR toevoegen aan RPA zodat de robots nog wat effectiever kunnen worden. Hierbij leert het de robots onder andere afbeeldingen en tekst interpreteren en begrijpen, iets wat het omschrijft als ICR. De robots krijgen als het ware een set aan mogelijkheden om ook te anticiperen op mogelijke veranderingen. In de praktijk levert het situaties op als het lezen van een contract, zodat het beoordeeld kan worden op overeenstemming met compliance-richtlijnen. Zo kan het besluiten wat er moet gebeuren met het contract.
Door deze vorm intelligentie toe te voegen geeft ABBYY de RPA-robots intelligentie die ze missen, al kun je je afvragen of het dan niet meer richting een echt AI-robot gaat die ook menselijke intelligentie heeft. Volgens Hubert is dat momenteel niet echt een zorg, aangezien RPA op deze vorm van intelligentie zit te wachten. Dat tonen de samenwerkingen die ABBYY gesloten heeft ook aan. De grootste drie RPA-vendoren – UiPath, Automation Anywhere en Blue Prism – werken op dit vlak inmiddels samen met ABBYY. Hubert verwacht desgevraagd wel dat sommige RPA-leveranciers zelf ICR proberen toe te voegen, maar dat ABBYY voorlopig wel een voorsprong heeft door zijn research en development.
Eenvoud op de juiste plek
ABBYY laat hiermee zien dat de traditionele OCR- en OMR-technologie, alsmede de ICR-technologie waardevol is in de huidige markt. Hetgeen wat de software doet staat in het teken van de eindgebruiker zoveel mogelijk gebruiksgemak bieden. Dat zagen we recent nog met de integratie van de ABBYY Business Card Reader-app die geïntegreerd kan worden met Salesforce. Daardoor kunnen visitekaartjes direct gescand worden voor het aanmaken van een contact in Salesforce, wat een kleine tijdsbesparing scheelt. De ABBYY-software kan echter ook meer tijd besparen, zoals een registratieproces bij een bank vereenvoudigen door OCR toe te passen.
Naar aanleiding van het gesprek zijn we benieuwd wat we de komende periode nog meer kunnen verwachten. Er werd duidelijk gehint naar nieuwe ontwikkelingen op het gebied van OCR en ICR, maar heel veel details kon ABBYY nog niet geven. Zodra we meer weten lees je het uiteraard op Techzine.