Softwarepakketten.nl
BCS HR Software
EXACT Software
VISMA E-accounting
E-boekhouden

Bijdrage van Bloggers (blogs)

Hoe werkt OCR? En wat is de toekomst van OCR-software?

Plaatsingsdatum 31-03-2020
Berichtdatum 31 maart 2020

Blog door WhiteVision

Je hoort veel over het automatisch herkennen van documenten, maar hoe werkt OCR nu eigenlijk precies?

De afkorting ‘OCR’ staat voor Optical Character Recognition. De term vertegenwoordigt een techniek waarmee de computer letters, cijfers en leestekens van een plaatje afleest. Handig, want zo transformeer je documenten tot digitale versies om ze te kunnen bewerken en archiveren. Klinkt goed. Maar hoe werkt OCR in jóuw voordeel? En wat is de volgende stap op OCR-gebied?
Vroeger en nu: hoe werkt OCR in de basis en waar ligt de meerwaarde?

Tijdens het OCR-proces zet de software de 'leesbare' gegevens op een plaatje om in digitale data. Het resultaat is een bewerkbare tekst. Vroeger was dit meer dan voldoende. OCR was toen behoorlijk complex, omdat documenten veelal per post werden verstuurd. Een driedubbel gevouwen document met koffievlekken uitlezen was een sterk staaltje technisch vernuft. En OCR-software kreeg dat voor elkaar, bijvoorbeeld door het document digitaal 'schoon te poetsen'. Maar tegenwoordig ontvangen de meeste organisaties documentatie per mail in pdf-formaat. Het herkennen van teksten alléén is daarom niet meer zo'n ingewikkeld proces. Wat maakt OCR-software nu dan nog zo innovatief?

Alleen een OCR-systeem dat de gegevens ook kan interpreteren, springt er tegenwoordig nog uit. Reguliere OCR-software doet niets meer dan het omzetten van plaatje naar tekst. Een interpretatieslag maakt het verschil. Maar hoe werkt OCR wanneer het aankomt op het interpreteren van een document? Precies zoals het klinkt: de software begrijpt en verwerkt de data die erop staan. Dit kunnen onder andere een factuurnummer, een vervaldatum en een ordernummer zijn.

Hoe helpt OCR-software bij het eenvoudiger verwerken van documenten?
Het antwoord op die vraag heeft alles te maken met het interpretatievermogen van de OCR-software. Op het moment dat je een document aanbiedt, bepaalt het OCR-systeem met wat voor soort document het te maken heeft. Op basis daarvan zoekt het naar specifieke velden of woorden. Hierbij is 'kwaliteit' een sleutelwoord: slechte OCR-software interpreteert de data niet correct, terwijl goede OCR-software zaken als factuur- en vervaldatum prima van elkaar kan onderscheiden en het meest waarschijnlijke scenario schetst. Dit stelt het systeem vervolgens aan je voor, zodat jij alleen nog even een controle hoeft uit te voeren.
De beste OCR-software vinden: waarop moet je letten?

Als je op zoek gaat naar de beste OCR-software voor jouw organisatie, is het belangrijk om eerst te bepalen met welk doel je een OCR-oplossing wilt gebruiken. Hoe meer documenttypes je bijvoorbeeld wilt laten herkennen, hoe intelligenter de software moet zijn.

Er is gratis OCR-software beschikbaar, onder meer via Google. Als je hier een document aanbiedt ter herkenning, heb je het binnen 1 seconde terug. Maar reken niet op enige interpretatie van de gegevens. Je ziet een grote brei van woorden achter elkaar staan en zal zelf moeten uitvissen waar die allemaal voor staan. Het kost niets, maar je hebt er ook niet veel aan – zeker niet wanneer je pagina's aan tekst hebt. Als je echt wat uit een OCR-oplossing wilt halen, is het belangrijk dat je kiest voor intelligente software.

Maar hoe werkt OCR die slim is? Het uitgangspunt is dat het herkennings- en interpretatieproces automatisch verloopt, zodat jij geen saai, repeterend (invoer)werk meer hoeft te verrichten. Dit betekent bijvoorbeeld dat de herkenningsgraad bij aanvang al heel hoog is, dat je geen templates hoeft aan te maken met de hand en dat de software automatisch een correctie aanbrengt wanneer de herkenning niet direct 100% is. De meeste partijen bieden deze slimme OCR-software niet. Maar het is wel verstandig om hiervoor te kiezen, omdat je alleen zo álles uit OCR kunt halen.

Volgende stappen: hoe werkt OCR in de toekomst?
Van oudsher richt OCR-software zich vooral op het verwerken van inkoopfacturen. Maar met de digitalisering van documenten wordt de stroom van inkomende documenten steeds meer divers. En die stroom moet je op eenduidige wijze kunnen verwerken in je financieel-administratieve systeem.

Daarnaast is er steeds meer sprake van documenten die aan facturen gekoppeld zijn, zoals pakbonnen of hr-onboardingformulieren. Ook daarop moeten slimme OCR-technieken worden toegepast. Een goede interpretatie van de gegevens zorgt er immers voor dat deze correct in het achterliggende (ERP-)systeem worden geregistreerd. Dat scheelt je een grote hoeveelheid werk.

Dat de flexibiliteit van OCR-software in toenemende mate belangrijk is, komt doordat documenten steeds minder gestructureerd zijn. Waar OCR zich vroeger alleen kon focussen op 1 bepaald documenttype met een vaste indeling (zoals een inkoopfactuur), moet het nu allerlei formats en lay-outs kunnen herkennen. Daar heb je enorm slimme OCR-software voor nodig.

Dus hoe werkt OCR dan in de toekomst? Misschien bewegen we toe naar 1 grote mailbox waarin alle documenttypes terechtkomen om door de OCR-software te worden herkend en verwerkt. (Wanneer het om inkoopfacturen gaat, heeft WhiteVision hiervoor overigens al een oplossing: de SMART E-mail-handler.) En wellicht is er naast Optical Character Recognition straks ook sprake van beeldherkenning. Wat als software de gezichten op een foto via socialmediaprofielen direct van een naam kan voorzien? Of kan berekenen wat de glasoppervlakte in de gevel van een kantoorpand is? Hoe slim kan OCR dán worden?

Meer weten over slimme OCR-software?
WhiteVision biedt een zelflerende OCR-oplossing die alle opgedane kennis deelt binnen de gebruikerscommunity. Het gebruiksgemak is optimaal, de software corrigeert zichzelf automatisch en alle gebruikers profiteren van het steeds slimmer wordende systeem. Bovendien ontwikkelen wij onze oplossing continu door, zodat zij toekomstbestendig is én blijft.

Categorie(n) Branche > Accountantskantoren, Branche > Financials, Soort > Documentbeheer en dossierbeheer
Bronvermelding WhiteVision
Internet URL http://www.whitevision.nl


Onerzoeksbureau GBNED