artikel

Digitaal handtekening lezen: bespaart kosten en verhoogt kwaliteit

Supply chain

Postbedrijven gebruiken het al jaren voor de verwerking van hun brieven en in veel formulierverwerkende bedrijven is de technologie aan een stevige opmars bezig: Optical Character Recognition (OCR) of in het Nederlands optische kararakterherkenning. Hoe zit een businesscase eruit en waar moeten bedrijven op letten als ze overwegen OCR te implementeren?

OCR wordt gebruikt om papieren documenten te transformeren tot digitale, zodat ze te bewerken en archiveren zijn en in andere applicaties gebruikt kunnen worden. Papieren documenten zoals formulieren, brieven, contracten, artikelen, rapporten en handleidingen worden in een handomdraai omgezet naar bewerkbare teksten, bijvoorbeeld een Word-bestand. OCR werkt op basis van patroonherkenning. De tekst die moet worden gelezen, wordt gefotografeerd. Op dat moment is de tekst nog gewoon een afbeelding.

 

OCR-software herkent vervolgens de letters en cijfers en kan deze in een Word-document weergeven. Zo kunnen met de hand ingevulde acceptgiro’s in het betalingssysteem worden ingevoerd, schadeformulieren worden gelezen en brieven door postsorteermachines in de juiste bak worden geworpen.

 

Twee smaken
OCR-software is er grofweg in twee smaken. Er is software voor de consumentenmarkt, die gebruikers in staat stelt om een tekst op A4 in te scannen. Daarna vervaardigt de OCR-software een document dat precies lijkt op het ingescande document, waarbij ook de fonts (lettertypes) en de opmaak worden gekopieerd. Behalve dat de omgezette tekst makkelijker te bewerken is, is het een groot voordeel dat een A4-tje in Word aanzienlijk minder geheugenopslag kost dan een A4-tje als de ingescande ‘foto’ van het document.
De andere variant is professionele OCR-software die ook handgeschreven tekst herkent en die in een proces wordt ingezet. Dit wordt toegepast in sorteercentra van posterijen, bij de verwerking van enquêtes en schadeformulieren, bij het lezen van acceptgiro’s en het herkennen van nummerborden.

Bij veel van deze documenten gaat het om formulieren die met de hand worden ingevuld. De software moet dan dus in staat zijn handschriften te herkennen. Dit is vele malen ingewikkelder dan het herkennen van gedrukte tekst, vanwege de grote variatie in schrijfwijzen. Doordat de tekst op een formulier echter op vaste plaatsen staat en ook vaak een specifieke betekenis heeft, bijvoorbeeld een postcode, registratienummer, adres of getal, is er vaak toch een goede herkenbaarheid mogelijk. De software weet dan namelijk al of er op een bepaalde plek een letter of een cijfer moet staan en maakt geen vergissingen door een 9 voor een g aan te zien of andersom. 

De markt voor OCR-software is breed en divers. Dat komt door de veelvoud van toepassingen, meent Hans Kamperman, project manager bij PrimeVision. “Bij het eerste type OCR-software ben je een heel eind als de software de meest voorkomende lettertypes herkent. Bovendien is het meestal niet zo erg als ergens een letter verkeerd wordt gelezen. Dit soort software wordt in combinatie met scanners verkocht; het is een massamarkt die zich kenmerkt door standaardoplossingen.”

PrimeVision opereert in het tweede type markt, waar het gaat om het lezen van formulieren, acceptgiro’s, adressen en andere documenten die vaak met de hand worden ingevuld. Kamperman: “Dan praat je over zo verschrikkelijk veel meer vrijheidsgraden, dat is niet te vergelijken met het omzetten van documenten met getypte tekst. Bovendien zijn in die omgevingen de gevolgen van het fout lezen vaak veel groter. Als de OCR-software het bedrag op een acceptgiro niet goed leest en teveel geld van je bankrekening afschrijft, heeft dat grote consequenties. Niet alleen kost het veel geld om de fout te herstellen, maar ook het vertrouwen dat klanten in je hebben zal fors afnemen. De foutkans moet in dit soort omgevingen dus veel kleiner zijn, terwijl de variatie vele malen groter is.”

 

Selectiecriteria
Hoewel op het tweede type markt de technologie op alle deelsegmenten vergelijkbaar is, opereren op iedere deelmarkt andere leveranciers. Dat komt doordat iedere markt om een andere aanpak vraagt, meent Kamperman. “Kijk je bijvoorbeeld naar software voor nummerplaatherkenning, dan kan vaak een standaardoplossing worden geïntegreerd in bestaande systemen, zoals een slagboom. OCR is in die markt een product. Dat ligt geheel anders in de formulierverwerkende industrie. Daar grijpt OCR diep in in de processen. Vaak wordt OCR tegelijk met een document management oplossing geïmplementeerd en is de inregeling van die systemen maatwerk. Dat betekent voor leveranciers dat ze niet zozeer een product verkopen, maar een project. Kun je je bij een standaardtoepassing als nummerplaatherkenning beperken tot een goede kwaliteitsvergelijking van de systemen, bij dit soort maatwerktoepassingen is niet alleen de kwaliteit van de software zelf de kritische succesfactor, maar ook de kwaliteit van het projectmanagement en de consultancy.”

 

Foutkans
De hamvraag in dat adviestraject is altijd: bij welke foutkans zijn de totale kosten het laagst en welke foutkans kan ik in mijn proces toestaan? Het is duidelijk dat een verkeerd bezorgde brief slordig is, maar dat de gevolgen van een verkeerd afgeboekt bedrag vele malen groter zijn. Bovendien is er in het eerste geval nog een menselijke controle op het moment dat de post wordt bezorgd, terwijl die in het tweede geval meestal ontbreekt. Dit soort factoren moeten uiteraard worden meegewogen. Vervolgens kan op een wiskundige manier worden berekend bij welke foutkans de totale kosten van het proces het laagst zijn (zie kader). 

 

Snelheid

Een ander belangrijk aspect van OCR is de beschikbare rekenkracht en daarmee de snelheid. Om voldoende efficiencywinst te behalen ten opzichte van het handmatige proces, moet een document met een bepaalde snelheid kunnen worden afgehandeld. Hoe meer rekentijd er is, des te slimmere technieken kunnen worden ingezet om binnen de beschikbare tijd de geschreven tekst te herkennen. Omdat de Wet van Moore nog altijd geldig is – iedere achttien maanden verdubbelt de rekenkracht van chips – is de rek er op dit front nog lang niet uit.

 

Lezen adreslabel
Is het lezen van een handschrift op een formulier of acceptgiro voor de meeste OCR-software al niet eenvoudig, het wordt nog ingewikkelder als een adres of adressticker op een pakket moet worden gelezen. Vaak is de ruimte voor het adres op een sticker zo klein, dat de afzender het adres van de geadresseerde niet netjes binnen de lijnen krijgt. Ook staan adressen regelmatig half op het etiket en half op de doos, of dwars door de lijnen die de adresregels moeten aangeven of door een logo op de adressticker. 

 

Behalve dat het adres moeilijk leesbaar is, is het voor automatische sorteersystemen ook heel lastig vindbaar. De meeste pakketten zijn dozen, wat betekent dat de adressticker op zes kanten van het pakket kan zitten. Anders dan bij een brief – die in alle gevallen ongeveer dezelfde dikte heeft – moet bij een pakket de scherpstelling van de camera steeds opnieuw aan ieder pakketje worden aangepast. Tekstherkenning begint immers met een goede foto van de te lezen tekst. Vervolgens moet nog worden vastgesteld wat de boven- en onderkant van het adres is. Pas dan kan het adres worden gelezen en het resultaat worden geanalyseerd.

 

Codering
TNT Post Pakketservice kende al jaren een werkmethode waarbij de gegevens van het fysieke pakket dienden te worden gecodeerd, en ging op zoek naar een werkwijze om de kosten voor deze activiteit te verlagen. Naar aanleiding van ervaringen van buitenlandse pakketdiensten riepen ze de hulp in van PrimeVision, dat op basis van standaardcomponenten een maatwerkoplossing ontwikkelde. 

 

Manager Sorteercentrum Internationale Pakketten Gabby van der Arend legt uit hoe het systeem werkt: “Ongeveer 60 procent van alle pakketten is voorgemeld (adresgegevens zijn bekend in het systeem op basis waarvan een sorteerbeslissing kan worden genomen), de andere 40 procent moet nog door een codeur worden opgevoerd in het systeem. Vroeger zat deze codeur naast de band, moest het pakketje eraf pakken, kijken waar de adressticker zat en vervolgens de postcode, het huisnummer en een eventuele extensie intikken om het adres op te voeren. Dan was er nog een specifieke werkplek waar, in geval van pakketten met een aanvullende dienst, aangegeven moest worden of het pakket met of zonder aanvullende dienst werd verstuurd.” 

 

Een aanvullende dienst is bijvoorbeeld een zending onder rembours of een pakket waarvoor getekend moet worden. In de nieuwe situatie wordt van ieder pakket een foto gemaakt. Het OCR-systeem checkt aan de hand van gegevens op de foto of het een pakket is met of zonder aanvullende dienst en leest postcode, huisnummer en eventuele extensie uit. In ongeveer de helft van de gevallen worden die gegevens goed gelezen. De pakketten die niet goed zijn gelezen, worden aangeboden aan videoschermen in een aparte ruimte, waar de codeurs tegenwoordig bij elkaar zitten. 

 

Van der Arend: “Het systeem biedt de foto’s ad random aan de codeurs aan, zodat niet meer de band hun werktempo bepaalt, maar zij in hun eigen tempo kunnen werken en er sprake is van een continue stroom van aanbod van beelden. Alle codeurs hebben een blindtypetraining gehad voor aanvang van de daadwerkelijke videocodeeropleiding. Omdat ze nu geen pakketje vanaf de band hoeven te pakken en hoeven draaien tot ze het adres gevonden hebben, kunnen ze veel sneller coderen dan voorheen. Daarmee hebben we een belangrijke bottleneck in het proces weggehaald.” 

 

OCR heeft bij TNT Post Pakketservice een grote impact op de organisatie. Het proces is anders ingericht en er is fors op mankracht bespaard. TNT Post Pakketservice verwacht het systeem in drie jaar terug te verdienen.

 

Nieuwe lay-out
Van der Arend zegt dat het overigens niet zozeer de handgeschreven adressen zijn waar de OCR-software moeite mee heeft, maar vooral de afwijkende lay-outvormen van de adresstickers. “Je hebt bijvoorbeeld etiketten met strepen waarop klanten het adres moeten schrijven. Die zijn moeilijk door OCR te lezen. Ook zijn er etiketten waar je een landcode voor de postcode moet zetten. Dat wordt niet herkend omdat de OCR-software op de plaats van de postcode vier cijfers en twee letters verwacht aan te treffen.” 

Kamperman onderkent dit probleem. “De software kan inderdaad moeilijk overweg met dikke zwarte schrijflijntjes, maar maak je daar een stippellijn van in plaats van een doorgetrokken streep, dan is dat prima weg te filteren. Ook de ruimte om iets in te vullen is op veel formulieren uitermate beperkt. Als er te weinig ruimte is om de postcode en de plaatsnaam achter elkaar te schrijven, dan zetten veel mensen de plaatsnaam er maar onder. De software herkent het dan echter niet meer altijd als adres.”

 

Businesscase
OCR kan in omgevingen waar veel formulieren moeten worden verwerkt of veel adressen moeten worden uitgelezen tot forse besparingen leiden, mits het selectie- en implementatietraject gedegen wordt aangepakt. Selecteer een leverancier op zijn kennis en know-how, niet alleen op de kwaliteit van de software. Realiseer je dat een OCR-implementatie vrijwel altijd gepaard gaat met (forse) wijzigingen in de processen. Een goed moment is daarom de invoering van een document management systeem, waarbij de processen toch ook al onder de loep worden genomen en opnieuw worden ingericht. Wordt aan deze voorwaarden voldaan, dan is al snel een businesscase te maken waarbij de software zich in een aantal jaren terugverdient.

 

Auteur: Mirjam Hulsebos / DataCollect 3

Drie redenen om te kiezen voor OCR:

– Kostenbesparing door automatisering van handwerk

– Kwaliteitsverbetering. Mensen maken een onvoorspelbaar aantal fouten. Bij OCR kan de gebruiker een foutmarge instellen. Door deze foutmarge lager te stellen dan bij handwerk, verbetert de kwaliteit. Bovendien verbetert de voorspelbaarheid. De computer heeft immers nooit hoofdpijn, is niet aan het weekend toe en heeft op maandagochtend ook geen opstartproblemen.

– Eenvoudig om capaciteit op te schalen. Bedrijven die regelmatig piekperiodes kennen, weten hoe moeilijk het is om gedurende een korte periode aan personeel te komen. Een extra computer bijplaatsen is een stuk eenvoudiger.

Bij welke foutkans zijn de kosten het laagst?
Het is interessant te weten bij welke foutkans de totale kosten van het proces het laagst zijn. Die kans is als volgt te berekenen. De gebruiker hangt aan ieder proces een waarschijnlijkheidspercentage dat aangeeft hoe hoog de kans moet zijn dat de teksten juist worden herkend. De software kan nooit met 100 procent zekerheid zeggen dat hij de teksten juist heeft gelezen, dus de gebruiker zal het gewenste waarschijnlijkheidspercentage moeten vaststellen. Alle documenten die hoger scoren dan dit percentage worden geaccepteerd, alle documenten die lager scoren worden geweigerd en zullen handmatig moeten worden ingevoerd. Bij het vaststellen van het waarschijnlijkheidspercentage spelen twee factoren een rol: de kosten verbonden aan een weigering van het document, en de kosten verbonden aan een fout. Op basis van deze beide kostenposten kan het meest kostenefficiënte waarschijnlijkheidspercentage worden berekend.

Reageer op dit artikel