Texterkennung: Essenzielles Glied in der Dunkelverarbeitung

8.1.2019

Die Texterkennung wird in der schnelllebigen digitalen Welt immer wichtiger. In den meisten Fällen ist das Arbeiten mit Stift und Papier oder das manuelle Übertragen von Inhalten aus Rechnungen, Verträgen oder Formularen überflüssig geworden. Stattdessen befindet sich unsere Art mit Dokumenten im stetigen Wandel und macht unser Leben nun leichter. Aber wie funktionieren Texterkennungsprogramme genau und wie können Sie davon profitieren? Lassen Sie uns in das Thema, mit der Versicherungsbranche als Beispiel, eintauchen und beleuchten was eine Texterkennung ist, wie sie funktioniert und welche Vorteile sich aus der automatisierten Verarbeitung mit mobilen Anwendungen im Alltag ergeben.

Was ist Texterkennung?

Texterkennung (OCR) definiert sich durch den Prozess, Text aus digitalen Bildern Pixel für Pixel zu extrahieren und in eine digitale Variante umzuwandeln. Das Verfahren ist auch bekannt unter dem Namen Optical Character Recognition. Nachdem eine Seite durch einen Scanner oder eine mobile App gescannt wurde (z.B. ein Vertragsdokument), analysiert die Software die Bausteine des Dokuments. Im ersten Schritt werden dabei Bild- von Textelementen getrennt. Im weiteren Prozess werden einzelne Zeichen erkannt und zu einem Text zusammengefügt. Das Ergebnis ist eine digitale Datei, die durchsucht und in automatisierten Prozessen verwendet werden kann.

Welche Technologie steckt hinter der Texterkennung?

Bei der Texterkennung (OCR) werden durch die Software folgende Schritte anhand der gegebenen Datei abgearbeitet:

  1. Die Software unterteilt das Dokument zunächst in Text und Bilder.
  2. Einzelne Blöcke von Text werden dann in Abschnitte, Sätze, Wörter und Buchstaben zerlegt.
  3. Die Texterkennungs-Software enthält Muster von jegliche Zeichen und gleicht die enthaltenen Buchstaben mit diesen ab. Bei einer Übereinstimmung von 99% geht das Programm davon aus, den korrekten Buchstaben erkannt zu haben.
  4. Daraus formt das Programm dann erst Wörter, dann Sätze und überträgt diese in ein bearbeitbares und durchsuchbares Dokumente

Wie wird Texterkennungssoftware (OCR) in der Versicherungsbranche genutzt?

Viele Abläufe bei Versicherern benötigen eine Umwandlung von analogem Text in eine digitale Form. Ein Scan in einem Bildformat allein genügt nicht, um das Dokument zu verarbeiten, zu ändern oder Text innerhalb des Dokuments zu suchen. Hier ist zusätzlich eine Integration von OCR Technologie in den Arbeitsabläufen erforderlich.

Anstatt Informationen manuell Wort für Wort abzutippen, was ein zeitraubender und fehleranfälliger Vorgang ist, setzen Versicherer vermehrt auf eine automatisierte Verarbeitung von Dokumenten. Innerhalb dieser automatisierten Prozesse werden Dokumente wie Rechnungen, Identitätsnachweise oder Verträge automatisch gescannt, erkannt und relevante Daten werden vollautomatisch verarbeitet. Das bring erhebliche Zeit- und Kostenersparnisse mit sich. Durch die zuverlässige Erkennung werden außerdem Fehler durch die manuelle Eingabe reduziert und so auch die Kundenzufriedenheit gesteigert. Alle Informationen können dann in Sekundenschnelle bearbeitet und gespeichert werden.

Unterschiede zwischen den verschiedenen Programmen zur Texterkennung

Qualität

Es werden zwar viele Tools zur Texterkennung angeboten, aber es gibt auch erhebliche Qualitätsunterschiede. Die Konsequenz dessen kann ein kostspieliger erhöhter Aufwand bei der Nachbearbeitung sein. Daher ist die Erkennungsgenauigkeit essenziell bei der Auswahl einer OCR Lösung. Hoch entwickelte Lösungen bieten außerdem zusätzliche Funktionen wie die Erkennung der Orientierung eines Dokuments oder verschiedene Ausgabeformate wie zum Beispiel als PDF-Datei oder das TIFF-Format.

Aufbewahrung und Sicherheit der Daten

Ein weiterer Schlüsselfaktor bei der Auswahl einer Texterkennung ist der Datenschutz. In Zeiten von übergreifenden internationalen Datenschutzstandards ist die Sicherheit der Daten von Angestellten und Kunden ein Muss. In diesem Fall zeichnen sich „nicht-serverbasierte“ Lösungen dadurch aus, die Daten direkt auf dem Endgerät des Nutzers zu verarbeiten und gar nicht erst an unkontrollierbare Server von Drittanbietern zu senden. Zusätzlich eliminieren digitale Dokumente die finanziell und logistisch höchst ineffiziente Lagerung der Dokumente vor Ort.

📌 Wenn Sie mehr über unsere Strategie zur Sicherheit Ihrer Daten erfahren wollen, lesen Sie gerne den Blog Post zum Thema Scanbot Datenschutz.

Spracherkennung

Es ist sehr wichtig, dass Ihr OCR Tool verschiedene Sprachen erkennen kann. Da immer mehr Menschen im Ausland arbeiten, wird die Fähigkeit internationale Kunden betreuen zu können zum ausschlaggebenden Faktor. Während viele OCR Lösungen alle gängigen Sprachen mit einem lateinischen Alphabet erkennen können, ist die Zahl der Lösungen mit einer Unterstützung für kyrillische, chinesische oder arabische Schriftzeichen begrenzt.

Verarbeitungsfehler

Um eine möglichst hundertprozentige Genauigkeit zu erreichen, benötigen Sie nicht nur einen guten OCR-Algorithmus, sondern auch das perfekte Ausgangsbild. Ein Smartphone ist heutzutage die flexibelste und günstigste Alternative zu wartungsaufwändigen Scannern. Aber da man beim Scan das Smartphone über das Dokument halten muss, ergeben sich auch erheblich mehr Fehlerquellen auf die eine Texterkennung sensibel reagiert. Beispiele sind eine zu geringe Auflösung, schlechte Lichtverhältnisse oder schräge Fotos. Daher müssen mobile Scan-Lösungen eine perfekte und der Situation angepasste Benutzerführung bieten, um einen bestmöglichen Scan zu erzielen. Diese Funktion macht den größten Unterschied beim mobilen Scannen aus, da Qualitätsverluste im ersten Schritt später nicht wettgemacht werden können.

📌 Fazit: Texterkennung ist mehr als relevant für Versicherungen

Zusammenfassend kann festgehalten werden, dass der Einsatz von Programme zur Erfassung und Erkennung von Text die Produktivität deutlich erhöhen, während zusätzlich Kosten gespart werden. Sie ermöglichen die Digitalisierung von Rechnungen, Verträgen oder Identitätsnachweisen, die zu klassifizierbaren und durchsuchbaren digitalen Dateien werden. Um Probleme bei der Verarbeitung zu vermeiden, ist die Auswahl der richtigen Lösung essenziell. Wenn es um sensitive Daten geht raten wir dringend zu einer „nicht serverbasierten“ Offline-Lösung, um einen höchstmöglichen Datenschutz zu gewähren.

Erhalten Sie die ausführliche Fallstudie

Digitale Schadensprozesse

Um auf die Fallstudie zuzugreifen, verarbeitet und nutzt Scanbot die angegebenen Informationen, um Sie bzgl. unserer Produkte zu kontaktieren und Ihnen den monatlichen Newsletter zuzusenden. Sie können sich jederzeit davon abmelden. Hinweise zum Widerruf und der Verarbeitung der Daten finden Sie in unserer Datenschutzerklärung.

Scanner SDK Fact Sheet

Das Scanbot Fact Sheet: Alle Informationen auf einen Blick!

Scanbot verarbeitet und nutzt die angegebenen Informationen, um Sie bzgl. unserer Produkte zu kontaktieren und Ihnen den monatlichen Newsletter zuzusenden. Sie können diesen Service jederzeit deabonnieren. Hinweise zum Widerruf und zu der Verarbeitung Ihrer Daten finden Sie in unserer Datenschutzerklärung.

Max Stratmann

Vertriebsleiter
Call vereinbaren
Eine E-Mail senden

Wir freuen uns darauf, mit Ihnen gemeinsam die perfekte Scan-Lösung für Ihre App zu finden. Unser Expertenteam steht Ihnen zu allen Fragen bzgl. der Funktionalität, Integration oder des Lizenzmodells zur Verfügung.