Herausforderung für das Scannen in der Cloud: Amazon Textract

By Ulrich Kampffmeyer posted 12-05-2018 04:59

  

Eigentlich ist es ja nur eine API und ein Dienst in der Cloud, der aus Amazons weitem Portfolio neuer Entwicklungen stammt. Es geht um die Texterkennung aus gescannten Dokumenten. Bisher ein klassisches Geschäft für Inhouse-Lösungen und Dienstleister. Nun kommt Amazon mit einer Lösung in der Cloud, in die man hineingescannt und ausgewertete OCR/ICR-Ergebnisse zurückerhält. Eigentlich nichts Aufregendes, wäre da nicht der Preis: 1,50 $US für 1000 Seiten. [Quelle: http://bit.ly/AmazonTEXTRACT

Textract (http://bit.ly/amazontextract) markiert einen Paradigmenwechsel. Technologie, die bisher nur teuer für Unternehmen verfügbar war, wird zum Allgemeingut. Die Funktionalität und der Preis sind eine Kampfansage an die ECM-Branche. 

Textract extrahiert Daten mit hoher Genauigkeit. Mit jedem neuen Dokument wird die Lösung sicherer. Daher ist der geringe Preis auch nur ein Anreiz, die selbstlernende und selbstoptimierende KI-Lösung mit Lern- und Textmaterial zu füttern. Sie gleichermaßen für Fließtext wie auch für - gut designte - Formulare geeignet. Layouts und Feldinhalte werden erkannt und extrahiert. Die Ergebnisse können einfach über die API in Anwendungen und Datenbanken integriert werden. Es ist nicht notwendig, selbst zu programmieren, Vorlagen oder Bildschirmformulare zu entwickeln. Amazon weist darauf hin, dass die sehr gute Qualität auf bereits millionenfach ausgewerteten Dokumenten basiert - deren Inhalt dann aber von Amazon verarbeitet werden (und gespeichert werden?). Das ist der Pferdefuss des Angebotes. Auch wenn dieses adhoc beauftragt und wieder gekündigt werden kann, da es keine vertragliche Laufzeitbindung gibt. 

Es wird spannend, wie die ECM-Branche auf diese Herausforderung reagiert. Gute Qualität zu Low Cost. Auch kann man ja dann die Daten und die Dokumente auch gleich in der Amazon-Cloud für wenig Geld lassen. zumindest ein Anbieter denkt schon in diese Richtung (und kündigt neue Features schon an): Microsoft. Auch im Umfeld von Office365 und Sharepoint wird es mehr Funktionalität für das Records Management und die automatische Klassifikation in 2019 geben.

[Quelle: http://bit.ly/AmazonTEXTRACT


#amazon
#textract
#cloud
#ScanningandCapture
#OCR.ICR
#formsprocessing
#UlrichKampffmeyer
0 comments
10 views