Alternative OCR Engine anbinden

  • Hallo,

    ich wollte mal fragen, wie es möglich ist, eine alternative OCR-Engine an Agorum anzubinden. Und ob das vielleicht auch mal jemand gemacht hat? Wir würden gern mal ein bisschen mit anderen (im Zweifel auch kostenpflichtige) Engines testen und die Ergebnisse vergleichen.

    • Offizieller Beitrag

    Hallo,


    ja, das wäre möglich, zumindest für den Einsatz als Textextraktion für die Suchmaschine. Für die Nutzung in docform wäre noch mehr notwendig.


    Wichtig ist, dass die OCR Engine, die angebunden werden soll via Script oder Batch aufgerufen werden kann. Und als erster Parameter das Quell-Dokument (z.B. eine PDF) erhält und als zweiter Parameter wird die Datei übergeben, in den das konvertierte Format geschrieben wird (z.B: Text). Eine tangierendes Beispiel für die Erstellung eines solchen Konverters ist hier zu finden: Konverter anlegen. (Hier wird zwar beschrieben, wie eine PDF in ein Bild konvertiert wird, kann aber analog angepasst werden für die Konvertierung von z.B: pdf zu txt.)

Jetzt Teil von agorum Community werden!

Noch kein Benutzerkonto? Registriere dich kostenlos und werde Teil von agorum Community!