Die Texterkennungsfunktion (Optical Character Recognition, OCR) kann auch Text aus gescannten PDF-Dokumenten auslesen.

Die Texterkennung für gescannte PDFs muss in den Einstellungen aktiviert sein.


Hinweis: Die Texterkennungsfunktion muss nur bei solchen Dokumenten explizit ausgeführt werden, die gescannt und dann als PDF gespeichert wurden. Bei anderen PDFs, die per Software erzeugt wurden, liest Canto den Dokumententext automatisch aus.


Texterkennung für gescannte PDFs aktivieren

So aktivieren Sie als Administrator  die Texterkennung für gescannte PDFs:

  1. Wählen Sie Einstellungen > Tab Konfigurationsoptionen > Erkennung.
  2. Aktivieren Sie die Checkbox Texterkennung (OCR) für gescannte PDFs aktivieren.

Texterkennung durchführen

Sie können die Texterkennung für einzelne PDFs gesondert, oder für mehrere PDFs gleichzeitig durchführen 

  1. Um Texte aus einem einzelnen gescannten PDF auszulesen, öffnen Sie das PDF in der Vorschauansicht und klicken auf das Symbol  (OCR für PDF) in der Werkzeugleiste.
  2. Um Texte aus einem mehreren gescannten PDFs auszulesen, markieren Sie die entsprechenden PDFs und klicken auf das Symbol  (OCR für PDFs) in der Werkzeugleiste.

Der erkannte Text wird jeweils im Feld Dokumenttext gespeichert.