Extrahieren

Mit dieser Funktion können Texte und/oder Grafiken aus PDF-Dokumenten isoliert und in einem Zielverzeichnis abgelegt werden.

Alle Dokumente aus der Liste werden verarbeitet, über die Optionen Texte extrahieren und Bilder extrahieren wird festgelegt, welche Bestandteile ausgelesen werden.

Das Zielverzeichnis enthält anschließend die gewünschten Dateien. Benannt sind diese mit dem Dokumentnamen _ Seite(Nummer)_Laufende Nummer. Textdateien gibt es für jede Seite, auf der Text gefunden wurde, hier gibt es keine laufende Nummer. Bildformate sind, je nach Bildformat, .jpg, .png oder .tif. Maskierte (freigestellte) Bilder werden in der Regel als .png gespeichert, zusätzlich dazu noch je ein .tif für das unmaskierte Bild und die Bildmaske. (Im Bild zum Beispiel POD_2020_05_Seite09_2.png, POD_2020_05_Seite09_2.tif und POD_2020_05_Seite09_3.tif)