PDF-Importoptionen in Data Prep Studio anpassen

Wenn Sie eine PDF-Datei in Monarch Data Prep Studio importieren, analysiert die Anwendung die Datei, um die beste Methode zum Transformieren der Daten zu finden. In den meisten Fällen erzielen die automatischen Erkennungsroutinen von Monarch Data Prep Studio das beste Ergebnis. Unter bestimmten Bedingungen müssen die PDF-Importoptionen evtl. etwas anders eingestellt werden.

Frühere in Monarch verwendete PDF-Engines nutzten nichtproportionale Schrift und freien Textfluss zur Einstellung der Textausrichtung. Diese älteren Engines reichen gewöhnlich für folgende Zwecke aus:

In neueren PDF-Berichten passiert jedoch Folgendes:

Außerdem werden PDF-Berichte nun von zahlreichen Softwareprodukten veröffentlicht und können hinsichtlich der Verwendung von Schriftarten, Hintergründen und Strichfarben unberechenbar sein. Daher ist eine Renderingmaschine erforderlich, die eine beliebige Kombination von Schriftarten (einschließlich sowohl nichtproportionale als auch Freitext-Schriftarten) und Hintergrundfarben tolerieren kann.

Monarch stellt eine neue PDF-Engine (Version 4.5) vor, die die Genauigkeit der Textextraktion verbessert, indem grafische Elemente wie vertikale und horizontale Linien und Rechtecke auf den wiedergegebenen PDF-Seiten erkannt und diese Elemente zur Bildung von Rastern verwendet werden, an denen der Text ausgerichtet wird. Diese neue Funktion adressiert Ausrichtungsprobleme, die einige Selektionsvorgänge in PDF-Dateien extrem schwierig gestalten.

Schritte:

  1. Öffnen Sie einen PDF-Bericht im Fenster „Berichtsentwurf“. In diesem Beispiel verwenden wir die Datei Komponisten.pdf, die normalerweise in C:\Users\Public\Documents\Altair Monarch\Reports verfügbar ist.

    Wie in der Abbildung unten dargestellt, erscheinen die Einträge in der zweiten Spalte des Berichts im Fenster „Berichtsentwurf“ versetzt, falls eine PDF-Engine mit niedrigerer Versionsnummer verwendet wird.

     

  2. Klicken Sie auf die Registerkarte Dokumentoptionen, um die Importeinstellungen für PDF-Dateien anzuzeigen.

  3. Geben Sie die gewünschten Einstellungen für folgende Optionen an:

  4. Wenn Sie mit dem Festlegen der gewünschten PDF-Importoptionen fertig sind, klicken Sie auf Akzeptieren, um diese Einstellungen zu speichern und auf die PDF-Datei anzuwenden. Im Beispiel unten wurden die Optionen Immer linksbündig und Linke Leerstellen unterdrücken ausgewählt.

     

  5. Monarch Data Prep Studio importiert die PDF-Datei unter Verwendung der festgelegten Importoptionen.