Doppelte Zeilen anzeigen/entfernen

„Duplikate anzeigen“ bzw. „Duplikate entfernen“ ermöglicht das Anzeigen bzw. Entfernen von Duplikaten aus einer Tabelle. Wählen Sie Duplikate anzeigen, um die Duplikate zu finden. Wählen Sie Duplikate entfernen, um unnötige Reihenduplikate zu entfernen.

Angenommen, Sie haben folgende Tabelle, in der die Datensätze 1 und 2, sowie 7 und 8 Duplikate sind:

 

„Duplikate anzeigen“ erstellt folgende Tabelle:

 

„Duplikate entfernen“ erstellt folgende Tabelle:

 

Zeilen mit doppelten Werten können für alle Spalten oder nur bestimmte Spalten angezeigt bzw. entfernt werden.  Sie könnten beispielsweise Zeilen mit doppelten Werten nur aus der Spalte Kunde entfernen, oder sowohl aus der Spalte Kontonummer als auch aus der Spalte Kunde.

Schritte:

Duplikate können nur vom Fenster Vorbereiten aus angezeigt werden. Gehen Sie dabei wie folgt vor:

  1. Wählen Sie im Fenster Vorbereiten die zu verändernde Tabelle aus.

  2. Wählen Sie Transformieren aus der Monarch Data Prep Studio-Symbolleiste aus.

  3. Das daraufhin angezeigte Dialogfeld ermöglicht die Auswahl einer Umwandlung.

  4. Wählen Sie Duplikate aus.

  5. Das Dialogfeld Duplikate wird angezeigt:

     

  6. Geben Sie den Namen der neuen Tabelle ein.

  7. Wählen Sie in der Dropdown-Liste den Vorgang „Deduplizieren“ aus.

  8. Folgendes Beispiel dient zur Erläuterung der verschiedenen Vorgänge:

     

    Es gibt zwei Gruppen von Duplikaten: Musikgeschäft Schütz kommt zwei mal vor und Die Melodie drei mal.

  9. Sie können wählen, welche Spalten bei der Suche nach Duplikaten berücksichtigt werden und welche nicht.

  10.  

    Eine Spalte, die abgewählt wurde, wird ignoriert, auch wenn sie Duplikate enthält.

  11. Klicken Sie auf das Kästchen Groß-/Kleinschreibung, wenn die Werte je nach ihrer Schreibweise differenziert werden sollen.

  12. Wenn die Groß-/Kleinschreibung aktiviert ist, gelten die Einträge „Musica Classica“ und „musica classica“ als zwei verschiedene Werte und werden nicht wie Duplikate behandelt.

  13. Wählen Sie die Spalten aus, die in die Ergebnistabelle mit einbezogen werden sollen.

  14. Klicken Sie auf OK.

  15. Monarch Data Prep Studio wendet die Deduplizierung an und erstellt eine neue Tabelle.