Übersicht: Summierungen in Data Prep Studio

Durch Klicken auf die Registerkarte Analysieren wird die Symbolleiste von Data Prep Studio gestartet, mit deren Hilfe Summierungen erstellt und verwaltet werden können. Eine Summierung fasst Informationen über ausgewählte Felder tabellarisch zusammen und stellt die Ergebnisse für eine tiefergehende Analyse in einer ein- oder zweidimensionalen Matrix dar. Nehmen wir beispielsweise eine Tabelle mit den Details zu Artikeln an, die von verschiedenen Kunden innerhalb von drei Monaten in einem Schallplattengeschäft gekauft wurden. Sie können diese Tabelle sortieren und sehen, wer jeden Tag wie viele Kopien gekauft hat. Sie erfahren aber nicht, wie viel jeder Kunde insgesamt im Quartal ausgegeben hat oder auch den Umsatzprozentanteil.

Abbildung 1. Auszug aus einer gewöhnlichen Tabelle in DPS.

 

Die unten angezeigte Summierung beantwortet diese Fragen.

Abbildung 2. Summierung des Gesamtumsatzes nach Kunde.

 

Anhand einer anderen Summierung erfahren Sie sogar, welcher Medientyp am beliebtesten war.

Abbildung 3. Summierung des Gesamtumsatzes nach Medientyp.

 

In den abgebildeten Summierungen werden die Informationen über ein einzelnes Schlüsselfeld (d.h. Zeile) zusammengefasst. In der ersten Summierung handelt es sich um das Schlüsselfeld „Kunde“ und in der zweiten um das Schlüsselfeld „Medien“. Tabellarisierte (oder summierte) Felder werden Messwerte genannt. In beiden oben dargestellten Summierungen wird das Feld „Betrag“ als Messwert verwendet.

Hinweis: In einer Summierung muss mindestens ein Schlüsselfeld vorhanden sein. In der Regel enthält eine Summierung zumindest einen Messwert, aber dieser ist nicht unbedingt erforderlich.

Schlüsselfelder dienen zur Erstellung der Summierungsmatrix. Die Summierung in Abbildung 3 verwendet beispielsweise das Feld „Medien“ als Schlüsselfeld. Monarch Data Prep Studio überprüft das Feld, erstellt eine Liste aller eindeutigen Werte (BLU, CD, LP, SACD und DVD) und verwendet diese Werte anschließend, um die Summierungsmatrix zu erstellen.

Messwerte sind numerische Felder, die für jede in den Schlüsselfeldern vorgefundene eindeutige Werteinheit tabellarisiert werden. In Abb. 3 ist das Feld „Betrag“ z. B. in separate Gesamtbeträge für die einzelnen Medien aufgegliedert.

Obwohl nur ein einziges Schlüsselfeld und ein einziger Messwert erforderlich sind, um eine Summierung zu erstellen, können Summierungen sehr komplex sein und verschiedene Schlüsselfelder, Spalten oder Elemente, und Messwerte enthalten. Jeder Messwert kann dazu verwendet werden, die Summe, den Durchschnitt, den prozentualen Anteil an der Gesamtsumme, den Höchstwert, den Mindestwert und die Standardabweichung oder Varianz für die einzelnen Schlüssel zu berechnen. Monarch Data Prep Studio außerdem die Funktion ZAHL, die als Messwert genutzt werden kann. Durch diese Funktion werden anstelle von Berechnung eines ausgewählten Messwertes die Datensätze für die einzelnen Schlüssel gezählt.

Die Summierung in Abbildung 4 enthält die Schlüsselfelder „Kunde“ und „Medien“ sowie die Funktion COUNT und das Feld „Betrag“ als Messwerte.  

Abbildung 4. Umsatz, unterteilt nach Kunde und Medien. In der Spalte ZAHL wird die Anzahl der Transaktionen angezeigt und in den Betragsspalten die Beträge für den Gesamtumsatz für die einzelnen Schlüssel.

 

Eine Summierung kann durch Elementfelder erweitert werden, so dass auch einzelne Transaktionen angezeigt werden können. Wenn Sie Einzeltransaktionen anzeigen möchten, ist es besser, Elementfelder zu benutzen, anstelle die Transaktionen im Tabellenfenster anzeigen zu lassen, da in der Summierung sowohl Zwischensummen als auch Gesamtsummen ausgeworfen werden können.

Die Summierung in Abbildung 5 enthält die Schlüsselfelder „Kunde“, „Medien“, „Anzahl“ und „Beschreibung“ sowie das Feld „Betrag“ als Messwert. Diese Summierung zeigt die Transaktionen pro Kunde und unterteilt nach Medientypen. Zwischensummen werden sowohl auf der Ebene der Medien als auch auf der Ebene der Kunden erstellt.

Abbildung 5. Eine Summierung, die einzelne Transaktionen anzeigt.

 

In allen vorstehend gezeigten Summierungen werden die Schlüsselfeldwerte in den Spalten auf der linken Seite der Summierung angezeigt. Es gibt jedoch auch noch eine andere Summierungsart, bei der die zusammengefassten Informationen über zwei Schlüsselfelder in einer zweidimensionalen Matrix angezeigt werden. Dabei werden die Werte für eines der Schlüsselfelder in der am weitesten links liegenden Spalte der Matrix und die Werte des anderen Schlüsselfelds über die erste Reihe hinweg als Spalten angezeigt. In dieser zweidimensionalen Anordnung wird immer nur ein einzelner Messwert angezeigt.

Ein Beispiel für diese Art der Summierung wird in Abbildung 6 dargestellt. In der abgebildeten Summierung sind „Kunde“ und „Medien“ die Schlüsselfelder, und die Werte für das Feld „Medien“ werden über die obere Reihe (Spalten) verteilt angezeigt. Das Feld „Betrag“ ist in separate Summen für die einzelnen Medientypen unterteilt. Summen für jedes Geschäft werden in der äußersten rechten Spalte und die Gesamtsummen für die einzelnen Medientypen entlang der untersten Reihe angezeigt. In der untersten rechten Zelle ist die Endsumme für alle Medientypen und Geschäfte zu sehen.

Abbildung 6. Zweidimensionale Summierung mit nach Kunden und Medientypen unterteilten Umsätzen.

 

Beachten Sie bitte, dass das Spaltenformat in Summierungen von den Spaltenformaten der Tabellen übernommen wird, aus denen die Summierung erstellt wurde. Das Ändern von Spaltenformaten im Fenster „Vorbereiten“ nachdem eine Summierung erstellt wurde, hat keine Auswirkung auf das Spaltenformat in dieser Summierung.

Folgenden Themen können sich bei der Arbeit mit Summierungen in Data Prep Studio als hilfreich erweisen: