Tutorial


Anwendung von Box-Plots und Punktwolken in Tableau

Anwendung von Box-Plots und Punktwolken in Tableau



VonJulien Godenir

...

17 Juli 2019

Dieser Beitrag dreht sich ganz um Box-Plots, bzw. Kastengrafiken und Punktwolken in Tableau. Die Idee ist, ein Diagramm mit verschiedenen Informationen zur statistischen Verteilung Ihrer Daten zu erstellen, indem Sie beispielsweise das Datenset „Superstore" (im Lieferumfang von Tableau Desktop enthalten) verwenden. Sollten Sie Tableau Public verwenden, finden Sie die Daten hier.


Box-Whisker-Plot und Punktwolke in Tableau

Wie Sie in der oberen Grafik sehen können, haben wir für jeden Kunden eine Vertriebsansicht innerhalb einer Punktwolke. Wir haben einen Box-Plot verwendet, um die Mediane, Quartile und Deziles unseres Datensatzes zu erhalten. Außerdem ist es möglich, Kunden nach Umsatz zu gruppieren, um z.B. eine Aggregation zu Tausenden zu erhalten.

In folgendem Tutorial erfahren Sie, wie wir zu dem Ergebnis gekommen sind.

Sollten Sie Fragen haben oder auf Probleme stoßen, können Sie uns jederzeit kontaktieren. Viel Erfolg!

1. Das Fundament der Box-Whisker-Plots und Punktwolken: LOD-Ausdrücke

Um mit meinen Daten einfacher arbeiten zu können, verwende ich Level of Detail-Ausdrücke, um die Verkäufe nach Kunden, Verkaufskategorien und die Anzahl der Kunden nach Kategorie zu berechnen.

Da ich dem Benutzer die Möglichkeit geben möchte, die Größe von Verkaufskategorien zu ändern, erstelle ich einen Parameter vom Typ Ganzzahl (Integer) [Category Size]. Persönlich setze ich die Werte 1000, 2000, 3000, 5000 und 10000 ein. Sie können jedoch variieren und auch andere Werte einfügen.

Einen ersten Parameter in Tableau setzen

Um die Anzahl der Verkäufe für einen Kunden zu ermitteln, nutzen wir die „FIXED“ Kalkulation auf [Customer Name] und berechnen die Summe von [Sales]. Sie können auch "INCLUDE" oder „EXCLUDE" als LOD-Kalkulationen verwenden, wenn Sie möchten.


Eine erste FIXED-LOD zu Tableau hinzufügen

Als nächstes berechne ich, in welcher "Klasse" ein Kunde ist, indem ich den Umsatz pro Kunde durch [Category Size] dividiere und dann die kleinste Ganzzahl annähere.


Verwendung der FLOOR Kalkulation

Um die Berechnung zu verdeutlichen, füge ich ein berechnetes Feld hinzu, welches ich [Label Category Sales by customer] nenne und das einfach angibt, zwischen welchen Werten der Datensatz liegt.


Hinzufügen der Kategorien

Dieses Feld wird uns verständlichere Legenden des Stils "1000 "x" "1999" geben. Schließlich berechne ich die Anzahl der Kunden in einer bestimmten Kategorie [Number of Clients per Category] mit einer zweiten Berechnung nach Detaillierungsgrad.


Ermittlung der Anzahl von Kunden pro Kategorie

Hier ist das Ergebnis, das wir anschließend erhalten:


Das Zwischenergebnis

2. Punktewolke und Box-Plots erstellen


Um einen Punktwolkeneffekt zu erzielen, wenn Sie nur eine Kennzahl haben, müssen Sie einzelne Werte zufällig sortieren. Tableau bietet die RANDOM () -Funktion, welche ich in diesem Tutorial jedoch nicht verwenden werde. Dafür werde ich meine eigene Random-Funktion ausführen. Dabei möchte ich in der Lage sein, die Punkte auf der Achse 0 der Ordinaten zu platzieren, wenn es nur einen Punkt gibt. Wir werden sehen, dass dieses Vorgehen nützlich ist, um zwei Aggregationsebenen in einem einzigen Diagramm zu kombinieren.

Also erstelle ich einen Integer-Parameter [Seed], den ich nach meinem Belieben festlegen kann (Bspw. 12/24/48/..). Ich füge anschließend ein berechnetes Feld [Random]unter Verwendung der bereits berechneten Felder hinzu. Die Idee dabei ist: Wenn die Kategorie nur einen Kunden enthält, setze ich den Punkt auf Null. Ansonsten dividiere ich den Verkaufswert durch den Parameter [Seed] und subtrahiere die nächste ganze Zahl ( ROUND ) von diesem Wert.


Random Funktion in Tableau mit IIF-Kalkulation nachbilden

Das Ergebnis dieser Berechnung liegt zwischen -0,5 und 0,5, wenn [Seed] im Vergleich zu den vom Kunden angegebenen Verkaufswerten klein genug gewählt wurde.

NB: Achtung, wenn Ihre Daten ganze Zahlen sind, muss Seed auch groß genug gewählt werden, um den Effekt einer Wolke zu erzielen. Es gibt also ein Medium, das von Ihren Daten abhängt. Ziehen Sie in einer neuen Tabelle ATTR ( [Random] ) in die Spalten und MIN ( [Sales by Customer] ) in die Zeilen. Fügen Sie [Customer Name] zu den Markierungen und [Label Category by Customer] zur Farblegende hinzu. Alles, was Sie tun müssen, ist, einen Box-Whisker-Plot / Box-Plot, bzw. eine Kastengrafik auf Ihr Dashboard zu ziehen (indem Sie MIN ( [Sales by Customer] ) wie unten gezeigt auswählen).


Box-Plot mit der Analytics-Funktion in Tableau erstellen

NB: Es sollte bekannt sein, dass die ATTR-Funktion tatsächlich eine MIN- und eine MAX-Funktion ist. Es wird nur dann ein Wert zurückgegeben, wenn MIN und MAX gleich sind. Auf diese Weise können Sie die korrekte Aggregation der Daten überprüfen. Wenn Sie sich jedoch der Aggregation Ihrer Daten sicher sind, speichert die Verwendung der MIN- (oder MAX-) Funktion eine Berechnung und kann Ihr Dashboard daher etwas schneller machen. Wir werden später sehen, warum ich gezwungen bin, ATTR für Spalten zu verwenden.

3. Nutzung der Dual Axis Funktion in Tableau

Nachdem wir nun unsere beiden Dashboards erstellt haben, müssen wir nur noch die beiden Dashboards miteinander kombinieren. Dazu verwende ich die Dual Axis-Funktion in Tableau verwenden. Ich berechne außerdem einfach die Ordinate der Aggregationen, um die Punkte im Median der Kategorien zu platzieren. Wenn die Kategorie "2000" "x" "2999" ist, setze ich den Punkt normalerweise auf 2500. Sie können ihn aber natürlich auch auf 2000 setzen, wenn Sie dies bevorzugen. Ich nenne diese Berechnung [Ordinate] wegen mangelnder Inspiration an diesem Wochenende:


Das berechnete Feld Ordinate erstellen

Anschließend sind folgenden Schritte auszuführen:

  1. Platzieren Sie [Ordinate] auf Rows

  2. Löschen Sie [Customer Name] aus AGG [Ordinate]

  3. Ziehen Sie stattdessen [Number of Clients per Category] auf die Markierungsgröße für [Ordinate].

  4. Wählen Sie die Dual Axis-Funktion für [Ordinate].

  5. Synchronisieren Sie die Achse auf der rechten Seite

  6. Deaktivieren Sie die Option "Kopfzeile auf rechter Achse anzeigen"

  7. Ästhetische Anpassungen vornehmen (Transparenz, Größe der Elemente)

Die letzten vier Punkte sind hier zudem visualisiert:


Nutzung der Dual Axis Funktion in Tableau


Und das war's auch schon! Sie können die Visualisierung auf Tableau Public downloaden.