In einer Welt, in der täglich 2,5 Billionen Byte Daten generiert und verbraucht werden, müssen Unternehmen nach neuen Methoden suchen, um Daten zu transformieren und zu kombinieren, um eine optimale Effizienz zu erzielen. Eine solche Methode zum Kombinieren von Daten ist Datenüberblendung in Tableau .
Da dies im Datenzyklus einer bestimmten Organisation einen so wichtigen Zweck erfüllt, ist es in den meisten Fällen ein sehr wichtiges Modul . In diesem Blog werden wir die folgenden Konzepte diskutieren:
- Warum benötigen Sie eine Datenmischung in Tableau?
- Was ist Datenmischung in Tableau?
- Wie unterscheidet es sich von Data Joining?
- Wann sollte das Mischen durch Joining ersetzt werden?
- Mischen Sie Ihre Daten in Tableau
- Einschränkungen beim Mischen von Daten in Tableau
Warum benötigen Sie Data Blending in Tableau?
Angenommen, Sie sind ein Entwicklertabelle Wer hat Transaktionsdaten in Salesforce und Kontingentdaten in Access gespeichert. Die Daten, die Sie kombinieren möchten, werden in verschiedenen Datenbanken gespeichert, und die Granularität der in jeder Tabelle erfassten Daten ist in den beiden Datenquellen unterschiedlich. Daher ist das Mischen von Daten der beste Weg, um diese Daten zu kombinieren.
Das Mischen von Daten ist unter folgenden Bedingungen nützlich:
Sie möchten Daten aus verschiedenen Datenbanken kombinieren, die von datenbankübergreifenden Joins nicht unterstützt werden.
Datenbankübergreifende Joins unterstützen keine Verbindungen zu Cubes (z. B. Oracle Essbase) oder zu einigen Nur-Extrakt-Verbindungen (z. B. Google Analytics). Richten Sie in diesem Fall einzelne Datenquellen für die zu analysierenden Daten ein und kombinieren Sie die Datenquellen mithilfe von Datenmischungen auf einem einzigen Blatt.
Die Daten sind unterschiedlich detailliert.
Manchmal erfasst ein Datensatz Daten mit verschiedenen Detailebenen mehr oder weniger Granularität als der andere Datensatz.
Angenommen, Sie analysieren Transaktionsdaten und Kontingentdaten. Transaktionsdaten erfassen möglicherweise alle Transaktionen. Kontingentdaten können jedoch Transaktionen auf Quartalebene aggregieren. Da die Transaktionswerte in jedem Datensatz auf unterschiedlichen Detailebenen erfasst werden, sollten Sie die Daten mithilfe von Datenmischungen kombinieren.
Was ist Datenmischung in Tableau?
Data Blending ist eine sehr leistungsstarke Funktion in Tafel . Es wird verwendet, wenn verwandte Daten in mehreren Datenquellen vorhanden sind, die Sie zusammen in einer einzigen Ansicht analysieren möchten. Es ist eine Methode zum Kombinieren von Daten, die eine Datentabelle aus einer Datenquelle mit Datenspalten aus einer anderen Datenquelle ergänzt.
Normalerweise verwenden Sie Joins, um diese Art der Datenkombination durchzuführen. Abhängig von Faktoren wie Datentyp und Granularität kann es jedoch vorkommen, dass die Datenmischung besser verwendet wird.
Wie unterscheidet es sich von der Datenverbindung?
Das Mischen von Daten simuliert einen herkömmlichen Link-Join. Der Hauptunterschied zwischen den beiden ist wann Der Join wird in Bezug auf die Aggregation durchgeführt.
Links verbinden
Wenn Sie einen linken Join zum Kombinieren von Daten verwenden, wird eine Abfrage an die Datenbank gesendet, in der der Join ausgeführt wird. Bei Verwendung eines linken Joins werden alle Zeilen aus der linken Tabelle und alle Zeilen aus der rechten Tabelle zurückgegeben, deren linke Zeile mit einer entsprechenden Zeilenübereinstimmung übereinstimmt. Die Ergebnisse des Joins werden dann an Tableau zurückgesendet und von Tableau aggregiert.
Verwenden von r für maschinelles Lernen
Angenommen, Sie haben die folgenden Tabellen. Wenn die gemeinsamen Spalten sind Benutzer ID Bei einem Link-Join werden alle Daten aus der linken Tabelle sowie alle Daten aus der rechten Tabelle übernommen, da jede Zeile eine entsprechende Zeilenübereinstimmung in der linken Tabelle aufweist.
Datenmischung
Wenn Sie Daten kombinieren, um Daten zu kombinieren, wird für jede Datenquelle, die auf dem Blatt verwendet wird, eine Abfrage an die Datenbank gesendet. Die Ergebnisse der Abfragen, einschließlich der aggregierten Daten, werden von Tableau zurückgesendet und kombiniert. Die Ansicht verwendet alle Zeilen aus der primären Datenquelle, der linken Tabelle, und die aggregierten Zeilen aus der sekundären Datenquelle, der rechten Tabelle, basierend auf der Dimension der Verknüpfungsfelder.
Sie können das Verknüpfungsfeld ändern oder weitere Verknüpfungsfelder hinzufügen, um verschiedene oder zusätzliche Datenzeilen aus der sekundären Datenquelle in die Mischung aufzunehmen und die aggregierten Werte zu ändern.
Angenommen, Sie haben die folgenden Tabellen. Wenn die Verknüpfungsfelder sind Benutzer ID In beiden Tabellen werden beim Mischen Ihrer Daten alle Daten aus der linken Tabelle übernommen und die linke Tabelle durch die Daten aus der rechten Tabelle ergänzt. In diesem Fall können aus folgenden Gründen nicht alle Werte Teil der resultierenden Tabelle sein:
- Eine Zeile in der linken Tabelle hat keine entsprechende Zeilenübereinstimmung in der rechten Tabelle, wie durch den Nullwert angezeigt.
- In den Zeilen der rechten Tabelle befinden sich mehrere entsprechende Werte, die durch das Sternchen (*) gekennzeichnet sind.
Angenommen, Sie haben dieselben Tabellen wie oben, aber die sekundäre Datenquelle enthält ein neues Feld mit dem Namen Zwecke . Wieder, wenn das Verknüpfungsfeld ist Benutzer ID Beim Mischen Ihrer Daten werden alle Daten aus der linken Tabelle übernommen und durch Daten aus der rechten Tabelle ergänzt. In diesem Fall sehen Sie im vorherigen Beispiel denselben Nullwert und dieselben Sternchen zusätzlich zu den folgenden:
- Weil der Zwecke Feld ist ein Maß, Sie sehen die Zeilenwerte für dieZweckeDas vor den Daten in der rechten Tabelle aggregierte Feld wird mit den Daten in der linken Tabelle kombiniert.
- Wie im vorherigen Beispiel enthält eine Zeile in der linken Tabelle nicht die entsprechende Zeile für die Zwecke Feld, wie durch den zweiten Nullwert angegeben.
Wann ist der Beitritt zu ersetzen? Mischen
1. Daten müssen bereinigt werden.
Wenn Ihre Tabellen nach einem Join nicht korrekt miteinander übereinstimmen, richten Sie Datenquellen für jede Tabelle ein, nehmen Sie die erforderlichen Anpassungen vor (dh benennen Sie Spalten um, ändern Sie Spaltendatentypen, erstellen Sie Gruppen, verwenden Sie Berechnungen usw.) Verwenden Sie dann Datenmischung, um die Daten zu kombinieren.
2. Verknüpfungen verursachen doppelte Daten.
Doppelte Daten nach einem Join sind ein Symptom für Daten auf verschiedenen Detailebenen. Wenn Sie doppelte Daten bemerken, verwenden Sie anstelle einer Verknüpfung die Datenüberblendung, um stattdessen eine gemeinsame Dimension zu mischen.
3. Sie haben viele Daten.
In der Regel werden Verknüpfungen empfohlen, um Daten aus derselben Datenbank zu kombinieren. Verknüpfungen werden von der Datenbank verwaltet, sodass Verknüpfungen einige der nativen Funktionen der Datenbank nutzen können. Wenn Sie jedoch mit großen Datenmengen arbeiten, können Joins die Datenbank belasten und die Leistung erheblich beeinträchtigen. In diesem Fall kann das Mischen von Daten hilfreich sein. Da Tableau das Kombinieren der Daten nach der Aggregation der Daten übernimmt, müssen weniger Daten kombiniert werden. Wenn weniger Daten kombiniert werden müssen, verbessert sich im Allgemeinen die Leistung.
Mischen Sie Ihre Daten in Tableau
Sie können die Datenüberblendung verwenden, wenn Sie Daten in separaten Datenquellen haben, die Sie zusammen auf einem einzigen Blatt analysieren möchten. Tableau verfügt über zwei integrierte Datenquellen mit dem Namen Sample-Superstore und Probe Kaffeekette.mdb Dies wird verwendet, um das Mischen von Daten zu veranschaulichen.
Schritt 1: Stellen Sie eine Verbindung zu Ihren Daten her und richten Sie die Datenquellen ein
- Stellen Sie eine Verbindung zu einem Datensatz her und richten Sie die Datenquelle auf der Datenquellenseite ein. Ein ingebaute Datenquelle Probe Kaffeekette.mdb ,Dies ist eine MS Access-Datenbankdatei, die zur Veranschaulichung der Datenüberblendung verwendet wird.
- Gehe zu Daten > Neue DatenquelleStellen Sie eine Verbindung zum zweiten Datensatz her.In diesem Beispiel wird das verwendet Probe - Superstore Datenquelle. T.Dann richten Sie die Datenquelle ein.
- Klicken Sie auf die Registerkarte Blatt, um mit dem Erstellen Ihrer Ansicht zu beginnen.
Schritt 2: Legen Sie eine primäre Datenquelle fest
Finde die maximale Anzahl in Array Java
- Ziehen Sie mindestens ein Feld aus Ihrer primären Datenquelle in die Ansicht, um es als primäre Datenquelle festzulegen. In dem Daten Klicken Sie im Bereich auf die Datenquelle, die Sie als primäre Datenquelle festlegen möchten. In diesem Beispiel Kaffeekette probieren ist ausgewählt.
- Der folgende Screenshot zeigt die verschiedenen in der Datei verfügbaren Tabellen und Verknüpfungen.
Schritt 3: Legen Sie eine sekundäre Datenquelle fest
- Felder, die in der Ansicht von Datenquellen verwendet werden, die nicht die primäre Datenquelle oder aktive Links sind, bestimmen nachfolgende Datenquellen automatisch als sekundäre Datenquelle. In diesem Fall Sample Superstore.
Schritt 4: Daten mischen
- Jetzt können Sie die Daten aus beiden Quellen basierend auf einer gemeinsamen Dimension integrieren ( Zustand , in diesem Fall). Beachten Sie, dass neben der Dimension - Status ein kleines Linkbild angezeigt wird. Dies gibt die gemeinsame Dimension zwischen den beiden Datenquellen an.
- Angenommen, Sie erstellen ein Balkendiagramm mit Gewinnquote im Säulenregal und Zustand Im Reihenregal zeigt die Grafik, wie sich die Gewinnquote für jeden Staat sowohl im Supermarkt als auch in den Kaffeekettengeschäften ändert.
Einschränkungen beim Mischen von Daten in Tableau
- Es gibt einige Einschränkungen beim Mischen von Daten bei nicht additiven Aggregaten, z MEDIAN , und RAWSQLAGG .
- Das Mischen von Daten beeinträchtigt die Geschwindigkeit der Abfrage bei hoher Granularität.
- Wenn Sie versuchen, nach einem berechneten Feld zu sortieren, das gemischte Daten verwendet, wird das berechnete Feld nicht in der Dropdown-Liste Feld des Dialogfelds Sortieren aufgeführt.
- Cube-Datenquellen können nur als primäre Datenquelle zum Mischen von Daten in Tableau verwendet werden. Sie können nicht als sekundäre Datenquellen verwendet werden.
Ich hoffe, Sie alle haben jetzt eine gute Vorstellung davon Datenüberblendung in Tableau von diesem Blog. Lust auf mehr Wissen? Keine Sorge, dieses Video gibt Ihnen ein besseres Verständnis des Konzepts.