Per què hauria de combinar-se quan ja es pot unir a Tableau?

Combinació de dades a Tableau: un mètode utilitzat quan hi ha dades relacionades en diverses fonts de dades, que voleu analitzar juntes en una sola vista.

En un món que genera i consumeix 2,5 quintilions de bytes de dades, al dia, les organitzacions estan obligades a buscar nous mètodes per transformar i combinar dades per aconseguir una eficiència òptima. Un d'aquests mètodes per combinar dades és Combinació de dades a Tableau .



Ara bé, com que té un propòsit tan important en el cicle de dades d'una organització determinada, en la majoria és un mòdul molt essencial . En aquest bloc, parlarem dels conceptes següents:



Per què necessiteu la combinació de dades a Tableau?

Suposem que sou un Taula de desenvolupadors qui té dades transaccionals emmagatzemades a Salesforce i dades de quota emmagatzemades a Access. Les dades que voleu combinar s’emmagatzemen en diferents bases de dades i la granularitat de les dades capturades a cada taula és diferent a les dues fonts de dades, de manera que la combinació de dades és la millor manera de combinar aquestes dades.

com començar aws cli

La combinació de dades és útil en les condicions següents:



  1. Voleu combinar dades de diferents bases de dades que no són compatibles amb les combinacions entre bases de dades.

    Les unions entre bases de dades no admeten connexions a cubs (per exemple, Oracle Essbase) ni a algunes connexions només extractes (per exemple, Google Analytics). En aquest cas, configureu fonts de dades individuals per a les dades que voleu analitzar i, a continuació, utilitzeu la combinació de dades per combinar les fonts de dades en un sol full.

  2. Les dades es troben en diferents nivells de detall.

    De vegades, un conjunt de dades captura dades mitjançant diversos nivells de detall és a dir, major o menor granularitat que l’altre conjunt de dades.

    Per exemple, suposem que esteu analitzant dades de transaccions i dades de quota. Les dades transaccionals poden capturar totes les transaccions. Tot i això, les dades de quotes poden agregar transaccions a nivell de trimestre. Com que els valors transaccionals es capturen a diferents nivells de detall en cada conjunt de dades, haureu d'utilitzar la combinació de dades per combinar-les.



Què és la combinació de dades a Tableau?

La combinació de dades és una característica molt potent a Pissarra . S'utilitza quan hi ha dades relacionades en diverses fonts de dades, que voleu analitzar juntes en una sola vista. És un mètode per combinar dades que complementen una taula de dades d'una font de dades amb columnes de dades d'una altra font de dades.

Normalment, utilitzeu combinacions per realitzar aquest tipus de combinació de dades, però hi ha moments, en funció de factors com el tipus de dades i la seva granularitat, en què és millor utilitzar la combinació de dades.

c ++ vés a

En què es diferencia de la combinació de dades?

La barreja de dades simula una unió esquerra tradicional. La diferència principal entre tots dos és Quan la unió es realitza respecte a l'agregació.

Unió a l'esquerra

Quan utilitzeu una unió esquerra per combinar dades, s'envia una consulta a la base de dades on es realitza la unió. Si feu servir una unió esquerra, es tornen totes les files de la taula esquerra i totes les files de la taula dreta que tinguin una correspondència de fila corresponent a la taula esquerra. Els resultats de la unió es tornen a enviar i agrupar per Tableau.

Per exemple, suposem que teniu les taules següents. Si les columnes comunes són ID d'usuari , una unió a l'esquerra pren totes les dades de la taula esquerra, així com totes les dades de la taula dreta, perquè cada fila té una correspondència de fila corresponent a la taula esquerra.

Unió de dades: combinació de dades a Tableau - EdurekaCombinació de dades

Quan utilitzeu la combinació de dades per combinar dades, s'envia una consulta a la base de dades per a cada font de dades que s'utilitza al full. Tableau envia i combina els resultats de les consultes, incloses les dades agregades. La visualització utilitza totes les files de la font de dades principal, la taula esquerra i les files agregades de la font de dades secundària, la taula dreta, en funció de la dimensió dels camps d'enllaç.

Podeu canviar el camp d'enllaç o afegir més camps d'enllaç per incloure files de dades diferents o addicionals de la font de dades secundària a la combinació, canviant els valors agregats.

Per exemple, suposem que teniu les taules següents. Si els camps d'enllaç són ID d'usuari a les dues taules, que combina les dades, pren totes les dades de la taula esquerra i complementa la taula esquerra amb les dades de la taula dreta. En aquest cas, no tots els valors poden formar part de la taula resultant a causa del següent:

  • Una fila de la taula esquerra no té una correspondència de fila corresponent a la taula dreta, tal com indica el valor nul.
  • Hi ha diversos valors corresponents a les files de la taula dreta, tal com indica l’asterisc (*).

Suposem que teniu les mateixes taules que les anteriors, però la font de dades secundària conté un camp nou anomenat fins . De nou, si el camp d'enllaç és ID d'usuari , barrejar les vostres dades pren totes les dades de la taula esquerra i les complementa amb dades de la taula dreta. En aquest cas, veureu el mateix valor nul i els mateixos asteriscs a l'exemple anterior, a més del següent:

  • Perquè el fins El camp és una mesura, veieu els valors de fila per afinscamp agregat abans de combinar les dades de la taula dreta amb les dades de la taula esquerra.
  • Com amb l'exemple anterior, una fila de la taula esquerra no té la fila corresponent per al fitxer fins camp, tal com indica el segon valor nul.

Quan substituir la unió Barreja

1. Les dades necessiten neteja.

Si les taules no coincideixen correctament entre si després d’unir-se, configureu fonts de dades per a cada taula, feu les personalitzacions necessàries (és a dir, canvieu el nom de les columnes, canvieu els tipus de dades de les columnes, creeu grups, feu servir càlculs, etc.) i a continuació, utilitzeu la combinació de dades per combinar-les.

2. Les combinacions provoquen dades duplicades.

Les dades duplicades després d’unir-se són un símptoma de dades en diferents nivells de detall. Si observeu dades duplicades, en lloc de crear una combinació, utilitzeu la combinació de dades per combinar-vos amb una dimensió comuna.

3. Teniu moltes dades.

Normalment, es recomana unir combinacions de dades de la mateixa base de dades. La base de dades gestiona les combinacions, que permet que les combinacions aprofitin algunes de les capacitats natives de la base de dades. Tanmateix, si esteu treballant amb grans conjunts de dades, les combinacions poden afectar la base de dades i afectar significativament el rendiment. En aquest cas, la combinació de dades pot ajudar. Com que Tableau gestiona la combinació de les dades després que les dades s’agrupen, hi ha menys dades per combinar. Quan hi ha menys dades per combinar, en general, el rendiment millora.

Combinació de dades a Tableau

Podeu utilitzar la combinació de dades quan teniu dades en fonts de dades independents que voleu analitzar juntes en un sol full. Tableau té dues fonts de dades incorporades anomenades Mostra-supermercat i Mostra de cadena de cafè.mdb que s’utilitzarà per il·lustrar la combinació de dades.

Pas 1: connecteu-vos a les vostres dades i configureu les fonts de dades

  • Connecteu-vos a un conjunt de dades i configureu la font de dades a la pàgina d'origen de dades. Un ifont de dades nbuilt Mostra de cadena de cafè.mdb ,que és un fitxer de base de dades MS Access, s’utilitzarà per il·lustrar la combinació de dades.
  • Anar a Dades > Nova font de dades, connecteu-vos al segon conjunt de dades.Aquest exemple utilitza el fitxer Mostra: supermercat Font de dades. Then ha configurat la font de dades.
  • Feu clic a la pestanya del full per començar a crear la vostra vista.

Pas 2: designeu una font de dades principal

  • Arrossegueu almenys un camp des de la font de dades principal a la vista per designar-lo com a font de dades principal. A la Dades , feu clic a la font de dades que vulgueu designar com a font de dades principal. En aquest exemple, Mostra de cadena de cafè està seleccionat.
  • La següent captura de pantalla mostra les diferents taules i combinacions disponibles al fitxer.

crear una còpia de l'objecte java

Pas 3: designeu una font de dades secundària

  • Els camps que s'utilitzen a la vista des de fonts de dades que no són la font de dades principal o els enllaços actius designen automàticament les fonts de dades posteriors com a font de dades secundària. En aquest cas, Sample Superstore.

Pas 4: Combinar dades

  • Ara podeu integrar les dades de les dues fonts en funció d’una dimensió comuna ( Estat , en aquest cas). Tingueu en compte que apareix una imatge d’enllaç petita al costat de la dimensió - Estat. Això indica la dimensió comuna entre les dues fonts de dades.
  • Suposem que creeu un gràfic de barres amb Relació de beneficis al prestatge de la columna i Estat al prestatge de files, el gràfic mostra com la ràtio de beneficis varia per a cada estat, tant a les botigues de la superfície com de les cadenes de cafè.

Limitacions de la combinació de dades a Tableau

  1. Hi ha algunes limitacions de barreja de dades al voltant d’agregats no additius, com ara MITJA , i RAWSQLAGG .
  2. La combinació de dades compromet la velocitat de la consulta en gran granularitat.
  3. Quan intenteu ordenar per un camp calculat que utilitza dades combinades, el camp calculat no apareix a la llista desplegable Camp del quadre de diàleg Ordena.
  4. Les fonts de dades del cub només es poden utilitzar com a font de dades principal per combinar dades a Tableau. No es poden utilitzar com a fonts de dades secundàries.

Espero que tots, ara, tingueu una bona idea Combinació de dades a Tableau d’aquest bloc. Teniu gana de més coneixements? No us preocupeu, aquest vídeo us permetrà entendre millor el concepte.