Models de dades de rusc

Els models de dades de Hive contenen els components següents, com ara bases de dades, taules, particions i compartiments o clústers.



Hive és un sistema de magatzem de dades per a Hadoop que facilita el resum de dades, consultes ad-hoc i l’anàlisi de grans conjunts de dades emmagatzemats en sistemes de fitxers compatibles amb Hadoop. Hive estructura les dades en conceptes de base de dades ben entesos com taules, files, columnes i particions. Admet tipus primitius com enters, flotants, dobles i cordes. Hive també admet matrius associatius, llistes, estructures i l'API Serialize i Deserialized s'utilitza per moure dades dins i fora de les taules.



Vegem detalladament els models de dades de ruscos

Models de dades de rusc:

Els models de dades Hive contenen els components següents:



__en ell mateix)
  • Bases de dades
  • Taules
  • Particions
  • Cubells o grups

Particions:

Partició significa dividir una taula en parts de gra gruixut en funció del valor d'una columna de partició, com ara 'dades'. Això fa que sigui més ràpid fer consultes sobre segments de dades

convertir doble a int java

Models de dades de rusc

Llavors, quina és la funció de partició? Les claus de partició determinen com s’emmagatzemen les dades. Aquí, cada valor únic de la clau de partició defineix una partició de la taula. Les particions porten el nom de dates per comoditat. És similar a la 'divisió de blocs' a HDFS.



Cubells:

Els dipòsits proporcionen una estructura addicional a les dades que es poden utilitzar per fer consultes eficients. Una unió de dues taules que es troben a les mateixes columnes, inclosa la columna d'unió, es pot implementar com a unió al mapa. La recopilació per identificació usada significa que podem avaluar ràpidament una consulta basada en usuaris executant-la en una mostra aleatòria del conjunt d’usuaris.

anar a c ++

Tens alguna pregunta? Esmenteu-los a la secció de comentaris i us respondrem.

Articles Relacionats:

Comandaments útils del rusc