OLTP vs OLAP

El següent bloc parla breument sobre OLTP vs OLAP i els diversos casos d’ús.



OLTP vs OLAP

Es diu que OLTP és més un sistema de transaccions en línia o un sistema d’emmagatzematge de dades, on l’usuari fa moltes transaccions en línia mitjançant el magatzem de dades. També es diu que té més lectures / escriptures ad-hoc que es fan en temps real.



OLAP és més aviat un magatzem de dades fora de línia. S'hi accedeixnombre de vegadesa la moda fora de línia. Per exemple, els fitxers de registre massius es llegeixen i es tornen a escriure als fitxers de dades. Algunes de les àrees comunes on s’utilitza OLAP són els treballs de registre, els treballs de mineria de dades, etc.

Es diu que Cassandra és més que OLTP, ja que és en temps real, mentre que Hadoop és més que OLAP, ja que s’utilitza per a analítiques i escriptures massives.



Per què integrar OLAP i OLTP?

Si en el cas que busqueu el preu més barat per a la reserva d’hotels els propers 365 dies, aquí teniu un gran conjunt de dades per a Cassandra i voleu rebre recomanacions sobre bases de dades en temps real, es realitza una promoció en funció del preu.

En aquest escenari, hem d’iterar tots els registres i mantenir-ne les analítiques, que és una tasca desconeguda enorme que s’ha d’iniciar sovint. Aquí, Hadoop entra en joc per a la reducció de dades massives.

L'altre avantatge és que podem executar un clúster i avortar l'execució d'un clúster Hadoop diferent.



El tercer avantatge és que també es pot reduir molts costos d’operació.

Donat un escenari en què, si un usuari està ben versat en diversos ecosistemes Hadoop, com Hive, Pig Latin i necessita integrar-hi dades, cal connectar una font de dades a Cassandra i intentar executar Map Reduir també els llocs de treball.

Hi ha un patró notable entre OLTP i OLAP. A OLTP, hi ha menys nombre d’escriptures, per exemple. Informació de l'hotel. Suposant que els canvis de preu es produeixen cada 5.000 vegades per segon, és possible que les lectures siguin més importants aquí. En aquest cas, hi pot haver 1 escriptura per segon, però les lectures poden expulsar-les a centenars i milers. Per tant, la proporció aquí és al voltant d’1: 1000.

les cordes a Java són immutables

És interessant observar que Cassandra pot encabir-se fàcilment en aquest model, que inclou models en què la lectura / escriptura és igual. A més, quan es tracta d’OLTP, fins i tot si s’aconsegueix un model de consistència ajustable i fort, es pot veure una bretxa de mil·lisegons entre els models consistents eventuals i els models consistents més forts. Per tant, Cassandra pot encabir-se a OLTP.

En arribar a OLAP, es poden veure diferents patrons OLAP, el que significa que hi ha diverses escriptures que es produeixen simultàniament. A OLAP, bolquem les dades en un sol tret, és a dir, tots els fitxers de registre es posen al magatzem de dades i després comencem a processar-los. El patró de dades o patró d’accés és exactament el contrari del tipus d’aplicació OLTP. Aquí, Hadoop o MapReduce seran útils.

Tens alguna pregunta? Esmenta’ls a la secció de comentaris i et respondrem.

Articles Relacionats:

5 raons principals per aprendre Cassandra