OLTP gegen OLAP



Der folgende Blog spricht kurz über OLTP vs OLAP und die verschiedenen Anwendungsfälle.

Was sind Kontextfilter in Tableau?

OLTP gegen OLAP

OLTP soll eher ein Online-Transaktionssystem oder ein Datenspeichersystem sein, bei dem der Benutzer viele Online-Transaktionen unter Verwendung des Datenspeichers ausführt. Es wird auch gesagt, dass mehr Ad-hoc-Lese- / Schreibvorgänge in Echtzeit stattfinden.





OLAP ist eher ein Offline-Datenspeicher. Es wird darauf zugegriffenAnzahloffline. Beispielsweise werden Massenprotokolldateien gelesen und dann in Datendateien zurückgeschrieben. Einige der allgemeinen Bereiche, in denen OLAP verwendet wird, sind Protokolljobs, Data Mining-Jobs usw.

Cassandra soll mehr von OLTP sein, da es sich um Echtzeit handelt, während Hadoop mehr von OLAP ist, da es für Analysen und Massenschreibvorgänge verwendet wird.



Warum OLAP & OLTP integrieren?

Wenn Sie in den nächsten 365 Tagen nach dem günstigsten Preis für eine Hotelbuchung suchen, haben Sie hier einen riesigen Datensatz für Cassandra und möchten Empfehlungen zur Echtzeitdatenbank erhalten. Eine Aktion wird basierend auf dem Preis durchgeführt.

In einem solchen Szenario müssen wir alle Datensätze iterieren und die Analyse auf dem neuesten Stand halten. Dies ist ein riesiger Offline-Job, der häufig gestartet werden muss. Hier kommt Hadoop ins Spiel, um Bulk-Daten zu verarbeiten.

wie man einen jframe in java macht

Der andere Vorteil ist, dass wir einen Cluster ausführen und die Ausführung eines anderen Hadoop-Clusters abbrechen können.



Der dritte Vorteil ist, dass man auch viele Betriebskosten reduzieren kann.

In einem Szenario, in dem ein Benutzer, der mit verschiedenen Hadoop-Ökosystemen wie Hive, Pig Latin vertraut ist und Daten darin integrieren muss, eine Datenquelle in Cassandra einbinden und versuchen muss, Map auszuführen Reduzieren Sie auch Arbeitsplätze.

Zwischen OLTP und OLAP ist ein Muster erkennbar. In OLTP gibt es weniger Schreibvorgänge, z. Hotelinformation. Unter der Annahme, dass die Preisänderungen alle 5000 Mal pro Sekunde erfolgen, sind die Lesevorgänge hier möglicherweise höher. In einem solchen Szenario kann es 1 Schreibzugriff pro Sekunde geben, aber Lesevorgänge können zu Hunderten und Tausenden führen. Das Verhältnis liegt hier also bei 1: 1000.

Es ist eine interessante Beobachtung, dass Cassandra leicht in dieses Modell passt, einschließlich Modelle, bei denen Lesen / Schreiben gleich ist. Auch wenn es um OLTP geht, kann man, selbst wenn man in ein abstimmbares und starkes Konsistenzmodell gerät, eine Millisekundenlücke zwischen eventuell konsistenten Modellen und stärksten konsistenten Modellen erkennen. Somit kann Cassandra in OLTP passen.

Wenn man zu OLAP kommt, sieht man verschiedene OLAP-Muster, was bedeutet, dass mehrere Schreibvorgänge gleichzeitig stattfinden. In OLAP werden Daten auf einmal ausgegeben, d. H. Alle Protokolldateien werden in den Datenspeicher gestellt, und dann beginnen wir mit der Verarbeitung. Das Datenmuster oder Zugriffsmuster ist genau das Gegenteil von OLTP-Anwendungen. Hier ist Hadoop oder MapReduce hilfreich.

Wie erstelle ich ein Paket?

Hast du eine Frage an uns? Erwähnen Sie sie im Kommentarbereich und wir werden uns bei Ihnen melden.

Zusammenhängende Posts:

Top 5 Gründe, Cassandra zu lernen