Große Daten

Spark vs Hadoop: Welches ist das beste Big Data Framework?

Dieser Blog-Beitrag spricht über Apache Spark vs Hadoop. Sie erhalten eine Vorstellung davon, welches Big Data-Framework in verschiedenen Szenarien das richtige ist.

Ausführen der Scala-Anwendung in der Eclipse-IDE mithilfe von Sbteclipse

In diesem Blog erfahren Sie, wie Sie das sbteclipse-Plugin installieren und einrichten. Es enthält schrittweise Anweisungen zum Ausführen der Scala-Anwendung in Eclipse IDE.

Hadoop gemeistert? Zeit, mit Apache Spark zu beginnen

Dieser Blog-Beitrag erklärt, warum Sie nach Hadoop mit Apache Spark beginnen müssen und warum das Erlernen von Spark nach dem Erlernen von Hadoop Wunder für Ihre Karriere bewirken kann!

Drilldown auf Apache Drill, der New-Age-Abfrage-Engine

Dieses Apache Drill-Tutorial bietet Ihnen alle Informationen, die Sie benötigen, um mit der Apache Drill-Abfrage-Engine und der Verwendung mit Hadoop, Big Data und Apache Spark zu beginnen.

Apache Spark kombinierenByKey erklärt

In diesem Spark Hadoop-Blog erfahren Sie alles, was Sie über Apache Spark combinByKey wissen müssen. Ermitteln Sie die durchschnittliche Punktzahl pro Schüler mithilfe der kombinierten Methode.

Apache Falcon: Neue Datenverwaltungsplattform für das Hadoop-Ökosystem

Apache Falcon ist eine neue Datenverwaltungsplattform für das Hadoop-Ökosystem, die die Onboarding-Feed-Verarbeitung und das Feed-Management in Hadoop-Clustern vereinfacht. Erfahren Sie, wie Sie es einrichten.

Erklärte Funkenakkumulatoren: Apache Spark

In diesem Apache Spark-Blog werden Spark-Akkumulatoren ausführlich erläutert. Erfahren Sie anhand von Beispielen, wie Spark-Akkus verwendet werden. Funkenakkumulatoren sind wie Hadoop Mapreduce-Zähler.

Apache Flink: Das Big Data Analytics-Framework der nächsten Generation für die Stream- und Batch-Datenverarbeitung

In diesem Blog erfahren Sie alles über Apache Flink und das Einrichten eines Flink-Clusters. Flink unterstützt Echtzeit- und Stapelverarbeitung und ist eine unverzichtbare Big Data-Technologie für Big Data Analytics.

Verteiltes Caching mit Broadcast-Variablen: Apache Spark

In diesem Blogbeitrag wird das verteilte Caching mit Broadcast-Variablen erläutert und Sie können mit der effizienten Verteilung großer Werte in der Spark-Programmierung beginnen.

CCA- und CCP-Zertifizierungen von Cloudera: Alles, was Sie wissen müssen

CCA- und CCP-Zertifizierungen von Cloudera haben die CCDH- und CCSHB-Prüfungen ersetzt. In diesem Blog erfahren Sie alles, was Sie über die neuen Zertifizierungen wissen müssen.

Stateful Transformationen mit Fenster im Spark-Streaming

In diesem Blogbeitrag werden statusbehaftete Transformationen mit Fenstern in Spark Streaming erläutert. Erfahren Sie alles über das stapelweise Verfolgen von Daten mithilfe von D-Streams.

Kumulative Stateful Transformation in Apache Spark Streaming

Dieser Blog-Beitrag beschreibt zustandsbehaftete Transformationen in Spark Streaming. Erfahren Sie alles über kumulatives Tracking und Up-Skills für eine Hadoop Spark-Karriere.

Big Data im Gesundheitswesen: Wie Hadoop die Gesundheitsanalytik revolutioniert

Hadoop & Big Data-Technologien revolutionieren die Analytik im Gesundheitswesen. In diesem Big Data-Blog im Gesundheitswesen wird erläutert, wie Big Data-Analysen die medizinische Versorgung verbessern können.

Hadoop-Streaming: Schreiben eines Hadoop MapReduce-Programms in Python

Dieser Blog-Beitrag zu Hadoop Streaming ist eine Schritt-für-Schritt-Anleitung zum Schreiben eines Hadoop MapReduce-Programms in Python zur Verarbeitung großer Mengen von Big Data.

Big Data Tutorial: Alles, was Sie über Big Data wissen müssen!

Dieser Blog zum Big Data Tutorial bietet Ihnen einen vollständigen Überblick über Big Data, seine Eigenschaften, Anwendungen sowie Herausforderungen mit Big Data.

HDFS-Tutorial: Einführung in HDFS und seine Funktionen

Dieses HDFS-Tutorial-Blog hilft Ihnen dabei, das verteilte HDFS- oder Hadoop-Dateisystem und seine Funktionen zu verstehen. Sie werden auch kurz die Kernkomponenten untersuchen.

Splunk vs. ELK vs. Sumo Logic: Welche funktioniert am besten für Sie?

Verstehen Sie in diesem Splunk-Tutorial die Unterschiede zwischen Splunk und ELK und Sumo Logic und bestimmen Sie, welches dieser Tools am besten zu Ihnen passt.

Splunk-Anwendungsfall: Dominos Erfolgsgeschichte

In diesem Splunk-Anwendungsfall-Blog erfahren Sie, wie Domino's Pizza Splunk verwendet hat, um Einblicke in das Verbraucherverhalten zu gewinnen und ihre Geschäftsstrategien zu formulieren.

Hadoop installieren: Einrichten eines Hadoop-Clusters mit einem einzelnen Knoten

Dieses Tutorial ist eine schrittweise Anleitung zum Installieren und Konfigurieren des Hadoop-Clusters auf einem einzelnen Knoten. Alle Hadoop-Installationsschritte gelten für CentOS-Computer.

HDFS-Befehle: Hadoop-Shell-Befehle zum Verwalten von HDFS

In diesem Blog werden die verschiedenen HDFS-Befehle wie fsck, copyFromLocal, expunge, cat usw. behandelt, mit denen das Hadoop-Dateisystem verwaltet wird.

Top Artikel

Kategorie

Interessante Artikel