Wie führe ich Hive-Skripte aus?

Dies ist ein Tutorial zum Ausführen von Hive-Skripten. Durch Ausführen dieses Skripts wird der Zeit- und Arbeitsaufwand für das manuelle Schreiben und Ausführen jedes Befehls verringert.

Als Data Warehousing-Paket, das auf Hadoop aufbaut, wird Apache Hive zunehmend für Datenanalysen, Data Mining und Vorhersagemodelle eingesetzt. Unternehmen suchen nach Fachleuten, die einen festen Halt haben . In diesem Beitrag sehen wir uns an, wie Hive-Skripte ausgeführt werden. Im Allgemeinen verwenden wir die Skripte, um eine Reihe von Anweisungen gleichzeitig auszuführen. Hive-Skripte werden fast genauso verwendet. Dies reduziert den Zeit- und Arbeitsaufwand für das manuelle Schreiben und Ausführen jedes Befehls.

Tutorial zu SQL Server Integration Services

Hive-Skripte werden in den Versionen Hive 0.10.0 und höher unterstützt. Da die Hive 0.90-Version in CDH3 installiert ist, können wir keine Hive-Skripte in CDH3 ausführen. Sie können die folgenden Schritte in CDH4 ausführen, da dort die Version Hive 0.10.0 installiert ist. Wissen Sie, wie Sie ein Hive-Skript erstellen? Wenn nein, klicken Sie auf um mehr Klarheit zu gewinnen.



Master-Hive-Now

Lassen Sie uns nun sehen, wie Sie die Skripte in Hive schreiben und in CDH4 ausführen:

Schritt 1: Schreiben eines Hive-Skripts.

Um das Hive-Skript zu schreiben, sollte die Datei mit der Erweiterung .sql gespeichert werden. Öffnen Sie ein Terminal in Ihrer Cloudera CDH4-Distribution und geben Sie den folgenden Befehl ein, um ein Hive-Skript zu erstellen.
Befehl: sudo gedit sample.sql

Bei Ausführung des obigen Befehls wird die Datei mit der Liste aller Hive-Befehle geöffnet, die ausgeführt werden müssen.

In diesem Skript wird eine Tabelle erstellt, beschrieben und Daten werden geladen und aus der Tabelle abgerufen.

1. Erstellen der Tabelle in Hive:

Befehl: Tabellenprodukt erstellen (Produkt-ID: int, Produktname: Zeichenfolge, Preis: Float, Kategorie: Zeichenfolge) Zeilenformat begrenzte Felder, die durch ',' abgeschlossen sind.

Hier ist Produkt der Tabellenname und {Produkt-ID, Produktname, Preis, Kategorie} sind die Spalten dieser Tabelle.

Mit ',' abgeschlossene Felder geben an, dass die Spalten in der Eingabedatei durch das Symbol ',' getrennt sind.

Standardmäßig werden die Datensätze in der Eingabedatei durch eine neue Zeile getrennt.

2. Beschreibung der Tabelle:

Befehl: Produkt beschreiben

3. Laden Sie die Daten in die Tabelle.

Um die Daten zuerst in die Tabelle zu laden, müssen wir eine Eingabedatei erstellen, die die Datensätze enthält, die in die Tabelle eingefügt werden müssen.

Model View Controller in Java

Lassen Sie uns eine Eingabedatei erstellen.

Befehl: sudo gedit input.txt

Bearbeiten Sie den Inhalt der Datei wie in der Abbildung gezeigt.

4. Abrufen der Daten:

Zum Abrufen der Daten wird der Befehl select verwendet.

Befehl: Wählen Sie * aus dem Produkt

Der obige Befehl wird verwendet, um den Wert aller in der Tabelle vorhandenen Spalten abzurufen. Das Skript sollte so aussehen, wie es im folgenden Bild gezeigt wird.

Jetzt sind wir mit dem Schreiben des Hive-Skripts fertig. Die Datei sample.sql kann jetzt gespeichert werden.

Schritt 2: Ausführen des Hive-Skripts

Der folgende Befehl führt das Hive-Skript aus:

Befehl: hive –f /home/cloudera/sample.sql

ist git und github gleich

Stellen Sie beim Ausführen des Skripts sicher, dass der gesamte Pfad des Speicherorts der Skriptdatei vorhanden ist.

Wir können sehen, dass alle Befehle erfolgreich ausgeführt wurden.

So werden Hive-Skripte in CDH4 ausgeführt und ausgeführt.

Hive ist eine wichtige Komponente von Hadoop und Ihr Know-how in Hive kann Ihnen bestbezahlte Hadoop-Jobs einbringen! Edureka bietet einen speziell kuratierten Hadoop-Kurs an, mit dem Sie Konzepte wie MapReduce, Garn, Schwein, Bienenstock, HBase, Oozie, Flume und Sqoop beherrschen können. Klicken Sie auf die Schaltfläche unten, um loszulegen.

Hast du eine Frage an uns? Bitte erwähnen Sie sie in den Kommentaren und wir werden uns bei Ihnen melden.

Zusammenhängende Posts:

Hive-Befehle

Hive-Datenmodelle