SQL für Data Science: One-Stop-Lösung für Anfänger



In diesem Blogbeitrag zu SQL for Data Science erfahren Sie, wie SQL zum Speichern, Zugreifen auf und Abrufen von Daten zur Durchführung von Datenanalysen verwendet werden kann.

Seitdem Data Science als vielversprechendster Job der Ära auf Platz 1 eingestuft wurde, versuchen wir alle, uns dem Rennen von anzuschließen . In diesem Blogbeitrag zu SQL for Data Science erfahren Sie, wie SQL zum Speichern, Zugreifen auf und Abrufen von Daten zur Durchführung von Datenanalysen verwendet werden kann.

Hier ist eine Liste der Themen, die sein werden in diesem Blog behandelt:





    1. Warum wird SQL für Data Science benötigt?
    2. Was ist SQL?
    3. Grundlagen von SQL
    4. MySQL installieren
    5. Zum Anfassen

Warum wird SQL für Data Science benötigt?

Wussten Sie, dass wir täglich mehr als 2,5 Billionen Datenbytes generieren? Dieses Tempo der Datengenerierung ist der Grund für die Popularität von High-End-Technologien wie Data Science , , usw.

Das Ableiten nützlicher Erkenntnisse aus Daten wird als Data Science bezeichnet. Data Science umfasst das Extrahieren, Verarbeiten und Analysieren von Tonnen von Daten. Zur Zeit brauchen wir Damit können diese riesigen Datenmengen gespeichert und verwaltet werden.



Was ist Data Science - Edureka

Das ist wo SQL kommt herein.

SQL kann zum Speichern, Zugreifen auf und Extrahieren großer Datenmengen verwendet werden, um den gesamten Data Science-Prozess reibungsloser durchzuführen.



Was ist SQL?

SQL Dies steht für Structured Query Language und ist eine Abfragesprache zur Verwaltung relationaler Datenbanken.

Aber was genau ist eine relationale Datenbank?

Eine relationale Datenbank ist eine Gruppe genau definierter Tabellen, aus denen auf Daten zugegriffen, diese bearbeitet, aktualisiert usw. werden können, ohne dass die Datenbanktabellen geändert werden müssen. SQL ist der Standard (API) für relationale Datenbanken.

Zurück zu SQL: Mit der SQL-Programmierung können mehrere Aktionen für Daten ausgeführt werden, z. B. das Abfragen, Einfügen, Aktualisieren und Löschen von Datenbankeinträgen. Beispiele für relationale Datenbanken, die SQL verwenden, sind MySQL Database, Oracle usw.

Um mehr über SQL zu erfahren, können Sie die folgende Blogs:

  1. Grundlegendes zu SQL-Datentypen - Alles, was Sie über SQL-Datentypen wissen müssen
  2. TABELLE IN SQL ERSTELLEN - Alles, was Sie über das Erstellen von Tabellen in SQL wissen müssen

Bevor wir mit einer SQL-Demo beginnen, sollten wir uns mit den grundlegenden SQL-Befehlen vertraut machen.

Grundlagen von SQL

SQL bietet eine Reihe einfacher Befehle zum Ändern von Datentabellen. Lassen Sie uns einige der grundlegenden SQL-Befehle durchgehen:

  • DATENBANK ERSTELLEN - erstellt eine neue Datenbank
  • TABELLE ERSTELLEN - erstellt eine neue Tabelle
  • EINFÜGEN IN - fügt neue Daten in eine Datenbank ein
  • WÄHLEN - extrahiert Daten aus einer Datenbank
  • UPDATE - aktualisiert Daten in einer Datenbank
  • LÖSCHEN - löscht Daten aus einer Datenbank
  • ALTER DATABASE - ändert eine Datenbank
  • ALTER TABLE - ändert eine Tabelle
  • TROPFENTABELLE - löscht eine Tabelle
  • INDEX ERSTELLEN - Erstellt einen Index zum Suchen eines Elements
  • DROP INDEX - löscht ein Index

Um SQL besser zu verstehen, installieren wir MySQL und sehen, wie Sie mit Daten spielen können.

MySQL installieren

Die Installation von MySQL ist eine einfache Aufgabe. Hier ist ein Schritt für Schritt Anleitung Das wird Ihnen helfen, MySQL auf Ihrem System zu installieren.

Sobald Sie mit der Installation fertig sind MySQL, folgen Sie dem folgenden Abschnitt für eine einfache Demo, die Ihnen zeigt, wie Sie Daten einfügen, bearbeiten und ändern können.

SQL für Data Science - MySQL-Demo

In dieser Demonstration erfahren Sie, wie Sie Datenbanken erstellen und verarbeiten. Dies ist eine Demonstration für Anfänger, um Ihnen den Einstieg in die Datenanalyse in SQL zu erleichtern.

Wie schreibe ich Singleton-Klasse in Java

Also lasst uns anfangen!

Schritt 1: Erstellen Sie eine SQL-Datenbank

Eine SQL-Datenbank ist ein Storage Warehouse, in dem Daten in einem strukturierten Format gespeichert werden können. Jetzt erstellen wir eine Datenbank mit MySQL ::

DATENBANK ERSTELLEN edureka USE edureka

Im obigen Code gibt es zwei SQL-Befehle:

Hinweis : SQL-Befehle werden in Großbuchstaben definiert und ein Semikolon wird zum Beenden eines SQL-Befehls verwendet.

  1. CREATE DATABASE: Dieser Befehl erstellt eine Datenbank mit dem Namen 'edureka'.

  2. USE: Mit diesem Befehl wird die Datenbank aktiviert. Hier aktivieren wir die 'edureka'-Datenbank.

Schritt 2: Erstellen Sie eine Tabelle mit den erforderlichen Datenfunktionen

Das Erstellen einer Tabelle ist so einfach wie das Erstellen einer Datenbank. Sie müssen nur die Variablen oder die Merkmale der Tabelle mit ihren jeweiligen Datentypen definieren. Mal sehen, wie das geht:

TABELLE ERSTELLEN Spielzeug (TID INTEGER NICHT NULL PRIMARY KEY AUTO_INCREMENT, Item_name TEXT, Preis INTEGER, Menge INTEGER)

Im obigen Codefragment treten folgende Dinge auf:

  1. Verwenden Sie den Befehl 'TABELLE ERSTELLEN', um eine Tabelle mit dem Namen 'Spielzeug' zu erstellen.
  2. Die Spielzeugtabelle enthält 4 Funktionen, nämlich TID (Transaktions-ID), Artikelname, Preis und Menge.
  3. Jede Variable wird mit ihren jeweiligen Datentypen definiert.
  4. Die TID-Variable wird als Primärschlüssel deklariert. Ein Primärschlüssel bezeichnet grundsätzlich eine Variable, die einen eindeutigen Wert speichern kann.

Sie können die Details der definierten Tabelle mit dem folgenden Befehl weiter überprüfen:

BESCHREIBEN Sie Spielzeug

Schritt 3: Einfügen von Daten in die Tabelle

Nachdem wir eine Tabelle erstellt haben, füllen wir sie mit einigen Werten. In diesem Blog habe ich bereits erwähnt, wie Sie Daten mit nur einem einzigen Befehl, d. H. INSERT INTO, zu einer Tabelle hinzufügen können.

Mal sehen, wie das geht:

EINFÜGEN IN SPIELZEUGWERTE (NULL, 'Zug', 550, 88) EINFÜGEN IN SpielzeugWERTE (NULL, 'Hotwheels_car', 350, 80) EINFÜGEN IN SpielzeugWERTE (NULL, 'Magic_Pencil', 70, 100) EINFÜGEN IN SpielzeugWERTE ( NULL, 'Dog_house', 120, 54) IN Spielzeugwerte EINFÜGEN (NULL, 'Skateboard', 700, 42) IN SpielzeugWERTE EINFÜGEN (NULL, 'GI Joe', 300, 120)

Im obigen Codefragment haben wir einfach 6 Beobachtungen mit dem Befehl INSERT INTO in unsere Tabelle 'Spielzeug' eingefügt. Für jede Beobachtung habe ich in den Klammern den Wert jeder Variablen oder Funktion angegeben, die beim Erstellen der Tabelle definiert wurde.

Die TID-Variable wird auf NULL gesetzt, da sie automatisch von 1 inkrementiert wird.

Lassen Sie uns nun alle in unserer Tabelle vorhandenen Daten anzeigen. Dies kann mit dem folgenden Befehl erfolgen:

SELECT * FROM Spielzeug


Schritt 4: Ändern Sie die Dateneingaben

Nehmen wir an, Sie haben beschlossen, den Preis für das G.I. Joe, da es Ihnen viele Kunden bringt. Wie würden Sie den Preis der Variablen in einer Datenbank aktualisieren?

Verwenden Sie einfach den folgenden Befehl:

UPDATE Spielzeug SET Preis = 350 WHERE TID = 6

Mit dem Befehl UPDATE können Sie alle in der Tabelle gespeicherten Werte / Variablen ändern. Mit dem Parameter SET können Sie eine bestimmte Funktion auswählen, und mit dem Parameter WHERE können Sie die Variable / den Wert identifizieren, die / den Sie ändern möchten. Im obigen Befehl habe ich den Preis der Dateneingabe aktualisiert, deren TID 6 ist (G.I. Joe).

Sehen wir uns nun die aktualisierte Tabelle an:

SELECT * FROM Spielzeug

Sie können auch ändern, was angezeigt werden soll, indem Sie sich nur auf die Spalten beziehen, die Sie anzeigen möchten. Mit dem folgenden Befehl werden beispielsweise nur der Name des Spielzeugs und der jeweilige Preis angezeigt:

SELECT Item_name, Preis FROM Spielzeug

Schritt 5: Daten abrufen

Nachdem Sie die Daten eingefügt und geändert haben, ist es endlich Zeit, die Daten gemäß den Geschäftsanforderungen zu extrahieren und abzurufen. Hier können Daten zur weiteren Datenanalyse und Datenmodellierung abgerufen werden.

Beachten Sie, dass dies ein einfaches Beispiel für den Einstieg in SQL ist. In realen Szenarien sind die Daten jedoch viel komplizierter und umfangreicher. Trotzdem bleiben die SQL-Befehle unverändert, und das macht SQL so einfach und verständlich. Es kann komplexe Datensätze mit einer Reihe einfacher SQL-Befehle verarbeiten.

Lassen Sie uns nun Daten mit einigen Änderungen abrufen. Lesen Sie den folgenden Code und versuchen Sie zu verstehen, was er tut, ohne auf die Ausgabe zu achten:

SELECT * FROM Toys LIMIT 2

Du hast es erraten! Es zeigt die ersten beiden Beobachtungen in meiner Tabelle.

Probieren wir etwas Interessanteres aus.

SELECT * FROM Spielzeug BESTELLEN NACH Preis ASC

Wie in der Abbildung gezeigt, sind die Werte in aufsteigender Reihenfolge der Preisvariablen angeordnet. Was würden Sie tun, wenn Sie nach den drei am häufigsten gekauften Artikeln suchen möchten?

Es ist wirklich ganz einfach!

SELECT * FROM Spielzeug BESTELLEN NACH Menge DESC LIMIT 3

Versuchen wir es noch einmal.

SELECT * FROM Spielzeug WO Preis> 400 BESTELLEN NACH Preis ASC


Diese Abfrage extrahiert die Details der Spielzeuge, deren Preis mehr als 400 beträgt, und ordnet die Ausgabe in aufsteigender Reihenfolge des Preises.

So können Sie Daten mithilfe von SQL verarbeiten. Nachdem Sie die Grundlagen von SQL für Data Science kennen, sind Sie sicher neugierig, mehr zu erfahren. Hier sind ein paar Blogs, um Ihnen den Einstieg zu erleichtern:

  1. Was ist Data Science? Ein Leitfaden für Anfänger in Data Science
  2. MySQL Tutorial - Ein Leitfaden für Anfänger zum Erlernen von MySQL

Wenn Sie sich für einen vollständigen Kurs über künstliche Intelligenz und maschinelles Lernen anmelden möchten, hat Edureka einen speziell kuratierten Kurs Dadurch beherrschen Sie Techniken wie überwachtes Lernen, unbeaufsichtigtes Lernen und Verarbeitung natürlicher Sprachen. Es umfasst Schulungen zu den neuesten Fortschritten und technischen Ansätzen im Bereich künstliche Intelligenz und maschinelles Lernen wie Deep Learning, grafische Modelle und Reinforcement Learning.