R-Programmierung - Anfängerhandbuch zur R-Programmiersprache



Dieser Blog über R-Programmierung führt Sie in R ein und hilft Ihnen, die verschiedenen grundlegenden Konzepte der R-Programmierung anhand von Beispielen im Detail zu verstehen.

R ist eines der beliebtesten Analysetools. R wird nicht nur für Analysen verwendet, sondern ist auch eine Programmiersprache.Mit dem Wachstum in der IT-Branche steigt der Bedarf an Fachkräften oder Fachkräften mit einem Verständnis von R als Datenanalyse-Tool und Programmiersprache.In diesem Blog werde ich Ihnen helfen, die verschiedenen Grundlagen der R-Programmierung zu verstehen. In unserer p revious Blog ,Wir haben diskutiert, warum wir Analytics brauchen, was Business Analytics ist, warum und wer R verwendet.

In diesem Blog werden wir die folgenden Kernkonzepte der R-Programmierung in der folgenden Reihenfolge verstehen:





  1. Variablen
  2. Datentypen
  3. Datenoperatoren
  4. Bedingte Erklärung
  5. Schleifen
  6. Funktionen

Sie können die Webinar-Aufzeichnung der R-Programmiersprache durchgehen, in der unser Kursleiter die Themen ausführlich anhand von Beispielen erläutert hat, die Ihnen helfen, die R-Programmierung besser zu verstehen.

R Programmierung für Anfänger | R Programmiersprachen-Tutorial | Edureka



Gehen wir also weiter und schauen uns das erste Konzept der R-Programmierung - Variablen an.

R Programmierung: Variablen

Variablen sind nichts anderes als ein Name für einen Speicherort, der einen Wert enthält. Eine Variable in R kann numerische Werte, komplexe Werte, Wörter, Matrizen und sogar eine Tabelle speichern. Überraschend, oder?

Variable - R Programmierung - Edureka

Feige: Schaffungvon Variablen



Das obige Bild zeigt uns, wie Variablen erstellt und in verschiedenen Speicherblöcken gespeichert werden. In R müssen wir im Gegensatz zu anderen Programmiersprachen wie Java, C, C ++ usw. keine Variable deklarieren, bevor wir sie verwenden.

Lassen Sie uns vorwärts gehen und versuchen zu verstehen, was ein Datentyp ist und welche verschiedenen Datentypen in R unterstützt werden.

R Programmierung: Datentypen

In R wird eine Variable selbst nicht als Datentyp deklariert, sondern erhält den Datentyp des ihr zugewiesenen R-Objekts. Daher wird R als dynamisch typisierte Sprache bezeichnet, was bedeutet, dass wir einen Datentyp derselben Variablen immer wieder ändern können, wenn wir ihn in einem Programm verwenden.

So konfigurieren Sie Eclipse für Java

Datentypen gibt an, welchen Wertetyp eine Variable hat und welche Art von mathematischen, relationalen oder logischen Operationen auf sie angewendet werden können, ohne einen Fehler zu verursachen. Es gibt viele Datentypen in R, im Folgenden sind jedoch die am häufigsten verwendeten aufgeführt:

Lassen Sie uns nun jeden dieser Datentypen ausgehend von Vektoren einzeln diskutieren.

Vektoren

Vektoren sind die grundlegendsten R-Datenobjekte und es gibt sechs Arten von Atomvektoren. Unten sind die sechs Atomvektoren:

Logisch : Es wird verwendet, um logische Werte wie zu speichern WAHR oder FALSCH .

Numerisch : Es wird verwendet, um sowohl positive als auch negative Zahlen einschließlich reeller Zahlen zu speichern.

ZB: 25, 7,1145, 96547

Ganze Zahl : Es enthält alle ganzzahligen Werte, d. H. Alle positiven und negativen ganzen Zahlen.

ZB: 45,479, -856,479, 0

Komplex : Diese haben die Form x + yi, wobei x und y numerisch sind und i die Quadratwurzel von -1 darstellt.

ZB: 4 + 3i

Charakter : Es wird verwendet, um entweder ein einzelnes Zeichen, eine Gruppe von Zeichen (Wörter) oder eine Gruppe von Wörtern zusammen zu speichern. Die Zeichen können entweder in einfachen oder doppelten Anführungszeichen definiert werden.

ZB: 'Edureka', 'R macht Spaß zu lernen'.

Im Allgemeinen wird ein Vektor auf folgende Weise definiert und initialisiert:

Vtr = c (2, 5, 11, 24) Oder Vtr<- c(2, 5, 11 , 24)

Lassen Sie uns vorwärts gehen und andere Datentypen in R verstehen.

Liste

Listen sind Vektoren ziemlich ähnlich, aber Listen sind die R-Objekte, die Elemente verschiedener Typen wie & minus Zahlen, Zeichenfolgen, Vektoren und eine andere Liste enthalten können.

Z.B:

Vtr<- c('Hello', 'Hi','How are you doing') mylist <- list(Vtr, 22.5, 14965, TRUE) mylist 

Ausgabe:

[[1]] [1] 'Hallo' 'Hallo' 'Wie machst du '[[2]] [1] 22,5 [[3]] [1] 14965 [[4]] [1] WAHR

Matrix

Matrix ist das R-Objekt, in dem die Elemente in einem zweidimensionalen rechteckigen Layout angeordnet sind.

Die grundlegende Syntax zum Erstellen einer Matrix in R lautet & minus

 Matrix (Daten, nrow, ncol, byrow, dimnames) 

Wo:

  • Daten ist der Eingabevektor, der zu den Datenelementen der Matrix wird.
  • nrow ist die Anzahl der zu erstellenden Zeilen.
  • ncol ist die Anzahl der zu erstellenden Spalten.
  • byrow ist ein logischer Hinweis. Wenn TRUE, sind die Eingabevektorelemente zeilenweise angeordnet.
  • dimname sind die Namen, die den Zeilen und Spalten zugewiesen sind.

Beispiel:

Mymatrix<- matrix(c(1:25), nrow = 5, ncol = 5, byrow = TRUE) Mymatrix 

Ausgabe:

[, 1] [, 2] [, 3] [, 4] [, 5] [1,] 1 2 3 4 5 [2,] 6 7 8 9 10 [3,] 11 12 13 14 15 [4, ] 16 17 18 19 20 [5,] 21 22 23 24 25

ARRAY

Arrays in R sind Datenobjekte, mit denen Daten in mehr als zwei Dimensionen gespeichert werden können. Es nimmt Vektoren als Eingabe und verwendet die Werte in der Nein Parameter zum Erstellen eines Arrays.

Die grundlegende Syntax zum Erstellen eines Arrays in R lautet & minus

 Array (Daten, dim, dimnames) 

Wo:

  • Daten ist der Eingabevektor, der zu den Datenelementen des Arrays wird.
  • Nein ist die Dimension des Arrays, in der Sie die Anzahl der Zeilen, Spalten und die Anzahl der Matrizen übergeben, die mit den genannten Dimensionen erstellt werden sollen.
  • dimname sind die Namen, die den Zeilen und Spalten zugewiesen sind.

Beispiel:

Myarray<- array( c(1:16), dim=(4,4,2)) Myarray 

Ausgabe:

, , ein [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16 2 [, 1] [, 2] [, 3] [, 4] [1,] 1 5 9 13 [2,] 2 6 10 14 [3,] 3 7 11 15 [4,] 4 8 12 16

Datenrahmen

Ein Datenrahmen ist eine Tabelle oder eine zweidimensionale Array-ähnliche Struktur, in der jede Spalte Werte einer Variablen und jede Zeile einen Satz von Werten enthältzumjede Spalte. Im Folgenden sind einige Merkmale eines Datenrahmens aufgeführt, die bei jeder Arbeit mit ihnen berücksichtigt werden müssen:

  • Die Spaltennamen sollten nicht leer sein.
  • Jede Spalte sollte dieselbe Menge an Datenelementen enthalten.
  • Die in einem Datenrahmen gespeicherten Daten können vom numerischen Typ, vom Faktor oder vom Zeichentyp sein.
  • Die Zeilennamen sollten eindeutig sein.

Beispiel:

emp_id = c (100: 104) emp_name = c ('John', 'Henry', 'Adam', 'Ron', 'Gary') dept = c ('Vertrieb', 'Finanzen', 'Marketing', 'HR ',' F & E ') emp.data<- data.frame(emp_id, emp_name, dept) emp.data 

Ausgabe:

emp_id emp_name dept 1 100 John Sales 2 101 Henry Finance 3 102 Adam Marketing 4 103 Ron HR 5 104 Gary R & D.

Nachdem wir die grundlegenden Datentypen von R verstanden haben, ist es an der Zeit, uns eingehend mit R zu befassen, indem wir die Konzepte der Datenoperatoren verstehen.

R Programmierung: Datenoperatoren

Es gibt hauptsächlich 4 Datenoperatoren in R, die wie folgt aussehen:

Rechenzeichen : Diese Operatoren helfen uns, die grundlegenden arithmetischen Operationen wie Addition, Subtraktion, Multiplikation usw. auszuführen.

Betrachten Sie das folgende Beispiel:

num1 = 15 num2 = 20 num3 = 0 #addition num3 = num1 + num2 num3 #substraction num3 = num1 - num2 num3 #multiplication num3 = num1 * num2 num3 #division num3 = num1 / num2 num3 #modul num3 = num1 %% num2 num3 #exponent num1 = 5 num2 = 3 num3 = num1 ^ num2 num3 #bodenteilung num3 = num1% /% num2 num3

Ausgabe:

[1] 35 [fünfzehn [1] 300 [1] 0,75 [1] 15 [1] 125 [elf

Vergleichsoperatoren : Diese Operatoren helfen uns bei der Ausführung relationaler Operationen wie der Überprüfung, ob eine Variable größer, kleiner oder gleich einer anderen Variablen ist. Die Ausgabe einer relationalen Operation ist immer ein logischer Wert.

Betrachten Sie die folgenden Beispiele:

num1 = 15 num2 = 20 # entspricht num3 = (num1 == num2) num3 # ist nicht gleich num3 = (num1! = num2) num3 # kleiner als num3 = (num1 num2) num3 # ohne gleich num1 = 5 num2 = 20 num3 = (num1 = num2) num3

Ausgabe:

[1] FALSCH [1] WAHR [1] WAHR [1] FALSCH [1] WAHR [1] FALSCH

Zuweisungsoperatoren: Diese Operatoren werden verwendet, um Variablen in R Werte zuzuweisen. Die Zuweisung kann entweder mit dem Zuweisungsoperator durchgeführt werden((<-) oder gleich Operator (=). Der Wert der Variablen kann auf zwei Arten zugewiesen werden: links und rechts.

LogischBetreiber: Diese Operatoren vergleichen die beiden Entitäten und werden normalerweise mit booleschen (logischen) Werten wie 'und', 'oder' verwendet.und'nicht'.


R Programmierung: Bedingte Anweisungen

  1. If-Anweisung: Die If-Anweisung hilft Ihnen bei der Auswertung eines einzelnen Ausdrucks als Teil des Ablaufs. Um diese Auswertung durchzuführen, müssen Sie nur das Schlüsselwort If gefolgt von dem auszuwertenden Ausdruck schreiben. Das folgende Flussdiagramm gibt eine Vorstellung davon, wie die If-Anweisung den Fluss eines Codes steuert: Betrachten Sie das folgende Beispiel:
num1 = 10 num2 = 20 if (num1<=num2){ print('Num1 is less or equal to Num2') 

Ausgabe:

[1] 'Num1 ist kleiner oder gleich Num2'
  • Sonst If-Anweisung: Die Else if-Anweisung hilft Ihnen dabei, Verzweigungen auf den von der If-Anweisung erstellten Flow zu erweitern, und gibt Ihnen die Möglichkeit, mehrere Bedingungen zu bewerten, indem Sie neue Flow-Zweige erstellen. Der folgende Ablauf gibt Ihnen eine Vorstellung davon, wie die else if-Anweisung den Ablauf des Codes verzweigt:

    Betrachten Sie das folgende Beispiel:

    Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 ist kleiner als Num1')} else if ('Num1 == Num2) {print (' Num1 und Num2 sind gleich ')}

    Ausgabe:

    [1] 'Num1 ist kleiner als Num2'

  • Sonst Aussage: Die else-Anweisung wird verwendet, wenn alle anderen Ausdrücke überprüft und für ungültig befunden werden. Dies ist die letzte Anweisung, die als Teil des If - Else if - Zweigs ausgeführt wird. Im Folgenden finden Sie eine bessere Vorstellung davon, wie Else den Codefluss ändert:

Betrachten Sie das folgende Beispiel:

Num1 = 5 Num2 = 20 if (Num1 Num2) {print ('Num2 ist kleiner als Num1')} else print ('Num1 und Num2 sind gleich')}

Ausgabe:

[1] 'Num1 und Num2 sind gleich'

R Programmierung: Schleifen

Mit einer Schleifenanweisung können wir eine Anweisung oder eine Gruppe von Anweisungen mehrmals ausführen. Es gibt hauptsächlich 3 Arten von Schleifen in R:

  1. Schleife wiederholen : Es wiederholt eine Anweisung oder eine Gruppe von Anweisungen, während eine bestimmte Bedingung WAHR ist. Die Wiederholungsschleife ist das beste Beispiel für eine Exit-gesteuerte Schleife, bei der der Code zuerst ausgeführt wird und dann die Bedingung überprüft wird, um festzustellen, ob sich die Steuerung innerhalb der Schleife befinden oder diese verlassen soll. Unten sehen Sie den Kontrollfluss in einer Wiederholungsschleife:
    Schauen wir uns das folgende Beispiel an, um zu verstehen, wie wir mit der Wiederholungsschleife n Zahlen hinzufügen können, bis die Summe 100 überschreitet:

    x = 2 wiederhole {x = x ^ 2 drucke (x) wenn (x> 100) {break}

    Ausgabe:

    [1] 4 [1] 16 [1] 256
  2. while-Schleife :: icht hilft, eine Anweisung oder eine Gruppe von Anweisungen zu wiederholen, während eine bestimmte Bedingung WAHR ist. Während sich die Schleife im Vergleich zur Wiederholungsschleife geringfügig unterscheidet, handelt es sich um ein Beispiel für eine eingangsgesteuerte Schleife, bei der die Bedingung zuerst überprüft wird. Nur wenn sich herausstellt, dass die Bedingung erfüllt ist, wird die Steuerung innerhalb der Schleife geliefert, um den Code auszuführen . Unten sehen Sie den Kontrollfluss in einer while-Schleife:
    Schauen wir uns das folgende Beispiel an, um die Summe der Quadrate für die ersten 10 Zahlen zu addieren und zu verstehen, wie die while-Schleife besser funktioniert:

    system.exit (0)
    num = 1 sumn = 0 while (num<=11){ sumn =(sumn+ (num^2) num = num+1 print(sumn) } 


    Ausgabe:

    [elf [fünfzehn [1] 14 [1] 30 [1] 55 [1] 91 [1] 140 [1] 204 [1] 285 [1] 385 [1] 506
  3. für Schleife : Es wird verwendet, um eine Anweisung oder Gruppe von für eine feste Anzahl von Malen zu wiederholen. Im Gegensatz zur Wiederholungs- und while-Schleife wird die for-Schleife in Situationen verwendet, in denen bekannt ist, wie oft der Code zuvor ausgeführt werden muss. Es ähnelt der while-Schleife, in der die Bedingung zuerst überprüft wird und dann nur der darin geschriebene Code ausgeführt wird. Sehen wir uns jetzt den Kontrollfluss der for-Schleife an:

Schauen wir uns nun ein Beispiel an, in dem wir die for-Schleife verwenden, um die ersten 10 Zahlen zu drucken:

für (x in 1:10) {print (x)}

Ausgabe:

[elf [1] 2 [1] 3 [1] 4 [fünfzehn [1] 6 [1] 7 [1] 8 [1] 9 [1] 10

R Programmierung: Funktionen

Eine Funktion ist ein Block aus organisiertem, wiederverwendbarem Code, mit dem eine einzelne verwandte Aktion ausgeführt wird. In R gibt es hauptsächlich zwei Arten von Funktionen:

Vordefinierte Funktionen : Dies sind integrierte Funktionen, mit denen der Benutzer seine Arbeit erledigen kann easier. ZB: mean(( x) , sum(( x) , sqrt ( x ), toupper(( x ), usw.

Benutzerdefinierte Funktionen: Diese Funktionen werden vom Benutzer erstellt, um eine bestimmte Anforderung des Benutzers zu erfüllen. Das Folgende ist die Syntax zum Erstellen einer Funktion inR:

 func  tion_name  <– Funktion (arg_1, arg_2 & hellip){ // Funktionskörper }}

Betrachten Sie das folgende Beispiel einer einfachen Funktion zum Erzeugen der Summe der Quadratevon2 Zahlen:

sum_of_square<- function(x,y) { x^2 + y^2 } sum_of_sqares(3,4) 
Ausgabe: [1] 25

Ich hoffe, Ihnen hat das Lesen dieses R-Programmierblogs gefallen. In diesem Tutorial haben wir alle Grundlagen von R behandelt, sodass Sie jetzt mit dem Üben beginnen können. Nach diesem R-Programmierblog werde ich weitere Blogs zu R for Analytics erstellen. Bleiben Sie also auf dem Laufenden.

Nachdem Sie die Grundlagen von R verstanden haben, lesen Sie die von Edureka, einem vertrauenswürdigen Online-Lernunternehmen mit einem Netzwerk von mehr als 250.000 zufriedenen Lernenden auf der ganzen Welt. Mit Edurekas Data Analytics with R-Schulung erhalten Sie Kenntnisse in den Bereichen R-Programmierung, Datenmanipulation, explorative Datenanalyse, Datenvisualisierung, Data Mining, Regression, Stimmungsanalyse und Verwendung von RStudio für reale Fallstudien zu Einzelhandel und sozialen Medien.

Hast du eine Frage an uns? Bitte erwähnen Sie es im Kommentarbereich dieses 'R Programming' -Blogs und wir werden uns so schnell wie möglich bei Ihnen melden.