Was sind die Voraussetzungen für maschinelles Lernen?



Dieser Blog über die Voraussetzungen für maschinelles Lernen hilft Ihnen dabei, die grundlegenden Konzepte zu verstehen, die Sie kennen müssen, bevor Sie mit maschinellem Lernen beginnen.

Maschinelles Lernen ist zweifellos die gefragteste Technologie der Ära! Wenn Sie ein Anfänger sind, der mit maschinellem Lernen beginnt, ist es wichtig, dass Sie die Voraussetzungen für maschinelles Lernen kennen. Dieser Blog hilft Ihnen dabei, die verschiedenen Konzepte zu verstehen, die Sie kennen müssen, bevor Sie mit maschinellem Lernen beginnen.

Um detaillierte Kenntnisse über künstliche Intelligenz und maschinelles Lernen zu erhalten, können Sie sich live anmelden von Edureka mit 24/7 Support und lebenslangem Zugriff.





Hier ist eine Liste von Themen in diesem Blog behandelt:

  1. Voraussetzungen für maschinelles Lernen
  2. Grundlegendes zum maschinellen Lernen anhand eines Anwendungsfalls

Voraussetzungen für maschinelles Lernen

Zunächst einmalMaschinelles Lernen Sie müssen mit folgenden Konzepten vertraut sein:



  1. Statistiken
  2. Lineare Algebra
  3. Infinitesimalrechnung
  4. Wahrscheinlichkeit
  5. Programmiersprachen

Statistiken

Statistiken enthalten Tools, mit denen aus den Daten ein Ergebnis erzielt werden kann. Es gibt beschreibende Statistiken, mit denen Rohdaten in wichtige Informationen umgewandelt werden. Inferenzstatistiken können auch verwendet werden, um wichtige Informationen aus einer Datenprobe abzurufen, anstatt einen vollständigen Datensatz zu verwenden.

Mehr darüber lernen Statistiken können Sie durch die folgenden Blogs gehen:

Lineare Algebra

Lineare Algebra befasst sichmit Vektoren, Matrizen und linearen Transformationen. Dies ist beim maschinellen Lernen sehr wichtig, da es zum Transformieren und Ausführen von Operationen am Datensatz verwendet werden kann.



Infinitesimalrechnung

Die Analysis ist ein wichtiges Feld in der Mathematik und spielt eine wichtige Rolle in vielen Algorithmen für maschinelles Lernen. Datensatz mit mehreren Funktionen sindWird zum Erstellen von Modellen für maschinelles Lernen verwendet, da mehrere multivariable Kalküle eine wichtige Rolle beim Erstellen eines Modells für maschinelles Lernen spielen. Integrationen und Differenzierungen sind ein Muss.

Wahrscheinlichkeit

Die Wahrscheinlichkeit hilft, die Wahrscheinlichkeit des Auftretens vorherzusagen. Sie hilft uns zu argumentieren, dass die Situation möglicherweise erneut auftritt oder nicht. Für maschinelles Lernen ist die Wahrscheinlichkeit a Stiftung.

Mathematics

Um mehr über die Wahrscheinlichkeit zu erfahren, können Sie dies durchgehen Blog.

Python __init__ selbst

Programmiersprache

Es ist wichtig, Programmiersprachen wie R und Python zu kennen, um den gesamten maschinellen Lernprozess zu implementieren. Python und R bieten beide integrierte Bibliotheken, die die Implementierung von Algorithmen für maschinelles Lernen sehr einfach machen.

Neben grundlegenden Programmierkenntnissen ist es auch wichtig, dass Sie wissen, wie Daten extrahiert, verarbeitet und analysiert werden. Dies ist eine der wichtigsten Fähigkeiten, die für maschinelles Lernen benötigt werden.

Erfahren Sie mehr über die Programmierung Sprachen für maschinelles Lernen können Sie durch die folgenden Blogs gehen:

  1. Die besten Python-Bibliotheken für Data Science und maschinelles Lernen

Anwendungsfall für maschinelles Lernen

Beim maschinellen Lernen geht es darum, einen Algorithmus zu erstellen, der aus Daten lernen kann, um eine Vorhersage darüber zu treffen, welche Arten von Objekten auf dem Bild vorhanden sind, oder eine Empfehlungs-Engine, die beste Kombination von Medikamenten zur Heilung bestimmter Krankheiten oder zur Spam-Filterung.

Maschinelles Lernen basiert auf mathematischen Voraussetzungen. Wenn Sie wissen, warum Mathematik beim maschinellen Lernen verwendet wird, macht es Spaß. Sie müssen die Mathematik hinter den Funktionen kennen, die Sie verwenden werden, und welches Modell für die Daten geeignet ist und warum.

Beginnen wir also mit einem interessanten Problem der Vorhersage von Immobilienpreisen, bei dem ein Datensatz mit einer Historie verschiedener Merkmale und Preise vorliegt. Zunächst werden wir die Fläche des Wohnraums in Quadratfuß und die Preise betrachten.

Jetzt haben wir einen Datensatz, der zwei Spalten enthält, wie unten gezeigt:

Es muss eine gewisse Korrelation zwischen diesen beiden Variablen bestehen, um herauszufinden, dass wir ein Modell erstellen müssen, das den Preis von Häusern vorhersagen kann. Wie können wir das tun?

Lassen Sie uns diese Daten grafisch darstellen und sehen, wie sie aussehen:

Hier ist die X-Achse der Preis pro Quadratfuß Wohnfläche und die Y-Achse ist der Preis des Hauses. Wenn wir alle Datenpunkte zeichnen, erhalten wir ein Streudiagramm, das durch eine Linie dargestellt werden kann, wie in der obigen Abbildung gezeigt. Wenn wir einige Daten eingeben, wird ein Ergebnis vorhergesagt. Idealerweise müssen wir eine Linie finden, die die maximalen Datenpunkte schneidet.

Hier versuchen wir eine Linie zu erstellen, die wie folgt bezeichnet wird:

Y = mX + c

Diese Methode zur Vorhersage der linearen Beziehung zwischen dem Ziel (abhängige Variable) und der Prädiktorvariablen (unabhängige Variable) wird als lineare Regression bezeichnet. Es ermöglicht uns, eine Beziehung zwischen zwei Variablen zu untersuchen und zusammenzufassen.

  • X = unabhängige Variable
  • Y = abhängige Variable
  • c = y-Achsenabschnitt
  • m = Steigung der Linie

Wenn wir die Gleichung betrachten, haben wir Werte für X, die eine unabhängige Variable sind. Wir müssen also nur Werte für m und c berechnen, um den Wert von Y vorherzusagen.

Wie finden wir diese Variablen?

Um diese Variablen zu finden, können wir eine Reihe von Werten ausprobieren und versuchen, eine Linie zu finden, die die maximale Anzahl von Datenpunkten schneidet. Aber wie können wir die am besten passende Linie finden?

Um die am besten passende Linie zu finden, können wir die Fehlerfunktion der kleinsten Quadrate verwenden, die den Fehler zwischen dem realen Wert von y und dem vorhergesagten Wert y` findet.

Die Fehlerfunktion der kleinsten Quadrate kann unter Verwendung der folgenden Gleichung dargestellt werden:

Mit dieser Funktion können wir den Fehler für jeden vorhergesagten Datenpunkt ermitteln, indem wir ihn mit dem tatsächlichen Wert des Datenpunkts vergleichen. Sie nehmen dann die Summe aller dieser Fehler und quadrieren sie, um die Abweichung in der Vorhersage herauszufinden.

Microsoft SQL-Tutorial für Anfänger

Wenn wir die dritte Achse zu unserem Diagramm hinzufügen, die alle möglichen Fehlerwerte enthält, und sie im dreidimensionalen Raum darstellen, sieht sie folgendermaßen aus:

Im obigen Bild befinden sich die idealen Werte im unteren schwarzen Teil, der die Preise nahe am tatsächlichen Datenpunkt vorhersagt. Der nächste Schritt besteht darin, die bestmöglichen Werte für m und c zu finden. Dies kann mithilfe der Optimierungstechnik erfolgen, die als Gradientenabstieg bezeichnet wird.

Der Gradientenabstieg ist eine iterative Methode, bei der wir mit der Initialisierung einiger Wertesätze für unsere Variablen beginnen und diese langsam verbessern, indem wir den Fehler zwischen dem tatsächlichen Wert und dem vorhergesagten Wert minimieren.

Wenn wir nun denken, dass die Preise der Wohnung praktisch nicht nur vom Preis pro Quadratfuß abhängen, gibt es viele Faktoren wie die Anzahl der Schlafzimmer, Badezimmer usw. Wenn wir auch diese Merkmale berücksichtigen, wird die Gleichung etwas aussehen so was

Y = b0 + b1x1 + b2x2 + & hellip .. + bnxn + c

Dies ist eine multilineare Regression, die zur linearen Algebra gehört. Hier können wir Matrizen der Größe mxn verwenden, wobei m Merkmale und n Datenpunkte sind.

Betrachten wir eine andere Situation, in der wir die Wahrscheinlichkeit verwenden können, um den Zustand des Hauses zu ermitteln, um ein Haus danach zu klassifizieren, ob es sich in einem guten oder einem schlechten Zustand befindet. Um dies zu erreichen, müssen wir eine Technik namens Logistische Regression verwenden, die die Wahrscheinlichkeit von Ereignissen untersucht, die durch eine Sigmoidfunktion dargestellt werden.

In diesem Artikel haben wir die Voraussetzungen des maschinellen Lernens und ihre Anwendung beim maschinellen Lernen behandelt. Im Grunde besteht es also aus Statistik, Kalkül, linearer Algebra und Wahrscheinlichkeitstheorie. Calculus verfügt über Techniken zur Optimierung, die lineare Algebra über Algorithmen, die mit großen Datenmengen arbeiten können. Mit der Wahrscheinlichkeit, dass wir die Wahrscheinlichkeit von Ereignissen vorhersagen können, und Statistiken können wir nützliche Erkenntnisse aus der Stichprobe von Datensätzen ableiten.

Nachdem Sie die Voraussetzungen für maschinelles Lernen kennen, sind Sie sicher neugierig, mehr zu erfahren. Hier sind einige Blogs, die Ihnen den Einstieg in Data Science erleichtern:

Wenn Sie sich für einen vollständigen Kurs über künstliche Intelligenz und maschinelles Lernen anmelden möchten, hat Edureka einen speziell kuratierten Kurs Dadurch beherrschen Sie Techniken wie überwachtes Lernen, unbeaufsichtigtes Lernen und Verarbeitung natürlicher Sprachen. Es umfasst Schulungen zu den neuesten Fortschritten und technischen Ansätzen im Bereich künstliche Intelligenz und maschinelles Lernen wie Deep Learning, grafische Modelle und Reinforcement Learning.