Betreutes Lernen in Apache Mahout

Überwachtes Lernen ist eine Technik des maschinellen Lernens, bei der eine Funktion aus den gekennzeichneten Beispielen für Trainingsdaten abgeleitet wird.

Überwachtes Lernen ist die Methode, bei der die Trainingsdaten sowohl die Eingabe als auch die gewünschten Ergebnisse enthalten. Das Training des Systems mit Beispielen wird als überwachtes Lernen bezeichnet. Das Training des Algorithmus mit einem Lehrer kann auch als überwachtes Lernen behandelt werden. Nach dem Training des Algorithmus mit allen Beispieldaten oder beschrifteten Daten, die beide Prädiktoren für die Zielvariable enthalten, kann der Algorithmus trainiert und das unsichtbare Beispiel für die weitere Klassifizierung verwendet werden.



android studio ui design tutorial

Hier sind einige der wichtigen Funktionen des überwachten Lernens in Mahout:

  • Der Aufbau eines geeigneten Trainings-, Validierungs- und Test-Sets (Bok) ist von entscheidender Bedeutung.
  • Diese Methoden sind normalerweise schnell und genau.
  • Die überwachten Lernmethoden müssen verallgemeinern können.
  • Sie liefern korrekte Ergebnisse, wenn neue Daten in die Eingabe eingegeben werden, ohne a zu kennenprioriZiel.
  • In einigen Fällen sind die korrekten Ergebnisse (Ziele) bekannt und werden während des Lernprozesses in das Modell eingegeben.

Beispiel für betreutes Lernen

Falls Sie eine Mission trainieren möchten und zwei verschiedene Gruppen von Bildern zusammen mit den beschrifteten Daten erhalten, z. Im obigen Bild hat eine Gruppe die Bilder eines Elefanten und die andere die eines Löwen. Beschriftete Daten implizieren, dass jeder Datensatz einen Zielwert hat. In dem obigen Beispiel handelt es sich bei dem Datensatz um Bilder eines Elefanten, während die ihm gegebene Bezeichnung, d. H. 'Elefant', der Zielwert des Datensatzes ist. Ein solcher beschrifteter Datensatz wird für den Trainingsprozess verwendet, so dass der Trainingsalgorithmus diesen Datensatz nutzen und ein Modell erstellen kann, das weiter verwendet werden kann, um die unsichtbaren Beispiele ohne die beschrifteten Daten oder die Zielvariable zu klassifizieren.

Lassen Sie uns die Merkmale identifizieren, die bei der Identifizierung eines Objekts als Elefant oder Löwe hilfreich sind:

Die Funktionen könnte sein - - Größe, Farbe, Höhe, Ohrgröße, Rumpf, Stoßzahn

Dies kann als Funktionsumfang bezeichnet werden, der für Schulungszwecke verwendet wird. Dieser Funktionsumfang wirkt sich auf die endgültige Zielvariable aus. Diese Variablen sind bekannt als Predictor Variablen , weil sie uns bei der Bestimmung der helfen endgültige Zielvariable . Die endgültige Variable kann auch als Label bezeichnet werden. Die letzte Variable Hier ist Elefant / Löwe.

table-word

In diesem Beispiel ist jeder Datensatz in den Kategorien Größe, Farbe, Höhe, Ohrgröße, Rumpf und Stoßzahn eine Prädiktorvariable, während Elefant und Löwe die Zielvariablen sind. Diese Variablen können als Trainingsbeispiele bzw. Trainingsdatensätze behandelt werden.

Supervised Learning ist also eine Methode, mit der Sie zusammen mit den Beschriftungen trainieren, wobei Sie den Algorithmus auffordern, bestimmte Funktionen daraus zu extrahieren. Auf dieser Grundlage kann der Algorithmus jedes Mal, wenn Sie ein unsichtbares Beispiel sehen, diese klassifizieren in die richtige Klasse.

Hast du eine Frage an uns? Erwähnen Sie sie im Kommentarbereich und wir werden uns bei Ihnen melden.

Zusammenhängende Posts: