Predictive Analytics-Prozess in Business Analytics mit R.

Der Blog gibt einen kurzen Überblick über den Predictive Analytics-Prozess in Business Analytics mit R.

Typischer Modellierungsprozess:

In einem typischen Modellierungsprozess ist es wichtig, eine Hypothese zu erstellen. Eine Ausschreibung (Request for Proposal) wird empfangen und anschließend eine Hypothese erstellt.



Javascript-Länge eines Arrays
  1. Bestimmen Sie die richtige Datenquelle - Hier kann der Kunde Datenquelle angeben, wenn nicht, müssen wir nach einer Datenquelle suchen. In einem Szenario, in dem wir versuchen zu bewerten, wer die Wahl gewinnen würde, wird eine öffentliche Analyse der Daten mit Quellen durchgeführt, die soziale Medien, Nachrichtenkanäle oder die öffentliche Meinung umfassen. Wir müssen auch die Datenmenge verstehen, die zur Analyse des Problems erforderlich ist. In diesem Fall suchen wir normalerweise nach großen Stichproben, da es sich um einen Wahlfall handelt. Wenn die Analyse im Gesundheitswesen durchgeführt wird, ist es andererseits schwierig, sich für eine große Bevölkerung zu entscheiden, da die Möglichkeit besteht, dass nicht genügend Personen zur Validierung der Hypothese herangezogen werden. Auch die Qualität der Daten ist sehr wichtig.
  2. Daten extrahieren - Wenn wir beispielsweise eine Bevölkerungsstichprobe ziehen, können wir Attribute wie hohes Einkommen, niedriges Einkommen, Alter, Erwerbsbevölkerung (außerhalb / vor Ort), Einwohner, NRI, Abdeckung von Krankenhäusern usw. untersuchen, um die Studie zu initiieren . Hier benötigen wir möglicherweise nicht so viele Attribute für die Hypothese. Wir verstehen, dass Attribute wie hohes und niedriges Einkommen möglicherweise nicht dazu beitragen, wer die Wahl gewinnt. Das Alter kann jedoch einen Unterschied machen, da es direkt angibt, wie viele Personen wählen werden. Oft schließen wir weniger verwendete Attribute aus oder schließen nützliche Attribute ein. In beiden Fällen könnte es schief gehen. Aus diesem Grund ist die Analytik eine Herausforderung.
  3. Massieren Sie die Daten passend zum Werkzeug - Dies liegt daran, dass nicht alle Tools alle Daten akzeptieren können. Bestimmte Tools akzeptieren nur CSV-Daten oder Excel-Daten. Der Mangel an Werkzeugen ist eine Herausforderung.
  4. Führen Sie die Analyse aus - Diese Operation kann mit vielen Analysetechniken durchgeführt werden.
  5. Schlussfolgerungen - Die Analyse gibt Zahlen aus, um genau zu sein. Es liegt jedoch an einem Benutzer, aus diesen Zahlen Schlussfolgerungen abzuleiten. Wenn zum Beispiel 10% oder 20% steht, müssen wir verstehen, was es bedeutet? Leitet es eine Korrelation zwischen Attribut A und Attribut B her?
  6. Ergebnisse implementieren - Es ist wichtig, Schlussfolgerungen umzusetzen, um Ergebnisse im Geschäft zu sehen. Zum Beispiel kann gefolgert werden, dass 'Die Leute kaufen Regenschirm in der Regenzeit' was zu mehr Geschäft führen kann. Hier müssen wir Schlussfolgerungen umsetzen, wo wir Regenschirme in Geschäften verfügbar machen, aber dann kann es zu Managementproblemen kommen. In dem Moment, in dem die Statistik das Ergebnis liefert, kann die Implementierung schief gehen.
  7. Überwachung der Fortschritte - Im letzten Schritt spielt die Überwachung eine wichtige Rolle. Die Überwachung kann schief gehen, da nicht viele Unternehmen den Fortschritt überwachen möchten, und dies wird als vernachlässigbarer Schritt angesehen. Die Überwachung ist jedoch wichtig, da wir verstehen können, ob unsere Forschung und Schlussfolgerungen in die richtige Richtung gehen.

Lesen Sie auch diesen Artikel' Korrelation bedeutet nicht Ursache 'Dies gibt einen Einblick, wie Analysten etwas falsch machen können. Ein wichtiger Punkt in diesem Diagramm ist, dass die laufende Analyse der einzige Schritt ist, bei dem die Maschine rechenschaftspflichtig ist. Darüber hinaus liegt es an einem Menschen, der letztendlich bestimmt, wie die Forschung durchgeführt wird.

Hast du eine Frage an uns? Erwähnen Sie sie im Kommentarbereich und wir werden uns bei Ihnen melden.

Was ist .format in Python

Zusammenhängende Posts: