Fuzzy K-Means Clustering in Mahout

Dieser Blog bietet eine Einführung in das Fuzzy K-Means-Clustering in Apache Mahout.

Fuzzy K-Means ist genau der gleiche Algorithmus wie K-Means, eine beliebte einfache Clustering-Technik. Der einzige Unterschied besteht darin, dass ein Punkt nicht nur einem Cluster zugewiesen wird, sondern eine Art Unschärfe oder Überlappung zwischen zwei oder mehr Clustern aufweisen kann. Im Folgenden sind die wichtigsten Punkte aufgeführt, die Fuzzy-K-Mittel beschreiben:



  • Im Gegensatz zu K-Means, bei denen ein harter Cluster gesucht wird, bei dem jeder der Punkte zu einem Cluster gehört, sucht Fuzzy K-Means nach den weicheren Clustern für die Überlappung.
  • Ein einzelner Punkt in einem weichen Cluster kann zu mehr als einem Cluster mit einem bestimmten Affinitätswert zu jedem der Punkte gehören.
  • Die Affinität ist proportional zum Abstand dieses Punktes vom Clusterschwerpunkt.
  • Ähnlich wie bei K-Means arbeitet Fuzzy K-Means mit Objekten, für die das Abstandsmaß definiert ist und die in der dargestellt werden können n- dimensionaler Vektorraum.

Fuzzy K-Means MapReduce Flow

Es gibt keinen großen Unterschied zwischen dem MapReduce-Fluss von K-Means und Fuzzy K-Means. Die Implementierung von beiden in Mahout ist ähnlich.

Was sind Bohnen in Java?

Es folgen die wesentliche Parameter für die Implementierung von Fuzzy K-Means:

  • Für die Eingabe benötigen Sie einen Vektordatensatz.
  • Es muss den RandomSeedGenerator geben, um die anfänglichen k Cluster zu setzen.
  • Für die Abstandsmessung ist SquaredEuclideanDistanceMeasure erforderlich.
  • Ein großer Wert der Konvergenzschwelle, z. B. –cd 1.0, wenn der quadratische Wert des Abstandsmaßes verwendet wurde
  • Ein Wert für maxIterations. Der Standardwert ist -x 10.
  • Der Normalisierungskoeffizient oder der Unschärfefaktor mit einem Wert größer als -m 1,0

Hast du eine Frage an uns? Erwähnen Sie sie im Kommentarbereich und wir werden uns bei Ihnen melden.

Fibonacci c ++ rekursiv

zusammenhängende Posts

Java Parse String bis heute

Betreutes Lernen in Apache Mahout