Wann sollte MinMaxScaler, wann StandardScaler und wann etwas anderes verwendet werden?

Foto von Sven Mieke An Unsplash

Was ist Skalierung?

Wenn Sie zum ersten Mal einen Datensatz in Ihr Python-Skript oder -Pocket book laden und sich Ihre numerischen Merkmale ansehen, werden Sie wahrscheinlich feststellen, dass sie alle auf unterschiedlichen Skalen liegen.

Dies bedeutet, dass jede Spalte oder jedes Function unterschiedliche Bereiche hat. Beispielsweise kann ein Function Werte zwischen 0 und 1 haben, während ein anderes Werte zwischen 1000 und 10000 haben kann.

Nehmen Sie die Weinqualitätsdatensatz aus dem UCI Machine Studying Repository (CC by 4.0 Lizenz) Zum Beispiel.

Einige Merkmale aus dem UCI-Datensatz zur Weinqualität. Bild vom Autor

Beim Skalieren handelt es sich im Wesentlichen um den Vorgang, alle Options einem ähnlichen oder gleichen Bereich oder Maßstab anzunähern. Dies kann beispielsweise durch die Transformation geschehen, sodass alle Werte zwischen 0 und 1 liegen.

Wann (und warum) Sie skalieren müssen

Es gibt einige Gründe, warum es wichtig ist, Funktionen vor dem Anpassen/Trainieren eines Machine-Studying-Modells zu skalieren:

  1. Stellt sicher, dass alle Options gleichermaßen zum Modell beitragen. Wenn ein Function groß ist und…

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert