Was ist Skalierung?
Wenn Sie zum ersten Mal einen Datensatz in Ihr Python-Skript oder -Pocket book laden und sich Ihre numerischen Merkmale ansehen, werden Sie wahrscheinlich feststellen, dass sie alle auf unterschiedlichen Skalen liegen.
Dies bedeutet, dass jede Spalte oder jedes Function unterschiedliche Bereiche hat. Beispielsweise kann ein Function Werte zwischen 0 und 1 haben, während ein anderes Werte zwischen 1000 und 10000 haben kann.
Nehmen Sie die Weinqualitätsdatensatz aus dem UCI Machine Studying Repository (CC by 4.0 Lizenz) Zum Beispiel.
Beim Skalieren handelt es sich im Wesentlichen um den Vorgang, alle Options einem ähnlichen oder gleichen Bereich oder Maßstab anzunähern. Dies kann beispielsweise durch die Transformation geschehen, sodass alle Werte zwischen 0 und 1 liegen.
Wann (und warum) Sie skalieren müssen
Es gibt einige Gründe, warum es wichtig ist, Funktionen vor dem Anpassen/Trainieren eines Machine-Studying-Modells zu skalieren:
- Stellt sicher, dass alle Options gleichermaßen zum Modell beitragen. Wenn ein Function groß ist und…