Bei vielen datenwissenschaftlichen Aufgaben möchten wir wissen, wie sicher wir uns über das Ergebnis sind. Zu wissen, wie sehr wir einem Ergebnis vertrauen können, hilft uns, bessere Entscheidungen zu treffen.
Sobald wir den Grad der mit einem Ergebnis verbundenen Unsicherheit quantifiziert haben, können wir ihn für Folgendes verwenden:
- Szenarioplanung zur Bewertung eines Greatest-Case- und Worst-Case-Szenarios
- Risikobewertung zur Bewertung der Auswirkungen auf Entscheidungen
- Modellbewertung zum Vergleich verschiedener Modelle und Modellleistung
- Kommunikation mit Entscheidungsträgern darüber, wie sehr sie den Ergebnissen vertrauen sollten
Woher kommt die Unsicherheit?
Schauen wir uns ein einfaches Beispiel an. Wir wollen den durchschnittlichen Preis eines 300-Quadratmeter-Hauses in Deutschland schätzen. Es ist nicht sinnvoll, die Daten für alle 300-Quadratmeter-Häuser zu erheben. Stattdessen berechnen wir den Durchschnittspreis anhand einer repräsentativen Teilmenge.