Datenwissenschaftler sind in der Entscheidungsfindung tätig. Unsere Arbeit konzentriert sich darauf, wie man unter Unsicherheit fundierte Entscheidungen treffen kann.
Und doch stützen wir uns bei der Quantifizierung dieser Unsicherheit oft auf die Idee der „statistischen Signifikanz“ – ein Instrument, das bestenfalls ein oberflächliches Verständnis vermittelt.
In diesem Artikel untersuchen wir, warum die „statistische Signifikanz“ fehlerhaft ist: willkürliche Schwellenwerte, ein falsches Gefühl der Gewissheit und das Versäumnis, auf reale Kompromisse einzugehen.
Am wichtigsten ist, dass wir lernen, wie wir über die binäre Denkweise von signifikant vs. nicht signifikant hinausgehen und einen Entscheidungsrahmen übernehmen, der auf wirtschaftlichen Auswirkungen und Risikomanagement basiert.
Stellen Sie sich vor, wir führen gerade einen A/B-Take a look at durch, um eine neue Funktion zu evaluieren, die darauf abzielt, die Zeit, die Benutzer auf unserer Web site verbringen – und damit auch ihre Ausgaben – zu steigern.
Die Kontrollgruppe bestand aus 5.000 Anwendern und die Behandlungsgruppe umfasste weitere 5.000 Anwender. Dies gibt uns zwei Arrays mit dem Namen therapy
Und management
Jeder von ihnen enthält 5.000 Werte, die die Ausgaben einzelner Benutzer in ihren jeweiligen Gruppen darstellen.