Bild vom Herausgeber | Ideogramm
Bei der Zeitreihenanalyse werden im Laufe der Zeit gesammelte Datenpunkte untersucht. Sie hilft dabei, Tendencies und Muster zu erkennen. Diese Analyse ist in den Bereichen Wirtschaft, Finanzen und Umweltwissenschaften nützlich. R ist aufgrund seiner leistungsstarken Pakete und Funktionen ein beliebtes Device zur Durchführung von Zeitreihenanalysen. In diesem Aufsatz werden wir untersuchen, wie man mit R eine Zeitreihenanalyse durchführt.
Unsere High 5 der kostenlosen Kursempfehlungen
1. Google Cybersecurity-Zertifikat – Begeben Sie sich auf die Überholspur zu einer Karriere in der Cybersicherheit.
2. Natürliche Sprachverarbeitung in TensorFlow – Erstellen Sie NLP-Systeme
3. Python für alle – Entwickeln Sie Programme zum Sammeln, Bereinigen, Analysieren und Visualisieren von Daten
4. Google IT Assist Skilled-Zertifikat
5. AWS Cloud-Lösungsarchitekt – Berufszertifikat
Bibliotheken laden
Der erste Schritt bei der Zeitreihenanalyse in R besteht darin, die erforderlichen Bibliotheken zu laden. ‚Vorhersage‘ Bibliothek bietet Funktionen für die Zeitreihenprognose. Die ‚tseries‘ Die Bibliothek bietet statistische Checks und Instruments zur Zeitreihenanalyse.
library(forecast)
library(tseries)
Zeitreihendaten importieren
Importieren Sie die Zeitreihendaten aus einer CSV-Datei in R. In diesem Beispiel verwenden wir einen Datensatz für die Finanzanalyse. Er verfolgt die Preisbewegungen im Laufe der Zeit.
knowledge <- learn.csv ("timeseries.csv", header = TRUE)
head(knowledge)
Erstellen eines Zeitreihenobjekts
Konvertieren Sie die Daten in ein Zeitreihenobjekt mit dem ‚ts‘ Funktion. Diese Funktion konvertiert Ihre Daten in ein Zeitreihenformat.
ts_data <- ts(knowledge$Worth)
Zeichnen Sie die Zeitreihe
Visualisieren Sie die Zeitreihendaten. Dies hilft dabei, Tendencies, Saisonalität und Anomalien zu erkennen. Tendencies zeigen langfristige Anstiege oder Abnahmen der Daten. Saisonalität zeigt regelmäßige Muster, die sich in festen Abständen wiederholen. Anomalien heben ungewöhnliche Werte hervor, die vom normalen Muster abweichen.
ARIMA-Modell
Das ARIMA-Modell wird zur Prognose von Zeitreihendaten verwendet. Es kombiniert drei Komponenten: Autoregression (AR), Differenzierung (I) und gleitender Durchschnitt (MA). Das ‚auto.arima‘ Die Funktion wählt automatisch das beste ARIMA-Modell basierend auf den Daten aus.
match <- auto.arima(ts_data)
Autokorrelationsfunktion (ACF)
Die Autokorrelationsfunktion (ACF) misst, wie eine Zeitreihe mit ihren vergangenen Werten korreliert. Sie hilft dabei, Muster und Verzögerungen in den Daten zu erkennen. Sie zeigt diese Korrelationen bei unterschiedlichen Zeitverzögerungen. Das ACF-Diagramm hilft dabei, die Reihenfolge des gleitenden Durchschnitts (MA) zu bestimmen (‚Q‘).
Partielle Autokorrelationsfunktion (PACF)
Die partielle Autokorrelationsfunktion (PACF) misst die Korrelation einer Zeitreihe mit ihren vergangenen Werten. Sie schließt die Auswirkungen dazwischenliegender Verzögerungen aus. Sie hilft dabei, die Stärke direkter Beziehungen bei unterschiedlichen Verzögerungen zu ermitteln. Das PACF-Diagramm zeigt diese Korrelationen für verschiedene Zeitverzögerungen. Das PACF-Diagramm hilft dabei, die autoregressive (AR) Ordnung zu ermitteln (‚P‘).
Ljung-Field-Take a look at
Der Ljung-Field-Take a look at prüft die Residuen eines Zeitreihenmodells auf Autokorrelation. Er prüft, ob die Residuen zufällig sind. Er prüft die Autokorrelation bei mehreren Verzögerungen. Ein niedriger p-Wert deutet auf eine signifikante Autokorrelation hin. Dies bedeutet, dass das Modell möglicherweise nicht intestine passt.
Field.check(match$residuals, lag = 20, sort = "Ljung-Field")
Residuenanalyse
Die Residuenanalyse untersucht die Unterschiede zwischen den beobachteten und den vorhergesagten Werten eines Zeitreihenmodells. Sie hilft zu prüfen, ob das Modell intestine zu den Daten passt.
plot (match$residuals, essential="Residuals of ARIMA Mannequin", ylab="Residuals")
abline(h=0, col="pink")
Prognosen
Bei der Prognose geht es darum, zukünftige Werte auf Foundation historischer Daten vorherzusagen. Verwenden Sie die ‚Vorhersage‘ um diese Vorhersagen zu erstellen.
forecast_result <- forecast (match)
Visualisierung von Prognosen
Visualisieren Sie prognostizierte Werte mit historischen Daten, um sie zu vergleichen. ‚Automatisches Plotten‘ Funktion hilft beim Erstellen dieser Visualisierungen.
autoplot(forecast_result)
Modellgenauigkeit
Bewerten Sie die Genauigkeit des angepassten Modells mit dem ‚Genauigkeit‘ Funktion. Sie bietet Leistungsmesswerte wie den mittleren absoluten Fehler (MAE) und den mittleren quadratischen Fehler (RMSE).
Einpacken
Die Zeitreihenanalyse in R beginnt mit dem Laden von Daten und dem Erstellen von Zeitreihenobjekten. Führen Sie als Nächstes eine explorative Analyse durch, um Tendencies und Muster zu erkennen. Passen Sie ARIMA-Modelle an, um zukünftige Werte vorherzusagen. Diagnostizieren Sie die Modelle und visualisieren Sie die Ergebnisse. Dieser Prozess hilft dabei, fundierte Entscheidungen anhand historischer Daten zu treffen.
Jayita Gulati ist eine Enthusiastin für maschinelles Lernen und technische Autorin, die von ihrer Leidenschaft für die Erstellung von Modellen für maschinelles Lernen angetrieben wird. Sie hat einen Grasp-Abschluss in Informatik von der Universität Liverpool.