22.02.2021
Erhalten Sie Twitter-Daten mit R und Tableau

Während der diesjährigen Tableau-Konferenz 2020 habe ich eine Visualisierung mit dem Titel veröffentlicht #DATA20 PRO MINUTE wo ich minutenweise gezählte Tweets mit dem Hashtag #data20 visualisiert habe. Dazu habe ich R verwendet, um die Daten von Twitter zu sammeln. Ich dachte, andere könnten dies nützlich finden, um ihre eigenen Tweets, Hashtags oder andere Personen und Themen zu verfolgen. Deshalb finden Sie hier einen kurzen Weblog-Beitrag darüber, wie Sie diese Daten abrufen und in Tableau integrieren können.

Initiieren Sie den Code

Um diesen Code verwenden zu können, benötigen Sie ein Twitter-Deal with Richten Sie hier eine Twitter-Entwickler-App (kostenlos) ein. Nachdem Sie eine App erstellt haben, erhalten Sie einen API-Schlüssel, einen API-Geheimschlüssel und ein Bearer-Token. Wir benötigen diese drei, um den Code auszuführen, der die Daten herunterlädt. Hinweis: Scrollen Sie zum Ende dieses Blogbeitrags, wenn Sie den gesamten Code auf einmal kopieren und einfügen möchten.

Hinweis: Ersetzen Sie im obigen R-Code das Consumer_key, Consumer_secretUnd bearer_token mit Ihrem eigenen in Anführungszeichen (ohne Klammern). Jede an Twitter gesendete Anfrage muss ein Token enthalten, daher sollten Sie es als Umgebungsvariable speichern.

Holen Sie sich den Hashtag #data20

Nach dem Einrichten der Startcodes besteht der nächste Schritt darin, den Code zum Sammeln der Daten festzulegen. Der folgende Beispielcode durchsucht Tweets nach dem Hashtag #data20 und 25.000 Ergebnisse zurückgeben, ohne Retweets.

Nachdem die Daten erfasst wurden, schreibt das nächste Codebit die Daten in eine CSV-Datei. Ersetzen Sie den Pfad und Dateinamen unten durch den gewünschten Speicherort.



Die endgültige Ausgabe besteht aus zwei CSV-Dateien, eine mit den Tweets und die andere Standortdatei mit den Benutzerinformationen. Sie können eine Beziehung (Nudel) erstellen oder sie in Tableau über das Feld zusammenfügen Benutzer-ID.

Lesen Sie Twitter-Standing-IDs und suchen Sie nach Tweets

Ein weiteres nützliches Software ist das Nachschlagen bestimmter Twitter-Standing-IDs und der Tweets. Ich habe diese Technik beispielsweise letztes Jahr verwendet, um die Aktivität meiner Tableau-Tipps zu verfolgen. Ich habe 194 Tipps veröffentlicht und wollte sehen, welche Tipps am Ende des Jahres am beliebtesten sind. Dazu habe ich ein Google Sheet verwendet, das eine Liste aller Tweets enthielt, insbesondere die Tweet-Standing-ID.

Im folgenden R-Code lese ich diese Standing-IDs aus einem Google Sheet in R ein und schlage dann jede einzelne nach, um die Informationen zu jedem Tweet zu sammeln. In diesem Fall befindet sich die Standing-ID am Ende der URL, sodass es eine Codezeile gibt, die die Status_ID aus dem URL-Hyperlink analysiert. Wenn Sie eine einfache Liste nur der Standing-IDs hätten, die Sie verfolgen möchten, müssten Sie diese nicht aus der URL analysieren.

Das rtweet-Paket in R

Im rtweet-Paket sind eine Reihe weiterer Instruments verfügbar. Sie können beispielsweise Follower, Erwähnungen, Favoriten und Timelines eines Benutzers abrufen. Sie können Mitglieder oder Abonnenten einer Liste herunterladen. Sie können die von Ihnen gesendeten oder empfangenen Direktnachrichten abrufen. Sie können Developments auf Twitter weltweit herunterladen, indem Sie einen Stadtnamen oder sogar einen Längen- und Breitengrad verwenden. Weitere Informationen und Beispielcode für einige dieser anderen Dinge finden Sie hier Die Dokumentation zum RTweet-Paket finden Sie hier.

Nachfolgend finden Sie den gesamten für dieses Projekt verwendeten Code als Kurzreferenz zum Kopieren und Einfügen.

Ich hoffe, dass Sie diese Informationen nützlich finden. Wenn Sie Fragen haben, schreiben Sie mir gerne eine E-Mail an Jeff@DataPlusScience.com

Jeffrey A. Shaffer

Auf Twitter folgen @HighVizAbility



Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert