Unstrukturierte Daten sind überall, und wenn Sie Datenwissenschaftler, Analyst oder Ingenieur sind, haben Sie sich wahrscheinlich mit Textdaten befasst, die Sie durch Stimmung klassifizieren möchten. Zu den gemeinsamen Quellen solcher Daten gehören Produktbewertungen, E -Mails, Anruf -Transkripte oder CRM -Notizen. Es kann schwierig sein, diesen Sinn zu machen, aber oft braucht man nur den Gesamtton: intestine, schlecht, glücklich, frustriert. Erkennung von Gefühlen Lassen Sie Sie Datensätze schnell filtern oder allgemeine Tendencies erstellen.

In diesem Leitfaden werden wir Produktüberprüfungsdaten untersuchen und große Sprachmodelle (LLMs) für die Stimmungsanalyse verwenden. Wir werden dann die Ergebnisse über eine interaktive App oder einen automatisierten Workflow weitergeben.

Lernziele

Ziel dieses Leitfadens ist es, zu lernen, wie eine Mischung aus LLMs und Python verwendet wird, um eine Reihe einfacher englischer Bewertungen innerhalb eines strukturierten Datensatzes zu kategorisieren. Wir werden nicht nur die Überprüfungen kategorisieren, sondern wir werden auch die Gefühle analysieren, um die allgemeine Stimmung nach Produktkategorie zu verstehen. Wir werden auch lernen, unsere Ergebnisse als interaktive Daten -App und automatisierte Synchronisierung an Google -Blätter weiterzugeben.

Erforschen Sie Ihre Daten mit SQL, Python und AI

In diesem Workflow werden wir zunächst die Daten sammeln und vorbereiten und dann ausführen Explorationsdatenanalyse (EDA) Vor der Analyse der Stimmungsanalyse. Wir werden Fabi.ai verwenden, eine KI-native BI-Plattform mit einem integrierten KI-Datenanalyst.

Vorbereitung Ihrer Daten

Der erste Schritt bei jeder Analyse ist das Sammeln und Vorbereiten Ihrer Daten. Wir werden Textdaten in einer strukturierten Tabelle verwenden. Mit Fabi können Sie eine Verbindung zu vielen Quellen herstellen: Lager, Dateien oder Google -Blätter. Für diesen Leitfaden ziehen wir aus einem öffentlichen Google -Blatt, aber Sie können jede Quelle verwenden.

Fügen Sie zunächst eine Google Sheets-Zelle in einem neuen Smartbook hinzu (ein AI-nativer Python-Notizbuch).

Fabi.ai

Suchen Sie nach dem Zugriff auf Ihr Google -Laufwerk auf Fabi, um die Datei mit Ihren Daten zu suchen. In diesem Fall verwenden wir einen öffentlich verfügbaren Datensatz, sodass wir die Google Sheet Pull -Zelle (öffentliche URL) verwenden, für die keine Authentifizierung erforderlich ist.

Kopieren Sie die Blatt -URL in der Zelle und geben Sie Ihrem Ausgang Python DataFrame einen Namen (z. B. „product_review_data“). Nach dem Ausführen dieser Zelle werden die Daten in Fabi als Python -Datenframe gespeichert, mit dem Sie jetzt KI analysieren können.

Fabi.ai -Sentiment -Datenanalyse

Erste explorative Datenanalyse und Datenreinigung

Vor Beginn der Sentimentanalyse müssen wir bestätigen, dass die Daten sauber sind. Ich fragte die KI: „Was sind einige potenzielle Probleme mit den Daten?“ und es markierte sofort zwei:

  • Inkonsistente Staatsformate („NY“ gegen „New York“)
  • Inkonsistente Kategoriennamen („Hut“ gegen „Hüte“)

Diese Artwork von Problemen sind in realen Daten häufig. KI erleichtert es einfach, solche Probleme schnell zu ermitteln, bevor sie mit der Analyse fortfahren.

Fabi.ai -Sentiment -Datenanalyse

KI kann nicht nur potenzielle Probleme erkennen, sondern auch dazu beitragen, sie anzugehen. Bitten wir die KI, diese Probleme für uns zu beheben: „Bitte räumen Sie die Daten anhand dieser Erkenntnisse auf.“

Fabi.ai

Die KI generiert entweder SQL- oder Python -Code, um alle festgestellten Probleme anzugehen. Wenn Sie den Fabi AI Analyst Agent im manuellen Modus ausführen (im Gegensatz zum automatischen Akzeptierenmodus), werden Sie aufgefordert, die AI-Vorschläge zu akzeptieren oder abzulehnen.

In diesem Fall akzeptieren wir die KI -Vorschläge, die die richtigen hinzufügen Python Zelle zu Ihrem Smartbook.

Fabi.ai

Wir haben jetzt einen neuen Python -Datenrahmen namens „Cleaned_data“.

In diesem Stadium ist es auch intestine, die Daten manuell zu inspizieren und sicherzustellen, dass die KI keine anderen potenziellen Probleme verpasst hat. Und wenn die KI Probleme verpasst hat, können Sie sie bitten, das Reinigungsskript zu aktualisieren, um diese zu berücksichtigen.

Stimmungsanalyse

Mit sauberen Produktüberprüfungsdaten können wir die Sentiment -Analyse starten, indem wir ein Feld „Review_Sentiment“ hinzufügen, um jede Bewertung als positiv, negativ oder impartial zu klassifizieren. Großsprachige Modelle mit Python sind dafür supreme.

Fügen Sie eine AI -Anreicherungszelle unter Ihrem Reinigungsschritt hinzu. Diese Zellen nehmen einen Datenrahmen, ein Feld und eine Eingabeaufforderung an und geben dann den DataFrame mit einer neuen Spalte basierend auf der Eingabeaufforderung zurück.

Verwenden Sie hier „Cleaned_data“ mit dem Feld „Evaluation“ und geben Sie „Cleaned_Data_Categorized“ mit „Review_Sentiment“ aus. Eingabeaufforderung: Kategorisieren Sie die Produktüberprüfung als positiv, negativ oder impartial. Wechseln Sie von der Vorschau zum Ausführen und Ausführen.

Fabi.ai -Sentiment -Datenanalyse

Nachdem Sie diese AI -Anreicherungszelle ausgeführt haben, haben Sie Ihren neuen Datenrahmen, der ein neues Feld enthält, das die Stimmungskategorie für jede Überprüfung enthält. Dies ist jetzt bequem so formatiert, dass Sie die Daten strukturierter analysieren können. Bitten wir die KI, den Prozentsatz der Bewertungen in jeder Kategorie als 100% iger Balkendiagramm zu zeichnen.

Fabi.ai -Sentiment -Datenanalyse

Wir bemerken sofort ein paar Dinge:

  • Denims und Badebekleidung haben die negativsten Bewertungen als Anteil aller Bewertungen
  • Schuhe haben die positivsten Bewertungen als Anteil aller Bewertungen

Als Vermarkter oder Produktbesitzer, der mit diesen Informationen ausgestattet ist, kann ich nun in unsere Jean- und Badebekleidung eingraben, um zu verstehen, woher die Unzufriedenheit stammt, und mit dem Vertriebs- und Marketingteam sprechen, um herauszufinden, wie die positiven Bewertungen für Schuhe oder das Doppelte auf dieser Produktlinie profitieren können.

Teilen Sie Ihre Arbeit

Ihre Datenanalyse ist nur so intestine wie Ihre Fähigkeit, Ihre Ergebnisse mit Ihren Mitarbeitern zu teilen. Es ist jetzt an der Zeit, Ihre Arbeit in eine Daten -App oder eine Tabelle zu verwandeln, die Sie teilen können. Wir zeigen Ihnen, wie Sie beide Ansätze verfolgen.

Verwandeln Sie Ihr Fabi -Notizbuch in eine Daten -App

Wenn Sie Ihre Analyse als interaktive Daten-App weitergeben möchten, klicken Sie einfach auf die Schaltfläche „Veröffentlichen“ in der oberen rechten Ecke (In dieser Anleitung werden wir nicht berühren, wie Sie Eingaben oder Filter zu Ihrer Daten-App hinzufügen, aber Sie können dies in wenigen Minuten problemlos tun). In diesem Staging -Bereich können Sie Tabellen und Diagramme verbergen, verschieben und ändern.

Fabi.ai -Sentiment -Datenanalyse

Sobald Ihre Daten -App so aussieht, wie Sie sie möchten, können Sie sie planen, um sie zu einer beliebigen Trittfrequenz zu aktualisieren. Sobald Sie bereit sind, stay zu gehen, klicken Sie auf „Beenden und anzeigen Bericht“. Von hier aus können Sie jeden Mitarbeiter oder Ihre gesamte Organisation mit der Funktionalität „Freigabe“ auf diesen Bericht zugreifen.

Synchronisieren Sie Ihre Analyse mit Google Sheets

Wenn Sie diese angereicherten Daten lieber mit einem anderen Ziel synchronisieren möchten, aus dem Ihre Stakeholder gerne arbeiten, wie z. Google -BlätterSie können eine Ausgangszelle hinzufügen. Fügen Sie ganz unten in Ihrem Smartbook ein „Google Sheets Push“ -Zelle hinzu und wählen Sie den Datenframe „Cleaned_Data_Categorized“ und das Google -Blatt, mit dem Sie die Daten synchronisieren möchten.

Fabi.ai -Sentiment -Datenanalyse

Key Takeaways

  • Datenquellen: Analysieren Sie Daten aus einem Lagerhaus, einer Datenbank, einem Google -Blatt oder einer lokalen CSV/Excel -Datei.
  • KI für EDA und Reinigung: Bitten Sie den AI -Analyst -Agenten von Fabi, Probleme zu erkennen und Ihre Daten zu reinigen.
  • Stimmungsanalyse: Verwenden Sie AI -Anreicherungszellen, um den Freeform -Textual content in einem Datenrahmen zu kategorisieren.
  • Python -Daten -Apps: Veröffentlichen Sie Ergebnisse als interaktive Dashboards, die Sie mit Kollegen teilen können.
  • Synchronisierung automatisieren: Übertragen Sie die verarbeiteten Überprüfungsdaten zur Zusammenarbeit auf Google Sheets zurück.

Abschluss

In diesem Handbuch untersuchten wir eine effiziente Möglichkeit, die Stimmungsanalyse mit AI und Python in der AI-nativen Datenanalyseplattform Fabi.ai durchzuführen. Sie haben gesehen, wie einfach es ist, Produktüberprüfungsdaten von Google Sheets zu ziehen, sie mit AI-generierten Python-Code über den AI-Analyst-Agenten von Fabi zu erkunden und zu reinigen, die Sentiment-Analyse mit einem LLM auszuführen und Ergebnisse als interaktive Python-App oder Google-Sheet zu teilen.

Technischer Inhaltsstratege und Kommunikator mit einem Jahrzehnt Erfahrung in der Erstellung und Vertrieb von Inhalten in den nationalen Medien, der Regierung von Indien und privaten Plattformen

Melden Sie sich an, um weiter zu lesen und Experten-Kuratinhalte zu genießen.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert