Erstellen einer RAG-API mit FastAPI

Erstellen Sie GenAI-Systeme und möchten diese bereitstellen, oder möchten Sie einfach mehr über FastAPI erfahren? Dann ist dies genau das, was Sie gesucht haben! Stellen Sie sich vor, Sie haben viele PDF-Berichte und möchten darin nach bestimmten Antworten suchen. Entweder könnten Sie stundenlang scrollen oder Sie könnten ein System aufbauen, das sie für Sie liest und Ihre Fragen beantwortet. Wir bauen ein RAG-System die über eine API mithilfe von FastAPI bereitgestellt und darauf zugegriffen wird. Lassen Sie uns additionally ohne weitere Umschweife eintauchen.

Was ist FastAPI?

FastAPI ist ein Python-Framework zum Erstellen von API(s). Mit FastAPI können wir HTTP-Methoden verwenden, um mit dem Server zu kommunizieren.

Eine seiner nützlichen Funktionen besteht darin, dass automatisch eine Dokumentation für Ihre von Ihnen erstellten APIs generiert wird. Nachdem Sie Ihren Code geschrieben und die APIs erstellt haben, können Sie eine URL besuchen und die Schnittstelle (Swagger UI) nutzen, um Ihre Endpunkte zu testen, ohne dass Sie das Frontend programmieren müssen.

REST-APIs verstehen

Eine REST-API ist eine Schnittstelle, die die Kommunikation zwischen Shopper und Server herstellt. REST API ist die Abkürzung für Representational State Switch API. Der Shopper kann HTTP-Anfragen an einen bestimmten API-Endpunkt senden und der Server verarbeitet diese Anfragen. Es gibt einige HTTP-Methoden gegenwärtig. Einige davon werden wir in unserem Projekt mithilfe von FastAPI implementieren.

HTTP-Methoden:

In unserem Projekt werden wir zwei Kommunikationsmethoden verwenden:

ERHALTEN: Dies wird zum Abrufen von Informationen verwendet. Wir werden die GET-Anfrage /well being verwenden, um zu überprüfen, ob der Server läuft.
POST: Dies wird verwendet, um Daten an den Server zu senden, um etwas zu erstellen oder zu verarbeiten. Wir werden /ingest- und /query-POST-Anfragen verwenden. Wir verwenden hier POST, weil dabei komplexe Daten wie Dateien usw. gesendet werden müssen JSON Objekte. Mehr dazu im Abschnitt Umsetzung.

Was ist RAG?

Retrieval-Augmented Technology (RAG) ist eine Möglichkeit, einem LLM Zugriff auf spezifisches Wissen zu gewähren, für das er ursprünglich nicht ausgebildet wurde.

RAG-Komponenten:

Abruf: Auf der Grundlage der Abfrage relevante Sätze aus dem/den Dokument(en) finden.
Technology: Übergabe dieser Sätze an ein LLM, damit dieses sie zu einer Antwort zusammenfassen kann.

Erfahren Sie mehr über die RAG im kommenden Abschnitt zur Implementierung.

Durchführung

Problemstellung: Erstellen eines Techniques, das es Benutzern ermöglicht, Dokumente hochzuladen, insbesondere TXT-Dateien oder PDFs. Anschließend indiziert es sie in einer durchsuchbaren Datenbank und stellt sicher, dass ein LLM Fragen zu den neuen Daten beantworten kann. Dieses System wird über API-Endpunkte bereitgestellt und verwendet, die wir über FastAPI erstellen.

Voraussetzungen

– Wir benötigen einen OpenAI-API-Schlüssel und verwenden das gpt-4.1-mini-Modell als Gehirn des Techniques. Sie können den API-Schlüssel über den Hyperlink erhalten: (https://platform.openai.com/settings/group/api-keys)

– Eine IDE zum Ausführen der Python-Skripte, ich verwende VSCode für die Demo. Erstellen Sie ein neues Projekt (Ordner).

– Erstellen Sie eine .env-Datei in Ihrem Projekt und fügen Sie Ihren OpenAI-Schlüssel genau wie folgt hinzu:

OPENAI_API_KEY=sk-proj...

– Erstellen Sie eine virtuelle Umgebung für dieses Projekt (um die Abhängigkeiten des Projekts zu isolieren).

Notiz:

Stellen Sie sicher, dass die fast_env in Ihrem Projekt erstellt wird, da Pfadfehler auftreten können, wenn das Arbeitsverzeichnis nicht auf das Projektverzeichnis festgelegt ist.
Nach der Aktivierung sind alle von Ihnen installierten Pakete in dieser Umgebung enthalten.

– Laden Sie den folgenden Weblog über das „Obtain-Image“ als PDF herunter, um ihn in unserem RAG-System zu verwenden:

Was ist FastAPI?

REST-APIs verstehen

Was ist RAG?

Durchführung

Voraussetzungen

Anforderungen

Implementierungsansatz

1. Die Aufnahmepipeline (/ingest)

2. Die Abfragepipeline (/question)

Python-Code

rag_pipeline.py:

Importe

Konfiguration

Initialisierungen und Definition der Funktionen

Definieren des Retrievers und Turbines

Importe

Konfiguration

/ingest API (Um das Dokument vom Benutzer zu übernehmen)

/question API (Um die RAG-Pipeline auszuführen)

Ausführen der App

Testen beider APIs

2. /query-API:

HTTP-Statuscodes verstehen

Statuscode-Kategorien:

Abschluss

Häufig gestellte Fragen

Melden Sie sich an, um weiterzulesen und von Experten kuratierte Inhalte zu genießen.

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt