Die Retrieval-Augmented Technology (RAG)-Technologie wurde quick sofort zum Normal in intelligenten Anwendungen. Dies battle ein Ergebnis des sich schnell entwickelnden Bereichs der künstlichen Intelligenz, der große Sprachmodelle und externe Wissensdatenbanken mit verschiedenen Echtzeit-Zugriffsmethoden kombinierte. Die RAG-Implementierung der herkömmlichen Artwork bringt große Schwierigkeiten mit sich: komplexe Vektordatenbank-Setups, komplizierte Einbettungspfade, Orchestrierung der Infrastruktur und die Notwendigkeit, die DevOps-Spezialisten hinzuzuziehen.

Hier sind einige der Hauptnachteile der traditionellen Entwicklung von RAG:

  • Die Einrichtung und Konfiguration der Infrastruktur kann Wochen dauern.
  • Vektordatenbanklösungen können äußerst kostspielig sein.
  • Es besteht ein Bedarf an der Integration mehrerer Instruments, was zu Komplexität führt.
  • Entwickler werden mit einer steilen Lernkurve konfrontiert sein.
  • Bei der Produktionsbereitstellung treten Herausforderungen auf.

Radikal neue RAG-Entwicklungstechnik NyRAG, ein bedeutender Fortschritt in RAG-Entwicklung Jetzt wird eine Lösung vorgestellt, die den gesamten Prozess in einen einfachen, konfigurationsgesteuerten Workflow vereinfacht. Unabhängig davon, ob Sie KI-gestützte Kundensupport-Bots, interne Wissensmanagementsysteme oder semantische Suchmaschinen erstellen, wird NyRAG Ihren Weg von der Idee bis zur Produktion beschleunigen.

Was ist NyRAG?

NyRAG ist ein Python-basiertes Open-Supply-Framework, das die Entwicklung von neu definiert Retrieval-Augmented Technology (LAPPEN). Dadurch entfällt die Final einer komplizierten Infrastruktureinrichtung und Sie können im Handumdrehen intelligente Chatbots und semantische Suchsysteme einführen. Manchmal sogar innerhalb weniger Minuten.

Hauptmerkmale von NyRAG

  • Konfigurationstechnik ohne Code
  • Internet-Crawling + Dokumentenverarbeitung
  • Lokale Docker- oder Vespa-Cloud-Bereitstellung
  • Integrierte Chat-Schnittstelle
  • Hybridsuche mit Vespa-Motor

So funktioniert NyRAG: Die 5-stufige Pipeline

Stufe 1: Abfrageverbesserung

Zunächst erstellt ein KI-Modell basierend auf Ihrer Frage mehrere verschiedene Suchvorgänge, um die Suchabdeckung zu verbessern.

Stufe 2: Einbettungsgenerierung

Anschließend werden die Abfragen mithilfe von SentenceTransformer-Modellen in Vektoreinbettungen umgewandelt.

Danach führt das System die Suche nach dem nächsten Nachbarn für die indizierten Blöcke durch.

Stufe 4: Chunk-Fusion

Folglich werden die Ausgaben kombiniert, dedupliziert und entsprechend ihrer Relevanzbewertung eingestuft.

Stufe 5: Antwortgenerierung

Abschließend werden die führenden Chunks an ein KI-Modell (über OpenRouter) übertragen, um begründete Antworten zu liefern.

Erste Schritte mit NyRAG

Die Voraussetzungen für NyRAG sind:

  • Python mit Model 3.10 oder höher
  • Docker Desktop (wenn Sie im lokalen Modus arbeiten)
  • Ein OpenRouter-API-Schlüssel

Die Befehle zur Set up von NyRAG sind:

pip set up nyrag
  • Verwendung des UV-Befehls (empfohlen)
uv pip set up -U nyrag

Versuchen wir nun, die beiden Modi von NyRAG zu verstehen, nämlich Internet-Crawling und Dokumentenverarbeitung.

Internet-Crawling-Modus

  • Ehrungen robots.txt
  • Subdomains standardmäßig enthalten
  • URL-Ausschlusslisten
  • Benutzeragenten sind anpassbar (Chrome, Firefox, Safari, Cellular)

Dokumentenverarbeitungsmodus

  • Speichert PDF, DOCX, TXT, Markdown
  • Rekursives Scannen von Ordnern
  • Filterung basierend auf Dateigröße und -typ
  • Möglichkeiten zur Verwaltung komplexer Dokumentarchitekturen

Praktische Aufgabe 1: Webbasierte Wissensdatenbank

In dieser Aufgabe erstellen wir eine Chatbot Das wird unsere Fragen anhand der Dokumentation von der Unternehmenswebsite beantworten.

Schritt 1: Einrichten der Umgebung

Befolgen Sie die folgenden Befehle, um die Umgebung für Ihr lokales System einzurichten

mkdir nyrag-website-demo
cd nyrag-website-demo
uv venv
supply .venv/bin/activate
uv pip set up -U nyrag
Umfeld

Schritt 2: Konfiguration erstellen

Mithilfe der Datei „company_docs_config.yml“ definieren wir die Konfigurationen:

title: company_knowledge_base  

mode: internet  

start_loc: https://docs.yourcompany.com/  

exclude:  

- https://docs.yourcompany.com/api-changelog/*  

- https://docs.yourcompany.com/legacy/*  

crawl_params:  

respect_robots_txt: true  

follow_subdomains: true  

aggressive_crawl: false  

user_agent_type: chrome  

rag_params:  

embedding_model: sentence-transformers/all-MiniLM-L6-v2  

embedding_dim: 384  

chunk_size: 1024  

chunk_overlap: 100

Schritt 3: Crawlen und Indexieren

Mit den folgenden Befehlen crawlen wir die Web site, extrahieren den Textinhalt, teilen ihn in Blöcke auf und generieren die Einbettungen, die dann in Vespa indiziert werden.

export NYRAG_LOCAL=1
nyrag --config company_docs_config.yml
Crawlen und Indexieren

Schritt 4: Chat-Schnittstelle starten

Verwenden Sie nun die Befehle und starten Sie die Chat-Oberfläche.

export NYRAG_CONFIG=company_docs_config.yml
export OPENROUTER_API_KEY=your-api-key
export OPENROUTER_MODEL=anthropic/claude-sonnet-4

uvicorn nyrag.api:app –host 0.0.0.0 –port 8000

Schritt 5: Testen Sie Ihren Bot

Sie können die folgenden Abfragen ausprobieren:

„Wie authentifiziere ich API-Anfragen?“

NyRAG

„Was sind die Tarifgrenzen?“

NyRAG

„Erklären Sie den Webhook-Konfigurationsprozess.“

NyRAG

Vergleich mit anderen Frameworks

Vergleichen wir NyRAG mit anderen Frameworks, um herauszufinden, wofür es am besten geeignet ist:

Rahmen Vorteile Nachteile Am besten für
NyRAG Zero-Code, integrierte Pipeline Weniger versatile Architektur Schnelle Bereitstellung
LangChain Hochgradig anpassbar Erfordert Codierung Komplexe Arbeitsabläufe
LamaIndex Tolle Dokumentation Manuelle DB-Einrichtung Benutzerdefinierte Integrationen
Heuhaufen Modularer Aufbau Steilere Lernkurve Unternehmens-Apps

Anwendungsfälle von NyRAG

  1. Kundensupport-Chatbots: Es wird verwendet, um sofortige und möglichst genaue Antworten zu erhalten. Es trägt auch dazu bei, die Anzahl der Help-Tickets zu senken.
  2. Internes Wissensmanagement: Es ermöglicht eine schnellere und reibungslosere Einführung neuer Mitarbeiter und bietet eine Möglichkeit, Informationen über Mitarbeiter verschiedener Abteilungen zu erhalten.
  3. Wissenschaftliche Mitarbeiter: Es hilft Forschern bei der Recherche von Dokumenten, beim Gewinnen von Erkenntnissen aus ihnen und beim Stellen von Fragen zur wissenschaftlichen Literatur, indem es prägnante Darstellungen umfangreicher Texte liefert.
  4. Suche nach Codedokumentation: Es erhöht die Gesamtproduktivität von Entwicklern, da sowohl virtuelle Leitfäden als auch API-Dokumente indiziert werden.

Abschluss

Die Trennung zwischen Idee und produktionsreifen RAG-Anwendungen ist sehr dünn geworden. Durch die Verwendung von NyRAG integrieren Sie nicht einfach eine Bibliothek; Sie erhalten eine vollständige RAG-Entwicklungsplattform, die standardmäßig Crawling-, Einbettungs-, Indizierungs-, Abruf- und Chat-Schnittstellen verwaltet.

Ob Sie Ihr erstes machen KI-Anwendung Ob Sie Ihr Hundertstel skalieren, NyRAG ist der Anbieter der Erfolgsgrundlage. Die Frage ist nicht, ob die RAG Ihren Antrag ändern wird. Es kommt vielmehr darauf an, wie schnell Sie es einrichten können.

Gen AI-Praktikant bei Analytics Vidhya
Abteilung für Informatik, Vellore Institute of Expertise, Vellore, Indien

Derzeit arbeite ich als Gen AI-Praktikant bei Analytics Vidhya, wo ich zu innovativen KI-gesteuerten Lösungen beitrage, die Unternehmen in die Lage versetzen, Daten effektiv zu nutzen. Als Informatikstudent im Abschlussjahr am Vellore Institute of Expertise bringe ich solide Grundlagen in Softwareentwicklung, Datenanalyse und maschinellem Lernen in meine Rolle ein.

Kontaktieren Sie mich gerne unter (e mail protected)

Melden Sie sich an, um weiterzulesen und von Experten kuratierte Inhalte zu genießen.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert