Bria AI ist ein generative KI Plattform für die Produktion professioneller visueller Inhalte, hauptsächlich für Unternehmen. Das im Jahr 2020 gegründete Unternehmen verfügt über die nötigen Instruments, darunter Textual content-zu-Bild-Generierung, Bearbeitung mit Inpainting, Hintergrundentfernung und mehr. Sie entwerfen ihre Modelle unter Berücksichtigung einer verantwortungsvollen KI-Nutzung und nutzen lizenzierte Daten, um Compliance und ethische Praktiken sicherzustellen. Sie gingen sogar eine Partnerschaft mit Getty Photographs ein, um die Produktion visueller Inhalte für Unternehmen mit KI-gesteuerten Instruments zu steigern. In diesem Artikel lernen wir, wie man mit Bria 2.3 einen KI-Bildgenerator erstellt.
Lernergebnisse
- Verstehen Sie die Fähigkeiten von Bria AI zur Automatisierung der Produktion hochwertiger visueller Inhalte in verschiedenen Branchen.
- Erfahren Sie, wie Sie die Funktionen von Bria AI nutzen können, z Textual content-zu-Bild-GenerierungHintergrundentfernung und Inpainting für mehr Kreativität.
- Entdecken Sie den ethischen Einsatz von KI bei der Erstellung visueller Inhalte und die Bedeutung lizenzierter Daten für den Betrieb von Bria AI.
- Entdecken Sie, wie das Modell Bria 2.3 die Geschwindigkeit und Qualität der Bilderzeugung verbessert und es für Anwendungen auf Unternehmensebene geeignet macht.
- Erhalten Sie Einblicke in die Integrationsmöglichkeiten für Bria AI, einschließlich API-Zugriff und Plattformen wie Hugging Face für Entwickler.
Dieser Artikel wurde im Rahmen der veröffentlicht Information Science-Blogathon.
Was ist Bria AI?
Bria AI ist eine unternehmensorientierte Plattform, die generative KI nutzt, um hochwertige visuelle Inhalte zu automatisieren. Angesichts der ständigen Nachfrage nach Bildern und Movies von Unternehmen und Kreativprofis hat Bria den Prozess optimiert, um hochwertige Inhalte in großem Maßstab zu produzieren. Im Mittelpunkt steht die Demokratisierung der Kreativität für große Unternehmen und kleine Startups gleichermaßen und macht sie einfach und zugänglich.
Was Bria auszeichnet, ist ihr sehr starkes Engagement für verantwortungsvolle KI. Sie trainieren ihre Modelle ausschließlich auf lizenzierten Daten und stellen sicher, dass alle Mitwirkenden für ihre Arbeit truthful entlohnt werden. Dieser Ansatz hält sie von Kontroversen im Zusammenhang mit bestimmten generativen KI-Systemen fern, die auf nicht lizenzierten oder urheberrechtlich geschützten Inhalten basieren.
Bria AI verfügt über unterschiedliche Instruments für jeden kreativen Bedarf. Es bietet äußerste Flexibilität in Bezug auf die Anpassung und ermöglicht es Benutzern, Bilder mithilfe von Texteingabeaufforderungen zu erstellen und zu ändern, Hintergründe auszutauschen und unerwünschte Elemente aus einem Bild zu entfernen – sogenanntes Inpainting. Bria AI bietet somit einen Mehrwert, indem es Unternehmen unterstützt, die stark auf Medien angewiesen sind.
Hauptmerkmale von Bria AI
Die Plattform von Bria AI bietet eine Fülle von Funktionen, die den kreativen Prozess für Unternehmen vereinfachen und verbessern. Zu den herausragenden Funktionen gehören:
- Textual content-zu-Bild-Generierung: Eine der Kernfunktionen von Bria ist die Textual content-zu-Bild-Generierung. Der Benutzer kann der KI eine Textbeschreibung zur Verfügung stellen, woraufhin diese ein entsprechendes Bild erstellt. Dies ist sehr hilfreich für Marketingteams oder für Content material-Ersteller, die bestimmte visuelle Elemente erstellen lassen möchten, aber weder die Zeit noch die Ressourcen haben, um individuelle Fotografien oder Designs in Auftrag zu geben.
- Hintergrundentfernung und -ersetzung: Brias KI kann Hintergründe präzise aus Bildern entfernen, wodurch es einfacher wird, Motive zu isolieren oder verschiedene Versionen desselben Bildes mit unterschiedlichen Hintergründen zu erstellen.
- Inpainting: Mit dieser Funktion können Sie vorhandene Bilder bearbeiten, indem Sie Teile eines Bildes mit einigen trivialen Informationen maskieren. Entfernen Sie unerwünschte Objekte oder lassen Sie Elemente im Bild besser aussehen, ohne die künstlerische Integrität einer Neuschöpfung zu beeinträchtigen.
- ControlNet: ControlNet ist eine leistungsstarke Funktion für Benutzer, die eine differenzierte Kontrolle über die Bilderzeugung benötigen. Sie ermöglicht es Benutzern, den Bilderzeugungsprozess zu steuern und der KI spezifischere Anweisungen zu geben.
Erkundung des Bria 2.3-Modells
Bria 2.3 ist das neueste von Bria AI veröffentlichte Modell und bringt einen bedeutenden Fortschritt in den Fähigkeiten der visuellen generativen KI. Bria 2.3 verfügt über eine Reihe von Funktionen, die eine höhere Qualität, detailliertere und schnellere Bilderzeugung ermöglichen. Die neuesten und wahrscheinlich coolsten Anwendungen von KI liegen in der Textual content-zu-Bild-Generierung, und Bria 2.3 glänzt hier. Egal, ob Sie Marketingmaterialien, Social-Media-Beiträge oder Produktbilder benötigen, mit Bria 2.3 können Sie ganz einfach individuelle Bilder erstellen, die auf Ihre Bedürfnisse zugeschnitten sind.
Anwendungsfälle für Bria AI und Bria 2.3
Bria AI bietet vielseitige Instruments und Modelle, einschließlich Bria 2.3, die Sie in verschiedenen Branchen und Szenarien anwenden können. Hier sind einige Beispiele dafür, wie Unternehmen und Fachleute die Technologie von Bria nutzen:
- Advertising and marketing und Werbung: Bria AI erstellt kampagnenorientierte, maßgeschneiderte Visuals für Marketingteams. In dieser Hinsicht können Groups mithilfe von Bildern, die auf der Grundlage von Textaufforderungen erstellt werden, einzigartige visuelle Elemente für Werbung, soziale Medien und E-Mail-Advertising and marketing erstellen.
- E-Commerce: Im On-line-Handel müssen Produktbilder von hoher Qualität sein; Bisher hat es mir die Verwendung von Bria 2.3 leicht gemacht, professionelle Bilder zu erstellen, Hintergründe zu entfernen oder zu ersetzen und, wo möglich, sogar mehrere Versionen von Produktbildern zu erstellen, um deren Verwendung zu verbessern.
So greifen Sie auf das Bria 2.3-Modell zu
- Offizielle Bria AI-Plattform: Bria stellt seine Instruments und Modelle auf seiner Plattform zur Verfügung. Sie können sich bei ihren Diensten anmelden, um über sie direkt auf deren Textual content-zu-Bild-Generierung, Hintergrundbearbeitung und andere Funktionen zuzugreifen Webseite.
- Umarmungsgesicht-Integration: Bria hat seine Modelle, darunter Bria 2.3, auf Hugging Face integriert, einer beliebten Plattform zum Teilen von KI-Modellen. Sie können mit diesen Modellen über ihre API oder direkt über die Benutzeroberfläche von Hugging Face interagieren und sie verwenden. Suchen Sie auf Hugging Face nach Bria-Modellen, indem Sie deren besuchen Modell-Hub und auf der Suche nach Beiträgen von Bria AI.
- API-Zugriff: Bria bietet Entwicklern Zugang für Anwendungsintegrationen oder Workflow-Integration über APIs. Sie bieten Dokumentation zur Verwendung ihrer APIs bei der Bildgenerierung, dem Entfernen des Hintergrunds von Bildern und dem Inpainting. Daher können sie problemlos in Web sites, Apps oder benutzerdefinierte Instruments integriert werden. Um eine der APIs zu starten, müssen Sie sich für den API-Zugriff anmelden Entwicklerportal.
- NVIDIA: Sie können über auf die Bria 2.3-Modell-API zugreifen NVIDIA NIM
Sehen wir uns an, wie man eine Webanwendung zur Bildgenerierung mit dem Bria 2.3-Modell erstellt:
- Holen Sie sich eine Bria 2.3-Modell-API von NVIDIA NIM
- Installieren Sie „necessities.txt“.
Holen Sie sich den vollständigen Code im GitHub-Repo.
Schritt 1: Erforderliche Bibliothek importieren
Um zu beginnen, müssen wir die wesentlichen Bibliotheken importieren, die unsere API-Anfragen, die Verwaltung von Umgebungsvariablen und die Net-App-Schnittstelle erleichtern. Die Bibliotheken umfassen requests
zur Bearbeitung von HTTP-Anfragen, base64
zur Dekodierung von Bilddaten, dotenv
zum Laden von Umgebungsvariablen, os
zur Interaktion mit dem Betriebssystem, time
zur Messung der Ausführungsdauer und streamlit
zum Erstellen der Webanwendungsschnittstelle.
import requests
import base64
from dotenv import load_dotenv
import os
import time
import streamlit as st
Schritt 2: Laden Sie Ihren API-Schlüssel aus der .env-Datei
In diesem Schritt laden wir den in a gespeicherten API-Schlüssel .env
Datei mit der load_dotenv
Funktion. Dieser API-Schlüssel ist von entscheidender Bedeutung, da er uns die Authentifizierung unserer Anfragen beim NVIDIA Bria AI 2.3-Modell ermöglicht. Anschließend richten wir die Foundation-URL für den API-Endpunkt ein und bereiten die erforderlichen Header für unsere HTTP-Anfragen vor. Dabei stellen wir sicher, dass wir unser Autorisierungstoken einschließen.
load_dotenv()
invoke_url = "https://ai.api.nvidia.com/v1/genai/briaai/bria-2.3"
api_key = os.getenv('NVIDIA_API_KEY')
headers = {
"Authorization": f"Bearer {api_key}",
"Settle for": "utility/json",
}
Der Code richtet die Foundation-URL und den API-Schlüssel ein, die für authentifizierte Aufrufe der Bria AI 2.3-Modell-API über NVIDIA NIM verwendet werden.
Schritt 3: Streamlit-Setup
Jetzt richten wir die Streamlit-Schnittstelle für unsere Bildgenerierungs-App ein. Dazu gehört das Definieren des Titels der App, das Erstellen eines Eingabefelds, in das Benutzer ihre Bildaufforderungen eingeben können, und die Möglichkeit, ein Seitenverhältnis auszuwählen. Wenn Benutzer auf die Schaltfläche „Bild generieren“ klicken, bereiten wir die Nutzlast mit den erforderlichen Parametern für den API-Aufruf vor, einschließlich der Eingabeaufforderung, des Seitenverhältnisses und anderer Konfigurationseinstellungen.
st.title("Bria Picture Era App")
immediate = st.text_input("Enter Your Picture Immediate Right here:")
aspect_ratio = st.selectbox("Facet Ratio", ("1:1", "16:9", "4:3"))
if st.button("Generate Picture"):
payload = {
"immediate": immediate,
"cfg_scale": 5,
"aspect_ratio": aspect_ratio,
"seed": 0,
"steps": 30,
"negative_prompt": ""
}
start_time = time.time()
response = requests.put up(invoke_url, headers=headers, json=payload)
end_time = time.time()
Dies ist eine einfache Schnittstelle der Webapp. Nach Eingabe einer Textaufforderung, des Seitenverhältnisses und der Auswahl von „Bild generieren“ wird ein Bild generiert. Diese Nutzlast besteht aus der Eingabeaufforderung, Konfigurationseinstellungen, einem Seitenverhältnis, einem festen Startwert für Konsistenz, der Anzahl der Generierungsschritte und einer optionalen negativen Eingabeaufforderung. Alle diese Parameter werden an die Bria-API gesendet, um das Bild entsprechend der Eingabe des Benutzers zu generieren, und die Reaktionszeit wird berechnet, nachdem der Benutzer die Eingabeaufforderung gegeben hat.
Schritt 4: Base64-Bild dekodieren
Nach dem Senden der API-Anfrage konzentriert sich dieser Schritt auf die Bearbeitung der Antwort. Wir prüfen, ob Fehler vorliegen, dekodieren die von der API erhaltenen base64-kodierten Bilddaten und speichern sie als PNG-Datei. Wenn das Bild erfolgreich generiert wurde, wird es auf der Streamlit-Oberfläche mit einer Erfolgsmeldung angezeigt. Darüber hinaus berechnen und zeigen wir die Reaktionszeit für den Bildgenerierungsprozess an, um Benutzern Suggestions zur Leistung der App zu geben.
response.raise_for_status()
response_body = response.json()
image_data = response_body.get('picture')
if image_data:
image_bytes = base64.b64decode(image_data)
with open('generated_image.png', 'wb') as image_file:
image_file.write(image_bytes)
st.picture('generated_image.png', caption='Generated Picture')
st.success("Picture saved as 'generated_image.png'")
else:
st.error("No picture knowledge discovered within the response")
response_time = end_time - start_time
st.write(f"Response time: {response_time} seconds")
Dieser Code liest die Antwort von der Bildgenerierungs-API, speichert das erstellte Bild und zeigt es an. Anschließend wird nach Fehlern gesucht, alle vorhandenen Base64-Bilddaten dekodiert, unter „generated_image.png“ gespeichert und in Streamlit als Erfolgsmeldung angezeigt. Andernfalls wird eine Fehlermeldung angezeigt, wenn keine Bilddaten gefunden wurden. Die Antwortzeit der API wird berechnet und abschließend angezeigt.
Vollständiger Code
Unter Einbeziehung aller von uns besprochenen Schritte integriert der vollständige Code die Bibliotheken, lädt den API-Schlüssel, richtet die Benutzeroberfläche ein und verarbeitet die API-Antwort, um ein Bild basierend auf Benutzereingaben zu generieren und anzuzeigen. Dieser strukturierte Ansatz ermöglicht ein nahtloses Erlebnis bei der Generierung von Bildern mithilfe des Bria AI-Modells.
import requests
import base64
from dotenv import load_dotenv
import os
import time
import streamlit as st
load_dotenv()
invoke_url = "https://ai.api.nvidia.com/v1/genai/briaai/bria-2.3"
api_key = os.getenv('NVIDIA_API_KEY')
headers = {
"Authorization": f"Bearer {api_key}",
"Settle for": "utility/json",
}
st.title("Bria Picture Era App")
immediate = st.text_input("Enter Your Picture Immediate Right here:")
aspect_ratio = st.selectbox("Facet Ratio", ("1:1", "16:9", "4:3"))
if st.button("Generate Picture"):
payload = {
"immediate": immediate,
"cfg_scale": 5,
"aspect_ratio": aspect_ratio,
"seed": 0,
"steps": 30,
"negative_prompt": ""
}
start_time = time.time()
response = requests.put up(invoke_url, headers=headers, json=payload)
end_time = time.time()
response.raise_for_status()
response_body = response.json()
image_data = response_body.get('picture')
if image_data:
image_bytes = base64.b64decode(image_data)
with open('generated_image.png', 'wb') as image_file:
image_file.write(image_bytes)
st.picture('generated_image.png', caption='Generated Picture')
st.success("Picture saved as 'generated_image.png'")
else:
st.error("No picture knowledge discovered within the response")
response_time = end_time - start_time
st.write(f"Response time: {response_time} seconds")
Immediate
Eine gemütliche Café-Szene mit der Nahaufnahme einer dampfenden Kaffeetasse auf einem rustikalen Holztisch, umgeben von Kaffeebohnen, einem Croissant und einem weichen, warmen Licht, das durch ein Fenster fällt und Behaglichkeit und Qualität vermittelt
Ausgabe
Reaktionszeit des Ausgangs: 3,992785426879541 Sekunden
Abschluss
Bria AI transformiert mit seinem Modell Bria 2.3 visuelle Inhalte für Unternehmen und YouTuber. Es hat sich als führende Marke in der Bildgenerierung auf Unternehmensebene mithilfe generativer KI etabliert. Bria AI legt Wert auf einen verantwortungsvollen Umgang mit KI, hochgradig individuelle Funktionen und eine schnelle Verarbeitung. Ob im Advertising and marketing, E-Commerce, bei der Erstellung von Inhalten oder im Design – Bria AI bietet Optionen und Möglichkeiten, um atemberaubende visuelle Darstellungen zu erstellen, die auf Ihre spezifischen Bedürfnisse zugeschnitten sind.
Wichtige Erkenntnisse
- Importieren Sie die erforderlichen Bibliotheken für API-Anfragen, Umgebungsmanagement und Net-App-Entwicklung, um die Bildgenerierung zu erleichtern.
- Laden Sie Ihren API-Schlüssel sicher von a
.env
Datei zur Authentifizierung von Anfragen an das NVIDIA Bria AI-Modell. - Erstellen Sie eine intuitive Streamlit-Oberfläche, über die Benutzer Bildaufforderungen eingeben und Seitenverhältnisse nahtlos auswählen können.
- Implementieren Sie Fehlerprüfung und Base64-Dekodierung, um generierte Bilder zu speichern und anzuzeigen und gleichzeitig die API-Reaktionszeit zu messen.
- Kombinieren Sie alle Komponenten in einer zusammenhängenden App, die Bilder basierend auf Benutzereingaben effizient generiert und präsentiert.
Häufig gestellte Fragen
A. Bria 2.3 ist ein fortschrittliches Textual content-zu-Bild-KI-Modell, das sich auf hochwertige, anpassbare visuelle Darstellungen für Unternehmen konzentriert. Es zeichnet sich durch Funktionen wie ControlNet und ethische Datenpraktiken aus.
A. Ja, Bria 2.3 wurde speziell für Unternehmensanwendungen entwickelt und bietet API-Zugriff und Optionen für die Massenverarbeitung. Aufgrund seiner hohen Generierungsgeschwindigkeit eignet es sich superb für Unternehmen, die große Mengen an Bildmaterial benötigen.
A. Sie können über die Web site, die API-Dokumentation, NVIDIA NIM oder über Hugging Face auf Bria 2.3 zugreifen. Diese Flexibilität ermöglicht es Entwicklern, die Instruments von Bria nahtlos in benutzerdefinierte Anwendungen zu integrieren.
A. ControlNet ermöglicht eine präzise Steuerung der Ausgabebilder durch die Verwaltung von Particulars wie Structure und Beleuchtung.
Die in diesem Artikel gezeigten Medien sind nicht Eigentum von Analytics Vidhya und werden nach Ermessen des Autors verwendet.