In KI-bezogenen Veröffentlichungen wird unvermindert fortgesetzt. Noch vor wenigen Tagen veröffentlichte es ein neues Software für Gemini namens URL Context Grounding.

URL-Kontext-Erdung kann eigenständig oder in Kombination mit Google Search Grounding verwendet werden, um tiefe Tauchgänge in Internetinhalte durchzuführen.

Was ist URL -Kontextgebiet?

Kurz gesagt, dies ist eine Möglichkeit, Gemini programmgesteuert zu haben, Fragen zu Inhalten und Daten zu lesen, zu verstehen und zu beantworten, die in einzelnen Internet -URLs enthalten sind (einschließlich derer, die auf PDFs hinweisen), ohne dass das, was wir als herkömmliche Lappenverarbeitung kennen, ausführen müssen.

Mit anderen Worten, es besteht nicht erforderlich, den URL -Textual content und den Inhalt zu extrahieren, ihn zu unterteilen, ihn zu vektrieren, ihn zu speichern und so weiter. Sie sagen Google, an welcher URL Sie sich interessieren, und Sie gehen aus. Wie Sie in einem Second sehen werden, ist es sehr einfach zu codieren und sehr genau.

Aus diesen Gründen sagte ich, es könnte ein weiterer Nagel in Rags Sarg sein.

Aber funktioniert es? Schauen wir uns ein paar Beispiele an.

Ich werde meine Entwicklungsumgebung zuerst unter Ubuntu WSL2 für Home windows einrichten. Folgen Sie mit oder verwenden Sie die Methode, an die Sie gewohnt sind.

$ uv init url_context
$ cd url_context
$ uv venv url_context
$ uv pip set up jupyter
$ uv pip set up "google-genai>=1.16.0"

Sie benötigen auch einen Google -API -Schlüssel. Wenn Sie noch keinen haben, besuchen Sie Google AI Studio, melden Sie sich bei Bedarf an und stellen Sie Ihren Schlüssel ein. Der Hyperlink, der dies zu tun ist, befindet sich in der Nähe der oberen rechten Ecke der Dashboard-Seite.

Google AI Studio

Wenn Sie diesen Befehl ausführen, sollten Sie in Ihrem Browser einen neuen Registerkarte mit einem Notizbuch aufbauen.

$ jupyter pocket book

Einige Einschränkungen, die man bewusst ist

Bevor Sie zu unseren Codierungsbeispielen fortfahren, gibt es einige Einschränkungen und Einschränkungen bei der Verwendung von URL -Kontext -Erdung, von denen Sie sich bewusst sein sollten.

  1. Maximal 20 URLs können professional Anfrage enthalten sein.
  2. Die maximale Größe für den von einer einzelnen URL abgerufenen Inhalt beträgt 34 ​​MB.
  3. Die folgenden Inhaltstypen sind nicht unterstützt
  • Paywalled Inhalte
  • YouTube -Movies
  • Google Workspace -Dateien wie Google -Dokumente oder Tabellenkalkulationen
  • Video- und Audiodateien

Wenn dies gesagt wird, gehen wir mit unseren Beispielen weiter.

Beispiel 1 – Befragung eines komplexen PDF

Meine Anlaufstelle für die Testdatei beim Testen von RAG oder einer ähnlichen Verarbeitung gegen Daten in PDFs besteht darin, einen der 10-Q-Quartalsergebnisbericht von Tesla zu verwenden. Es ist ziemlich lang mit rund 50 Seiten und hat einige recht komplexe Layouts mit Tischen usw.

Da es sich um ein SEC -Anmeldungsdokument handelt, bedeutet dies auch, dass es öffentlich verfügbar ist und seine Inhalte vollständig nutzt.

Wenn Sie sich selbst aussehen möchten, finden Sie das Dokument in dieser URL.

https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf

Für diese PDF ist die Frage, die ich immer stelle, dies,

"What are the Complete liabilities and Complete property for 2022 and 2023"

Die Antwort auf diese Frage ist auf Seite 4 des Dokuments. Hier ist diese Seite.

Bild aus Tesla Sec 10-Q-Einreichungsdokument

Für den Menschen ist die Antwort leicht zu finden. Wie Sie sehen können, betrugen das Gesamtvermögen für 2022/2023 (in Millionen) 82.338 USD/93.941 USD. Die Gesamtverbindlichkeiten betrugen (in Millionen) 36.440 USD/39.446 USD.

Früher (dh vor ungefähr 18 Monaten!) Battle es schwierig, diese Informationen aus diesem Dokument mit herkömmlichen Rag -Methoden zu erhalten.

Wie wird Google -URL -Kontext nach Erdung umgehen?

Geben Sie in Ihrem Jupyter -Notizbuch diesen Code ein.

from google import genai
from google.genai import sorts

from IPython.show import HTML, Markdown

consumer = genai.Shopper(api_key='YOUR_API_KEY HERE')

# We will use a lot of the Gemini fashions corresponding to 2.5 Flash and so forth... right here 
MODEL_ID = "gemini-2.5-pro"

immediate = """
  Based mostly on the contents of this PDF https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf, What 
  are the Complete liabilities and Complete property for 2022 and 2023. Lay them out on this format
                   September 30 2023    December 31, 2022
Complete Belongings         $123               $456
Complete Liabilities    $67                $23

Do not output anything, simply the above data
"""

config = {
    "instruments": ({"url_context": {}}),
}

response = consumer.fashions.generate_content(
    contents=(immediate),
    mannequin=MODEL_ID,
    config=config
)

show(response.textual content)

Das conflict’s, nur eine Handvoll Linien, aber sehen wir die Ausgabe.

'September 30 2023 December 31, 2022nTotal Belongings $93,941 $82,338nTotal Liabilities $39,446 $36,440'

Spot auf, nicht zu schäbig.

Mal sehen, ob es einige andere Informationen auswählen kann. Gegen Ende des PDF gibt es einen Transient an einen Mitarbeiter, der das Unternehmen im Begriff ist, ihre Abfindungsbedingungen umzusetzen. Kann der URL -Kontext ermitteln, warum das im Transient genannte Ausgangsdatum von Sternchen (***) gekennzeichnet ist? Hier ist ein Ausschnitt des Briefes.

Bild aus Tesla Sec 10-Q-Einreichungsdokument

Der Grund für die Maskierung des Ausgangsdatums ist in einer Fußnote angegeben.

Bild aus Tesla Sec 10-Q-Einreichungsdokument

Der Code, den wir benötigen, um diese Informationen zu extrahieren, ist unserem ersten Beispiel sehr ähnlich. Tatsächlich ist das einzige, was sich ändert, die Eingabeaufforderung, additionally werde ich das nur zeigen.

...
...
immediate = """
  Based mostly on https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf, an worker severance letter is displayed
  Why is the exit date referred to within the letter marked with ***
"""
...
...

Und die Ausgabe?

'Based mostly on the supplied doc, the exit date within the worker severance 
letter is marked with "(***)" as a result of particular, non-material data 
that the corporate treats as non-public or confidential has been deliberately 
omitted from the general public submitting.nnThe doc features a notice clarifying 
this observe: "Sure recognized data has been omitted from this 
doc as a result of it isn't materials and is the kind that the corporate treats 
as non-public or confidential, and has been marked with "(***)" to point 
the place omissions have been made."'

Wie Sie sehen können, ist das wieder genau richtig.

Was sind andere Verwendungszwecke für die Grundlage von URL -Kontext?

Meiner Meinung nach eröffnet es eine Fülle neuer Möglichkeiten, darunter:-

Eingehende Inhaltsanalyse und -Synthese.

  • Datenextraktion. Das Software kann bestimmte Informationen wie Preise, Namen oder wichtige Erkenntnisse aus mehreren URLs ziehen.
  • Dokumentvergleich. Es kann mehrere Berichte, Artikel oder sogar PDFs analysieren, um Unterschiede zu identifizieren und Tendencies zu verfolgen.
  • Inhaltserstellung. Durch die Kombination von Informationen aus mehreren Quell -URLs kann die KI genaue Zusammenfassungen, Weblog -Beiträge oder Berichte generieren. Beispielsweise könnte ein Entwickler das Software verwenden, um zwei Rezepte von verschiedenen Web sites zu vergleichen und Zutaten und Kochzeiten zu analysieren.
  • Code- und Dokumentationsanalyse. Entwickler können die KI auf ein GitHub -Repository oder eine technische Dokumentation verweisen, um Code zu erklären, Setup -Anweisungen zu generieren oder bestimmte Fragen dazu zu beantworten.

Anspruchsvolle agierende Arbeitsabläufe.

  • Die Kombination aus breiter Entdeckung durch Google-Suche und tiefe Analyse über das URL-Kontext-Software bildet die Grundlage für komplexe, mehrstufige Aufgaben. Ein AI -Agent könnte zuerst nach relevanten Artikeln zu einem Thema suchen und dann das URL -Kontext -Software verwenden, um Informationen aus den relevantesten Suchergebnissen zu „lesen“ und zu synthetisieren.
  • Die Gemini CLI, ein Open-Supply-AI-Agent, verwendet das URL-Kontext-Software für seinen Internet-Fetch-Befehl. Auf diese Weise können Entwickler Webseiten schnell zusammenfassen, Schlüsselinformationen extrahieren oder Inhalte sogar direkt von ihrem Terminal übersetzen.

Verbesserte sachliche Genauigkeit und reduzierte Halluzinationen.

  • Durch die Erde der Antworten im Inhalt bestimmter Webseiten wird die sachliche Genauigkeit der KI erhöht und die Wahrscheinlichkeit verringert, falsche oder erfundene Informationen zu generieren. Auf diese Weise kann die KI auch Zitate für ihre Behauptungen bereitstellen und das Vertrauen der Benutzer aufbauen, indem die Quellen ihrer Informationen angezeigt werden.

Unterstützt eine Vielzahl von Inhaltstypen.

  • PDFs. Die KI kann Textual content extrahieren und die Struktur von Tabellen in PDF -Dokumenten verstehen, wodurch Berichte und Handbücher für die Erdung zugänglich sind.
  • Bilder. Es kann Bilder in verschiedenen Formaten verarbeiten und analysieren (PNG, JPEG, BMP, Webp), wobei multimodale Funktionen zur Verständnis von Diagrammen und Diagrammen eingesetzt werden.
  • Internet- und Datendateien. Die fortgesetzte Unterstützung für HTML-, JSON-, XML-, CSV- und Klartextdateien gewährleistet eine breite Anwendbarkeit.

Beispiel 2 – Führen Sie einen Preisvergleich durch

Nehmen wir für unser zweites Beispiel an, wir sind auf der Suche nach einem neuen Kopfhörer. Wir werden eine Liste der URLs mehrerer On-line -Outlets füttern, die das Produkt in unseren Code verkaufen, und das Modell bitten, die drei billigsten Produkte abzurufen, die unserer Spezifikation entsprechen.

Dieses Beispiel fühlt sich vielleicht etwas überflüssig an, da es da draußen viele Einkaufsvergleichswebsites gibt, aber es ist wirklich nur dazu bestimmt, die Dinge hervorzuheben, die Sie mit dem Software machen können.

Sagen Sie, wir möchten ein bestimmtes Modell von Kopfhörern kaufen, z. Wir haben On-line -Outlets mit den wettbewerbsfähigsten Preisen identifiziert, aber diese Preise schwanken quick täglich. Lassen Sie uns ein Skript erstellen, das jederzeit ausgeführt werden kann, um die Geschäfte mit den drei günstigsten Preisen zurückzugeben.

Auch hier ist der einzige Unterschied zwischen diesem und unserem Beispielcode die Eingabeaufforderung. Der Relaxation des Codes ist der gleiche.

immediate = """
  Based mostly on these URL hyperlinks, output the three least expensive costs for these 
  headphones and the related retailer.
  
  
  https://electronics.sony.com/audio/headphones/headband/p/wh1000xm5-b?srsltid=AfmBOopJmjebTtZEieUvHEf5xEke7C7piVi3BdlSUdTPJH3wuBfTksJy
  https://tristatecamera.com/product/TRI_STATE_CAMERA_Sony_WH-1000XM5_Wireless_Noise-Canceling_Over-Ear_Headphones_Black_1_Yr_WH1000XM5BS2.html?refid=279&KPID=SONWH1000XM5BS2&fl=GSOrganic&srsltid=AfmBOoqnE7vgc1uOELadhkaRlhHuJx3HGRTV5ICN7ihNkFXI_UEuImZ2gXU
  https://poshmark.com/itemizing/Sony-WH-1000xm5-Headphones-672d0ab515ad54b37949b845#utm_source=gdm_unpaid
  https://reverb.com/merchandise/91492218-sony-wh-1000xm5-wireless-noise-canceling-over-the-ear-headphones-silver?utm_campaign=US-Shop_unpaid&utm_medium=cpc&utm_source=google
  Sony WH-1000XM5 Noise-Canceling Wi-fi Over-Ear Headphones (Black)
  https://www.newegg.com/p/0TH-000U-00JZ4?merchandise=9SIA29PK9N4805&utm_source=google&utm_medium=natural+buying&utm_campaign=knc-googleadwords-_-headphones+and+accessories-_-sony-_-9SIA29PK9N4805&supply=area&srsltid=AfmBOooONnd3a1lju0DgyhpdXlT1VtUp_skJdsx_uYH1DdHKLWPNe_DWBuY&com_cvv=8fb3d522dc163aeadb66e08cd7450cbbdddc64c6cf2e8891f6d48747c6d56d2c 
"""

Diesmal ist die Ausgabe.

'Based mostly on the supplied URLs, listed here are the three least expensive costs for the 
Sony WH-1000XM5 headphones:nn1.  
**$145.00** at Reverb.n2. 
**$258.99** at Teds Electronics.n3.  
**$329.99** at Sony.'

Beispiel 3 – Finanzanalyse und Vergleiche für Unternehmen.

In diesem Beispiel werden wir die Gewinnberichte in Quartal 2, 2025 sowohl von Amazon als auch von Microsoft vergleichen. Wir werden das Modell bitten, beide Berichte zu analysieren, Schlüsselinformationen zu extrahieren und mit einer Zusammenfassung zu schließen, die die wichtigsten Stärken und Strategien beider Unternehmen angibt. Die Daten werden erneut aus ihren öffentlichen Gewinnberichten für SEC 10-Q-Gewinnfrequenz erhalten.

from google import genai
from google.genai import sorts

from IPython.show import HTML, Markdown

consumer = genai.Shopper(api_key='YOUR_API_KEY_HERE')

MODEL_ID = "gemini-2.5-pro" 

microsoft_earnings_url = "https://www.sec.gov/ix?doc=/Archives/edgar/knowledge/0000789019/000095017025100235/msft-20250630.htm"
amazon_earnings_url = "https://www.sec.gov/ix?doc=/Archives/edgar/knowledge/0001018724/000101872425000086/amzn-20250630.htm"

# --- Step 3: Assemble the Detailed, Non-Trivial Immediate ---
# This immediate guides the AI to carry out a deep, comparative evaluation
# quite than only a easy knowledge extraction.

immediate = f"""
Please act as a senior monetary analyst and supply a comparative evaluation of the newest quarterly earnings reviews for Amazon  and Microsoft.

Entry and totally analyse the content material from the next two URLs:
1.  **Microsoft Earnings Report:** {microsoft_earnings_url}
2.  **Amazon's Earnings Report:** {amazon_earnings_url}

Based mostly *solely* on the data contained inside these two paperwork, please carry out the next duties:

1.  **Extract and Evaluate Key Monetary Metrics:**
    *   Establish and extract the Complete Income, Internet Revenue, and Diluted Earnings Per Share (EPS) for each firms.
    *   Current these core metrics in a transparent, formatted markdown desk for simple comparability.

2.  **Analyse and Summarise Administration Commentary:**
    *   Evaluate the sections containing quotes from the CEOs (Satya Nadella for Microsoft, Jeff Bezos for Amazon) and CFOs.
    * For every firm, write a paragraph summarising the important thing themes they're emphasising. What are the first drivers of their efficiency, based on them? What's the total tone of their commentary (e.g., optimistic, cautious)?

3.  **Establish and Distinction Strategic Focus:**
    * Pinpoint the particular enterprise segments or product classes that every firm highlights as main progress drivers (e.g., Microsoft Cloud and AI, Amazon's AWS companies, and so forth).
    *   Distinction their main strategic focus for the quarter. Is yet another targeted on enterprise/cloud, whereas the opposite is extra targeted on shopper {hardware} and ecosystem progress?

4.  **Synthesise a Conclusive Government Abstract:**
    *   Write a closing, concise paragraph that synthesises the findings. Evaluate the general well being and present strategic posture of the 2 firms based mostly on these reviews. For instance, conclude which firm demonstrated stronger progress on this particular quarter and during which areas.

Simply output your closing evaluation. There isn't a have to output intervening steps thopughts or knowledge
"""

config = {
    "instruments": ({"url_context": {}}),
}

response = consumer.fashions.generate_content(
    contents=(immediate),
    mannequin=MODEL_ID,
    config=config
)

show(Markdown(response.textual content))

Hier ist die Ausgabe.

Here's a comparative evaluation of the newest quarterly earnings reviews for 
Amazon and Microsoft.

1. Key Monetary Metrics
Metric          Amazon (Q2 2025)        Microsoft (FY25 Q2)
Complete Income   143.7 billion            61 9 billion
Internet Revenue      10.4 billion             21.9 billion 
Diluted EPS     1                        2.94

2. Administration Commentary Evaluation
Microsoft:

Microsoft's administration, led by CEO Satya Nadella, maintains a extremely 
optimistic tone, emphasizing the transformative affect of AI on their 
enterprise. Nadella's commentary highlights the "Microsoft Cloud" as a main 
efficiency driver, citing its function in serving to prospects apply AI at scale. 
The corporate's CFO, Amy Hood, reinforces this by noting that the robust 
quarterly outcomes had been pushed by the Microsoft Cloud, which noticed a 23% improve 
in income. The overarching theme from Microsoft's management is that their 
investments in AI will not be simply paying off however are basically reshaping their
product choices and buyer relationships, resulting in important progress 
and market management.

Amazon:

Amazon's management, together with CEO Jeff Bezos, presents a assured and 
forward-looking perspective. The commentary highlights the robust efficiency 
of Amazon Internet Companies (AWS) and the corporate's continued innovation in AI, 
notably with companies like Bedrock and the event of customized AI chips.
Bezos emphasizes the corporate's deal with long-term, customer-centric innovation.
The general tone is considered one of sturdy optimism, with a transparent message that Amazon's 
investments in AI and cloud computing are yielding substantial outcomes and 
will proceed to be central to their technique.

3. Strategic Focus Distinction
Microsoft:

Microsoft's strategic focus for the quarter is closely centered on its 
enterprise and cloud choices, with a selected emphasis on synthetic 
intelligence. The report repeatedly highlights the "Microsoft Cloud" because the 
cornerstone of its success, with particular mentions of merchandise like Azure, 
Dynamics 365, and Microsoft 365, all of that are being infused with AI 
capabilities. The commentary from CEO Satya Nadella explicitly factors to the 
firm's success in serving to prospects apply AI at scale as a key 
differentiator and progress driver.

Amazon:

Amazon's strategic focus, whereas additionally closely invested in cloud and AI via 
AWS, is broader, encompassing its huge e-commerce and consumer-facing 
companies. The report underscores the expansion of AWS, with a notable improve 
in income and working earnings, and highlights the corporate's innovation in 
AI with companies like Bedrock. Nonetheless, not like Microsoft, Amazon's report additionally 
factors to the power of its shopper enterprise, with a deal with choice, 
worth, and comfort, in addition to the expansion of its promoting companies.

4. Government Abstract
Based mostly on their newest quarterly reviews, each Microsoft and Amazon are 
demonstrating robust monetary well being and are strategically positioned to 
capitalize on the expansion of cloud computing and synthetic intelligence. 
Microsoft's report signifies a extra targeted technique, with the "Microsoft 
Cloud" and its built-in AI capabilities serving as the first engine of 
progress, leading to spectacular profitability. Amazon, whereas additionally experiencing 
important progress in its AWS section, presents a extra diversified technique, 
balancing its enterprise cloud enterprise with its large e-commerce and 
promoting operations. On this particular quarter, Microsoft has proven stronger 
progress in internet earnings and EPS, reflecting the excessive margins of its enterprise 
software program and cloud enterprise.

Zusammenfassung

In dem Artikel wird das neue URL-Kontext-Grounding-Software für Gemini vorgestellt, mit dem Entwickler den Inhalt bestimmter Internet-URLs (einschließlich PDFs) direkt abfragen und analysieren können, ohne dass Schritte (RAG) wie Textextraktion, Chunking und Vektorisierung herrschendem Technology (Abruf generiert wurden.

Ich habe seine Benutzerfreundlichkeit mit Python-Code-Beispielen gezeigt, die auf Jupyter-Notizbüchern ausgeführt werden und das erfolgreiche Abrufen von Daten aus Teslas 10-Q-Sec-Einreichung PDF, Produktpreisvergleiche in ganz On-line-Outlets und eine finanzielle Analyse von Amazon und Microsoft Q2 2025 Finanzergebnisse gezeigt haben.

Während ich Einschränkungen wie das Software nicht mit Paywalled -URLs und einigen Medieninhalten wie YouTube -VideoaS feststellte, habe ich seine Fähigkeit hervorgehoben, eine tiefe Dokumentenverhör, Datenextraktion, Vergleich und Synthese auf einer Vielzahl von Webseiten und OPNLine -PDFs durchzuführen, die seine Genauigkeit durch die Bodierung von Reaktionen in realen Quellen verbessern.

Für viele Anwendungsfälle ersetzt dieses Software effektiv herkömmliche Lag -Workflows, insbesondere in Kombination mit Google Search Grounding, um komplexere Agenten -Workflows, sachliche Zuverlässigkeit und multimodale Inhaltsanalyse zu ermöglichen.

Ich hoffe, dieser Artikel hat Ihren Appetit auf die unzähligen Anwendungsfälle geweckt, die dieses nützliche Dienstprogramm bieten kann.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert