In KI-bezogenen Veröffentlichungen wird unvermindert fortgesetzt. Noch vor wenigen Tagen veröffentlichte es ein neues Software für Gemini namens URL Context Grounding.
URL-Kontext-Erdung kann eigenständig oder in Kombination mit Google Search Grounding verwendet werden, um tiefe Tauchgänge in Internetinhalte durchzuführen.
Was ist URL -Kontextgebiet?
Kurz gesagt, dies ist eine Möglichkeit, Gemini programmgesteuert zu haben, Fragen zu Inhalten und Daten zu lesen, zu verstehen und zu beantworten, die in einzelnen Internet -URLs enthalten sind (einschließlich derer, die auf PDFs hinweisen), ohne dass das, was wir als herkömmliche Lappenverarbeitung kennen, ausführen müssen.
Mit anderen Worten, es besteht nicht erforderlich, den URL -Textual content und den Inhalt zu extrahieren, ihn zu unterteilen, ihn zu vektrieren, ihn zu speichern und so weiter. Sie sagen Google, an welcher URL Sie sich interessieren, und Sie gehen aus. Wie Sie in einem Second sehen werden, ist es sehr einfach zu codieren und sehr genau.
Aus diesen Gründen sagte ich, es könnte ein weiterer Nagel in Rags Sarg sein.
Aber funktioniert es? Schauen wir uns ein paar Beispiele an.
Ich werde meine Entwicklungsumgebung zuerst unter Ubuntu WSL2 für Home windows einrichten. Folgen Sie mit oder verwenden Sie die Methode, an die Sie gewohnt sind.
$ uv init url_context
$ cd url_context
$ uv venv url_context
$ uv pip set up jupyter
$ uv pip set up "google-genai>=1.16.0"
Sie benötigen auch einen Google -API -Schlüssel. Wenn Sie noch keinen haben, besuchen Sie Google AI Studio, melden Sie sich bei Bedarf an und stellen Sie Ihren Schlüssel ein. Der Hyperlink, der dies zu tun ist, befindet sich in der Nähe der oberen rechten Ecke der Dashboard-Seite.
Wenn Sie diesen Befehl ausführen, sollten Sie in Ihrem Browser einen neuen Registerkarte mit einem Notizbuch aufbauen.
$ jupyter pocket book
Einige Einschränkungen, die man bewusst ist
Bevor Sie zu unseren Codierungsbeispielen fortfahren, gibt es einige Einschränkungen und Einschränkungen bei der Verwendung von URL -Kontext -Erdung, von denen Sie sich bewusst sein sollten.
- Maximal 20 URLs können professional Anfrage enthalten sein.
- Die maximale Größe für den von einer einzelnen URL abgerufenen Inhalt beträgt 34 MB.
- Die folgenden Inhaltstypen sind nicht unterstützt
- Paywalled Inhalte
- YouTube -Movies
- Google Workspace -Dateien wie Google -Dokumente oder Tabellenkalkulationen
- Video- und Audiodateien
Wenn dies gesagt wird, gehen wir mit unseren Beispielen weiter.
Beispiel 1 – Befragung eines komplexen PDF
Meine Anlaufstelle für die Testdatei beim Testen von RAG oder einer ähnlichen Verarbeitung gegen Daten in PDFs besteht darin, einen der 10-Q-Quartalsergebnisbericht von Tesla zu verwenden. Es ist ziemlich lang mit rund 50 Seiten und hat einige recht komplexe Layouts mit Tischen usw.
Da es sich um ein SEC -Anmeldungsdokument handelt, bedeutet dies auch, dass es öffentlich verfügbar ist und seine Inhalte vollständig nutzt.
Wenn Sie sich selbst aussehen möchten, finden Sie das Dokument in dieser URL.
https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf
Für diese PDF ist die Frage, die ich immer stelle, dies,
"What are the Complete liabilities and Complete property for 2022 and 2023"
Die Antwort auf diese Frage ist auf Seite 4 des Dokuments. Hier ist diese Seite.

Für den Menschen ist die Antwort leicht zu finden. Wie Sie sehen können, betrugen das Gesamtvermögen für 2022/2023 (in Millionen) 82.338 USD/93.941 USD. Die Gesamtverbindlichkeiten betrugen (in Millionen) 36.440 USD/39.446 USD.
Früher (dh vor ungefähr 18 Monaten!) Battle es schwierig, diese Informationen aus diesem Dokument mit herkömmlichen Rag -Methoden zu erhalten.
Wie wird Google -URL -Kontext nach Erdung umgehen?
Geben Sie in Ihrem Jupyter -Notizbuch diesen Code ein.
from google import genai
from google.genai import sorts
from IPython.show import HTML, Markdown
consumer = genai.Shopper(api_key='YOUR_API_KEY HERE')
# We will use a lot of the Gemini fashions corresponding to 2.5 Flash and so forth... right here
MODEL_ID = "gemini-2.5-pro"
immediate = """
Based mostly on the contents of this PDF https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf, What
are the Complete liabilities and Complete property for 2022 and 2023. Lay them out on this format
September 30 2023 December 31, 2022
Complete Belongings $123 $456
Complete Liabilities $67 $23
Do not output anything, simply the above data
"""
config = {
"instruments": ({"url_context": {}}),
}
response = consumer.fashions.generate_content(
contents=(immediate),
mannequin=MODEL_ID,
config=config
)
show(response.textual content)
Das conflict’s, nur eine Handvoll Linien, aber sehen wir die Ausgabe.
'September 30 2023 December 31, 2022nTotal Belongings $93,941 $82,338nTotal Liabilities $39,446 $36,440'
Spot auf, nicht zu schäbig.
Mal sehen, ob es einige andere Informationen auswählen kann. Gegen Ende des PDF gibt es einen Transient an einen Mitarbeiter, der das Unternehmen im Begriff ist, ihre Abfindungsbedingungen umzusetzen. Kann der URL -Kontext ermitteln, warum das im Transient genannte Ausgangsdatum von Sternchen (***) gekennzeichnet ist? Hier ist ein Ausschnitt des Briefes.

Der Grund für die Maskierung des Ausgangsdatums ist in einer Fußnote angegeben.

Der Code, den wir benötigen, um diese Informationen zu extrahieren, ist unserem ersten Beispiel sehr ähnlich. Tatsächlich ist das einzige, was sich ändert, die Eingabeaufforderung, additionally werde ich das nur zeigen.
...
...
immediate = """
Based mostly on https://ir.tesla.com/_flysystem/s3/sec/000162828023034847/tsla-20230930-gen.pdf, an worker severance letter is displayed
Why is the exit date referred to within the letter marked with ***
"""
...
...
Und die Ausgabe?
'Based mostly on the supplied doc, the exit date within the worker severance
letter is marked with "(***)" as a result of particular, non-material data
that the corporate treats as non-public or confidential has been deliberately
omitted from the general public submitting.nnThe doc features a notice clarifying
this observe: "Sure recognized data has been omitted from this
doc as a result of it isn't materials and is the kind that the corporate treats
as non-public or confidential, and has been marked with "(***)" to point
the place omissions have been made."'
Wie Sie sehen können, ist das wieder genau richtig.
Was sind andere Verwendungszwecke für die Grundlage von URL -Kontext?
Meiner Meinung nach eröffnet es eine Fülle neuer Möglichkeiten, darunter:-
Eingehende Inhaltsanalyse und -Synthese.
- Datenextraktion. Das Software kann bestimmte Informationen wie Preise, Namen oder wichtige Erkenntnisse aus mehreren URLs ziehen.
- Dokumentvergleich. Es kann mehrere Berichte, Artikel oder sogar PDFs analysieren, um Unterschiede zu identifizieren und Tendencies zu verfolgen.
- Inhaltserstellung. Durch die Kombination von Informationen aus mehreren Quell -URLs kann die KI genaue Zusammenfassungen, Weblog -Beiträge oder Berichte generieren. Beispielsweise könnte ein Entwickler das Software verwenden, um zwei Rezepte von verschiedenen Web sites zu vergleichen und Zutaten und Kochzeiten zu analysieren.
- Code- und Dokumentationsanalyse. Entwickler können die KI auf ein GitHub -Repository oder eine technische Dokumentation verweisen, um Code zu erklären, Setup -Anweisungen zu generieren oder bestimmte Fragen dazu zu beantworten.
Anspruchsvolle agierende Arbeitsabläufe.
- Die Kombination aus breiter Entdeckung durch Google-Suche und tiefe Analyse über das URL-Kontext-Software bildet die Grundlage für komplexe, mehrstufige Aufgaben. Ein AI -Agent könnte zuerst nach relevanten Artikeln zu einem Thema suchen und dann das URL -Kontext -Software verwenden, um Informationen aus den relevantesten Suchergebnissen zu „lesen“ und zu synthetisieren.
- Die Gemini CLI, ein Open-Supply-AI-Agent, verwendet das URL-Kontext-Software für seinen Internet-Fetch-Befehl. Auf diese Weise können Entwickler Webseiten schnell zusammenfassen, Schlüsselinformationen extrahieren oder Inhalte sogar direkt von ihrem Terminal übersetzen.
Verbesserte sachliche Genauigkeit und reduzierte Halluzinationen.
- Durch die Erde der Antworten im Inhalt bestimmter Webseiten wird die sachliche Genauigkeit der KI erhöht und die Wahrscheinlichkeit verringert, falsche oder erfundene Informationen zu generieren. Auf diese Weise kann die KI auch Zitate für ihre Behauptungen bereitstellen und das Vertrauen der Benutzer aufbauen, indem die Quellen ihrer Informationen angezeigt werden.
Unterstützt eine Vielzahl von Inhaltstypen.
- PDFs. Die KI kann Textual content extrahieren und die Struktur von Tabellen in PDF -Dokumenten verstehen, wodurch Berichte und Handbücher für die Erdung zugänglich sind.
- Bilder. Es kann Bilder in verschiedenen Formaten verarbeiten und analysieren (PNG, JPEG, BMP, Webp), wobei multimodale Funktionen zur Verständnis von Diagrammen und Diagrammen eingesetzt werden.
- Internet- und Datendateien. Die fortgesetzte Unterstützung für HTML-, JSON-, XML-, CSV- und Klartextdateien gewährleistet eine breite Anwendbarkeit.
Beispiel 2 – Führen Sie einen Preisvergleich durch
Nehmen wir für unser zweites Beispiel an, wir sind auf der Suche nach einem neuen Kopfhörer. Wir werden eine Liste der URLs mehrerer On-line -Outlets füttern, die das Produkt in unseren Code verkaufen, und das Modell bitten, die drei billigsten Produkte abzurufen, die unserer Spezifikation entsprechen.
Dieses Beispiel fühlt sich vielleicht etwas überflüssig an, da es da draußen viele Einkaufsvergleichswebsites gibt, aber es ist wirklich nur dazu bestimmt, die Dinge hervorzuheben, die Sie mit dem Software machen können.
Sagen Sie, wir möchten ein bestimmtes Modell von Kopfhörern kaufen, z. Wir haben On-line -Outlets mit den wettbewerbsfähigsten Preisen identifiziert, aber diese Preise schwanken quick täglich. Lassen Sie uns ein Skript erstellen, das jederzeit ausgeführt werden kann, um die Geschäfte mit den drei günstigsten Preisen zurückzugeben.
Auch hier ist der einzige Unterschied zwischen diesem und unserem Beispielcode die Eingabeaufforderung. Der Relaxation des Codes ist der gleiche.
immediate = """
Based mostly on these URL hyperlinks, output the three least expensive costs for these
headphones and the related retailer.
https://electronics.sony.com/audio/headphones/headband/p/wh1000xm5-b?srsltid=AfmBOopJmjebTtZEieUvHEf5xEke7C7piVi3BdlSUdTPJH3wuBfTksJy
https://tristatecamera.com/product/TRI_STATE_CAMERA_Sony_WH-1000XM5_Wireless_Noise-Canceling_Over-Ear_Headphones_Black_1_Yr_WH1000XM5BS2.html?refid=279&KPID=SONWH1000XM5BS2&fl=GSOrganic&srsltid=AfmBOoqnE7vgc1uOELadhkaRlhHuJx3HGRTV5ICN7ihNkFXI_UEuImZ2gXU
https://poshmark.com/itemizing/Sony-WH-1000xm5-Headphones-672d0ab515ad54b37949b845#utm_source=gdm_unpaid
https://reverb.com/merchandise/91492218-sony-wh-1000xm5-wireless-noise-canceling-over-the-ear-headphones-silver?utm_campaign=US-Shop_unpaid&utm_medium=cpc&utm_source=google
Sony WH-1000XM5 Noise-Canceling Wi-fi Over-Ear Headphones (Black)
https://www.newegg.com/p/0TH-000U-00JZ4?merchandise=9SIA29PK9N4805&utm_source=google&utm_medium=natural+buying&utm_campaign=knc-googleadwords-_-headphones+and+accessories-_-sony-_-9SIA29PK9N4805&supply=area&srsltid=AfmBOooONnd3a1lju0DgyhpdXlT1VtUp_skJdsx_uYH1DdHKLWPNe_DWBuY&com_cvv=8fb3d522dc163aeadb66e08cd7450cbbdddc64c6cf2e8891f6d48747c6d56d2c
"""
Diesmal ist die Ausgabe.
'Based mostly on the supplied URLs, listed here are the three least expensive costs for the
Sony WH-1000XM5 headphones:nn1.
**$145.00** at Reverb.n2.
**$258.99** at Teds Electronics.n3.
**$329.99** at Sony.'
Beispiel 3 – Finanzanalyse und Vergleiche für Unternehmen.
In diesem Beispiel werden wir die Gewinnberichte in Quartal 2, 2025 sowohl von Amazon als auch von Microsoft vergleichen. Wir werden das Modell bitten, beide Berichte zu analysieren, Schlüsselinformationen zu extrahieren und mit einer Zusammenfassung zu schließen, die die wichtigsten Stärken und Strategien beider Unternehmen angibt. Die Daten werden erneut aus ihren öffentlichen Gewinnberichten für SEC 10-Q-Gewinnfrequenz erhalten.
from google import genai
from google.genai import sorts
from IPython.show import HTML, Markdown
consumer = genai.Shopper(api_key='YOUR_API_KEY_HERE')
MODEL_ID = "gemini-2.5-pro"
microsoft_earnings_url = "https://www.sec.gov/ix?doc=/Archives/edgar/knowledge/0000789019/000095017025100235/msft-20250630.htm"
amazon_earnings_url = "https://www.sec.gov/ix?doc=/Archives/edgar/knowledge/0001018724/000101872425000086/amzn-20250630.htm"
# --- Step 3: Assemble the Detailed, Non-Trivial Immediate ---
# This immediate guides the AI to carry out a deep, comparative evaluation
# quite than only a easy knowledge extraction.
immediate = f"""
Please act as a senior monetary analyst and supply a comparative evaluation of the newest quarterly earnings reviews for Amazon and Microsoft.
Entry and totally analyse the content material from the next two URLs:
1. **Microsoft Earnings Report:** {microsoft_earnings_url}
2. **Amazon's Earnings Report:** {amazon_earnings_url}
Based mostly *solely* on the data contained inside these two paperwork, please carry out the next duties:
1. **Extract and Evaluate Key Monetary Metrics:**
* Establish and extract the Complete Income, Internet Revenue, and Diluted Earnings Per Share (EPS) for each firms.
* Current these core metrics in a transparent, formatted markdown desk for simple comparability.
2. **Analyse and Summarise Administration Commentary:**
* Evaluate the sections containing quotes from the CEOs (Satya Nadella for Microsoft, Jeff Bezos for Amazon) and CFOs.
* For every firm, write a paragraph summarising the important thing themes they're emphasising. What are the first drivers of their efficiency, based on them? What's the total tone of their commentary (e.g., optimistic, cautious)?
3. **Establish and Distinction Strategic Focus:**
* Pinpoint the particular enterprise segments or product classes that every firm highlights as main progress drivers (e.g., Microsoft Cloud and AI, Amazon's AWS companies, and so forth).
* Distinction their main strategic focus for the quarter. Is yet another targeted on enterprise/cloud, whereas the opposite is extra targeted on shopper {hardware} and ecosystem progress?
4. **Synthesise a Conclusive Government Abstract:**
* Write a closing, concise paragraph that synthesises the findings. Evaluate the general well being and present strategic posture of the 2 firms based mostly on these reviews. For instance, conclude which firm demonstrated stronger progress on this particular quarter and during which areas.
Simply output your closing evaluation. There isn't a have to output intervening steps thopughts or knowledge
"""
config = {
"instruments": ({"url_context": {}}),
}
response = consumer.fashions.generate_content(
contents=(immediate),
mannequin=MODEL_ID,
config=config
)
show(Markdown(response.textual content))
Hier ist die Ausgabe.
Here's a comparative evaluation of the newest quarterly earnings reviews for
Amazon and Microsoft.
1. Key Monetary Metrics
Metric Amazon (Q2 2025) Microsoft (FY25 Q2)
Complete Income 143.7 billion 61 9 billion
Internet Revenue 10.4 billion 21.9 billion
Diluted EPS 1 2.94
2. Administration Commentary Evaluation
Microsoft:
Microsoft's administration, led by CEO Satya Nadella, maintains a extremely
optimistic tone, emphasizing the transformative affect of AI on their
enterprise. Nadella's commentary highlights the "Microsoft Cloud" as a main
efficiency driver, citing its function in serving to prospects apply AI at scale.
The corporate's CFO, Amy Hood, reinforces this by noting that the robust
quarterly outcomes had been pushed by the Microsoft Cloud, which noticed a 23% improve
in income. The overarching theme from Microsoft's management is that their
investments in AI will not be simply paying off however are basically reshaping their
product choices and buyer relationships, resulting in important progress
and market management.
Amazon:
Amazon's management, together with CEO Jeff Bezos, presents a assured and
forward-looking perspective. The commentary highlights the robust efficiency
of Amazon Internet Companies (AWS) and the corporate's continued innovation in AI,
notably with companies like Bedrock and the event of customized AI chips.
Bezos emphasizes the corporate's deal with long-term, customer-centric innovation.
The general tone is considered one of sturdy optimism, with a transparent message that Amazon's
investments in AI and cloud computing are yielding substantial outcomes and
will proceed to be central to their technique.
3. Strategic Focus Distinction
Microsoft:
Microsoft's strategic focus for the quarter is closely centered on its
enterprise and cloud choices, with a selected emphasis on synthetic
intelligence. The report repeatedly highlights the "Microsoft Cloud" because the
cornerstone of its success, with particular mentions of merchandise like Azure,
Dynamics 365, and Microsoft 365, all of that are being infused with AI
capabilities. The commentary from CEO Satya Nadella explicitly factors to the
firm's success in serving to prospects apply AI at scale as a key
differentiator and progress driver.
Amazon:
Amazon's strategic focus, whereas additionally closely invested in cloud and AI via
AWS, is broader, encompassing its huge e-commerce and consumer-facing
companies. The report underscores the expansion of AWS, with a notable improve
in income and working earnings, and highlights the corporate's innovation in
AI with companies like Bedrock. Nonetheless, not like Microsoft, Amazon's report additionally
factors to the power of its shopper enterprise, with a deal with choice,
worth, and comfort, in addition to the expansion of its promoting companies.
4. Government Abstract
Based mostly on their newest quarterly reviews, each Microsoft and Amazon are
demonstrating robust monetary well being and are strategically positioned to
capitalize on the expansion of cloud computing and synthetic intelligence.
Microsoft's report signifies a extra targeted technique, with the "Microsoft
Cloud" and its built-in AI capabilities serving as the first engine of
progress, leading to spectacular profitability. Amazon, whereas additionally experiencing
important progress in its AWS section, presents a extra diversified technique,
balancing its enterprise cloud enterprise with its large e-commerce and
promoting operations. On this particular quarter, Microsoft has proven stronger
progress in internet earnings and EPS, reflecting the excessive margins of its enterprise
software program and cloud enterprise.
Zusammenfassung
In dem Artikel wird das neue URL-Kontext-Grounding-Software für Gemini vorgestellt, mit dem Entwickler den Inhalt bestimmter Internet-URLs (einschließlich PDFs) direkt abfragen und analysieren können, ohne dass Schritte (RAG) wie Textextraktion, Chunking und Vektorisierung herrschendem Technology (Abruf generiert wurden.
Ich habe seine Benutzerfreundlichkeit mit Python-Code-Beispielen gezeigt, die auf Jupyter-Notizbüchern ausgeführt werden und das erfolgreiche Abrufen von Daten aus Teslas 10-Q-Sec-Einreichung PDF, Produktpreisvergleiche in ganz On-line-Outlets und eine finanzielle Analyse von Amazon und Microsoft Q2 2025 Finanzergebnisse gezeigt haben.
Während ich Einschränkungen wie das Software nicht mit Paywalled -URLs und einigen Medieninhalten wie YouTube -VideoaS feststellte, habe ich seine Fähigkeit hervorgehoben, eine tiefe Dokumentenverhör, Datenextraktion, Vergleich und Synthese auf einer Vielzahl von Webseiten und OPNLine -PDFs durchzuführen, die seine Genauigkeit durch die Bodierung von Reaktionen in realen Quellen verbessern.
Für viele Anwendungsfälle ersetzt dieses Software effektiv herkömmliche Lag -Workflows, insbesondere in Kombination mit Google Search Grounding, um komplexere Agenten -Workflows, sachliche Zuverlässigkeit und multimodale Inhaltsanalyse zu ermöglichen.
Ich hoffe, dieser Artikel hat Ihren Appetit auf die unzähligen Anwendungsfälle geweckt, die dieses nützliche Dienstprogramm bieten kann.
