Strukturierte Ausgaben mit LLMs: JSON-Modus, Funktionsaufrufe und wann sie jeweils verwendet werden
Wir haben viel über beliebte Techniken zur Optimierung der Leistung und Kosten von KI-Anwendungen gesprochen, z Antwort-Streaming oder sofortiges Caching. Heute möchte ich über etwas anderes, aber ebenso Wichtiges für…