Ein genauerer Blick auf die finanzielle Nachhaltigkeit von KI

In meine April-KolumneIch habe darüber gesprochen, dass die tatsächlichen Kosten der KI ein potenziell fataler Fehler für die worthwhile Kommerzialisierung der Technologie auf lange Sicht sind. Interessanterweise haben wir in den zwei Monaten seitdem einige bemerkenswerte Schlagzeilen aus der Technologiebranche gesehen, die meine Argumentation möglicherweise in katastrophalem Ausmaß bestätigen könnten.

Es fühlt sich an, als ob der Wind in der KI-Branche so schnell die Richtung ändert, dass es schwierig ist, den Überblick zu behalten. Vor ein paar Monaten haben Technologieunternehmen und sogar einige andere Unternehmen große Anstrengungen unternommen, um ihre Mitarbeiter dazu zu bewegen, KI stärker zu nutzen, und verlangten von den Groups, diese in Arbeitsabläufe zu integrieren, unabhängig davon, ob sie einen klaren Bedarf oder besonderen Wunsch für die Software program hatten.

Rückblick ist 20–20

Wie jeder, der darüber nachgedacht hat, wahrscheinlich hätte vorhersagen können, wann Sie binden die materiellen Lebensgrundlagen der Menschen Um eine Sache häufiger zu nutzen, wird ein großer Teil der Menschen die Sache tatsächlich häufiger nutzen. Dies führte zu „tokenmaxxing“, Bestenlisten zur Token-Nutzung in Unternehmen wie Amazonund schockierende vierteljährliche KI Token-Ausgabenzahlen an unzähligen Orten wie Uber (und andere Unternehmen, die nicht bereit waren, Namen zu nennen). Es ist mir ehrlich gesagt unklar, warum diese Unternehmen von diesen Ergebnissen überrascht sind, aber nichtsdestotrotz hat dies zu einem Drawback geführt Drehpunkt In die Anweisungen an das Private beides, weil dies Die Kosten sind nicht tragbar über einen längeren Zeitraum, sondern auch, weil der Einsatz der KI nicht zu ausreichend spektakulären Geschäftsergebnissen geführt hat.

Es ist möglich, dass die Führungskräfte glaubten, dass der Einsatz von KI zu einer halb wundersamen Produktivitätsexplosion führen würde, aber wenn das so struggle, hatten sie ihre Hausaufgaben wirklich nicht gemacht. Viele von uns auf dem Feld sowie Menschen in den Medien, die über die Branche berichten ertönte Warnungen darüber, dass KI ein Werkzeug ist, das effektiv oder ineffektiv eingesetzt werden kann, und die Erwartung von Wundern wird immer enttäuschen.

Ich habe diese Artwork von Metapher schon einmal verwendet, aber stellen Sie sich vor, diese Unternehmen wären im Baugewerbe tätig und elektrische Bohrmaschinen wären neu erfunden worden, was außergewöhnliche Produktivitätssteigerungen im Bauwesen möglich gemacht hätte. Die richtige Reaktion wäre nicht, so viele Bohrmaschinen wie möglich zu kaufen, was zu einer Verknappung der Bohrmaschinenkomponenten führt und deren Preis in die Höhe treibt, und das Private anzuweisen, bei jeder Aufgabe eine Bohrmaschine zu verwenden, und Anzeigetafeln zu erstellen, die zeigen, wer die Bohrmaschinen am meisten Minuten des Tages verwendet hat. Es gäbe Gebäude mit Lochmustern in Kind eines Schweizer Käses, man hätte exorbitant viel Geld für Bohrmaschinen und den Strom ausgegeben, um sie anzutreiben, und man hätte ungefähr so viel vorzuweisen, wie es Technologieunternehmen heute mit KI tun.

Geld ist nicht unendlich

Auf jeden Fall begann die Realität zusammenzubrechen, und es struggle zumindest eine schnelle Rückkehr zur Erde. Einige Unternehmen kaufen immer noch Bohrmaschinen, aber die Großen haben gemerkt, dass das Kosten-Nutzen-Verhältnis hier nicht stimmt, und passen sich an. Allerdings wie ich im April erklärtdas wird nicht so einfach sein, wie sie denken. Einige Unternehmen fangen an, ihren Groups zu sagen, dass der Einsatz von KI für fruchtbare Zwecke und nicht nur für Tokenmaxxing erfolgen muss, um zu versuchen, die Kosten zu senken und gleichzeitig die Vorteile der Technologie dort zu nutzen, wo sie Wert generieren kann.

Was sie noch nicht begreifen, ist, dass die Budgetierung von Token und die klare Definition, wann KI bei einem Drawback helfen soll, eine viel unbestimmtere Aufgabe ist als der Einsatz anderer Arten von Technologie. Gehen wir zurück zu mein April-Artikel und erinnern Sie sich an die Erfahrungen mit der Nutzung von KI für den Einzelnen.

„Sie können angeblich kontrollieren, wie viele Token Sie einreichen, und damit Ihre Kosten kontrollieren, aber diese Kontrolle ist begrenzt. Sie können Ihre Eingabeaufforderungen kurz gestalten, überflüssige Anweisungen begrenzen und dadurch Ihre Kosten für Eingaben niedrig halten. Wenn jedoch Agententools involviert sind und das LLM Eingabeaufforderungen zur Weitergabe an andere LLMs erstellt, sind Sie nicht mehr für die Länge der Eingabeaufforderungen verantwortlich. Noch wichtiger ist, dass Sie nur die minimale Kontrolle über die Anzahl der Token haben, die gesendet werden.“ Jedes Modell antwortet mit (z. B. indem es darum bittet, „prägnant“ zu sein). Meistens ist die Anzahl der Ausgabe-Tokens ein Teil der nichtdeterministischen Unbekannten, die ich zuvor beschrieben habe. Und Sie werden feststellen, dass ein Ausgabe-Token das Fünffache des Preises eines Eingabe-Tokens kostet.

Um dies noch weiter zu verdeutlichen: Jedes Mal, wenn Sie KI verwenden, besteht die Möglichkeit, dass diese Ihre Frage nicht erfolgreich beantworten kann. Die Spielautomatenkomponente greift additionally zum Drawback auf. Der Techniker weiß nicht, A. wie viele Token eine Eingabe zurückgibt oder B. wie oft eine Eingabe eingegeben werden muss (möglicherweise mit Änderungen), um eine erfolgreiche Antwort auf eine Frage zu erhalten. Um die Kosten zu berechnen, müssen wir alle Anzahl der Eingabeaufforderungs-Tokens und alle Ausgabeaufforderungs-Tokens (A, unbekannt) für die Länge der erforderlichen Versuche (B, die ebenfalls unbekannt ist) summieren. A und B variieren auf unbestimmte Zeit, basierend auf der Modellarchitektur, dem vorliegenden Drawback, der Zufälligkeit im Modell und anderen Faktoren, die uns hinter den Kulissen wahrscheinlich nicht einmal bewusst sind. Dann multiplizieren wir mit dem Preis professional Token für das oder die verwendeten Modelle, der, wie ich im April erklärt habe, ebenfalls variiert.

Wenn Sie additionally in der Finanzabteilung eines Technologieunternehmens arbeiten und das Dollarbudget für KI-Tokens für das nächste Jahr festlegen müssen, wünsche ich Ihnen viel Glück. Selbst wenn Sie eine Schätzung basierend auf der bisherigen Nutzung oder mit sehr detaillierten Angaben zu den Produktivitätszielen des Unternehmens vornehmen, erscheinen mir Ihre Chancen, den richtigen Betrag zu budgetieren, ziemlich gering. Sie müssen jedoch eine Artwork Restrict einführen. Dies kann kein Blankoscheck-Szenario sein, additionally müssen Sie die Leute irgendwann abschneiden.

Praktische Implikationen

Wie soll das eigentlich funktionieren? Handelt es sich um „manuelles Codieren“ in der zweiten Jahreshälfte, nachdem die erste Hälfte intensiv mit KI genutzt wurde? Sind alle unsere E-Mails und Marketingdokumente in Q3 und This autumn handschriftlich verfasst? Schalten wir unsere KI-Transkriptionstools und Voice-to-Textual content-Software program ab, nachdem ein Schwellenwert erreicht wurde? Das ist für mich eine faszinierende Frage, denn ich habe persönlich erlebt, wie sehr sich die Erfahrung beim Schreiben von Code mit KI vom Schreiben ohne KI unterscheidet, und das Hin- und Herwechseln zwischen den beiden Prozessen wäre unglaublich störend.

Dies wirft auch die Frage auf, wie sich Kostensenkungen bei KI auf die Unternehmen auswirken werden, die KI-basierte Lösungen anbieten. Letzten Oktober habe ich darüber gesprochen wie die Hyperscaler (Anthropic, OpenAI, Google usw.) Startups dazu drängen, KI-basierte Funktionen in ihre Produkte zu implementieren, um Gewinne zu erzielen, die sie an die Investoren zurückzahlen, die viele Milliarden Greenback in diese Branche gesteckt haben. Da die Kosten für die Bereitstellung von KI-Funktionen steigen und Unternehmen immer mehr auf ein Pay-per-Use-Modell umsteigen, wird dieses Schwungrad allmählich zusammenbrechen. Wenn Unternehmen anfangen, KI-basierte Instruments weniger zu nutzen, weil ihre Budgets die steigenden Kosten nicht decken können, versiegt die Pipeline der Einnahmen zurück zu den Hyperscalern. Anthropic und OpenAI planen in diesem Jahr Börsengängebeide mit äußerst ungewissem Weg zur Rentabilität und Hunderten von Milliarden Greenback, die sie den Investoren schulden, sodass eine Verlangsamung der KI-Nutzung das Letzte ist, was sie brauchen.

Erwähnenswert ist auch, dass Apple letzte Woche auf der WWDC seinen Produktvorstoß in die KI angekündigt hat Kritiker sind antwortet hübsch bisher positiv. Das neue Siri, das die Technologie von Google Gemini nutzt, wird einen erheblichen Schutz der Privatsphäre bieten (auf dem Gerät und in der privaten Cloud sowie minimale Datenspeicherung) und den Nutzern außerdem keine zusätzlichen Kosten verursachen. Wenn dies verfügbar ist und die Qualität den Erwartungen entspricht, ist möglicherweise auch die regelmäßige Nutzung von ChatGPT und Claude durch Verbraucher gefährdet.

Abschluss

Sehen Sie sich diesen Bereich an, denn obwohl die Geschichten über „Unternehmen schockiert über KI-Rechnungen“ und „OpenAI und Anthropic streben nach den größten Börsengängen der Geschichte“ oft getrennt berichtet werden, handelt es sich in Wirklichkeit um dieselbe Erzählung aus unterschiedlichen Blickwinkeln. Selbst wenn Technologieunternehmen das Gefühl haben, dass KI ihnen Vorteile und Produktivitätssteigerungen bringt, verfügen sie einfach nicht über unbegrenzte Budgets, um sie einzusetzen. Wenn sie nicht über unbegrenzte Budgets verfügen (und Verbraucher sicherlich nichtDa die CPG-Preise die Budgets belasten und die Wirtschaftsstimmung auf dem niedrigsten Stand seit quick einem Jahrhundert ist, müssen wir zurückkommen und fragen, woher die Abermilliarden kommen sollen, die OpenAI, Anthropic und andere an Einnahmen generieren wollen. Kombinieren Sie dies mit dem öffentlicher Widerstand gegen Rechenzentren und negativ Stimmung über KI im Allgemeinenund Hyperscaler haben ein echtes Drawback.

Lesen Sie mehr über meine Arbeit unter www.stephaniekirmer.com