de.wedoany.com-Bericht: Unternehmen sind zunehmend besorgt über die steigenden Kosten für den Einsatz von Künstlicher Intelligenz. Uber hatte bereits im April sein gesamtes KI-Programmierbudget für das Jahr 2026 aufgebraucht; Microsoft zog die Lizenzen für Claude Code zurück, nachdem es Entwicklern die Nutzung monatelang erlaubt hatte; ein Mitarbeiter von Priceline verriet TechCrunch, dass die Verlängerungskosten für seinen Cursor-Vertrag um das Vier- bis Fünffache gestiegen seien.
Obwohl die Preise pro Token gesunken sind, treiben die Verbreitung von KI-Anwendungen und zunehmend autonome Agenten den Gesamtverbrauch rasant in die Höhe. Unternehmen, die Anfang 2025 in großer Zahl unbegrenzte Tarife abgeschlossen haben, sind nun damit beschäftigt, herauszufinden, wohin ihr Geld fließt, Ausgaben zu kürzen und aus dem Budgetdruck eine Rendite zu erzielen. Gleichzeitig entsteht ein Markt, der den Bedarf an Kostenverfolgung deckt: Start-ups, etablierte Anbieter und eine neue Normungsorganisation wetteifern darum, Unternehmen die entsprechenden Werkzeuge und Sprachsysteme bereitzustellen.
„Vor sechs Monaten fragten Kunden nur: ‚Was kann es? Ist es gut genug?‘“, sagte Alexander Embiricos, Leiter des Unternehmenskundengeschäfts von OpenAI, auf einer Veranstaltung in New York City zu TechCrunch. „Jetzt ist die Unterhaltung völlig anders. Sie lautet: ‚Wir geben zu viel aus. Welche Transparenz könnt ihr bieten? Welche Prüfungsmöglichkeiten? Welche Token-Kontrollen? Wie effizient sind eure Modelle?‘“
Vor diesem Hintergrund gab die Linux Foundation diese Woche die Tokenomics Foundation bekannt, eine neue Normungsorganisation, die darauf abzielt, eine ähnliche Kostenkontrolle für KI-Token-Ausgaben zu etablieren, wie sie FinOps (Kostendisziplin für Cloud-Ausgaben) für die Cloud bietet.
„Im April und Mai hörte ich von Unternehmen: ‚Mein Gott, wir haben bereits das Dreifache unseres gesamten Token-Budgets für 2026 überschritten, und es ist erst April‘“, sagte J.R. Storment, Geschäftsführer der FinOps Foundation, einer Tochter der Linux Foundation, zu TechCrunch. „Wir begannen, von existenziellen Krisen zu hören. Die gesamte Diskussion verlagerte sich von ‚Token-Maximierung‘ und ‚schnell laufen‘ hin zu ‚Wir brauchen Leitplanken. Wie können wir das kontrollieren?‘“
Diese Rufe kommen, nachdem CEOs zuvor enthusiastisch von ihren Teams verlangt hatten, ohne Rücksicht auf Kosten die besten Modelle zu nutzen und Projekte schnell voranzutreiben. Neue Modelle, die im November veröffentlicht wurden, wie Anthropics Claude Opus 4.5, OpenAIs GPT-5.1 und Googles Gemini 3 Pro, brachten deutliche Verbesserungen bei Agentenwerkzeugen, was zu einem exponentiellen Anstieg des Verbrauchs führte. Berichten zufolge sah sich ein Unternehmen aufgrund fehlender Nutzungsbeschränkungen für Mitarbeiter einer Claude-Rechnung in Höhe von 500 Millionen Dollar gegenüber.
„Das ist wie eine Crack-Kokain-Epidemie“, sagte Chris Reed, Senior Director of IT Finance bei Priceline. Er wies darauf hin, dass das Unternehmen bereits begonnen habe, Token-Limits für bestimmte Gruppen einzuführen: „Sie lassen dich zuerst den süßen Geschmack kosten, machen dich süchtig, und dann bist du an sie gefesselt.“
Vitaly Gordon, CEO der Engineering-Operations-Plattform Faros AI, sagte, er habe kürzlich mit einem Chief Technology Officer gesprochen, der erwähnte: „Einer meiner Ingenieure hat letzten Monat 40.000 Dollar für Tokens ausgegeben. Ich weiß wirklich nicht, ob ich ihn aufhalten oder allen anderen sagen soll, sie sollen es ihm gleichtun.“
Eine Umfrage von Faros im März ergab, dass bei 20.000 Entwicklern die Produktivität zwar zunahm, aber auch die Fehler- und Neuschreibungsrate stieg. Die Engineering-Management-Plattform Jellyfish stellte ebenfalls fest, dass die Ingenieure, die die meisten Tokens verbrauchten, etwa doppelt so produktiv waren wie diejenigen, die KI weniger nutzten, aber dafür die zehnfache Menge an Tokens ausgaben.
Nicholas Arcolano, Forschungsleiter bei Jellyfish, teilte TechCrunch per E-Mail mit, dass der explosionsartige Anstieg der KI-Ausgaben größtenteils auf Agentenfunktionen zurückzuführen sei, wobei der Verbrauch pro Entwickler innerhalb von neun Monaten um etwa das 18,6-fache gestiegen sei. Diese Daten machen den Zusammenhang zwischen Produktivitätssteigerung und Ausgabenwachstum noch unklarer. „Ob sich extreme Ausgaben lohnen, hängt letztlich vom endgültigen Geschäftswert (z. B. Umsatz) des veröffentlichten Codes ab, und die meisten Unternehmen können dies immer noch nicht messen“, sagte Arcolano.
Ein Teil des Messproblems liegt im schieren Umfang der aktuellen KI-Nutzung. „Die Verfolgung von Cloud-Kosten ist ein Datenproblem mit Hunderten Millionen Zeilen pro Monat“, sagte Storment. „Die Verfolgung von Token-Kosten ist ein Datenproblem mit Billionen von Zeilen pro Monat. Man kann diese Daten nicht einfach in eine beliebige Tabellenkalkulation oder sogar in ein einfaches Werkzeug stopfen. Man muss seine Werkzeuge, Normen und Buchhaltungssysteme grundlegend überdenken.“
Bei Priceline hat Reed bereits Unterschiede festgestellt und wies auf Probleme zwischen den von den Anbietern gemeldeten Nutzungsdaten und den internen Daten von Priceline hin. „Meine Karriere begann im Telekommunikationskostenmanagement, und ich sehe alle Parallelen von der Telekommunikation über die Cloud bis hin zur KI“, sagte er. „Immer wenn etwas Neues eingeführt wird, gibt es Abrechnungsfehler sowie Möglichkeiten zur Prüfung und Optimierung.“
Um dieses Problem herum entsteht ein Markt. Reine Player wie Pay-i können die Kosten und die Leistung von GenAI-Investitionen verfolgen, messen und optimieren; Paid ermöglicht es Entwicklern, Kosten zu verfolgen, die Nutzung zu messen und Benutzer auf der Grundlage des tatsächlichen Werts statt einer Abonnementgebühr abzurechnen. Es gibt auch Unternehmen wie Jellyfish, Waydev und Faros AI, die KI-Agenten-Überwachung anbieten, um die Rendite von Entwicklerwerkzeugen nachzuweisen. Storment sagte, die meisten der 180 Anbieter unter dem Dach der FinOps Foundation tendierten in diesen Bereich.
Unternehmen mit bestehenden Vertriebskanälen fügen ebenfalls neue Funktionen hinzu. Ramp ist kürzlich in das Management von KI-Ausgaben eingestiegen; Datadog und New Relic haben Dienste wie Cloud-Kostenmanagement, Token-Level-Beobachtbarkeit und GPU-Überwachung hinzugefügt. Auf der FinOps X-Konferenz nächste Woche wird AWS voraussichtlich neue Finanzmanagementfunktionen für Unternehmens-KI-Ausgaben vorstellen.
Tiffany Luck, Partnerin bei NEA, glaubt, dass Token-Effizienz und Beobachtbarkeit in die „Harness-Schicht oder Anwendungsschicht“ integriert werden könnten. Sie erwähnte das Start-up Factory, das diese Woche einen Modell-Router auf den Markt brachte, der automatisch das passende Modell für jede Aufgabe auswählt. Gordon erwartet, dass führende Labore und andere Modellanbieter eine OpenRouter-ähnliche Optimierung übernehmen werden, die Anfragen an das günstigste Modell weiterleitet – ein Trend, der sich bereits in den Claude-Rechnungen von Unternehmen zeigt. „Selbst wenn Sie das Opus-Modell aufrufen, wird ein Teil der Kosten Sonnet oder Haiku zugeschrieben“, sagte Gordon, „weil letztere intelligent genug sind, um die Aufgabe zu erledigen. Ich denke, das wird immer üblicher werden.“
Allerdings werden all diese Werkzeuge ohne eine gemeinsame Sprache oder gemeinsame Definitionen entwickelt. Hier möchte die Tokenomics Foundation ansetzen. Die Stiftung entwickelt normative Definitionen und Rahmenwerke für „Tokenomics“; offene Standards, Normen und Metriken für die Nutzung und Abrechnung von KI-Tokens; sowie neue Metriken wie Kosten pro Intelligenz oder Tokens pro Watt. Sie plant auch, Metriken für die Token-Factory-Effizienz und die Verbrauchseffizienz zu definieren. Die Organisation soll offiziell im Juli starten und wird auf der FinOps X-Konferenz nächste Woche weitere Mitglieder bekannt geben.
„Die Token-Ökonomie ist grundlegend abstrakter und undurchsichtiger als alles, was wir bisher in diesem Maßstab verwaltet haben“, sagte Nishant Gupta, Chief Availability Officer bei Salesforce, in einer Erklärung. „Sie erfordert eine andere operative Muskulatur, als die Industrie sie für die Cloud aufgebaut hat.“
Obwohl Goldman Sachs prognostiziert, dass der weltweite Token-Verbrauch bis 2030 um das 24-fache steigen wird, benötigen Unternehmen, die bereits über dem Budget liegen, jetzt Lösungen, während die ersten Ergebnisse der Stiftung noch Monate auf sich warten lassen. „Vielleicht haben wir die Dampfmaschine erfunden, aber wir haben das Fließband noch nicht verstanden“, sagte Gordon. Laut Arcolano ist es klug, breit und maßvoll vorzugehen. „Die beste Rendite erzielt man, wenn man die breite Mittelschicht von niedriger auf mittlere Nutzung bringt, anstatt die Vielnutzer noch weiter zu treiben“, sagte er.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









