de.wedoany.com-Bericht: Das KI-Infrastruktur-Unternehmen Neurometric AI hat eine automatisierte Token-Engineering-Plattform vorgestellt und bekannt gegeben, dass es Anfang dieses Jahres eine Finanzierung in Höhe von 4 Millionen US-Dollar abgeschlossen hat. Die Plattform soll Unternehmen dabei helfen, Kosten und Leistung von Agent-Workloads zu verwalten.
Wenn Unternehmen KI-Agenten von der Experimentierphase in die Produktionsphase überführen, können einzelne Workflows Dutzende von Modellaufrufen generieren. Viele Unternehmen senden jede Aufgabe weiterhin an Frontier-Modelle, obwohl kleinere und günstigere Modelle die gleichen oder bessere Ergebnisse erzielen könnten. Neurometric bewertet diese Aufrufe einzeln, passt die Prompts bei Bedarf an und leitet jede Aufgabe an das kosteneffizienteste Modell weiter, das die erforderlichen Leistungsschwellen erfüllt. Wenn keine geeignete Option vorhanden ist, wird ein speziell entwickeltes Small Language Model erstellt. Für einfache, hochvolumige Workloads generiert die Plattform automatisch spezialisierte Small Language Models, um Geschwindigkeit und Kosten der Aufgaben zu optimieren.
„Im vergangenen Jahr haben Unternehmen bewiesen, dass KI-Agenten immer komplexere Aufgaben ausführen können. Jetzt müssen sie nachweisen, dass die wirtschaftlichen Vorteile auch bei großflächigem Einsatz dieser Agenten bestehen bleiben", sagte Rob May, CEO von Neurometric. „Jeder Modellaufruf ist auch eine Preisentscheidung, und diese Entscheidungen summieren sich im Workflow eines Agenten. Token-Engineering bietet Unternehmen eine Möglichkeit, Kosten zu kontrollieren, ohne die Qualität zu beeinträchtigen."
Derzeit verlassen sich Unternehmen auf manuelle Tests und einzelne Punktlösungen, um zu entscheiden, welche Modelle verschiedene KI-Aufgaben übernehmen sollen. Mit dem Aufkommen neuer Modelle und Änderungen bei Preisen, Geschwindigkeit und Leistung können diese Entscheidungen schnell veralten. Neurometric integriert Modell-Routing, die Erstellung von Small Language Models und den Zugang zu einem Marktplatz für vortrainierte, aufgabenspezifische Small Language Models (SLM) in einer Plattform. Der Task Endpoint Manager bewertet eingehende Anfragen auf der Grundlage kontinuierlich aktualisierter Modellleistungs- und Preisdaten und leitet dann jede Aufgabe entsprechend den Anforderungen des Kunden an Genauigkeit, Kosten und Latenz weiter. Wenn kein vorhandenes Modell diese Anforderungen erfüllt, erstellt und bereitstellt der Auto-SLM Creator ein Small Language Model für die spezifische Aufgabe. Der SLM-Marktplatz der Plattform ermöglicht Kunden zudem den Zugriff auf Modelle, die für häufige und wiederkehrende Workloads entwickelt wurden.
In frühen Kundenkontakten haben über Neurometric geroutete oder erstellte Modelle eine um bis zu 20 Prozentpunkte höhere Genauigkeit als Frontier-Modelle bei gleichzeitig geringeren Kosten und niedrigerer Latenz erzielt.
Neurometric hat Anfang dieses Jahres eine Finanzierung in Höhe von 4 Millionen US-Dollar abgeschlossen, an der sich Betaworks, ex-Ante, Everywhere.vc, Encoded, Vermillion, Abstraction und Mu Ventures sowie die Angel-Investoren Jason Calacanis, Co-Moderator des All-In Podcast, und Dharmesh Shah, CTO von Hubspot, beteiligten. Die Mittel werden für den Ausbau der Engineering- und KI-Forschungsteams sowie für die Bereitstellung weiterer Optimierungstools für die Kernplattform verwendet.
Neurometric positioniert Token-Engineering als eine Disziplin, die auf der Grundlage der erforderlichen Qualität, Kosten und Geschwindigkeit entscheidet, wie jede Aufgabe in einem KI-Workload erledigt werden soll. Im Gegensatz zum Prompt-Engineering, das sich auf die Verbesserung der Anweisungen an das Modell konzentriert, entscheidet Token-Engineering, welches Modell die Aufgabe zuerst erhalten soll und ob ein spezialisierteres Modell dafür erstellt werden sollte. Da Unternehmen mehr KI-Agenten einsetzen, einzelne Workflows mehr Modellaufrufe generieren und die Anzahl der verfügbaren Modelle weiter wächst, wird der Bedarf an dieser Fähigkeit voraussichtlich steigen. Die Plattform ist derzeit unter neurometric.ai verfügbar, und das Unternehmen plant, sich vom 29. Juni bis 2. Juli auf der AI Engineer World's Fair in San Francisco mit Kunden, Investoren und Medien zu treffen.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









