FAR Labs aus den VAE eröffnet KI-Inferenzplattform, Preise für einige Modelle um 91 % niedriger_Weltnachrichten

FAR Labs aus den VAE eröffnet KI-Inferenzplattform, Preise für einige Modelle um 91 % niedriger

2026-06-27 11:25

Merken

de.wedoany.com-Bericht: FAR Labs hat die Registrierung für seine FAR AI-Inferenzplattform geöffnet, Entwicklern Zugriff gewährt und die Listenpreise für mehrere Modellbereitstellungen bekannt gegeben. Das in Abu Dhabi ansässige KI-Infrastruktur-Unternehmen (eine Tochtergesellschaft von Dizzaract) möchte Entwicklern helfen, die Betriebskosten von KI-Anwendungen zu senken, wenn die Nutzung von Softwareprodukten und Automatisierungstools zunimmt.

FAR Labs eröffnet günstigeren Zugang zur KI-Inferenzplattform

Das Herzstück der Plattform ist ein verteiltes Inferenznetzwerk, das die Anforderungen der Entwickler mit den verfügbaren Rechenressourcen abgleicht. Benutzer können über eine OpenAI-kompatible API auf das System zugreifen, aus mehreren Modellen auswählen und schnell starten, während ihre Arbeitslasten vom FAR Orchestrator an GPU-Ressourcen weitergeleitet und ausgeführt werden. FAR Labs betrachtet die Kosten als seinen wichtigsten Wettbewerbsvorteil. Das Unternehmen vergleicht seine Preise mit denen anderer Anbieter und behauptet, dass seine Netzwerkstruktur es ihm ermögliche, bei bestimmten Bereitstellungen deutlich niedrigere Preise anzubieten.

Konkret beträgt der Listenpreis von FAR AI für das Modell Qwen3-30B-A3B 0,03 USD pro 1 Million Token, während NextBit 0,35 USD und DeepInfra 0,27 USD verlangt. Das Unternehmen gibt an, dass dieser Preis bis zu 91 % niedriger sei als der der letztgenannten Anbieter. Für das Modell Qwen2.5-72B-Instruct gibt das Unternehmen einen FP8-Listenpreis von 0,17 USD pro 1 Million Token an, während NovitaAI BF16 0,39 USD und DeepInfra FP8 0,38 USD kosten. Dies mache den Preis angeblich 55 % bis 56 % niedriger als die aufgeführten Alternativen. Für das Modell Qwen3.5-122B-A10B gibt FAR AI einen FP8-Listenpreis von 0,51 USD pro 1 Million Token an. Laut Unternehmensangaben seien die Kosten für Ausgabe-Token im Vergleich zu Anbietern wie AtlasCloud FP8 und SiliconFlow FP8 um bis zu 79 % niedriger.

Dieser Schritt von FAR Labs erfolgt zu einer Zeit, in der KI-Unternehmen mit anderen wirtschaftlichen Herausforderungen konfrontiert sind als in den frühen Jahren. Obwohl die Token-Stückpreise drastisch gesunken sind, steigen die Gesamtausgaben für Inferenz weiter an, da Unternehmen über Kundensupport-Tools, Agenten, Assistenten, Spiele und interne Workflows mehr KI-Anfragen abwickeln. Dieser Wandel ist besonders wichtig für Entwickler, die auf proprietäre APIs von Unternehmen wie OpenAI und Anthropic angewiesen sind. Mit der Skalierung von Produkten können wiederkehrende Inferenzkosten die Gewinnmargen schmälern und den Spielraum für Tests und Expansion einschränken.

FAR Labs gibt an, dass sein Preisvorteil auf der Nutzung unterausgelasteter Rechenressourcen beruht, anstatt auf großen, speziellen Rechenzentrumsclustern. Die Plattform nutzt verfügbare GPU-Kapazitäten von Verbrauchergeräten sowie Rechenzentren kleiner und mittlerer Unternehmen und verteilt die Arbeit über seine leistungsorientierte Orchestrierungsschicht. Das Unternehmen versucht auch, über den Preis hinausgehende Probleme zu adressieren, und erklärt, dass Entwickler, die Produktions-Workloads betreiben, Systeme benötigen, die privat, zuverlässig im Routing, mit niedriger Latenz und für reale Szenarien nutzbar sind. Die Orchestrierungsschicht umfasst sicheres Inferenzieren auf Basis vertrauenswürdiger Ausführungsumgebungen, Zuverlässigkeitsbewertungen, Unterstützung für Open-Source- und proprietäre Modelle sowie semantische Vektor-Streams. Laut FAR Labs ist das Routing-System auf Betriebszeit, Workload-Kontinuität und latenzempfindliche Leistung ausgelegt.

Das Unternehmen gibt an, dass während der SuperAI Singapore-Konferenz in mehreren Gesprächen mit Entwicklern, GPU-Anbietern, Modellteams, Investoren und Führungskräften von Unternehmen Interesse an dieser Art von Infrastruktur geäußert wurde, was auf einen Bedarf an schnellerer, zuverlässigerer, kostengünstigerer und für die Produktion geeigneter Inferenzinfrastruktur hindeutet. FAR AI befindet sich derzeit in der Testphase mit geschlossenen Partnern und bietet Entwicklern eine frühzeitige Zugangsregistrierung sowie 1 Million kostenlose Token für diejenigen, die dem Programm beitreten.

In einer Erklärung erläuterte Ilman Shazhaev, Gründer und CEO von Dizzaract, die Marktbegründung des Unternehmens. „Die Preise für KI sinken ständig. Seit 2021 sind die Kosten pro Token um etwa 99 % gefallen. Dennoch steigen die KI-Rechnungen, weil die Nutzung schneller wächst als die Preise fallen. Inferenz wird zum größten Einzelkostenfaktor in der KI“, sagte er. „Unser Kostenvorteil ist kein Verlustbringer-Rabatt. Er ist strukturell.“

Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.