de.wedoany.com-Bericht: Kürzlich plant das US-amerikanische KI-Inferenz-Chip-Unternehmen Groq, bei bestehenden Investoren bis zu 650 Millionen US-Dollar einzuwerben, um sein KI-Inferenz-Neocloud-Geschäft voranzutreiben. Dieser Finanzierungsplan erscheint, nachdem Groq eine große Lizenzvereinbarung mit Nvidia getroffen hat, und zeigt, dass das Unternehmen seinen Schwerpunkt weiter auf Inferenz-Cloud-Dienste verlagert, die auf selbst entwickelten Chips und Systemen basieren.
Groq trat ursprünglich mit selbst entwickelten Language Processing Unit (LPU)-Chips in den KI-Rechenmarkt ein und konzentrierte sich auf Inferenzszenarien für große Modelle. Im Vergleich zum Training übernimmt die Inferenz die Antwort-, Generierungs-, Aufruf- und Servicebereitstellung nach der Inbetriebnahme des Modells und wirkt sich direkt auf Latenz, Durchsatz, Kosten und Benutzererfahrung von KI-Anwendungen aus. Da große Modelle von der Test- in die Produktionsumgebung übergehen, benötigen Unternehmen nicht nur Rechenleistung für das Training, sondern auch eine Infrastruktur, die Chatbots, Codegenerierung, suchgestützte Funktionen, intelligente Kundendienste, Unternehmensagenten und multimodale Anwendungen stabil unterstützen kann. Der Begriff Neocloud bezieht sich in der Regel auf neue Cloud-Service-Anbieter oder spezialisierte Cloud-Plattformen für KI-Workloads, deren Kernkompetenz nicht in traditionellen universellen Cloud-Ressourcen liegt, sondern in der Fähigkeit zur Bereitstellung von Rechenleistung, die auf GPUs, speziellen KI-Chips, Inferenz-Engines, Modelldiensten und hochgradig paralleler Planung basiert. Die geplante Finanzierung von Groq zielt genau darauf ab, die Chipfähigkeiten weiter zu einem kundenorientierten Inferenz-Cloud-Dienst zu bündeln, anstatt nur beim Hardwareverkauf oder der Demonstration einzelner Chipleistungen stehen zu bleiben.
Dieser Finanzierungsplan spiegelt auch wider, dass sich der Markt für KI-Infrastruktur vom „Kampf um Trainingsrechenleistung" auf die „Bereitstellung von Inferenzdiensten" ausdehnt. Groq hatte zuvor im Jahr 2024 eine Series-D-Finanzierungsrunde über 640 Millionen US-Dollar abgeschlossen und erreichte eine Bewertung von 2,8 Milliarden US-Dollar. Die Mittel sollten unter anderem für den Ausbau der KI-Inferenz-Recheninfrastruktur und der Rechenzentrumskapazitäten verwendet werden. Mit steigendem Aufrufvolumen generativer KI-Anwendungen werden die Inferenzkosten zu einem der Hauptbelastungsfaktoren für die kontinuierliche Nutzung von KI durch Unternehmen. Inferenzplattformen mit niedriger Latenz, hohem Durchsatz und Skalierbarkeit erhalten daher leichter Marktaufmerksamkeit. Informationen von Axios und Reuters zufolge plant Groq, bei bestehenden Investoren bis zu 650 Millionen US-Dollar einzuwerben, was extern auch als „Phase Zwei"-Strategie des Unternehmens nach dem Lizenzabkommen mit Nvidia angesehen wird. Es ist zu beachten, dass es sich hierbei noch um eine geplante Finanzierung und Marktberichterstattung handelt und nicht direkt geschrieben werden kann, dass die Finanzierung bereits abgeschlossen ist, noch dass das Inferenz-Neocloud-Geschäft von Groq bereits signifikante kommerzielle Einnahmen generiert.
Der Fokus der weiteren Beobachtung wird darauf liegen, ob Groq die Finanzierung über 650 Millionen US-Dollar abschließt, auf der Bewertung und der Investorenstruktur nach der Finanzierung, dem Expansionstempo der Inferenz-Neocloud-Plattform sowie darauf, ob seine LPU-Architektur bei hochgradig parallelen Aufrufen großer Modelle weiterhin Kosten- und Latenzvorteile aufweisen kann. Die geplante Finanzierung des US-Unternehmens Groq zur Erweiterung des Inferenz-Neocloud-Geschäfts zeigt, dass sich der Wettbewerb um KI-Rechenleistung von Chip-Hardware und Trainingsclustern weiter zu kommerziell lieferbaren Inferenz-Cloud-Plattformen und unternehmensgerechten KI-Servicefähigkeiten verlagert.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









