de.wedoany.com-Bericht: Am 24. Juni haben OpenAI und Broadcom gemeinsam den ersten intelligenten Prozessor Jalapeño vorgestellt. Dieser Chip wurde speziell für die Inferenz großer Sprachmodelle (LLM) entwickelt und ist der erste KI-Beschleuniger einer gemeinsam entwickelten, mehrgenerationalen Computing-Plattform. Ziel ist es, die Geschwindigkeit, Zuverlässigkeit und Verfügbarkeit von KI-Diensten zu verbessern und fortschrittliche KI-Fähigkeiten effizienter in größeren Bereitstellungsszenarien einzusetzen. OpenAI bezeichnet Jalapeño als seinen ersten Intelligence Processor, dessen Architektur auf die zukünftigen Anforderungen der LLM-Inferenz ausgelegt ist.
Jalapeño ist keine bloße Umwandlung eines universellen KI-Beschleunigers in einen Inferenzchip, sondern wurde basierend auf den Anforderungen der bei OpenAI täglich betriebenen Modelle, Kernel, Servicesysteme und Produkte neu entwickelt. In der Ankündigung betonte OpenAI, dass der Chip auf die Betriebscharakteristiken von ChatGPT, Codex, der API und zukünftigen Agentenprodukten ausgerichtet ist und dabei die Effizienz von Berechnung, Speicherzugriff, Netzwerkverbindung und Scheduling bei der Inferenz großer Modelle optimiert. Für LLM-Dienste ist die Inferenz direkt entscheidend für die Wartezeit der Nutzer, die Stabilität der Systemantwort und die Kosten pro Recheneinheit. Eine Chip-Architektur, die den Datentransfer reduziert und die Hardware-Auslastung erhöht, kann in groß angelegten Diensten eine höhere Effizienz freisetzen.
OpenAI gab an, dass die technischen Muster von Jalapeño im Labor bereits Machine-Learning-Workloads, darunter GPT-5.3-Codex-Spark, mit der Zielfrequenz und dem Zielstromverbrauch ausführen. Das Unternehmen hat noch keine endgültigen Leistungstestergebnisse veröffentlicht, aber frühe Tests zeigen, dass die Leistung pro Watt von Jalapeño das derzeitige Spitzenniveau deutlich übertreffen wird. OpenAI kündigte zudem an, in Kürze einen detaillierteren technischen Bericht zu veröffentlichen, der die Leistung des Chips in Bezug auf Inferenz, Energieeffizienz und Systembereitstellung weiter erläutert.
Die Entwicklungszeit für diesen Chip wurde auf neun Monate verkürzt. OpenAI erklärte, dass Jalapeño vom ersten Design bis zur Fertigung und Tape-out gemeinsam von beiden Unternehmen entwickelt wurde, wobei OpenAIs Modelle einen Teil des Designs und der Optimierungsarbeit beschleunigten. Chipdesign umfasst typischerweise mehrere Phasen wie Architekturdefinition, Verifikation, physische Implementierung, Softwareanpassung und Fertigungsvorbereitung, was langwierig und risikoreich ist. Dieses Projekt integrierte Modellfähigkeiten in den Chipdesignprozess und zeigt, dass KI-Tools Einzug in die Halbleiterforschung und -entwicklung selbst halten. Broadcom ist für die Siliziumimplementierung und Netzwerktechnologieunterstützung verantwortlich; Technologien wie der Tomahawk-Netzwerkchip werden an der skalierbaren Produktion der Plattform beteiligt sein.
OpenAI ordnet Jalapeño zudem in eine längerfristige, umfassende Infrastrukturstrategie ein. Das Unternehmen wurde bisher hauptsächlich als Entwickler von Modellen und KI-Produkten angesehen. Mit der Einführung eines selbst entwickelten intelligenten Prozessors erweitert es seine Fähigkeiten nun auf Chip-Architektur, Speichersysteme, Netzwerke, Scheduling und Bereitstellungssysteme. Greg Brockman, Präsident und Mitgründer von OpenAI, bezeichnete Jalapeño als Teil der langfristigen, umfassenden Infrastrukturstrategie des Unternehmens, mit dem Ziel, Rechenressourcen reichlicher verfügbar zu machen und KI schneller, zuverlässiger und erschwinglicher zu gestalten.
Gemäß der Planung beider Unternehmen wird Jalapeño den ersten Schritt einer mehrgenerationalen Computing-Plattform darstellen. Die erste Bereitstellung ist für Ende 2026 geplant und soll in den folgenden Jahren weiter ausgebaut werden. Die Plattform wird die von OpenAI entwickelten Beschleuniger, die Siliziumimplementierung, Netzwerk- und Verbindungstechnologien von Broadcom sowie die Fähigkeiten von Celestica in den Bereichen Platinen, Racks und Systemintegration kombinieren. Hock Tan, Präsident und CEO von Broadcom, erklärte, dass die Zusammenarbeit die Bereitstellung von Gigawatt-Rechenzentren gemeinsam mit Microsoft und anderen Partnern unterstützen werde.
Für OpenAI liegt die Bedeutung des Inferenzchips darin, die Kosten und die Antwortgeschwindigkeit von Large-Model-Diensten weiter in den eigenen Einflussbereich zu bringen. Das Training bestimmt die Leistungsgrenze eines Modells, die Inferenz entscheidet darüber, ob das Modell stabil und kostengünstig die Nutzer erreichen kann. Mit steigenden Aufrufzahlen von ChatGPT, Codex, der API und Agentenprodukten muss die Inferenzinfrastruktur gleichzeitig Durchsatz, Latenz, Energieverbrauch und Zuverlässigkeit bewältigen. Wenn Jalapeño in der anschließenden Bereitstellung die Erwartungen erfüllt, wird es OpenAI eine neue Hardwaregrundlage bieten, um die Kosten für KI-Dienste zu senken und die Stabilität des Modellzugriffs zu verbessern.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









