de.wedoany.com-Bericht: KI bringt eine Reihe neuer Anforderungen für HPC-Zentren mit sich. Forscher konzentrieren sich nicht mehr nur auf das Training von Modellen; viele suchen nun nach Inferenzdiensten und KI-Agenten als Teil ihrer täglichen Forschung. Für HPC-Zentren bedeutet dies, herauszufinden, wie diese Dienste in großem Maßstab bereitgestellt und mit der bestehenden HPC-Infrastruktur zusammenarbeiten können.
Diese Fragen standen im Mittelpunkt der TPC26-Session „Wissenschaftliche KI-Plattformen: Inferenz, Agenten und KI-Dienste für HPC-Einrichtungen“. Die Diskussion brachte Redner aus nationalen Laboren, Supercomputing-Zentren, der Industrie und Forschungseinrichtungen zusammen, die ihre Erfahrungen beim Aufbau und Betrieb von KI-Diensten für Forscher teilten. Zu den Teilnehmern gehörten Dr. İlkay Altıntaş, Chief Data Science Officer am San Diego Supercomputer Center und Principal Investigator der National Data Platform; Dr. Venkat Vishwanath, KI-Leiter am Argonne Leadership Computing Facility; Dr. Jason Haga vom japanischen National Institute of Advanced Industrial Science and Technology (AIST); Samantha Sury von HPE; Dr. Paola Buitrago vom Pittsburgh Supercomputing Center; Dr. Shoaja Fan; sowie Dr. Dan Stanzione, Executive Director des Texas Advanced Computing Center (TACC).

Dr. Altıntaş eröffnete die Diskussion mit einem Überblick über die National Research Platform, die Forschern über gemeinsame Dienste Zugang zu KI-Modellen bietet. Dr. Altıntaş betonte, dass die Plattform auf drei verschiedenen Ebenen betrachtet werden müsse, darunter die Infrastrukturebene mit Rechenleistung, Speicher und allem, was dazugehört – ähnlich wie HPC-Dienste, jedoch mit Tokens anstelle von Kernstunden. Die National Research Platform bietet derzeit neun offene Modelle an und zielt darauf ab, Forschern KI-Fähigkeiten zu ermöglichen, ohne dass sie ihre eigene Infrastruktur bereitstellen und verwalten müssen. Dieses Thema zog sich durch die gesamte Sitzung, während die Redner diskutierten, wie HPC-Zentren auf die wachsende Nachfrage nach Inferenzdiensten und KI-Tools reagieren können.
Der Aufbau dieser Dienste erfordert zudem eine speziell für Inferenz ausgelegte Infrastruktur. Dr. Hagas Vortrag konzentrierte sich auf die japanischen Bemühungen, im Rahmen der National Testbed Initiative eine Reihe von KI-Beschleunigern und Inferenztechnologien zu evaluieren. Haga erklärte, dass das Programm eine Vielzahl modernster KI-Beschleuniger evaluiert und Techniken entwickelt, um leistungsstarke Inferenzdienste sowie praktische Zugangsmethoden zu diesen unterschiedlichen Rechenressourcen bereitzustellen. Für Forscher ist die Hardware selbst oft zweitrangig; entscheidend ist, ob der Dienst verfügbar ist, gute Leistung bietet und sich in ihre Arbeit integrieren lässt, ohne dass sie Experten werden müssen. Das Projekt soll Forschern helfen, verschiedene KI-Hardwareplattformen auszuprobieren, und bietet einen Rahmen für die Bereitstellung von Inferenzdiensten, um zu untersuchen, wie ein breiteres Spektrum an Beschleunigern zukünftige wissenschaftliche KI-Workloads unterstützen kann.
Die Vorträge unterstrichen die Herausforderungen für HPC-Einrichtungen: Forscher kümmern sich nicht darum, welche Hardware im Hintergrund läuft, erwarten aber zunehmend, dass KI-Dienste bei Bedarf jederzeit verfügbar sind.

Obwohl sich die Diskussion hauptsächlich auf Infrastruktur und Technologie konzentrierte, argumentierte Dr. Stanzione, dass wirtschaftliche Fragen letztlich die größere Herausforderung darstellen könnten. Stanzione wies darauf hin, dass Tokens tatsächlich Geld kosten, und viele Labore in den letzten Monaten über die Aufgabe der Nutzung diskutiert hätten, wenn Menschen sie in großem Umfang verwenden. Mit der zunehmenden Verfügbarkeit von KI-Diensten steigt die Nutzung rapide an, was eine Reihe von Belastungen mit sich bringt, die sich von traditionellen HPC-Workloads unterscheiden, insbesondere wenn Institutionen versuchen, die wachsende Nachfrage mit begrenzten Budgets in Einklang zu bringen. Laut Stanzione könnte die langfristige Herausforderung nicht der Bau von Inferenzplattformen sein, sondern die Suche nach nachhaltigen Betriebsweisen. Er sagte, dass unter den vielen technischen Fragen der finanzielle Aspekt auf lange Sicht das Handeln mehr als jeder andere Faktor bestimmen könnte.
Die Diskussion zeigte, wie HPC-Einrichtungen sich an die nächste Phase der KI-Anwendungen anpassen. Obwohl der Großteil der Aufmerksamkeit der Branche weiterhin auf Modellen und Hardware liegt, kamen die Redner immer wieder auf die praktischen und unvermeidlichen Realitäten der Bereitstellung von KI als Dienst zurück. Von gemeinsamen Inferenzplattformen und Beschleuniger-Testbeds bis hin zur Ökonomie des Token-Verbrauchs – die in den Vorträgen diskutierten Herausforderungen deuten darauf hin, dass die Zukunft der wissenschaftlichen KI gleichermaßen von Betrieb und Infrastruktur sowie von Fortschritten bei den Modellen selbst abhängen könnte.
Dieser Artikel wurde von Wedoany übersetzt und bearbeitet. Bei jeglicher Zitierung oder Nutzung durch künstliche Intelligenz (KI) ist die Quellenangabe „Wedoany“ zwingend vorgeschrieben. Sollten Urheberrechtsverletzungen oder andere Probleme vorliegen, bitten wir Sie, uns unverzüglich zu benachrichtigen. Wir werden den entsprechenden Inhalt umgehend anpassen oder löschen.
E-Mail: news@wedoany.com









