Südkoreanische Softwareunternehmen setzen auf Technologiemix, um steigende Token-Kosten durch KI-Agenten zu bewältigen_Weltnachrichten_Wedoany.com

Startseite Nachrichten Details

Südkoreanische Softwareunternehmen setzen auf Technologiemix, um steigende Token-Kosten durch KI-Agenten zu bewältigen

2026-07-02 08:57

Merken

de.wedoany.com-Bericht: Südkoreanische Softwareunternehmen senken die durch die Verbreitung von KI-Agenten drastisch gestiegenen Token-Kosten durch eine Kombination verschiedener Technologien wie Prompt-Optimierung, LLM-Gateways, lokale Bereitstellung und Multi-Modell-Strategien.

[Bildquelle: generiert von nanobanana2]

KI-Agenten rufen zur Erfüllung von Aufgaben mehrfach selbstständig Sprachmodelle auf und führen verschiedene Tools aus, was den Token-Verbrauch im Vergleich zur menschlichen Nutzung um ein Vielfaches bis zu mehreren Dutzend Mal erhöht. Ein südkoreanisches Unternehmen hat seit diesem Jahr unternehmensweit KI-Agenten eingeführt, die monatlich etwa 250 Milliarden Token verbrauchen und monatliche Infrastrukturkosten in Höhe von 200 bis 300 Millionen Won verursachen.

Einige Unternehmen beginnen mit der Verschlankung von Prompts und Caching. WISEITECH reduziert unnötig lange Eingaben und wiederholte Aufrufe, während Naver Cloud die Modelle je nach Aufgabe optimiert. Unternehmen betrachten LLM-Gateways zunehmend als zentrale Kontrollknoten, um die Modellnutzung der Abteilungen in Echtzeit zu überwachen. Hancom integriert Routing- und Fallback-Systeme, NDS baut Gateways auf Basis von LiteLLM.

Lokale Bereitstellungslösungen werden ebenfalls von mehreren Unternehmen eingesetzt. MakinaRocks verbindet Open-Source-Modelle mit der eigenen vLLM-Infrastruktur, S2W nutzt eigene GPU-Server für die Verarbeitung großer Aufgabenmengen. Multi-Modell-Strategien weisen standardisierte, wiederkehrende Aufgaben leichten oder Open-Source-Modellen zu. Crowdworks setzt auf kommerzielle Modelle wie Amazon Bedrock in Kombination mit Mini-Modellen. CyNapse Soft führt die Serena MCP- und LSP-Technologie ein, die Quellcode in semantische Einheiten segmentiert und im Vergleich zu Open-Source-Frameworks eine Token-Einsparung von etwa 20 % erzielt.

Die Kostenoptimierung im Zeitalter generativer KI stellt die Architekturfähigkeiten der Unternehmen auf die Probe. Der Aufbau eines umfassenden Kontrollsystems durch Caching zur Eliminierung doppelter Anfragen, lokale Bereitstellung zur Isolierung sensibler Daten und Routing zum Ersetzen teurer Modelle wird zum Maßstab für die Nachhaltigkeit von Softwareunternehmen.

IKT Technik für künstliche Intelligenz

Vorheriger Artikel：Brasiliens Präsident Lula plädiert für regionale Lieferketten für kritische Mineralien

Nächster Artikel：Rocket Lab übernimmt Iridium für 8 Milliarden US-Dollar

Angebotsgespräch

Ka-Band Phased-Array-Antennen-Sende-Subarray

COXSAT TECHNOLOGY CO., LTD.

Angebotsgespräch

Singlemode-Glasfaser G.652B

SHENZHEN SDG INFORMATION CO., LTD.

Angebotsgespräch

Intelligentes Überwachungssystem für Förderbänder

LUO YANG WIRE ROPE INSPECTION TECHNOLOGY CO., LTD.

Angebotsgespräch

TWP16 P-Band-Troposphären-Windprofiler-Radar

China Huayun Meteorological Technology Group Co., Ltd.

Angebotsgespräch

Elektrohydraulisches Steuerungssystem für SAC-Hydraulikausbaugestelle

Beijing Tianma Intelligent Control Technology Co., Ltd.

Angebotsgespräch

Tragbares Satellitenterminal mit Flachbildschirm – manuelles tragbares Terminal mit 0,35-Meter-Öffnung

China Starwin Science & Technology co., Ltd.

Angebotsgespräch

QPS-20A schnelles Umschaltgerät für redundante Stromversorgung

CHN ENERGY ZHISHEN CONTROL TECHNOLOGY CO., LTD.

Angebotsgespräch

Industrieschalter für den Hausgebrauch

Shenzhen Yuhang Communication Technology Co., Ltd.

Angebotsgespräch /Set

Baolande Application Server Software V9.5

Beijing Baolande Software Corporation

Angebotsgespräch

SIS-Sicherheitsinstrumentierungslösung

Beijing Consen Automation Technology Co., Ltd.

Angebotsgespräch /Set

Kollaboratives Energiemanagement- und Steuerungssystem für Cloud, Edge und Endgeräte

Beijing Agent Devote Power Technology Development Co., Ltd.

Angebotsgespräch

FAO (Autonome Fahrzeuge)

UniTTEC Co., Ltd.

Empfehlungen in Verbindung damit

IPO-Antrag von Weian Electronics in China angenommen, geplante Mittelaufnahme von 1,835 Milliarden Yuan

Portugal veröffentlicht 9-Milliarden-Parameter-Sprachmodell AMÁLIA

Londoner MDOTM sichert sich 27 Millionen US-Dollar Finanzierung

ULA plant Start von 29 Amazon-Leo-Satelliten am 2. Juli

Belgisches Aikido übernimmt israelisches Root, Transaktionsvolumen könnte 100 Millionen US-Dollar betragen

Onsemi stellt den VGA-Bildsensor ARX383CS vor

US-Startup Pie erhält 19,5 Millionen US-Dollar in Serie A, um kleinen Unternehmen bei der Anpassung an KI-Suche zu helfen

US-amerikanische FCC stimmt am 22. Juli über Satellitenlizenzreform und C-Band-Auktion ab

Upscale AI aus den USA sammelt insgesamt 500 Millionen US-Dollar für KI-Netzwerke ein

BTQ Technologies erhält französische Genehmigung zur Übernahme von QPerfect – Transaktionsvolumen 18,59 Millionen Euro

Neueste Nachrichten

Erfolgreiche Auslieferung von 45-Tonnen-Großzylindern durch Lanzhou Lanshi Superalloy

Kuwaitisches Zain ersteigert syrische 25-Jahres-Telekomlizenz für 747 Millionen US-Dollar

Magna AI und EEC bauen souveräne KI-Infrastruktur in Saudi-Arabien auf

Indiens Bundesstaat Telangana plant Bau einer 1500 Hektar großen Data Center City

Digital Realty übernimmt drei Hyperscale-Rechenzentren in Nord-Virginia für 3,5 Milliarden US-Dollar

VodafoneZiggo in den Niederlanden schließt Bereitstellung einer einheitlichen Störungsmanagement-Plattform ab

Chinas Xiaomi Auto liefert im Juni erneut über 30.000 Fahrzeuge aus, kumuliert rund 180.000 Einheiten im ersten Halbjahr

Google Cloud erweitert Spanner-Datenbank um Multi-Modell- und KI-Unterstützung

Nvidia-Ingenieur leitet Entwicklung des Open-Source-Roboter-Software-Stacks Isaac ROS

Chinesischer Autohersteller Leapmotor liefert im Juni weltweit 93.376 Fahrzeuge aus, ein Anstieg von 95 % im Jahresvergleich