Warum hat Edge Computing endlich seine Killer-Applikation?

Der Edge-Computing hat die theoretische Argumentationsphase von "Warum brauchen wir es?" hinter sich gelassen und ist in die Projektumsetzungsphase von "Wie bauen wir es gut auf?" eingetreten.

In den letzten zehn Jahren war Edge Computing ein beliebtes Thema auf verschiedenen Konferenzen.

Zu Beginn konzentrierte sich die Branche auf die Fragen, "Was ist Edge Computing?" und "Warum brauchen wir es?". Es gab Debatten über Definitionen wie "ferner Rand", "naher Rand" und "Netzwerkrand". Später wurde Edge Computing mit 5G, der industriellen Internetplattform und dem Internet der Fahrzeuge verknüpft. Die zentralen Schlagwörter wurden "Echtzeitfähigkeit" und "örtliche Entscheidungsfindung". Netzbetreiber und Gerätehersteller begannen, die MEC (Multi-Access Edge Computing)-Architektur zu fördern. Später, als das Konzept klarer wurde, begann die AI-Inferenz am Rand zu erfolgen. Kameras, Roboter und industrielle Geräte können nicht nur Daten sammeln, sondern auch lokal analysieren und in Echtzeit reagieren. Heute, mit dem Aufstieg von generativer KI und Agenten, hat sich der Schwerpunkt der Branchendiskussion von "Verlagerung der Rechenleistung nach unten" auf "verteilte intelligente Kooperation" verschoben - viele früher nur theoretische Edge-Computing-Ideen werden jetzt in realen Branchenscenarien beschleunigt umgesetzt.

Kürzlich diskutierten mehrere Experten aus Jones Lang LaSalle, Intel, Ericsson, Qualcomm und American Tower Corporation auf einer ausländischen Fachkonferenz über die neuesten Trends im Edge Computing. Die Teilnehmer kamen aus verschiedenen Teilen der Wertschöpfungskette, wie Immobilien, Chips, Kommunikationsgeräten und Turm-Infrastruktur. Viele Ansichten waren sehr anregend, und dieser Artikel fasst und teilt sie zusammen.

Die "verspätete" Killer-Applikation: AI-Inferenz

Die Teilnehmer versuchten nicht, eine einheitliche Definition für "Edge" zu geben, sondern bildeten einen Konsens über ein "Kontinuum", d. h. eine flexible und programmierbare Ausführungsumgebung, die sich vom Zentralcloud über die regionale bis zur lokalen und Unternehmensgrenze erstreckt. In diesem System werden Workloads je nach Latenz, Datenschutz, Sicherheit und Kostenanforderungen dynamisch an verschiedenen Orten platziert.

Ein besonders bemerkenswerter Standpunkt in dieser Diskussion war: AI-Inferenz wird zur echten "Killer-Applikation" im Edge Computing.

Jim Poole von American Tower Corporation fasste die Entwicklung von MEC in den letzten zehn Jahren mit einem anschaulichen Satz zusammen: "MEC ist wie jemand, der nach einem Hammer für seinen Nagel sucht." Multi-Access Edge Computing (MEC) ist eine Netzwerkarchitektur, die Cloud-Rechenleistung und IT-Serviceumgebungen am Netzwerkrand bietet. Ziel ist es, die Latenz zu verringern, die effiziente Netzwerkbetreuung und -dienstleistung sicherzustellen und die Kundenerfahrung zu verbessern.

Aus der Definition von MEC lässt sich ableiten, dass die Branche frühzeitig vorhersehen konnte, dass es in Zukunft eine verteilte Rechenschicht brauchen würde. Deshalb haben Netzbetreiber und Infrastrukturhersteller viele Edge-Knoten vorab installiert. Das Problem war jedoch, dass es damals keine Geschäftsszenarien gab, die diese Knoten wirklich benötigten. Mit anderen Worten, die Infrastruktur war der Nachfrage voraus. Diese Einschätzung erklärt auch, warum Edge Computing in den letzten Jahren zwar viel Aufmerksamkeit erregte, aber wenig Ergebnisse zeigte. Obwohl industrielles Internet, VR/AR oder das Internet der Fahrzeuge als wichtige Richtungen für Edge Computing angesehen wurden, konnten diese Szenarien nie genügend und anhaltende Rechenleistungserfordernisse schaffen.

Der Unterschied heute liegt in einer grundlegenden Veränderung auf der Nachfrageseite. Mit der Verbreitung von generativer KI müssen alle Anfragen und Datenquellen, egal welche Antwort der Benutzer möchte, hochgeladen werden. Die von der lokalen Seite generierten Rohdaten wie hochauflösende Bilder, Audio- und Videoströme müssen in Echtzeit in die Cloud hochgeladen und verarbeitet werden. Dies hat in den letzten Jahren zu einem starken Anstieg des Upload-Datenvolumens geführt. Dr. Koymen von Qualcomm sagte, dass sich das Verhalten der Benutzer von der Video-Konsumtion über die Downlink-Verbindung hin zur AI-generierten Datenverkehr über die Uplink-Verbindung verschiebt. Agenten-Daten werden in den nächsten Jahren die von Menschen generierten Daten übertreffen. Joe Constantine von Ericsson zitierte Daten aus dem "Ericsson Mobility Market Report", um dies zu untermauern: Der globale Datenverkehr wird bis 2029 verdreifachen, und bis 2035 wird der Uplink-Datenverkehr um das Zehnfache steigen.

Dieses neue Modell mit den Merkmalen "Upload - Inferenz - Reaktion" stellt bisher nie dagewesene Anforderungen an die Netzwerklatenz und -bandbreite. Hier kommt Edge Computing ins Spiel. Sean Farney von Jones Lang LaSalle sagte: "Edge AI-Inferenz macht die Infrastrukturbranche wieder attraktiv." Nach 20 Jahren des Strebtens hat die Branche endlich die echte Killer-Applikation gefunden - AI-Inferenz. Sie hat zwei Schlüsselmerkmale: eine hohe Rechenleistung und eine hohe Empfindlichkeit gegenüber Latenz. Diese beiden Faktoren "zwingen" die Rechenleistung, sich von zentralisierten Cloud-Datencentern nach außen zu verteilen.

KI zwingt die Datencenter-Architektur "neu zu schreiben"

Wie wird ein echter Edge-Knoten in der KI-Zeit aussehen? Poole gab eine beeindruckende Statistik: In den letzten 25 Jahren wurden weltweit etwa 95 % der Datencenter auf eine Leistungsdichte von 5 - 10 kW pro Rack ausgelegt. Heute erreichen die neuen KI-Systeme eine Leistungsdichte von 150 - 200 kW pro Rack, und Google hat sogar eine Konfiguration von 1 MW pro Rack gezeigt.

Dies ist nicht nur ein Problem, das durch eine Optimierung der Luftführung gelöst werden kann. Es bringt zwei Veränderungen mit sich - erstens wird es für Unternehmen immer schwieriger, eigene Datencenter zu bauen. Poole sagte, dass in den letzten zwanzig Jahren der größte Wettbewerber in der Datencenterbranche die internen Rechenzentren der Unternehmen war. Aber jetzt, mit der starken Zunahme der Komplexität und der Leistungsdichte der KI-Infrastruktur, wird das Selbstbau-Modell immer unbrauchbarer. "Man kann nicht mehr einfach ein eigenes Datencenter bauen und das Problem lösen."

Zweitens wird die Flüssigkeitskühlung von einer "fortgeschrittenen Lösung" zur Branchen-Standard, und die On-Site-Stromerzeugung wird in einigen US-Bundesstaaten sogar von einer "Option" zu einer behördlichen Anforderung.

Zur gleichen Zeit ändert sich auch die geografische Verteilung der Rechenleistungsinfrastruktur. Derzeit ist der Großteil der Rechenleistung in Nordamerika noch in etwa 15 Kernstadtregionen konzentriert. Aber Poole prognostiziert, dass die Branche in einem viel kürzeren Zeitraum als in den letzten 25 Jahren auf 30 - 50 Zweit- und Drittstädte ausweiten wird.

Das eigentliche ungelöste Problem ist, ob die zukünftige Edge-Infrastruktur "zentralisiert" oder "dezentralisiert" sein wird: Wird es 300 Datencenter mit 10 MW Leistung in ganz Amerika geben, oder werden 2000 Edge-Racks mit 60 kW Leistung neben jedem Kommunikationsturm installiert? Die Turmgesellschaften neigen eindeutig zu letzterem.

Als Vertreter der Chiphersteller hat Qualcomm einen anderen Blickwinkel eingebracht: Nicht alle AI-Inferenzaufgaben müssen auf GPUs ausgeführt werden. Koymen meint, dass GPUs zwar gut für das Modelltraining geeignet sind, aber in Inferenzszenarien zu teuer und stromintensiv sind. Im Vergleich dazu sind die speziell für die Inferenz optimierte NPUs, die an Endgeräten und am äußeren Rand platziert werden, besser für die leichten Inferenzaufgaben im Edge-Kontinuum geeignet.

In gewisser Weise bringt die KI die Datencenter wieder in die "Schwerindustrie". Dies bedeutet auch, dass der Wettbewerb im Edge Computing sich von der Softwarefähigkeit hin zu den Fähigkeiten in Energie, Immobilien und Infrastruktur verschiebt, d. h. wer schneller Zugang zu Land, Strom, Kühlung und Installationsressourcen hat - deshalb sind auch Immobilien- und Turm-Infrastrukturunternehmen an dieser Diskussion beteiligt.

2028 - 2029: Wohin geht die Branche?

Angesichts der bevorstehenden Veränderungen haben die Experten auch konkrete Prognosen für die Branchenlage in den Jahren 2028 - 2029 gegeben.

Koymen von Qualcomm verknüpfte seine Prognose mit seiner 6G-Roadmap: 2028 werden vorkommerzielle Geräte erscheinen, und 2029 wird die Kommerzialisierung zusammen mit den globalen Netzbetreibern erfolgen. Zu diesem Zeitpunkt wird die Edge-Infrastruktur Anwendungen wie AI Recall, AR-Brillen mit "What You See Is What You Get" und verteilte Rechenleistung für Roboter unterstützen.

Constantine von Ericsson gab drei quantifizierte Einschätzungen: Erstens wird bis 2029 75 % des globalen Datenverkehrs über 5G-Netze laufen. Zweitens wird die Branche nicht mehr darüber streiten, "was Edge Computing ist", sondern über Service Level Agreements (SLA) und die TM Forum-Stufe 4/5-Automatisierung - dies ist ein Zeichen für die Reife der Branche. Drittens wird der Druck für die nachhaltige Entwicklung der Datencenter die wichtigste Designbeschränkung werden.

Agarwal von Intel machte eine Prognose, die eher auf die Branchenumsetzung abzielt. Er meint, dass bis 2028 die Branchenkonferenzen völlig anders aussehen werden. Auf der Bühne werden nicht mehr Gerätehersteller über Architekturen berichten, sondern Händler, Bergbauunternehmen und Hafenbetreiber über die tatsächlichen Renditen ihrer Installationen. Er warnt die Branche davor, die Fehler bei privaten drahtlosen Netzen zu wiederholen: Die Netze wurden gebaut, aber es gab keine erfolgreichen Fälle.

Farney machte die langfristigste Prognose: Humanoid-Roboter werden in den Datencenterbetrieben auftauchen, um die große Arbeitskräfte-Lücke zu füllen. Das Konzept des "physikalischen KI" wird zur Realität - NVIDIA und T-Mobile haben angekündigt, zusammenzuarbeiten und AI-RAN-Infrastruktur am Rand des 5G-Netzes zu installieren. Dadurch können KI-Agenten in städtischen Kreuzungen und industriellen Anlagen in Echtzeit reagieren, und die Anforderungen an die Endgeräte werden dank der Edge-Rechenleistung stark reduziert.

Abschluss

Im Vergleich zur Technologie selbst hat diese Diskussion am Ende einige realistischere Probleme aufgedeckt: Strom, Fachkräfte und Daten.

Zuerst der Strom: Die AI-Inferenz führt zu einem starken Anstieg der Rechenleistungserfordernisse, aber die globale Netzausbau-Geschwindigkeit kann nicht mitkommen. Poole sagte sogar, dass das US-Elektrizitätsnetz nicht für diese lokale, hochdichte Belastung ausgelegt ist. Zweitens die Fachkräfte: Nur bei Jones Lang LaSalle gibt es derzeit tausende offene Stellen in Bezug auf Datencenter. Drittens die Daten: Constantine machte eine bemerkenswerte Einschätzung - die zukünftig erfolgreichen Unternehmen sind möglicherweise nicht diejenigen mit den besten Modellen, sondern diejenigen mit dem besten Daten-System. Denn mit der zunehmenden Ähnlichkeit der Modellfähigkeiten werden die Datenqualität, -struktur und -verwaltung wahrscheinlich die eigentlichen Wettbewerbsvorteile in der KI-Branche sein.

Insgesamt wird ein klares Bild sichtbar: Edge Computing hat die theoretische Phase, in der man sich fragte, "warum wir es brauchen", hinter sich gelassen und ist in die praktische Phase, in der man sich fragt, "wie wir es bauen können", eingetreten.

Quellen: Why the edge finally has its killer use case - RCRWirelessDie Zeit hat sich gewandelt, "großer Upload" wird zum Fokus der Kommunikationsnetzwerk-Upgrades - moomooWas ist Multi-Access Edge Computing (MEC)? - Redhat

Dieser Artikel stammt aus dem WeChat-Account "Internet der Dinge Think Tank" (ID: iot101), Autor: Sophia, veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。