100-GigE-Ethernet entfesselt

Diagramm zur Veranschaulichung der Verbindung von einer 100GigE-Kamera über eine 100GigE-Netzwerkkarte, Server und Softwareausgabe.

100GigE entfesselt: Sony-Sensoren treffen auf reale Hochgeschwindigkeitssystemarchitektur

Hochgeschwindigkeits-Bildverarbeitung hat die rein kamerazentrierte Denkweise hinter sich gelassen. Mit Sonys neuesten Pregius-S-Sensoren, die 100-GigE-Leistung für ein breiteres Spektrum industrieller Anwendungen ermöglichen, liegt die eigentliche Herausforderung nun in der Systemarchitektur: die reibungslose Übertragung massiver Bilddatenströme von der Kamera zum Host, zur GPU und zum Speicher. Dieser Artikel erläutert, wie optimiertes Zero-Copy-GVSP, GigE Vision 3.0/RDMA und Software-Tools wie eSDK Pro und eCapture Pro skalierbare, produktionsreife Pipelines ermöglichen.

Der Flaschenhals liegt nicht mehr in der Kamera, sondern im System.

Die meisten Bildverarbeitungsingenieure wissen genau, wann ein System ausfällt. Was sie oft nicht erklären können, ist die Ursache, denn die Kamerawerte sehen gut aus, die Schnittstelle arbeitet mit voller Bandbreite und die Hardware sollte eigentlich mehr als ausreichend sein. Die Antwort liegt bei immer mehr Hochgeschwindigkeitsinstallationen darin, dass das Problem woanders lag. Eine einzelne moderne Industriekamera kann mehr Daten pro Sekunde erzeugen, als ein komplettes Bildverarbeitungssystem vor zehn Jahren verarbeiten konnte. Installationen mit mehreren Kameras erreichen heute routinemäßig aggregierte Datenraten im Bereich von mehreren zehn Gigabyte pro Sekunde, und die Sensoren, die dazu in der Lage sind, sind weder exotisch noch teuer. Der Flaschenhals hat sich verlagert. Er befindet sich nicht mehr in der Kamera.

Dieser Wandel ist nicht nur eine technische Kuriosität. Er verändert die Schwerpunkte der Entwicklungsarbeit, die benötigten Kompetenzen von Systemintegratoren und die Auswahl der Anbieter mit der erforderlichen Erfahrung. Die Bildverarbeitung verlagert sich zunehmend von CPU-basierten Architekturen hin zu GPU-beschleunigten Pipelines, oft kombiniert mit Edge-Computing in Sensornähe. In diesen Umgebungen ist die Bildaufnahme zum einfachen Teil geworden. Die Datenverarbeitung entscheidet über Erfolg oder Misserfolg der Systeme.

In den letzten zehn Jahren hat sich die CMOS-Sensortechnologie rasant weiterentwickelt. Insbesondere Sony hat mit seinen Pregius- und Pregius-S-Plattformen, die zu einem Eckpfeiler moderner industrieller Bildgebung geworden sind, maßgeblich zu dieser Entwicklung beigetragen. Höhere Auflösungen, verbesserte Empfindlichkeit und stetig steigende Bildraten haben Anwendungen ermöglicht, die noch vor wenigen Jahren schwierig oder gar unmöglich waren. Doch dieser Fortschritt hat die eigentlichen technischen Herausforderungen in Bildgebungssystemen grundlegend verlagert. Lange Zeit war der Hauptengpass in der Hochleistungs-Bildverarbeitung entweder der Sensor selbst oder die Kameraschnittstelle zur Übertragung der Bilddaten an das Hostsystem. Heute ist dies zunehmend nicht mehr der Fall. Moderne Sensoren können enorme Datenströme erzeugen, und Schnittstellen mit hoher Bandbreite wie 100GigE sind problemlos in der Lage, diese zu übertragen. Die eigentliche Herausforderung beginnt erst, nachdem die Bilddaten die Kamera verlassen haben.

Diagramm zur Veranschaulichung der Verbindung von einer 100GigE-Kamera über eine 100GigE-Netzwerkkarte, Server und Softwareausgabe.

Konfigurationsdiagramm für ein 100-GigE-Kamerasystem

Die Konfiguration eines 100GigE-Kamerasystems, das sich mit Standard-Ethernet-Komponenten skalieren lässt.

Wenn PowerPoint Realität wird

In den letzten Monaten haben mehrere Kamerahersteller endlich ihre ersten 100GigE-Kameras auf den Markt gebracht – Plattformen, die zuvor jahrelang hauptsächlich in Produktplänen und Präsentationsfolien existierten. Ihre zunehmende Verfügbarkeit ist ein wichtiger Schritt für die Bildverarbeitungsbranche. Hochgeschwindigkeits-Ethernet-Bildgebung ermöglicht Anwendungen, die bisher spezialisierte und kostspielige Hardware-Schnittstellen erforderten, und lässt Bildverarbeitungssysteme sich modernen Rechenzentrumsarchitekturen annähern – mit all der damit verbundenen Flexibilität und Skalierbarkeit.

Was in der aktuellen Ankündigungswelle leicht übersehen wird, ist, dass Hochgeschwindigkeits-Ethernet-Bildgebung an sich nicht neu ist. Emergent Vision Technologies stellte seine ersten 10-GigE-Kameras vor über zwölf Jahren vor, gefolgt von 25-GigE-Plattformen vor über acht Jahren und 100-GigE-Kameras auf Basis von Gpixel-Sensoren vor über sechs Jahren. Von Anfang an waren diese Plattformen für Anwendungen konzipiert, bei denen herkömmliche Bildverarbeitungsarchitekturen schnell an ihre Grenzen stoßen: großflächige Inspektionssysteme mit mehreren Kameras, Studios für volumetrische Aufnahmen, wissenschaftliche Bildgebungsplattformen und Hochgeschwindigkeits-Bewegungsanalyse-Systeme, bei denen die Anzahl der Kameras nicht im einstelligen, sondern im Dutzendbereich liegt. Die über zehnjährige Erfahrung in diesen Umgebungen hat eine einfache Erkenntnis hervorgebracht: Die Kamera selbst war selten der eigentliche Flaschenhals. Der entscheidende Faktor war fast immer die dahinterliegende Systemarchitektur.

Diese Beobachtung ist nicht abstrakt. Ein kürzlich erfolgter Kundeneinsatz verdeutlicht sie. Ein Hersteller in der Lebensmittelverarbeitung benötigte ein KI-basiertes, automatisiertes optisches Inspektionssystem, das bis zu 21 Kameras gleichzeitig betreiben konnte. Alle Bilddaten sollten über einen einzigen Netzwerk-Switch an ein Host-System mit drei GPUs geleitet werden. Der kundeneigene KI-Inferenzcode lief direkt auf dieser Hardware und verarbeitete den gesamten Kamerastream in Echtzeit – ohne Toleranz für Frameverluste oder Verarbeitungsverzögerungen. Über zwei Jahre lang hatte der Kunde versucht, diese Architektur mit Kameras eines der weltweit größten Hersteller von Bildverarbeitungssystemen zu realisieren. Theoretisch war die Hardware geeignet. In der Praxis konnte das System jedoch bei der erforderlichen Kameraanzahl keinen stabilen Betrieb gewährleisten. Der CPU-Overhead durch Standard-GVSP-Implementierungen führte zu einer Auslastung des Hosts, lange bevor die GPU-Pipeline zum limitierenden Faktor wurde. Frameverluste, inkonsistente Latenz und unzuverlässige KI-Inferenzergebnisse waren die Folge. Als Emergent hinzugezogen wurde, lief das komplette 21-Kamera-System stabil auf demselben Host. Es nutzte 10GigE-Kameras in Kombination mit einem optimierten GVSP-Treiberstack und einer sofort einsatzbereiten Lösung auf Basis von eCapture Pro, Emergents Echtzeit-Software für die Mehrkamera-Datenerfassung und -verarbeitung mit grafischer Benutzeroberfläche für Systemeinrichtung, Überwachung und Datenverwaltung. Der KI-Inferenzcode des Kunden wurde als benutzerdefiniertes Plugin in dieses Framework integriert, wodurch die eingehenden Bildströme direkt und ohne zusätzlichen Datenverarbeitungsaufwand verarbeitet werden konnten. So entfiel der Aufwand, große Teile der Erfassungs-, Visualisierungs- und Laufzeitinfrastruktur von Grund auf neu zu entwickeln, und die Zeit bis zur Inbetriebnahme des Systems wurde deutlich verkürzt. Die drei GPUs konnten endlich ihre eigentliche Aufgabe erfüllen: den KI-Code des Kunden ausführen, anstatt mit dem Netzwerkstack um CPU-Zyklen zu konkurrieren. Die Kameras waren nie das Problem, sondern die Datenpipeline.

Sony-Sensoren erweitern die 100GigE-Plattform

Bislang basierten alle 100GigE-Flächen- und Zeilenkameraplattformen von Emergent auf der Sensorfamilie von Gpixel, die sich für Hochgeschwindigkeitsaufnahmen als äußerst leistungsfähig erwiesen und die erste Generation von Ethernet-Kamerasystemen mit hoher Bandbreite ermöglicht hat. Der nächste Schritt in dieser Entwicklung wird nun durch die neueste Sensorgeneration von Sony vorangetrieben.

Die neuesten CMOS-Sensoren von Sony, basierend auf der Pregius-S-Technologie der vierten Generation, vereinen hohe Auflösung, hohe Bildraten und verbesserte Empfindlichkeit in einer kompakten Pixelarchitektur. Mit Pixelgrößen von 5.48 µm bis hinunter zu 2.74 µm ermöglichen diese Sensoren deutlich höhere Auflösungen bei gleichbleibender Bildqualität und Effizienz, die industrielle Inspektionssysteme fordern. Das Portfolio deckt ein breites Leistungsspektrum ab – von schnellen Sensoren mittlerer Auflösung bis hin zu Plattformen mit über 100 Megapixeln – und erfüllt damit vielfältige Anwendungsanforderungen.

Neue Sony-Sensoren, darunter die IMX926, IMX949, IMX925, IMX947, IMX929, IMX928 und IMX927.

Die ersten Modelle dieser neuen Generation, darunter die HZ-12000-SB (IMX926), HZ-25000-SB (IMX925) und HZ-100-SB (IMX927), werden bereits produziert. Weitere Kameras folgen im Laufe von Ende 2026 und Anfang 2027, entsprechend Sonys Roadmap für neue Sensoren. Systemisch betrachtet bieten diese Sensoren weit mehr als nur höhere Auflösungen. Eine einzelne Kamera kann bei voller Leistung mehrere Gigabyte Bilddaten pro Sekunde erzeugen. In Umgebungen mit mehreren Kameras skalieren die aggregierten Datenraten schnell auf Dutzende oder sogar Hunderte von Gigabyte pro Sekunde, wodurch die Frage nach dem Transport und der Verarbeitung dieser Daten wichtiger denn je wird.

Sonys Roadmap umfasst auch Versionen dieser Großformatsensoren mit niedrigeren Bildraten, wie beispielsweise die IMX937- und IMX938-Klasse. Diese sind für Anwendungen gedacht, bei denen maximale Auflösung, aber nicht die volle Sensorgeschwindigkeit erforderlich ist. Die Varianten eröffnen zusätzliche Designoptionen, da sie je nach Anwendungsanforderungen mit Schnittstellen geringerer Bandbreite wie 10GigE oder 25GigE kombiniert werden können. Dies ermöglicht kosteneffizientere Systemarchitekturen bei gleichzeitig hoher Bildqualität. Zukünftige Kameraplattformen auf Basis dieser Sensoren ergänzen das aktuelle 100GigE-Portfolio sowie die etablierten 10GigE-EROS- und 25GigE-BOLT-Familien und bieten Systementwicklern mehr Flexibilität, Auflösung, Bandbreite und Gesamtsystemkosten für verschiedene Anwendungsszenarien optimal auszubalancieren.

Die GVSP-Herausforderung und wie man sie löst

In der Bildverarbeitung ist GigE Vision seit Langem der etablierte Schnittstellenstandard für niedrigere Bandbreiten und deckt 1-, 2.5- und 5-GigE-Installationen ab. Das GigE Vision Streaming Protocol (GVSP) ist der Teil dieses Standards, der für den eigentlichen Bilddatentransport verantwortlich ist, und seine Vorteile liegen seit jeher in seiner standardisierten Netzwerkinfrastruktur, der breiten Softwarekompatibilität und der Unabhängigkeit von proprietärer Hardware. Emergent treibt die Entwicklung von GigE Vision im Hochgeschwindigkeitsbereich seit über einem Jahrzehnt voran, lange bevor der Rest der Branche nachzog. Genau deshalb sind die Implementierungsherausforderungen bei der Skalierung auf 10, 25 und 100 GigE für das Unternehmen nichts Neues.

Die Herausforderung liegt in der Implementierung des Protokolls bei diesen höheren Bandbreiten. Was viele Integratoren zunächst der CPU-Auslastung zuschreiben, ist in Wirklichkeit ein Problem der Speicherbandbreite. Bei herkömmlichen GVSP-Implementierungen durchlaufen eingehende Bilddaten mehrere Pufferkopien. Jede Kopie beansprucht Speicherbandbreite, und bei hohen Datenraten mit mehreren simultanen Kamerastreams sättigt diese kumulative Last das System schnell, lange bevor die CPU selbst zum limitierenden Faktor wird. Das Ergebnis ist bekannt: Frameverluste, instabiles Verhalten und ein Hostsystem, das selbst dann überlastet ist, wenn die CPU-Auslastung auf dem Papier noch im Rahmen liegt.

Emergent begegnete diesem Problem von Anfang an mit einer Zero-Copy-GVSP-Architektur. Anstatt Daten über aufeinanderfolgende Speicherpuffer zu leiten, platziert die Implementierung Bilddaten in einem einzigen Transfer direkt an ihrem Zielort. Dadurch wird der Speicherbandbreiten-Overhead herkömmlicher Ansätze um bis zu 300 % reduziert und die CPU-Interaktion auf das vom Standard geforderte Minimum beschränkt. Wie Abbildung 2 zeigt, ist der Unterschied zwischen einer traditionellen GVSP-Implementierung und einer Zero-Copy-Architektur erheblich und wird mit jedem zusätzlichen Kamerastream im System deutlicher.

Diagramm, das den traditionellen Pfad für Kameradaten über GVSP, den Systemspeicher und die CPU zeigt.

Traditioneller GVSP-Datenpfad für 100-GigE-Kameras

Abbildung 2: Traditioneller GVSP-Datenfluss mit mehreren Speicherkopien und CPU-basierter Frame-Rekonstruktion, was den Systemaufwand bei der Hochgeschwindigkeits-100GigE-Bildgebung erhöht.

Optimierter GVSP-Prozess für 100GigE-Kameradaten

Optimierter GVSP-Prozess für 100GigE-Kameras

Abbildung 3: Der optimierte Zero-Copy-GVSP-Datenfluss nutzt Direct DMA, um Frames von der Netzwerkkarte zu übertragen, wodurch Speicherkopien minimiert und die CPU-Beteiligung auf Steuerungsaufgaben beschränkt wird.

RDMA und GigE Vision 3.0

Die nächste Entwicklungsstufe in diesem Bereich ist der kommende GigE Vision 3.0-Standard, der native Unterstützung für RDMA (Remote Direct Memory Access) einführt. RDMA ermöglicht kopierfreie Datenübertragung auf Standardebene und erlaubt Netzwerkschnittstellen, Bilddaten direkt in Anwendungsspeicherpuffer zu übertragen – ohne Zwischenkopien und ohne CPU-Eingriff für jedes einzelne Paket. Damit adressiert er dasselbe Problem der Speicherbandbreite, das Emergents optimierte GVSP-Architektur seit Jahren löst, und macht den Ansatz branchenweit zugänglicher. Zum Zeitpunkt der Veröffentlichung wird erwartet, dass der Standard formell ratifiziert ist oder sich bereits in der finalen Phase der Ratifizierung befindet.

Für Emergent ist dies vertrautes Terrain. Das Zero-Copy-Prinzip bildet seit Beginn den Kern der GVSP-Implementierung des Unternehmens und entstand aus der betrieblichen Notwendigkeit in Multi-Kamera-Systemen mit hoher Bandbreite, wo architektonische Ineffizienz keinen Spielraum ließ. GigE Vision 3.0 erweitert diese Funktionalität nun auf ein breiteres Spektrum an Implementierungen, und Emergent unterstützt beide Ansätze vollständig. Allerdings bringt RDMA auch eigene Kompromisse mit sich. Bestimmte Implementierungen schränken das Multicast-Streaming ein, das in skalierbaren Multi-Kamera-Systemen weiterhin eine wichtige Rolle spielt. Wie Abbildung 3 zeigt, bietet jedes Transportverfahren spezifische Eigenschaften, und die richtige Wahl hängt vom gesamten Systemkontext und nicht allein von der Bandbreite ab.

Funktion

Traditionelles GVSP

Optimiertes GVSP (Emergent)

RDMA (GigE Vision 3.0)

CPU-Auslastung Hoch Sehr niedrig Sehr niedrig
Datenkopien 1 0 0
Standard-NICs Ja Ja Ja (ähnlich wie optimiertes GVSP)
GPUDirect (Linux) Nein Ja Ja
GPUDirect (Windows) Nein Ja Nein
Mehrfachbesetzung Voll unterstützt Voll unterstützt Nicht unterstützt
Einfache Integration Standards konform Standards konform Standardskonform (GigE Vision 3.0)
Skalierbarkeit (Mehrkamerasysteme) Begrenzt Bewährt Hängt von der Anwendung ab

Von Kamerastreams zu Datenpipelines

Sobald die Bilddaten das Hostsystem erreichen, beginnt die eigentliche Arbeit. Moderne Hochleistungs-Bildgebungssysteme setzen zunehmend auf GPU-basierte Verarbeitungspipelines für Inspektion, Rekonstruktion oder KI-Inferenz. Die effiziente Übertragung der Daten von der Netzwerkschnittstelle in den GPU-Speicher stellt dabei eine erhebliche technische Herausforderung dar. Technologien wie GPU Direct unter Windows ermöglichen die Übertragung von Bilddaten von der Netzwerkschnittstelle in den GPU-Speicher mit minimalem Overhead und vermeiden so den CPU-Flaschenhals, der den Durchsatz sonst einschränken würde.

In der Praxis kann die effiziente Integration dieser Mechanismen in eine Anwendungspipeline komplex sein, insbesondere bei der Verarbeitung mehrerer Datenströme mit hoher Bandbreite. In Umgebungen mit mehreren Kameras, in denen die Gesamtdatenraten Dutzende oder sogar Hunderte von Gigabyte pro Sekunde erreichen, muss die Integration zwischen Kameraschnittstellen, Systemspeicher, GPU-Verarbeitungspipelines und Speicherinfrastruktur sorgfältig von Anfang bis Ende geplant werden. Wie Abbildung 4 zeigt, reichen diese Architekturen von kompakten Edge-Systemen mit einer Kamera bis hin zu großen Installationen mit mehreren Kameras, die auf Netzwerk-Switches und mehreren GPU-Workstations basieren. Der Unterschied zu herkömmlichen Framegrabber-basierten Ansätzen ist signifikant: Ethernet-basierte Systeme ermöglichen eine flexible Skalierung mit Standard-Netzwerkinfrastruktur, während Framegrabber-Architekturen dedizierte Hardware pro Kameragruppe benötigen und entsprechend komplexer und teurer werden.

Diagramm zur Veranschaulichung des Unterschieds in der Skalierbarkeit von GigE- gegenüber CoaXpress-Kameras

Skalierbarkeit des GigE-Kamerasystems im Vergleich zu CoaXpress-Systemen

Abbildung 4: Vergleich von skalierbaren Ethernet-basierten Mehrkameraarchitekturen und traditionellen Framegrabber-basierten Systemen.

Auch die wirtschaftliche Dimension spielt eine Rolle. Bei manchen Hochgeschwindigkeitsinstallationen wird Stabilität einfach durch zusätzliche Hardware erreicht: zusätzliche Server, dedizierte Netzwerkschnittstellen, separate Verarbeitungsknoten zur Lastverteilung. Das kann zwar funktionieren, führt aber oft zu unnötig komplexen und teuren Architekturen. Durch die Optimierung des Datentransports, die Reduzierung des CPU-Overheads und die Entwicklung effizienter Verarbeitungspipelines von Anfang an ist es möglich, deutlich mehr Kameras mit weniger Hostsystemen zu betreiben. Stabile Multi-Kamera-Installationen erfordern nicht den Ansatz „eine Kamera pro Computer“. Sorgfältig konzipierte Systeme können auf Dutzende von Kameras skaliert werden, ohne die Hardwareanforderungen und die Betriebskomplexität zu beeinträchtigen. Dieses Gleichgewicht zwischen Leistung, Stabilität und Kosten entscheidet oft darüber, ob ein Hochgeschwindigkeits-Bildgebungsprojekt in der Produktion erfolgreich ist oder im Konzeptstadium bleibt.

Um diese Integration zu vereinfachen, bieten Software-Frameworks wie eSDK Pro – das Anfang des Jahres von InVision als Top-Innovation 2026 ausgezeichnet wurde – Zugriff auf optimierte Datenpfade, einschließlich GPU Direct. Anstatt umfangreiche Low-Level-Entwicklung zu erfordern, ermöglichen diese Ansätze Systementwicklern, sich auf die Anwendungslogik zu konzentrieren und beim Aufbau leistungsstarker Bildverarbeitungspipelines hunderte von Entwicklungsstunden für Transport, Speicherverwaltung und Schnittstellenoptimierung zu vermeiden.

Die nächste Phase der Hochgeschwindigkeits-Vision

Mit der neuen Sensorgeneration von Sony, die nun in Produktion geht, und GigE Vision 3.0, das RDMA-Unterstützung für die gesamte Branche bietet, beginnt für die Hochgeschwindigkeits-Ethernet-Bildgebung eine neue Ära. Hochleistungssensoren, Ethernet-Infrastruktur mit hoher Bandbreite und moderne GPU-Rechenarchitekturen verschmelzen zu einer Weise, die Anwendungen ermöglicht, die bisher für die meisten Systemintegratoren unerreichbar waren. Immer mehr Unternehmen werden diesen Bereich erkunden, und die Technologie selbst wird sich rasant weiterentwickeln.

Was die Praxiserfahrung des letzten Jahrzehnts jedoch immer wieder gezeigt hat, ist, dass die Kameraspezifikationen selten über den Erfolg entscheiden. Zuverlässige Systeme im Produktiveinsatz zeichnen sich dadurch aus, dass jede Stufe der Bildverarbeitungskette unter Berücksichtigung des gesamten Datenflusses konzipiert wurde – vom Sensor zur Schnittstelle, von der Schnittstelle zum Host, vom Hostspeicher zur GPU und weiter zur Speicherung oder Ausgabe. Die Lebensmittelverarbeitungslinie mit 21 Kameras, die zwei Jahre lang ohne funktionierende Lösung lief, ist keine Ausnahme, sondern die Regel. Bei Hochgeschwindigkeits-Bildverarbeitung war die Kamera nie der eigentliche Flaschenhals, sondern die Systemarchitektur. Und um diese Architektur optimal zu gestalten, braucht es etwas, das kein Datenblatt liefern kann: Erfahrung aus realen Einsätzen im großen Maßstab unter realen Betriebsbedingungen.

100GigE-Flächen- und Zeilenkameras von Emergent Vision Technologies

ZENITH 100GigE bietet das Nonplusultra in puncto Geschwindigkeit und Auflösung.

ZENITH 100GigE-Kameras

Bildrate: 16-3462 FPS
Auflösung: 2.5 MP – 152 MP
Chroma: Farbe, Mono

PINNACLE steht für Höchstgeschwindigkeit bei Inspektion und Sortierung.

PINNACLE 100GigE-Kameras

Zeilenrate: 400-1000 kHz
Auflösung: 8K-16K TDI, 16K x 16
Chroma: Farbe, Mono