Tech-Portal

Tech-Portal

Einführung in die maschinelle Bildverarbeitung

Was ist maschinelles Sehen?

Machine Vision kann als eine Sammlung von Hardware- und Softwaretechnologien definiert werden, die Maschinen mit Bilderfassungsfunktionen ausstatten und es ihnen ermöglichen, ihre Entscheidungsfindung zu automatisieren. In einfachen Worten bezieht sich maschinelles Sehen auf den Ersatz des menschlichen Sehens und der Intelligenz durch Beleuchtung, Objektive, Kameras und Computer.

Während das menschliche Sehen gut darin ist, eine Szene qualitativ zu analysieren, zeichnet sich das maschinelle Sehen durch den quantitativen Aspekt aus. Die Fähigkeit, eine Szene zu erfassen und zu quantifizieren, macht maschinelles Sehen zu einer geeigneten Alternative zum menschlichen Sehen für Anwendungen, die Folgendes erfordern:

  • Inspektion kleiner Details
  • Nicht körperlicher Kontakt
  • Mehr Sicherheit
  • Höhere Produktivität
  • Verbesserte Genauigkeit
  • Automatisierung sich wiederholender Aufgaben
  • Betrieb in gefährlichen Umgebungen

Im Vergleich zu Bildverarbeitungssystemen, die in Verbraucheranwendungen eingesetzt werden, beispielsweise Smartphone-Kameras und Point-and-Shoot-Kameras, sind maschinelle Bildverarbeitungssysteme:

  • Sehr hohe Geschwindigkeit (FPS)
  • Komponente konfigurierbar
  • API-programmierbar
  • Extrem robust
  • Mechanisch zuverlässig
  • Und stabil bei extremen Temperaturen

In den letzten zehn Jahren haben Bildverarbeitungssysteme ein explosionsartiges Wachstum erlebt, nicht nur in Bezug auf ihre Leistungsfähigkeit und Komplexität, sondern auch in Bezug auf ihre breitere Akzeptanz in Fertigungs- und Nicht-Fertigungsanwendungen. Laut dem globalen Technologiemarkt-Beratungsunternehmen ABI Research werden die Gesamtlieferungen für Bildverarbeitungssysteme bis 16.9 2025 Millionen erreichen, was eine installierte Basis von 94 Millionen Bildverarbeitungssystemen in der industriellen Fertigung schaffen wird.

Bausteine ​​eines Bildverarbeitungssystems

Ein System, das maschinelle Bildverarbeitungstechnologien nutzt, besteht hauptsächlich aus vier Hauptblöcken:

  1. Bilderfassung – Der Kern der maschinellen Bildverarbeitung liegt in der Fähigkeit, eine Szene visuell zu erfassen und in ein digitales Format umzuwandeln. Bildsensoren in Verbindung mit Objektiven können Licht einfangen, Photonen in Elektronen umwandeln und ein digitales Bild ausgeben. Dieser Prozess, eine Szene in ein digitales Bild umzuwandeln, wird oft als Bilderfassung bezeichnet. Bildsensoren und unterstützende Elektronik sind normalerweise in einer Schutzhülle untergebracht, die wir Kamera nennen.
  1. Datenübermittlung – Sobald ein Bild von einem Sensor erfasst und in ein digitales Format verpackt wurde, das als „Pixelformat“ bezeichnet wird, wird es zur weiteren Verarbeitung an ein externes Computergerät übermittelt. Hier ist eine Liste einiger Standards, die von der Bildverarbeitungsbranche für die Datenbereitstellung entwickelt wurden:
    • Kamera-Link
    • CoaXpress
    • GigeVision
    • USB3-Vision
    • MIPI
    • IIDC2
  1. Informationsextraktion – Nachdem ein Rohbild von einem Sensor von einem Computergerät empfangen wurde, wird es vorverarbeitet und auf Merkmale wie:
    • Kantenerkennung
    • Mustervergleich
    • Klassifikation
    • Segmentierung
    • Messung
    • Stückzählung
    • Objekterkennung und Ortung
    • Zeichenerkennung
    • Barcode-Lesung
  1. Entscheidungsfindung – Anhand der extrahierten Informationen wird ein Algorithmus verwendet, der normalerweise mit AI/ML/DL trainiert wird* würde Entscheidungen treffen und Steuerausgaben an eine Maschine senden.
Abbildung-4-skaliert

Maschinelles Sehen vs. Computersehen

Die Begriffe „Machine Vision“ und „Computer Vision“ werden oft verwendet, wenn es um Bilder geht, daher ist es wichtig, dass wir die Bedeutung dahinter verstehen und Missverständnisse ausräumen.

Bildverarbeitung Computer Vision
Der Begriff „Machine Vision“ wird hauptsächlich im Zusammenhang mit der industriellen Automatisierung verwendet Der Begriff „Computer Vision“ wird hauptsächlich im Zusammenhang mit Deep Learning/künstlicher Intelligenz verwendet
Maschinelles Sehen wird hauptsächlich mit der Vorverarbeitung von Bildern und der regelbasierten Merkmalsextraktion in Verbindung gebracht Computer Vision wird hauptsächlich mit der Nachbearbeitung von Bildern und der lernbasierten Merkmalsextraktion in Verbindung gebracht
Beim maschinellen Sehen handelt es sich immer um ein Kamerasystem zur Bilderfassung und Datenlieferung Kamerasysteme können beteiligt sein oder nicht
Maschinelles Sehen kann GPU-Verarbeitung und Cloud-Computing beinhalten oder auch nicht Große Computer-Vision-Modelle erfordern häufig GPU-Verarbeitung und Cloud-Computing
Das Ziel der maschinellen Bildverarbeitung ist es, Maschinen in die Lage zu versetzen, ihre Entscheidungsfindung zu automatisieren, indem sie ihre Umgebung visuell erfassen Das Ziel von Computer Vision ist es, ein KI-Modell zu trainieren, indem es Merkmale aus einer Reihe von Bildern lernt und dann Vorhersagen trifft

Es ist klar, dass sowohl maschinelles Sehen als auch Computer Vision zwar die Verarbeitung von Bildern beinhalten, ihre Ziele jedoch unterschiedlich sind. Maschinelles Sehen ist nicht unbedingt eine Teilmenge von Computer Vision und Computer Vision ist nicht unbedingt eine Teilmenge von maschinellem Sehen, aber Systeme für maschinelles Sehen nutzen oft Computer-Vision-Tools, um aussagekräftige Informationen für ihren Entscheidungsprozess abzuleiten. Zuvor müssen verschiedene Faktoren berücksichtigt werden Auswahl einer Bildverarbeitungskamera oder die Computer-Vision-Kamera.