Videomanagementsysteme (VMS)
Ein Videoverwaltungssystem, auch als VMS bekannt, sammelt Eingaben von einer Reihe von Kameras und anderen Sensoren und befasst sich mit allen damit verbundenen Aspekten der Videoverarbeitung, wie z. B. Speicherung, Abruf, Analyse und Anzeige.
VMS wird in der Regel für Sicherheit und Überwachung verwendet, um die persönliche Sicherheit zu verbessern und gleichzeitig die Privatsphäre des Einzelnen zu wahren.
Traditionell erfolgte die Analyse von Live-Videostreams manuell und stützte sich auf die menschliche Wahrnehmung und visuelle Identifizierung von Ereignissen. Heutzutage automatisiert Deep Learning die Analyseaufgabe. Deep Learning erleichtert die Skalierbarkeit und verbessert die Gesamtleistung.
Für diese Videoanalyse in Echtzeit benötigen VMS-Systeme Hochleistungsrechner. KI verändert diesen Markt durch eine schnellere und genauere Ereignisidentifikation zu geringeren Kosten.

Niedrige Latenz und höhere Bildraten ermöglichen eine zeitnahe Videoverarbeitung bei der Erkennung und Suche in Videostreams.

Mit mehr Rechenleistung pro Einheitspreis, die sich in mehr Komplexität pro Anwendung, mehr Anwendungen pro Stream und mehr Streams pro Plattform sowie erheblichen Einsparungen bei Streaming-Bandbreite und Speicherplatz dank ereignisbasierter Aufzeichnung niederschlägt.

Höhere Leistung durch weniger Fehlalarme und verpasste Erkennungen.

Hochmoderne Videoanalyse nahe an der Kamera (Edge) bedeutet, dass personenbezogene Daten (PII) nicht übertragen und in der Cloud gespeichert werden müssen.

Eine umfassende Software-Suite, die eine breite Palette von Plattformen, Betriebssystemen und neuronalen Netzwerkmodellen unterstützt.

Produkte, die für raue Bedingungen ausgelegt sind und den industriellen Betriebsbedingungen entsprechen.
Ebenen der Videoanalyse
Die erste Ebene der Videoanalyse ist das Szenenverständnis. Es werden Metadaten für Echtzeit-Reaktionen extrahiert und für zukünftige Suchen und Analysen gespeichert. In dieser Phase können mehrere neuronale Netze mit fortschrittlichen Algorithmen Deep-Learning-Aufgaben ausführen. Das ist die Grundlage, auf der komplexere Prozesse vordefinierte Ereignisse identifizieren und spezifische Reaktionen auslöst werden.
Objekterkennung
Dient dazu, ein bestimmtes Objekt oder eine Klasse von Objekten in einem Bild zu identifizieren. Sie kann auch verwendet werden, um zwischen Objektklassen zu unterscheiden.
Zählen
Es wird die Anzahl der Objekte in einem bestimmten Bereich ermittelt, insbesondere an Orten, mit begrenzter Belegung, die Auswirkungen auf die Sicherheit hat.
Schätzung der Dichte
Identifiziert eine sich entwickelnde Situation. Im Gegensatz zum Zählen wird sie in Situationen verwendet,
wenn die Gesamtdichte von Interesse ist und nicht die Anzahl der Objekte.
Objektattribute
Unterstützen die eindeutige Identifizierung einer Person oder eines Objekts in einer bestimmten Szene,
oder der erneuten Identifikation in derselben Szene im Laufe der Zeit oder an mehreren Orten.
Gesture Estimation
Dient der Analyse einer Gestenabfolge zur Interpretation bestimmter Verhaltensweisen
im Rahmen der Verhaltensanalyse.
Entfernungsmessung
Wird verwendet, um die Entfernung zwischen zwei oder mehr Personen oder Objekten basierend auf der genauen 3D-Position in einem definierten Raum zu berechnen.
Die zweite Ebene der Videoanalyse ist die Ereignisauslösung in Echtzeit basierend auf Erkenntnissen aus der Erkennungsphase. In dieser Phase lösen vordefinierte Ereignisse eine bestimmte Reaktion aus, z. B. das Auslösen eines Alarms oder ein Handlungsaufruf für das Sicherheitspersonal und/oder Notfalldienste. Übliche Anwendungen:
Crowd-Management
Basierend auf der Personen- und Fahrzeugzählung und der Dichteschätzung erzeugt die Ansammlung einer großen Anzahl von Einheiten ein Ereignis an einem bestimmten Ort, das eine Reaktion oder einen Handlungsaufruf auslösen kann, z. B. Lastverteilung und dynamisches Verkehrsmanagement.
Perimeterschutz
Gesichts- und Personenattribute sowie Gestenschätzung und Abstandsmessung können dazu dienen, einen Bereich mit eingeschränktem Zugang oder eine unsichere Zone zu sichern und zu schützen.
Soziale Distanzierung
Wird verwendet, um festzustellen, ob Menschen an öffentlichen Orten soziale Distanz wahren, und um die Gesundheitsbehörden bei ihren Bemühungen zur Eindämmung einer Pandemie zu unterstützen.
Verhaltensanalyse
Die Verhaltensanalyse erkennt Notsignale und löst einen Alarm aus, um Notfalldienste so schnell wie möglich und viel schneller als ein Anruf bei 112 zum Einsatzort zu rufen.
Verlorene Person / unbeaufsichtigtes Objekt
Hilfreich für Sicherheitspersonal, wenn es nach verlorenen Personen/verlassenem Gepäck sucht oder Verdächtige aufspürt.
Erkennung von Fahrzeugkennzeichen (LPR)
Wird bei die Zugangskontrolle und Abrechnung an Parkplätzen oder in Garagen verwendet.
Die dritte Ebene der Videoanalyse ist die Indizierung, Speicherung und Abfrage von Metadaten.
Durch die Untersuchung von Mustern der Langzeitbeobachtungen und die gemeinsame Analyse aus unterschiedlichen Perspektiven können tiefe Einblicke gewonnen werden. Das kann für folgende Zwecke genutzt werden:
Indizierung und Aufzeichnung
Zur effizienten Verwaltung der Daten und um Kommunikations- und Speicherkosten zu reduzieren, wird künstliche Intelligenz eingesetzt, um zwischen aussagekräftigen Ereignissen und Hintergrundmaterial zu unterscheiden. Dadurch kann das System nur vom Benutzer definierte signifikante Ereignisse aufzeichnen und speichern.
Zusammenfassung
In der Zusammenfassung wird eine bearbeitete und prägnante Version von Videoaufnahmen erstellt, die nur die wesentlichen Ereignisse und Erkenntnisse enthält, während „totes Filmmaterial“ herausgeschnitten wird.
Datenextraktion
Die Datenextraktion ist ein Vorgang zur Identifizierung von Mustern in gespeicherten Daten, die auf den aus dem Videostream extrahierten Metadaten basieren. Je besser und ausführlicher diese Metadaten sind, umso besser sind die Ergebnisse und Erkenntnisse. Die Qualität der Metadaten hängt von der Qualität der Analysen ab, und hier kommen die fortschrittlichen Algorithmen von Deep Learning ins Spiel.