Monokulare Tiefenschätzung

Für zahlreiche Anwendungen, wie z. B. das autonome Fahren oder die erweiterte Realität, ist die Generierung von Tiefenkarten unerlässlich. Typischerweise werden diese aus Stereobildpaaren oder durch den Einsatz aktiver Sensoren (z. B. LiDAR oder RGB-D-Kameras) erzeugt. Ausgehend von der monokularen Tiefenwahrnehmung des Menschen wird in diesem Projekt die Schätzung von Tiefenkarten aus Einzelbildern mittels künstlicher neuronaler Netze untersuch.
Evaluationsmetriken
Zur qualitativen Beurteilung solcher vorhergesagten Tiefenkarten wurden bisher meist qualitative Vergleiche und globale Fehlermetriken verwendet. Diese berücksichtigen jedoch nicht die lokalen geometrischen Eigenschaften der Tiefenkarten. Aus diesem Grund stellen wir eine Reihe neuer, geometrisch interpretierbarer Metriken vor, die sich auf die folgenden Qualitätskriterien von Tiefenkarten konzentrieren:
- Genauigkeit und Vollständigkeit von Tiefendiskontinuitäten
- Planarität und Orientierung von flächigen Objekten
- Abstandsbezogene Beurteilung
Weitere Informationen werden in den zugehörigen Publikationen [Koch19; Koch20] beschrieben.






RGB-D-Datensatz iBims-1
Die Anwendung unserer neuen Fehlermetriken erfordert einen hochwertigen RGB-D-Referenzdatensatz. Mit Hilfe eines maßgeschneiderten Aufnahmeaufbaus, bestehend aus einer DSLR-Kamera und einem terrestrischen Laserscanner, kann eine Reihe von dichten und genau ausgerichteten RGB-D-Bildpaaren erzeugt werden, die sich durch hohe Auflösung und geringes Rauschen auszeichnen. Unsere aufgenommenen Bildpaare liefern scharfe Tiefenunterbrechungen sowie rauschfreie ebene Flächen, die Grundvoraussetzungen für unsere Fehlermetriken sind.
Dieser Aufbau wurde verwendet, um unseren neuen Testdatensatz iBims-1 (independent Benchmark images and matched scans - version 1) für die monokulare Tiefenschätzung zu erstellen. Weitere Informationen zu unserem Datensatz finden Sie auf der Datensatzseite.



