Monokulare Tiefenschätzung
Depth Anything V2 analysiert ein einzelnes 2D-Bild und schätzt, wie weit jeder Bildpunkt von der Kamera entfernt ist – ohne Stereokamera, ohne Lidar. Das Modell wurde auf Millionen von Bildern trainiert und erkennt Tiefenhinweise wie Überlappung, Größenverhältnisse und Fokus.
Warum bleibt die Rückseite flach?
Das Modell sieht nur die sichtbaren Pixel. Die Rückseite des Motivs fehlt im Foto – das Relief ist daher ein Bas-Relief, kein volumetrisches 3D-Modell. Im Médaillon-Modus wird eine geschlossene Hülle (Rückseite + Seitenwände) ergänzt, die das Mesh druckbar macht.
Wie entsteht das Mesh?
Ein Gitter aus 256 × 256 Punkten wird in Z-Richtung verschoben. Die Tiefe wird nur innerhalb der Alpha-Maske normalisiert (Min/Max-Stretching), damit der volle Kontrast genutzt wird. Ein Gamma-Wert > 1 hebt flache Oberflächen heraus; < 1 dämpft extreme Ausreißer. Dreiecke, die halb im Hintergrund liegen, werden aus dem Mesh entfernt – kein Spaghetti an den Kanten.
Gamma-Regler
Formel: z = pow(depth, gamma) × stärke. Gamma = 1.0 ist linear. Gamma < 1 macht das Relief insgesamt flacher und gleichmäßiger. Gamma > 1 betont Vordergrundelemente und quetscht den Hintergrund zusammen.