Kürzlich habe ich mich gefragt, wie gut denn unsere besten Kameras sein mögen im Vergleich zu einem menschlichen Auge. Internet sei Dank habe ich nicht nur viele Daten dazu gefunden, sondern auch noch den einen oder anderen überraschenden Fakt sowie auch einige amüsante Aspekte.
Fangen wir also mit folgender Frage an: "Wie hoch ist die Auflösung des menschlichen Auges in Megapixeln?" Nun, sie direkt mit einer Kamera aus der realen Welt zu vergleichen ist gar nicht so einfach... aber lesen Sie weiter.
Bei den meisten Digitalkameras finden Sie orthogonale Pixel: sie sind in einem Raster über den Sensor verteilt. In einer Schicht darüber ist bei den meisten Kameras zudem ein Filter verbaut - normalerweise handelt es sich dabei um einen "Bayer"-Filter, genannt nach Bryce Bayer, dem Wissenschaftler, der diesen Aufbau entwickelt hat. Dieser Filter besteht aus roten, grünen und blauen Elementen welche den darunter liegenden lichtempfindlichen Zellen ermöglichen, Farbinformationen zu extrahieren. Es gibt auch Ausnahmen zu dieser Anordnung: zum Beispiel Kameras mit FOVEON Sensoren sind fundamental anders aufgebaut, aber das wäre ein Thema für einen weiteren Blogbeitrag.
Stellen Sie sich also für das Auge einen Sensor mit einer riesigen Anzahl von Pixeln vor, etwa 130 Millionen. In der Mitte des Sensors befindet sich eine höhere Dichte von Pixeln als gegen die Ränder hin und nur etwa 6 Millionen dieser Sensoren sind gefiltert, um Farbempfindlichkeit zu ermöglichen. Davon sind nur etwa 100.000 empfindlich für Blau! Übrigens ist dieser Sensor nicht flach, sondern halbkugelförmig, so dass eine sehr einfache Linse ohne Verzerrungen verwendet werden kann; echte Kameralinsen müssen auf eine flache Oberfläche projizieren, was angesichts der sphärischen Natur einer einfachen Linse nicht unproblematisch ist - deshalb enthalten bessere Objektive gewöhnlich einige asphärische Elemente.
Die Diagonale der projizierten Fläche beträgt im Durchschnitt etwa 22 mm und ist damit nur etwas grösser als die eines Micro Four Thirds Sensors, aber die sphärische Beschaffenheit bedeutet, dass die Oberfläche etwas grösser als jene eines Vollformat-35 mm-Kamerasensors.
Das ist also die Hardware. Aber das ist nicht der limitierende Faktor für die effektive Auflösung. Das Auge scheint "kontinuierlich" zu sehen, es arbeitet zyklisch. Wenn man dies als eine Art Bildfrequenz betrachtet stellt man fest, dass die wirklich schnell ist. Das Auge verhält sich nämlich wie ein "okularer Mikrotremor", der in ständiger Bewegung ist und zwar mit etwa 70-110 Hz. Das Ergebnis ist, dass Sie, sofern sich nichts zu schnell bewegt, eine effektive Auflösungserhöhung von 120MP auf etwa 480MP erhalten, da das Bild aus mehreren Abtastwerten aufgebaut wird. Unser Auge beherrscht also so etwas wie "Pixelshift", eine Technologie zur Erhöhung der Sensorauflösung, welche in letzter Zeit in einigen Kameramodellen Einzug gehalten hat (Olympus, Sony Alpha IV, Fuji GF100, Panasonic G9 usw).
Wenn wir ein Bild wahrnehmen, gibt es eine Low-Level-Bildverarbeitung sowie spezialisierte Prozesse, die auf höheren Abstraktionsebenen arbeiten. Zum Beispiel sind wir Menschen wirklich gut darin, horizontale und vertikale Linien zu erkennen. Wir führen auch einen ständigen Mustervergleich des Gesehenen mit unseren Erinnerungen durch. Wir sehen also nicht nur ein Objekt, sondern wir erkennen ein Objekt sofort und rufen eine ganze Bibliothek mit Informationen über dieses Ding ab, das wir gerade gesehen haben.
Ein weiterer interessanter Aspekt unserer Im-Gehirn-Bildverarbeitung ist, dass wir keine fixe Auflösung verwenden. Wenn unsere Augen altern und wir nicht mehr so gut sehen können, sinkt unsere effektive Auflösung. Dennoch passen wir uns in relativ kurzer Zeit an das an, was das Auge tatsächlich noch erkennen kann.
Bei schlechten Lichtverhältnissen haben viele Kameras heutzutage die Fähigkeit, mehrere verschiedene Fotos während der Aufnahme zu mitteln, wodurch das Signal verstärkt, die Dynamik erhöht und das Rauschen reduziert wird; unser Gehirn macht genau dies bei schwachem Licht. In der Fototechnik spricht man dabei von HDR-Bildern. Unsere Augen/Gehirn-Kombination kann aber noch viele Dinge mehr. Erwähnenswert an dieser Stelle sind Folgefokussierung, Gesichtserkennung.
"Was würde denn sowas kosten?"
Auf eine ganz spannende Frage, die sich Chaleb Ward auf seiner Website "The Beat" gestellt hat, lautet: "...was würde eine Kamera mit ähnlichen Spezifikationen wie ein Auge denn heutzutage kosten, wenn es sie denn gäbe...?".
Ich fand den Artikel amüsant genug, um hier die Fakten daraus herauszupicken. Seine Aufstellung sieht folgendermassen aus:
Wenn wir bei einer Kamera über die Brennweite sprechen, sprechen wir buchstäblich über den Abstand vom optischen Zentrum des Objektivs zum Kamerasensor. Dieselbe Regel würde auch für Ihr Auge gelten. Technisch gesehen hätte das durchschnittliche menschliche Auge also eine Brennweite von 17 mm.
* Brennweite: 17mm
* Vergleichbares Objektiv: Olympus M.Zuiko 17mm F/2.8
* Preis: 299$
Während ein 17-mm-Objektiv an einer Vollformatkamera ein Sichtfeld von etwa 93 Grad hätte, hat das durchschnittliche menschliche Auge ein Sichtfeld von etwa 180 Grad, wenn es nach vorne blickt. Bei Verwendung eines einfachen Blickwinkelrechners würde der tatsächliche Blickwinkel dem eines 1 mm-Objektivs entsprechen.
* Blickwinkel: 180 Grad
* Vergleichbares Objektiv: Nikkor 6mm f 2.8
* Preis: 120000$
Unter Berücksichtigung des Blickwinkels hat unser 17-mm-Augapfel eine fokale Äquivalenz von 1 mm. Theoretisch hat unser Auge also einen negativen Crop-Faktor von x,05 im Vergleich zu einer Vollbildkamera. Unnötig zu sagen, dass es diese Technologie im wirklichen Leben nicht gibt.
* Crop Faktor: 0.05
* Vergleichbar zu: Metabones Speed Booster (x 14)
* Preis: 1000$ (variiert, je nach Version)
In einer unglaublich dunklen Situation kann sich die Iris eines Auges auf etwa 8 mm ausdehnen. Wenn wir also diese Information in eine Formel fassen würden, bei der unsere Brennweite der Länge unserer Augen entspricht (etwa 17 mm), würden wir eine tatsächliche Blende von etwa f/2,1 erhalten. Diese Zahl ist beeindruckend, aber sicherlich nicht weltbewegend.
* Blende: 2.1 - 8.3
* Vergleichbares Objektiv: Canon EF 35mm F2 IS USM
* Preis: 550 $
Es wird geschätzt, dass das durchschnittliche menschliche Auge bis zu 576MP an Informationen zu einem bestimmten Zeitpunkt lesen kann, was dem Begriff Retina-Display eine ganz neue Bedeutung verleiht. Leider können moderne DSLRs noch nicht ganz Bilder in dieser Auflösung aufnehmen. In der Astronomie gibt es jedoch eine Kamera, die mit 570MP nahe dran ist.
* Auflösung: 576MP
* Vergleichbare Kamera: Dark Energy Camera
* Preis: 35000000$
ISO bezieht sich auf die Energiemenge, die zu einem bestimmten Zeitpunkt an den Sensor der Kamera gesendet wird. Wenn es jedoch um Ihre Augen geht, haben Sie nicht wirklich die Möglichkeit, Ihre Empfindlichkeit weit über die ISO-Empfindlichkeit von 1000 bei einer Kamera hinaus zu erhöhen.
* ISO: 1 - 1000
* Vergleichbare Kameras: für jede moderne Kamera kein Problem
* Preis: ab 300$
Es wird gesagt, dass unsere Augen bis zu 10 Millionen verschiedene Farben wahrnehmen können. Das mag zwar als viel erscheinen, ist aber im Verhältnis zu dem, was heutige Kameras verarbeiten können, ziemlich gering. Jeden Tag zeichnen Videokameras Farbinformationen mit mindestens 8 Bit pro Kanal auf, aber viele Kameras können bis zu 14 bzw. 16 Bit pro Kanal aufzeichnen - 16 Bit ergibt über 281 Billionen Farben!
* Bitrate: 8 pro Kanal (ergibt 16 Millionen Farben)
* Vergleichbare Ausrüstung: jede moderne Kamera (inkl. Mobiltelefone)
* Preis: ab 100$
Der Dynamikbereich hat mit der Fähigkeit Ihrer Kamera zu tun, sowohl extrem helle als auch extrem dunkle Details gleichzeitig abzubilden. Die meisten professionellen Kameras haben einen Dynamikbereich von 11-14 Blendenstufen. Je mehr Blendenstufen Ihre Kamera hat, desto grösser ist ihre Fähigkeit, kontrastreiche Bilder aufzunehmen. Überraschenderweise ist das menschliche Auge in Bezug auf den Dynamikbereich auf Augenhöhe mit moderner Technologie.
* Dynamikbereich: 10-14 Blenden
* Vergleichbares Ausrüstung: jede moderne Kamera
* Preis: ab 1000$
Ihre Augen haben keinen mechanischen oder radialen Verschluss, sie ähneln also eher einer Kamera mit elektronischem Verschluss. Wenn Sie jedoch die Bewegungsunschärfe Ihres Auges mit einer ähnlichen Bewegungsunschärfe einer Kamera vergleichen möchten, winken Sie einfach mit der Hand von Ihrem Gesicht aus mit konstanter Geschwindigkeit heran. Sehen Sie die Bewegungsunschärfe?
Wenn Sie die Verschlusszeit einer Kamera an die Bewegungsunschärfe Ihres Auges anpassen, kommen Sie auf eine Verschlusszeit von etwa 1/100-1/200. Wahrscheinlich sehen Sie im Alltag nicht sehr viel Bewegungsunschärfe, weil Ihre Augen daran gewöhnt sind, sich bewegende Objekte unglaublich schnell zu verfolgen.
* Verschlusszeiten: 1/100 - 1/200
* Vergleichbare Ausrüstung: jede moderne Kamera übertrifft diesen Bereich
* Preis: ab 100$
Durch Forschung konnten Wissenschaftler herausfinden, dass Menschen Informationen bis zu etwa 1000fps interpretieren können. Zwar kann man sich diese Informationen sicherlich nicht in Zeitlupe in den Kopf zurückspielen, aber es hat grössere Auswirkungen auf die Zukunft des Filmemachens. Deshalb wirkt ein 48fps-Film wie der Hobbit so anders als ein 24fps-Film.
* Bilder pro Sekunde: 1000
* Vergleichbare Ausrüstung: z.B. Highspeed Kameras von Black Magic
* Preis: ab 3000 $ (2020)
Die Schlussrechnung
Es wäre absurd, die oben zusammengetragenen Preise zusammenzuzählen und zu behaupten, dass diese Endsumme dem Preis einer "menschlichen Augenkamera" entsprechen würde. Trotzdem: man sieht, dass unsere Augen rein schon aus Sicht der "Mechanik" ziemlich wertvolle Knipsen sind und dass man besser sehr vorsichtig damit umgehen sollte...
Comments