6. Narration [staging] – filmanalyse.at

Inhalt:

6. Zur Analyse der narrativen Struktur
6. Zur Analyse der narrativen Struktur
6.1 Modell zur Narration fiktionaler Filme nach David Bordwell: Fabula, Syuzhet und Style
6.2 Bordwells und Thompsons „Range of Story Information: Restricted or Unrestricted?“
- 6.2.1 Depth of story information
6.3 Diegese / diegetische Welt
- 6.3.1 Diegetische Teilschichten nach Wulff
- 6.3.2 Die aktiven ZuschauerInnen: diegetisieren und narrativisieren
6.4 Erzählinstanz, Fokalisierung, Okularisierung und Aurikularisierung
6.5 Beispielanalysen

6. Zur Analyse der narrativen Struktur

Die Begriffe zur Analyse der Narration im Film entstammen der sogenannten Narratologie, einer Teildisziplin der Literaturwissenschaft, die eine lange Tradition und ein entsprechend großes und ausdifferenziertes Spektrum an theoretischen Ansätzen vorzuweisen hat. Die Herausforderung für den vorliegenden Zusammenhang besteht angesichts der damit verbundenen Komplexität daher darin, die Narratologie für die Filmanalyse nutzbar zu machen.
Zur beispielhaften Veranschaulichung der theoretischen Überlegungen wird auch in dieser Sektion mit Filmausschnitten gearbeitet. Da die Narration in der Regel aber den gesamten Film oder zumindest längere Teile eines Films betrifft, gestaltet sich eine solche Vorgehensweise bei diesem spezifischen Aspekt der Filmanalyse allerdings schwieriger als bei anderen Aspekten.

6. Zur Analyse der narrativen Struktur

Die Vielfalt an Begriffen und Modellen ist zunächst verwirrend. Die Herausforderung besteht unter anderem darin, für die jeweilige Analyse das Modell zu finden, das am ehesten dazu geeignet ist, die vorliegende Fragestellung zu bearbeiten. So ist Bordwells Modell besser geeignet, um narrative Konstruktionen von ganzen Filmen zu beschreiben, Kuhns Terminologie wiederum um Mikrostrukturen einzelner Szenen auf ihre Perspektivierung hin zu untersuchen.

6.1 Modell zur Narration fiktionaler Filme nach David Bordwell: Fabula, Syuzhet und Style

Ein übersichtliches und pragmatisches Modell¹ zur theoretischen Annäherung an die verschiedenen Aspekte filmischer Narration legte der amerikanische Filmwissenschaftler David Bordwell in seinem Standardwerk Narration in the Fiction Film² von 1985 vor, wobei er drei Begriffe anführt, die für die narrative Konstruktion eines Films von besonderer Bedeutung sind: Fabula, Syuzhet und Style.

Bordwell, David (1985): Narration in the Fiction Film. Wisconsin: The University of Wisconsin Press, S. 49ff.

Fabula (Story): Der Begriff bezeichnet die Geschichte, die erzählt wird, ohne dass alles, was erzählt wird, auch gezeigt werden muss. Folglich entsteht die zusammenhängende Geschichte durch die kognitive Leistung der ZuschauerInnen.
Syuzhet (Plot): Das Syuzhet bezeichnet die tatsächliche Darstellung der Fabula im Film und die „Architektur“ dieser Darstellung, d. h., die Frage nach Syuzhet umfasst folgende Teilfragen: Welche Ereignisse der Fabula werden gezeigt? Wie ausführlich werden die Ereignisse gezeigt? Und in welcher Reihenfolge werden die Ereignisse gezeigt?
Style: Unter Style versteht man die Gestaltungselemente des jeweiligen Films, beispielsweise Kamerabewegungen, Lichtsetzung, Formen des Schnitts. Der Begriff umfasst also technische Elemente der filmischen Gestaltung, während Syuzhet die dramaturgischen Komponenten bezeichnet. Der Style ist für die narratologische Dimension des Films insofern von Bedeutung, als mithilfe von Kamerapositionen beispielsweise Erzählperspektiven erzeugt werden können oder bestimmte Inszenierungsinstrumente wie die Lichtsetzung Elemente der Mise-en-Scène hervorheben und sie dadurch für den weiteren Verlauf der Geschichte relevant erscheinen lassen können.

Dieser kognitive Mechanismus, der bei der Erläuterung des Begriff der Fabula erwähnt wurde, wirkt nicht nur über die gesamte Story eines Films hinweg, sondern bereits auf Ebene einer einzelnen Szene, wie nachfolgend beispielhaft erläutert wird: Eine Figur betritt ein Gebäude. Das Ganze ist in einer halbtotalen Einstellung von außen gefilmt, d. h., die Figur und deren Umgebung sind erkennbar. Die Figur öffnet die Tür, dann folgt ein Schnitt, und die anschließende Einstellung zeigt, wie die Figur einen Gang entlangläuft, eine Zimmertür öffnet und das dahinterliegende Zimmer betritt, ohne dass der gesamte Weg der Figur durch die erste Tür hindurch in das Gebäude hinein und zum Zimmer hin gezeigt worden wäre. Im Bruchteil einer Sekunde können sich somit prägnante Parameter wie Licht, Sound und Geographie verändern, ohne dass bei den ZuschauerInnen Desorientierung entstehen würde. Wie selbstverständlich wird stattdessen vorausgesetzt, dass sich das Zimmer in demselben Gebäude befindet, das die Figur in der Einstellung zuvor betreten hat. Auch der Zeitsprung (die Figur ist im Bruchteil einer Sekunde an einer ganz anderen Stelle im Gebäude) wird auf Zuschauerseite in der Regel nicht als Verzerrung erfahren, sondern als erzählerische Verdichtung akzeptiert. Auch eine solch vergleichsweise unspektakuläre Szene setzt also eine beträchtliche kognitive Leistung aufseiten der ZuschauerInnen voraus. Der eigentliche Film, also die Summe aller Einstellungen liefert also in aller Regel lediglich audiovisuelle Fragmente, die von den ZuschauerInnen als Indikatoren für größere erzählerische Zusammenhänge interpretiert werden. Solche Indikatoren können von FilmemacherInnen bewusst mehrdeutig gestaltet sein, um verschiedene Interpretationsmöglichkeiten zu fördern, Desorientierung zu schaffen, falsche Fährten zu legen etc. Die Konstruktion des erzählerischen Gesamtzusammenhangs durch die ZuschauerInnen hängt dabei maßgeblich von vertrauten Schemata und sogenannten Invarianten³, also gleichbleibenden Merkmalen ab. Bei der oben beschriebenen Szene handelt es sich um eine Inszenierungskonvention des continuity system, das unter anderem dazu dient, Handlungsabläufe zu verkürzen, ohne den erzählerischen Zusammenhang aufzulösen, wofür allerdings bestimmte Bedingungen zu erfüllen sind. So sollte die Figur über beide Einstellungen hinweg gleich aussehen; trüge die Figur in der ersten Einstellung also beispielweise einen grünen Anzug und in der zweiten einen gelben, würde dies durch die ZuschauerInnen möglicherweise als Anschlussfehler wahrgenommen oder zu Irritationen führen. Ändern sich die Rezeptionsbedingungen genrebedingt, könnte die erzählerische Lücke innerhalb der oben geschilderten Sequenz allerdings auch zu einer anderen narrativen Konstruktion auf Zuschauerseite führen. So beispielsweise in der Fantasy-basierten Comicverfilmung X-Men (USA 2000, Regie: Bryan Singer), wo Mystique, eine Mutantin mit der Fähigkeit zur Gestaltwandlung, in der Lage ist, andere Figuren in Sekundenschnelle optisch perfekt zu kopieren. In solch einem Film würden zahlreiche ZuschauerInnen bei der oben geschilderten Szene wohl die Möglichkeit einbeziehen, dass zwischen erster und zweiter Einstellung etwas vorgefallen ist und die Figur in der zweiten Einstellung nicht mehr die ursprüngliche Figur, sondern eine Gestaltwandlerin ist.
Manchmal können Zusammenhänge der Fabula, etwa der Chronologie, durch eine entsprechende Konstruktion des Syuzhets, also der Anordnung der Szenen, auch erst rückwirkend erschlossen werden. Ein Beispiel dafür wäre Pulp Fiction (USA 1994, Regie: Quentin Tarantino). In einer Szene des Films wird der Killer Vincent Vega angeschossen, und zwar so, dass sein Überleben äußerst unwahrscheinlich ist. Dennoch taucht dieselbe Figur in einer der folgenden Szenen wieder auf, ohne dass weitere Hinweise zu diesem Zeitpunkt verdeutlichen würden, dass sich die Szene im zeitlichen Verlauf der Erzählung vor dem Mord abspielt. Auf der Ebene des Syuzhets, also der Repräsentation, erzeugt die versetzte Anordnung der Szenen zunächst Irritation. Die Konstruktion der Fabula ist dadurch gestört und die ZuschauerInnen bleiben zunächst mit dem ungelösten Problem zurück, wie es sein kann, dass die Figur wieder lebendig ist. Erst später wird den ZuschauerInnen durch verschiedene Indikatoren ermöglicht, die Chronologie der Ereignisse auf der Ebene der Fabula herzustellen, indem deutlich wird, dass sich die Szenen, die zwar den ZuschauerInnen nach dem Mord gezeigt werden, sich innerhalb der Geschichte vor dem Mord ereignet haben.

Fight Club (USA/D 1999, Regie: David Fincher)

In diesem Zusammenhang ist auch der Begriff Excess (Überschuss) zu erwähnen, der ebenfalls filmstilistische Elemente bezeichnet, die allerdings nicht im Dienst der Geschichte stehen. Zum Beispiel kann so etwas wie Excess entstehen, wenn neue technische Möglichkeiten vorgestellt werden sollen, etwa um den Film damit bewerben zu können. In Fight Club (USA/D 1999, Regie: David Fincher) etwa werden immer wieder rasante virtuelle Kamerafahrten eingesetzt, die zwar die Erzählung extrem dynamisieren und zudem stilistische Maßstäbe gesetzt haben, die sich aber mehr als Bildgestaltungsmittel in den Vordergrund der Wahrnehmung drängen, statt die Geschichte tatsächlich voranzubringen (siehe Ausschnitt rechts und unter Virtuelle Kamera).
Wenngleich der Excess als filmanalytische Kategorie seine Berechtigung hat, so ist er in der praktischen Handhabung doch nicht ganz unproblematisch. Denn wann genau ein gestalterisches Mittel tatsächlich dramaturgischen Zwecken dient bzw. die kognitive Konstruktion der Geschichte durch die ZuschauerInnen beeinflusst und wann nicht, kann nicht immer genau ausgemacht werden. Insofern ist der Begriff eher im idealtypischen Sinne zu verstehen, der Excess in der Praxis also ein graduelles Phänomen.

6.2 Bordwells und Thompsons „Range of Story Information: Restricted or Unrestricted?“

Bordwell und Thompson führen diese recht groben Kategorien, wie sie selbst einräumen, als Orientierungspunkte ein, nach denen die narrative Struktur von Filmen erst einmal eingeordnet werden können⁴.
Restricted (limited range of story information) meint im Grunde eine Art des Geschichtenerzählens, bei der die ZuschauerInnen nur so viel wissen wie die Hauptfigur (oder vielleicht sogar weniger), d.h. wichtige Informationen fehlen, um die gezeigten Vorgänge in Gänze einordnen und verstehen zu können. Rätselhaftigkeit bildet folglich in der Regel den dramaturgischen Reiz einer solchen limitierten Informationsvergabe. Bordwell/Thompson nennen hier als Beispiel dementsprechend den Kriminalfilm The Big Sleep (USA 1946, Regie: Howard Hawks), in dem die ZuschauerInnen nur so viel wie der ermittelnde Detektiv wissen und die Spannung des Films dadurch erzeugt wird, dass die ZuschauerInnen quasi den Protagonisten dabei belgeiten, wie er die Informationen zusammenträgt, um den Fall zu lösen.
Unrestricted story information (broad range of story information/omniscient narration) hingegen ermöglichen den ZuschauerInnen, das Geschehen einzuordnen und zu verstehen. Die story-relevanten Informationen werden deutlich und ökonomisch, d.h. in ihrer Dichte überschaubar vermittelt. Als Beispiel nennen Bordwell und Thompson Griffith‘ Film The Birth of a Nation, in dem mehr Informationen vermittelt werden, als die einzelnen Figuren haben und den ZuschauerInnen ein Überblick über die Ereignisse und deren Zusammenhänge gegeben wird, etwa wenn eine Gruppe Gefangener nichts davon weiß, dass eine andere Gruppe auf dem Weg ist, diese zu retten, den ZuschauerInnen beide Gruppen aber in Parallelmontage gezeigt werden.

Es handelt sich immer um eine graduelle, nie um eine absolute Einordnung⁵, d.h. Filme haben eine mehr oder weniger restricted und unrestricted narration und wechseln vielleicht auch die Strategie der Informationsvergabe im Laufe der Geschichte.
Filme arbeiten aber auch nicht selten mit Verrätselungen, indem Informationen zum besseren Verständnis zwar gegeben aber bewusst so verschleiert werden, dass sie übersehen oder von den ZuschauerInnen oft falsch interpretiert werden (sollen).

Mulholland Drive (USA/F 2001, Regie: David Lynch)

Unrestricted oder restricted? So eröffnet etwa der Film Mulholland Drive (USA/F 2001, Regie: David Lynch) zu Beginn durch einige Merkmale die Möglichkeit, dass es sich bei den darauffolgenden Ereignissen um einen Traum handeln kann, aber die Inszenierung ist nicht ganz eindeutig, so dass diese leicht übersehen werden. Die Szene zuvor zeigt tanzende Paare, eine blonde junge Frau wird dann im Scheinwerferlicht allein exponiert. Verschwommen eingblendet wird ein älteres Paar, die die Frau zwischen sich haben. Mittels einer Überblendung mit Doppelbelichtung geht die Einstellung langsam in die nächste über. Das Bild ist zunächst unscharf, die Kamera schwenkt langsam von links nach rechts auf ein Bett mit roten Bezügen. Die Bewegung der Kamera erscheint nahezu zögerlich, vielleicht suchend. Aus dem Off ist schweres, zitterndes Atmen zu hören, wie von einer Person die Angst hat. Die Tonlage lässt eine weibliche Person vermuten. Die Kamera fährt auf ein Kopfkissen zu, das Bild verschwimmt und es erfolgt eine Abblende. Synthesizerklänge heben an, dazu wird ein leises Windrauschen eingespielt. Werden die Hinweise auf eine schlafende Figur erkannt und damit die Möglichkeit, dass es sich hierbei um eine Traummarkierung handeln könnte, sind die folgenden unlogischen Ereignisse viel weniger verstörend, weil sie durch das Wissen und die eigene Erfahrung mit Träumen rationalisiert werden können, d.h. von einem Traum wird auch nicht erwartet, dass er logisch ist. Die Szene zuvor kann dann auch dieser Traumlogik zugeordnet. Für das vor dieser Szene gezeigte stellt sich die Frage nur nicht in der Schärfe, weil es sich um den Anfang des Films handelt und Filmanfänge durchaus eigene kurze Filme sein können, die eine Metapher für den folgenden Film bilden.

Unristricted: In Smulltronstället (Wilde Erdbeeren, S 1957, Regie: Ingmar Bergmann) hingegen erzählt die Hauptfigur von einem Traum. Der Erzähler und Träumende ist dabei im Bett mit geschlossenen Augen in einem dunklen Zimmer zu sehen. Harfenklänge sind zu hören, woraufhin ein harter Schnitt erfolgt und die Figur plötzlich auf einer Straße zu sehen ist, wie der Erzähler auch über voice-over als Trauminhalt berichtet. Hier werden gleich mehrere Markierungen sehr deutlich gesetzt, um den Traum anzuzeigen.

Smulltronstället (Wilde Erdbeeren, S 1957, Regie: Ingmar Bergmann)

The Sixth Sense (USA 1999, Regie: M. Night Shyamalan)

Ein weiteres Beispiel im Zusammenhang, ob restricted oder unrestricted bzw. ob es sich um eine Mischform handeln könnte, ist The Sixth Sense (USA 1999, Regie: M. Night Shyamalan), dessen Anfang (vgl. auch zu The Sixth Sense unter Punkt 6.3 Diegese / diegetische Welt) zeigt, wie einer der Hauptfiguren mit einem Bauchschuss niedergeschossen wird, dieser nach einer Abblende und dem Zwischentitel „THE NEXT FALL“ aber, anscheinend vollständig genesen, wieder auftaucht. Ein Bauchschuss ist in der Regel tödlich und auch die Inszenierung mit der Vogelperspektive auf die angeschossene Figur, die auf dem Bett liegt und das sich langsame Entfernen der Kamera mit der Abblende ins Schwarz, könnten auch als Informationen/Inszenierungsstrategien verstanden werden, die den Tod der Figur bedeuten. Da die Figur aber wieder erscheint und keinerlei Informationen/Inszenierungmerkmale auf übernatürliche Ereignisse hinweisen, gehen die meisten ZuschauerInnen zunächst von einer Genesung aus. Der Abgleich der gegeben Informationen durch den Film erfolgt bei den ZuschauerInnen zunächst auf der Folie der eigenen Erfahrungswelt. Erst im Laufe des Films stellt sich heraus, dass es in dieser diegetischen Welt Geister gibt. Da die Niederschießung der Figur zu Beginn aber nicht als eindeutig tödlich dargestellt wurde, der Prolog formal abgetrennt ist und auch einige filmische Zeit vergangen ist, legt die Narration nahe, den Status der Figur als Überlebender einzuordnen und die Informationen, die auch einen tödlichen Ausgang als Möglichkeit eröffnen, zu vernachlässigen.

6.2.1 Depth of story information

In diesem Zusammenhang führen Bordwell und Thompson auch den Begriff der depth of story information ein. Mit diesem Terminus wird das Augenmerk auf graduelle Abstufungen von Subjektivität und Objektivität bei Perspektivierung gelenkt.

Dr. Jekyll and Mr. Hyde (USA 1931, Regie: Rouben Mamoulian)

Eher subjektiv: Dr. Jekyll and Mr. Hyde (USA 1931, Regie: Rouben Mamoulian) beginnt mit einer als point-of-view-shot markierten Einstellung, die als Plansequenz weitergeführt wird. Nach der Title-Sequence erfolgt eine Aufblende und orgelspielende Hände in Großaufnahme sind aus einer aufsichtigen Perspektive zu sehen, die den point-of-view-shot von der Position der musizierenden Figur markiert. Die Einstellung ist außerdem mit einer runden Maske aufgenommen, so dass das nahezu quadratische Format (genauer beträgt die Aspect Ratio 1.20:1⁶) an den Ecken abgerundet erscheint und eine Art Tunnelblick suggeriert, also den subjektiven Blick als einen beschränkten Blick inszeniert. Ein Klopfen ist zu hören, die Kamera schwenkt nach rechts und ein Mann, der durch seine Kleidung und seine abwartende Haltung im Türrahmen schnell als Butler erkannt werden kann, wird in einer amerikanischen Einstellung sichtbar. Eine männliche Stimme aus dem Off ist hören, die „Come in“ sagt. Aufgrund der auditiven Nähe und durch den Kameraschwenk, der eine Kopfbewegung suggeriert, (Einmal abgesehen davon, dass es keine Hinweise auf eine weitere Figur gibt.), kann die Stimme zunächst der der Figur zugeordnet wird, die die Orgel spielt, was auch handlungslogisch sinnvoll erscheint. Im weiteren Verlauf dieser Einstellung bewegt sich die Figur deren point-of-view durch die Kamera nachvollzogen wird durch den Raum, steigt in eine Kutsche und fährt zu einer Vorlesung an einer Universität, die von der Figur, die wiederholt als Dr. Jekyll angesprochen wird, selbst hält (an einer Stelle erfolgt eine Überblendung, die aber sehr unauffällig gemacht wurde, so dass die ganze Szene mit point-of-view als eine lange Plansequenz erscheint.). Die Figuren, die Dr. Jekyll ansprechen, schauen direkt in die Kamera. Die ZuschauerInnen erfahren diesen Vorgang, der durch die Selbstverständlichkeit, mit der Figuren wie der Butler und der Kutscher mit Dr. Jekyll reden als Routine. Die ZuschauerInnen erleben also zu Beginn die Alltagspraxis eines angesehen und respektierten Akademikers im wahrsten Sinne des Wortes aus dessen Sicht.
Ein Perspektivwechsel erfolgt, als die Figur einen Hörsaal einer Universität betritt (3:09), die Kameraführung ein Überblicken dessen Publikums vermittelt und dann ein harter Schnitt zu zwei tuschelnden Studenten überleitet (3:35). Die visuelle Verringerung der Distanz durch Fokussierung der beiden jungen Männer in Verbindung, damit dass auch keine Maske mehr an den Ecken des Bildes sichtbar ist, und dass das Flüstern für die ZuschauerInnen verständlich bedeutet eine Loslösung von subjektiven Perspektive der Figur Dr. Jekyll hin zu einer objektiveren Perspektive, die weitere Reaktionen anderer Figuren auf Dr. Jekyll zeigen. Ein Paar älterer Herren, die als Kollegen werden anschließend gezeigt, woraufhin zwei Einstellungen eine Sicht auf Dr. Jekyll aus dem Publikum aus verschiedenen Stellen des Hörsaals aus relativer Distanz zur Figur Dr. Jekyll (1. Einstellung ist zwischen Amerikanischer und Halbtotaler Einstellungsgröße und die 2. Einstellung zwischen Halbtotaler und Totaler Einstellung) aus den Sitzreihen heraus folgen. Die Suggestion als Teil des Publikums im Hörsaal die Vorlesung Dr. Jekylls wahrnzunehmen, wird durch die Rückenansichten des Publikums vor der Kamera verstärkt. Nach diesen beiden Einstellungen schließt eine Einstellung an, in der kein weiteres Publikum sichtbar ist, die stark untersichtig ist und die Figur Dr. Jekyll in einer Nahaufnahme zeigt. Die Figur blickt in Richtung der Kamera und adressiert damit direkt das Publikum (4:16). Danach erfolgt eine Einstellung, die Dr. Jekyll von hinten in einer halbnahen Einstellung als Rückenfigur vor seinem Publikum zeigt (4:30). Die Schwenks nach links und anschließend nach rechts korrespondieren mit dem Vortrag Dr. Jekylls über die zwei Seelen des Menschen und wird dadurch wieder stärker subjektiv geprägt.
Die Einführung des Protagonisten in seinem sozialen Umfeld durchläuft also verschiedene Perspektivierungen, die sich graduell von einer sehr stark subjektiven über distanziertere und damit objektivere Perspektiven bis hin zu einer Adressierung der Zuschauer*innen, am Ende wieder eine subjektivere Perspektive einnimmt.

Der Prozess (Orig.: Le procès, F/I/D 1962 Regie: Orson Welles)

Eher subjektiv: Orson Welles berühmte Verfilmung des noch berühmteren Romanfragments Der Prozess von Franz Kafka beginnt mit der Parabel Vor dem Gesetz, die im Roman erst im letzten Drittel von einer Figur der diegetischen Welt erzählt wird. Im Film erzählt ein auktorialer Erzähler in Form einer männlichen voice-over-Stimme diese Parabel, die zusätzlich mit Bildern illustriert wird. Die Erzählung endet mit folgender Aussage des Erzählers: „Das ist der Hergang der Geschichte, die „Der Prozess“ erzählt. Die Logik dieser Geschichte ist die Logik eines Traumes, eines Albtraumes.“ Darauf folgt eine Überblendung mit Doppelbelichtung in eine unscharfe Aufnahme eines schlafenden jungen Mannes, die langsam scharf gestellt wird (0:21). Der Albtraum wird damit zunächst der Figur zugeordnet. Der Erzähler hat aber im Stile eines auktorialen Erzählers die Geschichte vermittelt. Mit der Erwähnung einer kommenden Geschichte, der „Logik eines Albtraums“ und der Einblendung der Figur entwickelt sich der auktoriale Erzähler langsam zu einem personalen Erzähler, denn die Inszenierung bleibt von nun an der Figur des Josef K. Der Erzähler ist also bereits über den Albtraum des schlafenden Mannes informiert, der noch kommen wird. Sind die Bildern dann schon eine Art Screenshots des Albtraums der erst noch gezeigt wird? Dann wären sie schon Teil der Innensicht der Figur Josef K. die dann eingeblendet wird. Oder ist alles nur ein Albtraum einer Figur, die gar nicht gezeigt wird? Die Inszenierung versucht so, die brüchige Erzählperspektive des Romanbeginns ins Filmische zu transponieren (siehe dazu auch unten).

Barry Lyndon (UK/USA 1975, Regie: Stanley Kubrick)

Eher objektiv: Bei Barry Lyndon (UK/USA 1975, Regie: Stanley Kubrick) führt ein allwissender Erzähler, der sich über eine sonore männliche Stimme über voice-over mitteilt, die ZuschauerInnen durch die Geschichte und vermittelt Informationen, die eine weit über die Perspektive der Figuren hinausgeht. Der Film lehnt sich mit dieser Erzählweise eines auktorialen Erzählers, eingeblendeten Texttafeln mit geschwungenen Lettern und der Einteilung in Kapiteln an die Erzählweise der Literatur, insbesondere des Romans an. Der allwissende Erzähler, der mit der männlichen Stimme als Erzählinstanz, steht mit seinem Wissen quasi über der Diegese, als wenn er die Welt von außen betrachten würde. So schiebt sich zwischen die diegetische Welt und ihre Figuren eine Erzählinstanz, die eine gewisse Distanz der RezipientInnen und den dargestellten Ereignissen schafft.

Beispiele:
sehr subjektiv: Der Prozeß, A Clockwork Orange
objektiv: Barry Lyndon,

6.3 Diegese / diegetische Welt

Als Ergänzung zu Bordwells Modell soll an dieser Stelle noch der Begriff der Diegese bzw. diegetischen Welt eingeführt werden. Der Begriff Diegese ist durch den französischen Philosophen Etienne Souriau in die Filmwissenschaft eingeführt worden⁷ und bezeichnet zunächst die im Medium des Films konstruierte Welt, in der sich die Handlung der Geschichte vollzieht und die nach eigenen Gesetzmäßigkeiten funktioniert. Diese Welt kann der realen Welt der ZuschauerInnen entsprechen, muss es aber nicht. Ein Fantasyfilm etwa kann von Magiern, Zwergen und anderen fantastischen Wesen bevölkert sein, ohne dass solche Gestalten bei den ZuschauerInnen für Irritation sorgen würden, weil diese mit dem Genre vertraut sind und solche Wesen in den diegetischen Welten des Genres eine Konvention darstellen. Die meisten Filme eröffnen mit ihrer diegetischen Welt daher eine konventionalisierte Genrewelt⁸, die bei den ZuschauerInnen bestimmte Erwartungen provoziert. Solche Effekte sind auch für Genrehybride⁹ festzustellen, bei denen Merkmale verschiedener Genres zusammenfließen.
Zur Diegese gehören des Weiteren Elemente, die filmisch selbst überhaupt nicht dargestellt werden. Wenn beispielsweise die Handlung eines Films in New York angesiedelt ist, wird der Rest der den ZuschauerInnen bekannten Welt wie selbstverständlich und meist unbewusst als der diegetischen Welt zugehörig vorausgesetzt, auch wenn dieser weder gezeigt noch von den handelnden Figuren oder in anderer Weise irgendwie thematisiert wird.
Innerhalb der Filmwissenschaft wird der Begriff der Diegese allerdings keineswegs einheitlich verwendet. Einen Überblick über die verschiedenen Deutungen bietet der Text von Anton Fuxjäger¹⁰ (hier geht es zum Text).

6.3.1 Diegetische Teilschichten nach Wulff

Ein interessanter Ansatz zur diegetischen Welt findet sich beim Filmwissenschaftler Hans-Jürgen Wulff. Dieser hat in seinem Aufsatz „Schichtenbau und Prozeßhaftigkeit des Diegetischen“¹¹ die diegetische Welt des Films in Teilschichten systematisiert (hier geht es zum Text).

Diegetische Teilschichten nach Wulff

Fight Club (USA/D 1999, Regie: David Fincher)

„Die erzählte Welt ist eine physikalische Welt, die physikalische Eigenschaften wie Schwerkraft oder Konsistenz aufweist.“¹²
„Die erzählte Welt ist als Wahrnehmungswelt der Figuren konzeptualisiert.“¹³ Am Verhalten der Figuren ist also zu erkennen, dass die Figuren auf ihre Umwelt reagieren und diese in der Regel auch auf sie reagiert.
„Die diegetische Welt ist die soziale Welt der Figuren.“¹⁴ Das heißt, die Figuren interagieren in der Welt des Films in der Regel mit anderen Figuren. Auf diese Weise werden bestimmte soziale Regeln etabliert, die der Alltagswelt der ZuschauerInnen mehr oder weniger vertraut sein können, aber nicht müssen. Die Welt eines Märchen- oder Fantasyfilms funktioniert etwa nach anderen Regeln als ein Film, der im Deutschland der Gegenwart spielt. In Lord of the Rings (USA/NZ 2001, 2002, 2003, Regie: Peter Jackson) beispielsweise ist die soziale Welt weitgehend deutlich in Gut und Böse getrennt. Orks abzuschlachten wird dort als moralisch gerechtfertigt, sogar als notwendig gesehen, da deren Bösartigkeit und Gewaltbereitschaft einen unabänderlichen Wesenszug darstellt und den als Helden stilisierten Protagonisten der Erzählung keine Handlungsalternative lässt. In unserer Alltagswelt dominieren hingegen andere Vorstellungen von Gut und Böse, die zumindest prinzipiell von der Veränderungsfähigkeit und der Würde jedes Menschen ausgehen, weshalb in den meisten westlichen Demokratien selbst bei schwerwiegenden Straftaten wie Mord und Vergewaltigung keine Todesstrafe vorgesehen ist.
„In engem Zusammenhang mit der Sozialwelt ist die erzählte Welt schließlich eine moralisch eigenständige Welt.“¹⁵ Die Figuren können durch ihr Verhalten die moralischen Maßstäbe der ZuschauerInnen herausfordern, bestätigen oder ihnen widersprechen. Filme können moralische Dilemmata thematisieren, die ihrerseits womöglich zum zentralen dramaturgischen Element des Films werden. Jedes Genre hat sein eigenes moralisches Wertesystem. So sind im Mafiafilm Misstrauen, Verrat und Mord allseits präsent und keine Ausnahme; sie sind also genreimmanente Komponenten und bilden damit den (un-)moralischen Standard dieses Kriminalfilm-Subgenres. Im Zuge der Filmrezeption läuft aufseiten der ZuschauerInnen daher stets ein Abgleichungsprozess zwischen dem eigenen moralischen Wertehorizont und jenem der diegetischen Welt bzw. der Figuren ab.

Diegese vs. Plot vs. Story

Doch in welchem Verhältnis stehen nun Diegese und die bereits oben erläuterten narratologischen Kategorien Fabula bzw. Story und Syuzhet bzw. Plot zueinander? Im Schaubild rechts umfasst die Diegese die Story und den größten Teil des Plots, weil der diegetischen Welt auch viele Elemente implizit zugeordnet werden, die in keinster Weise dargestellt werden. Im Schaubild rechts umfasst die Diegese die Story und den Plot, da sich die Story innerhalb der diegetischen Welt ereignet und über den Plot, also die audiovisuellen Fragmente, die die ZuschauerInnen auf der Leinwand präsentiert bekommen, vermittelt wird. Da die Gestaltung der opening credits (also die Nennung von Mitwirkenden an dem Film sowie in der Regel dessen Titel) und der closing credits (Nennung weiterer Mitwirkenden am Film bis hin zu technischen Spezifikationen und Danksagungen) zwar Informationen über die diegetische Welt enthalten können, aber zugleich auch auf die nicht-diegetische Welt verweisen, gehören sie weder vollständig zur Diegese noch zur nicht-diegetischen Welt. So sind etwa bei den opening credits in Fight Club (USA 1999, Regie: David Fincher) die Texteinblendungen zugleich Elemente der diegetischen Welt. Der Film eröffnet mit einer rasanten virtuellen Kamerafahrt rückwärts durch organische Strukturen, die an Synapsen erinnern. Namen von Produktionsstudio und Schauspielern wie Edward Norton und Brad Pitt erscheinen. Die Lettern, die sich innerhalb des dargestellten Raums zu befinden scheinen, driften ineinander und pulverisieren. Die Kamerafahrt, die mit dem Blick auf den Protagonisten endet, der sodann beginnt, aus dem Off heraus zu erzählen, eröffnet schließlich die diegetische Welt, und verrät bereits, dass alles, was im Folgenden geschehen wird, dem Kopf des Erzählers entspringt.

Bei einem Film wie Smoke (USA 1995, Regie: Wayne Wang) beispielsweise, der ausschließlich in New York spielt, werden die ZuschauerInnen in aller Regel davon ausgehen, dass die übrigen Teile der USA und der Welt auch in der diegetischen Welt existieren, obwohl diese im gesamten Film nicht thematisiert werden. Der Balken, der im Schaubild den Plot darstellt, ragt rechts und links nur leicht über den Bereich der Diegese hinaus, um so die opening credits und die closing credits darzustellen. Diese nur dem Plot zuzurechnen, ist nicht ganz unproblematisch; denn einerseits können die Credits – insbesondere die Anfangs-Credits – Informationen enthalten, die den Aufbau der Story unterstützen, dabei aber nicht Teil der diegetischen Welt sind. So kann es sich beispielsweise um Gestaltungsmittel wie Musik oder Typographie handeln, die sowohl eine spezifische Stimmung zu erzeugen imstande sind, als auch auf ein bestimmtes Genre verweisen und Informationen über die Geschichte und ihre Konstruktion enthalten können. Die Grenzen zwischen Diegetischem und Nicht-Diegetischem sind also fließend (siehe dazu auch Fuxjäger 2007, S. 25, hier geht es zum Text). Fight Club spielt in einer Großstadt, die durch verschiedene Attribute wie Architektur, Autos, Kleidung der Figuren und nicht zuletzt die Sprache als amerikanische wahrgenommen werden dürfte, auch wenn die Stadt während des gesamten Films nicht einmal konkret benannt wird. Damit werden für die Vorstellung der diegetischen Welt bei den ZuschauerInnen Wissensbestände über das Phänomen Großstadt und im Besonderen über amerikanische Großstädte abgerufen, die in die Konstruktion der diegetischen Welt des Films einfließen. Allerdings ist die Inszenierung von vorneherein durch den Look (Bordwell) mittels Kameraführung, Licht und nicht zuletzt durch die Erzählperspektive sehr artifiziell und suggeriert keine naturalistische Darstellung einer amerikanischen Großstadt. Konkret erzählt wird in dieser diegetischen Welt im ersten Teil des Films die Story/Fabula eines jungen Mannes, der an Schlaflosigkeit leidet und diese zu kompensieren versucht, indem er Selbsthilfegruppen für Probleme besucht, die gar nicht die seinen sind, woraus sich eine Art Sucht entwickelt. Die zahlreichen Besuche, die den Suchtcharakter illustrieren, werden allerdings nicht im Detail gezeigt, sondern lediglich angedeutet; die Inszenierung zeigt nur vereinzelt Szenen aus verschiedenen Gruppensitzungen, immer wieder in schnellen Schnitten, um die Gier des Protagonisten nach dem Gefühl, Teil einer Gruppe zu sein, für die ZuschauerInnen erfahrbar zu machen. Diese Inszenierung bildet die Ebene des Syuzhet. Als der Protagonist bei seiner betrügerischen Teilnahme durch eine Frau gestört wird, die sich genauso verhält wie er selbst, beginnt sein Leiden von neuem und die Geschichte nimmt eine andere Richtung (story/fabula). Nach einiger Zeit gründet er eine Untergrundorganisation, die stetig wächst, wobei die einzelnen Schritte, etwa die Rekrutierung der Mitglieder, nicht gezeigt wird, was vonseiten der ZuschauerInnen gleichwohl im Sinne einer darstellerischen Verdichtung akzeptiert wird.
Im Grunde besteht nahezu jeder Film aus einer Anordnung von audiovisuellen Fragmenten. Die Inszenierung zielt dabei in der Regel darauf ab, den ZuschauerInnen auf Basis solcher Fragmente zu ermöglichen, einen kohärenten Gesamtzusammenhang zu konstruieren, also die erzählerischen Lücken zwischen den einzelnen Fragmenten kognitiv aufzufüllen. Sowohl bei größeren Handlungszusammenhängen als auch innerhalb von Szenen müssen diese Fragmente also so gestaltet sein, dass die Möglichkeit der kognitiven Vervollständigung unterstützt wird. Bei einer Dialogszene mit zwei Figuren etwa kann es schon irritierend sein, wenn die Figuren beim Schuss-/Gegenschuss-Verfahren in unterschiedlichen Lichtverhältnissen gezeigt werden. Erfolgen größere Zeitsprünge innerhalb einer Geschichte, wird nicht selten ein Insert mit Zeitangabe eingeblendet, etwa „THE NEXT FALL“ wie in The Sixth Sense (USA 1999, Regie: M. Night Shyamalan). So werden die ZuschauerInnen auf mögliche Veränderungen bei Figuren oder Handlung und eine neue Situation vorbereitet. Im Falle von The Sixth Sense dient der Zeitsprung zudem der Verschleierung, dass der Psychiater Malcolm Crowe, auf den zuvor – im Prolog des Films – ein Patient geschossen hat, und der kurz nach der Einblendung wieder auftaucht, keineswegs genesen, sondern aufgrund der Schussverletzung verstorben ist und lediglich als Geist weiterexistiert, den nur Menschen mit einer besonderer Gabe wahrnehmen können.

6.3.2 Die aktiven ZuschauerInnen: diegetisieren und narrativisieren

Bordwells oben skizziertes Modell zur Narration fiktionaler Filme geht von aktiven ZuschauerInnen aus, die den Prozess der Filmrezeption durch kognitive Prozesse wesentlich mitgestalten. Daran knüpft Britta Hartmann an, wenn sie die Aktivitäten des sogenannten Diegetisierens und Narrativisierens definiert.

Diegetisieren: „Diegetisierung meint die auf den Entwurf einer weitgehend kohärenten und in sich konsistenten erzählten Welt bezogenen imaginativen Akte des Zuschauers; die Diegese ist ihr Resultat, die erfolgte Synthese der auf diese imaginäre Welt bezogenen Denotationen des Textes und der Wissensbestände des Zuschauers (vgl. Branigan 1986; Wulff 2007b).“¹⁶
Um zu verstehen, was damit gemeint ist, kehren wir zu unserem Beispiel The Sixth Sense zurück. Die Welt des Films wird uns zunächst als eine präsentiert, die nach den physikalischen Gesetzen unserer Alltagswelt zu funktionieren scheint. Auch die sozialen Praktiken und Institutionen, die gezeigt oder angedeutet werden, gibt es in der Realität. Im Prolog feiert der Protagonist des Films, bereits erwähnt ein Kinderpsychiater, mit seiner Frau einen beruflichen Erfolg. Sie stoßen bei Kerzenlicht mit einem alkoholischen Getränk an, sprechen ein zeitgenössisches Englisch (nicht wie beispielsweise in A Clockwork Orange (UK/USA 1971, Regie: Stanley Kubrick), in dem zwar ebenfalls Englisch gesprochen wird, das aber mit ungewöhnlichen Vokabeln und Redewendungen angereichert ist) und leben offenbar in einem schönen Haus, das auf eine wohlhabende bürgerliche Existenz hinweist. Im weiteren Verlauf des Films wird dann aber deutlich, dass in der diegetischen Welt Geister existieren, die nur von Menschen mit besonderer Begabung gesehen werden können. Der Film entwickelt somit eine eigene Gesetzmäßigkeit, weshalb die ZuschauerInnen ihre ursprünglichen Annahmen über die die filmisch dargestellte Welt also korrigieren müssen, um der Handlung weiter folgen zu können. Von rezeptionspsychologischer Bedeutung ist dabei in der Regel, dass der Film der eigens entwickelten Gesetzmäßigkeitslogik folgt, also konsistent bleibt und diese nicht beliebig durchkreuzt. Verfahren Filme inkonsistent, führt das auf Zuschauerseite oftmals zu einem Illusionsbruch, d. h., der „kommunikative Vertrag“¹⁷, also die unausgesprochene Vereinbarung zwischen Film bzw. FilmemacherInnen und ZuschauerInnen, nach bestimmten Regeln zu inszenieren (seitens der FilmemacherInnen) und zu rezipieren bzw. eine gewisse Illusionsbereitschaft mitzubringen (seitens der ZuschauerInnen), wird vom Film gebrochen. Bei The Sixth Sense wäre es beispielsweise inkonsistent, wenn die Geister ohne weitere Begründung im weiteren Verlauf des Films plötzlich auch zu anderen Menschen ohne spezielle Begabung Kontakt aufnehmen könnten. Das aber bedeutet, dass die Diegese stets nur von beiden Seiten her zu kreieren ist. GenrekennerInnen des Horrors, sei es Film oder Literatur, wissen um die Konventionen zur Genese von Geistern, die in der diegetischen Welt in der Regel nur deshalb existieren, weil den Menschen, deren Wiedergänger sie sind, im Leben ein Unrecht widerfahren ist, das nur von ausgewählten Lebenden getilgt, gesühnt oder, weniger biblisch betrachtet, gerächt werden kann. Die Lebenden avancieren dieser Logik zufolge zur Exekutive des Geistes, damit dieser schließlich Ruhe finden kann und die Lebenden ihren eigenen Konflikt zu lösen in der Lage sind. Genrewissen liefert ZuschauerInnen also immer auch Hinweise auf die dramaturgische Gestaltung eines Films und ist zugleich ein unverzichtbares Element bei der Diegetisierung eines Films.

Narrativisieren: „Im Zentrum der narrativisierenden Aktivitäten stehen die Figuren. […] Die erzählte Welt verlangt nach Bewegung und Veränderung: Damit eine Geschichte ihren Anfang nehmen kann, muss sie mit Figuren bevölkert werden, welche die Diegese mit ihrem Handeln dynamisieren.“¹⁸
Bezogen auf das Beispiel The Sixth Sense (USA 1999, Regie: M. Night Shyamalan) lässt sich dies anhand der Figur des Psychiaters und seiner Frau erläutern, die als Paar einer traditionellen bürgerlichen Idealvorstellung zu entsprechen scheinen. Das Paar ist wohlhabend, der Mann(!) beruflich erfolgreich, seine Frau bewundert und verehrt ihn. Das Ambiente mit Kamin, die Auszeichnung für seine berufliche Leistung und weitere Attribute wirken schon fast zu schön, um wahr zu sein. So gesehen könnte es sich beim Anfang von The Sixth Sense auch um das Happy End eines Films handeln. Da die Szene aber nun einmal am Anfang des Films steht, ist ein baldiger Bruch mit der Idylle wahrscheinlich, der mit dem Auftauchen eines verzweifelten jungen Mannes, eines ehemaligen Patienten von Malcolm, auch tatsächlich schnell eintritt. Der Prozess des Narrativisierens ist nach Bordwell durch Hypothesenbildung, -bestätigung oder -verwerfung geprägt. Die Informationsdichte des Mediums Film und die vorgegebene Geschwindigkeit, in der die Informationen präsentiert werden (ein Film im Kino kann nicht angehalten und zurückgespult werden), zwingt die ZuschauerInnen, unbearbeitete Probleme zurückzulassen. Der Prolog von The Sixth Sense etwa endet mit der Niederschießung des Psychiaters, also einer Figur, die vielleicht die Hauptfigur ist. Handelt es sich also um das Ende der Geschichte, die dem Film lediglich vorangestellt wurde, weshalb im Folgenden gezeigt werden wird, wie es dazu gekommen ist? Die anschließende Einblendung „THE NEXT FALL“ negiert diese Option sehr schnell, obwohl die in der vorhergehenden Szene niedergeschossene Figur plötzlich wieder vollkommen gesund zu sein scheint. Was hat dieser Vorfall also für eine Bedeutung für die Entwicklung von Figur und Geschichte? Diese Frage, die viele ZuschauerInnen zum jetzigen Zeitpunkt des Films beschäftigen dürfte, muss allerdings erst einmal zurückgestellt werden, weil nach der Einblendung eine weitere Hauptfigur vorgestellt und die Geschichte von Malcolm und Cole erzählt wird, die mit dem zuvor gezeigten Attentat nichts zu tun zu haben scheint. Die Geschichte läuft also zunächst in eine andere Richtung.
Da Diegetisieren und Narrativisieren eng miteinander verwoben sind, weil über die Handlungen der Figuren die diegetische Welt zu einem großen Teil vermittelt wird, weil auf diese Weise Erzählperspektiven konstituiert werden etc., können diese Ebenen in der analytischen Praxis nicht strikt voneinander getrennt werden.

6.4 Erzählinstanz, Fokalisierung, Okularisierung und Aurikularisierung

Die lange Tradition der literaturwissenschaftlichen Narratologie hat eine Fülle an Überlegungen und Begriffen hervorgebracht, die zwar nicht eins zu eins auf den Film übertragen werden können, aber durchaus inspirierend wirkten. So wurden narratologische Begriffe innerhalb der Filmwissenschaft vielfach rezipiert und für das Medium Film umdefiniert. Das gilt beispielsweise für den Fokalisierungsbegriff des Literaturwissenschaftlers Gerard Genette¹⁹, der etwa von Markus Kuhn in Filmnarratologie. Ein erzähltheoretisches Analysemodell²⁰ für den Film weiterentwickelt wurde, um Relationen des Wissens von Erzählinstanz und Figur beschreibbar zu machen. Mit Relationen des Wissens ist das Verhältnis dessen gemeint, was die filmische Erzählinstanz den ZuschauerInnen an Informationen vermittelt und dem, was die Figur weiß. Auf der visuellen Ebene ist die Erzählinstanz im Prinzip das, was die Kamera zeigt. Der abstraktere Begriff „visuelle Erzählinstanz“ ist unter anderem dem Umstand geschuldet, dass filmische Bilder längst nicht mehr ausschließlich mit einer Filmkamera erzeugt werden, sondern bisweilen mehr oder weniger im Computer generiert werden. Wird etwa eine Figur in einer totalen Einstellung gezeigt, ist für die ZuschauerInnen mehr sichtbar, als die Figur selbst sehen kann. Dementsprechend wissen die ZuschauerInnen in dieser konkreten Situation mehr über die Umgebung als die Figur. Der Begriff ist darüber hinaus anschlussfähig für weitere Begriffe zur Analyse filmspezifischer Charakteristika, so die Relationen der Wahrnehmung, die in Kuhns Modell über die Begriffe der Okularisierung für die visuelle Ebene und Aurikularisierung für die auditive Ebene erfasst werden. Bei Relationen der Wahrnehmung erfolgt ein Abgleich zwischen dem, was visuell (oder auditiv) dargestellt wird, also was die ZuschauerInnen wahrnehmen können, und dem, was die Figur wahrnimmt.

Zum Zusammenhang von Erzählinstanz, Fokalisierung, Okularisierung und Aurikularisierung nach Markus Kuhn²¹
Von besonderer Bedeutung für die narratologische Perspektive in der Filmanalyse ist zunächst der Begriff der Erzählinstanz. Eine solche Erzählinstanz (auch Narrative Instanz) ist die vermittelnde Einheit von Autor und Geschichte und von der Geschichte zu den RezipientInnen. Der Begriff dient in der Literaturwissenschaft also im Grunde einer Trennung von AutorIn und Werk, um bei der Analyse die verschiedenen Möglichkeiten der Perspektivierung beschreiben zu können und dem Problem der Frage nach der AutorInnenintention aus dem Weg zu gehen. Der berühmte Romanbeginn „Jemand mußte Josef K. verleumdet haben, denn ohne dass er etwas Böses getan hätte, wurde er eines Morgens verhaftet.“ ²² wird zwar der historischen Person Franz Kafka als Produzent zugeordnet, dieser wird aber in der Analyse nicht als Aussagesubjekt, also nicht als „Sprecher“ dieses Satzes betrachtet. Dafür wurden Begriffe wie auktorialer Erzähler (auch allwissender Erzähler) und Nullfokalisierung entwickelt, um eine Perspektivierung zu benennen, die eben nicht der Autor oder die Autorin sind und der eben zitierte Satz zeigt einen allwissenden Erzähler an, da es sich um eine Aussage über eine Figur handelt, die anscheinend noch nicht weiß, dass sie verhaftet wird. Gleichzeitig wird „Jemand musste“ eine Vermutung geäußert und damit wiederum eine Subjektivierung vorgenommen, ohne dass hier deutlich wird, wer diese Vermutung anstellt. Die nachfolgenden Sätze etablieren dann bereits die strenge Bindung der Erzählung an die Hauptfigur Josef K., so dass der Satz rückwirkend wenigstens zum Teil als Wahrnehmung der Figur Josef K. interpretiert werden kann (vgl. Beicken 1995, genaue Quellenangabe folgt), der Bruch in der Perspektivierung in diesem Satz aber bestehen bleibt, da über Josef K. in der dritten Person ausgesagt wird und ein Ereignis beschrieben wird, von dem die Figur noch nichts weiß. Bei Perspektivierungen geht es also um die Informationsvergabe in Bezug auf die Figuren. Wissen die LeserInnen mehr als die Figur(en) und darüber hinaus, wer nimmt wahr, also aus wessen Sicht werden die Informationen vermittelt?
Bei einer Figurenrede wie „‚Wer sind Sie?‘ fragte K.“²³ wird die Frage der Figur K. zugeordnet, auch wenn wir als LeserInnen wissen, dass der Autor Franz Kafka wohl diesen Satz geschrieben hat und dieser Satz einen Teil der Konstruktion der Figur K. bildet, der hier der Protagonist ist. Das „fragte K.“ vermittelt eine Außenperspektive, also eine Erzählinstanz, die aussagt, dass die Figur K. die Frage „Wer sind Sie?“ stellt. Schon nach dem ersten Satz wird der auktoriale Anteil der brüchigen Erzählperspektive zugunsten eines personalen Erzählers (Dieser Terminus stammt von dem Narratologen Franz K. Stanzel²⁴.) vernachlässigt. Bei einer personalen Erzählperspektive teilen die LeserInnen dieselben Informationen wie die Figur, ohne dass sie diese direkt aus deren Sicht erfahren. Kafka verwendet diese Form der Erzählperspektive im weiteren Verlauf des Romans konsequent, so dass auf sprachlicher Ebene eine Außenperspektive vermittelt wird, aber im Grunde alles, was geschieht, dem Wissens- und Wahrnehmungshorizont der Hauptfigur entstammt.
Auch wenn Literaturverfilmungen grundsätzlich als eigenständige Werke betrachtet werden sollten, kann eine Verfilmung von Kafkas Roman als Vergleichsfolie herangezogen werden, um hier zur Veranschaulichung der Frage nach der Erzählinstanz zu dienen.

Die ersten Sätze aus Kafkas Roman werden hier zitiert, um durch einen Abgleich mit der filmischen Umsetzung zu ermöglichen.
Der berühmte erste Satz von Kafkas Roman beinhaltet eine brüchige Erzählperspektive. Das „mußte“ drückt hier eine Spekulation aus. Aber wer stellt diese Spekulation an? In Deutungen wird diesem Satzteil vor allem wegen des „mußte“ zumindest eine subjektive Qualität zugeschrieben. Die Aussage kann einer Art externen Beobachter zugeordnet, der aber kein auktorialer Erzähler ist, denn dann wüsste er, ob eine Verleumdung stattgefunden hat oder nicht. Es handelt sich bei dieser Erzählform um einen sogenannten personalen Erzähler.

Seltsam ist, dass in der Literatur der Satz anscheinen bereits der Gedankenwelt Josef K.s zugeschrieben wird (stimmt das?).

Überschrift: Welche Position nehmen Überschriften in der Literatur ein? Peritexte? Man könnte aber bereits die Überschrift hinzuziehen, die den Charakter eines Tatsachenberichts hat.

„Verhaftung

Jemand mußte Josef K. verleumdet haben, denn ohne daß er etwas Böses getan hätte, wurde er eines Morgens verhaftet. Die Köchin der Frau Grubach, seiner Zimmervermieterin, die ihm jeden Tag gegen acht Uhr früh das Frühstück brachte, kam diesmal nicht. Das war noch niemals geschehen. K. wartete noch Weilchen, sah von seinem Kopfkissen aus die alte Frau die ihm gegenüber wohnte und die ihn mit einer an ihr ganz ungewöhnlichen Neugierde beobachtete, dann aber, gleichzeitig befremdet und hungrig, läutete er. Sofort klopfte es und ein Mann, den er in dieser Wohnung noch niemals gesehen hatte trat ein. Er war schlank und doch fest gebaut, er trug ein anliegendes schwarzes Kleid, das ähnlich den Reiseanzügen mit verschiedenen Falten, Taschen, Schnallen, Knöpfen und einem Gürtel versehen war und infolgedessen, ohne daß man sich darüber klar wurde, wozu es dienen sollte, besonders praktisch erschien. »Wer sind Sie?« fragte K. und saß gleich halb aufrecht im Bett. Der Mann aber ging über die Frage hinweg, als müsse man seine Erscheinung hinnehmen und sagte bloß seinerseits: »Sie haben geläutet?«»Anna soll mir Frühstück bringen«, sagte K. und versuchte zunächst stillschweigend durch Aufmerksamkeit und Überlegung festzustellen, wer der Mann eigentlich war.“²⁵

Orson Welles‘ Verfilmung beginnt mit dem Gleichnis des Mannes, der bei einem Türhüter vor dem Gesetz um Einlass bittet. Diese Gleichnis wird in dem Roman erst am Ende von einem Geistlichen, also einer Figur der diegetischen Welt erzählt. Die männliche Erzählstimme bleibt hier neutral in dem Sinne, dass sie sich nicht als die Stimme einer Figur aus der diegetischen Welt kenntlich macht. Sie ist als auktoriale Erzählperspektive oder nach Genette als nullfokalisiert einzuordnen. Die visuelle Gestaltung unterstützt diese Erzählperspektive insofern, dass die schwarz-weißen Standbilder, von der Ästhetik her vermutlich Stiche oder Radierungen, die wie Karten aufgestellt oder durch Überblendungen gewechselt werden, die erzählte Geschichte illustrieren, also die Gestaltung als Karten wie eine Art Diashow des Erzählers das voice-over begleiten. Die Illustrationen sind durch das Schwarz-weiß und die groben Darstellungen der Figuren simpel gehalten und vermitteln eher das Setting der Geschichte und unterstützen ihre Atmosphäre, als dass sie zusätzliche Informationen enthalten. Der Erzähler beginnt, die Geschichte des Mannes vom Lande, der Einlass beim Gesetz verlangt, zu erzählen. Dabei adressiert er die ZuschauerInnen nicht direkt. Es handelt sich hierbei um einen auktorialen Erzähler. Der Kontext der Geschichte bleibt allerdings völlig unklar. Handelt es sich um eine Parabel, eine Sage, ein Märchen? Und in welchem Zusammenhang steht sie zu einer filmischen Realität?
– Parabelhaftigkeit des folgenden Films wird mit diesem Prolog bereits behauptet bzw. auf darauf vorbereitet: „Das ist der Hergang der Geschichte, die „Der Prozess“ erzählt. Die Logik dieser Geschichte ist die Logik eines Traumes, eines Albtraumes.“ Darauf folgt eine Überblendung mit Doppelbelichtung in eine unscharfe Aufnahme einer Figur, die langsam scharf gestellt wird.
– Welche Perspektivierung bildet die visuelle Ebene mit den Bildern, die wie Aufstellkarten wirken.
– Welche Rolle spielt die Musik?
– Perspektivierung bzw. Leseanleitung mit „Logik eines Albtraums“ –> Damit wird die Widersprüchlichkeit der Ezählperspektive der literarischen Vorlage unterlaufen und den ZuschauerInnen eine Leseanleitung an die Hand gegeben. Fortan können sich die ZuschauerInnen immer damit beruhigen, dass alles nur ein Traum ist. Eine Beruhigung, die Kafka seinen LeserInnen nicht zugesteht.

Der Prozess (Orig.: Le procès, F/I/D 1962 Regie: Orson Welles)

Beim Film ist die visuelle Erzählinstanz, wie oben bereits beschrieben, im Grunde das Bild. Es geht hier nicht um eine physische Einheit, also die Kamera oder andere bilderproduzierende Apparaturen. Der Begriff der visuellen Erzählinstanz ist als abstrakter Begriff für die visuelle Ebene des Films zu verstehen. Das gleiche gilt für die auditive Ebene. Auch hier geht es nicht um die technischen Instrumente zur Erzeugung der Tonspur, sondern um ihre erzählerische Funktion.
Über diese audiovisuellen Erzählinstanzen vermitteln die FilmemacherInnen (AutorInnen) schließlich die Geschichte den RezipientInnen.
Die Germanisten Matias Martinez und Michael Scheffel definieren den ursprünglich literaturwissenschaftlichen Begriff in ihrer Einführung in die Erzähltheorie als „personifizierenden Ausdruck für das Aussagesubjekt“²⁶. Dieses Aussagesubjekt muss keine Figur sein, die etwas verbal vermitteln würde, sondern kann auch „körperlos“ bleiben. Denn auch, wenn im Film etwas gezeigt wird, das nicht die Wahrnehmung einer Figur darstellt, werden durch die Darstellung doch sehr wohl Informationen vermittelt, die zur Konstruktion der Geschichte beitragen, es wird also etwas erzählt. Was eine Figur wahrnimmt und was mit den verschiedenen Gestaltungsmitteln des Films tatsächlich erzählt wird, kann somit deckungsgleich sein oder sich unterscheiden, d. h., das Verhältnis zwischen dem Wissen der Erzählinstanz und dem der Figur kann auf unterschiedliche Art und Weise ausgestaltet sein. Solche Relationen des Wissens werden im narratologischen Sprachgebrauch unter dem Begriff der Fokalisierung erfasst.
Mit Blick auf die Eigenheiten des Mediums Film plädiert der Medienwissenschaftler Markus Kuhn für eine Differenzierung des Begriffs der Erzählinstanz und unterscheidet zwischen nichtsprachlichen und sprachlichen Erzählinstanzen. Die nichtsprachlichen Erzählinstanzen umfassen visuelle und auditive Elemente, die sich nicht einem Sprachsystem wie Deutsch, Englisch, etc. zuordnen lassen. Sprachliche Erzählinstanzen umfassen auditive Elemente wie gesprochene Sprache in Dialogen, voice-over und visuelle Elemente wie Texteinblendungen. Wenn eine Kameraeinstellung keiner Figur zuzuordnen ist, es sich also nicht um einen sogenannten Point-of-View-Shot oder einen Over-the-Shoulder-Shot handelt, bei denen die ZuschauerInnen an der Perspektive einer Figur partizipieren, ist abstrakt von der visuellen (nichtsprachlichen) Erzählinstanz die Rede. Die sprachliche Erzählinstanz kann demgegenüber sowohl auditiv als auch visuell in Erscheinung treten, etwa durch gesprochene Dialoge oder aber in Form von Zwischentiteln und anderen schriftsprachlichen Elementen.
Für die Analyse der sogenannten Relationen der Wahrnehmung, also der verschiedenen miteinander in Beziehung stehenden Wahrnehmungsweisen von Erzählinstanz und Figur(en) verwendet Kuhn daher zwei Begriffe, die die unterschiedlichen Vermittlungsebenen berücksichtigen. Das Verhältnis visueller Darstellungsweisen bezeichnet Kuhn als Okularisierung, das Verhältnis auditiver Repräsentationen als Aurikularisierung.
Da die Kategorien Fokalisierung (Relationen des Wissens) und Okularisierung/Aurikularisierung (Relationen der Wahrnehmung) verschiedene Dinge bezeichnen, müssen sich die entsprechend bezeichneten Phänomene innerhalb einer Szene nicht entsprechen und können von Einstellung zu Einstellung wechseln.

6.4.1 Fokalisierung

Markus Kuhn hat insgesamt drei Typen der Fokalisierung identifiziert, die erlauben, die „Relation des Wissens zwischen Erzählinstanz und Figur“²⁷ zu klassifizieren. Wenngleich die entsprechenden Begriffe unabhängig von der Vermittlungsweise funktionieren, ist mit Blick auf die filmischen Gestaltungsmittel zwischen visuellen und sprachlichen Formen zu unterscheiden, wobei zunächst die visuelle Sphäre zu erläutern ist.
Nullfokalisierung²⁸: Die visuelle Erzählinstanz zeigt mehr, als die Figur weiß.
Interne Fokalisierung²⁹: Die visuelle Erzählinstanz zeigt in etwa so viel, wie die Figur weiß.
Externe Fokalisierung³⁰: Die visuelle Erzählinstanz zeigt weniger, als die Figur weiß.

Die Prinzipien von Deckungsgleichheit und Differenz, die hier sichtbar werden und das Verhältnis des Wissens von Erzählinstanz und Figur(en) analytisch greifbar machen, lassen sich auch auf die sprachliche Ebene der filmischen Darstellung übertragen (Fußnote noch einfügen: Kuhn S. 124).

Nullfokalisierung³¹: Die sprachliche Erzählinstanz sagt mehr, als eine Figur weiß.
Interne Fokalisierung³²: Die sprachliche Erzählinstanz sagt in etwa so viel, wie eine Figur weiß.
Externe Fokalisierung³³: Die sprachliche Erzählinstanz sagt weniger, als eine Figur weiß.

6.4.2 Okularisierung

Wie bereits oben erläutert, verwendet Kuhn zur relationalen Analyse der Wahrnehmung von visueller Erzählinstanz und Figur(en) den Begriff der Okularisierung. Wie im Fall der Fokalisierung lassen sich auch hier wiederum drei Varianten unterscheiden, je nachdem, ob sich die Wahrnehmungsweisen von Erzählinstanz und Figur(en) unterscheiden oder ob sie deckungsgleich sind³⁴.
Nullokularisierung: Das, was die visuelle Erzählinstanz zeigt, ist an keine Figur gebunden.
Interne Okularisierung: Die visuelle Erzählinstanz zeigt in etwa, was die Figur wahrnimmt.
Externe Okularisierung: Die Figur nimmt etwas wahr, das die visuelle Erzählinstanz nicht zeigt.

6.4.3 Aurikularisierung

Da die Wahrnehmung im Film im Regelfall nicht nur visuell, sondern auch akustisch in Szene gesetzt wird, ist das Drei-Varianten-Prinzip auch für die auditiven Aspekte der Wahrnehmung zu berücksichtigen³⁵. Wie bereits erläutert, verwendet Kuhn für diese Dimension den Begriff der Aurikularisierung.
Nullaurikularisierung: Der Ton kann nicht der Wahrnehmung einer Figur zugeordnet werden.
Interne Aurikularisierung: Der Ton kann der auditiven Wahrnehmungsperspektive einer Figur zugeordnet werden.
Externe Aurikularisierung: Markierung, dass eine Figur etwas hört, das den ZuschauerInnen nicht präsentiert wird ³⁶. Eine Markierung kann ein Gesichtsausdruck oder eine körpersprachliche Äußerung sein. Die ZuschauerInnen sehen, wie eine Figur an einer Tür lauscht. Für die ZuschauerInnen ist nicht zu hören, was hinter der Tür passiert, aber die Figur drückt mimisch Erstaunen aus, woraus zu schließen ist, dass sie etwas hört, das die Ursache für diese Reaktion bildet.

6.4.4 Point-of-View, identifikatorische Nähe

Jede der naratologisch relevanten Kategorien, die oben vorgestellt wurden, greift auf spezifische filmische Gestaltungsmittel zurück. Eines der bekanntesten Gestaltungsmittel dürfte dabei der sogenannte Point-of-View-Shot bzw. die subjektive Kamera (Ich-Erzähler), die im Fall der Internen Okularisierung zum Einsatz kommt. Die Art der Inszenierung suggeriert hier, dass die Kamera die Blickperspektive einer Figur einnimmt. Häufig wird ein solcher Point-of-View-Shot durch Montage in Szene gesetzt, wobei zuerst eine Figur zu sehen ist, deren Blick in eine bestimmte Richtung weist; daraufhin zeigt die Kameraeinstellung, was in dieser Richtung zu sehen ist. Oder aber die Reihenfolge der Einstellungen wird umgekehrt, es wird also zuerst etwas gezeigt und im Anschluss folgt die Präsentation der Figur, der der vorherige „Blick“ zugeordnet werden kann. Eine weitere Variante des Point-of-View-Shots verzichtet sogar auf die Präsentation einer Figur, wobei der Eindruck subjektiver Wahrnehmung mittels Handkamera und eine unruhige oder den Raum durchschreitende Kamera erzeugt wird, die das Umherblicken oder Laufen einer Person suggeriert. Unterstützt werden kann eine solche Art und Weise der Inszenierung auch durch den Ton, etwa den Klang von Schritten auf Asphalt, durch Atemgeräusche oder knackende Zweige und Äste, die im Zusammenhang mit einer im Raum voranschreitenden Kamera den Eindruck einer sich im Wald bewegenden Person erzeugen können.
Ein bekanntes Beispiel für eine solche Inszenierungsweise ist die erste Einstellung von Halloween (USA 1978, Regie: John Carpenter), bei der die Kameraführung den Blick einer Figur suggeriert, ohne diese zuvor eingeführt zu haben (hier geht es zum Filmausschnitt).

Anders als der Point-of-View-Shot suggeriert die sogenannte Position der identifikatorischen Nähe keinen rein subjektiven Blick, wenngleich sie ebenfalls der Internen Okularisierung zuzuordnen ist. Der Begriff ist Knut Hickethiers Film- und Fernsehanalyse³⁷ entnommen und bezeichnet Inszenierungen, bei denen die Kamera nahe an einer Figur bleibt, etwa beim sogenannten Over-Shoulder-Shot, sodass die ZuschauerInnen an der Wahrnehmung einer Figur partizipieren.³⁸ Hickethier nennt als Beispiel eine Szene aus dem Fernsehfilm Stück für Stück (D 1962, Regie: Peter Lilienthal), in dem ein Junge durch ein Fenster in eine Küche eindringt. Die Kamera nimmt einen Point-of-View von der Position des Jungen ein, durchsucht die Küche und fährt diese anschließend mit einem Schwenk ab, wobei der Junge essend und auf einem Stuhl sitzend gezeigt wird. Wie Hickethier schreibt, ist die Kamera hier in eine „auktoriale Position zurückgekehrt, hat aber die identifikatorische Nähe zum Jungen, die vorher aufgebaut worden war, noch bewahrt.“³⁹

6.5 Beispielanalysen

Im Folgenden werden einige Beispiele angeführt, die verschiedene Kombinationen von Fokalisierungs-, Okularisierungs- und Aurikularisierungsformen veranschaulichen und die analytische Reichweite der entsprechenden Kategorien aufzeigen. Diese Kategorien der Fokalisierung, Okularisierung und Aurikularisierung ermöglichen es, filmästhetisches Material, also den Film, wie er den ZuschauerInnen erscheint, nach seiner narrativen Struktur zu befragen. Eine solche analytische Perspektive bildet dann wiederum einen wichtigen Ausgangspunkt für die Interpretation des Films.
Als Hauptbeispiel dient die berühmte Schlusssequenz aus 2001: A Space Odyssey, die zwar bereits vielfach diskutiert, allerdings noch nie mit dem hier vorgestellten narratologischen Modell analysiert worden ist. Es handelt sich bei 2001 aufgrund seiner ungewöhnlichen Raum-Zeit-Inszenierung zwar um einen Sonderfall, aber der Film verfährt letztlich doch mit zum Zeitpunkt seiner Produktion bereits lang etablierten Mitteln filmischen Erzählens, etwa dem sogenannten Schuss-Gegenschuss-Verfahren, bei dem zwischen zwei einander gegenüberliegenden Kameraperspektiven gewechselt wird.

Beispiel 1 – The Shining

Interne Fokalisierung bei interner Okularisierung

The Shining (UK/USA 1980, Regie: Stanley Kubrick)

Die hier ausgewählte Szene aus The Shining zeigt Danny, einen kleinen Jungen, der mit einem Dreirad durch die Gänge des Overlook-Hotels fährt. Die Kamera folgt dem Jungen und befindet sich stets etwa auf Höhe der Figur. Es handelt sich also um eine sogenannte Rückenfigur (Terminus aus der Kunstwissenschaft, zur Rückenfigur im Film bitte hier weiterlesen), die auf narrativer Ebene in diesem Fall wie ein Over-the-Shoulder-Shot funktioniert, nur dass die Figur zentriert im Bild ist. Hier kann also von einer internen Fokalisierung bei gleichzeitiger Nullokularisierung gesprochen werden, da den ZuschauerInnen visuell in etwa der Wissenshorizont der Figur vermittelt wird, ohne dass deren eigener Blick für die Inszenierung von besonderer Bedeutung wäre, die Darstellung also nicht an die Wahrnehmung der Figur gebunden ist (Nullokularisierung). Variiert wird die hier in Szene gesetzte Erzählsituation, als Danny anhält, weil am Ende eines Ganges plötzlich zwei Zwillingsschwestern stehen. Nach einem wiederholten Schuss-Gegenschuss vom Over-the-Shoulder-Shot auf das erschrockene Gesicht des Jungen wird plötzlich und sehr kurz das Gangende eingeblendet; zu sehen sind dort nun aber die blutverschmierten Leichen der Mädchen, ebenso blutverschmierte Wände sowie eine Axt im Bildvordergrund. Danny ist nicht zu sehen, die Einstellung ist also nicht als Over-the-Shoulder-Shot inszeniert. Im Anschluss folgt erneut eine Einstellung, die nicht als Over-the-Shoulder-Shot konzipiert ist und die Mädchen zeigt, die zu Danny zu sprechen scheinen. Diese Einstellung erzeugt den Eindruck eines Point-of-View-Shots von Danny aus, da die Mädchen in dieser Position am Ende des Ganges schon zuvor mit Danny im Bild zu sehen waren, was durch die Nullokularisierung suggeriert, dass sie tatsächlich in der diegetischen Welt des Films auch für andere Figuren sichtbar wären und nicht nur in Dannys Fantasie existieren. Analytisch könnte man die beiden Inszenierungen vielleicht folgendermaßen unterscheiden: Beide Einstellungsfolgen sind intern fokalisiert, aber der Over-the-Shoulder-Shot ist nullokularisiert, während der Point-of-View-Shot als Stilmittel einer internen Okularisierung zu analysieren ist. Beim Point-of-View-Shot ist die Perspektive durch die Interne Okularisierung stärker subjektiviert, wodurch das Gezeigte im Sinne einer Halluzination oder Vision Dannys interpretiert werden kann. Allerdings bilden die kurzen Einstellungen mit den Mädchen als Leichen eine weitere Zeitebene, und die Mädchen in den Over-the-Shoulder-Shots könnten potenziell von jeder Figur wahrgenommen werden. Da aber auch das vorhergehende Szenario mit den äußerlich unversehrten Zwillingen auf dem Gang, die mittels eines Over-the-Shoulder-Shots gezeigt werden, nicht eindeutig als Teil der filmischen Realität inszeniert ist bzw. unklar bleibt, ob es in dem Hotel spukt, es also übernatürliche Erscheinungen in der diegetischen Welt gibt oder nicht, bleibt eine Erzählung im Sinne visionärer Erfahrungen plausibel; zumal Danny die Mädchen in einer früheren Szene schon einmal gesehen hat und die Figur als Kind mit einer seherischen Begabung zuvor bereits eingeführt wurde.

Beispiel 2 – The Tenant/Le locataire

Interne Fokalisierung, interne Okularisierung und interne Okularisierung bei Nullfokalisierung

The Tenant/Le locataire (F 1976, Regie: Roman Polanski)

In The Tenant/Le locataire findet sich eine ähnliche Erzählperspektive, wie sie am Beispiel des Jungen Danny in The Shinning erläutert wurde. Der erkrankte und sich von der Hausgemeinschaft verfolgt fühlende Protagonist Trelkovsky (Roman Polanski) geht in der hier präsentierten Szene zur Toilette, die sich gegenüber von seinem Apartment auf dem Gang befindet. Die erste Einstellung in dem kleinen Raum zeigt die Figur von außen, wie sie den Raum betritt und das Licht anschaltet. Sie beginnt also mit einer Nullfokalisierung bei gleichzeitiger Nullokularisierung, weil die visuelle Erzählinstanz durch die Außensicht auf die Figur zunächst eine Art Beobachterposition einnimmt, etwas mehr weiß als die Figur. Trelkovsky wendet den Blick daraufhin auf einen Punkt im rechten unteren Off. Dieser Blick wirft die Frage auf, was genau Trelkovsky sieht, womit kurz eine externe Fokalisierung entsteht, weil die Figur etwas anschaut, das die Kamera nicht zeigt. Es folgt ein Point-of-View-Shot: Gezeigt wird, wie an der Lichtsetzung, dem aufsichtigen Kamerawinkel und dem Verlauf der Wand zu erkennen ist, die linke Wand des kleinen Raumes. Die suggerierte Distanz der Kamera und der Blickwinkel erzeugen dabei einen sogenannten Eyeline Match, also die Suggestion der Fortdauer über zwei aufeinanderfolgende Einstellungen hinweg, und legen auf diese Weise die Wahrnehmung der Einstellung als Point-of-View der Figur nahe. Die zunächst statische Einstellung geht dann nach wenigen Sekunden in einen Schwenk entlang der Wände über. Als der „Blick“ der Kamera schließlich auf der rechten Wand ankommt, vom horizontalen Winkel her dem Beginn der Einstellung vergleichbar, allerdings als Normal-, nicht mehr als Aufsicht, zoomt die Kamera zurück, und die Figur wird in einem Over-the-Shoulder-Shot sichtbar. Sie blickt ebenfalls auf die Wand, sodass es sich hier nun wieder um eine interne Fokalisierung handelt, allerdings bei gleichzeitiger Nullokularisierung. Wie im Fall von The Shining liegt hier eine Abstufung der Subjektivität vor, die eine Einschätzung des Gezeigten als real oder als Vision der Figur unsicher werden lässt. Die beschriebene Einstellung ist der von Hickethier als Position der identifikatorische Nähe beispielhaft genannten Szene vergleichbar (siehe oben). Während The Shining dem Subgenre des Geisterhausfilms zugeordnet werden kann und der Verlauf der Geschichte bis zur oben besprochenen Szene übernatürliche Ereignisse denkbar, ja sogar wahrscheinlich sein lässt, steht in Polanskis Film die labile Persönlichkeit eines alleinstehenden kleinen Angestellten im Mittelpunkt, dessen Identität sich zunehmend aufzulösen scheint. Die Grenze zwischen dem seelischen Inneren der Figur und der Außenwelt verschwimmt zusehends. In der hier betrachteten Szene mündet die Auflösung der Grenze schließlich in einen Akt der Selbstbeobachtung, visualisiert durch dieselbe Figur, die gegenüber im Apartment steht und mit einem Fernglas herüberschaut. In einem Over-the-Shoulder-Shot ist Trelkovsky dabei weiterhin im Bildvordergrund sichtbar. Somit handelt es sich bei dieser Selbstbeobachtung einerseits ebenfalls um eine interne Fokalisierung bei gleichzeitiger Nullokularisierung; andererseits ist zu bedenken, dass sich die Einordnung einer Einstellung im Sinne der Okularisierung stets an dem orientiert, was die jeweilige Figur wahrnimmt. Insofern kann in Bezug auf die zweite Version der Figur Trelkovsky gegenüber am Fenster auch von einer externen Okularisierung gesprochen werden, da sie durch das Fernglas etwas wahrnimmt; nämlich die Version von Trelkovsky, den die ZuschauerInnen in die Toilette auf dem Gang begleitet haben, die von den ZuschauerInnen nun aber abgewendet steht, da also das, was Trelkovsky mit dem Fernglas erblickt, für die ZuschauerInnen nicht sichtbar ist. Wenngleich naheliegender sein dürfte, dass es sich bei dieser zweiten Version am gegenüberliegenden Fenster um eine Art Halluzination handelt, sind die Grenzen zwischen Realität und Imagination aufgrund der Inszenierung bereits derart durchlässig geworden, dass die Relationen der Wahrnehmung von Erzählinstanz und Figur nicht klar einzuordnen sind.

Beispiel 3 – 2001: A Space Odyssey

Interne Fokalisierung, interne Okularisierung, interne Okularisierung bei Nullfokalisierung, externe Fokalisierung, externe Okularisierung und interne Aurikularisierung, Nullaurikularisierung, externe Aurikularisierung

ANMERKUNG: Die hier präsentierte Szene aus 2001 ist aufgrund ihrer Vieldeutigkeit wohl eine der am häufigsten diskutierten in Stanley Kubricks Werk. Die nachfolgende Analyse wird diese Diskussion allerdings vernachlässigen und anhand der oben vorgestellten Begrifflichkeiten lediglich versuchen den Umgang mit Erzählperspektiven in dieser Szene nachzuzeichnen. Der kunstphilosophische Diskurs in 2001 wird dabei nicht berücksichtigt, und auch eine gesellschaftspolitische Interpretationsmöglichkeit wird in diesem Zusammenhang nur kurz anzureißen sein. Die Anzahl der Publikationen zu Kubricks Filmen ist mittlerweile so unübersichtlich, dass an dieser Stelle zwei Monographien zu nennen sind, die die zentralen Deutungen von 2001 vorstellen, diskutieren und zu jeweils unterschiedlichen eigenen Schlüssen gelangen: Stanley Kubrick – Das Schweigen der Bilder⁴⁰ von Kay Kirchmann sowie Raum und Zeit im filmischen Oeuvre von Stanley Kubrick⁴¹ von Ralf Fischer.

2001: A Space Odyssey (UK/USA 1965-68, Regie: Stanley Kubrick)

Zum Ende des Science-Fiction-Klassikers 2001: A Space Odyssey befindet sich der Astronaut Bowman nach einer langen, psychedelisch anmutenden Raumgondelfahrt durchs Weltall plötzlich in einem Raum, der mit Möbeln aus der Zeit Louis XVI. ausgestattet ist, wobei der Boden aus futuristisch wirkenden und leuchtenden Lichtfliesen besteht. An den Raum grenzt ein Badezimmer, das stilistisch in einer Mélange aus Louis XVI. und dem Stil der 1960er Jahre gehalten ist.
Die gesamte Szene ist mit Shot-reverse-Shot-Verfahren inszeniert, jedoch nur mit einer Figur, Bowman, der nach verschiedenen Zeitsprüngen jeweils um viele Jahre gealtert zu sein scheint. Auch die Einrichtung des Raums verändert sich im Zuge dieser Zeitsprünge. Durch das Shot-reverse-Shot-Verfahren betrachtet sich Bowman also selbst beim Altern. Dieser Zusammenbruch zeitlicher Linearität wird nun mittels verschiedener Verfahren der Perspektivierung für die ZuschauerInnen als Zeitlosigkeit erfahrbar gemacht. Die Szene mit der Detailaufnahme eines Auges, dessen Abbild nach jedem Lidschlag neu eingefärbt wird, markiert den Übergang zwischen Gondelflug und Aufenthalt im Louis-XVI.-Raum. Zu bemerken ist das allerdings zunächst nur durch eine Veränderung auf der Tonspur. Zunächst klingt die atonale Musik aus, dann sind undefinierbare, hallende Geräusche zu vernehmen (ob es sich dabei wirklich um die Komposition Aventures handelt, wie Fischer schreibt⁴², konnte nicht festgestellt werden), die auf ein verändertes Raumgefüge schließen lassen. Die Einstellung ist nullokularisiert, da zuvor kein Betrachterstandpunkt etabliert wurde. Wie viel die Figur weiß, lässt sich zudem nicht bestimmen, was bei dieser stark symbolisch aufgeladenen Darstellung allerdings auch keine Rolle spielen dürfte; denn auch wenn das Auge der einzig im Film verbliebenen Figur Bowman zugeordnet werden kann, hebt die Inszenierung das Auge so hervor, dass nurmehr das Auge als Symbol im Vordergrund steht und nicht die visuelle Wahrnehmung der Figur Bowman. Andererseits ist das Auge durch die Detailaufnahme hervorgehoben, sodass es eher als Symbol ins Bild gesetzt sein dürfte und kaum den Blick der Figur suggerieren soll. Insofern könnte diese Einstellung auch als Nullfokalisierung eingeordnet werden. Ob die hallenden Geräusche überhaupt diegetisch sind, ob sie von der Figur gehört werden können oder nicht, ob sie vielleicht sogar ausschließlich von ihr gehört werden können, es sich also womöglich um eine akustische Halluzination handelt, kann an dieser Stelle nicht festgestellt werden. Es handelt sich also möglicherweise um eine Nullaurikularisierung oder eine interne Aurikularisierung.

Abb. 1

Abb. 2

Abb. 3

Abb. 3.1

Das bereits oben beschriebene Zimmer im Louis-XVI.-Stil wird zunächst aus der Gondel heraus im Gegenschuss zur Detailaufnahme des Auges gezeigt (Abb.1), zumindest dürfte es von den meisten ZuschauerInnen so interpretiert werden, weil es die naheliegendste Möglichkeit ist, einen Zusammenhang zwischen den Einstellungen zu konstruieren. Die Einstellung bildet eine interne Fokalisierung, weil visuell in Szene gesetzt wird, was aus der Gondel heraus zu sehen ist und außerdem zuvor zu sehen war, wie Bowman, die einzige zu diesem Zeitpunkt des Films noch verbliebene Figur, das Raumschiff mit der Raumgondel verlassen hat. Durch den auf diese Weise suggerierten Point-of-View kann die Einstellung also als intern okularisiert eingeordnet werden. Die anschließende Großaufnahme (Abb. 2) von Bowman dürfte diese Interpretation bestätigen. Die folgenden Einstellungen zeigen die Gondel dann im Zimmer aus verschiedenen Perspektiven (Abb. 3 und 3.1), die jeweils nullfokalisiert und nullokularisiert sind, da sie einen Überblick über den Raum gewähren, zugleich aber keiner Figur zugeordnet werden können. Außerdem setzt ein Atemgeräusch ein, das aufgrund des Sounddesigns als Atmen unter einem Helm zu identifizieren ist, folglich also dem Astronauten zugeordnet werden kann. Da die Figur ihr Atmen unter dem Helm auch hören dürfte, handelt es sich um eine interne Aurikularisierung, die auditiv „identifikatorische Nähe„⁴³ (siehe dazu oben) zur Figur herstellt und damit eine interne Fokalisierung suggeriert. Dass über den Ton eine verstärkte Subjektivierung der Blickperspektive erzeugt wird, drückt der Begriff der Aurikularisierung allerdings nicht aus, weshalb den Begrifflichkeiten zufolge das Atmen der visuellen Erzählinstanz zugerechnet werden müsste. Das aber ist widersprüchlich, da diese nullfokalisiert und nullokularisiert ist. Die hallenden Geräusche klingen weiterhin weit entfernt, d. h., die Klangquellen scheinen sich nicht im selben Raum zu befinden. Lediglich tinnitusartige Klänge drängen hin und wieder in den Vordergrund, klingen dann aber wieder ab. Dass es sich um extradiegetischen Sound handelt, ist nicht auszuschließen, allerdings erschwert die extrem artifizielle, sich jeder Alltags- und Filmgenreerfahrung entziehende Ästhetik von Sound und Mise-en-Scène eine Unterscheidung von diegetisch und extradiegetisch; die Diegetisierung, so wie sie oben mit Verweis auf Britta Hartmann erläutert wurde, wird somit gehemmt, eine kohärente Konstruktion der diegetischen Welt durch die ZuschauerInnen ist somit kaum möglich. Das Sounddesigns in dieser Sequenz suggeriert durch das Atemgeräusch im akustischen Vordergrund also einerseits räumliche Nähe zur Figur, die sich in der Einstellungsfolge, in der der Louis-XVI.-Raum zu sehen ist, allerdings noch in der Gondel zu befinden scheint. Die Geräusche im akustischen Hintergrund entstammen aber vermutlich einer Quelle außerhalb des Raums, der Raum selbst scheint keine Atmo zu haben. Im Grunde fehlt hier also der akustische Mittelgrund. Visuell folgt auf die beschriebene Sequenz mit den Raum-Totalen eine Großaufnahme Bowmans im Astronautenanzug. Dabei bleiben die Atemgeräusche deutlich zu hören, sodass eine interne Aurikularisierung vorliegt; da die Akustik aber gleichzeitig eine subjektive Perspektive suggeriert, indem die ZuschauerInnen hören, was sonst nur die behelmte Figur hören kann, die Figur aber zugleich von außen zu sehen ist, entsteht eine paradoxe Situation, die sich gewissermaßen als Dissoziation beschreiben lässt.

Abb. 4

Abb. 5

Im Anschluss an die Großaufnahme Bowmans wird ein Gegenschuss präsentiert, der den Astronauten in einer halbtotalen Einstellung durch das Fenster der Gondel zeigt (Abb. 4). Es folgt eine amerikanische Einstellung, in der Bowman stehend im Zimmer zu sehen ist. Als Gegenschüsse inszeniert, scheint die Figur also genau auf jene Gondel zu schauen, in der sie sich zu diesem Zeitpunkt selbst befindet. Zudem setzt im Laufe der amerikanischen Einstellung (Abb. 5) ein tinnitusartiger Ton ein, wodurch der Status des Gezeigten noch unklarer wird. Handelt es sich etwa um eine sauerstoffmangelbedingte Halluzination Bowmans im Inneren der Gondel oder aber um einen Traum? Wenngleich solche rationalistischen Erklärungsversuche im Zuge von Diegetisierungsbemühungen nachvollziehbar sind, spricht viel dafür, dass die Szene symbolisch zu deuten ist, eine rationalistische Interpretation somit in die Irre führt. Interessant ist in diesem Zusammenhang, welche Wahrnehmungsweise von Raum und Zeit hier über filmische Verfahren der Perspektivierung erfahrbar gemacht wird. Bei der amerikanischen Einstellung wirkt Bowmans Gesicht bereits leicht verändert, aber Einstellungsgröße und Helm erschweren eine Einschätzung.

Abb. 6

Abb. 7

Abb. 8

Erst die anschließende Großaufnahme (Abb. 6) bestätigt die sichtbare Alterung der Figur. Das andauernde Atemgeräusch bildet eine Soundbridge zwischen den Einstellungen. Bowman schaut mit staunendem Blick in die Richtung, in der die Gondel steht. Es folgt wiederum ein Gegenschuss. Dieses Mal handelt es sich um einen Over-the-Shoulder-Shot. Über die linke Schulter von Bowman hinweg ist das Zimmer ohne Gondel in einer Totalen zu sehen (Abb. 7). Auffällig ist dabei die Inszenierung des Raums in Weitwinkeloptik, die vor allem am linken Bildrand die Linien gebogen erscheinen lässt. Dann geht Bowman langsam nach vorne in den Raum hinein (Abb. 8). Das Schuss-Gegenschuss-Verfahren, das hier zur Anwendung kommt, dient in der Regel dazu, die Gegenwart zweier Figuren zu verdeutlichen, auch wenn beide nicht immer gleichzeitig im Bild zu sehen sind. Insofern ist das Schuss-Gegenschuss-Verfahren eine Inszenierungskonvention für Dialoge, d. h., zwei Figuren unterhalten, wobei zwischen ihnen hin- und hergeschnitten wird, um Sprechen und/oder Reaktionen der Figuren zu zeigen. In der Wahrnehmung der ZuschauerInnen entsteht auf diese Weise üblicherweise ein Raum-Zeit-Kontinuum, in dessen Rahmen sich die Unterhaltung abspielt. In der vorliegenden Szene dient das Schuss-Gegenschuss-Verfahren hingegen dazu, die Zeitebenen Vergangenheit, Gegenwart und Zukunft zusammenfallen zu lassen. Die einzige Referenz für das Verstreichen von Zeit ist Bowmans sichtbar gemachter Alterungsprozess. Da die Umgebung komplett statisch zu sein scheint, entwickelt sich dieser Prozess nicht synchron mit der räumlichen Welt, in der er stattfindet, was das Phänomen der Zeitlichkeit wahrnehmbar machen könnte. Die offensichtliche Zeitlosigkeit der Umgebung führt stattdessen zu einer Selbstbeobachtung der Figur, die so Zeuge ihres eigenen Verfalls wird und an der die ZuschauerInnen partizipieren. Die Szene entwickelt also die Erfahrung einer Zeitwahrnehmung, die sich am eigenen Körper orientiert. Der Raum bleibt davon unberührt. Dieser Zusammenfall verschiedener Zeitebenen ist in der Mise-en-Scène auch auf Ebene der Kulissen festzustellen. Futuristisches Design wird mit Möbeln eines längst vergangenen Jahrhunderts kombiniert. Nicht zufällig dürfte es sich hier um die symbolische Repräsentation des Aufklärungsjahrhunderts handeln, in dem das wissenschaftliche Weltbild entstanden war und unter dessen Voraussetzungen wiederum jene Technologie entwickelt wurde, mit der Bowman ins Weltall fliegen konnte.

Abb. 9

Abb. 10

Abb. 11

Gleichzeitig steht dieses Jahrhundert auch für den Untergang der Monarchie, die sich symbolisch im Mobiliar manifestiert und dessen Stil den Namen jenes Bourbonenkönigs trägt, der während der Französischen Revolution hingerichtet wurde. Der technologische Fortschritt, die daraus resultierende Eroberung des Weltraums und der zunehmende Wohlstand führten die Menschen, so könnte diese Sequenz auch gelesen werden, in die soziale Isolation und somit zur Selbstentfremdung.
Im weiteren Verlauf der Szene begegnet sich Bowman schließlich noch auf weiteren Altersstufen; anschließend auch ohne Helm und mit diegetischem Ton. Interessant ist hier, wie der Ton die Perspektivierung und damit die Zeitebenen ineinander verschränkt. Bowman geht durch einen Türrahmen, wobei er einen weiteren Raum zu betreten scheint, den er sich, offenbar, neugierig anschaut (Abb. 9). Interessant ist an dieser Stelle, dass es sich formal betrachtet eigentlich um einen Anschlussfehler handelt, denn auf dem Bett im rechten Bildhintergrund sind Kleidungsstücke zu sehen, die in der vorhergehenden Einstellung nicht dort waren; und in jener Richtung, aus der heraus Bowman sich in der Einstellung zuvor in den Raum hinein bewegt hatte, ist kein Türrahmen zu sehen. Das Bett steht, wie in Abbildung 9 zu sehen, außerdem rechts, müsste aber links stehen, wenn der Anschluss stimmen würde. Die Montage suggeriert durch die gleichbleibende Bewegungsdynamik der Figur, dieselbe Kleidung, das Licht etc., dass die Einstellung gemäß dem Continuity System unmittelbar an die vorhergehende Einstellung anschließt, aber tatsächlich bricht der Anschluss mit der dreidimensionalen Logik des Raumes und streng genommen auch mit der Zeitlogik, denn wo sollten plötzlich die Kleidungsstücke hergekommen sein? Da die Raum-Zeit-Logik aber zuvor bereits durchbrochen worden ist (wenngleich dieser Bruch ostentativer inszeniert worden ist), kann auch diese Einstellungsfolge als Teil des spezifischen Raum-Zeit-Verhältnisses der gesamten Szene betrachtet werden. Zugleich lässt sich der Bruch mit dem Continuity System als Hinweis des Regisseurs auf den Umstand lesen, wie sehr unsere (Film-)Wahrnehmung auf die Herstellung von Kontinuität geeicht ist. Vorstellbar ist selbstverständlich auch, dass sich tatsächlich ein Anschlussfehler eingeschlichen hat, was mit Blick auf die strenge Komposition des Films und die bekanntermaßen äußerst akribische Arbeitsweise Kubricks allerdings wenig wahrscheinlich sein dürfte. Der Raum, den Bowman betritt, stellt sich schließlich als Badezimmer heraus, der in einer seltsamen Mischung aus Louis-XVI. und dem zeitgenössischen Stil der Produktionszeit des Films, also den 1960er Jahren eingerichtet ist, wie ein Point-of-View-Shot mit einem Kameraschwenk (Abb. 10) zeigt. Bowman geht weiter in den Raum hinein und betrachtet sich mit staunendem Blick in einem Spiegel (Abb. 11). Das Atmen ist immer noch zu hören, aus dem Off ist nach einer kurzen Phase der Selbstbetrachtung eine leises Klackern zu vernehmen, das auch Bowman hört, denn er merkt auf und dreht sich um. Es handelt sich hierbei also um eine interne Aurikularisierung bei gleichzeitiger Nullokularisierung und interner Fokalisierung, weil die Figur in den Spiegel schaut und die ZuschauerInnen ungefähr das Gleiche sehen wie diese. Es stellt sich heraus, dass das Geräusch von Bowman auf einer weiteren Alterungsstufe stammt, auf der er im Morgenmantel an einem Esstisch in jenem Raum sitzt, aus dem der jüngere Bowman soeben hervorgetreten ist. Die Entdeckung seiner selbst in diesem anderen Raum wird wieder mittels Schuss-Gegenschuss-Verfahren und Point-of-View-Shots inszeniert, die den Standpunkt des jüngeren Bowman einnehmen. Die Einstellung, die Bowman leicht versetzt von vorne in der Nahaufnahme zeigt, ist nullokularisiert, weil sie keiner Figur zugeordnet werden kann (Abb. 12).

Abb. 12

Abb. 13

Abb. 14

Abb. 15

Abb. 16

Abb. 17

Abb. 18

Abb. 18.1

Bowmans immer noch ungläubiger und in dieser Einstellung (immer noch Abb. 12) offensichtlich zielgerichtete Blick deutet eine externe Fokalisierung an, weil nicht gezeigt wird, was die Figur sieht. Allerdings zeigen zwischengeschnittene Point-of-View-Shots mit einer Kameraführung, die den Bewegungen Bowmans entsprechen dürfte, was dieser sieht (interne Fokalisierung mit interner Okularisierung). Die zeitgleiche Präsenz eines Atemgeräuschs und des Klackerns von Essbesteck legen somit nahe, dass beide Altersversionen gleichzeitig repräsentiert sind, wobei visuell bisher nur jeweils eine Version der Figur gezeigt wird. Gegenschuss und Point-of-View-Shot bildet besagte Kamerabewegung, die in Richtung der Tür zu jenem Zimmer führt, aus dem Bowman gekommen ist. Die weiteren Einstellungen legen sukzessive den Blick in den anderen Raum (Abb. 13 und 14) frei. Der ältere Bowman geht dem jüngeren, nach dem er offensichtlich etwas bemerkt hat, offensichtlich entgegen. Aufgrund des präsenten Sounds, wird eine akustische Wahrnehmung der Figur suggeriert. Diese hält inne und schaut anschließend im Badezimmer nach (Abb. 16 und 17). Das Atmen stoppt bei der letzten Großaufnahme des jüngeren Bowman (Abb. 15), die eingeblendet wird, nachdem der ältere innegehalten hat. Das bedeutet, dass hier zwei interne Aurikularisierungen vorliegen, die auf die Darstellung von zwei Versionen einer einzigen Figur zurückzuführen sind, die sich zudem überkreuzen. Der jüngere Bowman hört den älteren und wendet sich ihm daraufhin zu, der ältere scheint den jüngeren zu hören und wendet sich ihm ebenfalls zu, allerdings ist dieser dann verschwunden. Der nachfolgende Gegenschuss aus dem Raum ist eine aufsichtige Totale, die einen Überblick über den Raum gewährt (Abb. 18). Die Erzählperspektive bildet hier eine Nullfokalisierung bei gleichzeitiger Nullokularisierung. Da der Ton sich auf Geräusche beschränkt, die von der Figur erzeugt werden und sie diese vermutlich auch wahrnehmen kann, der Ton aber nicht dezidiert die auditive Wahrnehmungsperspektive der Figur anzeigt (wie etwa das Atemgeräusch unter dem Helm), handelt es sich um eine Nullaurikularisierung. Die Inszenierung wechselt hier von einer subjektivierenden Strategie zu einer neutraleren, die den ZuschauerInnen einen Überblick über die Szenerie gewährt. Bowman wird im Folgenden beim Essen gezeigt. Essen (indirekt auch Schlafen, wie das Bett suggeriert, und selbstverständlich altern) scheint in dieser sterilen Atmosphäre das einzig Kreatürliche zu sein, dass der Mensch nicht überwunden hat. Die Darstellung des Essens erzeugt zudem den Eindruck von Alltagsroutine (siehe auch Abb. 18.1), Bowman scheint sich in diesen Räumen eingerichtet zu haben. Mit der existenziellen, sich regelmäßig wiederholenden Tätigkeit der Nahrungsaufnahme geht eine Art Normalisierung der Wahrnehmung einher, sowohl für die Figur als auch für die ZuschauerInnen. Gestört wird diese Alltagsroutine durch den Bruch eines Glases, das der Figur durch Unachtsamkeit auf den Boden fällt. Auf die möglichen symbolischen Bedeutungen dieses Ereignisses soll hier nicht näher eingegangen werden. Suggeriert wird aber, dass dieses Ereignis den Übergang zur (Selbst-)Wahrnehmung der nächsten Altersstufe einleitet.

Abb. 19

Abb. 20

Abb. 21

Als Bowman sich nun hinunterbeugt, um die Scherben auf dem Boden zu betrachten, meldet sich aus dem Off wieder ein Atemgeräusch (Abb. 19). Mit einem Over-the-Shoulder-Shot wird Bowman anschließend als Greis im Bett liegend gezeigt (Abb. 20). Die Inszenierung der Figur im Bett erinnert an eine Aufbahrung und angesichts des Alters und des kränklichen Aussehens der Figur an ein Sterbebett. In dieser Einstellung wird die Figur das erste und einzige Mal gleichzeitig visuell auf zwei verschiedenen Altersstufen repräsentiert. Interessant ist hier, dass das Atmen als einziges Geräusch die ganze Zeit über präsent ist. Dadurch entsteht dieselbe Nähe-Distanz-Relation wie zu Beginn der Szene. Einerseits suggeriert das Sounddesign des Atmens räumliche Nähe zur Figur, andererseits bleibt sie aber visuell distanziert. Die auditive Ebene suggeriert also eine interne Fokalisierung über interne Aurikularisierung (das hörbare Atmen unter dem Helm hört die Figur auch) bei gleichzeitiger Nullokularisierung. Die Einstellung (Abb. 20) ist visuell als nullokularisiert und aufgrund der sehr nahen Positon der Kamera zur Figur intern fokalisiert einzustufen. Das bedeutet, die visuelle Erzählinstanz zeigt in etwa, was die Figur weiß, zeigt aber nicht ihre Wahrnehmung. Anders verhält es sich hingegen in jener Einstellung, in der der greise Bowman den Arm hebt, mit dem Finger ins rechte Off zeigt und dabei versucht, den Kopf anzuheben. Die Figur scheint etwas wahrzunehmen, das die ZuschauerInnen nicht wahrnehmen können (Abb. 21). So ergibt sich eine externe Fokalisierung bei externer Okularisierung. Auch wenn in dieser Einstellung die Figur relativ nah gezeigt wird, erscheint das Atemgeräusch noch näher; die Dissoziation zwischen auditiver Nähe und visueller Distanz zur Figur wird also aufrechterhalten. Durch diesen Widerspruch zwischen Bild und Ton erfahren die ZuschauerInnen eine Dissonanz zwischen ihrer eigenen Nähe-Distanz-Regulierung und der filmischen Inszenierung, die die Selbstentfremdung der Figur erfahrbar macht; denn auf der Ebene der Aurikularisierung knüpft das Sounddesign wieder an das Atmen unter dem Helm an. Auch wenn es nicht ganz so deutlich klingt, scheint das Atemgeräusch im Ohr der ZuschauerInnen wesentlich näher zu sein, als die Figur auf dem Bett visuell erscheint. Auf diese Weise wird eine subjektive Wahrnehmungsperspektive suggeriert, die über die visuelle Erzählinstanz und Wahrnehmung aber nicht bestätigt wird. Nun stellt sich noch die Frage, warum dann das Atemgeräusch nicht durchgängig zu hören ist. In jener Szene, in der Bowman sich vom Esstisch erhebt, weil er (vermutlich) etwas gehört hat und nachschaut, bleibt das Atemgeräusch bis zur Einstellung mit dem zerbrochenen Glas aus. Das Sounddesign ist hier insofern naturalistischer, als dass nur solche Geräusche zu hören sind, die von den Handlungen der Figur herzurühren scheinen, etwa Schritte und das schon erwähnte Klackern des Essbestecks. Gezeigt wird in dieser Szene Alltagsroutine, d. h., die Selbstbeobachtung ist hier aufgehoben, bis zu jenem Moment, als durch eine Ungeschicklichkeit das Glas zu Bruch geht und die Alltagsroutine durchbrochen wird. Diese Störung initiiert offensichtlich die nächste Phase der Selbstwahrnehmung.

Abb. 22

Abb. 23

Abb. 24

Abb. 25

Die folgende Einstellung zeigt Bowman dann von einer Position oben hinter dem Bett, wie er auf den schwarzen Monolithen zeigt, der mitten im Zimmer steht (Abb. 22). Die Einstellung kann erzählperspektivisch als eine Art Hybrid eingeordnet werden, weil sie einerseits als Überblickseinstellung fungiert, da sie die Figur in einer relativ weiten Einstellungsgröße zeigt, auf der anderen Seite aber der Subjektivierung dient, weil sie wie ein erweiterter Over-the-Shoulder-Shot funktioniert und das Atemgeräusch zusätzlich die Subjektivierung unterstützt. Insofern lassen sich dieser Einstellung auf Ebene der Erzählperspektive auch Aspekte einer internen Fokalisierung zuordnen, gleichwohl ist sie tendenziell stärker nullfokalisiert und muss auf Ebene der visuellen Wahrnehmung als null okularisiert eingeordnet werden. Für die auditive Ebene gilt der Begriff der internen Aurikularisierung. Zugunsten des Überblicks und damit im Sinne einer Nullfokalisierung und Nullokularisierung fällt die nachfolgende Einstellung aus (Abb. 23). Das Atemgeräusch wird beibehalten, wodurch die Subjektivierung der Inszenierung nicht vollständig aufgelöst wird. Die Einstellung stellt sich insofern als Abweichung von der sonstigen Inszenierung dar, als dass sie die Subjektivierung wieder etwas zurücknimmt und visuell einen Überblick gewährt, indem sie einen neutralen Betrachterstandpunkt etabliert, bevor die nächste Einstellung dann einen Point-View-Shot von Bowmans Position suggeriert (Abb. 24). Gegen Ende dieser Einstellung verstummt das Atmen, und für einen kurzen Augenblick herrscht Stille. Das bisher wesentliche inszenatorische Strukturmerkmal auf Ebene der Montage, das Schuss-Gegenschuss-Verfahren, wird hier im Grunde fortgesetzt, nur dass anstelle eines noch älteren Bowman nun der schwarze Monolith im Raum steht, der zuvor bereits wiederholt, also leitmotivisch im Film aufgetaucht ist. Es folgt sodann ein Gegenschuss vom Monolithen zu Bowman im Bett. Auf dem Bett liegt anstatt des greisen Bowman nun ein Fötus in glänzender Fruchtblase (Abb. 25), der greise Bowman hingegen ist verschwunden oder transformiert. Im Zuge dieser Einstellung ist schließlich derselbe dumpfe Basston wie bei der Einblendung des Metro-Goldwyn-Meyer-Logos zu Beginn des Films wahrnehmbar, der dort als Einführung zu Richard Strauß‘ Komposition Also sprach Zarathustra dient.

Abb. 26

Abb. 27

Abb. 27.1

Abb. 28

Nachdem der Fötus mit weit geöffneten Augen von der Seite (Abb. 26) und in einer vergleichbaren Position wie der greise Bowman gezeigt wird (vgl. Abb. 21), folgt von der Position des Bettes aus eine Kamerafahrt auf den Monolithen zu, (Abb. 27 und 27.1). Die Fahrt signalisiert eine subjektive Kamerbewegung. Der Fötus, der in dieser Einstellung die einzige Figur darstellt, fällt als Akteur eigentlich aus; gleichwohl ist aufgrund der Rätselhaftigkeit des gesamten Films und insbesondere der Schlusssequenz davon auszugehen, dass die Wahrnehmung der ZuschauerInnen mittlerweile so geeicht ist, dass sie die Ereignisse nicht mehr handlungslogisch zu interpretieren versuchen, sondern auf symbolischer Ebene miteinander verknüpfen. Sobald der Monolith dann das Bild ausfüllt, wird auf den Mond geschnitten (Abb 28). Auf die gewaltige Symbolik der Szene kann an dieser Stelle nicht detailliert eingegangen werden, von Interesse für den vorliegenden Zusammenhang ist allerdings, dass die Erzählperspektive mit dem Tod und/oder der Wiedergeburt der Figur (Abb. 25) zu einer Nullfokalisierung bei Nullokularisierung und Nullaurikularisierung wechselt, zumindest sofern der Monolith nicht als Figur interpretiert wird. Dann müsste bei der entsprechenden Einstellung in (Abb. 25) hingegen von einer internen Fokalisierung bei interner Okularisierung gesprochen werden. Die Musik wird vom Sounddesign her erkennbar als Filmmusik eingespielt, kann von den Figuren also nicht wahrgenommen werden (Nullaurikularisierung).

Abb. 29

Abb. 30

Abb. 31

Dann schwenkt die Kamera nach unten, die Erde kommt aus dem rechten unteren Off ins Bild (Abb. 29), und nach einer Weile erscheint links der Fötus in seiner Fruchtblase in der linken Bildhälfte; von der Größe im Blickfeld der Erde vergleichbar. Der Fötus dreht sich, bis er direkt in die Kamera zu schauen scheint (Abb. 30). Der Blick des (ungeborenen) Kindes in die Kamera richtet sich also an die ZuschauerInnen, die innerdiegetische Verklammerung der Blickachsen durch das Schuss-Gegenschuss-Verfahren wird dabei in Richtung des Zuschauerraums aufgelöst. Die Einordnung als Nullfokalisierung und Nullokularisierung wäre zwar technisch zutreffend, allerdings ist der Blick in die Kamera ein sehr spezielles ästhetisches Verfahren, das auch als „Durchbrechen der vierten Wand“ bezeichnet wird. Mit dieser Metapher wird die virtuelle Grenzüberschreitung der filmischen Darstellung in Richtung der Realität der ZuschauerInnen umschrieben. Die ZuschauerInnen bilden in der erwähnten Einstellung den gegenüberliegenden Pol jener Blockachse, die von der Figur eröffnet wird. Der Gegenschuss, den die Konvention des Schuss-Gegenschuss-Verfahrens fordern würde, beträfe in diesem Fall also die ZuschauerInnen, die so auf sich selbst zurückgeworfen werden. Der Blick des Fötus kann somit als „metaleptische Tendenz“ (Fußnote Kuhn S. 358) bezeichnet werden, da eine Grenzüberschreitung in die extradiegetische Welt der ZuschauerInnen angedeutet wird. Für weiterführende Überlegungen zur narratologischen Struktur dieser letzten Einstellung des Films helfen die Kategorien der Fokalisierung, Okularisierung und Aurikularisierung also nicht wirklich weiter.
Über die Bedeutung des Fötus ist viel geschrieben worden. Vielleicht ist das die Bestätigung der These, dass es sich hier um ein „ästhetisch verdichtetes Fragezeichen“⁴⁴ in Bezug auf die Zukunft der Menschheit handelt. Dem Medienwissenschaftler Kay Kirchmann zufolge beantwortet Kubrick diese Frage mit A Clockwork Orange (UK/USA 1971), der den Blick des Fötus zu Beginn mit der Großaufnahme des Protagonisten Alex fortführt (Abb. 31).⁴⁵ Kann der Fötus, der der Erde entgegentreibt, als symbolische Wiedergeburt Bowmans und damit als ein Symbol der Hoffnung verstanden werden, so ist der provozierende, aggressive Blick des Gewalttäters Alex zu Beginn von A Clockwork Orange die Negation dieser Hoffnung. Kirchmann versteht die Figur als radikalen Ästheten, der sich jeglicher Sinnstiftung verweigert. Damit muss die Figur der Ästhetik der Dekadenz zugeordnet werden (Kirchmann, S. 184 ff.) die sich mit ihrer Haltung in einer dystopischen Welt eine Art freien Willen bewahrt, während um ihn herum Menschen gezeigt werden, die wie Karikaturen von Vertretern gesellschaftlicher Institutionen wirken. Die narratologische Analyse dieser Sequenz, die auf der Rezeptionsebene eine äußerst irritierende und rätselhafte Raum-Zeit-Erfahrung erzeugt, ermöglicht eine Einordnung der verwendeten filmischen Mittel, um widersprüchliche und unserer Alltagserfahrung widersprechende Raum-Zeit-Erfahrungen zu konstituieren. Die Begriffe der Fokalisierung und Okularisierung/Aurikularisierung ermöglichen zudem die Analyse der Inszenierung auf den Ebenen der Informationsvergabe und der Wahrnehmungsperspektive und bieten somit ein gutes Fundament für mögliche Interpretationen. Zugleich zeigt sich in diesem Zusammenhang, dass eine konsequente Anwendung der Begriffe angesichts der notwendigerweise sehr detaillierten Analysearbeit, die damit verbunden ist, einen enormen methodischen Aufwand bedeuten, der für die Untersuchung größerer narrativer Zusammenhänge schwer umzusetzen sein dürfte.

Exkurs: weitere Beispiele

– Vergleich der Filmanfänge von The Shining und Funny Games (A 1997, Regie: Michael Haneke), um strukturelle Ähnlichkeiten und Unterschiede der Inszenierung mit der Hilfe narratologischer Begriffe herauszuarbeiten und deren Grenzen zu thematisieren.
– Anhand eines Ausschnitts aus Rear Window (USA 1954, Regie: Alfred Hitchcock) wird noch eine Standardinszenierung mit den Begriffen Fokalisierung, Okularisierung und Aurikularisierung analysiert.

Für weitere Beispiele hier klicken

<- 5. Sound

Quellen:

Bordwell, David (1985): Narration in the Fiction Film. Wisconsin: The University of Wisconsin Press, S. 49ff.
Bordwell, David (1985): Narration in the Fiction Film, Madison, Wisconsin: Univ. of Wisconsin Pr.
Wuss, Peter (1993): Filmanalyse und Psychologie. Strukuturen des Films im Wahrnehmungsprozeß, Berlin: Ed. Sigma (Sigma-Medienwissenschaft; Bd. 15), S. 55ff.
vgl. dazu Bordwell, David/Thompson, Kristin (2013): Film Art. An Introduction. New York: Mc Graw-Hill Education. S. 87ff
Bordwell, David/Thompson, Kristin (2013): Film Art. An Introduction. New York: Mc Graw-Hill Education. S. 88.
imdb.com, abgerufen am 18.09.2020, https://www.imdb.com/title/tt0022835/technical?ref_=tt_dt_spec
Souriau, Etienne: „Die Struktur des filmischen Universums und das Vokabular der Filmologie“, In: montage a/v 6/2/1997, S. 140-157.
vgl. Schmidt, Oliver (2013): Hybride Räume. Filmwelten im Hollywood-Kino der Jahrtausendwende, Marburg: Schüren, S. 110ff.
Kuhn, Markus et al (Hg): Filmwissenschaftliche Genreanalyse. Eine Einführung, Berlin: deGruyter 2013, S. 29ff.
Fuxjäger, Anton: „Diegese, Diegesis, diegetisch: Versuch einer Begriffsentwirrung“, In: montage a/v, 16/2/2007, S. 17-37.
http://www.derwulff.de/2-145, zuletzt abgerufen am 14.04.2020
http://www.derwulff.de/2-145, zuletzt abgerufen am 14.04.2020, S. 2)
http://www.derwulff.de/2-145, zuletzt abgerufen am 14.04.2020, S. 2)
http://www.derwulff.de/2-145, zuletzt abgerufen am 14.04.2020, S. 3)
http://www.derwulff.de/2-145, zuletzt abgerufen am 14.04.2020, S. 4)
Hartmann, Britta (2009): Aller Anfang – Zur Initialphase des Spielfilms, Marburg: Schüren, S. 136.
Casetti, Francesco: „Filmgenres, Verständigungsvorgänge und kommunikativer Vertrag“, In: montage a/v, 10/2/2001, S. 155-173, S. 161ff.
ebd. S. 149
Genette, Gérard (1994): Die Erzählung. aus dem Franz. von Andreas Knop, München: Fink.
Kuhn, Markus (2011): Filmnarratologie. Ein erzähltheoretisches Analysemodell. Berlin/New York: de Gruyte.
Kuhn, Markus (2011): Filmnarratologie. Ein erzähltheoretisches Analysemodell. Berlin/New York: de Gruyter, S. 119ff.
Kafka, Franz [1925] (1995): Der Proceß, Frankfurt a.M.: Fischer Taschenbuch, S.9.
ebd. S. 9
Martinez, Matias/Scheffel, Michael, Einführung in die Erzähltheorie, München: Beck 2005, 6. Aufl., S. 90.
Kafka, Franz [1925] (1995): Der Proceß, Frankfurt a.M.: Fischer Taschenbuch, S.9.
Martinez, Matias/Scheffel, Michael, Einführung in die Erzähltheorie, München: Beck 2005, 6. Aufl., S. 187f.
ebd. S. 122
Kuhn, Markus (2011): Filmnarratologie. Ein erzähltheoretisches Analysemodell. Berlin/New York: de Gruyter, S. 123
ebd. S. 123
ebd. S. 123
ebd. S. 124
ebd. S. 124
ebd. S. 124
vgl. Kuhn S. 128
vgl. Kuhn S. 129
ebd. S. 128ff
Hickethier, Knut (1996): Film- und Fernsehanalyse, Stuttgart: Metzler.
ebd. S. 125
ebd. S. 125
Kirchmann, Kay (2001): Stanley Kubrick – Das Schweigen der Bilder, Bochum: Schnitt – Der Filmverlag, 3. erw. Auflage.
Fischer, Ralf Michael (2009): Raum und Zeit im filmischen Oeuvre von Stanley Kubrick, Berlin: Mann.
Fischer, Ralf Michael (2009): Raum und Zeit im filmischen Oeuvre von Stanley Kubrick, Berlin: Mann, S. 293.
Hickethier, Knut (1996): Film- und Fernsehanalyse, Stuttgart: Metzler, S. 125.
Fischer, Ralf Michael (2009): Raum und Zeit im filmischen Oeuvre von Stanley Kubrick, Berlin: Mann, S. 291ff.
Kirchmann, Kay (2001): Stanley Kubrick – Das Schweigen der Bilder, Bochum: Schnitt – Der Filmverlag, 3. erw. Auflage, S.183f.