Die meisten Ratgeber verkürzen die Erzählperspektive auf eine einzige Frage: erste oder dritte Person. Diese Frage ist wichtig, aber oberflächlich. Denn die Erzählperspektive ist keine Wahl des Pronomens. Sie ist die Entscheidung darüber, durch wessen Kopf der Leser die Welt sieht, wie viel dieser Kopf weiß und wie nah du ihn an diesen Kopf stellst. Das Pronomen ist die Folge dieser Entscheidung, nicht ihr Inhalt.
Genau deshalb gerät die Perspektive so leise aus den Fugen. Der Autor wählt die personale Erzählweise in der dritten Person, dann blickt er mitten in der Szene in den Kopf einer zweiten Figur, beschreibt das Gesicht des Protagonisten „von außen” oder schiebt zwischen Leser und Bild ein Verb, das dieses Bild nicht braucht. Jeder dieser Fehltritte ist für sich genommen winzig. Zusammen ergeben sie eine Erzählung, die unausgereift wirkt, obwohl der Leser selten benennen kann, was genau gestört hat. Dieser Artikel handelt davon, wie man diese Misstöne benennt, bevor es der Lektor tut.
Erste Person, dritte Person und ein einziger Wissensstand
Die Wahl der Erzählperson ist die erste Entscheidung und die am wenigsten subtile von allen. Die erste Person („ich trat ein, ich sah”) schenkt Nähe und eine Stimme aus dem Stand, schließt den Leser aber in einen einzigen Schädel ein: Er weiß nur so viel, wie der Erzähler weiß. Die personale dritte Person („sie trat ein, sie sah”) klingt aus leichter Distanz, hält in der Praxis aber dieselbe Disziplin einer einzigen Perspektive ein. Die auktoriale dritte Person öffnet den Zugang zu vielen Köpfen, allerdings auf Kosten der Nähe.
Die Falle liegt nicht in der Wahl selbst, sondern in ihrer Konsequenz. Mit der Person wählst du auch die Zeit, Vergangenheit oder Gegenwart. Beides soll unverändert gelten. Ein unbeabsichtigtes Abgleiten vom Präteritum ins Präsens oder eine schwankende Erzählperson ist ein Fehltritt, den der Leser als Misston empfindet, selbst wenn er die Ursache nicht benennt. Ursula K. Le Guin behandelt in „Steering the Craft” feste Person und feste Zeit wie Geleise, in denen sich die Erzählung hält. Lege sie für das Ganze fest, geh dann den Text durch und glätte jeden unwillkürlichen Wechsel.
Unter der Person verbirgt sich etwas Wichtigeres: der Wissensstand. Die Erzählperspektive ist nicht nur, durch wessen Augen wir schauen, sondern auch, wie viel diese Augen wissen können. Und genau hier beginnt die eigentliche Arbeit an der Perspektive.
Personaler Erzähler gegen auktorialen
Der personale Erzähler weiß nur das, was sein Perspektivträger weiß. Er weiß nicht, was im Nebenzimmer geschieht, kennt fremde Gedanken nicht, sieht das eigene Gesicht nicht von außen. Diese Enge ist seine Stärke: Der Leser entdeckt die Welt gemeinsam mit der Figur, im selben Tempo und mit derselben Unwissenheit, und fiebert deshalb stärker mit.
Der auktoriale Erzähler sieht alles und jeden. Das ist ein mächtiges Werkzeug, in der modernen Prosa aber immer seltener, weil es die Reichweite mit Distanz bezahlt. Je mehr der Erzähler über die Figur hinaus weiß, desto weiter steht der Leser entfernt. Der klassische Panoramaroman kann sich das leisten, eine kammerspielartige psychologische Geschichte meist nicht.
Der Ärger beginnt, wenn der Autor einen personalen Erzähler ansetzt, aber wie ein auktorialer schreibt, ohne es selbst zu bemerken. Das ist ein Perspektivbruch: Die Erzählung liefert Wissen, das der Perspektivträger nicht haben könnte. Die Figur „sah nicht, wie hinter ihrem Rücken jemand verräterisch lächelte”, doch wenn sie es nicht sah, woher dann dieses Lächeln im Text. Jill Elizabeth Nelson gibt in „Rivet Your Readers with Deep Point of View” dafür einen Test in einem Satz: Frag jeden Satz, ob diese Figur das wirklich wissen könnte. Wenn nicht, filtere die Information durch das, was die Figur tatsächlich wahrnimmt, oder streiche sie.
Headhopping, das Springen zwischen Köpfen
Der häufigste und am schwersten aufzuspürende Perspektivfehler ist das Headhopping: das Springen zwischen Köpfen. Innerhalb einer einzigen Szene dringt die Erzählung in das Innere von mehr als einer Figur ein und gibt die Gedanken und Empfindungen mehrerer Personen zugleich preis. Der Absatz beginnt im Kopf der Protagonistin, im dritten Satz weiß er schon, was ihr Gegenüber fühlt, im fünften kehrt er zu ihr zurück. Der Leser verliert den Boden, weil er nicht mehr weiß, durch wessen Augen er schaut.
Das ist nicht dasselbe wie der auktoriale Erzähler. Der auktoriale betrachtet alle konsequent, aus einer einzigen, höheren Distanz. Das Headhopping gibt eine nahe, personale Perspektive vor und bricht sie dann beiläufig, mal hier, mal dort. Browne und King nennen es in „Self-Editing for Fiction Writers” eines der sichersten Zeichen einer ungeübten Hand, denn der erfahrene Autor spürt die Grenze des Kopfes, der Anfänger sieht sie nicht.
Die Regel ist einfach und kostet weniger, als man denkt: ein Perspektivträger pro Szene. Die Zustände der übrigen Figuren zeigst du von außen, durch ihr Verhalten. Nicht „sie wusste, dass er wütend auf sie war”, sondern „er stellte die Tasse eine Spur zu hart ab”. Du willst die Perspektive wechseln? Wechsle sie an der Grenze der Szene oder des Kapitels, klar erkennbar, und nicht mitten im Absatz. Eine stimmige Perspektive gibt festen Boden, genau wie die Figurenkonsistenz im Roman es tut: Beide sind das Versprechen, dass sich die Welt nicht ohne Vorwarnung unter dem Leser verschiebt.
Psychische Distanz und Gardners Skala
Hier beginnt die subtilste Schicht der Erzählperspektive. John Gardner beschrieb in „The Art of Fiction” die psychische Distanz: die Skala, auf der die Erzählung den Leser zum Inneren der Figur positioniert. An einem Ende steht die kühle Beobachtung aus der Vogelperspektive („Es war Winter im Jahr 1853. Ein Mann ging durch die Stadt”). Am anderen der rohe Gedanke von innen („Gott, schon wieder Schnee, schon wieder diese Hände ohne Handschuhe”). Dazwischen liegt ein ganzes Spektrum: Verhalten, Sprache, schließlich Empfindung.
Die Sache ist die: Kein Punkt dieser Skala ist an sich besser. Worauf es ankommt, ist das bewusste Steuern. Eine Szene beginnt oft aus der Ferne, stellt den Rahmen ein und schiebt den Leser dann allmählich näher heran, bis er im Höhepunkt direkt hinter den Augen der Figur sitzt. Dieses Heranschieben soll fließend sein. Wenn die Erzählung ohne Grund über die Skala springt, mal kühl aus der Distanz, gleich darauf intim von innen, dann wieder kühl, verliert der Leser das Gefühl dafür, wo er steht, und die Szene wirkt verstellt.
Das Mittel ist technisch und machbar: Lege die angestrebte Distanz der jeweiligen Szene fest, und bewege dich dann schrittweise über die Skala, nicht sprunghaft. Die besten Eröffnungen spielen oft gerade mit der Bewegung über diese Achse, wovon wir im Text darüber schreiben, wie man einen Roman beginnt. Die bewusste Distanz entscheidet, ob eine Szene intim oder gleichgültig ist, ganz unabhängig davon, welches Pronomen du gewählt hast.
Erlebte Rede, das Verschmelzen zweier Stimmen
Die tiefste Stufe der Nähe schenkt eine Technik, die im Deutschen erlebte Rede heißt und im Englischen free indirect discourse. Der Gedanke der Figur tritt direkt in den Erzählsatz ein, ohne Anführungszeichen und ohne den Rahmen „dachte sie, dass”. Statt „Sie sah auf die Uhr und dachte, dass es schon zu spät für die Rückkehr sei” schreibst du „Sie sah auf die Uhr. Zu spät. Und ohnehin wartete niemand auf sie”. Der zweite und dritte Satz sind nicht der Erzähler, sie sind sie, obwohl die Sätze formal in der dritten Person stehen.
James Wood zeigt in „How Fiction Works”, dass dies eines der Fundamente des modernen Romans ist: Die Stimme des Erzählers und die Stimme der Figur verschmelzen zu einer einzigen, sodass der Leser die Figur hört, nicht einen Vermittler. Das ist eine Technik der tiefen Perspektive, in der sich die Erzählung so eng an den Geist der Figur klebt, dass der Leser die Szene mit ihren Worten und ihren Urteilen durchlebt.
Du verschenkst diese Nähe, wenn du trotz enger Perspektive einen „neutralen” Erzähler starr von der Figur abtrennst. Die Perspektive sitzt dicht an der Figur, doch die Erzählung klingt wie ein kühler Berichterstatter, der sie von der Seite referiert. Schreib ausgewählte Erzählsätze so um, dass sie den Wortschatz und die Urteile der Figur tragen. Damit verbunden ist das Eintauchen in die Stimme: Wortwahl, Vergleiche und Assoziationen sollen sich aus einem konkreten Menschen ergeben, aus seinem Beruf, seiner Bildung, seinen Erfahrungen. Wenn die Erzählung gleich klingt, egal wessen Perspektive wir verfolgen, verschwimmen die Figuren. Wie man unterscheidbare Stimmen baut, legen wir im Text darüber dar, wie man Figuren entwickelt.
Filterwörter und Verben der Gedankendistanz
Es gibt zwei Gewohnheiten, die den Leser still und leise vom Erleben fernhalten, und die meisten Autoren sehen sie im eigenen Text nicht. Die erste sind Filterwörter: Wahrnehmungsverben, die zwischen Leser und Bild gepresst werden. „Sie sah, wie zwei Schlangen zwischen den Felsen kämpften” lässt den Leser auf die Figur blicken, die blickt, statt den Kampf unmittelbar zu betrachten. „Zwischen den Felsen kämpften zwei Schlangen” stellt ihn in die Szene. Dieselben „sie spürte, dass”, „sie hörte, wie”, „sie bemerkte, dass” häufen sich auf jeder Seite, und jedes davon rückt den Leser einen Schritt zurück. Streich das Wahrnehmungsverb, liefere das Bild unmittelbar. Den Filter lass nur dort stehen, wo der Akt des Bemerkens selbst bedeutsam ist, weil die Figur gerade etwas nicht zu sehen erwartet hat.
Die zweite Gewohnheit sind Verben der Gedankendistanz: der Rahmen „dachte sie, dass”, „fragte sie sich, ob”, an jeden Gedanken der Figur geklebt. „Sie fragte sich, ob sie es rechtzeitig schaffen würde” referiert das Denken von außen. „Würde sie es rechtzeitig schaffen?” lässt es hören. Jill Elizabeth Nelson zeigt, dass das Abnehmen des Etiketts den rohen Gedanken unmittelbar wiedergibt und die Figur sofort näher rückt. Das Beste daran ist, dass keine dieser Korrekturen Information kostet. Du entfernst nur die Schicht des Vermittlers, und Bild und Gedanke bleiben, nur eben näher.
Auktorialer Einschub und der letzte Meter Nähe
Wenn eine Szene bereits nah geschrieben ist, lässt sie sich leicht mit einem einzigen Satz eines Erzählers verderben, der vor die Figur tritt. Das ist der auktoriale Einschub: ein Kommentar aus der Position des allwissenden Autors, in die enge Perspektive eingefügt. Die häufigste Form ist die Vorankündigung einer Zukunft, die die Figur nicht kennen kann: „Hätte sie nur gewusst, was sie erwartete”. In einer von innen geschriebenen Szene unterbricht eine solche Stimme aus dem Off das Eintauchen und erinnert den Leser daran, dass er eine erdachte Geschichte in den Händen hält.
Die Regel ist stimmig mit dem ganzen Rest des Kapitels: In der nahen Perspektive gehört das Urteil der Figur und ergibt sich aus dem, was sie hier und jetzt weiß. Streiche den Kommentar oder verwandle ihn in ein echtes Urteil der Figur, das in diesem Augenblick präsent ist. Statt anzukündigen, was sie erwartet, zeig, wovor sie sich fürchtet. Die Angst der Figur treibt die Szene an, das Wissen des Erzählers hält sie auf.
Das schließt die Logik der Erzählperspektive: Jede dieser Techniken, von der Wahl der Person bis zum Schnitt der Filter, dient einem Zweck. Den Leser in einem einzigen Kopf zu halten, auf einer festgelegten Distanz, ohne Brüche, die dieser Kopf nicht machen könnte. Die Perspektive ist kein Schmuck der Erzählung. Sie ist eine Abmachung darüber, durch wessen Augen wir schauen, und Abmachungen bricht man nur bewusst. Wie Romanidee und Struktur bestimmen, welche Perspektive sich überhaupt zu verfolgen lohnt, legen wir im Leitfaden einen Roman schreiben dar.
Wie man die eigene Erzählperspektive überprüft
Das Schwierigste an der Perspektive ist, dass der Autor den Text liest und dabei alles über alle Figuren zugleich weiß. Er weiß, was das Gegenüber fühlt, und sieht deshalb nicht, dass er gerade dessen Gedanken in einer Szene preisgegeben hat, die jemand anderem gehört. Er weiß, was die Figur erwartet, und so erscheint ihm der auktoriale Einschub natürlich. Den Sprung der Distanz liest er als Rhythmus, nicht als Misston. Das eigene Auge ist hier der schwächste Prüfer, denn es sieht die Absicht, nicht das Blatt.
Diese Lücke schließt ein Werkzeug. Vellam liest den Roman Kapitel für Kapitel und beurteilt die Erzählperspektive nach dem, was die Schreibwerkstatt lehrt: ob die Perspektive nicht innerhalb einer Szene zwischen Köpfen springt, ob die Erzählung kein Wissen liefert, das der Perspektivträger nicht haben kann, ob die psychische Distanz sich fließend verschiebt statt sprunghaft, ob Filterwörter und die Rahmen „dachte sie, dass” den Leser nicht vom Erleben fernhalten. Es zeigt die konkrete Textstelle, nicht eine Allgemeinheit. Dabei unterscheidet es den bewussten Perspektivwechsel vom unwillkürlichen Bruch. Das ersetzt nicht deine Entscheidungen über die Erzählung, sondern schließt sie dort, wo das eigene Auge nicht mehr hinreicht. Wie das an einem echten Text aussieht, zeigen die Beispielanalysen.
Häufige Fehler bei der Erzählperspektive
Headhopping
In einer Szene lernen wir die Gedanken mehrerer Figuren zugleich kennen. Die Regel lautet: ein Perspektivträger pro Szene, fremde Zustände zeig von außen, durch ihr Verhalten.
Perspektivbruch
Die Erzählung liefert Wissen, das die Figur nicht haben kann: das eigene Gesicht von außen, Ereignisse in einem anderen Zimmer, fremde Gedanken. Frag, ob sie es wissen könnte.
Sprung der psychischen Distanz
Die Erzählung springt ohne Grund zwischen kühler Vogelperspektive und intimem Innenleben. Lege die Distanz der Szene fest und bewege dich schrittweise über die Skala.
Filterwörter
„Sie sah, wie die Schlangen kämpften" statt „zwei Schlangen kämpften". Das Wahrnehmungsverb lässt auf den Betrachter blicken, nicht auf die Szene. Streich es, liefere das Bild unmittelbar.
Der Rahmen „dachte sie, dass"
„Sie fragte sich, ob sie es schaffen würde" statt „Würde sie es schaffen?". Das Etikett referiert den Gedanken aus der Distanz. Nimm es ab und lass den rohen Gedanken in der Stimme der Figur stehen.
Auktorialer Einschub
„Hätte sie nur gewusst, was sie erwartete" in einer nah geschriebenen Szene. Die Stimme aus dem Off bricht das Eintauchen. Das Urteil soll der Figur gehören und sich aus dem ergeben, was sie jetzt weiß.
Häufige Fragen
Was ist die Erzählperspektive im Roman?
Die Erzählperspektive ist der Blickwinkel, aus dem die Geschichte erzählt wird: durch wessen Augen der Leser die Welt sieht, wie viel diese Person weiß und wie nah du ihn an ihr Inneres stellst. Sie umfasst die Wahl der Erzählperson (erste oder dritte), den Wissensstand des Erzählers (personal oder auktorial) sowie die psychische Distanz, also den Abstand des Lesers zum Kopf der Figur. Es ist nicht das Pronomen allein, sondern die ganze Abmachung darüber, wer wie viel sieht.
Worin unterscheidet sich der personale Erzähler vom auktorialen?
Der personale Erzähler weiß nur das, was sein Perspektivträger weiß: Er weiß nicht, was in einem anderen Zimmer geschieht, kennt fremde Gedanken nicht, sieht das eigene Gesicht nicht von außen. Er schenkt Nähe und das Entdecken der Welt gemeinsam mit der Figur. Der auktoriale Erzähler sieht alle und alles, was ein Panorama gibt, aber die Reichweite mit Distanz bezahlt. Je mehr der Erzähler über die Figur hinaus weiß, desto weiter steht der Leser entfernt.
Was ist Headhopping?
Headhopping ist das Springen zwischen Köpfen: Die Erzählung dringt innerhalb einer einzigen Szene in das Innere von mehr als einer Figur ein und gibt die Gedanken mehrerer Personen zugleich preis. Der Leser verliert, durch wessen Augen er schaut, und damit die Bindung zur Figur. Das ist nicht dasselbe wie die auktoriale Erzählung, die alle aus einer einzigen, stimmigen Distanz betrachtet. Das Mittel: ein Perspektivträger pro Szene, und den Perspektivwechsel an der Grenze der Szene oder des Kapitels vollziehen.
Was ist erlebte Rede?
Die erlebte Rede, im Englischen free indirect discourse, ist ein Kunstgriff, bei dem der Gedanke der Figur direkt in den Erzählsatz eintritt, ohne Anführungszeichen und ohne den Rahmen „dachte sie, dass”. Die Stimme des Erzählers und die Stimme der Figur verschmelzen zu einer einzigen, sodass der Leser die Figur hört, nicht einen Vermittler. Statt „sie dachte, dass es zu spät sei” schreibst du einfach „Zu spät”, in der dritten Person der Erzählung, aber mit dem Urteil und dem Wortschatz der Figur. Das ist das Fundament der tiefen, nahen Perspektive.
Was sind Filterwörter und warum schwächen sie die Erzählung?
Filterwörter sind Wahrnehmungsverben („sie sah”, „sie hörte”, „sie spürte”, „sie bemerkte”), die zwischen Leser und Bild gepresst werden. „Sie sah, wie der Schnee fiel” lässt auf die Figur blicken, die blickt, statt den Schnee unmittelbar zu betrachten. „Es schneite” stellt den Leser in die Szene. Der Filter rückt ihn einen Schritt zurück und nimmt dem Bild die Schärfe, meist ohne jeden Informationsgewinn. Streich das Wahrnehmungsverb und liefere das Bild unmittelbar, und lass den Filter nur dort, wo der Akt des Bemerkens selbst bedeutsam ist.