http://www.mediaculture-online.de

Autoren: Scheltwort, Petra / Kapp, Frieder / Jaiser, Frieder / Zeitter, Ernst.

Titel: Die 'Sprache der Gewalt' und ihre Wirkungen. Ansätze zur Analyse der Wirkung formaler Darstellungsformen von Gewalt in Fernsehsendungen auf Kinder im Alter von 8-11 Jahren.

Quelle: Kapitel 1-3 aus gleichnamiger Untersuchung (siehe Titel). Hrsg. von der Landesanstalt für Kommunikation Baden-Württemberg (Schriftenreihe der LfK Bd. 6). Villingen-Schwenningen 1996. S. 1-36.

Verlag: Neckar-Verlag.

Die Veröffentlichung erfolgt mit freundlicher Genehmigung der Autoren und der Landesanstalt für Kommunikation Baden-Württemberg (LfK).



Ernst Zeitter/Frieder Kapp/Frieder Jaiser/Petra Scheltwort

Die „Sprache der Gewalt“ und ihre Wirkungen: Ansätze zur Analyse der Wirkung formaler Darstellungsformen von Gewalt in Fernsehsendungen auf Kinder im Alter von 8 bis 11 Jahren (Auszug).



1 Die Wirkung medialer Gewaltdarstellungen: ein offenes Problem

Obwohl das Thema Mediengewalt zu den „Klassikern" der Medienforschung gezählt werden kann, konnten in Wirkungsuntersuchungen auch nach jahrzehntelanger Forschungstätigkeit keine eindeutigen Ergebnisse gefunden werden, die zu einer Versachlichung der Diskussion oder gar zu übereinstimmenden Einschätzungen über die Wirkungen massenmedialer Gewaltdarstellungen beigetragen hätten. Auch wenn Schätzungen von allein über 5000 deutschsprachigen Arbeiten zur Gewaltthematik ausgehen (Groebel, 1993), weist doch die Forschung in vielen Bereichen noch sehr große Lücken auf (vgl. zusammenfassend Kunczik, 1994). Vor allem aus den empirischen Befunden läßt sich alles andere als ein klares Bild ableiten: „Kurz, die Gewaltwirkungsforschung zeichnet sich trotz aller Vielfalt vorliegender Ergebnisse bis heute vor allem durch Widersprüchlichkeit aus" (Theunert, 1987, S. 10).

An Ansatzpunkten der Kritik fehlt es nicht: Neben methodischen Unzulänglichkeiten und dem unseriösen Umgang mit empirischen Daten (vgl. Kunczik, 1994), wird vor allem kritisiert, daß veraltete und widerlegte Theorien (z.B. die „Katharsishypothese": Feshbach, 1961; zur Widerlegung vgl. u.a. Feshbach, 1986) immer noch wiederholt, aktuelle Theorien aber häufig ohne Berücksichtigung der internationalen Forschungsdaten (Groebel, 1993) elaboriert und überprüft werden. Grundsätzlich wird bemängelt, daß in empirischen Untersuchungen häufig nicht dargelegt wird, was konkret Gegenstand der Untersuchungen sein soll (Analyse der Variablen) und welche Interpretationen die gewonnenen Ergebnisse sinnvollerweise zulassen (z.B. Übertragung von Laborexperimenten mit isolierten Variablen auf die tatsächliche, wesentlich komplexere Lebenswelt).

Neben den an anderer Stelle ausführlich beschriebenen Schwerpunkten der Methodendiskussion (zur Wirkungsforschung allgemein vgl. Schenk, 1987; bezogen auf Gewalt zu-sammenfassend Kunczik, 1994) lassen sich vor allem zwei Problembereiche in der empirischen Medienforschung hervorheben, die im Mittelpunkt der weiteren - zunächst theoretischen - Untersuchung stehen werden:



1. Die unpräzise Explikation der Gegenstände –„Gewalt“ bzw. „Gewaltdarstellung"

Im Zusammenhang mit der Diskussion um mögliche Effekte massenmedialer Gewaltdarstellungen wird in den Medien besonders der Begriff „Gewalt" häufig sehr unterschiedlich definiert, bzw. verzichtet man auf eine Definition oft ganz, "als ob genereller Konsens darüber bestünde, was mit dem Begriff gemeint ist" (Kunczik, 1993a, S. 98). Vereinzelte Versuche, die theoretische Struktur des Gewaltbegriffs zu analysieren (z.B. Schorb & Theunert, 1984; Neidhardt, 1986; Theunert, 1987) oder die Gewaltdebatte durch Anbindung an (psychologische) Aggressionstheorien einzuschränken und zu präzisieren (bspw. Groebel & Gleich, 1993, S. 44: "Strukturschema für verschiedene Aggressionsformen"), blieben in der konkreten Medienforschung häufig unberücksichtigt. So ist es nicht weiter verwunderlich, daß sich die Befunde der einzelnen Untersuchungen häufig widersprechen oder nur schwer aufeinander zu beziehen sind.

2. Die Vernachlässigung der „formalen Darstellungsweisen" in der Gewaltwirkungsforschung

Interessanterweise wurde trotz emsiger Forschungstätigkeiten über Wirkungen medialer Gewaltdarstellungen bislang kaum untersucht, welche Bedeutung den formalen Darstellungstechniken von Gewalt zukommt. Dies ist um so erstaunlicher, als die angloamerikanische formative Forschung" (formative research) davon ausging, formale Darstellungselemente könnten zentrale Determinanten der Aufmerksamkeit und damit der (potentiellen) aggressionsauslösenden Wirkungen von Gewalt im Fernsehen sein (Rice, Huston & Wright, 1984). Für den deutschsprachigen Raum liegen bisher u.W. keine Untersuchungen vor, die sich dezidiert mit den Wirkungen dieser formalen Darstellungselemente im Zusammenhang mit der Gewaltdiskussion befassen bzw. den Fokus ihrer empirischen Forschungsanalysen auf diese Variablen gelenkt hätten (zu theoretischen Ansätzen vgl. Groebel & Gleich, 1993).

2 Konzepte der Gewalt aus der Perspektive unterschiedlicher Wissenschaften

2.1. Die umgangssprachliche Bedeutung des Begriffs "Gewalt"

Wenn richtig ist, daß Gewalt in den Medien zuerst ein gesellschaftliches Problem ist - „nicht ein Medium generiert Gewalt, sondern die Gesellschaft, deren Bestandteil das Medium ist“ (Schorb & Theunerl, 1984, S. 31) - dann wird es sicherlich nützlich sein, Gewalt in einer Gesellschaft dort aufzusuchen, wo die gesellschaftlichen Erfahrungen von Gewalt gemacht und artikuliert werden: Dieser Weg vom umgangssprachlichen Verständnis von Gewalt zu einem für unsere Untersuchung vorwiegend medienwissenschaftlichen Begriff empfiehlt sich um so mehr, als soziale Erfahrung und ihre umgangssprachliche Artikulation auch die Vorbedingungen festlegen, unter denen Fernseh- und Filmkonsumenten den Gewaltdarstellungen in den Medien begegnen.

Ein Rückgang auf den alltäglichen Gebrauch eines wissenschaftlich definierten Begriffs kann dabei unter zwei Absichten erfolgen:

Das Problem eines Begründungszusammenhangs zwischen Alltagssprache und Wissenschaftssprache als ihrer Metaebene läßt sich in einer solchen Rekonstruktion wissenschaftlicher Begriffe aus alltäglicher gesellschaftlicher Erfahrung und ihrer Artikulation nur dann lösen, wenn wissenschaftliche Begriffe auch als Weiterbildung, als die Elaboration alltagssprachlicher Festlegungen verstanden werden. Freilich kann hier der allgemeine Sprachgebrauch nicht unmittelbar zur definitorischen Stütze, indirekt aber durchaus zur Orientierung einer wissenschaftlichen Analyse dienen.

Dieser Lösungsweg zwingt allerdings dazu, sich auf zwei Ebenen der begrifflichen Klärung zu bewegen:

Will man die Bedeutung des Begriffes „Gewalt“ wissenschaftlich einigermaßen präzise festlegen, empfiehlt es sich also, von der umgangssprachlichen Bedeutung des Gewaltbegriffs auszugehen. Ausgangspunkt können hier zunächst die Definitionen des Duden als eine Art der Kodifizierung umgangssprachlichen Gebrauchs sein:

„Gewalt“:

  1. Macht, Befugnis, das Recht und die Mittel, über jemanden, etwas zu bestimmen, zu beherrschen: die staatliche, die richterliche Macht;

  2. unrechtmäßiges Vorgehen, wodurch jmd. zu etwas gezwungen wird;

  3. physische Kraft, mit der etwas erreicht wird;

  4. elementare Kraft von zwingender Wirkung (z.B. die Gewalt des Sturmes)" (Duden, 1989,).



Umgangssprachliche Bedeutung und wissenschaftlicher Kontext des Gewaltbegriffs

Angesichts dieses ebenso umfassenden wie unstrukturierten Definitionsversuchs und der damit verbundenen wissenschaftlich unerwünschten Bedeutungsvielfalt ist zunächst festzulegen, welche Bereiche der gesellschaftlichen Wirklichkeit mit dem Begriff „Gewalt" etikettiert wurden. Dann sind diejenigen Bedeutungskomponenten herauszuarbeiten, die hier charakteristischerweise mit „Gewalt" gemeint sind.

In einem zweiten Schritt ist zu untersuchen, auf welche gesellschaftlichen Erscheinungen sich der Begriff „Gewalt“ nun sinnvollerweise im wissenschaftlichen Kontext dieses Projekts beziehen soll. Damit sind Nominaldefinitionen des Gewaltbegriffs mit ihrer Gefahr des infiniten Regresses vermieden.

Die Unterschiedlichkeit der Gewaltkonzepte verdeutlicht, daß sich der Begriff "Gewalt' aus mehreren Komponenten zusammensetzt. Entsprechend stellt sich bei der Explikation bzw. Definition eines Begriffs zunächst grundsätzlich die Frage, welche Komponenten als charakteristische Konstituenten des Gewaltbegriffs angesehen werden können (Klärung der Begriffsintension). Für eine Analyse der Wirkung von Gewaltdarstellungen erscheint es zudem sinnvoll, sich mit diesen (Begriffs-)Komponenten auseinanderzusetzen und herauszuarbeiten, welche Merkmale bzw. Dimensionen der Gewalt dargestellt werden und potentiell (unter Berücksichtigung weiterer Variablen) wirksam sein können.

Eine sehr umfassende und u.E. sinnvolle Analyse des alltagssprachlichen Gewaltbegriffs liefert Neidhardt (1986), der versucht, den semantischen Raum des Gewaltbegriffs zu bestimmen und einen Überblick über die charakteristischen Bedeutungselemente erarbeitet:

Bedeutungselemente des Gewaltbegriffs (Neidhardt, 1986, S. 121):

Bedeutungsdimensionen

Definitionskriterium

Definitionsbestandteil

(1) Art des Verhaltens

Einsatz von Zwangsmitteln

  1. phys. Mittel.

(b) psychische Mittel

(1. 1) Ausmaß des Zwangsmitteleinsatzes

(2)Verhaltenssubjekte

Akteure

(a)Personen

(b) + Institutionen, Strukturen

(3) Verhaltensobjekte

'Opfer'

  1. Personen

(b) Sachen

(4) Verhaltenseffekte

Verletzung

  1. physisch

  2. +psychisch

(4. 1) Ausmaß der Verletzung

(4.2) Absicht der Verletzung


(5) Verhaltensgründe

Normentsprechung

  1. illegal/illegitim

  2. + legal/legitim




Neidhardt geht es weniger um die Erarbeitung einer Definition von „Gewalt“ als vielmehr darum, „die verschiedenen Dimensionen, auf die sich der Begriff bezieht“ darzustellen und die Kriterien zu bezeichnen, „mit denen jeweils entschieden werden kann, ob Gewalt vorliegt oder nicht“ (vgl. Neidhardt, 1986, S. 121).



„Empirisch läßt sich nun feststellen, daß in der Sprachpraxis der Bevölkerung alle möglichen Kombinationen vorkommen und es insofern keinen eindeutigen Begriff von Gewalt gibt“ (a.a.O., S. 122). Sinnvollerweise läßt sich demnach „Gewalt“ als ein „lnterpretationskonstrukt" (vgl. Lenk, 1978) verstehen, das von verschiedenen Personen unterschiedlich interpretiert wird; ob eine Darstellung tatsächlich als „Gewalt“ wahrgenommen wird, kann von unterschiedlichen Faktoren abhängen (z.B. Alter, Religiosität, politische Orientierung, vgl. zusammenfassend Schwind et al., 1990; Kunzcik, 1994, S. 50f.).

Schon in den Definitionen des Duden ist die breite sektorale Streuung des Gewaltbegriffs im Bereich der gesellschaftlichen Wirklichkeit zu beobachten. Ein ähnliches, diesmal aber empirisch fundieries Bild bietet die Untersuchung von Kaase und Neidhardt (1990), die im Rahmen der "Unabhängigen Regierungskommission zur Verhinderung und Bekämpfung von Gewalt (Gewaltkommission)" entstanden ist. „Gewalt“ in der Politik wird hier von den Befragten folgenden gesellschaftlichen Bereichen oder Prozessen zugeordnet:

Verbale Konflikte, Stil der politischen Auseinandersetzung, Aktionen von Politikern, Parteien, Interessengruppen, Versprechungen, Affairen

17%

Demonstrationen

16%

Diktatur, Terror, Terrorismus, Revolution

13%

Herrschaft, Macht, Gesetze

10%

Psychische Gewalt, Intoleranz

7%

Gewalt als körperlicher Angriff

5%

Polizeigewalt

3%

Staatsgewalt

2%

Krieg, Bürgerkrieg

2%

Hausbesetzungen

1%

Sonstiges

4%

Keine Angabe, weiß nicht

20%

(Kaase & Neidhardt, 1990, S. 46)

Versuch einer vorläufigen Schematisierung

Die Streuung und die Mehrdeutigkeit umgangssprachlicher Umschreibungen des sozialen Erlebens „Gewalt", wie sie die obenstehende Tabelle zeigt, sind kein Zufall. Diese Umschreibungen sind durch vielfältige elementare Erfahrungen geprägt, wobei unmittelbar Erlebtes sich für viele schon kaum mehr unterscheidbar mit Eindrücken vermischt, die Medien bereits übermittelt haben: Gewaltbotschaften in den Medien gehören heute unablösbar zum Kontext, in dem einem Gewalt in der Gesellschaft unmittelbar begegnen kann.

Unterwirft man nun umgangssprachliche Beschreibungen des sozialen Erlebnisses „Gewalt“ Verschärfungsdefinitionen, dann muß man darauf achten, daß diese eingrenzenden Definitionen dem gesamtgesellschaftlichen Erfahrungsfeld adäquat bleiben, das sie letztlich bedingt und von dem mit wechselnder Differenzierung auch die Medienkonsumenten ausgehen.

Entscheidend bleibt schließlich die Trennschärfe ebenso wie die synthetische Bindungsfähigkeit des Begriffes „Gewalt“, der von den verwandten Begriffen "Macht", "Herrschaft", „Aggression" abzuheben ist.

Schon der in der Tabelle dokumentierte allgemeine Sprachgebrauch sollte davor warnen, den Begriff „Gewalt" voreilig auf die Täter-Opfer-Perspektive mit ihrer Bedingung der Schädigung zu verengen. Dieser Gewaltbegriff verlöre rasch seine Trennschärfe gegenüber dem Begriff der Aggression. Verengt man nun noch auf das soziale Feld der Mediengewalt, gerät man zudem sehr leicht in die Gefahr monokausaler Schuldzuweisungen. Den Medien wird dann eine Wirkung zugeschrieben, die sie in dieser Eindeutigkeit nicht haben.

Die Kategorien der Tabelle deuten an, daß auch in der allgemeinen, umgangssprachlich formulierten sozialen Erfahrung Gewalt als Erscheinung menschlichen Zusammenlebens in allen Bereichen der Gesellschaft zu finden ist. Theologie und Philosophie, Jurisprudenz, Politologie und Soziologie, Psychologie und Erziehungswissenschaft, um nur einige Wissenschaften zu nennen, haben sich den unterschiedlichen Erscheinungs- und Wirkungsfeldern von Gewalt zugewandt. Wo Gewalt als Botschaft von Medien transportiert wird, sind außerdem Publizistikwissenschaft, Kybernetik, Informatik und Medienpädagogik zuständig.

Wenn es richtig ist, daß Gewalt alle gesellschaftlichen Bereiche betrifft und deren Strukturen mit ausprägt, dann kommt es zunächst darauf an, bei der Analyse der Erscheinungen von Gewalt und ihrer Wirkungen von einem hinreichend umfassenden Gewaltbegriff auszugehen. Ihn liefert die Philosophie: "Die Bedeutung von Gewalt ist allgemein: über etwas verfügen ... Gewalt als bloßes Verfügenkönnen bedeutet noch kein negatives Verhältnis zur Sache, sondern meint neutral ein objektives Vermögen des Menschen, das auch als Mittel der Machtausübung gebraucht werden kann ... Dasjenige, über das man Gewalt hat, kann man gebrauchen, und zwar für beliebige Zwecke. Darin gründet der instrumentelle Charakter der Gewalt" (Krings, Baumgartner & Wild, 1973, S. 869).



Verfügungsgewalt geht nur vom Menschen aus. Nur er kann als Subjekt in einer Beziehung handeln, in der ein anderer, ein anderes, zum Objekt der Verfügungsmacht wird.

Ausüben kann der Mensch Verfügungsgewalt:



Verfügungsgewalt kann Lebewesen, besonders Menschen, Tiere, aber auch leblose Sachen betreffen. Gegenüber Sachen kann sie nur physisch ausgeübt werden.

Angesichts des instrumentellen Charakters von Verfügungsgewalt - von Macht - ist in allen Gesellschaften, die wir kennen, nach der Erlaubtheit dieser Verfügungsgewalt, nach deren ethischer Begründung, gefragt worden:

Ob diese Unterscheidung zwischen Legitimität und Illegitimität zu eindeutigen Ergebnissen führt, hängt von der Dichte und Ausschließlichkeit ab, mit denen herrschende Ideologien Gesellschaften überlagern. Betrachtet man Gesellschaften in Geschichte und Gegenwart, dann scheinen eindeutige Antworten eher selten, mehrdeutige eher die Regel zu sein.

Man kann nun versuchen, innerhalb des gesellschaftlichen Systems induktiv, bei der Verfügungsgewalt des Einzelnen, anzusetzen.

Wieweit verfügt ein Mensch - zunächst ganz privat - über sich selbst, etwa über seine Affekte, seine Impulse? Die Umgangssprache kennt da ein eindrückliches Bild: Jemand „hat sich in der Gewalt“. Freiheit erscheint hier ganz persönlich definiert als eine Funktion individueller Herrschaft. Ihr Maß korreliert mit dem Maß an Selbstbeherrschung, das man aufbringt.

Verfügungsgewalt im engsten persönlichen Bereich, aber auch in den intimen Gruppierungen der Partnerschaft und der Familie, entzieht sich daher in vielen Fällen einer rechtlichen Regelung, die „von außen" kommt.

Lebenspraktisch könnte man, nun in Hinwendung auf die anderen, einen Aspekt von Freiheit definieren als das Maß an Verfügungsgewalt, das jemand sich erworben hat. Der Einzelne steht hier in Konkurrenz zu anderen.



Die Beziehungen zwischen Einzelnen, sozialen Gruppen, Verbänden, Parteien und Institutionen, die jeweils Verfügungsgewalt erworben haben und nun in der Ausübung dieser Gewalt und damit in der Ausdehnung ihrer Freiheitsräume zueinander in Konkurrenz stehen, muß eine Rechtsordnung regeln:





Man kann eine Rechtsordnung als lästigen, äußerlichen Zwang widerwillig befolgen oder sie als moralischen Imperativ verinnerlichen und damit auf diese Weise frei sein. Wo die Rechtsordnung zum notwendigen Übel geworden ist, wird der Versuch verlockend, sie zu umgehen, wenn das ohne Gefahr möglich ist. Wo die Ethik die Rechtsordnung für den Staatsbürger nicht mehr deckt, wird, selbst wenn Einsicht in die Notwendigkeit einer solchen Ordnung besteht, der Verstoß gegen sie zum "Kavaliersdelikt". Eine Grauzone gesellschaftlicher Wertungen beginnt, die ohne scharf bestimmbare Übergänge in der Kriminalität endet.

Da ethische Antworten auf die Frage, wo und wann mit welcher Legitimation Verfügungsgewalt ausgeübt werden kann und soll, in Gesellschaften selten eindeutig und allgemeinverpflichtend gegeben sind, müssen diese Gesellschaften Herrschaft als die Möglichkeit, Verfügungsgewalt zu praktizieren, in mehr oder minder enger Beziehung zu ethischen Systemen begründen und in ihren Abläufen juristisch möglichst verbindlich zu organisieren suchen. Es entstehen Gewaltmonopole: Durch sie wird „die Bedrohung, die der Mensch für den Menschen darstellt .... einer strengeren Regelung unterworfen und ... berechenbar ... Es ist nicht mehr eine ständige Form der Unsicherheit, sondern eine eigentümliche Form von Sicherheit" (Elias, 1977, S. 325).

Souveränität als Verfügungsgewalt (damit zumindest im Anspruch auch Autorität) wird nun etwa aus dem Willen Gottes, dem Willen des Volkes oder dem einer gesellschaftlichen Klasse hergeleitet. Verfügungsgewalt wird in einem sich differenzierenden Rechtssystem, vor allem da, wo sie Zwangsgewalt auch gegen den Willen der Betroffenen ist, zunächst zum Privileg der Souveränität. Das Rechtssystem delegiert dann freilich Teile dieser Verfügungsgewalt. Diese Delegation muß geordnet geschehen: Das ist die Forderung der „balance of power", der Gewaltenteilung. „Eine jede Gesellschaft, in der die Garantie der Rechte nicht gewährleistet und die Teilung der Gewalten nicht anerkannt ist, besitzt keine Verfassung" (Französische Revolution - Erklärung der Menschen- und Bürgerrechte in Art. 16).

Es bilden sich nun aufeinander mehr oder minder streng zugeordnete Teilsysteme der

Die Praxis der Legislative, der Exekutive und der Judikative ist in unterschiedlichen Gesellschaften für die Mitglieder der Gesellschaft in unterschiedlichem Maße offengelegt (transparent). Transparenz und damit auch gesellschaftliche Kontrolle stellen in Gesellschaften mit gesetzlich verbürgter Meinungsfreiheit in Konkurrenz, sehr oft auch im Konflikt mit den drei legitimen Teilgewalten, die gesellschaftlichen Medien her. Sie werden, nicht zu unrecht, als die „vierte Gewalt" bezeichnet.

In Gesellschaften, die auf diese Weise organisiert sind, ist, bei Wert- und Geltungskonkurrenz mehrerer ethischer Systeme, nicht immer eindeutig, was an Gewaltausübung moralisch erlaubt oder verboten, was ethisch geboten ist. Fast immer aber ist, mit Hilfe des juristischen Spezialisten, klar erkennbar, was rechtlich zulässig oder unzulässig ist. Dabei lassen die Gegensatzpaare „legitim" – „illegitim", „legal" – „illegal" und „zulässig" – „unzulässig" die ganze Spannbreite dieser Unterscheidungen deutlich werden.

Nicht alle Mitglieder einer Gesellschaft halten eine Ethik für verpflichtend. Nicht alle respektieren die Rechtsordnung. Dem Bereich des Legitimen, des Legalen und Erlaubten steht der Bereich des Illegitimen, des Illegalen, ja des Kriminellen gegenüber. Gewalt wird in allen Bereichen geübt. Legislative, Exekutive und Judikative versuchen, vorbeugend, verhindernd und bestrafend den Bereich des Nicht-Rechtmäßigen möglichst klein und gesellschaftlich wirkungslos zu halten.

Verfügungsgewalt zeigt sich also eingebettet in ein deduktiv beschriebenes gesellschaftliches System. Dem Staatsbürger und seinem ganz persönlichen Anteil an dieser Gewalt eröffnet sich ihre induktive Perspektive, wo sie für ihn unmittelbar praktisch wird, im Büro des lokalen Parteifunktionärs etwa, im Amtsgericht, auf der Polizeiwache oder in der Baubehörde.

Begriffe wie „Volkssouveränität", „Gewaltenteilung" erfaßt nur derjenige als lebenspraktisch bedeutsam, der sich ihre induktive Perspektive bewußt gemacht und damit solide politische Kenntnisse erworben hat. Massenmedien, am meisten das Fernsehen, bringen vor allem im Bild auch abgehobenere Bereiche der Verfügungsgewalt, etwa Parlamente und Bundesgerichte, dem Zuschauer näher. Diese Nähe wird freilich verhängnisvoll, wo sie Erfahrung und politisches Wissen vortäuscht, die Einweg-Kommunikation nicht zu verschaffen vermag, wo sie damit dann kritische Distanz als Nachfragen und Nachprüfen verhindert.



Stützt die umgangssprachliche Benennung das Schema von Gewalt?

Ordnet man nun die Zuweisungen der Tabelle von Kaase & Neidhardt (1990) diesem einigermaßen groben Schema zu, dann stellt sich, wie bei den Definitionen des Duden, zunächst heraus, daß das Moment der Verfügungsgewalt tatsächlich in allen Zuweisungen aufscheint und damit als ein übergreifendes Funktionsprinzip angesehen werden kann. Auch die Kriterien der Gewaltenteilung lassen sich zumindest indirekt, in der Zuordnung von Gewalt zu den Begriffen „Herrschaft", „Macht", „Gesetz", „Staats- und Polizeigewalt" auffinden. Interessant ist ferner, daß wertungsbesetzte Begriffe wie "legitim-illegitim", die sich nur sehr schwer operationalisieren lassen, ebenfalls, wenigstens indirekt, in Zuweisungen von Gewalt zu den Begriffen und Erlebnisfeldern "Stil der politischen Auseinandersetzung, Aktionen von Politikern, Parteien, Interessengruppen, Versprechungen, Affairen", "Intoleranz" zum Tragen kommen. Die Sicht in der Tabelle bietet also keineswegs nur die übliche Engführung des Gewaltbegriffs in einer weitgehend physisch gesehenen Täter-Opfer-Perspektive.

Ein weitaus überwiegender Teil des Fernseh- und Filmangebots bevorzugt gerade diese Engführung des Gewalterlebnisses und der korrespondierenden Begriffe. Fernsehen und Film befinden sich dann in deutlichem Gegensatz zu einer Alltagssicht des Gewaltproblems; sie schränken die Erlebnisbreite der Konsumenten ein und simplifizieren damit das Problem. Kritik am Angebot der Sendeanstalten und der Filmverleihe müßte zunächst also bei der Qualität dieser verengenden Verzeichnung, nicht zuerst bei der Quantität dieser Angebote ansetzen. Die Kritik kann dann freilich auch die Adressaten nicht aussparen, die diese Angebote bereitwillig konsumieren, noch weniger ein Schulsystem, das kaum etwas dazu beiträgt, daß die Verzeichnung des Gewalterlebnisses inhaltlich und formal von Kindern und Jugendlichen durchschaut wird.

Es ist zunächst nicht verwunderlich, daß ein Großteil der medienbezogenen Gewaltwirkungsforschung der durch das Fernseh- und Filmangebot vorgegebenen Engführung des Gewalterlebnisses bei der Definition des Gewaltbegriffs folgt.



2.2. Gewaltkonzeptionen in der Medienforschung: Ein Überblick



Im Gegensatz zu einem umfassenden beschreibungsorientierten Gewaltbegriff (im Sinne von "Macht", vgl. den angloamerikanischen Begriff „power') wird in der empirischen Forschungsliteratur der Gewaltbegriff verengt auf negativ bewertete "aggressive" Gewalt (angloamerikanisch: "violence"). Dies zeigt sich besonders in der deutschsprachigen Diskussion um die Mediengewalt. Auch wenn für eine differenzierte Analyse von Gewaltdarstellungen auf kein "allgemeingültiges Begriffs- und Standardinstrument" (Krüger, 1994) zurückgegriffen werden kann, so stimmen doch die meisten (deutschsprachigen) Gewaltdefinitionen darin überein, daß die Schädigung oder Beeinträchtigung einer Person, eines Tieres oder eines Gegenstandes als zentrales Begriffscharakteristikum angesehen wird (opferorientiertes Kriterium). Dieses Minimalkriterium, das auf die Konsequenzen für das "Objekt/Opfer" verengt, läßt sich nahezu durchgängig bei allen Definitionsversuchen identifizieren und wird bisweilen ausführlich dargestellt (vgl. Krüger, 1994). Zusätzlich zu diesem opferorientierten Gewaltkriterium wird in den meisten Definitionen die "Täterseite" (als agierendes „Subjekt“ der Gewalt) mit einbezogen und dadurch hervorgehoben (täterorientiertes Kritierum), daß Gewalt häufig als „Tätlichkeit“ (im Sinne von Verfügungsmacht) auftritt. Grundsätzlich lassen sich in der Medienforschung vor allem zwei unterschiedliche Konzepte von Gewalt unterscheiden:

Das Konzept der personalen Gewalt

In unspezifizierter Form umfaßt personale Gewalt zunächst „alle Formen physischer und psychischer Gewalthandlungen, die zwischen Personen oder zwischen Personen und Sachen beobachtet werden können" (Theunert, 1987, S. 30). Bei dem Versuch, diesen Gewaltbegriff weiter zu präzisieren, lassen sich wiederum zwei Strategien unterscheiden, die sich beide kritisieren lassen:

Die Einbeziehung von nichtbeabsichtigter Schädigung in den Gewaltbegriff:

In einigen Definitionsvorschlägen wird zwar der Täter in die Gewaltdefinition mit einbezogen, ohne jedoch die Absichtlichkeit der Schädigung als notwendiges Merkmal mit aufzunehmen; auch unbeabsichtigte oder in Kauf genommene Schädigung wird als „Gewalt" bzw. Aggression bezeichnet:

Gewalt ist die absichtliche Herbeiführung sowie das nichtbeabsichtigte Eintreten von physischem, psychischem, materiellem, sozialem, ökologischem Schaden" (Krüger, 1994, S. 73).

"Auf der Ebene individueller Aggression wird allgemein ein Verhalten dann als aggressiv bezeichnet, wenn erkennbar eine Person oder eine Gruppe von Personen eine andere Person oder Gruppe sowie Tiere und Sachen bewußt und mit Absicht schädigt oder bei einer Handlung eine solche Schädigung in Kauf nimmt" (Groebel & Hinde, 1989, zit. nach Groebel & Gleich, 1993, S. 42).

Als problematisch erweist sich bei diesen Definitionen, daß durch die Einbeziehung von nichtbeabsichtigtem Schaden der Begriff „Gewalt/Aggression" stark ausgeweitet wird: so wäre nach dieser Definition auch von Gewalt zu sprechen, wenn ein Arzt bei einer chirurgischen Operation notwendigerweise die Haut seines Patienten verletzt oder ein etwas schusseliger Mensch versehentlich die zerbrechliche Vase von Tante Frida fallenläßt

Einschränkung des Gewaltbegriffs auf eine vom „Täter“ beabsichtigte Schädigung:

Diese Ausweitung des Gewaltbegriffs versuchen Autoren zu umgehen, die sich einem handlungstheoretischen Konzept des Gewaltbegriffs verpflichtet fühlen. Als zentrales Charakteristikum einer aggressiven/gewalttätigen Handlung wird dabei die Absicht der Schädigung angesehen (vgl. z.B. Selg, Mees & Berg, 1988, S. 14ff.).-

"Unter personaler Gewalt (Aggression) wird im folgenden die beabsichtigte physische und/oder psychische Schädigung einer Person, von Lebewesen oder Sachen durch eine andere Person verstanden" (Kunczik, 1994, S. 11).

An dieser engen Definition kann kritisiert werden (Kunczik, 1994, S. 12), daß gerade bei medialen Gewaltdarstellungen die zugrundeliegende Absicht des Täters nicht eindeutig festzustellen ist: sie muß von den Rezipienten erschlossen werden. Bei medialen Gewaltdarstellungen „reduziert sich die Schlußfolgerung, eine Handlung sei aggressiv, auf die Beobachtung eines motorischen Verhaltens und dessen sichtbare Folgen, z.B. das Umfallen des Opfers nach einem Schuß" (Groebei & Gleich, 1993, S. 41). Zudem läßt sich einwenden, die Unterscheidung zwischen planmäßig destruktivem und situativ reaktivem Handeln werde zumindest erschwert. „Weitergehende oder nicht unmittelbar ersichtliche Motive und Ursachen bleiben ausgespart" (Theunert, 1987, S. 28).



Das Konzept der strukturellen Gewalt

Über Definitionen hinaus, die sich auf physische (z.B. Verletzung) oder psychische (z..B. verbale Beleidigungen) Gewalttaten oder -handlungen durch agierende Personen ( „personale Gewalt") beschränken, wurde der Gewaltbegriff in einer erweiterten Sicht unter gesellschaftspolitisch-soziologischer Perspektive auf die strukturelle Manifestation von Machtverhältnissen ausgeweitet (Galtung, 1975). Dabei versteht Galtung unter Gewalt die „vermeidbare Beeinträchtigung grundlegender Bedürfnisse oder, allgemeiner ausgedrückt, des Lebens, die den realen Grad der Bedürfnisbefriedigung unter das herabsetzt, was grundsätzlich möglich ist. Die Androhung von Gewalt ist ebenfalls Gewalt" (Galtung, 1993, S. 106). Der sogenannten „strukturellen Gewalt" liegen ungleiche Gesellschafts- und Machtverhältnisse in den (auch kulturellen) Strukturen eines gesellschaftlichen Systems selbst zugrunde (vgl. zusammenfassend Schorb & Theunert, 1984; Theunert, 1987). Im Vergleich zur Minimaldefinition der „personalen Gewalt" legt dieses („systemtheoretische") Konzept der „strukturellen Gewalt“ seinen Schwerpunkt auf die Konsequenzen für das „Opfer“ und wird als Ergänzung zum Konstrukt der direkten personalen Gewalt verstanden.

Die Arbeitsgruppe um Theunert (vgl. Schorb & Theunert, 1984; Theunert, 1987) versuchte, den Ansatz von Galtung auszudifferenzieren und - ausgehend von einem alltagsnahen Gewaltverständis - ein „umfassendes Gewaltverständis" zu entwickeln und zu begründen. Bei der Bestimmung des Gewaltbegriffs wird zunächst ohne direkten Bezug auf das Phänomen der medialen Gewalt vorgegangen. Ausgangspunkt dieses Ansatzes ist die Kritik an einem reduktionistischen Gewaltverständis im Bereich der Wirkungsforschung (vgl. Theunert, 1987, S. 23ff.):

Durch die Ausrichtung auf besonders offensichtliche Formen personaler Gewalt bleiben subtile Formen (z.B. psychische und strukturelle) Gewaltformen unbeachtet (a.a.O., 24).

Durch die Beschränkung auf individuelles Gewalthandeln werden von vorneherein gesellschaftliche Dimensionen von Gewalt ausgeschlossen. „In diesem individualistischen Verständnis erscheint Gewalt ausschließlich an das Individuum gebunden, welches seiner gesellschaftlichen Zusammenhänge gänzlich enthoben ist“ (a.a.O., S. 26).

Durch die Bindung an die Intentionalität wird dabei der Blick zwangsweise auf den/die „Täter“ und die „Gewalttat" gerichtet; das Opfer bleibt eher am Rande (a.a.O., S. 27f.)

In einem erweiterten Gewaltbegriff verstehen Schorb und Theunert deshalb Gewalt als „die Manifestation von Macht und/oder Herrschaft, mit der Folge und/oder dem Ziel der Schädigung von einzelnen oder von Gruppen von Menschen" (Theunert, 1987, S. 40; vgl. auch Schorb & Theunert, 1984, S. 30). Als zentrale Bestimmungsmerkmale von Gewalt lassen sich demnach zum einen die bei den Betroffenen feststellbaren Folgen, die durch Gewalt bewirkte Schädigung, identifizieren, zum anderen ist „Gewalt an die Ausübung oder Existenz von Macht und Herrschaft“(Theunert, 1987, S. 41) gebunden.

Kritisiert wurde an diesem Gewaltkonzept vor allem die mangelnde Präzision der Definition und die damit verbundenen Schwierigkeiten, "strukturelle Gewalt" durch angemessene Operationalisierungen der empirischen Forschung zugänglich zu machen. "Strukturelle Gewalt ist mehr ein politisches Schlagwort (vergleichbar dem Imperialismusbegriff), denn bei der Definition der strukturellen Gewalt wird als Bezugspunkt ein eindeutig definierbares verteilungstheoretisches Optimum auf einer sozialen Wohlfahrtsfunktion angenommen, in dem alle Potentiale aktualisierbar sind, d.h. ein höchst erreichbarer Wonnepunkt der Gesellschaft... Angesichts der mit einer Operationalisierung verbundenen Probleme ist es nicht überraschend, daß die Problematik struktureller Gewalt bei der Diskussion um mögliche Effekte massenmedialer Gewaltdarstellungen weitgehend unbeachtet geblieben ist“ (Kunczik, 1994, S.13).

Es läßt sich festhalten, daß der Gewaltbegriff in der Medienforschung wesentlich enger gefaßt wird, als in der Alltagssprache. Bei der Analyse von Gewaltdarstellungen wird meist die „personale Gewalt" in den Vordergrund gerückt; aufgrund der Notwendigkeit einer empirisch bedingten Beschränkung erscheint dies durchaus sinnvoll. Allerdings sollte man bei der Analyse personenbezogener Gewaltdarstellungen nicht einseitig die Täterperspektive bevorzugen(das Konzept der „personalen Gewalt“ legt das nahe), sondern auch die Konsequenzen für das Objekt/Opfer der Gewalt sehen. Konkret bedeutet dies, daß auch die Darstellung von Opfern (ohne direkt dargestellte/sichtbare Gewalteinwirkung) als Gewaltdarstellung zu verstehen ist. Hier stimmen wir im wesentlichen mit den Überlegungen der Arbeitsgruppe Theunert überein, obwohl wir das Konzept der „strukturellen Gewalt“, insbesondere aufgrund der noch immer ungenügenden Operationalisierung (vgl. Kunczik, 1994), für kein sinnvolles Mittel zur Analyse audiovisueller Gewaltdarstellungen halten.

Methodologisch ist eine Engführung des Gewaltbegriffs für unser Forschungsvorhaben unter mehreren Gesichtspunkten keine grundlegende Gefahr:



2.3. Forschungsansatz zur Kodierung von Gewaltdarstellungen in Film und Fernsehen



Wie wir gesehen haben, liegen der Diskussion über Gewaltdarstellungen in den Medien, vor allem im Fernsehen, z.T. sehr unterschiedliche Gewaltkonzepte zugrunde. Von einer Analyse dieser Gewaltdarstellungen und ihren möglichen Wirkungen auf die Zuschauer ist daher zunächst zu fordern, den verwendeten Gewaltbegriff transparent und damit der Kritik zugänglich zu machen. Zu klären ist ferner, welche Dimensionen des Gewaltbegriffs Eingang in die audiovisuelle Darstellung von „Gewalt“ finden und - in Abhängigkeit davon - weiche Konsequenzen sich daraus für die Wahrnehmung des Rezipienten ergeben. Pointiert ausgedrückt: Es muß zunächst der formal-logische (inhaltliche) Aufbau der Gewaltdarstellungen im Fernsehen und im Film geklärt werden, ehe die Frage beantwortet werden kann, ob es für die gesellschaftlichen Erscheinungen von Gewalt in verschiedenen medialen Gattungsformen so etwas wie eine charakteristische formal-strukturelle „Mediensprache" gibt.

Einen methodisch sinnvollen Weg, die inhaltlichen Strukturen medialer Gewaltdarstellungen zu klären, eröffnet die Untersuchung von Krüger (1994). Krüger geht zunächst von einer sehr globalen Definition des Begriffs „Gewalt" aus: „Gewalt ist die absichtliche Herbeiführung sowie das nichtbeabsichtigte Eintreten von physischem, psychischem, materiellem, sozialem, ökologischem Schaden" (Krüger, 1994, S. 73; vgl. Kap. 2.1.). Auf der Basis einer solchen "Minimaldefinition" differenziert er dann nach inhaltlichen Strukturelementen und Darstellungsformen von Gewaltdarstellungen:



Gewaltdarstellungen sind nach diesem Konzept in unterschiedlichen Kombinationen unterschiedlicher Präsentationsarten möglich. Krüger kommt auf dieser Grundlage zu folgender Definition: "Eine Gewaltdarstellung liegt vor, wenn ... mindestens ein Element der Gewaltstruktur - Täter, Tat/Ereignis, Opfer, Betroffener, Schaden - sichtbar dargestellt wird"(a.a.O., S.74).

Aus diesen Prämissen lassen sich in Fiction- und Nachrichtensendungen vier Darstellungsvarianten der Gewalt ableiten:

    1. Alle Gewaltdarstellungen mit mindestens einem sichtbaren Gewaltelement (Täter, Tat/Ereignis, Opfer, Betroffener, Schaden);

    2. Gewaltdarstellungen mit Opfern, Betroffenen ohne sichtbare Tat/Ereignis;

    3. Gewaltdarstellungen mit sichtbarer Tat/Ereignis;

    4. Gewaltdarstellungen vom Typ "hard violence" (operational definiert durch das Zutreffen folgender Indikatoren: Tat/Ereignis sichtbar gezeigt, Töten oder Zerstören sichtbar gezeigt oder Tote oder Verletzte sichtbar gezeigt und Intensität der Gewaltausübung, der Präsentation der Gewalt, des Schaden oder Grausamkeit stark ausgeprägt (a.a.O., S. 75).

Eine empirische Untersuchung medialer Gewaltdarstellungen kann also auf dieser „inneren Struktur“ des Gewaltbegriffs aufbauen und gleichzeitig die vorliegenden strukturtheoretischen Ausarbeitungen (z.B. Neidhardt, 1986; Theunerl, 1987) mitberücksichtigen. Durch die enge Verbindung der mehrdimensionalen Merkmale wird gerade eine empirieorientierte Arbeit die präzise und umfassende Kategorisierung nur in Ansätzen leisten können. Für unsere Untersuchungen bietet sich auf der Basis geeigneter Theoriekonzepte unter dem Zwang forschungsökonomischer Beschränkung eine dreidimensionale Analyse medialer Gewaltdarstellungen an:



A. Art der Gewaltdarstellung (Schwerpunkt auf dem Inhalt)

Nach Neidhardt (1986; vgl. auch Groebel & Gleich, 1993) lassen sich als Hauptkategorien folgende inhaltliche Gewaltformen unterscheiden:

Diese Gewaltformen sind nicht als streng disjunkte Kategorien (miß-)zuverstehen. Vielmehrspiegeln sie die häufigsten Darstellungsvarianten von Gewalt in den deutschsprachigen Medien wider und können sowohl als Identifikationskriterium von Gewaltsequenzen als auch als inhaltliche Merkmale von Gewalt bei der Kodierung einzelner gewalthaltiger Darstellungen genutzt werden.



B. Fokussierung auf die agierenden Personen bei der Gewaltdarstellung

Zusätzlich zu dieser inhaltlich-formalen Strukturierung lassen sich bei Gewaltdarstellungen verschiedene personale Perspektiven unterscheiden:



C. Darstellung der Phase des Gewaltaktes (Schwerpunkt auf dem Handlungsablauf)



Es erscheint sinnvoll, bei medialen Gewaltdarstellungen zunächst von „Gewalttätigkeiten" auszugehen und entsprechend verschiedene Phasen des Handlungsablaufs zu unterscheiden:



Auch wenn diese (theoretische) phasenorientierte Strukturierung von Gewaltdarstellungen nicht unproblematisch ist, kann sie als analytische Unterscheidung bei der Strukturierung von Handlungsabläufen genutzt werden. (Problematisch ist besonders die (empirische) Operationalisierung der „Vorbereitungsphase": Wann beginnt die Vorbereitungsphase in einem Film, der etwa die Planung eines Mordes zum Thema hat? Ist es sinnvoll, erst das „Ziehen des Colts" als (unmittelbare) Vorbereitungsphase zu kennzeichnen?)

Mit dieser dreidimensionalen Betrachtungsweise, deren Einzelaspekte jeweils zueinander in Beziehung gesetzt werden können, lassen sich - auf vergleichsweise einfache Art und Weise - audiovisuelle Gewaltdarstellungen inhaltlich systematisch kategorisieren und analysieren. Weiche Bedeutung dieser Kategorisierung im Zusammenhang mit der Analyse einer „Filmsprache der Gewalt“ zukommt, steht im Mittelpunkt einer eigenen empirischen Untersuchung (vgl. Kapitel 5).



3 Die Bedeutung formaler Darstellungstechniken

bei der Fernseh-und Filmwahrnehmung



3.1. Die Relation von Form und Inhalt in der Film- und Fernseh-„Sprache"



Wer die formal-dramaturgischen Elemente einer „Sprache der Gewalt" in den Medien Fernsehen und Film untersuchen will, hat zunächst grundsätzlich die Wechselbeziehung von Form und Inhalt zu bedenken.

Die Frage nach dem Verhältnis von Form und Inhalt reicht weit in die europäische Philosophiegeschichte zurück. Sie hat sehr unterschiedliche Antworten erfahren (Cassirer, 1953; Wiehl, 1973; Jacobs, 1973). Trotzdem gibt es Momente, in denen sich diese Antworten bündeln lassen (Wiehl, 1973, S. 447f.; Jacobs, 1973, S. 458f.). Diese Momente sind von großer Bedeutung für eine Analyse der Form-Inhalt-Korrelation in der „Sprache" von Film und Fernsehen:


ursprüngliche Materie

ursprünglicher Inhalt

Form/Methode


ungeformte Materie I

ungeformter Inhalt I

Form/Methode


ungeformte Materie II

ungeformter Inhalt II

Form/Methode


....


Funktionsziel



Allerdings ist es sehr schwierig, je nach den situativen Kontexten solcher Prozeßphasen jeweils festzulegen, was in ihnen Materie, Stoff, Inhalt und was Form ist. Je nach Abstraktionsgrad der Betrachtung bedingt die Materie bzw. der Inhalt die Form bzw. die Methode, diese wiederum auf einer anderen Abstraktionsebene die Materie bzw. den Inhalt.

Beobachtet man nun, wie eine Fernsehsendung oder ein Kinofilm entstehen, erkennt man denselben - durch Inhalt, Endform und Funktionszielbestimmung phasengegliederten, schwierig zu interpretierenden - Herstellungsprozeß.

Audiovisuelle Massenkommunikationsmittel wie Fernsehen oder Film agieren heute weltweit. Ihr Material holen sie sich - wenigstens in der Möglichkeit - aus dem politischen und sozialen Leben aller Kontinente. Methodische Auswahl verleiht diesem Material Aktualität, Bedeutsamkeit, Interesse und damit eine dem Funktionsziel „Mitteilung" adäquate Endform.

Zunächst muß in der chaotischen Fülle weltweit für die Mitteilung verfügbarer individueller und sozialer Realität von Korrespondenten, Drehbuchautoren und Kameraleuten etwas entdeckt werden, was für diese - schon unter dem Endziel der medialen Mitteilung, also aus beruflich-professioneller Routine - bedeutsam, interessant wird. Aus beliebiger Realität wird in einem ersten Auswahlprozeß individuelle Wirklichkeit, aus der Fülle beliebiger Vorkommnisse schließen sich Fakten zu Ereignissen zusammen. Der Inhalt einer Welt tritt durch Auswahl als Stoff ein in einen regelgeleiteten, durch professionelle Routine bestimmten Herstellungs-, also Formungsprozeß.

Professionelle Routine bestimmt auch die Wahl des Mediums. Nicht jedes Ereignis ist optimal für die Darstellung im Fernsehen oder im Film, in einem Bild-Ton-Medium.

Für das schließlich gewählte Ereignis muß mit den Zeichensystemen des Fernsehens, mit bewegtem Bild, gesprochener Sprache, Musik und Geräusch (manchmal auch mit Zeichnung und Schrift) eine optimale Kombination gefunden werden, die das Ereignis aktuell, eindeutig, unmittelbar, bedeutsam, mit einem Wort: interessant macht.

Ist dieser Prozeß von Auswählen und Zusammenfügen, von Selektion und Montage gelungen, entsteht ein sendefähiges oder ein kinogängiges Produkt.

Das Gedächtnis des Adressaten speichert Inhalte und Formen dieser Produkte, indem es sie in seine Strukturen überführt. Nicht alles, was aufgenommen worden ist, wird auch gespeichert: Es darf Inhalt und Strukturen unseres Bewußtseins nicht unterschiedslos bestätigen. Wieder sind es Prozesse der Auswahl und Umformung, die darüber entscheiden, was unser Bewußtsein endgültig in geeigneter Struktur gespeichert.

Soll nun das, was unser Bewußtsein an Inhalten in spezifischer Form gespeichert hat, anderen mitgeteilt werden, müssen für Bewußtseinsinhalte und -formen geeignete Zeichensysteme und innerhalb dieser Systeme optimale Kommunikationsstrukturen gefunden werden. Der Prozeß beginnt von neuem, wenn geformte Mitteilung Interesse weckt, im Bewußtsein der anderen die ihr adäquaten Speicherungsstrukturen findet.

Dieses Schema gibt freilich den Prozeß nur sehr summarisch wieder, in dem Fernsehsendungen oder Filme entstehen, aufgenommen und in sekundärer Kommunikation weitergegeben werden. Er ist in Wirklichkeit viel komplizierter. Ein individuelles oder soziales Ereignis wird in Aussage und/oder Kommentar (A,A') zum Medieninhalt ausgeformt. Der Adressat dieser medial ausgeformten Inhalte rekonstruiert in seinem Bewußtsein Erfahrungsbestände der sozialen Wirklichkeit, von denen die medial geformten Inhalte handeln. Der Adressat läßt bestimmte Teilinhalte der Medienbotschaft dabei aus, selektiert also je nach dem Widerstand, den die Medienbotschaft in seinem Bewußtsein hervorruft und ergänzt das Aussortierte durch Inhalte und Formen des eigenen Bewußtseins; er montiert eine „neue", individuelle Medienbotschaft (A, A', A"). Gibt der Empfänger schließlich Medieninhalte (und Medienformen) als Inhalte und Formen seines Gedächtnisses im Gespräch wieder, werden auch diese Inhalte je nach Kommunikationssituation, nach vorausgesehener oder tatsächlicher Reaktion des Kommunikationspartners, nochmals umgeformt, „überarbeitet" (A, A', A", A''') (Ruhrmann, 989, S. 24f.).

Schemazeichnung leicht verändert nach Ruhrmann (1989, S. 71):

Unser Bild von der primären Kommunikation (Massenkommunikation) durch die Medien Fernsehen und Film, von der individuellen Verarbeitung der Kommunikationsinhalte durch den Adressaten und ihrer Weitergabe in sekundärer Kommunikation muß also differenziert werden.

Bei so vielen und differenzierten Umformungsprozessen, denen die Medienbotschaften im Bewußtsein ihrer Adressaten ausgesetzt sind, kann nur eine simple Reiz--Reaktionstheorie annehmen, Sendeinhalte des Fernsehens, Kinoformen des Films uniformierten „die Massen", bloß weil diese Botschaften Großgruppen erreichen.

Professionell, bewußt aus Erfahrung regelgeleitet, bleibt der Prozeß des Medienangebots und der jeweiligen subjektiven Verarbeitung und kommunikativen Weitergabe (in den meisten Fällen) allerdings nur solange, bis die Medienbotschaft „über den Sender, auf die Leinwand geht". Individuelle Verarbeitung und die Weitergabe in sekundärer Kommunikation sind zwar ebenfalls Selektions- und Transformationsprozesse. Aber sie sind dem kritischen Bewußtsein weitgehend entzogen. Es leuchtet ein, daß hier Manipulation als die unmerkliche Beeinflussung etwa durch das Medium Fernsehen einsetzen kann, wenn diese Prozesse (vor allem im Unterricht der Schule) nicht beizeiten altersspezifisch bewußt gemacht und damit in Ansätzen „professionalisiert" worden sind.

3.2. Die „Sprache" des Fernsehens und des Films



Ein System, das der Speicherung und der Mitteilung von Bewußtseinsinhalten dient, indem es Lebenswirklichkeit strukturiert, pflegt man eine „Sprache" zu nennen.

Eine „Sprache" muß drei Forderungen erfüllen:

Systeme, die nur über die Qualität der Systematik verfügen sind Codes. So sind im Code des Morsealphabets Striche und Punkte nach Verwendungsregeln untereinander systematisch geordnet. Diese Zeichen transportieren Bedeutung, deuten aber auf nichts, was außerhalb des Systems läge.

Systeme, die über Systematik und Zeichenbedeutung, nicht aber über Sekundarität verfügen, sind Zeichensysteme (einfaches Beispiel: das Farbsystem der Verkehrsampel). Die optischen Zeichensysteme im Bildkanal des Fernsehens sind Mischsysteme: Sie sind Codes, Zeichensysteme, aber sie verfügen nicht gleichzeitig über alle drei Qualitätsmerkmale von Sprache. Von „Bildsprache" zu reden, meint also eine im letzten nicht überzeugende Analogie.

Für sprachliche Konventionen in einer Gesellschaft gilt als Grundbedingung, was Herbert L. A. Hart (1961, S. 54ff., S.87f., S. 96, S. 99ff.) für Regeln überhaupt formuliert hat:



Ein solches System gesellschaftlicher Regeln gerät in die Krise, wenn eine erhebliche Zahl von Gesellschaftsmitgliedern diese Regeln nur aus Furcht vor Sanktionen oder nur in der Hoffnung auf persönlichen Nutzen befolgt. Sollen Mitglieder einer Gruppe (Gesellschaft) sprachlichen Regeln folgen, dann



Mehrdeutigkeit der „F-Sprachen"

Überträgt man diese Forderungen auf Sendeformen und Sendeinhalte des Fernsehens (dieselben Vorbehalte gelten auch für den Film), dann wird man rasch feststellen: Das Medium Fernsehen erfüllt die an die Sprache gestellten Forderungen weder in ihren Aussagestrukturen noch in ihrer gesellschaftlichen Verfaßtheit, auch wenn in diese Aussagegestalten gesprochene Sprache mit wechselndem Schwergewicht einbezogen ist. Für das Fernsehen und Film beherrschende bewegte Bild und seine Verbindungen mit Sprechsprache und Musik gilt:

Es ist nicht möglich, analog zum Phonem oder Morphem in der Sprech- oder Schreibsprache in den optischen Codes der sogenannten F-Sprachen des Fernsehens und des Films allgemein überzeugende strukturelle Gliederungen vorzunehmen. Zunächst stellt sich die Frage, ob das Einzelbild, das der Adressat als einzelnes gar nicht wahrnimmt, oder die Einstellung - der nicht unterbrochene Kameralauf - als kleinste Einheit anzusehen ist.



Es gibt also keine regelgeleitete Konvention vor allem des Zeichensystems der bewegten Bilder, die allgemein zugänglich wäre.

Noch weniger gibt es Sanktionen, wenn Medienproduzenten im Fernsehen oder im Film gegen Handwerksregeln verstoßen, die nur dem "Profi" bekannt sind, die das Publikum aber keineswegs als für alle verpflichtend, kommunikationsnotwendig, verinnerlicht hat

Es kann, wo es keine allgemein bekannten und anerkannten Konventionen gibt, auch keine "Krise" eines nicht allgemein verpflichtenden Ordnungssystems geben. Dafür gibt es um so mehr die Gefahr der Manipulation durch Zeichen und Zeichenstrukturen, deren Bedeutung und Systematik man nicht durchschaut.

Die "Krise" des Systems der bewegten Bilder besteht also in der Tatsache, daß die Systematik seiner Inhalte und Strukturen - obwohl leicht zu konsumieren - rational den meisten Zuschauern unzugänglich bleibt.



Strukturelle Invarianten der Film- und Fernseh-„Sprache"

Die Kameraoperationen und die Manipulationen des Schnitts sowie das Supersystem der Montage können in diesem Zusammenhang als strukturelle Invarianten einer Fernseh- bzw. einer Film-„Sprache" aufgefaßt werden, die Bewußtseinsinhalte mit ihren spezifischen Mitteln in Kommunikation transformiert.

Strukturelle Invarianten sind in diesen „Sprachen" informationstheoretisch zunächst Mittel zur Ordnung und dank der diese Ordnung begründenden Selektion auch zur Einschränkung des optisch-akustischen Informationsstroms. Dabei ist Information im publizistischen Sinne ihrerseits bereits ein Ergebnis von Selektion, also von Einschränkung. Informationsgehalt wäre unter diesem Gesichtspunkt das Maß der Wahrscheinlichkeit, mit der ein tatsächliches Ereignis sich aus der Menge der möglichen Ereignisse eines Wahrscheinlichkeitsfeldes hervorhebt. Der Informationsgehalt ist um so größer, je größer die Unbestimmtheit vor dem realen Ereignis war, welches sich nun aus der Menge der möglichen Ereignisse abhebt.

Strukturelle Invarianten bewirken die Einordnung vor allem von optischen Reizen, die Mitträger von Information sind, in die Wahrnehmungskategorien Raum und Zeit. Sie sind als Faktoren einer orientierenden Adaption an Realität (als Faktoren von Abstraktion) inhaltsrelational, aber nicht streng inhaltsabhängig (z.B. eine als Konvention etablierte Reihe von Einstellungsgrößen der Kamera: Weit / Total / Halbtotal / Halbnah / Nah / Groß / Detail als Beginn einer filmischen Narration; die Blende als Instrument räumlicher oder zeitlicher Zuordnung usw.) (Zeitter, 1987, S. 28; Kandorter, 1990, S. 75ff.).



3.3. Formale Strukturen der Film- und Fernseh-„Sprache“.

Möglichkeiten ihrer gesicherten Beschreibung



Spricht man von formalen Strukturen der Fernseh- und Film-„Sprache denkt man an ein System „traditioneller und semiotischer Konstruktionen" (Möller-Naß, 1988, S.xi), an Theorien also, in welchen Fernsehen und Film als Teilsystem der Massenkommunikation angesehen werden. Die Art und Weise, in der diese Medien Form und Inhalt in ihren Botschaften verbinden, könnte man ihre Dramaturgie nennen.



Zu Problemen der „Sprachen" dieser Medien, zu Fragen ihrer Dramaturgie, gibt es eine kaum mehr zu übersehende Literatur (z. B. Heimann, 1963; Siegrist, 1986; Zeitter, 1987; MöllerNaß, 1988; Appeldorn, 1988). Für unser Forschungsvorhaben mußte in bedenklicher Reduktion ein Kategoriensystem entwickelt werden, das die "strukturellen Invarianten" der Fernseh- und Film -"Sprache" vertretbar angemessen repräsentiert.



Allgemeine Hinweise:

Licht:

Fernsehsendungen sind, wie Kinofilme, Ergebnisse komplizierter fotogenetischer HellDunkel-Verbindungen. Aus diesen Verbindungen entstehen die Konturen und damit die Formen und Inhalte des Video- und Filmeinzelbildes. Lichtführung kennzeichnet die Objekte wie die Wahl der Kameraperspektiven, der Kamerabewegungen.



Lichtart:

Die Art der Lichtquelle, mit der die Szene beleuchtet wird. Es kann zwischen den Ausprägungen Naturlicht/simuliertes Naturlicht und Kunstlicht unterschieden werden. Maßgebend ist die Wirkung auf den Betrachter, nicht die tatsächliche Lichtquelle. Studioaufnahmen, die scheinbar bei natürlicher Beleuchtung aufgenommen wurden, werden deshalb als Naturlicht/simuliertes Naturlicht kodiert, auch wenn der Kodierer weiß oder vermuten kann, daß künstliche Studiobeleuchtung verwendet wurde. Dadurch soll vermieden werden, daß die Kategorie „Lichtart" gleichbedeutend mit dem Aufnahmeort (Studio oder im Freien) wird. Entsprechend würde dann eine Aufnahme etwa bei Neon-Straßenbeleuchtung im Freien als Kunstlicht kodiert.



Farbe (Objekt):

Farbe im Fernsehen und im Film verleiht zunächst den Objekten den Anmutungscharakter der Wärme (die Farben Orange/Rot) oder der Kühle/Kälte (die Farben Grün/Blau). Farbe kann der Fernsehaufnahme eigene Tiefenwirkung geben: Rot wirkt vorder-, Blau hintergründig: Es entsteht eine Scheinplastizität des Fernsehbildes. Fernsehfarben können in unterschiedlicher Intensität (Buntkraft) auf unser Auge wirken, als Vollfarben oder, gebrochen, als Mischfarben. Unter Fernsehprofis kursiert der böse Satz, die meisten Fernsehsendungen seien Buntfilme, keine Farbfilme.

Farbwahrmehmen ist immer mehr als nur aufnehmendes Sehen: Wir deuten aus vorgängiger Erfahrung Farben und Farbkombinationen. Eine rotbraune Farbfläche etwa in grüner Umgebung werden wir als Dach deuten. Eine Landschaft in unnatürlichen Farben erschwert uns die Deutung, schafft unter Umständen ein beengendes Gefühl der Fremdheit. Zu unseren Erwartungen von Räumen gehört es, daß wir uns deren Böden dunkler als die Decken vorstellen. Wird diese Ordnung, die das Verhältnis von Landschaft und Himmel nachbildet, verlassen, "pervertiert", fühlen wir unter Umständen Unbehagen.

Daß Farben unmittelbar Gefühle hervorrufen, weiß der Mensch schon seit den frühen Epochen seiner Geschichte. Emotionale Wirkung und symbolische Deutung der Farbe sind früh verbunden worden; vorgegebene Deutung kann dabei Farbwirkungen verstärken, indem sie diese auf einen Verstehenssektor bündelt („Blau ist die Farbe der Treue"), sie kann Wirkungen verändern, schließlich die Wirkung der einen Farbe zugunsten einer anderen abschwächen, verschieben.



Die Farbwirkungstheorie hat sich, seit Ansätzen in Goethes Farbenlehre, in Untersuchungen unterschiedlichster Systematik mit der Wirkung von Farben befaßt. Das Bild ist uneinheitlich. Bekannt sind der Forschung Farbwirkungen auf das vegetative Nervensystem. So wirkt die Farbe Rot auf den nervus sympathicus, der den Körper zu Höchstleistungen veranlaßt (Streßphänomen). Blau wirkt auf den Parasympathicus, der unserem Körper Ruhe und Erholung ermöglicht. Die Verbindung mit den Farbeffekten der „Wärme" (Rot/Orange) und der „Kühle" (Grün/Blau) ist dabei offensichtlich.

Obwohl Reiz- und Symbolwirkungen der Farben bekannt sind, in der Fernsehwerbung auch durchweg berücksichtigt werden, ist es dennoch nicht leicht, Farbwirkungen im Fernsehen und im Film verläßlich zu setzen. Nur große Flächen wirken eindeutig (dominant). Farbkombinationen (Kontraste) können die Wirkung der Einzelfarbe ebenso steigern wie verändern (das Weiß eines Autoscheinwerfers wirkt gegen einen purpurnen Himmel schmutziggelbgrünlich). Farbsymbolik, die Farbwirkung verstärken oder verändern kann, muß dem Fernseh- und Filmzuschauer zugänglich sein, soll sie Effekte erzielen. Farbwirkung verstärkt oder schwächt zudem konkurrierend die Wirkung von optischen Formen und akustischen Erscheinungen wie Sprache, Musik, Geräusch. Sie kann im Fernsehen und im Film nie als einzelne, allein gesetzt werden. Sie bedarf der Einwirkzeit, soll sie den Zuschauer beeindrucken. Die Flüchtigkeit der Montage steht dann gegen die Wirkungsmöglichkeiten von Licht und Farbe. Beide sind im Fernsehen Einzelreizketten in einer optisch-akustischen Gesamt-Reizgestalt, in einer Reizpartitur.

Es existieren folgende Ausprägungen: schwarz-weiß (Schwarz-Weiß-Film oder schwarzweiße Einstellung in einem Farbfilm), Farbmischung ohne dominante Farbe (im Bild findet sich eine Mischung verschiedener Farben, aber es ist keine Farbe in einem Ausmaß vorhanden, daß sie in der Wahrnehmung dominiert). dominante Farbe: blau (die Farbe blau oder eine Mischfarbe mit überwiegendem Blauanteil nimmt einen auffälligen Teil der Szene ein, so daß sie dominiert), dominante Farbe: grün (entsprechend mit grün), dominante Farbe rot (entsprechend mit rot), dominante Farbe: gelb (entsprechend mit gelb), dominante Farbe. Mischfarbe (entsprechend mit Mischfarben, die nicht mehr überwiegend von einer Primärfarbe bestimmt sind; hierzu zählt auch weiß) sowie dominante Farbe: nicht entscheidbar (es finden sich im Bild mehrere markante Farben, aber es ist nicht entscheidbar, ob eine von ihnen dominiert bzw. welche Farbe dominiert).



Einstellungsgröße:

Auf den Fernseh- und Filmbildern sehen wir, was die Kamera uns sehen läßt. Der Kameramann, wenn nicht vorher schon der Drehbuchautor, entscheidet mit dem Regisseur über die Größe, in der die Objekte schließlich auf dem Fernsehbildschirm oder auf der Kinoleinwand erscheinen. Die Kamera entscheidet mit ihrer Nähe zum Objekt aber nicht nur über Intimität oder Distanz unseres Erlebens. Mit Nähe oder Ferne setzt sie auch das Maß an Übersicht, mit der ein Objekt in seine Umgebung, in seine optischen Szenerie eingeordnet werden kann.



Die Weiteinstellung bietet mit dem völlig ungegliederten Überblick, den die Kamera gibt, alles, was die Kamera in einer Perspektive fassen kann, die Vermittlung eines optischen Gesamteindrucks (Personen mit ihrem weiten Umfeld, z.B. ganze Landschaften, sind im Bild; die Person oder Personen beherrschen noch nicht das Bild).

Die Totale führt, immer noch als Überblick, mit dem Beginn der optischen Verengung in eine Handlung ein. Die Handlungsträger erscheinen, noch Bestandteil ihrer Umgebung, im Bild (eine oder mehrere Personen mit ihrem näheren Umfeld, etwa einem Zimmer oder einer Gruppe von Personen, sind im Bild; die Personen beginnen das Bild zu beherrschen).

In der Halbtotale gibt die Kamera die Sicht des distanzierten Beobachters auf. Sie konzentriert sich auf den (auf die) Handlungsträger. Gestik und Mimik als nicht sprechsprachliche Verständigung - nonverbale Kommunikation - beginnen wichtig zu werden (eine oder mehrere Personen sind ganz zu sehen, also vom Kopf bis zu den Füßen und füllen damit das Bild auch aus).

Die Halbnaheinstellung zeigt den (die) Handlungsträger mit der Hälfte oder mit dem Drittel seiner (ihrer) Körpergröße. Die Kamera tastet sich an ihr(e) Objekt(e) heran. Sie interpretiert es (sie). (Möglichkeiten für Gestik und Mimik.) (Eine oder mehrere Personen sind etwa bis zu den Hüften im Bild).

In der Naheinstellung wendet die Kamera sich einem Objekt (etwa dem Gesicht eines Handlungsträgers) zu (Brustbild: die Personen sind bis etwa Brust-/Bauchhöhe zu sehen; in dieser Größe sind in der Regel Fernsehansager im Bild).

Die Großaufnahme läßt den Zuschauer am Objekt nicht mehr vorbeisehen. Es füllt das ganze Bild, beschlagnahmt Aufmerksamkeit, ist aber auch aus seiner Umgebung, aus seinem optischer. Kontext gelöst: „vereinzelt“ (nur der Kopf ist zu sehen, er füllt das Bild aus).

In der Detailaufnahme erreicht die Kamera die größte Nähe zum Objekt: optische Intimität, suggestive Wirkung, aber völlige Aufhebung der räumlichen Orientierung, bis zur Beziehungslosigkeit reichende Vereinzelung (z.B. nur noch Teile des Kopfes sind im Bild, der Kopf wäre größer als der Bildschirm).

Kodiert wird jeweils das erste Bild einer Einstellung. Dies gilt auch dann, wenn sich die Einstellungsgröße im Laufe einer Einstellung verändert, sei es durch Fahrten mit der Kamera, sei es dadurch, daß Personen im Vordergrund auftauchen und die Handlung dominieren.

Zeichnungen und Zeichentrick werden generell als groß kodiert.



Tiefenschärfe:

Tiefenschärfe nennt man den Bereich in der Tiefe des Bildes, der noch scharf abgebildet wird. Bei zunehmender Tiefenschärfe werden mehr und mehr Teile des Vorder- und Hintergrunds scharf abgebildet, bei geringer werdender Tiefenschärfe zerfließt mehr und mehr vom Vorder- und Hintergrund in Unschärfe.

Diese Kategorie erfaßt ungleichmäßige Verteilungen des Schärfebereichs, etwa wenn eine Person im Vordergrund scharf abgebildet ist und Personen im Hintergrund unscharf.

Es existieren zwei Ausprägungen: gleichmäßig (alle Ebenen der Tiefenstaffelung im Bild sind gleichmäßig scharf oder unscharf) und ungleichmäßig (es existieren verschieden scharfe Ebenen).



Kameraperspektive:

Die Kamera entscheidet mit ihrer Perspektive über die Sehposition, mit der ein Zuschauer in die Handlung eintritt. Damit entscheidet sie gleichzeitig über Emotionen, mit denen der Zuschauer an der Handlung teilnimmt.

Mit der Augenhöhe führt die Kamera den Zuschauer gleichsam als handelnde Person in normaler Sehposition in das Bild ein. Die Augenhöhe ist so das "alltäglich Gewohnte", voraussetzungslos Gegebene.

In der Untersicht, der sog. Froschperspektive, befindet sich die Kamera auf einer Ebene unterhalb der Augenhöhe. Sie ist nach oben gewinkelt. Aus dieser Perspektive wirkt das Bildobjekt überdimensioniert, geradezu drohend: Es ist uns „überlegen".

Zeigt die Kamera ein Objekt in der Draufsicht, der sog. Vogelperspektive, befindet sie sich auf einer Ebene oberhalb der Augenhöhe und ist nach unten geneigt. Das Objekt wirkt klein, unbedeutend. Nun sind wir diejenigen, die auf das Objekt „herabsehen", die es, wollten wir nur, auch leicht „übersehen" könnten.



Mit der Kameraperspektive ist die Höhe der Kamera relativ zur Augenhöhe der Hauptperson, und damit der vertikale Neigungswinkel der Kamera, gemeint. Wenn keine Person im Bild ist, muß wiederum die Position der Kamera relativ zu einer fiktiven Person geschätzt werden.

Leichte Abweichungen von der Augenhöhe, die fast immer vorkommen (kaum eine Einstellung ist genau in Augenhöhe aufgenommen), werden als Augenhöhe kodiert. Untersicht und Draufsicht werden kodiert, wenn sie als solche auf Anhieb gut erkennbar sind. Zeichentrick wird grundsätzlich als Draufsicht kodiert.



Kamerabewegung:

So wie die Kamera uns die Sehperspektive vorschreibt, ersetzen ihre Bewegungen auch die Bewegungen unserer Augen, gegebenenfalls, wenn die Kamera fährt, unseres ganzen Körpers.

Durch den Schwenk, d.h. durch die Bewegung der feststehenden Kamera um ihre Horizontal- oder Vertikalachse wird der Blick des Zuschauers geführt. Langsame Schwenks - z.B. über eine Landschaft - sind geeignet, Stimmungen zu vermitteln; schnelle Schwenks tragen eher dazu bei, eine Handlung zu dramatisieren.

Im Seitschwenk ahmt die Kamera die horizontale Bewegung unserer Augen oder unseres Kopfes nach. Sie ist fest postiert und bewegt sich auf gleicher Höhe nach rechts oder nach links. Der Vertikalschwenk imitiert Neigen oder Heben unseres Kopfes. Die fest postierte Kamera wird von einer feststehenden horizontalen Ebene aus nach unten oder nach oben bewegt.



Kamerabewegung horizontal:

Hiermit sind Drehungen der Kamera auf der horizontalen Ebene, also nach rechts oder links, gemeint, ohne daß sich der Standort verändert.

Entsprechend existieren die Ausprägungen keine (keine Drehung nach links oder rechts), Seitenschwenk rechts (Drehung nach rechts, also im Uhrzeigersinn) und Seitenschwenk links (Drehung nach links, also entgegen dem Uhrzeigersinn).

Kamerabewegung vertikal:

Drehungen auf der vertikalen Ebene, also nach oben oder unten, ohne daß sich der Standort verändert. Es existieren die Ausprägungen keine (keine Drehung nach oben oder unten), Aufschwenk (Drehung nach oben) und Abschwenk (Drehung nach unten).



Kamerabwegung in bezug auf ein Objekt - Kamerafahrt:

Hiermit sind Veränderungen des Standortes der Kamera angesprochen, wobei nicht die Richtung, sondern nur die Relation zum Hauptobjekt des Bildes interessiert. ~

Es existieren folgende Kategorien: keine (Kamera bleibt unbewegt stehen), Kamera bewegt sich mit Objekt (die Kamera bewegt sich in der gleichen Richtung und mit der gleichen Geschwindigkeit wie das bewegte Hauptobjekt, so daß sich ihre Stellung relativ zu diesem Objekt nicht ändert; Beispiel: die Kamera ist auf der Kühlerhaube eines fahrenden Autos montiert und nimmt die Insassen während der Fahrt auf), Kamera bewegt sich in bezug auf unbewegtes Objekt (die Kamera bewegt sich von der Stelle, während das Hauptobjekt an der Stelle bleibt; dadurch ändert sich die Stellung der Kamera zum Objekt) sowie Kamera bewegt sich in bezug auf ein bewegtes Objekt (sowohl die Kamera als auch das Hauptobjekt bewegen sich; dies aber nicht im gleichen Ausmaß, so daß sich die Stellung der Kamera zum Objekt verändert; Beispiel: während eine Person einen Weg entlangläuft, fährt die Kamera um sie herum).



Zoom:

Zoom nennt man eine Brennweitenveränderung des Objektivs während der Aufnahme. Es existieren folgende Ausprägungen: kein Zoom (keine Veränderung), Zoom näher (Verlängerung der Brennweite mit dem Effekt, daß der Ausschnitt kleiner wird und die abgebildeten Objekte größer), Zoom zurück (Verkürzung der Brennweite mit dem Effekt, daß der Ausschnitt größer wird und die abgebildeten Objekte kleiner) sowie Zoom bei unveränderter Einstellungsgröße (die Brennweite wird gerade so weit verändert, daß ein sich von der Stelle bewegendes Objekt gleich groß im Bild bleibt).

Zoomeffekte sehen auf den ersten Blick wie Kamerafahrten hin auf ein Objekt oder weg vom Objekt aus, sie sind aber bei genauerem Hinsehen dadurch zu unterscheiden, daß bei "Zoomfahrten" der Hintergrund im selben Ausmaß vergrößert wird und dadurch näherkommt wie der Vorder- und Mittelgrund. Bei echten Kamerafahrten nähert sich der Hintergrund (vor allem, wenn er weiter entfernt ist) langsamer.



Kamerasicht:

Ähnlich der Erzählperspektive bei Texten. Es existieren drei Ausprägungen, mit den Augen eines Handelnden (die Kamera filmt aus der Perspektive einer der an der Handlung beteiligten Personen), mit den Augen eines Dritten (die Kamera nimmt aus der Perspektive einer Person auf, die nicht zu den Handelnden gehört) sowie nicht entscheidbar.

Schnitt:

Fernsehen und Film müssen in der Regel Prozesse der Entwicklung und des menschlichen Handelns, die sich in realer Zeit abspielen, kürzen, wenn sie diese wiedergeben wollen. Damit geraten die von der Technik bestimmten Medien in ein Spannungsfeld zwischen technisch ermittelter, rein prozessual gegenwärtig gemessener Zeit und dem Zeiterleben des Menschen, das jeweils Vergangenheit und Zukunft in sein Gegenwartsverständnis einschließt.

Die Medien können zunächst Sende- oder Vorführzeit verkürzen, indem sie die Ablaufgeschwindigkeit ihrer Bildfolgen erhöhen (Zeitraffer). Aber das ist ein vordergründiges Mittel, das man zudem nicht in vielen Fällen anwenden kann.

Ein sehr viel wirksameres Mittel ist der Schnitt. Teile der ursprünglichen Aufnahmebänder (Filmabschnitte) werden herausgenommen: Man verzichtet auf sie, ihre Inhalte sind damit für diese Sendung, diese filmische Erzählung, diesen Bericht, diese Dokumentation liquidiert ("aufgehoben"). Schnitt als zeitliche Verkürzung ist ohne Auswahl, ohne Selektion nicht zu denken. Selektion ist ebenso gegeben, wenn nicht zeitliche Länge sondern inhaltlicher Umfang gekürzt werden muß (wobei in einem Prozeßmedium inhaltlicher Umfang sich in zeitlicher Länge ausdrückt und umgekehrt). Diese Selektion ist im Grunde aber nicht nur die Liquidation dessen, was ausgesondert wurde, sondern die Bewahrung ("Aufhebung", Konservierung) dessen, was erhaltenswert war.

Obwohl uns der Fernsehschirm, die Kinoleinwand eine Abfolge bewegter Bilder zeigen, kommt das fotografierte oder gezeichnete Einzelbild in unserer Wahrnehmung nicht zur Geltung. Wir sehen Bildfolgen, wie sie die Fernseh- bzw. die Filmkamera aufnimmt.

Filme aus der Frühzeit des Kinos, aber auch Amateurfilme, bestehen oft nur aus einer einzigen Bildfolge, aus einer einzelnen, ununterbrochenen Kameraaufnahme: aus einer Einstellung. Dabei kann sich die Kamera während dieser Aufnahme uneingeschränkt bewegen.

Kamerabewegung sowie Wechsel der Kameraperspektive sind also Bestandteil der Einstellung, wenn es sich um ein Stück fortlaufend aufgenommenen Films handelt.

Begrenzt wird die einzelne Einstellung durch den Schnitt. Mehrere Einstellungen werden zu einer Sequenz zusammengefügt.

Werden gegensätzliche Einstellungen aneinandergefügt, so daß die Übergänge von Einstellung zu Einstellung deutlich sichtbar, womöglich wie ein Ruck erlebt werden, das eine Bild abbricht und ein anderes übergangslos einsetzt, spricht man von hartem Schnitt.

Bei unmerklichen Übergängen haben wir es mit einem weichen Schnitt zu tun. Bewegungszusammenhänge werden betont.

Aber auch die Dauer der Einstellungen spielt eine Rolle. Langandauernde Einstellungen ergeben einen ruhigen, kurze einen rasanten Schnitt, wenn man sie aneinanderreiht. Längere Bildausschnitte verlangsamen dabei den Rhythmus, wirken beruhigend; die Aneinanderreihung zahlreicher kurzer Einstellungen erzeugt dagegen die Dynamik zeitlicher Beschleunigung.



Blende: Bilder einer Einstellung erscheinen aus dem Dunkel oder verschwinden in ihm. Man spricht von Aufblende beziehungsweise Abblende.

Läßt man verschiedene Einstellungen ineinander übergehen, so hat der Zuschauer den Eindruck, die Bilder einer Einstellung wüchsen aus den Bildern einer zweiten Einstellung heraus, die gleichzeitig verschwindet. In diesem Fall haben wir es mit einer Kreuzblende zu tun. Die Bilder überschneiden, überkreuzen sich sozusagen.

Blenden sind ein dramaturgisches Signal für das Erscheinen eines Wirklichkeitsraums (Aufblende) oder für den Übergang von einem Raum in den anderen (Kreuzblende). Die Kreuzblende als Rückblende markiert die Freiheit des Fernsehens, Zeiträume beliebig zu wechseln.



Schnitt - Anfang:

Mit „Schnitt - Anfang" ist in dieser Kategorie die Art des Beginns einer Einstellung gemeint, genauer: die Art der Einblendung der jetzt beginnenden Einstellung. Dementsprechend gibt es folgende Ausprägungen: harter Schnitt (das erste Bild der Einstellung ist ein normales, normal helles Bild; die Einstellung beginnt also abrupt), Aufblende (die ersten Bilder der Einstellung sind dunkel, das erste Bild in der Regel schwarz, und werden zunehmend heller), Kreuzblende (die letzten Bilder der vorangegangenen Einstellung und die ersten Bilder der aktuellen Einstellung überlagern sich zeitweise; in der Regel findet gleichzeitig eine Abblende der vorangegangenen und eine Aufblende der aktuellen Einstellung statt) und nichteinordenbar.

Ein Einstellungsbeginn, der durch spezielle Tricks, wie etwa Rauch, Nebel, Unschärfe etc. zustande gekommen ist, sollte möglichst den vorhandenen Ausprägungen zugeordnet werden. Trickblenden als solche werden nicht erfaßt; sie sollten als "besondere optische Effekte" kodiert werden.



Schnitt - Ende:

Damit ist die Art der Beendigung einer Einstellung gemeint, komplementär zum Anfang also die Art der Ausblendung. Es gibt folgende Ausprägungen: harter Schnitt (eine Einstellung endet „wie abgeschnitten"; das letzte Bild ist normal hell und nicht von der folgenden Einstellung überlagert), Kreuzblende (die letzten Bilder der aktuellen Einstellung und die ersten Bilder der folgenden überlagern sich zeitweise; in der Regel findet gleichzeitig eine Abblende der aktuellen Einstellung und eine Aufblende der folgenden statt) und nicht einordenbar

Ein Einstellungsende, das durch spezielle Tricks, wie etwa Rauch, Nebel, Unschärfe etc. zustande gekommen ist, sollte möglichst den vorhandenen Ausprägungen zugeordnet werden. Trickblenden als solche werden nicht erfaßt.



Ablaufgeschwindigkeit:

Hier wird die Ablaufgeschwindigkeit des Videobands bzw. des Films relativ zur Aufnahmegeschwindigkeit und damit die Ablaufgeschwindigkeit der Bewegungen im Video/Film erfaßt. Es existieren die Ausprägungen normal (normale Geschwindigkeit), Zeitlupe (Bewegungen wirken verlangsamt), Zeitraffer (Bewegungen wirken beschleunigt) und Standbild (es werden ein stehendes Bild oder mehrere stehende Bilder wie in einer Diashow gezeigt).



Besondere optische Effekte:

Diese Kategorie ist eine Sammelkategorie für verschiedene optische Effekte. Sie umfaßt folgende Ausprägungen: keine (keine Effekte), Fototrick (Tricks, die in normal fotografierten Filmen durch Manipulation der Bilder entstehen), Zeichentrick (Einzelbilder sind gezeichnet, bei der Vorführung entsteht der Eindruck von Bewegung), Bildteilung (auf dem Bildschirm sind gleichzeitig zwei oder mehr Bilder nebeneinander zu sehen) und andere (Sammelpunkt für alle restlichen optischen Effekte, die nicht den vorgenannten Ausprägungen zugeordnet werden können, die aber so auffällig sind, daß sie kodiert werden sollten; unter diesen Punkt fallen auch Trickblenden, also Nebel-, Rauch-, Unschärfeblenden etc. Die Blenden werden dabei der jeweils folgenden Einstellung zugeordnet.).

Effekte, die nicht eindeutig den genannten Ausprägungen zugeordnet werden können und die nicht deutlich auffällig sind, sollten im Zweifel nicht kodiert werden.

Da nur eine Kodierung je Kategorie vorgenommen wird, soll bei mehreren Effekten in einer Einstellung derjenige kodiert werden, der am auffälligsten ist.



Montageart:

Unter Montage verstehen wir das inhaltliche Muster, nach dem Einstellungen aneinander gefügt werden. Bezugspunkt für die Einschätzung einer Einstellung ist die jeweils vorangegangene.

Leben in seinem weitesten Sinne, anorganisch und organisch, mit Bewußtsein begabt oder bewußtlos, ereignet sich im Prozeß, in einem zeitlichen Nacheinander, in einer Entwicklung. Da wo dieser Prozeß sich in personalem Bewußtsein, zielgerichtet und in Freiheit vollzieht, spricht man von menschlichem Handeln.

Fernsehen und Film als Prozeßmedien können sowohl Entwicklung wie menschliches Handeln im zeitlichen Nacheinander wiedergeben, indem sie erzählen, berichten, dokumentieren. Fernsehen und Film sind narrative Medien.

Prozesse der Entwicklung und des Handelns ereignen sich in der Zeit. Zeitbewußtsein, als einen Begriff von gelebter Zeit, hat unter allen Lebewesen nur der Mensch. Zeit ist eine Erscheinung unseres alltäglichen Lebensvollzugs. Ganz unbefangen sprechen wir von heute, gestern und morgen, daß ein Ereignis zu früh, ein anderes zu spät eingetreten sei, daß wir (noch) „Zeit haben", daß „eine Frist abgelaufen sei".

Gegenwart wäre dem abstrakten Denken, das sich nicht der Praxis des alltäglichen Zeiterlebens zuwendet, jeweils nur der Moment, in dem Zukunft in Vergangenheit umschlägt. Menschliches Leben wäre dann ein Kette solcher Augenblicke technisch-organisierter Zeit. Sie könnte in ihrer blitzschnellen, identisch monotonen Abfolge nicht gelebt werden, weil diese Gegenwart ihre Zukunft unaufhaltsam an die Vergangenheit verlöre, ohne sich ihres Selbstwerts je gewärtig zu werden.

Menschliche Gegenwart aber als „psychische Präsenzzeit" hat in sich die Art und Weise der Tatsächlichkeit (als ihrer Gegenwart), der Notwendigkeit (als ihrer Vergangenheit) und aus beiden die der Möglichkeit (als ihrer Zukunft).

Fernsehen und Film müssen in der Regel Prozesse der Entwicklung und des menschlichen Handelns, die sich in realer Zeit abspielen, durch Vorausselektion des aufzunehmenden Materials, dann durch dessen Schnitt kürzen, wenn sie diese realen Prozesse wiedergeben wollen.

Der Schnitt hat auswählend Aufnahmematerial verkürzt: Das durch Auswahl gewonnene Medienmaterial, dessen zeitlich-prozessuale Struktur durch den Schnitt ja nun zerstört ist, braucht jetzt eine neue Struktur, in die es „aufgehoben" wird, gegebenenfalls auch Ergänzungen. Selektion, auswählender Schnitt ist im Fernsehen und im Film nicht ohne Konfiguration, ohne das professionelle Herstellen eines neues Zusammenhangs zu denken: Aus Selektion und Konfiguration entsteht Montage.

Montage kann Entwicklung und menschliches Handeln in der Reihenfolge der Phasen wiedergeben, wie sie sich in der Realität oder Fiktionalität abspielen, dann ist sie chronologisch.

Montage kann aber auch Entwicklungs- und Handlungsprozesse aufbrechen. Sie kann wie das menschliche Bewußtsein zwischen Gegenwart, Vergangenheit und Zukunft wechseln, sie kann die Verknüpfung zeitlicher Dimensionen als Mittel gegenseitiger Interpretation gebrauchen. Montage ist dann achronologisch.

Als Parallelmontage kann sie mehrere getrennte Handlungsstränge, aber auch einzelne Bilder als "fruchtbare Augenblicke" zu einer überpersonalen (u.U. kollektiven) Entwicklung verknüpfen und damit gesellschaftliche Prozesse mehr oder minder genau, realistisch oder symbolisch überhöht, nachbilden.

Mit der Möglichkeit, Handlungsstränge parallel (zeitlich simultan) zu setzen, eröffnet sich gleichzeitig die Möglichkeit des Vergleichs: Was da parallel gesetzt ist, kann analog oder kontrastiv erscheinen (die Analogie- oder die Kontrastmontage). Wir unterscheiden also grundsätzlich die erzählend-berichtende (narrative) Montage und die diskriminative Montage.

Verengt man nun Entwicklung auf menschliches Handeln, dann kann man dieses Handeln unter den Kategorien des Raumes oder der Zeit betrachten und darstellen.

Im Theater repräsentiert der Einakter die klassisch-aristotelische Forderung nach der Einheit von Handlung (die nicht unterbrochen wird), von Ort (der nicht gewechselt wird) und Zeit (die in ihrem „natürlichen" Ablauf, unverkürzt chronologisch erscheint).



Montage kann im Fernsehen und im Film diese Einheit aller drei Kategorien aufheben: Sie kann Handlungen unterbrechen, Orte wechseln, Zeitabläufe umstrukturieren, so zwischen Gegenwart, Vergangenheit Lind Zukunft pendeln, oder mehrere Handlungsstränge, die in sich chronologisch bleiben können, im Vergleich parallel setzen. Montage im Fernsehen und im Film ermöglicht der Handlung, sich in Raum und Zeit frei zu bewegen.

Schnitt und Blende erlauben also dem Fernsehen, Einstellungen so aneinanderzufügen, daß ihre Kombination zur Sinnaussage wird.

Schwierigkeiten kann die Abgrenzung der Handlung machen, da eine konkrete Aktion in der Regel ein Teil einer hierarchisch aufgebauten Handlungskette ist. Beispiel: in der Aufnahme eines Schulunterrichts wird eine Szene eingeblendet, in der sich zwei Schüler unterhalten. Die Handlung wäre hier die Unterhaltung zwischen den Schülern, nicht der Unterricht als übergeordneter Handlungstypus.

Unter Handlung verstehen wir in diesem Zusammenhang den Handlungstypus (z.B. Mord), nicht aber die durch Ort und Zeit eindeutig definierte Einzelhandlung (den konkreten Mord am Soundsovielten da-und-dort).



Dieser Zusammenhang wird durch die Einheit von Handlung (H), Ort (0) oder Zeit (Z), jeweils allein oder in Kombination, hergestellt. Dementsprechend gibt es folgende Ausprägungen:

1. Einstellung: Da die erste Einstellung nicht auf eine vorangegangene beziehbar ist, wird sie extra kodiert. Wenn ein Film aus mehreren unzusammenhängenden Teilen besteht, kann diese Kategorie auch mehrfach innerhalb des Films vergeben werden.

Einheit H-O-Z: Die aktuelle Einstellung führt die Handlung der vorangegangenen Einstellung am gleichen Ort weiter. Sie spielt gleichzeitig oder führt in normaler Zeitabfolge ohne Sprung die vorangegangene Einstellung weiter. Beispiel: In einem Verhör wird zwischen der Sicht des Verhörten und des Kommissars gewechselt.

Einheit H-0: Die aktuelle Einstellung führt die Handlung am gleichen Ort weiter, aber es wird ein Sprung in der Zeit vor oder zurück gemacht. Beispiel: ein Polizist wartet in einem Auto, bis ein Verdächtiger ein Haus verläßt; es erfolgt ein Schnitt, und man sieht den Beamten Stunden später immer noch warten. Beispiel für Rückblende: nach der Darstellung eines Mordes wird zurückgeblendet auf den Beginn der Szene, die schließlich mit dem Mord endet.

Einheit O-Z: Die aktuelle Einstellung zeigt eine parallele Handlung am gleichen Ort zur gleichen Zeit oder in normaler zeitlicher Abfolge ohne deutliche Sprünge. Beispiel: Bei der Aufnahme einer Schulklasse wird zunächst die Lehrerin gezeigt, die einen Stoff erklärt, dann wird umgeschnitten auf zwei Schüler, die sich währenddessen unterhalten. Normale zeitliche Abfolge wäre gegeben, wenn die Lehrerin eine Frage stellt und dann umgeschnitten wird auf einen Schüler, der sich daraufhin meldet.

Einheit H-Z.: Dies dürfte wohl selten vorkommen, es bedeutet, daß dieselbe Handlung zur selben Zeit an verschiedenen Orten spielt. Denkbar wäre hier ein Telefongespräch, wo zwischen den Teilnehmern hin und her geblendet wird.

Einheit H: Dieselbe Handlung wird an einem anderen Ort und zu einer anderen Zeit dargestellt. Auch dies dürfte selten sein. Denkbar wäre eine Rückblende von einem Autounfall auf den Beginn der Fahrt an einem anderen Ort.

Einheit 0: Es wird eine andere Handlung, die zu einer anderen Zeit am selben Ort spielt, dargestellt. Hier sind viele Beispiele denkbar, etwa die Darstellung der morgendlichen Rush-Hour gefolgt von nächtlicher Ruhe an einer Straßenkreuzung. Zu beachten ist, daß eine normale chronologische Abfolge als Einheit der Zeit kodiert würde.

Einheit Z (Parallelmontage): Die aktuelle Einstellung zeigt eine andere Handlung an einem anderen Ort, aber zur selben Zeit. Ein Beispiel wäre die Darstellung des Mittagessens an verschiedenen Plätzen, etwa in einer Familie, in einer Mensa, in einem Restaurant.



Schrift:

Diese Kategorie dient zur Erfassung von Schrifteinblendungen, auch im Vor- oder Nachspann. Es existieren folgende Ausprägungen: keine (keine Schrift sichtbar), Buchstabe (einzelne Buchstaben sichtbar), Wort (ein einzelnes Wort oder mehrere, nicht zu Sätzen verbundene, Wörter sind sichtbar), Satz (ein ganzer Satz ist sichtbar; dies erstreckt sich auch auf unvollständige, ungrammatische oder verkürzte Sätze, solange sie dem Alltagsverständnis nach als bedeutungsvolle Sätze erkennbar sind; auch Überschriften, die aus mehreren Wörtern bestehen, auch nur Artikel+Substantiv, gehören hierzu), Periode (zwei oder mehr Sätze sind sichtbar), Emblem (es ist ein Wahrzeichen, Symbol, Logo, Emblem oder ähnliches zu sehen) und Legem (Wortbruchstücke, die aber als solche erkennbar sind, also keine sinnlosen Buchstabengruppen; Beispiel- „ungen", aber nicht „hrk").



Ton:

Sprechsprache:

Gesprochene Sprache erleben wir im Fernsehen und im Film in verschiedenen Erscheinungsformen: Als Einzelwort hören wir sie in der Regel nur in Fernsehspielen oder Spielfilmen. In Sätzen oder Perioden bestimmt sie das gesamte Fernseh- und Filmprogramm.

Sprache/Laute:

Hiermit sind menschliche Äußerungen gemeint. Die möglichen Ausprägungen sind folgende: keine (keine menschlichen Laute oder Äußerungen hörbar), Laut (es ist ein menschlicher Laut oder mehrere Laute, aber kein artikuliertes Wort hörbar; hierunter fallen etwa Stöhnen, Ächzen, Weinen etc.), Wort (ein einzelnes Wort oder mehrere, nicht zu Sätzen verbundene, Worte sind hörbar), Satz (ein einzelner verstehbarer sinnvoller Satz ist hörbar; diese Ausprägung wird auch bei unvollständigen oder ungrammatischen Sätzen kodiert, sofern sie dem Alltagsverständnis nach als bedeutungsvolle Sätze verstehbar sind) sowie Periode (zwei oder mehr Sätze sind hörbar).

Sprach-/Lautquelle:

In dieser Kategorie wird die Quelle, genauer: der Ort der Quelle von Sprach- oder Lautäußerungen, die in der vorangegangenen Kategorie erfaßt wurden, angegeben. Es existieren nur drei Ausprägungen: keine Sprache/Laute (es sind keine Äußerungen hörbar; diese Ausprägung wird dann gewählt, wenn in der vorangegangenen Kategorie die Ausprägung keine gewählt wurde), Sprache/Laute im On (die Person, die eine Äußerung macht, gehört zu den an der Handlung beteiligten Personen, auch wenn sie im Moment nicht im Bild zu sehen ist) sowie Sprache/Laute im Off (die Person, die eine Äußerung macht, gehört nicht zu den an der Handlung beteiligten Personen, z.B. Sprecher, Kommentatoren etc.).

Musik:

Auch Musik begegnet uns im Fernsehen und im Film in verschiedener Tongestaltung: als Einzelton, als Motiv und als Melodie. Alle diese Einzelformen können kompositorisch in der unterschiedlichsten Weise verbunden werden.

Diese Kategorie bezieht sich entweder auf Musik, die im Bild gemacht wird, oder auf bildtranszendente Begleitmusik. Als Musik werden hier alle Töne aufgefaßt, die von Musikinstrumenten, auch aus fremden Musikkulturen, oder elektronischen Instrumenten, die solche imitieren, erzeugt werden. Alle Laute, die aus natürlichen Quellen stammen oder von anderen Quellen und die nicht gut erkennbar ein Musikinstrument imitieren, werden als Geräusche kodiert. Dies gilt auch dann, wenn die Geräusche erkennbar zu einem Musikstück zusammengefügt wurden, etwa bei bestimmten Arten moderner Musik. Bei solcher Musik ist zu beachten, daß sie, wenn die Geräusche mit musikalischen Instrumenten kombiniert wurden, sowohl unter "Musik", als unter "Geräusch" kodiert wird. Es existieren folgende Ausprägungen: keine Musik (es ist keine Musik hörbar), Ton (es ist ein einzelner Ton hörbar), Phrase, Motiv (kürzere zusammengehörige Tonfolgen), Melodie (ganze Melodien).



Musikquelle:

In dieser Kategorie wird ähnlich wie bei der Sprache der Ort der Quelle von musikalischen Tönen, die in der vorangegangenen Kategorie erfaßt wurden, angegeben. Es existieren nur drei Ausprägungen: keine Musik (es ist keine Musik hörbar; diese Ausprägung muß dann gewählt werden, wenn in der vorangegangenen Kategorie die Ausprägung keine gewählt wurde), Musik im On (die Musik wird im Zuge der Handlung produziert, auch wenn die Quelle nicht im Bild zu sehen ist) sowie Musik im Off (die Quelle der Musik gehört nicht zur Handlung; hierzu gehört in der Regel untermalende Musik).



Geräusch:

Geräusche begegnen dem Adressaten im Fernsehen und im Film als zeitlich umrissene akustische Einzelerscheinung oder als Geräuschkontinuum.

Die Grenze zwischen Musik und Geräusch wird durch die Periodizität der Schallschwingungen markiert. Regelmäßige Schwingungen erzeugen Töne, ungeregelte Geräusche. Aber diese Grenze ist heute im Bereich elektronischer Klänge fließend geworden.

Es gibt „Naturgeräusche" und Geräusche, die der kulturellen und zivilisatorischen Veränderung der Natur durch den Menschen entstammen.

Hier werden alle Laute erfaßt, die nicht von Personen geäußert werden und nicht nach den oben genannten Kriterien in die Kategorie "Musik" fallen. Hierunter fallen beispielsweise Laute von Tieren, Hintergrundgeräusche wie Verkehrslärm, im Zug der Handlung erzeugte Geräusche, aber auch Geräusche, die zur Untermalung erzeugt wurden, und zwar sowohl dann, wenn sie als Geräusche gemeint sind, als auch, wenn sie als Musik komponiert sind (s.o.).

Es existieren folgende Ausprägungen: kein Geräusch (keine Geräusche hörbar), Geräusch als Einzellaut (ein Geräusch oder mehrere sind als Einzelgeräusche hörbar, d.h. sie dauern nicht kontinuierlich an; sie gelten in diesem Sinne auch als Einzellaute, wenn sie in einem Zusammenhang zueinander stehen) sowie Geräusch als Kontinuum (ein Geräusch oder mehrere sind kontinuierlich, also ohne Unterbrechung zu hören, beispielsweise eine laufende Maschine oder Meeresrauschen).

Geräuschquelle:

In dieser Kategorie wird wieder ähnlich wie in den beiden Kategorien „Sprache" und „Musik" der Ort der Quelle von Geräuschen angegeben. Es existieren wiederum drei Ausprägungen: kein Geräusch (es sind keine Geräusche hörbar; diese Ausprägung wird dann gewählt, wenn in der vorangegangenen Kategorie die Ausprägung kein Geräusch gewählt wurde), Geräusch im On (die Quelle des Geräuschs gehört zur Handlung, auch wenn sie im Moment nicht im Bild zu sehen ist) sowie Geräusch im Off (die Quelle eines Geräuschs gehört nicht zur Filmhandlung).



3.4. Medienkommunikation und Wahrnehmung



Medienkommunikation - Wahrnehmung - Interesse

Ohne auf die heute kaum mehr überschaubare Anzahl von Wahrnehmungstheorien im einzelnen einzugehen (Waldenfels, 1974, S. 1669f.), kann man Wahrgenommenes als etwas beschreiben, was aus der Fülle der lebensweltlich gegen uns andringenden Reize und Reizkonfigurationen unsere Aufmerksamkeit erregt hat. Was uns aufmerksam macht, weckt unser Interesse: Es ereignet sich (Esser, 1973, S.738ff). Dabei meint Interesse nach einer der möglichen Grundbedeutungen des lateinischen Wortes zunächst, daß wir in ihm „zwischen" unserem Ich und dem sind, was als Nicht-Ich, als Gegenstand, unsere Aufmerksamkeit erregt, was wir uns aneignen möchten, ja aneignen müssen, sobald wir aufmerksam geworden sind. Mit „Gegenstand" ist dabei nicht notwendig „Objekt" gemeint, dem ein „Subjekt' sich zuwendet: Etwas, das erst angeeignet werden muß, unterscheidet sich darin von den Beständen unseres Bewußtseins als eines inneren Modells von Außenwelt. Dieses so „interessante" hat dabei einen schillernden Charakter: Wir nehmen Anteil an ihm, gleichzeitig ist es als etwas Anzueignendes auch etwas, was verwertet werden kann und soll.

Im Dazwischensein, das sich nach dem Noch-nicht-Angeeigneten ausstreckt, übersetzen wir das Anzueignende in die Strukturen unseres inneren Modells von Außenwelt: Das Anzueignende wird in diese Strukturen transformiert, transformiert aber auch die Strukturen, durch die es angeeignet wird. Mit anderen Worten: Was unsere Aufmerksamkeit erregt, was sich für uns ereignet, weil es unser Interesse findet, wird in das Konstrukt unseres inneren Modells von Außenwelt hineinkonstruiert, indem es strukturiert wird. Die Form ist also nicht etwas, was zum Bewußtseinsinhalt hinzuträte; sie macht diesen Inhalt erst bewußtseinsfähig und damit auch, hin zu einem anderen Bewußtsein, kommunikabel (Oerter, 1980, S. 131).

Eine zweite Transformation findet statt, wenn das Angeeignete, nun strukturierter Inhalt unseres Bewußtseins, tatsächlich mitgeteilt werden soll. Wir suchen dann unter den Zeichenrepertoires, die uns zur Verfügung stehen, nach Zeichen und Zeichenstrukturen, in die wir transformieren können, weil sie auch dem fremden Bewußtsein zur Verfügung stehen. Und wir transformieren gleichzeitig in eine Form, von der wir hoffen, daß sie den Inhalt interessant macht. Fremdes Bewußtsein faßt dann das Mitgeteilte auf als etwas, was angeeignet werden soll: Die Bewegung beginnt von Neuem. Dabei ist zu beobachten, daß wir aus strukturierter Wahrnehmung unmittelbar ebenso lernen können wie aus der Mitteilung von strukturierter fremder Wahrnehmung. Weil Wahrnehmung notwendig den Strukturen unseres inneren Modells von Außenwelt einkonstruiert wird, gibt es - das ist für jede Medientheorie grundsätzlich wichtig - für unser Bewußtsein auch keine „erste" und keine „zweite" Wirklichkeit, die man als mediales Surrogat polemisch gegen ein vermeintlich Originales absetzen könnte (Zeitter, 1987, S. 103).

Nun wird es möglich, formale Bewußtseinsstrukturen, die wechselnde Wahrnehmungsinhalte erst bewußtseinsfähig machen, allgemein zu definieren als strukturelle Invarianten, als grundsätzlich veränderbare Gegebenheiten in einem System, die angesichts auf sie einwirkender und durch sie angewandter Transformationen über eine längere Zeit unverändert bleiben (Oerter, 1980, S. 349). Begriffe etwa sind solche Invarianten, sie machen Kommunikation als intersubjektive Bekräftigung subjektiver Bewußtseinsinhalte erst möglich.

Auch in Fernsehsendungen als medialen Mitteilungen sind, wie im System unseres Bewußtseins, die formalen Einzelstrukturen wie ihre Kombination in der Montage, gemessen an den wechselnden, einwirkenden Inhalten, invariant. Sie halten sich, indem sie Wahrgenommenes in die Strukturen des Mediums transformieren, als Möglichkeiten medialer Aussage, als Klischees, durch, Klischees, die so lange sinnvoll bleiben, wie sie bei den Adressaten Interesse und damit die Möglichkeit der Aneignung der Inhalte bewirken können. Mediale Inhalte werden durch formale Invarianten zu medialer Wirklichkeit konstruiert, die interessieren kann und soll.



Wahrscheinlichkeitslernen - Strukturelle Invarianten

Diese strukturellen Invarianten werden vom Produzenten wie vom Adressaten durch Wahrscheinlichkeitslernen angeeignet.

Was heißt nun „Wahrscheinlichkeitslernen“? Eine invariante Form, mehrmals angetroffen, weckt Vorerwartungen. Zunächst sind diese Vorerwartungen vorbewußt, auch wenn sie Entscheidungen steuern. Bewußt werden sie, wenn eine Anfrage, also Kommunikation, uns zwingt, sie „auf den Begriff zu bringen".

Auch strukturelle Invarianten der Film- und Fernseh-„Sprache" als Formen der Vorerwartung bündeln optische Reize zu „Wahrnehmungsgestalten", die innerhalb einer durchaus gegebenen Variationsbreite spezifisch und damit erkennbar bleiben. Auch diesen Reizkonfigurationen muß etwas Unverwechselbares („Typisches") anhaften, wenn sie von anderen unterschieden werden sollen. Dieses Unverwechselbare jedoch ist nicht immer durch die Analyse seiner Einzelqualitäten (der einzelnen Reize), so gut wie immer aber aus seinem synthetischen Gesamteindruck heraus zu beschreiben. Dabei bleibt zunächst oft ungewiß, ob dieser Gesamteindruck als Ergebnis eines markanten Einzelreizes auf dem Hintergrund korrespondierender Reize oder ob er durch das Zusammentreten gleichwertiger Reize zustande kommt. Artikulation, Kommunikation sollten es auf dem Gebiet der strukturellen Invarianten der Film- und Fernseh-„Sprache" dem Lernenden aber ermöglichen, unterschiedliche Reaktionen auf unterschiedliche Reizkonfigurationen bewußt zu vollziehen.

In die Sprache der Wissenschaft übersetzt, bedeutet das für unseren Fernseh- und Filmkonsum: Strukturelle Information, bei der im Gegensatz zur semantischen Information nicht der Inhalt, aber sehr wohl Elemente der Bedeutung erfaßt werden, wird nach Theorien der informationellen Akkomodation vom Adressaten durch Wahrscheinlichkeitslernen erschlossen und in ihren Elementen angeeignet (Oerter, 1980, S.67ff.). Wahrscheinlichkeitslernen wäre hier die Einprägung der objektiven Häufigkeitsverteilungen struktureller Elemente und ihrer narrativen Funktionen (Verbindung zum Schemabegriff der kognitiven Psychologie). Diese nun subjektiv erfaßten Häufigkeiten bewirken eine Erwartungshaltung, stehen allerdings den Bewußtseinsprozessen nicht unmittelbar zur Verfügung; sie sind vor allen Dingen zunächst nicht spontan artikulierbar.

Strukturelle Invarianten sind Produkte einer Reduktion der möglichen optischen Reizmenge einer Botschaft. Mit Hilfe dieser Reduktion adaptiert der „Macher“, der Produzent, Inhalte seiner Wahrnehmung auf die Kommunikationsbedingungen eines optisch-akustischen Massenmediums. Der Macher findet strukturelle Invarianten bereits als Konventionen vor (Sprache nach Humboldt als „ergon") und transformiert sie im Prozeß der medialen Kommunikation in neue Aktualität: Strukturelle Invarianten werden so "energeia" und verändern damit, wenigstens in der Möglichkeit, den gesamten Möglichkeitsbestand ihrer Anwendungen = das Gesamtsystem des „ergon" (Humboldt, 1963, S. 418).

Wahrscheinlichkeitslernen, gerichtet auf strukturelle Invarianten der Fernseh- bzw. Film-„Sprache", kann man sich geschichtet vorstellen. Eine erste Lernmatrix erfaßt dann einfache Formen von Kameraoperationen und Schnitt, eine zweite Matrix überformt sie auf höherer Komplexions- und Verständnisebene (Formen der Montage).

Strukturelle Invarianten der Fernseh- bzw. Film-„Sprache" können durch Wahrscheinlichkeitslernen angeeignet werden. Erschlossen sind sie erst, wenn sie bewußt unterschieden, benannt und in ihren Wirkungen beschrieben werden können. Der Lernende muß, auch im produktionspraktischen Experimentieren, strukturelle Invarianten als Reizkonfigurationen in „Klassen" ordnen, also „begreifen". Er muß schließlich diesen komplexen Lernvorgang über den je konkreten Fall hinaus auf andere konkrete Fälle anwenden können (Lerntransfer). Strukturelle Invarianten der Film- und Fernseh-„Sprache" werden in der Montage nach einer Lernmatrix höherer Ordnung kombiniert, d.h., sie sind einem System von Gestaltungsregeln unterworfen.

In der Sprache der Lerntheorie: Auf Klassen von Reizkonfigurationen muß der Lernende mit Klassen von Ordnungsleistungen im Sinne der Systemorganisation reagieren können.

(Gagne, 1975, S. 170ff.; Zeitter, 1987, S. 128ff.). Der Lernende sollte dabei vor allem in praktischer Produktionstätigkeit erfahren, daß Regeln der Montage nicht strenge ästhetische Gesetze, sondern Konventionen des gesellschaftlichen Diskurses unter den Bedingungen eines optisch-akustischen Massenmediums sind, eines Diskurses, in den freilich ästhetische Momente, auch im Sinne von Tradition, jeweils eingehen.

Wir organisieren gerade auch unseren Fernsehkonsum sehr oft nach formalen Wahrscheinlichkeitskalkulationen. Wir wissen, wenn wir blind einschalten, u.U. innerhalb weniger Sekunden, daß wir mitten in einem Krimi sind, weil wir dessen formale Strukturen längst verinnerlicht haben - einen Krimi aber mögen wir im Augenblick sehr oder gar nicht. Wissen wir auch warum? Wissen wir, was die Familienmitglieder mögen und können wir über unsere Vorerwartungen, über unsere Vorlieben miteinander sprechen, können wir Konsens herstellen oder im Dissens sachlich bleiben?

Im Zeitalter des „Zapping", wenn man mit der Fernbedienung von Programm zu Programm hüpft, spielen solche Wahrscheinlichkeitsurteile eine große Rolle. Sie prägen aber darüberhinaus jede Art des Fernsehempfangs, sie bestimmen unsere Interessen gerade deshalb mit, weil sie den meisten von uns in ihrer Wirkung nicht bewußt sind. Wie wichtig wäre aber in der Begegnung mit einen-, so faszinierenden Medium wie dem Fernsehen, daß wir ein Bewußtsein unserer formalen Wahrscheinlichkeitserwartungen und damit der durch diese vorgeprägten Vorlieben und Geschmacksurteile hätten. Wie wichtig wäre es, wenn wir mit anderen sachlich darüber sprechen könnten. Wir wären dann mit Sicherheit weniger manipulierbar.

Ziel der Medienerziehung müßte es sein, Häufigkeiten dieser invarianten Strukturen, die deren Einprägungswert bestimmen, dem Bewußtsein des Adressaten, vor allem auch dem Bewußtseinsprozeß der Artikulation verfügbar zu machen. Dies kann besonders dadurch geschehen, daß der Lernende mit solchen Strukturen als Mitteln kreativer Aussage experimentieren, daß er durch sie sich ausdrücken lernt. Lerntheoretisch gesagt: Anstatt eine formale Konvention als subjektive Häufigkeitserwartung nur zu perzipieren, sollte man einen optischen Code der Reflexion, der Artikulation und damit der kreativen Produktion als den Medien der Selbsterfahrung erschließen.

Da diese Regeln aber, wie die Entwicklung der Gesellschaft, offen bleiben, entsteht immer wieder das gestalterische Problem, bekannte Regeln unter den beschreibbaren gesellschaftlichen Grundbedingungen so zu kombinieren, daß bei Veränderung dieser Bedingungen in Zusammenhang mit ihnen neue Leistungsmöglichkeiten entstehen. Diese Leistungsmöglichkeiten können unter Umständen zu Regeln höherer Ordnung werden. (Das schließt nicht aus, daß Kunst ihre Werke „intuitiv- instinktiv" hervorbringen kann.)

Strukturelle Invarianten sind, auf die Ganzheit eines Films oder einer Fernsehsendung gesehen, gemessen an den wechselnden Inhalten des gesellschaftlichen Diskurses die stabileren Elemente. Betrachtet man die Inhalt-Form-Beziehung als Wechselwirkung, in der sich ein Inhalt die passende Form sucht, die Form ihrerseits den Inhalt erst kommunikabel macht, dann können alte Formen als die stabileren Elemente einer Inhalt-Form-Korrelation weiterbestehen, obwohl die korrespondierenden Inhalte schon lange verschwunden sind. Schließlich sprengen neue Inhalte die alten Formen. Dialektisch gesehen entsteht im Sinne des Problemlösens eine neue Inhalt-Form-Korrelation. Ob man diese für eine Einheit „höherer Ordnung" halten muß, hängt von der Frage ab, ob man „Fortschritt" in der Kunst, allgemeiner gesagt im gesellschaftlichen Diskurs, für möglich, sogar für notwendig hält. Auf jeden Fall sollte der Lernende für die Beziehung zwischen Inhalt-Form-Korrelation und sozialer Situation im praktischen Erproben des medialen Diskurses sensibel gemacht werden.



3.5. Wahrnehmungstheoretische Grundlagen der Film- und Fernseh-"Sprache"

(Zeitter, 1987, S. 45; vgl. Ballstaedt et al., 1989)



Modelle der Neurophysiologie und -psychologie zeigen, wie eng bereits in der elementaren Verarbeitung visueller Reize Wahrnehmung und Sprache, aber auch Observation und Imagination verbunden sind. Selektive Aufmerksamkeit steuert die Wahrnehmung optischer Gegenstände, Neuronale Protokolle visueller Wahrnehmung bestimmen nach einem Modell von Sokolow (1975) grundsätzlich über die Verarbeitung visueller Information. Die nervengeleitete Eingabe visueller Reize wird in der Hirnrinde (Kortex) analysiert. Ein „Modell" wird gebildet.

Jede neue Reizeingabe wird mit diesem Model( einer Kombination früherer neuronaler Protokolle, „verglichen". Wird der Reiz als „neuartig", als „nicht passend" analysiert, löst das Orientierungsreaktionen im Kortex, aber auch im Körper aus. Der „passende", nicht als neuartig analysierte Reiz löst Impulse aus, die diese Reaktionen hemmen.

Neuere Forschungen der Neurophysiologie und -psychologie legen den Schluß nahe, das Vorstellen eines Gegenstandes aktiviere dieselben Gehirnregionen wie seine reale Wahrnehmung. Observation und Imagination sind also sehr wahrscheinlich bereits physiologisch eng verbunden.

Beim visuellen Vorstellen, der Imagination, werden nach einem plausiblen Modell von Damasio & Damasio (1994) im Gedächtnis nicht die „Abbilder“ von Objekten oder Personen abgerufen, die dort gespeichert wären. Eine Art von abstraktem Begriff aktiviert Erregungsmuster (neuronale Protokolle), die real wahrgenommene Gegenstände ausgelöst haben: „Vom Sprachzentrum verläuft die Gedächtnisspur rückwärts zum Ursprung" (Frankfurter Allgemeine Zeitung „Natur und Wissenschaft“ vom 06.04.1994, S. 4).

Visuelles Erinnern ist also offenbar eng mit Sprachverfügung verkettet. Bilder realer Wahrnehmung werden „gedacht“ wenn sie gespeichert oder erinnert werden sollen. Im Protokoll der durch sie ausgelösten Nerventätigkeit werden sie ganz basal „auf den Begriff“ gebracht.

Es leuchtet unmittelbar ein, wie wichtig frühes verbindendes Training von Bildwahrnehmung und zunächst einfachster Artikulation der erlebten visuellen Reize für eine persönliche Synthese von Schrift- und Bildkultur ist. Gleichzeitig zeigt sich, welche Bedeutung zumindest sprachnahe optische Erinnerungsbestände für das Verarbeiten visueller Information gewinnen.

Gespeicherte Anschauung als optisches Repertoire prägt die Verarbeitung weiterer realer Bilder: Der Vorwurf nur optischer, leerer Berieselung durch das Fernsehen wird sinnlos wie der, wir seien beim Fernsehen „passiv". Experimente haben gezeigt, daß wir unwillkürlich Bilder begrifflich einordnen, deuten. Wollten wir uns, gegen diese Funktion unseres Bewußtseins, allein dem Reizcharakter bewegter Bilder überlassen, brauchten wir für diese Askese von den verstehenden Bewußtseinsleistungen mehr Kraft als nötig ist, dieses „Verstehen" gegebenenfalls wie einen Motor im Leerlauf „mitlaufen" zu lassen.





Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Rechteinhabers unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und die Speicherung und Verarbeitung in elektronischen Systemen.

62