Dienstag, 7. August 2018

Wie man einen garantiert erfolgreichen Film dreht ...

... weiß natürlich niemand, denn sonst würden ja (zumindest im kommerziellen Sektor) nur noch lauter erfolgreiche Filme entstehen. Bekanntlich ist das bis jetzt nicht der Fall. Aber vier in England tätige Forscher glauben, der Antwort einen großen Schritt näher gekommen zu sein. Marco Del Vecchio von der University of Cambridge, Alexander Kharlamov und Glenn Parry, beide von der University of the West of England in Bristol, sowie Ganna Pogrebna von der University of Birmingham und vom Alan Turing Institute in London, haben dazu über 6000 Filme nach bestimmten Kriterien hin untersucht und ihre Ergebnisse kürzlich veröffentlicht. Dafür benutzten sie Methoden der computergestützten Sprachanalyse (Natural Language Processing, NLP) und komplexe Statistik. Eine vorläufige Version ihrer Arbeit präsentierten sie im Juli 2017 auf einem Forschungsseminar, die endgültige Fassung unter dem Titel The Data Science of Hollywood: Using Emotional Arcs of Movies to Drive Business Model Innovation in Entertainment Industries erschien im Juli 2018 in der Cornell University Library.

Worum geht es? Der Schlüsselbegiff im Titel und in der ganzen Arbeit ist emotional arcs, also "emotionale Bögen". Die Autoren führen diesen Begriff auf eine Arbeit zurück, die der eher als Romanautor bekannte Kurt Vonnegut 1981 in seinem Sammelband Palm Sunday veröffentlicht hatte. Man kann narrative Werke wie Romane und Spielfilme daraufhin untersuchen, wie sich die emotionale Befindlichkeit des Helden im Verlauf der Handlung entwickelt. (Begriffe wie "Held" oder "Protagonist" sind hier immer generisch, also geschlechtsneutral gemeint.) Beispielsweise kann sich der Held von bescheidenen Anfängen zu enormen Höhen aufschwingen, aber am Ende abstürzen, so dass er wieder genauso schlecht oder noch schlechter dasteht als am Anfang - die bekannte Geschichte von Aufstieg und Fall. Natürlich geht es auch umgekehrt - der Protagonist fällt in ein tiefes Loch und rappelt sich langsam wieder auf. Solche Entwicklungen lassen sich anschaulich in zweidimensionalen Koordinatensystemen veranschaulichen, in denen die x-Achse die Handlungszeit und die y-Achse Glück und Unglück des Protagonisten repräsentieren. Auch solche Grafiken hat den Autoren zufolge Vonnegut in seinem erwähnten Text als erster verwendet. Ein Forscherteam vom Computational Story Laboratory der University of Vermont hat 1327 literarische Werke (vorwiegend, aber nicht nur, Romane), die im Projekt Gutenberg frei zugänglich sind, mit Methoden des NLP auf solche emotionalen Verläufe hin untersucht und ihre Ergebnisse 2016 veröffentlicht (Andrew J. Reagan et al.: The Emotional Arcs of Stories are Dominated by Six Basic Shapes). Mit Hilfe anspruchsvoller mathematischer und statistischer Methoden identifizierten die Forscher aus Vermont sechs Grundmuster, die fast allen untersuchten Werken zugrunde lagen, und belegten diese mit griffigen Namen:
Rags to Riches - Aufstieg des Protagonisten
Riches to Rags - Fall des Protagonisten
Man in a Hole - Fall und Wiederaufstieg
Icarus - Aufstieg und Fall
Cinderella - Aufstieg, Fall und Wiederaufstieg
Oedipus - Fall, Wiederaufstieg und endgültiger Fall
Die Forscher hatten dazu nur englischsprachige Werke berücksichtigt und mit bestimmten Filtern die Zahl weiter reduziert - wie allgemeingültig diese Resultate sind, sei dahingestellt. Ganna Pogrebna und ihre Mitstreiter untersuchten in ihrer Arbeit nun zwei Fragestellungen: Lassen sich diese sechs Grundmuster auch in Filmen identifizieren, und wie wirken sich diese, statistisch betrachtet, auf den Erfolg der Filme aus? Auch hier wird wieder mathematisches Geschütz aufgefahren: Man findet Zahlenreihen mit bis zu sieben signifikanten Stellen, Methoden wie die diskrete Kosinustransformation (DCT) und eine Formel wie diese:


Untersucht wurden 6174 Filme. Da das Datenmaterial, wie in der Studie von 2016, in schriftlicher Form vorliegen musste, wurden dazu englischsprachige Untertiteldateien von Opensubtitles.org herangezogen. Weitere Informationen wurden von der IMDb sowie zu Einnahmen und Kosten der Filme von The Numbers bezogen. Aus zunächst nicht weniger als 156.568 Untertiteldateien wurden solche ausgewählt, zu denen auch die Daten zu (geschätzten) Produktionskosten und zu einheimischen und weltweiten Einspielergebnissen vorlagen. "Einheimisch" bedeutete in den meisten (aber nicht allen) Fällen: in den USA. Nach einigen weiteren Einschränkungen, die eine möglichst hohe Qualität der Untertitel sicherstellen sollten, ergaben sich schließlich die 6174 berücksichtigten Filme.

Die Vorgehensweise der Autoren (Abbildung 3 in der Originalarbeit)
Dieser Datenkörper wurde dann mit einem geeigneten Programmpaket untersucht. So wurde jedem Film eine entsprechende Kurve des emotionalen Verlaufs zugeordnet, und zwar mit einer zeitlichen Auflösung von jeweils einem Prozent der Laufzeit. Oder anders ausgedrückt, in jedem Film wurde genau 100 Mal gemessen, wie gut es dem Protagonisten gerade geht. Und schließlich wurden diese über 6000 Einzelergebnisse einer statistischen Gesamtschau unterworfen (und hier wird die Mathematik richtig kompliziert und zu hoch für mich). Das Ergebnis zur ersten untersuchten Frage ist eindeutig: Die genannten sechs Kategorien von emotional arcs lassen sich auch in Filmen identifizieren. Jeder Versuch einer anderen Einteilung (versuchsweise wurden auch 4, 8, 10 und 12 Cluster statt 6 getestet) ergibt schlechtere statistische Übereinstimmungen.

Die sechs Grundmuster - links die Grafiken, rechts jeweils drei Beispiele (Abb. 4 in der Originalarbeit)
Beim Erfolg der Filme wurden nicht nur die Einspielergebnisse erhoben, sondern auch Oscars und sonstige Filmpreise, Kritiker- und Publikumsmeinungen berücksichtigt (diese Daten wurden der IMDb entnommen). Das Hauptaugenmerk lag aber auf dem kommerziellen Erfolg. Beim Brutto-Einspielergebnis auf dem einheimischen Markt ergab sich folgende Reihenfolge:
Man in a Hole - 37,48 Mio. Dollar pro Film
Cinderella - 33,63 Mio. Dollar
Oedipus - 31,44 Mio. Dollar
Icarus - 30,57 Mio. Dollar
Riches to Rags - 29,94 Mio. Dollar
Rags to Riches - 29,71 Mio. Dollar
(Durchschnitt 32,61 Mio. Dollar)
Für den weltweiten Einspielerfolg lagen nicht in allen Fällen Daten vor, aber die Autoren konnten zeigen, dass sich die Ergebnisse für den einheimischen und den weltweiten Erfolg generell nicht signifikant unterscheiden (abgesehen von einem Skalierungsfaktor - der weltweite Gewinn ist natürlich immer größer als in einem bestimmten Land). Die durchschnittliche Filmlänge liegt übrigens in allen sechs Kategorien zwischen 108 und 110 Minuten, hat also keinen Einfluss auf das Ergebnis. In etlichen Presseberichten über die Studie wurde als Fazit hervorgehoben, Man in a Hole sei die Formel für einen erfolgreichen Film, was natürlich eine grobe Vereinfachung darstellt. Außerdem ist das bei weitem nicht das einzige Ergebnis. So zeigt sich etwa bei den IMDb User Ratings ein anderes Bild:
Rags to Riches - 6,64
Icarus - 6,54
Oedipus - 6,52
Riches to Rags - 6,52
Cinderella - 6,51
Man in a Hole - 6,45
(Durchschnitt 6,52)
Die Unterschiede sind nicht groß, aber (wie die Autoren nachweisen) statistisch signifikant. Und ausgerechnet Man in a Hole schneidet hier am schlechtesten ab, während diese Kategorie bei der Anzahl der abgegebenen User Ratings sehr deutlich führt, ebenso bei der Zahl der Rezensionen (User Reviews), wenn auch weniger deutlich. Filme der Kategorie Man in a Hole sind also nicht etwa deshalb so erfolgreich, weil sie das Publikum am zufriedensten zurücklassen, sondern eher weil sie am meisten Aufmerksamkeit erregen und zu Diskussionen führen. Ähnlich verhält es sich mit den Kritikermeinungen (gemessen am IMDb Meta Score) - auch hier schneidet Man in a Hole am schlechtesten ab. All diese und noch mehr Zusammenhänge (beispielsweise, was Filmpreise betrifft) haben die Autoren mit Methoden wie der OLS-Regressionsanalyse (gewöhnliche Kleinste-Quadrate-Methode) abgesichert - wie oben schon erwähnt, kann man in der Arbeit einige größere Zahlenkolonnen studieren. Insbesondere wenden sich die Autoren noch der Frage zu, inwiefern das Einspielergebnis nicht nur vom emotional arc, sondern auch vom Budget abhängt. Denn die oben angeführte Reihenfolge, mit Man in a Hole an der Spitze, ist ein Durchschnittswert für billige und teure Filme, muss aber nicht unbedingt für billige und für teure Filme gleichermaßen gelten. Dazu wurden die Filme in acht Budget-Klassen eingeteilt, von "unter einer Mio. Dollar" bis "über 100 Mio. Dollar". Es stellte sich heraus, dass bei Man in a Hole und Rags to Riches der zu erwartende Gewinn relativ linear vom Budget abhängt, während es bei den anderen vier emotional arcs günstige und ungünstige Budget-Fenster gibt. Ferner untersuchen die Autoren auch noch den Zusammenhang von Einspielerlösen, emotional arc und Genre der Filme. Es kamen dabei die 22 Genre-Kategorien der IMDb zum Einsatz. Ich will es aber nun hier bewenden lassen - wer noch mehr Details wissen will, muss die Studie selbst lesen.

Korrelationen zwischen (geschätztem) Budget und Brutto-Einnahmen, oben auf dem
einheimischen Markt und unten weltweit (CI steht für Konfidenzintervall)
(Abb. 5 in der Originalarbeit)
Die letztgenannten beiden Aspekte der Arbeit könnten von Studiobossen und ihren Buchhaltern aufmerksam studiert werden (falls diese den "Eierköpfen" aus der Wissenschaft überhaupt vertrauen). Es sei aber nochmals betont, dass es sich im Wesentlichen um eine Studie über Hollywoodfilme handelt. Kein Mensch weiß, wie das, um nur ein Beispiel zu nennen, mit Bollywood aussieht. Und wenn ein Film erst mal gedreht wird, dann spielen solche Dinge wie Regie, Schauspieler, Schnitt oder Musik ja auch noch eine Rolle. Und es wird auch weiterhin erfolgreiche und weniger erfolgreiche Werbekampagnen geben.

In einem Artikel im Guardian wird Ganna Pogrebna, die Sprecherin (correspondig author) der Gruppe, mit dem Satz "We are not trying to kill the film industry" zitiert, der so verkürzt etwas merkwürdig klingt. Damit gemeint war (wie Pogrebna mir freundlicherweise erklärt hat), dass mit der vermeintlichen Wunderformel Man in a Hole nicht die Kreativität in der Filmindustrie untergraben werden soll.

Das letzte Wort sollen die Autoren der Studie haben:

"What are the implications of our result on the business models of the entertainment industry? On the one hand, it may appear that when evaluating movie scripts, motion picture production companies should opt for scripts offering Man in a Hole emotional journeys. Yet, on the other hand, this would be an oversimplification of our results. We show that when emotional arcs are combined with different genres and produced in different budget categories any of the 6 emotional arcs may produce financially successful films. Therefore, a careful selection of the script-budget-genre combination will lead to financial success."

Kommentare:

  1. Höhere Mathematik bei diesen stark erhöhten Temperaturen – ich glaube, ich werde mich an die ganzen 33 Seiten Originalpaper wahrscheinlich erst bei kühlerem Wetter wagen können. Insofern danke, dass du die Ergebnisse so kompakt zusammengefasst hast.
    Meine erste Reaktion wäre wohl zu sagen, dass Filme mit multiplen Protagonisten Kassengift sein müssten – oder vielleicht alternativ: zu komplex, um selbst mit höherer Mathematik greifbar zu sein (mir fiel spontan LA RÈGLE DU JEU ein, der ja tatsächlich gefloppt war). Nicht-linear erzählte Filme oder Filme mit extrem wenigen Dialogen fallen da wohl auch flach – also: als Berechnungsgrundlage oder Kassenschlager.
    Das paraphrasierte Zitat von Ganna Pogrebna in dem Guardian-Artikel fand ich allerdings ganz interessant: von wegen "Die Formel nutzen für Erfolgsfilme, damit es eine Sicherheit gibt, um nebenher Experimenterelles produzieren zu können." Vielleicht also die Formel für ein neues "New Hollywood"?
    Intuitiv hätte ich GROUNDHOG DAY eher als "Man in a Hole" eingestuft. Und DER UNTERGANG als "Ödipus" oder "Riches to Rags".

    AntwortenLöschen
    Antworten
    1. Ja, bei Filmen mit mehreren gleichberechtigten Protagonisten wird es schwierig. Ich nehme an, dass der Algorithmus da einfach drüberfährt und so tut, als wäre da nur ein Held. Das ganze ist ja ausgetüftelte Statistik, aber keine künstliche Intelligenz. Aber wahrscheinlich sind diese Ausnahmen so selten, dass die Qualität des Gesamtergebnisses dadurch nicht beeinträchtigt wird. DIE SPIELREGEL ist natürlich ein Extremfall, auch wenn es in neuerer Zeit auch gelegentlich sowas gab, wie Altmans GOSFORD PARK.

      Filme mit extrem wenig Dialog sind sogar explizit ausgeschlossen, indem nur Untertitel mit mindestens 10.000 Zeichen berücksichtigt wurden (siehe das Ablaufdiagramm im Bild oben, und im Text des Originalartikels wird es auch erwähnt). Das soll eigentlich sicherstellen, dass nur Spielfilme und keine Kurzfilme berücksichtigt werden. Aber Spielfilme, in denen das große Schweigen ausbricht, trifft es dann halt auch.

      Dass man mehr Geld für Experimentelles übrig hat, wenn man im Mainstream den finanziellen Erfolg sicherer programmieren kann, klingt ja in der Theorie gut - aber ob es auch so kommt? Wobei ich nicht abstreite, dass es überall Leute gibt, die das (ohne Computerhilfe) schon immer so gemacht haben. Atze Brauner beispielsweise, der gerade 100 wurde und deshalb mit eineinhalb Dokus im Fernsehen geehrt wurde (die zweite war nur eine aufbereitete Version der ersten). Aber ein zweites New Hollywood? Hm.

      Bei DER UNTERGANG ist halt die Frage, wer der "Held" ist - Hitler oder Traudl Junge? Ich nehme doch stark an, dass sich die Einordnung bei "Man in a Hole" auf Junge bezieht. Aber wie gesagt - solche Entscheidungen trifft nicht irgendwer bewusst, sondern das ergibt sich halt von selbst aus der Statistik.

      Noch ein kleiner Nachtrag zu Vonnegut: Der fragliche Text von ihm war seine Abschlussarbeit in Anthropologie an der Universität von Chicago - mit der er durchgefallen ist. Hier auf Youtube gibt es einen kleinen Ausschnitt eines Vortrags von ihm über seine Version der emotional arcs.

      Löschen
    2. New "New Hollywood" ist mir wohl eingefallen, weil mir Monte Hellmans TWO-LANE BLACKTOP im Hinterkopf schwirrte. Der hat vier quasi gleichberechtigte Charaktere und sehr wenige Dialoge und ist bei Universal Pictures einfach mal so durchgeschlüpft. Aber ja, es ist tatsächlich unwahrscheinlich, dass Hollywood diese Berechnungen in diesem Sinne nutzen wird und wir außer mit noch mehr Comicverfilmungen (im "Man in the Hole"-Modus) bald mit Spannendem und Experimentellem überschüttet werden.
      Letztens lief auch Jess Francos SIE TÖTETE IN EKSTASE auf arte – die Zusammenarbeit mit Franco war eines der schönen "Nebenstränge" in Brauners Schaffen. Wenn es, bei anderen Projekten, zu kontrovers wurde, hat Brauner auch mal einen Film in den Giftschrank gesperrt – aber das ist natürlich eine andere Sache und dazu gibt es zufälligerweise bald mehr in meinem Bericht von Terza Visione zu lesen.
      Der Ausschnitt mit Vonnegut ist ja großartig :-D

      Löschen
    3. Auch von mir wird es bald etwas über Brauner und seinen Giftschrank geben - hat aber nichts mit Italien zu tun.

      Löschen

Wenn Du einen Kommentar hinterlässt und mit einem Google-Account eingeloggt bist oder deinen Namen (und ggf. Website) eingibst, werden diese Daten (und unter Umständen auch weitere personenbezogene Daten, wie z.B. deine IP-Adresse, auch bei anonymen Kommentaren) an Google-Server übermittelt. Mehr Infos dazu findest du in unserer Datenschutzerklärung und in der Datenschutzerklärung von Google.

Wenn Du über einen Google-Account eingeloggt bist, kannst du durch Ankreuzen der Checkbox "Ich möchte Benachrichtigungen erhalten" die Kommentare zu diesem Post abonnieren. Benachrichtigungs-Emails werden bei weiteren Kommentaren automatisch an die Email-Adresse verschickt, mit der Du im Google-Account eingeloggt bist. Das Abonnement kann jederzeit wieder gekündigt werden über den Link "Abmelden" in der Benachrichtigungs-Email.