Wer gewinnt die Bundestagswahl 2017?

2017-03-20by Marcus Groß

"But one of the reasons to build a model — perhaps the most important reason — is to measure uncertainty and to account for risk. If polling were perfect, you wouldn’t need to do this." Why FiveThirtyEight Gave Trump A Better Chance Than Almost Anyone Else
Nate Silver auf FiveThirtyEight.com

Prognose zur Bundestagswahl 2017

[Letztes Update: 22.09.2017]

Die Grafik zeigt die Wahlprognose von INWT Statistics für die Bundestagswahl 2017. Auf der y-Achse ist als dicke Linie für alle Parteien der prognostizierte Stimmanteil bei einer (imaginären) Bundestagswahl zu einem der auf der x-Achse abgetragenen Zeitpunkte dargestellt. Der schattierte Bereich um die jeweilige Linie stellt den 80 Prozent-Unsicherheitsbereich dar, d.h., das tatsächliche Wahlergebnis würde mit einer Wahrscheinlichkeit von 80 Prozent innerhalb dieses Bereichs liegen. Im rechten Teil der Grafik sind zwei vertikale Linien zu sehen. Die eine kennzeichnet das Datum, zu dem unsere Prognose erstellt wurde, die andere markiert den Zeitpunkt der Bundestagswahl. Die Unsicherheitsintervalle werden breiter, je weiter die Prognose in die Zukunft reicht. Im Hintergrund sind zusätzlich als dünne Linien die Prognosen der einzelnen Wahlforschungs-Institute abgetragen.

Prognose für das Wahlergebnis: Wahrscheinlichkeitsverteilungen für den Ausgang der Bundestagswahl 2017

Die folgenden Grafiken zeigen die sogenannten Wahrscheinlichkeitsverteilungen für den Ausgang der Bundestagswahl 2017 sowie für die aktuelle Sonntagsfrage für die verschiedenen Parteien. Der wahrscheinlichste Wert, d.h. unsere Prognose für das Wahlergebnis der Bundestagswahl, ist zusätzlich eingezeichnet. Da die Bundestagswahl am 24.09.2017 zeitlich weit hinter dem Zeitpunkt der aktuellen Sonntagsfrage liegt, ist das prognostizierte Ergebnis der Wahl mit einer größeren Unsicherheit behaftet. Die Wahrscheinlichkeitsverteilungen zeigen die komplette Verteilung (100%). Die in den Grafiken visualisierten Werte mit den Grenzen des 80%-Unsicherheitsintervalls sind in der Tabelle enthalten.

Bundestagswahl 2017

Sonntagsfrage

BTW 24.09.2017				Sonntagsfrage
Partei	Prognose	Untere Grenze	Obere Grenze	Prognose	Untere Grenze	Obere Grenze
CDU/CSU	36.2	33.6	39.0	36.2	33.6	39.0
SPD	22.1	19.9	24.4	22.1	19.9	24.4
AfD	10.3	8.9	11.9	10.3	8.9	11.9
Grüne	7.9	6.8	9.2	7.9	6.8	9.2
Linke	9.4	8.1	10.9	9.4	8.1	10.9
FDP	9.5	8.2	10.9	9.5	8.2	10.9
Sonstige	4.6	3.8	5.5	4.6	3.8	5.5

Bundestagswahl 2017: Wahrscheinliche und nicht so wahrscheinliche Ereignisse

Wir haben die Bundestagswahl 2017 100.000 Mal simuliert und so die Wahrscheinlichkeiten für verschiedene Ereignisse bestimmt.

Ereignis	Wahrscheinlichkeit
Mehrheit für Rot-Rot-Grün	0.0%
Mehrheit für Schwarz-Gelb	9.4%
Mehrheit für Schwarz-Grün	5.3%
Mehrheit für Rot-Grün	0.0%
Mehrheit für ‘Jamaika’ (Schwarz-Grün-Gelb)	99.8%
Mehrheit für ‘Ampel’ (Rot-Gelb-Grün)	0.1%
Mehrheit für große Koalition	100%
FDP kommt in den Bundestag	100%
AfD kommt in den Bundestag	100%
CDU/CSU bekommt mehr als 40% der Stimmen	4.6%
SPD bekommt mehr als 30% der Stimmen	0.0%
SPD bekommt weniger als 20% der Stimmen	10.7%
SPD stärker als CDU/CSU	0.0%
AfD wird drittstärkste Fraktion	61.1%
Sechs Fraktionen im Bundestag vertreten	99.9%
Angela Merkel bleibt Bundeskanzlerin*	99.9%
Martin Schulz wird Bundeskanzler*	0.1%

Die Sonntagsfrage: Wer wird Bundeskanzler? Prognosen zum Ausgang der Bundestagswahl 2017

Nach dem Wahlspektakel in den USA beschäftigt uns nun in Deutschland die Frage „Wer wird es?“, d.h. wer wird am 24. September 2017 Bundeskanzler? Im Gegensatz zu den USA stehen in Deutschland für die Bundestagswahl 2017 ‘nur’ die Prognosen verschiedener Umfrageinstitute zur Verfügung. Diese Wahl-Prognosen haben einen entscheidenden Haken: Sie basieren auf der Annahme, dass am jeweils nächsten Sonntag Bundestagswahl wäre – das ist die sog. Sonntagsfrage. Das heißt, bei den Ergebnissen der Wahlforscher handelt es sich um ein mehr oder weniger gutes Abbild der aktuellen politischen Stimmung in Deutschland und nicht um eine langfristige Prognose. Das wollen wir besser machen! Als Unternehmen für Data Science und Predictive Analytics sind wir darauf spezialisiert, qualifizierte und sehr genaue Vorhersagen für unsere Kunden zu machen. Wir strukturieren große Datenmengen und werten diese mithilfe statistischer Modelle aus. Dazu verbinden wir in unserer täglichen Arbeit praktische Statistikkompetenz mit fundierten wissenschaftlichen Methoden. Mit unseren Modellen können wir die Zukunft zwar nicht vorhersagen. Aber wir können mithilfe der Auswertung von Daten Wahrscheinlichkeiten für alle möglichen Wahlausgänge der Bundestagswahl 2017 bestimmen.

BTW17: Unser statistisches Prognosemodell zur Bundestagswahl 2017

Deshalb haben wir am Beispiel von Nate Silvers Blog FiveThirtyEight.com das Projekt BTW17 ins Leben gerufen. Dabei handelt es sich um ein statistisches Modell zur Bundestagswahl 2017. Unser Prognosemodell basiert auf den Wahl-Umfragen verschiedener Institute und ermöglicht es, sowohl kurz- als auch langfristige Wahrscheinlichkeitsaussagen über alle möglichen Ausgänge der Bundestagswahl 2017 zu treffen. Daraus lässt sich unter anderem ableiten, wie wahrscheinlich eine Bundestagsmehrheit der vieldiskutierten Rot-Rot-Grünen Koalition (sog. R2G-Koalition) ist oder wie wahrscheinlich neben der Großen Koalition aus CDU/CSU und SPD (sog. GroKo) andere Koalitionen sind wie z.B. die Ampel-Koalition oder die Jamaika-Koalition (jeweils unter Beteiligung der FDP). Dabei überzeugen unsere Wahlprognosen mit einer weiteren Besonderheit: Über die einfache Prognose der Stimmenanteile der einzelnen Parteien hinaus haben wir den Fokus auf eine Modellierung des Prognosefehlers gesetzt. Der Prognosefehler beschreibt die Abweichung des vorhergesagten Wahlergebnisses vom tatsächlichen Wahlergebnis. Dabei werden Abweichungen nach oben und nach unten berücksichtigt. Durch die Modellierung des Prognosefehlers ergänzen wir unsere Wahl-Prognosen also um ein realistisches Unsicherheitsintervall.

Data Science und Predictive Analytics im Wahlkampf: Wahl-Prognosen auf Basis statistischer Modelle

Im Vergleich zu absoluten Aussagen wie „Die SPD erhält 27 Prozent der Stimmen“, sind die Aussagen der oben vorgestellten Wahrscheinlichkeitsverteilungen auf den ersten Blick unbefriedigend. Doch wir reden von Wahrscheinlichkeiten und Unsicherheiten da eine Wahl-Prognose das tatsächliche Ergebnis nie sicher vorhersagen kann. Eine Prognose hat niemals den Anspruch eine Wahrsagung zu sein und sollte ihn auch niemals haben. Denn Prognosen sind Aussagen über einen zukünftigen Zustand und damit grundsätzlich mit Unsicherheit verbunden. Diese Unsicherheit kommt einerseits zustande, da die zugrundeliegende wissenschaftliche Methodik in der Praxis selten perfekt umgesetzt werden kann. Beispielsweise sind Umfragen verzerrt, weil bestimmte Wählergruppen in den Wahl-Umfragen überrepräsentiert sind. Andererseits kommt Unsicherheit bei den Vorhersagen von Ergebnissen ins Spiel, weil die Zukunft mangels Informationen eben nun mal unsicher ist. Das haben wir zuletzt bei der Präsidentschaftswahl in den USA im November 2016 festgestellt. In den Umfragewerten lag Hillary Clinton weit vorn, einige Institute bescheinigten ihr sogar eine Wahrscheinlichkeit von 98 - 99%, die erste Präsidentin der Supermacht zu werden. Das Wahlergebnis war am Ende ein anderes. Doch es gab auch etwas realistischere Wahlprognosen.

Prognose zur US-Wahl: Statistisches Modell sagt US-Präsidenten voraus

Einer hatte Trump auf dem Schirm: Der amerikanische Wahlforscher und Statistiker Nate Silver lieferte aus statistischer Sicht die präziseste Prognose. In seiner Wahlprognose zur US-Präsidentschaftswahl lag die Wahrscheinlichkeit für einen Sieg von Donald Trump kurz vor der Wahl zwischen 22 und 34 %. Das bedeutet, bei 100 voraussetzungsgleichen Wahlen wäre Trump erwartungsgemäß 22 bis 34 Mal Präsident geworden. Hört sich gar nicht so wenig an, oder? Kurz vor der Präsidentschaftswahl twitterte Nate Silver, dass folgende drei Szenarien etwa gleich wahrscheinlich sind: 1) solider Sieg für Hillary Clinton, 2) erdrutschartiger Sieg für Clinton, 3) knappe Entscheidung zugunsten von Donald Trump. Zum gleichen Zeitpunkt gingen die meisten US-Medien und US-Meinungsforscher weiterhin davon aus, dass Clintons Einzug ins Weiße Haus ausgemachte Sache sei. Woher hatte dieser Nate Silver diese Informationen und wer ist er eigentlich? Nathaniel Read „Nate“ Silver ist ein Publizist und Statistiker. Öffentliche Aufmerksamkeit erlangte er zunächst durch die Entwicklung von PECOTA: ein Algorithmus, der die Leistung und berufliche Entwicklung von Baseballspielern voraussagte. 2008 gründete Nate Silver den berühmten Blog FiveThirtyEight.com, in dem er eine völlig neue Art der Wahlprognose begründete: Basierend auf historischen Umfrageprognosen (fast) aller existierenden Umfrageinstitute sowie demographischer Daten entwickelte er ein statistisches Modell um u.a. den Ausgang der US-Präsidentschaftswahlen zu prognostizieren. Silvers Vorhersage-Modell bewies sich in der Praxis mehrfach als erstaunlich präzise.

Wahrscheinlicher Wahlausgang 2017: Umgang mit Wahlprognosen

Prognosen werden leider oft missverstanden. Eine Wahlprognose ist wie jede Prognose eine Wahrscheinlichkeitsaussage und keine in Stein gemeißelte Wahrsagung. Das konnten wir bei der US-Wahl mit dem von vielen nicht erwarteten Sieg von Donald Trump deutlich sehen. Das bedeutet:

ein sehr unwahrscheinliches Ereignis kann durchaus eintreten,
ein sehr wahrscheinliches Ereignis muss nicht zwangsläufig eintreten.

Diesen Sachverhalt verdeutlicht das folgende Beispiel aus einem Blogartikel von Übermedien:

“Wenn Sie vor der Wahl lesen, dass Hillary Clinton angeblich eine Wahrscheinlichkeit von 83 Prozent hat, Präsidentin der Vereinigten Staaten zu werden, könnten Sie dann ruhig schlafen, weil Sie wissen, dass Donald Trump keine Chance hat?

Andere Frage: Wenn Ihnen jemand einen Revolver in die Hand drückt, würden Sie Russisch Roulette spielen? Oder wäre Ihnen das Risiko zu groß, die eine Kammer mit der Kugel zu erwischen? Wir alle wissen, wie gefährlich das Spiel wäre: Die [Wahrscheinlichkeit], es zu gewinnen, liegt nur bei 83 Prozent.”

Das Schlechteste an Wahlprognosen: Wie wir mit ihnen umgehen
Stefan Niggemeier, am 13.11.2016

Rot-Rot-Grün, Ampel, Jamaika oder doch wieder Große Koalition? Auch wir können den Wahlausgang 2017 und die endgültige Koalition im Anschluss an die Bundestagswahl nicht vorhersagen. Aber wir sind professionelle Statistiker und treffen Wahrscheinlichkeitsaussagen aufgrund der uns zur Verfügung stehenden Informationen. Da unsere Prognose auf den Umfragewerten der einzelnen Wahlforschungs-Instituten basiert, ist im Umkehrschluss die Güte unseres Vorhersage-Modells von der generellen Qualität dieser Wahlumfragen abhängig. Sollte beispielsweise der Fall eintreten, dass alle Wahl-Umfragen der Institute den Stimmenanteil einer bestimmten Partei überschätzen, so wird auch unser Modell diese Partei tendenziell überschätzen. Allerdings wird bei unserem Ansatz ein solches Szenario durch die modellierten Fehlerbereiche abgedeckt.

Qualität von Wahl-Prognosen zur Bundestagswahl 2017

Für die Beurteilung der Aussagekraft und Qualität einer Wahl-Prognose zum Ergebnis der Bundestagswahl 2017 ist die Herausgabe von realistischen Fehlerbereichen essentiell. Wir geben bei unserer Prognose einen 80 Prozent-Fehlerbereich an. Das bedeutet, dass erwartungsgemäß in 8 von 10 Fällen das tatsächliche Wahlergebnis in diesem Bereich liegt. Die Wahlforschungsinstitute sind bei ihren Vorhersagen zum möglichen Wahlergebnis mit der Veröffentlichung der Fehlertoleranzen bzw. Fehlerbereiche generell sehr zurückhaltend. Dies liegt vor allem daran, dass griffige Interpretationen bevorzugt werden, die sich medial gut einsetzen und verwerten lassen. Dabei bevorzugen sowohl die Presse als auch die Leser und Zuschauer möglichst genaue Vorhersagen und schrecken vor „komplizierten Fehlerintervallen“ zurück. Da die in den Wahlumfragen befragten Personen nicht zufällig aus der Grundgesamtheit ausgewählt werden, ist der Fehlerbereich tatsächlich auch nicht ganz einfach zu berechnen. Die Forschungsgruppe Wahlen z.B. führt Festnetz-Telefonumfragen durch und gewichtet diese Stichprobe anschließend nach Geschlecht, Alter und Bildung (siehe Methodik der Forschungsgruppe Wahlen), um 'Repräsentativität' zu erzeugen. Bei 1250 Befragten werden als 95 Prozent-Fehlerbereichsgröße von den Wahlforschern +/-3 bzw. +/-2 Prozentpunkte bei Parteien mit einem Anteilswert von 40 bzw. 10 Prozent angegeben. Diese Fehlerbereiche wurden mit einer passenden Formel für eine Zufallsstichprobe mit Gewichtung berechnet. Problematisch bei der Gewichtung ist jedoch, dass niemals nach allen wahlentscheidungsrelevanten Merkmalen gewichtet werden kann. Auch andere Umstände können den Fehler vergrößern! Etwa wenn die Befragten bei bestimmten Parteien nicht wahrheitsgemäß antworten oder ihre Wahlteilnahme generell in Frage gestellt ist. Teilweise werden hier Korrekturfaktoren angewandt (dieses Vorgehen ist oft sehr intransparent) um daraus folgende Verzerrungen zu vermindern. Aus Sicht von INWT ist es daher besser, die Fehlerbereiche retrospektiv zu bestimmen d.h. über die Abweichung der Prognosen von den tatsächlichen Wahlergebnissen vergangener Wahlen zu mitteln. Nach unseren Berechnungen liegen die Fehlerbereiche für die Sonntagsfrage für ein einzelnes Institut leicht erhöht bei +/-4 Prozentpunkte bei einem Anteilswert von 40 Prozent und +/-2,5 Prozentpunkte bei einem Anteilswert von 10 Prozent. Mit der retrospektiven Bestimmung von Fehlerbereichen sind wir darüber hinaus in der Lage, Fehlerbereiche für die weiter in der Zukunft stattfindende tatsächliche Bundestagswahl 2017 anzugeben.

Unsere Methodik zur statistischen Modellierung der Wahlergebnisse für die Bundestagswahl 2017

Im Wesentlichen besteht die statistische Modellierung unserer Prognose zur Bundestagswahl 2017 aus vier Schritten:

Schritt 1: Anhand der historischen Umfragewerte und den tatsächlichen Wahl-Ergebnissen der letzten Bundestagswahlen wird für jedes Umfrageinstitut dessen Vorhersagegenauigkeit bestimmt. Zum Beispiel schnitt das Meinungsforschungsinstitut Allensbach bei seinen Umfrageergebnissen durchschnittlich 12 Prozent besser ab als die Wahlforscher von Emnid. Dabei wurde berücksichtigt, wie weit vor der Wahl die letzte Prognose des jeweiligen Instituts abgegeben wurde und eine entsprechende Korrektur durchgeführt. Jedes Wahlumfrage-Institut erhält je nach historischer Prognosegüte einen Gewichtungsfaktor, so dass Meinungsforschungsinstitute mit einer guten Prognosegenauigkeit bei den Umfrageergebnissen einen höheren Einfluss bei der Modellierung haben als schlechter abschneidende Wahlforschungsinstitute.

Schritt 2: Die aktuellen Umfrageergebnisse zur Bundestagswahl 2017 werden zu einem Gesamt-Trend zusammengefasst. Für diesen Trend werden die Qualität sowie eine mögliche Parteienvorliebe der Umfrageinstitute berücksichtigt. Mit der Parteienvorliebe eines Instituts ist die systematische Über- oder Unterschätzung des Wahlergebnisses bestimmter Parteien gemeint. Zum Beispiel liegen die Meinungsforscher von INSA mit ihren Schätzungen des Ergebnisses der CDU/CSU in den zurückliegenden Monaten konstant um 3-4 Prozentpunkte unter den Schätzungen der anderen Wahlforschungsinstitute. Zusätzlich wird der langfristige- und kurzfristige Trend zur optimalen Prognose der Wahlergebnisse der bevorstehenden Bundestagswahl genutzt. Weit vor der Bundestagswahl 2017 wirken sich aktuelle Ereignisse (wie z.B. Parteiskandale) nur in begrenztem Maße auf die Ergebnisse der Wahlen aus. Auf kurze Sicht gesehen ist es hingegen vorteilhaft, aktuelle Trends (egal ob negative oder positive) fortzuschreiben.

Schritt 3: Durch Betrachtung der historischen Wahlergebnisse der früheren Bundestagswahlen wird ein Unsicherheitsintervall für das Ergebnis der jeweiligen Partei ermittelt. Dieses Intervall projizieren wir unter Berücksichtigung der Zeit bis zur nächsten Bundestagswahl auf die prognostizierten Ergebnisse. Dabei werden auch die Korrelationen der Fehler zwischen den Parteien beachtet. Wenn z.B. die Union am Wahlabend schlechter abschnitt als von den Wahlforschern vorausgesagt, bekam die FDP im Gegenzug zumeist mehr Stimmen als erwartet.

Schritt 4: Es werden 100.000 Wahlausgänge simuliert, um die Wahrscheinlichkeiten für mögliche Zusammensetzungen des Bundestags zu bestimmen. Somit berücksichtigen wir Besonderheiten des deutschen Wahlrechts wie z.B. die 5-Prozent-Hürde.

Umfrageergebnisse als Datengrundlage für die Wahl-Prognose

Als Datengrundlage für die Modellierung der Wahl-Prognose zur Bundestagswahl 2017 dienen uns die historischen Umfrageergebnisse der renommierten Meinungsforschungsinstitute Allensbach, Emnid, Forsa, Forschungsgruppe Wahlen, GMS, Infratest Dimap sowie INSA seit der Bundestagswahl 1998 bis heute. Die Umfrageergebnisse der genannten Institute zur Bundestagswahl 2017 sind auf http://www.wahlrecht.de/umfragen/ für jedermann öffentlich zugänglich. An dieser Stelle möchten wir Wilko Zicht und Matthias Cantow herzlich für das Zusammenstellen der Daten danken.

Wie zuverlässig ist unsere Prognose zur Bundestagswahl 2017?

Die Frage, wie zuverlässig unsere Prognose zur Bundestagswahl 2017 ist, ist berechtigt. Wir haben das von uns entwickelte Modell retrospektiv an den vergangenen Bundestagswahlen getestet. Als Maß für die Qualität unseres Vorhersage-Modells nutzen wir die mittlere Abweichung unserer Ergebnisprognosen von den tatsächlichen Wahl-Ergebnissen. Für verschiedene Prognosehorizonte und über alle Parteien hinweg war unser Modell 11 Prozent genauer als der Durchschnitt der letzten fünf Prognosen der Umfrageinstitute und sogar 13 Prozent genauer als die letzte verfügbare Prognose eines beliebigen Meinungsforschungsinstituts.

Prognosen drei Monate vor der Bundestagswahl 2013 (24. 06. 2013)

	CDU/CSU	SPD	Linke	Grüne	FDP	AfD
Bundestagswahl 2013	41.5%	25.7%	8.6%	8.4%	4.8%	4.7%
INWT Prognose	38.9%	26.4%	7.5%	13.4%	5.3%	2.4%
Mittel der letzten 5 Institutsprognosen	39.8%	24.8%	7.4%	14.6%	5.0%	2.2%
Letzte Institutsprognose (INSA)	39.0%	26.0%	7.0%	16.0%	4.0%	2.0%

Bildet man den Mittelwert der absoluten Abweichungen kommt man auf mittlere Abweichungen bzw. Prognosefehler von 2,03 Prozent (INWT-Prognose), 2,13 Prozent (Mittel der fünf letzten Wahl-Umfragen) bzw. 2,58 Prozent (letzte verfügbare Prognose). Setzt man diese Werte ins Verhältnis, so war die INWT-Prognose gegenüber den Vergleichsprognosen 5 Prozent (Mittel der letzten fünf Wahlumfragen) bzw. 21 Prozent (letzte verfügbare Wahlprognose) besser.

Beispielrechnung für INWT:
(|38.9-41.5|+|26.4-25.7|+|7.5-8.6|+|13.4-8.4|+|5.3-4.8|+|2.4-4.7|)/6 = 2.03 %