Foto: Jennifer Sanchez

„Wir kombinieren und gewichten alle verfügbaren Wahlumfragen zu einer Gesamtprognose“

Ein Gespräch mit Dr. Marcus Groß

Wie bewerten sie den aktuellen Zustand der Wahlumfragen?

Die Wahlumfragen stehen derzeit vor mehreren Problemen. Das größte ist die schwindende Antwortbereitschaft („Response-Verhalten“) in Kombination mit der schwierigen Erreichbarkeit aller gesellschaftlichen Gruppen. So besitzen immer weniger Haushalte ein Festnetztelefon und sind daher für Institute, die diese Methodik verwenden, entsprechend nicht erreichbar. Dementsprechend muss mit komplexer Methodik und Gewichtung gearbeitet werden, um die fehlende Repräsentativität sowie Verzerrungen auszugleichen.

Dennoch sind die Wahlumfragen besser als oft unterstellt, da eine Prognose niemals exakt sein kann und immer mit einem Fehler behaftet sein wird. Zum Beispiel kann sich kurz vor der Wahl durch bestimmte Ereignisse die politische Stimmung noch ändern. Für die Beurteilung der Aussagekraft und Qualität einer Wahl-Prognose ist aber die Veröffentlichung von realistischen Fehlerbereichen essentiell.

„Zukünftige, wahlentscheidende Ereignisse lassen sich kaum vorhersagen“

Was unterscheidet den Ansatz von INWT Statistics von anderen Umfragesystemen?

Unsere Methodik kann man als „Poll-Pooling“ bezeichnen, eine Methode die der bekannte US-Statistiker Nate Silver bereits mehrmals erfolgreich für die US-Wahlen genutzt hat. Dabei kombinieren und gewichten wir alle verfügbaren Wahlumfragen zu einer Gesamtprognose. Wir geben dazu eine Langfristprognose für die Bundestagswahl selbst ab, indem wir kurzfristige und langfristige Trends optimal kombinieren. Empirisch hat sich nämlich gezeigt, dass der Effekt von politischen Ereignissen auf die Wählerstimmung mittel- bis langfristig wieder etwas nachlässt. Ein Beispiel ist die Nominierung von Martin Schulz als Kanzlerkandidat. Der sogenannte Schulz-Effekt hat wieder deutlich nachgelassen.

Zusätzlich kommunizieren wir offensiv die Fehlerbereiche unserer Prognosen, d.h. wie genau ist unsere Prognose. Zu diesem Zweck geben wir 80%-Fehlerbereiche aus. Mit einer Wahrscheinlichkeit von 80% wird das tatsächliche Wahlergebnis also in diesem Bereich liegen. Weiterhin erlaubt es unser Modell Wahrscheinlichkeiten für bestimmte Ereignisse anzugeben, wie z.B. „Bekommt Rot-Rot-Grün eine rechnerische Mehrheit?“ „Schafft es die AfD in den Bundestag?“ „Bekommt die SPD mehr als 30% der Stimmen?“ oder „Bleibt Angela Merkel Kanzlerin?“ Wie realistisch ein Ereignis ist, kann man so quantifizieren.

Es gibt im Wesentlichen also drei Unterschiede: Wir erstellen eine Prognose für die eigentliche Bundestagswahl im September und nicht für eine imaginäre Bundestagswahl am nächsten Sonntag, wir geben explizit die Unsicherheiten bzw. Fehlerintervalle unserer Prognosen an, denn eine gut Prognose muss immer eine Einschätzung der eigenen Genauigkeit angeben und wir können für verschiedene Ereignisse durch unseren mathematisch-statistischen Ansatz Wahrscheinlichkeiten angeben.

Sie wollen mit ihrer Analyse in die Zukunft blicken, wie genau funktioniert die Methode dahinter?

Die Zukunft vorhersagen können wir natürlich nicht, jedoch verbinden wir aktuelle und historische Daten mit einer Abschätzung der zukünftigen Fluktuation des Wahlverhaltens im Zeitverlauf. Je weiter man in die Zukunft prognostiziert, desto größer ist natürlich die Unsicherheit, jedoch kommunizieren wir diese Unsicherheit explizit.
So haben aktuelle Themen natürlich einen Einfluss auf den Wahlausgang, insbesondere wenige Wochen vor der Wahl. Zukünftige, wahlentscheidende Ereignisse dagegen lassen sich kaum vorhersagen, was dazu führt, dass eine perfekte Prognose oder Vorhersage naturgemäß nicht möglich ist.

In vier Schritten von den Umfragen

Wie groß sind die Datenmengen mit denen Sie arbeiten und woher stammen Sie?

Wir nutzen im Wesentlichen die Wahlumfragen aller wichtigen Umfrageinstitute der letzten 20 Jahre sowie natürlich die Ergebnisse der Bundestagswahlen. Insofern ist unsere Wahlprognose (derzeit noch) nicht im eigentlichen Sinne dem Feld „Big Data“ zuzuordnen.

„Das Nutzen von Daten aus dem Internet ist nicht notwendig und nicht vorgesehen. “

 

Können Sie sich vorstellen auch personenbezogene Daten aus dem Internet zu nutzen um Wahlen vorherzusagen?

Aufgrund unserer Geschichte unterliegt der Umgang mit personenbezogenen Daten in Deutschland strengen gerichtlichen Regeln und die entsprechenden Daten genießen einen hohen Schutz. Das halte ich durchaus für richtig. Das von uns entwickelte Modell basiert daher ausschließlich auf den Umfragen der Meinungsforschungsinstitute. Das Nutzen von Daten aus dem Internet ist nicht notwendig und nicht vorgesehen.

Überhaupt bin ich bezüglich der Social Media Daten etwas vorsichtiger. Denn obwohl die Rolle von Social Media in Bezug auf den Brexit oder die Wahl von Donald Trump als US Präsident teilweise sehr hoch angesetzt wird, ist es aufgrund von auf diese Weise gewonnen Daten schwierig ein repräsentatives Bild der politischen Meinungen bspw. der Bevölkerung Deutschlands zu bekommen.

Zur Person

Dr. Marcus Groß ist Statistiker und Experte für Predictive Analytics bei IWNT Statistics, einem Unternehmen für Data and Analytics.

Foto: Jennifer Sanchez

Mehr zu dem Thema