Hypothesentest – am aktuellst möglichen Beispiel

(zoon politicon) Begriff, Aussage, Hypothese, Test. Das sind die vier Grundtermini der empirischen Forschung, auch der entsprechenden Politikforschung. Wissenschaftstheoretisch kann das zu zwei Bewertungen der Annahmen führen: die Verifizierung oder die Falsifizierung der Hypothese. Im ersten Fall gilt als empirisch bestätigt, und man kann unverändert mit ihr weiterarbeiten. Im zweiten Beispiel wurde sie wiederlegt, und man sollte sie modifizieren.

verifalsi.gif

Was damit gemeint ist, sei a heute aktuellst möglichen Beispiel aufgezeigt: Ich nehme die Entwicklung der Meinungsbildung vom Zeitpunkt der letzten Umfrage bis zum Abstimmungstag. Die Beispiele stammen aus der jüngsten Umfrage für die SRG SSR idée suisse Medien, die gfs.bern realisiert hatte, und den Abstimmungsergebnissen zu den Volksentscheidung vom 24. Februar 2008.

Dabei geht es um zwei verschiedene Formen der Meinungsbildung: den Meinungsaufbau bei unschlüssigen BürgerInnen mit Teilnahmeabsichten, und den Meinungswandel bei Menschen, die sich äussern wollen, eine anfängliche Entscheidungsabsicht haben, diese aber im Verlaufe des Prozesses der Meinungsbildung ändern.

Die Hypothesen wurde aus dem Dispositionsansatz abgeleitet. Sie sind für Volksinitiativen und Behördenvorlagen unterschiedlich:

Hypothesen zur Meinungsbildung bei Volksinitiativen kurz vor der Abstimmung
Bei Volksinitiative gehen wir davon aus, dass die Entscheidungen positiv prädisponiert sind, wenn Initiativen ein Bevölkerungsproblem aufnehmen, dass sich die Meinungsbildung aber negativ entwickelt, wenn sie die Kampagne vom Problem hin zur seiner Lösung und ihren Konsequenzen verlagert. Konkret erwarten wir, dass sich das Nein während des Abstimmungskampfes aufbaut, und sich das Ja maximal hält, meist sogar zurückgeht. Aus Unentschiedenen werden bei Volksinitiativen während der Schlussphase GegnerInnen.

kjltrend.JPG

Die Grafik hierzu zeigt, dass sich die Erwartungen vollständig erfüllten. Der Nein-Anteil stieg von 55 auf 68 Prozent, der Ja-Anteil verringerte sich von 34 auf 32 Prozent. Der Anteil Unschlüssiger in der letzten Umfrage kann vollständig dem Nein-Lager zugerechnet werden.

kjlsprachen.JPG

Die Hypothese wird also voll bestätigt, und zwar nicht nur auf nationaler Ebene, sondern auch nach Sprachregionen.

Hypothesen zur Meinungsbildung bei Behördenvorlagen kurz vor der Abstimmung
Der erwartete Mechanismus bei Behördenvorlagen ist anders. Wir gehen hier nicht zwingend von einer positiven Prädisponierung bei Volksinitiativen aus. Behördenvorlagen kommen zur Abstimmung, auch wenn sie kein gravierende Probleme aus Bevölkerungssicht behandeln.
Vielmehr bildet sich die Meinungsbildung während des Abstimmungskampfes aufgrund der Kampagnen beider Seiten. In der Schlussphase gehen wir davon aus, dass die Nein-Seite mehr Unschlüssige anzieht, als die Ja-Seite; das Mass indem dies geschieht ist aber offen.

usr-trend.JPG

Im konkreten Fall, der Unternehmenssteuerreform erhöhte sich der Ja-Aneil um knapp 5 Prozentpunkte, jener der Gegner um gut 18 Prozentpunkte. Die Erwartung, dass sich die Unschlüssigen in beide Richtungen verteilen wird auch hier erfüllt.

usr-sprache.JPG

Die Verifikation der Hypothese gelingt generell gut, nach Sprachregionen in zwei von drei Fällen. Einzig in der italienischsprachigen Schweiz beobachten wir ein anderes Phänomen. Der Ja-Anteil nimmt hier leicht ab. Das kann man als partielle Widerlegung interpretieren.

Die Falsifizierung führt hier aber nicht zu einer allgemeinen Modifikation der Hypothese, weil die Widerlegung nur eine Untergruppe betrifft. Sie wirft aber neue Fragen auf, die zu testen sind: Kann der Spezialfall in der italienischsprachigen Schweiz regelmässig nachgewiesen werden? – Dann müsste man annehmen, dass die Eigenheiten der Meinungsbildung im Tessin anderes als in der Schweiz verlaufen. Ist dies nicht der Fall? – Unter dieser Bedingung wird man folgern, dass es sich um eine Ungenauigkeit der Befragung handelt, die sich zum Beispiel aus der geringeren Befragtenzahl in der italienischsprachigen Schweiz ergibt.

Testbilanz
Alles in allem sind aber die Hypothesen zur Meinungsbildung bei Volksabstimmung in den letzten Wochen, die aus dem Dispositionsansatz abgeleitet werden können, ausgesprochen robust. Sie wurden hier etwas vereinfacht diskutiert, weil wir die Effekte durch die Mobilisierung nicht berücksichtigt haben. Das ist angesichts der geringen Verschiebungen vertretbar.

5042037.JPG

Mehr noch: Die Hypothesen sind unterschiedlich, je nachdem ob es sich um einen Behördenvorlage oder eine Volksinitiative handelt. Das kann man nur aus dem Dispositionsansatz ableiten, weil er von unterschiedlichen Vorbestimmtheiten von Initiativen und Behördenvorlagen aufgrund der Problemdefinition ausgeht.

Und dann noch ganz zum Schluss: Sie entsprechen nicht unbedingt dem common sense, sondern der wissenschaftlich erschlossenen Realität. Diese ist, weil sie den Grad an Rationalität in der politisch-medialen Praxis erhöht, klar besser als die Meinungen über sie!

Claude Longchamp

Hochrechnungen von Volksabstimmungen und Wissenschaftstheorie

(zoon politicon) Gestern hat das Team von gfs.bern zum 48. Mal eine Hochrechnung zu eidgenössischen Volksabstimmungen durchgeführt. Der Erfolg lässt sich sehen:

. Um 1330 wurde das Ergebnis zur Kampfjetlärm-Initiative auf 8 Promille genau vorausgesagt, und
. um 1400 hielten wir das Resultat zur Unternehmenssteuerreform auf 5 Promille genau fest.

Letzteres war allerdings genau 50:50 für das Ja und das Nein, was einem Patt entsprach. Die Auflösung, ob wir eine Zustimmung oder Ablehnung erwarten, gelang 1520, als wir mit ungerundeten Zahlen von 50,4 Prozent ausgingen, was dann 1 Promille falsch war.

Hochrechnungen wie die gestrige basieren auf einer praktischen Umsetzung des des einfachen logischen Vorgehens, das seit 1948 als Hempel-Oppenheim-Schema in der Wissenschaftstheorie bekannt ist. Es unterscheidet

. die zu erklärende Variable (exemplandum),
. die erklärende Variable (exemplans) und
. einer Tatsache (Antezendens).

Die abhängige Variable ist jene, die wir prognostizieren wollen, also das Ergebnis der kommenden Volksabstimmung auf nationaler (Volksmehr) und kantonaler Ebene (Ständemehr). Die erklärende Variablen ist das Stimmverhalten (wiederum Volks- und Ständemehr) bei Vergleichsabstimmungen. Und die Tatsache sind die eintreffenden Gemeindeergebnisse.

Wir verwenden jedoch nicht alle Gemeinden, weil das zu wenig schnell wäre. Vielmehr setzen wir auf Gemeinden, die sich bei früheren Abstimmungen als repräsentativ für ihren Kanton erwiesen hatten.

Massgeblich ist es deshalb, die Referenzabstimmungen zu finden, die eine sinnvolle Gemeindeauswahl im Voraus erlaubt. Das ist gar nicht so einfach; es sind die folgenden Schritte nötig:

. Welche Annahmen zum ungefähren Abstimmungsausgang national lassen sich machen?
. Welches räumliche Konfliktmuster kann angenommen werden?
. Welche Abstimmungen in jüngerer Zeit erfüllen beide Erwartungen einigermassen gut?

Geleistet wird das mit statistischen Vergleichen. Im Idealfall gibt es eine Referenz, meist braucht es aber einen Mix aus mehreren. Die Entscheidung wird zirka 4 Wochen vor der Abstimmung getroffen, wenn der Abstimmungskampf begonnen hat, und wenn erste Umfragen zu den Entscheidungsabsichten und dem Konfliktmuster vorliegen. Die Gemeindeauswahl erfolgt danach.

Am Abstimmungstag selber treffen dann die Gemeindeergebnisse als unsere neue Tatsachen ein. Sie werden auf den Kanton hochgerechnet, das gibt das Ständemehr, wenn es nötig ist. Die Kantonshochrechnungen werden dann auf die nationale Ebene hochgerechnet. So sind alle Informationen zusammen, die es für die zu erklärende Variable im Hempel-Oppenheim-Schema braucht. Das ist dann das Ergebnis, das veröffentlicht wird.

Claude Longchamp

SRG Hochrechnung zu eidgenössischen Volksabstimmungen

(zoon politicon) Die Hochrechnung für die SRG SSR idée suisse Medien ist eine typische Eigenentwicklung des Forschungsinstituts gfs.bern. Das Produkt wird seit 16 Jahren angeboten; aktuell wurde die bestehende Zusammenarbeit wieder verlängert.

Proben für die Hochrechung: die SF DRS Crew an einem frühen Abstimmungssonntag

Auf nationaler Ebene ist die Dienstleistung mit der denkwürdigen Volksabstimmung über den Beitritt der Schweiz zum EWR entstanden. Wichtigstes Ziel war es, die Bekanntgabe des verbindlichen, aber nicht offiziellen Abstimmungsergebnisses merklich zu beschleunigen. Das Produkt gefiel damals so gut, dass wir seither lückenlos an jedem gesamtschweizerischen Abstimmungstag eine Hochrechnung realisiert haben.

Basisinformation

Die Hochrechnung basiert auf einer ersten Extrapolation von realen Gemeindeergebnissen auf die Kantonsebene, und auf einer zweiten Extrapolation von den Kantonen auf den Bund.

Entscheidend ist dabei die Auswahl der Gemeinden. Sie werden so bestimmt, dass sie für ihren Kanton repräsentieren. Um Zufälligkeiten auszuschliessen, werden aber in der Regel nur Gemeinden von einer mittleren Grösse berücksichtigt, die garantieren, schnell ausgezählt zu haben. Im Schnitt kommen rund 80-100 Gemeinden pro Vorlage zum Zug, – je nach Thema jeweils andere.

Die Extrapolationen in zwei Stufen basierte von Anbeginn an auf mathematischen Modellen. Dagegen war die Bestimmung von Referenzabstimmungen anfänglich Intuition. Heute entsteht sie aufgrund statistischer Vergleichsmodelle. Letzteres ist unsere eigentliche kreative Leistung. Vermutlich verfügen nur wir über das Wissen, wie das am Sichersten geschieht.

Anders als im Ausland hat sich in der Schweiz die exit-poll Methode als Hochrechnungsbasis nicht durchgesetzt. Das hat zwei Gründe: Die Kosten sind höher, und die hohe Zahl der vorzeitig briefliche Stimmenden mindert den Wert von Befragung vor den Abstimmungslokalen.

Leistungen
Die Hochrechnung selber leistet zweierlei:

. Erstens, die schnelle Bestimmung des Volks-, und wenn nötig auch des Ständemehrs aus Gemeindedaten.
. Zweitens, aber auch eine Analyse des räumlichen Abstimmungsprofils hinsichtlich seiner polit-ökonomischen und polit-kulturellen Eigenheiten.

Ueber die Hochrechnung wird seit dem 6. Dezember 1992 in den SRG-Medien berichtet. Die Information setzt an Abstimmungen um 12 Uhr 30 ein, und sie endet meist um zirka 17 Uhr 30. Im Normalfall werden die hochgerechneten Ergebnisse alle 30 Minuten aufdatiert resp. zu Erstanalyse verarbeitet.

Auf Internet wird die Entwicklung der Ergebnisse dokumentiert. Die meisten Agenturen, privaten Radios der Schweiz und ausländischen Medien, die sich für die Schweiz interessieren, berichten darüber.

Genauigkeit
Unterschieden wird zwischen Trend- und Hochrechnungen. Trendrechnung lassen nur qualitative Aussagen (wird angenommen, wird abgelehnt, ist nicht entscheidbar) zu, während Hochrechnungen Angaben machen, in welchem Verhältnis das Ja und das Nein zueinander stehen. Um 14 Uhr muss eine Hochrechnung vorliegen, die bis am Schluss auf 2 Prozent genau bleibt. Im Schnitt weichen unsere Extrapolationen um 1 Prozent vom vorläufig amtlichen Endergebnis ab, das die Bundeskanzlei am Abend des Abstimmungstages kommuniziert.

Die Ironie der Geschichte: Die Hochrechnungen haben sich bei politische Interessierten innert kürzester Zeit durchgesetzt. Sie gelten heute als zuverlässige Referenz für den Abstimmungsausgang. Sie haben sich so auch vorteilhaft auf die Glaubwürdigkeit von Umfragen vor Abstimmungen ausgewirkt, obwohl sie selber gar kein demoskopisches Produkt sind!

Claude Longchamp

Live Bericht aus dem Hochrechnungszentrum in der Blogosphäre:
2.3.2007
17.6.2007