Trendextrapolationen bringen mehr als reine Messungen – Die SRG-Trendumfragen statistisch verlängert

Dem Bewerbungsschreiben für die Durchführung der SRG-Trendbefragungen zu den eidgenössischen Volksabstimmungen 2016-2019 musste man einen Schätzer beilegen, der aufzeigte, wie oft man in der Vergangenheit mittels Umfrageserien die richtige Mehrheit ermittelt hatte. Hier unsere Darstellung in Kurzform, mit einem Ausblick auf den 5. Juni 2016.

Stellt man alleine auf die zweite von zwei SRG-Umfragen ab, kamen wir für die beiden letzten Legislaturen bei linken Volksinitiativen auf 100 Prozent Richtige. Bei rechten Volksinitiativen betrug der Wert 89 Prozent. Geringer war er bei Behördenvorlagen, bei denen 64 Prozent korrekt vermessen wurden. Das Problem lag da weniger bei falschen Mehrheiten. Vielmehr machte uns recht häufig zu schaffen, dass keine Seite eine ausgewiesene Mehrheit hatte.
blog_cal
Genau das brachte uns auf den Plan! Mit einer Extrapolation der Ergebnisse aus der ersten zur zweiten Befragung kann man eine dritte erdachte Umfrage simulieren. Projiziert auf den Abstimmungstag, sollte diese dem Endergebnis entsprechen.

Knifflig war hier die Wahl des richtigen Projektionsmodells. Denn es sind verschiedene möglich, alleine aufgrund der Ja- oder der Nein-Anteile, Kombinationen davon oder Differenzierungen nach Vorlagen. Schliesslich entschieden wir uns für fünf Varianten, die wir gleichwertig nebeneinander stellten. Entscheiden soll der mainstream der Extrapolationen.

Die so erzielten Verbesserungen waren erheblich. Bei linken Initiativen stimmte die Mehrheit unverändert zu 100 Prozent. Bei rechten steigerten wir den Wert auf 94 Prozent. Der Schnitt der Initiativen wird zu 97 Prozent korrekt eingeschätzt. Bei Behördenvorlagen wurde die Mehrheit in 96 Prozent der Fälle richtig vorhergesehen.

Damit liegt man innerhalb des Sicherheitsintervalls, das in den Sozialwissenschaften üblicherweise angewandt wird.

Überträgt man dieses Verfahren auf die aktuellen Vorlagen, kann man von einem Ja bei der Asylgesetzrevision ausgehen. (Erinnert sei, dass wir das Fortpflanzungsmedizingesetz nicht untersuchten, da man nach dem klaren Ja vor Jahresfrist zum Verfassungsartikel von einem ähnlichen Ergebnisse beim Gesetz ausging.) Derweil macht es Sinn, mit einer Ablehnung der drei Volksinitiativen zu rechnen.

Die sicherste der vier Aussagen ist die zum bedingungslosen Grundeinkommen. Die unsicherste bleibt die zur Service-Public-Initiative.

Greift man alleine auf die zweite Umfrage zurück, könnte man gerade bei der Service-Public-Initiative auch von einem denkbaren Ja sprechen. Berücksichtigt man den nachgewiesenen Trend, ist das jedoch wenig plausibel. Dank des neuen Verfahrens kann man das noch etwas genauer haben – wenn auch immer noch nicht ganz sicher!

Claude Longchamp

Trendumfragen zu Volksabstimmungen sind mehr als Momentaufnahmen, aber weniger als Prognosen

Dass Umfragen per se keine Prognosen sind, habe ich schon häufig genug betont. Immer klarer wird jedoch auch, dass sie nicht blosse Momentaufnahmen bleiben müssen. Mit der Zahl vergleichbar gemachter Umfragen steigen die Möglichkeiten präzisierter Einschätzungen.

Von Momentaufnahmen spricht man bei einer einmaligen Messung von Einstellungen, Entscheidungsabsichten und Verhaltensweisen. Das ist insbesondere dann sinnvoll, wenn, wie bei der öffentlichen Meinung, Konstanz über die Zeit nicht gesichert angenommen werden kann.

Von Trends sprechen wir, wenn mindestens zwei, besser drei identisch hergestellte Momentaufnahmen vorliegen. Denn das gibt den Zwischenstandsmeldungen eine Perspektive über die Momentaufnahme hinaus. Trends kann man sogar extrapolieren, womit man an sich zu Prognosen gelangt.

Wir haben Ende 2015 als Bilanz unserer Arbeiten für die SRG alle Abstimmungsfragen seit 2008 reanalysiert, neu extrapoliert und hinsichtlich der Trefferquoten bewertet. Mit Trefferquote meinen wir den Anteil zutreffender Mehrheiten.

bild_blog_Cal

Stellt man einzig auf die erste Welle ab, die in der Regel 45 Tage vor der Volksabstimmung erhoben wird, bleibt die Trefferquote klar zurück. Bei Behördenvorlagen bleibt die Mehrheit bis zum Schluss in 56 Prozent der Fälle gleich, bei Volksinitiativen in 71.4 Prozent der Fälle. Die zweite Welle verbessert die Einschätzungen namentlich von Volksinitiativen erheblich. Die Trefferquote liegt jetzt bei 94.3 Prozent, während sie bei Behördenvorlagen nur auf 64 Prozent gesteigert werden kann.

Extrapoliert man die Entwicklungen im Ja- und Nein-Anteil aufgrund von Erfahrungen mit der Schweizer Politik, Abstimmungskämpfen und Trendumfragen auf den Abstimmungstag,  verändert sich das Bild nochmals. Volksinitiativen kennen  jetzt eine Trefferquote von 97.1 Prozent, Behördenvorlagen von 96 Prozent. Der Hauptgrund für die Steigerung bei Behördenvorlagen liegt darin, dass der Anteil Unentschiedener häufig recht gross ist, sodass Aussagen recht vage bleiben. Bei Volksinitiativen kann man mit einer Differenzierung zwischen linken und rechten Vorlagen ebenfalls noch einiges verbessern. So ist es möglich, mittels Extrapolation die Genauigkeit bei der Bestimmung der Mehrheit bei linken Initiativen auf 100 Prozent zu steigern, während sie bei rechten Initiativen einen Sicherheitsgrad von 94.1 Prozent erreicht.

Quantitative Prognosen bleiben schwieriger, insbesondere bei rechten Volksinitiativen. Punktgenaue Prognosen sind bis heute nicht möglich. Denn das Wechselspiel aus Effekten der Mobilisierung und Meinungsbildung bleibt letztlich ein Geheimnis. Hauptgrund hierfür ist, dass man in den letzten Tagen vor der Volksabstimmung in der Schweiz keine Umfragen mehr machen darf. Nur mit solchen käme man diesem Wechselspiel empirisch hinreichend genau auf die Spur.

Umfragen per se haben in der Tat eine nur beschränkte Prognosekraft. Trendumfragen können aber dazu verwendet werden, mittels Extrapolationen auf den Abstimmungstag die Sicherheit qualitativer Aussagen auf jenes Mass zu erhöhen, dass man sich in den Sozialwissenschaften wünscht.

Zutreffende Prognosen zeigen zuverlässige Verfahren

Florida hat gezählt, sodass das Endergebnis der US-Präsidentschaftswahlen endlich feststeht. Mit dem Endresultat kann man die Güte der Umfragen, der Aggregatoren und der Umrechnungen von Wähler- auf Elektorenstimmen prüfen.

Präsident Barack Obama bei seiner Wiederwahl Ende Januar 2013 mit 332 von 538 Elektorenstimmen rechnen. Von den gut 120 Mio. WählerInnenstimmen hat er 50,5 Prozent bekommen; sein Widersacher, Mitt Romney, kam auf 47,9 Prozent, während 1,6 Prozent der Stimmen auf die übrigen Bewerber entfielen.

Nate Silver, den Star unter den Analytikern der US-Wahlen, hat für seine Evaluierung nur die Firmen berücksichtigt, die in den letzten 3 Wochen mindestens 5 Umfragen realisiert haben, sei dies auf nationaler oder auf staatlicher Ebene. Das schränkt Zufallsergebnisse in der Bewertung ein, nicht zuletzt, weil es kurz vor der Wahl eine Tendenz gäbe, die letzte Umfragen eines Instituts dem mainstream unter den Polls anzugleichen, schreibt “Mr. 538”.

Auf Silvers Liste rangiert denn auch IBD/TIPP an der Spitze, realisiert für Investors.com. Die Abweichung vom Endergebnis beträgt hier 0.9 Prozentpunkte; mit einem minimalen Ueberhang für den Herausforderer. 22 weitere Firmen figurieren auf der Liste: 12 arbeiteten mittels LivePhones, 6 mit Internetumfragen und 5 mit RobotPhone; letztere haben keine Befrager mehr, sondern führen die Interviews mit einer Automatenstimme durch.

In den letzten drei Wochen entschienen am meisten Umfragen mit dieser Methode – zum Nachteil der Demoskopie, denn sie waren am ungenauesten und sie hatten am deutlichsten einen Bias Richtung Romney.

Leseanleitung:
Entscheidend ist jeweils die 2. Kolonne, welch die mittlere Abweichung der gemachten Umfragen in absoluten Zahlen angibt, während die dritte zeigt, in welche Richtung diese im Schnitt ausfällt. Wenn Gravis Marketing für seine 16 Umfragen ein 2,7 erhält wich man im Schnitt 2,7 Prozentpunkte vom Endresultat ab, und zwar, wie Kolonne 3 nahelegt, stets zugunsten der Republikaner. Derweil verteilen sich die geringeren Abweichungen von Mellman auf beide Seiten gleich stark.

Beste Umfragen mit Live-Interviews

Firma/Medium Zahl Abweichung Richtung

. IBD/TIPP 11 0.9 R+0,1
. Mellman Group 9 1,6 R/D +/-0,0
. OpinionResearch/CNN 10 1,9 R+0,8
. CVOTERInternation/UPI 13 2,0 R+2,0
. GroveInsight 18 2,0 R+0.1

Schnitt 10 1,7 R+0,6

Beste Online-Umfragen

. GoogleConsumerSurvey 12 1,6 R+1,1
. RANDCorporation 17 1,8 D+1,5
. Ipsos/Reuters 42 1,9 R+1,4
. AngusReid 11 1,9 R+0,8
. YouGov 30 2,6 R+1,1

Schnitt 22 2,0 R+0,6

Beste Umfragen mit Robotinterviews

. SurveyUSA 17 2,2 R+0,5
. WeAskAmerica 9 2,6 D+0,1
. PublicPolicyPolling 71 2,7 R+1,6
. Gravis Marketing 16 2,7 R+2,7
. RassmusenReports 60 4,2 R+3,7

Schnitt 36 2,9 R+1,7

Berücksichtigt man die 5 besten jeder Methode, liegen die Umfragen mit LivePhones vorne; ihre mittlere Abweichung beträgt 1,7 Prozentpunkte. An zweiter Stelle finden sich die Internet-Umfragen, deren durchschnittlicher Fehler bei 2,0 Prozentpunkten liegt. Mit 2,9 Prozentpunkten deutlich schlechter die Umfrageroboter.

Das zweite wichtige Ergebnis betrifft die Richtung der hauptsächlichen Abweichung. 19 der 23 Serien überschätzen Romney, nur 4 Obama. Das straft alle Behauptungen als Lügen, wonach republikanische Wähler schwieriger zu befragen seien, inbesondere bei der traditionellen Methoden mit InterviewerInnen.

Vielmehr fallen drei negativ Firmen auf: Gallup, American ResearchGroup und RassmusenReport. Sie haben Romney zwischen 4 bis 7 Prozent systematisch überschätzt; was ausserhalb des Stichprobenfehlers liegt. Hauptgrund hierfür dürften die unbrauchbare Definition der wahrscheinlichen WählerInnen, denn die entsprechenden Angaben verschärften in der Regel den Bias zugunsten der Republikaner.

Besser als die genauesten Umfrageserien waren die Aggregatoren. Das überrascht nicht wirklich, denn ihr Vorgehen ist darauf ausgerichtet, Fehleinschätzungen aufgrund von Ausreiser zu vermeiden. Meine Uebersicht hierzu lautet:

Endwerte der Umfrageaggregatoren

Effektiv: 51,3 zu 48,7 (Vereinfachung der Verhältniszahlen durch Reduktion der Angaben auf die beiden Hauptkandidaten)

. NateSilver/“538“ 51,3 zu 48,7 (R/D +/- 0,0)
. Sam Wang/ElectionConsoriumProjection 51,2 zu 48,8 (R+0,1)
. ElectionProjection 50,6 zu 49,4 (R+0,7)
. TalkingPointsMemo 50,5 zu 49,5 (R+0,8)
. RealClearPolitics 50,4 zu 49,6 (R+0,9)

Schnitt R+0,5

Die fünf gebräuchlichsten unter ihren haben eine finale Abweichung von maximal 0.9 Prozent; der mittlere Fehler betrug eine halben Prozentpunkt. Genau richtig lag Nate Silvers „538“, während alle anderen einen leichten Republikaner-Bias hatten. Am knappsten fiel der bei Sam Wangs Berechnung für das ElectionProjection der Universität Princeton aus, gefolgt von den Plattformen ElectionProjection und TalkingPointsMemo. Vergleichsweise ungenau war RealClearPolitics – der Aggregator, auf den sich die meisten (hiesigen) Massenmedien stützten. Er überschätzte Romney mit 0,9 Prozentpunkten und legte damit am deutlichsten einen knappen Ausgang nahe. Gänzlich unangebracht war die Attacke auf Nate Silver aus den Rängen der republikanischen Medien, kurz vor der Wahl, weil sie seiner Wahrscheinlichkeitsberechnung keinen Glauben schenken wollten.

(Selber habe ich am meisten auf Pollyvote abgestellt, ein Aggregator, der nicht nur Umfragen, sondern auch weitere Analysetools berücksichtigt; Die Abweichung hier: 0,3 – und zwar gunsten Romneys. Leider kurz vor der Wahl einem Hacker-Angriff zum Opfer gefallen).

Prognosen von Elektorenstimmen

Effektiv: 332 zu 2106

. Drew Linzer/Votamatic: 332 zu 206
. Josh Putnam/Frontloading: 332 zu 206
. Nate Silver/FiveThirtyEight: 313 zu 225
. Sam Wang/ElectionConsortiumPrinceton: 312 zu 236
. ElectionProjection: 303 zu 235
. RealClearPolitics: 303 zu 235

Es bleibt der Kommentar zur Liste der Abweichungen bei Elecotral College. Alles richtig hatten hier Josh Putnam, Professor für Politikwissenschaft am Davidson College, North Carolina, gleich auf mit seinem Kollegen Drew Linzer von der Emory University. Nate Silver hatten ebenfalls keinen Fehler, vergab aber die Stimmen nicht blockweise nach Gliedstaaten, sondern multipliziert sie mit Wahrscheinlichkeiten, weshalb er leicht schlechter abschneidet.

Mit einem Fehler (alle Florida, wo man mit einer republikanischen Mehrheit rechnet) folgen das ElectionConsortium, ElectionProjection und RealClearPolitics. Ein schwerer Missgriff machte hier übrigens Karl Rove, der Romney mit 285 Elektorenstimmen als Sieger sah.

Was bleibt?

Erstens, die Umfragen waren recht zuverlässig; die klassischen Telefonbefragung (mit Handynummern) bleibt die beste Methode.

Zweitens, die Aggregatoren sind genauer als die Umfrageserien, weil sie Ausreisser vermitteln. “538” war dabei besser als “RCP”.

Drittens, die Umrechnung von Wähler- auf Elektorenstimmen klappt umso besser, je mehr man rechnet und keine wishfull-thinking Zuschreibungen vornimmt.

Claude Longchamp

Twittprognosis ?????????????

Am Sonntag schon bin ich auf Twittprognosis gestossen; darüber zu bloggen getraute ich mich am 1. April nicht, weshalb ich das heute nachhole. Mit der Frage an die Weisheit der Viele: Wer und was steckt hinter dieser Weise der …

Die neueste Grafik ist spektakulär: Eine Prognose für die Piratenpartei in jedem deutschen Bundesland. Mit 13 Prozent ist Berlin Rekordhalter, während in der neueste Spross in der deutschen Parteienlandschaft in Baden-Württemberg auf 2,5 Prozent kommt.

Vertrieben wird die Darstellung von “twittprognosis”. Genauso wie viele andere, höchst interessante Vorhersagen.
Nur, was twittprognosis ist erfährt man kaum; die kürzeste Selbstdarstellung lautet: “Scientificly ascertained prognoses for elections worldwide based on CATI, Online-Panel, Prognosis, Online-Polls, Face-To-Face-Interviews and Election Results.”
Eine Homepage ausserhalb von Twitter gibt es nicht; selbst google findet hierzu nicht. Auf wikipedia eine grosse Leere, einzig irgendwo versteckt ein Kommentar, der twitter-Dienst suche sich einzunisten, ohne dass man erfahre, was gemacht werden; Fazit, gut geraten sei auch geraten.

An sich finde ich die Weisheit der Viele etwas höchst Interessantes. Hier bleibt die Frage, ist es die Weisheit einiger weniger? Vielleicht hilft mir die Weisheit der Vielen, die mir folgen, weiter, um zu klären, wer und was Twittprognosis ist?

Claude Longchamp

Wie wir uns selber täuschen, wenn wir unsicher sind, was ist.

Ein kleiner Gedanke zu den Reaktionen, die ich bekomme, wenn wir abstimmungsbezogene Umfragen publizieren. Keine Kritik an niemanden, aber ein Experiment, das sich lohnt, bei sich selber zu machen, um sich zu durchschauen.

Die meisten Reaktionen sind typisch. Von einem meiner Auftritte im Fernsehen zu Umfragen bleibt am häufigsten Aeusserliches. Zum Beispiel die neue Umgebung der Präsentation. Die Bücherwand mit dem Asterix-Band im Hintergrund. Oder das ich mich am Morgen beim Rasieren geschnitten hatte, und man das Stunden später noch sah – in der Grossauflösung.

Aufgrund der übrigen Reaktionen schliesse ich: Geblieben sind auch wenige Zahlen. Beispielswseise jene zum zustimmenden Anteil bei der Zweitwohnungsinitiative, die zahlreiche Gegner in den betroffenen Gebieten schockierte.

Die Kognitionswissenschaft vergleicht das schon mal mit einem ausgeworfenen Ankern. Je unübersichtlicher die Verhältnisse seien, umso eher bleibe ein möglichst konkreter Befund haften, lautet die entsprechende Analyse.

Was meint man damit? Mit der Problematik von Zweitwohnungen haben wir, in der politischen Oeffentlichkeit, wenig Erfahrungen. Eine vergleichbare Abstimmung, die uns gut in Erinnerung wäre, gibt es nicht. So schiessen die Spekulationen ohne Grundlage ins Kraut. Deshalb bezieht man sich zum Beispiel auf einfache Verhaltensannahmen. In den betroffenen Gebieten sei man geschlossen dagegen, und in den übrigen Regionen beurteile man das aufgrund des Wunsches, eine Zweitwohnung zu erwerben.

Ich will die Richtigkeit solcher Ueberlegung ein wenig bezweifeln. Denn solche Interessendefinitionen sind häufig wunschgeleitet sind. Wer möchte, dass die Initiative scheitert, sammelt alles, was dagegen spricht und formuliert so seine Erwartungen. Besser wäre esallerdings, auch das Gegenteil zu machen, das heisst alles zu sichten, was zugunsten der Initiative erwähnt werden kann, und zu überlegen, wer dann alles dafür stimmen müsste.
Allein das würde zu mehr selbstkritischer Reflexion führen. Denn diese ist nötig, will man sich nicht selber täuschen. Die gleiche Kognitionswissenschaft kennt nebst der genannten Ankerheuristik zahlreiche andere Mechanismus, die unsere Wahrnehmungen leiten. Sechs weitere Beispiele mögen meinen Gedankengang verstärken:

der übertriebene Optimismus: Je parteiischer wir sind, umso optimistischer sind wir, Recht zu haben oder zu bekommen.
die Selbstüberschätzung: Je parteiischer wir sind, umso eher überschätzen wir uns selber.
die Bestätigungs-Tendenz: Je früher wir uns festgelegt haben, desto eher suchen wir nach Bestätigung, und blenden wird Zwischentöne aus.
die Konservatismus-Tendenz: Je früher wir uns festgelegt haben, desto resistenter sind wir einer Neubeurteilung.
die Verallgemeinerungs-Heuristik: Ein paar Bestätigungen unserer Annahmen reichen, und wir sind sicher, richtig zu liegen.
die Verfügbarkeits-Heuristik: Je greifbarer Informationen sind, desto eher halten wir sie für richtig.

Um eines klar zu sagen: Das alles macht unseren Messwert weder schlechter noch besser. Er ist, in engen Grenzen, für den Moment der Erhebung richtig. Was daraus bis zum Abstimmungstag wird, ist eine Sache, die auf einem späteren Blatt beschrieben werden wird.

Mit meinem Beitrag wollte ich indessen Hinweise geben, warum wir solche Zahlen zu Unrecht für richtig oder falsch halten.
Weil wir uns von ganz bestimmten Tendenzen, Routinen und Selbstbildern bestimmen lassen. Die haben mit allgemeinen menschlichen Schwächen zu tun, aber auch mit unserem Standpunkt in der Sache und der vorläufigen Entscheidung.

Vielleicht ist es ganz ratsam, nicht einfach bei Hintergründen oder einzelnen Zahlen stehen zu bleiben. Dafür ein paar Mechanismen zu durchschauen, die unser über Gebühr optimistisch oder pessimistisch stimmen – bevor wir effektiv stimmen!

Claude Longchamp

Volksinitiativen: Kürzestfassung der Erkenntnisse zur Meinungsbildung

Nicht nur mit der Meinungsbildung zu Behördenvorlagen, auch mit jener zu Volksinitiativen habe mich in den letzten Wochen nochmals systematisch beschäftigt. Hier meine diesbezüglichen Erkenntnisse in der Kürzestfassung.

Eidgenössische Volksinitiative haben es (unverändert) schwer. 17 von 20 scheitern in der Volksabstimmung; 3 werden angenommen. Ein wesentlicher Grund ist, dass die Nein-Kampagnen mehr Wirkungen zeigen als jene der Ja-Seite.

Tabelle
Grafik anklicken für grössere Ansicht

Viele Initiativ-Komitees legen mit ihrem Anliegen den Finger auf einen wunden Punkt, indem sie ein politisch vernachlässigtes Problem aufbringen. Das ist der Sinn der Initiative. Die andere Seite der Medaille ist, dass sie sich fast ebenso häufig beim Lösungsansatz täuschen, zu kompromisslos sind, um von einer Mehrheit angenommen werden zu können.

Die Ausschaffungsinitiative war eine der berühmten Ausnahmen. Zwar ging auch hier die Ablehnungsbereitschaft mit dem Abstimmungskampf (von 36 auf 48 Prozent) hoch, und es verringerte sich die Zustimmungstendenz (von 58 auf 52 Prozent). Allein, die Effrekte blieben vergleichsweise gering; und sie bewirkten (für einmal) keinen Mehrheitswechsel.

Bei linken Initiativen, die gut starten, ist der Meinungsumschwung meist stärker. Typisch hierfür steht der Prozess bei der Steuergerechtigkeitsinitiative der SP. Auch sie begann bei 58 Prozent (bestimmt oder eher) Ja; schliesslich waren es genau soviele Nein. Während der vergangenen Legislatur gab es keinen so gründlichen Wechsel der Mehrheit wie in diesem Fall..

Geringer ist der Wandel, wenn die Unterstützung einer Initiative von Beginn weg nur minderheitlich ist. Typisch hierfür die Volksinitiative gegen Behördenpropaganda, die in den Umfragen mit 27 Prozent Zustimmung begann, schliesslich bei 25 Prozent landete.

Das alles macht es einfacher, die Dynamik von Meinungsbildungsprozessen bei Volksinitiativen zu beurteilen, als man das bei Behördenvorlagen mit einer Regel machen könnte: Sicher ist, dass mit dem Abstimmungskampf die Opposition steigt, wahrscheinlich, das parallel dazu den Nein-Anteil sinkt. So gut das bekannt ist, so wenig weiss man im Voraus, wie stark die Effekte ausfallen.

Das kann verschiedene Ursachen haben:
Erstens, es macht einen Unterschied, wer der Initiant ist; die Rechte hat Vorteile gegenüber der Linke, und daselbst führt die SVP die wirkungsvollsten Initiativ-Kampagnen.
Zweitens, es kommt darauf an, ob die Nein-Seite eine Schwachstelle der Initiative findet oder nicht und sie frühzeitig und intensiv kommuniziert,
Drittens, der (wahrgenommene) Problemdruck entscheidet. Je höher er ist, desto geringer bleibt der Meinungswandel, und geringer er ist, umso grösser fällt der Wandel aus.

Mehr Forschung auf diesem Gebiet wäre angezeigt. Leisten kann man sie alleine mit Bevölkerungsumfragen nicht. Nötig wäre es, sie mit eine qualititive und quantitative Analyse der Propaganda mit den Verstärkereffekte in den Medien zu kombinieren. Leider setzt sich dafür niemand spezifisch ein.

Claude Longchamp

Behördenvorlagen: Kürzestfassung der Erkenntnisse zur Meinungsbildung

Eine systematisch Durchsicht aller Vorbefragung zu eidgenössischen Volksabstimmungen der letzten Legislaturperiode legt nahe, von 6 typischen Meinungsbildungsprozessen auszugehen. Ausgangslagen, Prädispositionen, Allianzen und Engagements bestimmen den Abstimmugnsausgang.

Man erinnert sich (wahrscheinlich): Die Vorlage zum BVG-Umwandlungssatz scheiterte 2010 hochkant. Was das Parlament befürwortet hatte, fiel mit 73 Prozent Nein-Stimmen exemplarisch durch. Ganz anderes geschah beim Gegenvorschlag zur Volksinitiative, die Komplementärmedizin betreffend. 67 Prozent befürwortenden dies in der Volksabstimmung.


Grafik anclicken um sie zu vergrössern

Der Vergleich zwischen Vorbefragungen und Abstimmungsergebnissen legt in beiden Fällen nahe, dass Verstärkung vorhandener Prädispositionen die zentrale Wirkung der Kampagne war. Denn sowohl beim BVG Umwandlungssatz als auch bei der Komplementärmedizin standen die Mehrheiten von Beginn weg fest – selbst annähernd im Verhältnis der Volksabstimmung

Beide Entscheidungen nennen wir “prädisponiert”, “stabil positiv resp. vorbestimmt” sind den auch unsere ersten beiden Typen. Die überwiegende Zahl der BürgerInnen haben eine Meinung zum Abstimmungsthema, und sie ändern sie nicht, während der Kampagnen in der Oeffentlichkeit. Das ist allerdings eher die Ausnahme als die Regel. Es kommt dann vor, wenn eine politische Entscheidung sichtbare Auswirkungen auf den Alltag vieler hat; dann erfolgt die Meinungsbildung aus eben diesem Alltag heraus, und nicht erst während des Abstimmungskampfes. Geht es um handfeste materielle Interesse oder um zentrale Werte, kann man davon ausgehen, dass es selbst aufwendigen Kampagnen nicht gelingt, das Eis zu brechen.

Das pure Gegenteil davon erlebten wir beim Verzicht auf die allgemeine Volksinitiative. Diese Neuerung der Volksrechte, vom Parlament eingeführt, wurde von eben diesem Parlament wieder zurückgezogen, bevor sie auch nur einmal zur Anwendung gelangt war. Die Bevölkerung war in diese Prozesse kaum involviert, doch waren zur Einführung und zur Abschaffung je eine Volksabstimmung nötig.

Wie noch nie zuvor, ergab die Umfrageserie von den Abstimmungen hier einen gründlichen Meinungswandel. Vor der Kampagne war eine Mehrheit negativ eingestellt. 66 Prozent wollten 6 Wochen vor der Abstimmung noch Nein sagen Das hatte nicht mit vertiefter Beschäftigung zu tun, dafür viel mit dem Reizwort Verzicht auf ein Volksrecht. Am Abstimmungstag war dann alles ganz anders. 68 Prozent sagten Ja zur Vorlage. Die Auseinandersetzung mit dem Inhalt, der Einsatz der Politik und der Medien und die Einsicht, nichts zu verlieren, bewirkten dies.

Dieser Fall heisst bei uns “nicht prädisponiert”, verbunden mit einer eindeutig von der Ja-Seite beherrschten Willensbildung. Auch er ist insgesamt recht selten, aber unser dritte Typ.

Denn mehrheitlich haben wir es bei Behördenvorlagen damit zu tun, dass die Vorbestimmtheit eher positiv ausgerichtet, aber nicht stabil ist. Die Meinunsbildung im Parlament führt zu einem Kompromiss, und die Parolen der Parteien im Abstimmungskampf verstärken den mainstream. Doch hängt das Ergebnis der Volksabstimmung essenziell vom Engagement in den Kampagnen ab, und so gibt es zwei Varianten: Eine Zustimmungsmehrheit von 50-60 Prozent ist immer dann zu erwarten, wenn die Behördenseit die Themenführung übernimmt und im Abstimmungskampf von sich aus kommuniziert. Wir nennen das den “labil (positiv) vorbestimmten Typ mit offensiver Ja-Kommunikation “. Ohne das Engagement von Bundesrat und befürwortenden Parteien wäre beispielsweise die Unternehmenssteuerreform wohl nicht angenommen worden, vielleicht auch der Biometrische Pass gescheitert.

Krass ist das Gegenbeispiel beim Gegenvorschlag zur Gesundheitsinitiative der SVP gewesen. Im Parlament formierte sich eine bürgerlichen Mehrheit dafür, und die Initianten zogen ihr Begehren vor der Abstimmung zurück. Während des Abstimmungskampfes zerfiel die befürwortenden Allianz indessen, was den StimmbürgerInnen nicht entging, sodass sich die Meinungsbildung in den letzten Wochen vor der Abstimmung deutlich ins Nein entwickelte und die Vorlage schliesslich scheiterte. Für uns ist das der 5. Typ, der labil vorbestimmte mit einem Zerfall der Ja-Seite. Solche Entscheidungen gehen in der Regel negativ aus.

Nur dann, wenn eine Vorlage ganz dem Volksempfinden entspricht und kaum jemand Opposition macht, geht die Sache auch ohne grosse Behördenaktivitäten durch. Das kommt bei fakultativen Referenden kaum vor, denn darüber wir nur abgestimmt, wenn es eine minimal organisierte und verankerte Opposition gibt. Bei obligatorischen Referenden ist das aber sehr wohl möglich, wie das Beispiel der Forschung am Menschen zeigt – somit ist das unser 6. Typ.

Claude Longchamp

Wahlbarometer: Zustimmung zu BundesrätInnen mehrheitlich – Kritik vor allem parteipolitisch motiviert

Im Rahmen des neuesten Wahlbarometers, das heute erschienen ist, haben die Wiederwahlempfehlung (unmittelbar vor dem angekündigten Rücktritt von Bundespräsidentin Micheline Calmy-Rey) untersucht. Die ausführlichen Befragungsergebnisse können hier nachgeschlagen werden. Mein Kommentar dazu lautet.

Eines vorneweg: Wir haben nicht die Frage gestellt, wen man selber wählen würde. Denn das setzte voraus, dass es eine Volkswahl des Bundesrates geben würde. Vielmehr haben wir uns danach erkundigt, über welche der bisherigen Bundesratsmitglieder man die Meinung habe, sie sollten am 14. Dezember 2011 wiedergewählt werden oder nicht.

grafik60Grafik anclicken, um sie zu vergrössern.

Die Wahlberechtigten setzen dabei sehr wohl Akzente. Gegenüber allen sieben Mitgliedern vertritt eine Mehrheit die Meinung, sie sollte nochmals gewählt werden. Am klarsten kommt das bei Doris Leuthard zu Ausdruck. 75 Prozent der Wahlberechtigten empfehlen die CVP-Magistratin zur Wiederwahl. Bei Simonetta Sommaruga (SP) sind das 70 Prozent. Didier Burkhalter (FDP) bringt es auf 69 Prozent. Ihnen ist gemeinsam, dass sich nur rund jede achte Personen eine Nicht-Wiederwahl wünscht. Etwas gespaltener sind die Positionen gegenüber Eveline Widmer-Schlumpf (BDP), Ueli Maurer (SVP) und Johann Schneider-Ammann (FDP). Zwischen 65 und 56 Prozent sähen sie gerne weiterhin im Bundesrat, während gut ein Fünftel das Gegenteil vertritt.

Am polarisiertesten sind die Meinungen, wenn es um Bundespräsidentin Micheline Calmy-Rey (SP) geht. Hier wünschen sich 51 die Wahl für eine weitere Amtsperiode, während 35 Prozent das ausdrücklich ablehnen. Stellt man auf die Unschlüssigen ab, kennt Bundesrat Schneider-Ammann den grössten Anteil, indes nicht, weil man ihn nicht kennen würde, sondern weil man sich in der Entscheidung noch nicht sicher ist.

Hinter der Bewertung verstecken sich vor allem partei- und regionalpolitische Präferenzen. Die Gegnerschaft von Calmy-Rey kommt aus dem entgegengesetzten politischen Lager. Nur ein Drittel der SVP-Wählenden möchte sie im Amt behalten. Polarisierend wirkt sie auch bei den parteipolitischen Ungebundenen. Sie empfehlen die Bundespräsidentin zu 46 Prozent für eine weitere Bundesratszeit. Bei Bundesrat Schneider-Ammann geht die Opposition nicht so tief; dafür ist sie breiter. Nur Minderheiten von SP, GPS und GLP möchten, dass er in seinem Amt bestätigt wird. Bei Ueli Maurer reduziert sich das auf die SP- und GPS-Wählenden. Ein beschränktes Problem hat schliesslich Eveline Widmer-Schlumpf. Das Misstrauen ihr gegenüber kommt aus ihrer ehemaligen Partei. Immerhin genau die Hälfte der heutigen SVP-Wählenden würde sie zur Wiederwahl empfehlen.

Hinsichtlich der Sprachregionen haben die Bundesräte Maurer und Schneider-Ammann ein Problem. In der Romandie findet sich keine Mehrheit, welche die beiden weiter empfehlen würde. Bei Bundespräsidentin Calmy-Rey gilt schliesslich, dass sie in allen Regionen umstritten ist. Mit 55 Prozent wird sie am ehesten noch in der italienischsprachigen Schweiz unterstützt.
So bleibt, dass die BürgerInnen gegenüber Abwahlen von BundesrätInnen skeptisch sind. Klare Hinweise auf dringend erwartete Veränderungen gibt es nicht. Immerhin mischen sich aber mehr oder minder klare Zwischentöne in die Beurteilungen, die in erster Linie parteipolitisch motiviert sind.

Claude Longchamp

BundesrätInnen in repräsentativen Bevölkerungsumfragen

Man weiss es, unsere BundesrätInnen haben es nicht besonders gerne, wenn ihr Zuspruch in der Bevölkerung in Umfragen getestet wird. Trotzdem, es kommt regelmässig vor, und es ist an der Zeit, zu den Ergebnissen einen Ueberblick zu verschaffen.

Zeitschriften wie die “Illustré” (zusammen mit MIS Trend) oder Wochenendblätter wie die “Sonntagszeitung” (gemeinsam mit Isopublic) bringen periodisch Uebersichten über die Akzeptanz der einzelnen BundesrätInnen.

Nebst vielen Gemeinsamkeiten der beiden Serien, gibt es auch Unterschiede in der Sicherung der Repräsentativität: So interessiert sich die Sonntagszeitung dafür, wer im Bundesrat in Zukunft eine wichtige Rolle spielen solle oder eben nicht, während Illustré die Aktion der MagistratInnen in den letzten 6 Monaten bewerten lässt. Die Aussagen der Sonntagszeitungen basieren auf rund 1255 Befragten, während sich Illustre mit 600 begnügt. Beide Auftraggeber lassen Interviews in der deutsch- und französischsprachigen Schweiz durchführen, nicht aber in der italienischen. Isopublic kontrolliert die so entstehenden Ergebnisse zur zusätzlichen Wahlabsichtsfrage aufgrund der zurückliegenden Wahlen. Schliesslich gibt es Unterschiede in der Auswertung: MIS lässt Unschlüssige in der Darstellung weg, Isopublic weisst sie ausdrücklich aus.

Die jüngste Erhebung von Isopublic war in diesem Sommer, präzise zwischen den 8. und 18. Juni 2011; sie bezieht sich auf die aktuellen Mitglieder des Bundesrates. Demgegenüber befragte MIS Trend vor rund einem Jahr einen BürgerInnenquerschnitt, konkret zwischen dem 31. August und 6. September 2010, also noch vor der Ersatzwahl für die zurückgetretenen Moritz Leuenberger und Hans-Rudolf Merz am 22. September 2010.

brumfragen
Grafik anclicken um sie zu vergrössern

Zunächst fällt auf, dass sich die Reihenfolge der BundesrätInnen, die in beiden Umfragen auftauchen, genau gleich bleibt. Das spricht für eine recht stabile Rangordnung unter den Magistratspersonen. Zuspruch aus der Bevölkerung ist nicht einfach etwas bliebiges; vielmehr hat es klare Konturen. Zu diesen zählen die politische Position, die Amtsdauer und die Hoffnungen und Enttäuschungen, die sich daraus ergeben.

Der Zeitpunkt, und damit verbunden die Fragestellungen, beeinflussen jedoch die Messwerte – und so auch die Abstände der BundesrätInnen untereinander. Am deutlichsten schlägt sich dies bei Widmer-Schlumpf nieder: In der Rückwärtsbetrachtung ihrer Leistungen ist sie top, wenn es um die Aussichten in der Zukunft geht, rangiert sie genau in der Mitte der BundesrätInnen. Vergleichbares findet sich bei Burkhalter und Calmy-Rey, indes einiges weniger ausgeprägt.

Konstant sind die Verhältnisse ganz oben und ganz unten: Doris Leuthard ist, egal wann und egal wie befragt, die populärste Bundesrätin, während für Ueli Mauer genau das Gegenteil gilt.

Oder allgemeiner gesagt: Umfragen zu BundesrätInnen geben sehr wohl Grundströmungen in der stimm- und wahlberechtigten Bevölkerung zuverlässig wieder. Die Details der Befragungen beeinflussen die konkreten Prozentzahlen. Deshalb sollte man die nur innerhalb einer Befragungsserie vergleichen, während das generelle Ranking, und Aenderungen darin, sehr wohl etwas über die Akzeptanz der Regierungsmitglieder in der Schweizer Bevölkerung aussagen.

Ein Mechanismus tritt immer deutlicher zu Tage: Unsere BundesrätInnen haben ihre Sache im BürgerInnen-Urteil nicht einfach schlecht, wenn alles vorbei ist. Die Bilanzen fallen unterschiedlich, mehrheitlich aber (knapp) positiv aus. Wenn es dagegen um die Zukunft geht, hagen wir Zweifel, wegen diesem und jenem. Das tritt vor allem Personen, über deren Rücktritt öffentlichen spekuliert wird.

Claude Longchamp

I had a dream

Vor 20 Jahren träumte ich davon, parallel zu den etablierten Nachanalyse von Wahlen und Abstimmungen in der Schweiz auch Voruntersuchungen machen zu können. An den 3. Demokratietagen in Aarau zog ich vor einigen Tagen Bilanz zu diesem Unterfangen. Hier meine drei wichtigsten Schlüsse.

untitled

“Erstens, Wahlprognosen sind prinzipiell möglich; Parteiwahlen können sicherer vorweggenommen werden als Personenwahlen. Alles hängt aber vom Zeitpunkt der Vorhersage ab.
Das hat mit der deutlicheren Vorbestimmtheit von Entscheidungen zum Nationalrat zu tun, denn unsere Meinungen zu Parteien bilden wir uns fast täglich. Das ist schon bei Ständeräten nicht der Fall und die Unterscheidung kann auch bei Kantons- und Regierungsratswahlen gemacht werden. Deshalb sind kurzfristige Entscheidungen, ja taktische Erwägungen bei Personenwahlen generell höher, was die Vorwegnahme der Ergebnisse erschwert.

Zweitens, Abstimmungsprognosen sind deutlich schwieriger. Generell ist Vorsicht angebracht.
Ermitteln kann man Trends der Meinungsbildung; mittels Szenarien lassen sich diese auch extrapolieren. Im schlechtesten Fall bleibt der Ausgang offen; im Normalfall kann er qualitativ im Sinne eines Nein- oder Ja-Entscheides vorweg benannt werden, während punktgenaue Prognose vorerst nicht möglich sind. Hauptgrund ist, dass die Dynamik der Meinungsbildung bei Behördenvorlagen grösser ist als bei Parteiwahlen und bei Entscheidungen über Volksinitiativen noch erheblicher ausfallen kann als bei Behördenvorlagen. Das erschwert die Aufgabe.

Drittens, etabliert hat sich, bei Wahlen eine Serie von Vorwahlbefragungen auf der Basis von jeweils 2000 auskunftswilligen Wahlberechtigten zu erstellen. Bei Abstimmungen gibt es zwei Erhebungen bei je 1200 Bürger und Bürgerinnen – die eine zu Beginn der Kampagne, die andere etwa in der Mitte. Im Vergleich zu Wahlen ist beides in der Regel nur recht nahe zum Abstimmungstag möglich. Einmalige Bestandesaufnahmen genügen aus unserer Warte nicht.”

Mehr dazu im Referat an der Fachtagung hier.

Claude Longchamp