Kanton Luzern: Wahlbefragungen und Wahlbörsen im Vergleich.

Die Wahlen in Luzern sind ausgezählt – ein guter Moment, Wahlumfragen und Wahlbörsen vor der Wahl im Vergleich zu evaluieren.

vergleich_luzern
Grafik anklicken, um sie zu vergrössern

Gemäss Statistischem Amt des Kantons Luzern gewinnt die GLP (5,9%/+5,9 Prozentpunkte) bei den Parlamentswahlen am meisten, gefolgt von der SVP (22,3%/+3,2%), der BDP (1,7%/+1,7%), der GP (8,7%/+1,4%) und der SP (11,0%/+0,3%). Verliererin sind die CVP (31,3/-6,0%) und die FDP (18,9/-4,2%).

Die Wahlbefragung der Neuen Luzerner Zeitung kam der Sache beschränkt nahe. Falsch ist kein Trend. Verkannt wurde aber der Gewinn der SVP, die gemäss Umfrage wäre sie stabil geblieben. Verschätzt hat man sich auch bei der FDP, die mehr als erwartet verlor, bei der SP, die wenig gewann, und bei der GLP die mehr gewann.

Es kann gut sein, dass letzteres einen inneren Zusammenhang hat: Nachdem die GLP in Basellschaft und Zürich zulegte und zum vorrangigen Medienthema wurde, könnten potenzielle FDP- und SP-WählerInnen geschwenkt sein. Bei der SVP dürfte eine andere Ursachenanalyse zutreffen, denn bei ihr gibt es, vor allem auf dem Land einen stillschweigenden Wechsel gerade aus CVP-Kreisen, den man kaschiert.

Die mittlere Abweichung zwischen Resultate und Befragung betrug bei der zweiten Welle 1,54 Prozentpunkte je Partei. Das ist mehr als bei der ersten, wo der Vergleichswert bei 1,3 lag. Das ist unüblich. Es spricht dafür, dass sich verschiedene Probleme gemischt haben dürften.

Den Vergleich nicht scheuen muss die Wahlbörse von www.wahlfieber.at. Nimmt man hier den Tag vor der Publikation der Umfrage als Massstab (26.3.) betrug die Abweichung zum Ergebnis im Mittel 1,34 Prozentpunkte pro Partei. Die grösste Abweichung gibt es bei der FDP, für die die Wettgemeinschaft mehr Verluste erwartete, als es schliesslich der Fall war (2.2 Prozentpunkte Abweichung). Um je 2 Zähler überschätzt wurden dagegen GLP und GP. Damit war die Wahlbörse trendiger als die Wahlbefragung. Wo sich was an Veränderung abzeichnet, übertrieb man.

Bis am Schluss legte sich das noch ein wenig. Der Prognosefehler am Vortag der Wahl reduzierte sich auf weniger als 0,8 Prozentpunkte Abweichung.

Das führt mich zu folgenden Arbeitshypothesen:

1. Wahlbefragungen und Wahlbörsen interagieren. Wahlbörsen richten sich in einer frühen Phase an Wahlbefragungen aus; sie können jedoch auch zur Evaluierung der Sicherheit von Ergebnisse in Wahlbefragungen verwendet werden, insbesondere, wo man vergessene oder verschwiegene Antworten in Umfragen vermuten kann. Im aktuellen Fall betrifft das die SVP.
2. Trends in Wahlbörsen erhellen das Bild der Entwicklungen in der Zeit, während der keine Befragungen mehr gemacht werden dürfen. Im aktuellen Fall betrifft das sie Sammlung hin zur GLP.

Claude Longchamp

Warum Wahlbefragungen Sinn machen!

Sicher, es gibt Einfacheres als an der Schwelle zum Wahlkampf 2011 Wahlumfragen zu empfehlen. Ich mache es an den heutigen 3. Aarauer Demokratietagen gerade deshalb. Mit der Absicht, den Blick für Stärken und Schwächen von Tools in Wahlkämpfen zu schärfen.

in-schweiz-in-kuerze-bev
Wahlbefragung zeichnen ein Bild der politischen Schweiz – und sind damit mehr als Prognosen.

Die 10 letzten Anfrage, die ich in Sachen Wahlen 2011 von Medienschaffenden, PR-Agenturen und politischen Parteien erhalten habe, lauten zusammengefasst:

. Wie wählt der Mittelstand?
. Wann entscheiden sich die Wählenden verbindlich?
. Hat die BDP ihre WählerInnen eher von der SVP oder von FDP/CVP?
. Beteiligen sich Frauen immer noch weniger an Wahlen als Männer?
. Wie gross ist die Internetnutzung in politischen Kampagnen?
. Welche Themen kommen bei der Bürgerschaft an, welche nicht?
. Stimmen und Wählen AuslandschweizerInnen anders als InlandschweizerInnen?
. Wer wählt nicht?
. Ist Bäumle für die WählerInnen sympathisch?
. Haben Promi mehr oder weniger Wahlchancen?

Was hat sich in den letzten 20 Jahren bei Schweizer Wahlen geändert?

Zwei konnte ich nicht beamnworten: Ob es einen Unterschied zwischen Wählenden im In- und Ausland gibt, kann man nicht beantworten, weil man aus Datenschutzgründen keinen Zugang zu den Adressen der politisch eingeschriebenen AuslandschweizerInnen bekommt, und ob Bäumle im Wahlvolk ankommt oder nicht, weil wir das noch nie überprüft haben. Ob Promis mehr oder weniger Wahlchancen haben als Normalo, kann man in Umrissen auch mit anderen als Umfragedaten beantworten. Der Rest ist typisch demoskopischer Alltag.

Die Nachfrage nach teilnahme- und parteirelevanten Informationen aus BürgerInnen-Sicht an unserem kommt daher, dass die politische Statistik in der Schweiz in Vielem unterentwickelt ist. Manchmal ist es ein einfaches Interesse, das zu Anfragen beim gfs führt. Bisweilen sind es SchülerInnen und StudentInnen, die sich ein realistisches Bild der Schweizer Wählerin, des Schweizer Wählers verschaffen müssen. Oder es besteht ein professioneller Bedarf, möglichst präzisere Entscheidungsgrundlagen: Wer Kampagnen führt, will wissen, was das Potenzial seiner Aktion ist, welche Gruppen man auf der sicheren Seite hat, und wo noch verbreitete Unsicherheit besteht.

Erfahrungsgemäss gibt es drei Möglichkeiten, zu relevanten Antworten zu kommen:

. Man unterhält sich mit seinen peers, Arbeitskollegen oder im Familienkreis, und man macht sich so ein Bild, was im nahen Umfeld Sache ist.Vorteil: hohe Authentizität; Nachteil: die Antworten hängen von der eigenen gesellschaftlichen Stellung ab.
. Man liesst Zeitungen aufmerksam, um mehr über seine Umwelt zu erfahren: Vorteil: Erweiterung des Gesichtsfeldes; Nachteil: immer mehr Trendiges, immer weniger Gesichertes.
. Man macht es so wie in der Sozialforschung, greif auf Studienmaterial zurück: Vorteil: geprüfte Information; Nachteil: aktualisiert nicht immer verfügbar.

Mein Bild der Politik mache ich mir immer als Mix aus den drei Informationsquellen: Was ich den Massenmedien entnehme, nährt meine Fragen. Was ich in Studien finde, revidiert vorläufige Antowroten oder sichert sie. Was ich von letzterem in meinem Alltag wieder finde, ist für mich veranschaulicht.

Genau das zu tun empfehle ich allen, die Wahlbefragungen für sich nutzen wollen. Sie sind ein Teil der Virtualität von heute, lassen aber Bezüge zur Realität herstellen. Man nimmt sie über Medien zur Kenntnis, widersprechen lieb gewordenen Medieninterpretation jedoch häufig.

Was mich immer wieder wundert, wenn Medienschaffende uns kontaktieren und wenn wir ihre Berichte lesen: Die Neugier nach Ergebnissen in Recherchegesprächen ist häufig breit. Die Publikationen focussieren dann meist eine Frage: Sind die Prognosen richtig oder falsch? Den Rest verwendet man am liebsten ohne Quellenangaben in den eigenen Berichten.

Dies Verengung beeinflusst sogar die Fragestellungen, die man für Referate an wissenschaftlichen Tagung gestellt bekommt. So auch für meinen Beitrag in Aarau. Ich will mich dem weder entziehen, noch dabei stehen bleiben. Deshalb werde ich zu Prognosen von Wahlen reden, aber auch zum Nutzen von Umfragen in der Mediengesellschaft.

Hier die Referatsunterlagen.

Claude Longchamp

Politbarometer gleicht sich Wahlbarometer an

Mit dem heutigen Politbarometer der Sonntagszeitung werden die Stärken der Parteien demoskopisch neu bestimmt. Auffälligstes Ergebnis: Die Resultate sind fast identisch mit denen im herbstlichen Wahlbarometer der SRG. Neue Parteien haben Chancen zu gewinnen, während SVP und Grüne wenigstens gegenwärtig nicht mehr so mobilisiert sind wie 2007.

isop
Entwicklung der Parteienstärke gemäss Umfragen der SOZ 2007-2010

Das letzte Wahlbarometer von SRG/gfs.bern fand unmittelbar nach den Bundesratswahlen statt; das Politbarometer berücksichtigt zudem die Auswirkungen der Volksabstimmungen vom 28. November 2010. Darin liegen – politisch gesprochen – Welten. Denn im ersten Moment waren FDP und SP in Fahrt; jetzt ist es die SVP.

Dennoch sind die Unterschiede in den Parteistärken der beiden Befragungen gering – besser gesagt gering geworden. Bei der SP beträgt die Differenz zwischen beiden Messungen 1 Prozentpunkt, bei der BDP 0.9 Zähler. Je 0.6 Prozentpunkte sind es bei den Grünen und den Grünliberalen. Halb so viel resultiert bei der CVP, und bei FDP und SVP weichen die Resultate gerade um 0,1 Einheiten ab.

Die Uebereinstimmung war in den letzten 2 Jahren nicht immer so. Noch im September 2009 sah die Sonntagszeitung SVP und SP fast gleich auf. Der SVP wurden massive Verluste nachgesagt, der SP einige Gewinne. Nun hat sich das im neuesten Politbarometer ins Gegenteil verkehrt.

Das hat vor allem mit dem Score der SVP bei Isopublic zu tun, die von einer Umfrage zur anderen 3,3 Prozentpunkte zulegte. Aber auch die SP wird neu eingeschätzt, hat sie doch 1,9 Prozentpunkte weniger als noch vor drei Monaten.

Die Analyse für diese Sprünge bleibt allerdings weitgehend aus. Bei der SVP wird man den Abstimmungssieg in Sachen Ausschaffung vorbringen können. Bei der SP kann man an das Parteiprogramm erinnern. Fakten, ob das stimmt, gibt es leider nicht. Denn die Parteienprofile in Gesellschaftsgruppen werden nicht analysiert. Anders als das Wahlbarometer verzichtet das Politbarometer auch auf eine Wählerstromanalyse, genauso wie man in der Sonntagszeitung nichts über die Höhe der Teilnahmeabsichten am unterstellten Wahlgang erfährt.

Damit bleibt die Frage offen, ob man hier von Trends über Messinstrumente hinweg sprechen kann.

Formulieren wir es deshalb positiv: Die schweizerischen Wahlumfragen sehen (knapp ein Jahr vor den Wahlen) BDP und GLP als aussichtsreiche Wahlsiegerinnen. SP, FDP und CVP sind weitgehend stabil, während Grüne und SVP nicht mehr von der Mobilisierung wie 2007 profitieren können.

Was nicht ist, kann noch werden. Denn die einzig brauchbare Prognose ist die, die nicht eintrifft, weil man noch rechtzeitig gehandelt hat!

Claude Longchamp

Der Minarettsfall in Umfragen im Rückspiegel: Was war Sache, und was kann man daraus lernen?

Über Umfragen in Abstimmungskämpfen ist gerade in der Schweiz im Nachgang zur Minarett-Entscheidung viel debattiert worden. Die SRG sistierte die Publikation weiterer Umfragen vorerst und liess mehrere externe Experten die Studien begutachten. Zwischenzeitlich werden die Umfragen wieder gemacht und veröffentlicht, es wird aber zwischen einer Normal- und Spezialsituation unterschieden.

Die Gutachten

Matthias Jung von der Forschungsgruppe Wahlen kam in einer ersten, kurzen Ueberprüfung des Vorgehens zum Schluss, die Datenerhebungen und -auswertungen seien methodisch korrekt und entsprächen dem State of the Art. Die vermutete Handy-Problematik schloss er aufgrund deutscher Erfahrungen weitgehend aus. Soziale Erwünschtheit im Antwortverhalten zu kulturell tabuisierten Themen hält er im Einzelfall für eine mögliche Erklärung der Diskrepanz im Minarettsfall. Bestätigt wird diese Einschätzung auch damit, dass es bei den beiden anderen Vorlagen, die mit den gleichen Befragungen analysiert wurden, keine Daten- und Interpretationsprobleme gab.

Ein zweites, ausführliches Gutachten der Schweizer Mediensoziologen Kurt Imhof und Patrick Ettinger kritisierte den medialen Umgang mit Umfragen vor Abstimmungen. 44 Prozent aller Publikationen im Minaretts-Fall seien im Vergleich zu den Daten und Berichten überinterpretiert gewesen. Die Selbstsuggestion habe sich auf die redaktionelle Berichterstattung ausgewirkt. Den Produzenten und Erstvermittlern von Befragungen empfehlen die Experten, (noch) stärker als bisher den Charakter der Momentaufnahme zu deklarieren, von bisherigen Trends zu sprechen und die Unsicherheit des Ausgangs zu betonen. Soziale Erwünschtheit im Antwortverhalten als Folge von Meinungsdrucks schlossen auch sie nicht aus. Die Diskussion über ein Verbot der Plakate der Initiantinnen und Initianten hätte eine spezielle Situation geschaffen, die höchst kontrovers und emotional geführt worden sei. Sie raten, in vergleichbaren Situationen vermehrt auch auf andere Informationsquellen wie Online-Foren abzustellen. Auf quantifizierende Korrekturwerte für Umfragen verzichteten sie aber.

Das dritte, ebenfalls ausführliche Gutachten der Politikwissenschafter Markus Freitag, Adrian Vatter und Thomas Milic beschäftigte sich mit den unterstellten Wirkungen von Umfragen auf die Meinungsbildung. In Übereinstimmung mit den bisherigen Übersichten kommen sie zum Schluss, dass es auch im aktuellen Fall kaum empirisch gesicherte Belege für die Annahmen der Lethargie- oder Defätismus-Hypothesen gäbe. Drei Gründe bringen sie vor: Die Nutzerinnen und Nutzer publizierter Umfragen vor Abstimmungen entsprächen weitgehend dem Typ des multiplen Mediennutzers, der politisch überdurchschnittlich interessiert sei und ein weitgehend autonomes Selbstverständnis als Bürgerin respektive Bürger habe. Der aktuelle Fall weiche davon nicht ab, da es sich um eine im Alltag weitgehend bekannte Problematik handle, die thematische Prädispositionen schon vor dem Abstimmungskampf habe entstehen lassen. Statt von sozialer Erwünschtheit auszugehen, wäre es deshalb hilfreicher, von Entscheidungsambivalenz zu sprechen, wonach sich in Stimmabsichten sowohl Parteiloyalitäten als auch Alltagserfahrungen spiegeln, und zwar in einem variablen Verhältnis. Schliesslich relativierten sie Mobilisierungswirkungen von Umfragen. Sicher ausgeschlossen werden könne die Defätismus-Hypothese, weil die BefürworterInnen trotz negativer Aussichten gemäss Umfragen besonders stark mobilisiert gewesen seien. Weitgehend gilt das auch für die Lethargie-Hypothese, weil auch bei den Gegnergruppen eine im Vergleich zu allen Abstimmungen überdurchschnittliche Teilnahmehäufigkeit festgestellt werden konnte.

Diese Argumentationen der Experten überzeugten die SRG, das Instrument der Vorbefragungen weiterzuführen und die entsprechenden Studien nach einem einmaligen Unterbruch wieder zu publizieren. Angesichts der guten Erfahrungen mit rund 50 Abstimmungsvorbefragungen kann man davon ausgehen, dass sich Umfragen im Normalfall bewährt haben, im Spezialfall jedoch mit erhöhten Vorsichtsmassnahmen eingesetzt werden soll. gfs.bern hat 10 Vorsichtsmassnahmen für die eigenen Kontrollen erarbeitet.

Meine Folgerungen

Ob die im Minarettsfall ausgewiesenen Werte für die Stimmabsichten richtig oder falsch waren, konnte bis jetzt nicht eindeutig beantwortet werden. Unterstellt man soziale Erwünschtheit im Antwortverhalten, kann man von höheren Ja-Anteilen ausgehen, die aufgrund der tabuisierten Abweichung kaschiert worden seien. Folgt man dem Konzept der Entscheidungsambivalenz, können solche Annahmen täuschend sein. Nur die Relevanz der geäusserten Stimmabsichten wäre mit Blick auf den Abstimmungsentscheid stark eingeschränkt.

In der Wahlforschung ist man geneigt, solche Phänomene eher gemäss der sozialen Erwünschtheit zu interpretieren, und man kennt ansatzweise auch Korrekturfaktoren. Das heisst jedoch nicht, dass das auch bei Abstimmungen so wäre. Denn anders als bei wiederkehrenden Parteientscheidungen gibt es bei Abstimmungen angesichts der viel höheren Variabilität von Entscheidungsthemen keine eindeutigen Prädispositionen. Wenn schon leiten sie sich sowohl aus Alltagserfahrungen einerseits und parteipolitischen Bindungen anderseits ab. Strukturiert beides einen Abstimmungsentscheid in die gleiche Richtung, sollten keine Messprobleme in Umfragen entstehen. Stehen sie zueinander im Widerspruch, können Parteibindungen im Meinungsbildungsprozess in den Hintergrund treten und die Alltagserfahrungen den für den effektiven Abstimmungsentscheid determinieren.

In der Tat zeigten die verschiedenen Umfragen, die keine Mehrheit für die Minaretts-Initiative auswiesen, dass islamkritische Forderungen mehrheitsfähig waren und entsprechende Botschaften der Initiativ-Befürworter auf Zustimmung stiessen, ohne dass sie entscheidungsrelevant gewesen wären. Insbesondere bei parteipolitisch ungebundenen Bürgerinnen und Bürgern nahm deren Bedeutung für den Stimmentscheid erst mit der Zeit zu. Das lässt einen Meinungsumschwung durch plausibel erscheinen, wurde auch so kommuniziert, nach der Erstpublikation aber nicht mehr weiter vermittelt.

Unsere eigenen Erfahrungen mit Umfragen vor Abstimmungen decken sich weitgehend mit den übrigen Befunden der ExpertInnen. Es ist sogar gut möglich, dass beides drin ist: soziale Erwünschtheit und Entscheidungsambivalenz. In der Kommunikation ist das aber gar nicht das wichtigste: Das Hauptproblem ist sie mediale Stilisierung von Umfragen zu Prognosen. Die Medien suggerieren damit aber genau das Gegenteil von dem Umfragen gemäss Demoskopen sind: Momentaufnahmen. Gut gemachte Serien von Momentaufnahmen lassen gesicherte Trends erkennen, die im besten Fall auch eine Vorausschau erlauben. Punktgenaue Prognosen bleiben Abstimmungen Spekulation. Sinnvoller ist es, wenn man zuverlässig erkennt, ob eine Vorlage angenommen oder abgelehnt wird, oder ob die Entscheidung offen ist.

Claude Longchamp

Britische Befragungsinstitute trafen Wahlergebnis weitgehend

Die letzten Befragung zu den britischen Unterhauswahlen lagen mehrheitlich richtig – mit einem Abstrich bei den Liberaldemokraten.

icm
Selbstdarstellung ICM, dem Institut mit den genauesten Wahlbefragungen

ICM kam mit ihre Umfrage am Vortag der britischen Unterhauswahlen den effektiven Parteistärken am nächsten. Der durchschnittliche Fehler bei den drei grossen Parteien resp. den aufaddierten anderen Parteien beträgt 1,25 Prozentpunkte. Bei keiner Partei gab es eine Abweichung von mehr als 2 Prozent. Das kann als schwarz gelten!

Akkurat war auch die letzte Befragungswelle von Populus, Harris und Mori. Sie wiesen einen mittleren Fehler von 1,75 Prozentpunkte auf. Alle überschätzten sie aber die Stärke der Liberaldemokraten um einiges.

Das ist denn auch eine der interessantesten Beobachtungen, über die UKPollingReport heute zu den Wahlvorbefragung in Grossbritannien berichtet. Nachdem Labour bei frühreren Wahlen regelmässig überschätzt worden war, kam es diesmal zu einem gegenteiligen Effekt. Dafür stuften die Umfragen die Liberaldemokraten stärker ein, als sie am Ende waren.

Es mag Zufall sein, dass die genaueste Umfrage überhaupt nicht am Vortag, sondern am Vorvortag gemacht wurde. YouGove hatte am 4. April das Endresultat eigentlich fast punktgenau ermittelt. Vielleicht, könnte man auch folgern, folgt das auch einem System.

Denn am letzten Tag wissen alle Befragten, dass die Umfragen mit höchstem Prestige in der Oeffentlichkeit publiziert wird. Und vielleicht annimiert sie das, leicht verzerrende taktische Antworten zu geben.

UKPOLLINGREPORT

Am 6. Mai 2010 wählte Grossbritannien sein neues Parlament. Umfragen berichten über den Stand der Meinungsbildung. Und UKPOLLINGREPORT berichtet bis zum Wahltag über die demoskopischen Berichte. Ein Porträt der Metaberichterstattung.

Die Umfragen zu den britischen Parlamentswahlen überschlugen sich die letzten drei Tage. Mit der TV-Debatte zwischen den Spitzenkandidaten änderte sich die fast fixe Hackordnung unter den Parteien. Die Liberaldemokraten setzten sich gemäss Umfragen von BPIX und YouGov knapp an die Spitze, gefolgt von den Konservativen und den Sozialisten. Vergleiche der Vor- und Nachbefragungen zum Medienevent zeigten, dass insbesondere die unter 40jährigen, etwas weniger auch die Frauen mit ursprünglich konservativer Präferenz zur Meinungsänderung beitrugen, der schon festgeschriebene Umschwung das Wochenende aber kaum überlebte.

800px-UKGeneralElection2010ICMPolls_svg
Stand der Dinge bei den britischen Parlamentswahlen: Uebersicht über die einzelnen Umfragen zu den Wahlabsichten gemäss UKPR

UKPollingReport ist eine Plattform zu Umfragen vor den britischen Parlamentswahlen. Sie wird in Kooperation mit YouGov betrieben, berücksichtigt aber alle publizierten Polls. Das alleine hilft, die Uebersicht zu bewahren. Zudem erstellt UKPR einen Index der Parteistärken, der alle Resultate der letzten 20 Tage berücksichtigt. Und es findet sich eine Umrechnung der ermittelten Parteistärken auf erwartete Sitze im Unterhaus.

Beide Indikatoren sind naturgemäss stabiler als einzelne Ergebnisse. Demnach können die Konservativen unter David Cameron mit 34 Prozent der Stimmen rechnen, Labour unter Premier Gordon Brown mit 28 und die Liberaldemokraten unter Nick Clegg mit 27. Umgerechnet in Sitze könnte Labour mit 271 Vertretern stärkste Kraft bleiben, dicht gefolgt von den Conservativen mit 265 Sitzen und den Liberaldemokraten mit 82 Abgeordneten. Mit anderen Worten: gerechnet wird mit einem hung parliament, das heisst einem Unterhaus ohne Mehrheitspartei.

Selbstredend hängt das alles von den Methoden der Umrechnung und der Gewichtung von Umfragen im Index ab. UKPR weiss darum. Doch die alles entscheidende Frage ist welche. Und da gehen die Annahmen auchin Grossbritannien auseinander. Deshalb empfiehlt die Plattform die vergeschlagenen Index als gesichertere Annäherungen, die von tagesaktuellen Ausschlägen und methodischen Unterschieden zwischen den Instituten bereinigt sind.

Ein Blog macht die Plattform zusätzlich interessant. Teilweise resultieren Unmengen von Reaktionen auf Beiträge, wie etwa auf die Umfrage mit den Liberaldemokraten an der Spitze. Da meldeten sich schon mal 1000 Kommentatoren in weniger als 72 Stunden, um ihrer eigenen Analyse Ausdruck zu geben.

Am 6. Mai weiss man, welches Institut genauer resp. welcher Kommentar treffender war, als das rollende Mittel durch den Wahlkampf. Vorher ist dieses sicher zuverlässiger als die Aufgeregtheit einer einzelnen Stellungnahme zu einem einzelnen Medienbericht. Das könnte sich auch die Berichterstatter in den Schweizer Medien zu den britischen Parlamentswahlen zu Herzen nehmen.

Bundespräsidentin Doris Leuthard kommt gut an

Doris Leuthard, die aktuelle Bundespräsidentin, führt das neueste Bundesratsranking von Isopublic an. 77 Prozent der für die Sonntagszeitung resp. Le Matin Dimanche befragten 1003 Wahlberechtigten sind der Meinung, sie sollte in der Bundespolitik eine wichtige Rolle spielen. Damit verbesserte sie sich in den letzten 5 Monaten um 3 Punkte.

Vertrauen-in-Merz-und-Leuenberger-gesunken_teaser_wide

Didier Burkhalter, gerade mal solange im Amt, nimmt mit 68 Prozent Zuspurch neu den zweiten Platz ein, vor Eveline Widmer-Schlumpf (65%, -7 Prozentpunkte) und Micheline Calmy-Rey (61%, +5 Prozentpunkte) und Ueli Maurer (59%, +4%).

Leuthard und Burkhalter polarisieren in der Wahlbevölkerung kaum, Widmer-Schlumpf, Calmy-Rey und Maurer beschränkt, bei positivem Saldo. Genau das ist bei den beiden Schlusslichern nicht der Fall. Denn Hans-Rudolf Merz (44%, -3 Prozentpunkte) und Moritz Leuenberger (43%, -7 Prozentpunkte) ecken bei mehr Wahlberechtigten an, als sie Unterstützung finden. Damit polarisieren sie erheblich.

Eigentliche Gewinnerin der letzten Monate ist die Genfer Sozialdemokratin Calmy-Rey; sie legte am meisten zu. Ihr Parteikollege Zürcher Leuenberger verlor dafür mit der Bündnerin Widmer-Schlumpf von der BDP am meisten. Insgesamt verlieren die BundesrätInnen leicht an Zustimmung.

Bei den Wahlabsichten der Parteien halten sich die aktuellen Veränderungen der Messung vom 4. bis 17. Februar 2010 in engen Grenzen. Eine klarere Sprache ertönt, wenn man die jüngsten Messwerte mit den Wahlergebnissen 2007 vergleicht. Demnach gewinnt Calmy-Reys SP (+1,9%) und Leuthards CVP am ehesten hinzu (+1,4%). Die FDP, neu durch Burkhalter repräsentiert, verliert weiter (-1,2%). Noch grösser wären die Einbussen der SVP (-4,8%). Davon profitieren würde vor allem dei BDP (+4,3%, 2007 aber noch gar nicht existent).

Die Trends bei den BundesrätInnen sind klarer und plausibler. Jene bei den Parteien widersprechen teilweise den kantonalen Wahlergebnisse diametral, und auch den Messwerten von Isopublic für die Gemeindewahlen in der Stadt Zürich. Diese sehen bei der SVP keine wirkliche Trendwende zum Schlechteren, und bei der SP keine gesicherter zum Besseren.

Umfragen sind Bestandesaufnahmen – nicht mehr und nicht weniger

Zu den gröberen Missverständnissen in der öffentlichen Verwendung von Umfragen zählt, dass sie an sich als Prognosen gelesen werden. Meine Erfahrung lehrt mich vielmehr: Umfragen helfen, die Unsicherheit vor einer Entscheidung einschränken, nicht die Realität, die kommt, vorweg zu nehmen.

Hätten alle Menschen zu jedem Zeitpunkt eine feste Meinung, wäre alles ganz einfach. Man könnte heute eine Befragung aller oder eines Teils davon machen und wüsste, was morgen geschieht.

Doch trifft diese Annahme nicht zu!

Es gehört zum Wesen von Prozessen, nicht stabil, sondern dynamisch zu sein. Und es zählt zu den Eigenschaften sozialer Prozesse, nicht nach einer einfachen Mechanik zu funktionieren.

Vielmehr sind Meinungsbildungsprozesse interaktiv. Es lassen sich Einflussgrössen benennen, wie das Handeln der PolitikerInnen, der Medien, die politische Grosswetterlage und die Kampagnen vor einer Enscheidung. Genaue Zustände vorherzusehen, ist dagegen fast unmöglich.

Der Dispositionsansatz versucht dieser Auffassung von kollektiver Meinungsbildung gerecht zu werden. Entwickelt wurde er, um das Zusammenspiel von öffentlicher Meinung und Bürgermeinungen in konkreten Sachfragen zu analysieren.

Stimmabsichten sind weder stabil, noch entwickeln sie sich beliebig. Sie sind veränderlich, folgen dabei aer Gesetzmässigkeiten. Bei Abstimmungen kennt man verschiedene Effekte, die Veränderungen bewirken, recht gut:

1. Teilnahmeabstinenz: Unentschiedene oder Unschlüssige beteiligen sich nicht.
2. Meinungsaufbau: Unentschiedene bewegen sich am Schluss in beide Richtungen, nicht weil sie für etwas sind, aber weil sie gegen etwas sind.
3. Meinungsumschwung: Latent Entschiedene ändern ihre Meinung am Schluss in die umgekehrte Richtung.

So viel man darüber aus der Sicht der Theorie weiss, so gering sind die bisherigen empirischen Kenntnisse. Das macht es bisweilen schwierig, genau zu sagen, was nach einer Befragung geschieht. Trendbefragungen helfen, diese Unsicherheit zu verringern. Wo sie bleit, verzichten wir lieber darauf, mit wenig begründeten Faustregeln Extrapolationen von Umfragewerten zu machen, um Abstimmungsergebnisse zu prognostizieren.

Das hat für Medien und KonsumentInnen eine wichtige Konsequenz: Prognose müssen ausbleiben, vor allem dann, wenn die Dynamik der Meinungsbildung erst angefangen hat, in Veränderung begriffen ist, und wir nicht wissen, wo das alles endet. Wo man das im Griff hat, kann man Prognosen machen.

Von Umfragen sollte man nicht alles, aber auch nicht einfach nichts erwarten: Umfragen helfen, die Unsicherheiten vor einer Entscheidung einschränken, nicht aber die Realität, die kommen wird, vorweg zu nehmen.

Mein Dank an die Analysten-Konkurrenz

Noch schwankt “20 Minuten“, wenn es um Umfragen aus dem gfs.bern geht. Sohat die Redaktion nachgehakt. Bei der KollegeInnen-Konkurrenz. Was dabei herauskam, überrascht auch mich!

417192_1_20100126105953
Quelle: St. Galler Tagblatt

“Wer die Schweizer Politologieprofessoren nach der Glaubwürdigkeit von Claude Longchamp und seinen Studien fragt, kommt schnell zum Schluss: Claude Longchamp ist zwar keineswegs unumstritten. Die Fehler bei der Minarettabstimmung aber, so der Tenor der Experten, liege weniger an Longchamps Fähigkeiten, als dass es die Grenzen solcher Demoskopie-Prognosen aufzeige.

Michael Hermann, Sozialgeograf an der Uni Zürich, sagt: «Es ist einfach sehr schwierig, das Verhalten von Menschen vorauszusagen.» Georg Lutz, Professor für Poltikwissenschaft an der Uni Bern, meint: «Ich sage nicht, dass jemand besser Prognosen machen kann. Ich sage aber, dass man sich der Grenzen solcher Umfragen besser bewusst sein muss.»

Deshalb nehmen die Politikwissenschaftler auch die Medien in die Verantwortung. Besonders das Schweizer Fernsehen, welche die Untersuchungen bei Longchamp jeweils bestellt, muss Kritik einstecken. «Die SRG verkauft Longchamps Umfragen, die nur Bestandesaufnahmen sind, als Prognose», sagt die Politologin Regula Stämpfli.

Dies sei eine zeitlang gut gegangen, weil die Umfragen den Abstimmungsergebnissen mehr oder weniger entsprachen. «Jetzt rächt es sich, dass beim Fernsehen der Unterschied zwischen Umfrage und Prognose nie zum Thema gemacht wurde», meint Stämpfli.

Der Genfer Politologieprofessor Simon Hug vermutet, dass auch Longchamp damit nicht immer glücklich ist: «Ich habe das Gefühl, dass er oft gedrängt wird, mehr zu sagen, als er eigentlich kann.» Auch Hermann nimmt Longchamp in Schutz: «Er hat vor der Minarettabstimmung gewarnt, dass gerade diese Kampagne einen ungewöhnliche Dynamik habe.»

Die Medien hätten diesen Einwand aber kaum beachtet und lediglich die nackten Zahlen weitergegeben. Und weil Longchamp der einzige sei, der Prognosen abgebe, sei er auch der einzige, der Prügel beziehe, wenn sie daneben gingen.

Wirklichen Anlass zur Kritik gibt bei Claude Longchamp nur eine Sache: Die mangelnde Transparenz darüber, wie seine Umfrageergebnisse zustande kommen. Besonders dezidiert kommt die Kritik von den Universitätsprofessoren Simon Hug. Er meint: «Es ist fragwürdig, dass Longchamp seine Datenbasis und seine Methodik nicht veröffentlichen muss, obwohl die Umfragen von der SRG und damit mit öffentlichen Geldern finanziert werden.» In den USA und Frankreich würden Umfragedaten deshalb öffentlich gemacht.

Wenn die Daten offen lägen, würde man Longchamps Methodik nachvollziehen können, so Hug. «Es würde eine Debatte unter Politologen entstehen, dank der Fehler beseitigt und das System verbessert werden könnte.» Kann man der heute veröffentlichten Nachanalyse also trauen? «Ja», meint Regula Stämpfli: «Claude Longchamp bleibt ein solider Berufskollege, da man von ihm weiss, dass er aus Fehlern nicht nur viel lernt, sondern dann auch wirklich qualitativ Besseres herausbringt.»

Hierzu habe ich zwei Wünsche:

1. Eine Umfrage per se ist keine Prognose. Denn nur unter der Annahme, dass alle eine Meinung haben und diese nicht mehr ändern, wäre die Umfrage dem Ergebnis gleich. Doch stimmt die Annahme für keine einzigen der 53 untersuchten Abstimmungen für die SRG.
2. Abstimmungsumfragen sind nicht der letzte Stand der Dinge, weil die letzte vor eine Abstimmung 16-18 Tage vor dem letzten Abstimmungssonntag gemacht werden muss, um spätestens am 11. Tag vor der Abstimmung veröffentlich zu sein.

Zurecht wird im 20 min Artikel erwähnt, man stelle nur auf Zahlen ab, nicht auf Analysen und Interpretationen. Deshalb lege ich meine publizierten Untersuchungen immer offen. Sie steht just in time auf Internet abrufbar. In meinem letzten Blog bin ich bewusst auf solche Probleme eingegangen. Ansätze, Methoden und Vorgehenswesen sind in jedem Bericht beschrieben. Ich freue mich, wenn man sie inskünftig genauer liesst, kommentiert und mit Verbesserungen versieht.

Und noch etwas: Am meisten würde mich freuen, wen Journalisten aufhöhren würden, aus allem und jedem eine “todsichere Prognose” zu machen. Auch hierzu lohnt es sich, in meinem Bericht zur Minarett-Initiative nachzuschlagen.

Soziale Erwünschtheit in Umfragen zum Minarett-Verbot

Lange habe ich geschwiegen, was die SRG-Befragungen zur Minarett-Initiative beitrifft. Das war übrigens nicht der Fall, weil ich mich nicht äussern wollte, jedoch weil ich keine ungeprüften Aussagen in die Welt setzen wollte. Hier der Stand der Abklärungen.

Widerlegte Annahmen

Eine gfs-interne Untersuchung sowie eine externe eines unabhängigen Experten liegen zwischenzeitlich vor. Sie wurden weitgehend parallel erstellt, ohne dass ein direkter Gedankenaustausch stattfand. Sie vertiefen eine erste Analyse, die in der ersten Woche nach der Abstimmung gemacht worden war.

Die externe Evaluierung kommt zum Schluss, die Befragungen seien handwerklich korrekt und methodisch nach dem internationalen Standard erstellt worden. Beide Analysen widerlegen die Annahme, die Nutzer von nicht eingetragenen Handies seien für die ausgetretenen Probleme entscheidend. Dafür spricht vor allem, dass die gleiche Umfrage in den beiden anderen Vorlagen zu Ergebnissen vom 29. November mit der üblichen Genauigkeit führt.

Soziale Erwünschtheit ganz allgemein
Vielmehr legen beide Abklärungen das Hauptaugenmerk auf das Phänomen der sozialen Erwünschtheit. Damit bezeichnet man Verzerrung in Umfrage-Ergebnissen nicht-statistischer Art. Sie treten auf, weil Antworten, die normativ konform sind, anziehender wirke werden als umgekehrte.

Wäre die letzte Umfrage zur Minarett-Initiative am Freitag vor der Volksabstimmung gemacht resp. am Samstag davor publiziert worden, und wären die Mehrheiten gegensätzlich gewesen, würde man zurecht von Lügen in Umfragen sprechen.

Diese Uebersetzung von sozialer Erwünschtheit ist jedoch irreführend. Die letzte Befragung war am Abstimmungstag rund 18 Tage alt. Das lässt genügend Spielraum für spätere definitive Entscheidungen offen, die zu relevanten Verschiebungen in den Ja- und Nein-Anteilen führen. Auch die letzte Umfrage ist keine Prognose, sondern eine Momentaufnahme.

Soziale Erwünschtheit bei Entscheidungsambivalenz
Soziale Erwünschtheit in Abstimmungsbefragungen tritt dann auf, wenn während der Meinungsbildung erhebliche Ambivalenz vorliegt, die scih erst mit der verbindlichen Entscheidung zugunsten einer eindeutigen Stellungnahme aufgelöst wird.

Konkret: Ein Sympathisant der FDP weiss, dass seine Partei gegen die Initiative ist. Doch lassen ihn seine Alltagserfahrungen zweifeln, die Vorlage abzulehnen. Mit Muslimen verbinden ihn am Wohnort oder in den Medien nicht nur gute Erfahrungen. Dieses Gefühl hat in den letzten Jahren sogar zugenommen, und es ist seither der Nährboden, dass man auf Parolen gegen die Islamisierung der Schweiz anspricht – selbst wenn man bedenken hat, dass es zur wirtschaftlichen oder politischer Gegenmassnahmen bei einer Initiative-Annahme kommt.

In der Umfrage sagt diese Person, sie sei unentschieden, lässt aber bei den Argumenten erkennen, sie könnte zustimmen.

Soziale Erwünschtheit unter Kooperationsbereitschaft bei Interviews

Soziale Erwünschtheit kann auch aus einem anderen Grund zu Antwortverzerrungen führen. Vor allem dann, wenn der eigene Standpunkt in Abweichung zur Mehrheitsmeinung in der Politik gesehen wird, kann man versucht sein, ein Interview zu verweigern. Das wiederum führt zu unterschätzten Anteilen in der ausgewiesenen Zustimmung in der Umfrage, während die ausgewiesene Nein-Anteile zu hoch sind.

Auch hier ein Beispiel: Eine Frau, die wenig politisch ist, nicht immer an Abstimmungen teilnimmt, bei der Minarett-Abstimmung aber mit Ja stimmen will, getraut sich weniger schnell, ein Interview zu gewähren, als ein hochpolitischer Parteigänger, der auf der Nein-Seite steht.

Stand der Dinge
So hoch die Uebereinstimmung beider Evaluierungen in der Diagnose der Minarett-Befragungen ist, so schwer fällt es allen zu sagen, wie stark die benannten Effekte sind. Das hat mit den nur ansatzweise entwickelten Methoden zu tun, soziale Erwünschtheit empirisch messen zu können. Sicher ist vorerst nur, dass der erste der beiden Effekte wichtiger ist als der zweite.

Sicher ist auch, dass das ein seltener Fall ist, weshalb wir von einem durch das Thema bedingten Spezialfall sprechen, der aber bei diesem thema recht systematisch aufkommt, und zwar bei den Vor- wie bei den Nachbefragungen.