{"id":321,"date":"2013-09-24T10:09:35","date_gmt":"2013-09-24T08:09:35","guid":{"rendered":"http:\/\/www.hofstetter.at\/?p=321"},"modified":"2013-09-24T12:30:58","modified_gmt":"2013-09-24T10:30:58","slug":"stichprobenfehler","status":"publish","type":"post","link":"https:\/\/www.hofstetter.at\/index.php\/2013\/09\/24\/stichprobenfehler\/","title":{"rendered":"Stichprobenfehler"},"content":{"rendered":"<p>In Wahlzeiten wird sehr oft \u00c3\u00bcber den Fehler bei Umfragedaten diskutiert. Dabei gibt es viele Fehlerquellen wie die Wahl der falschen Stichprobe (gewisse W\u00c3\u00a4hlerschichten sind zb schwerer zu befragen als andere), der Befragte sagt nicht die Wahrheit und so weiter.<br \/>\nNeben diesen Fehlern gibt es auch den rein mathematischen <a href=\"http:\/\/de.wikipedia.org\/wiki\/Standardfehler\">Stichprobenfehler<\/a>, der daraus folgt, dass eben nicht alle Teilnehmer einer Wahl befragt werden k\u00c3\u00b6nnen, sondern eben nur ein kleiner Teil, eben die Stichprobe.<\/p>\n<p>Am einfachsten kann man sich den Stichprobenfehler bei sehr kleinen Stichproben vorstellen: Befragt man zur Nationalratswahl zum Beispiel nur drei Leute k\u00c3\u00b6nnte man als Antworten \u00c3\u2013VP, FP\u00c3\u2013 und Stronach erhalten. Der R\u00c3\u00bcckschlu\u00c3\u0178 das jeder dieser drei Parteien also 33.3% aller Stimmen erhalten werden ist nicht sonderlich stichhaltig.<\/p>\n<p>Der Fehler ist aber auch bei deutlich gr\u00c3\u00b6\u00c3\u0178eren Stichproben nicht zu vernachl\u00c3\u00a4ssigen hier als Beispiel eine Bev\u00c3\u00b6lkerung von 5.000.000 von den denen   <\/p>\n<table border=1>\n<tr>\n<td>SPO<\/td>\n<td>27<\/td>\n<\/tr>\n<tr>\n<td>OVP<\/td>\n<td>22<\/td>\n<\/tr>\n<tr>\n<td>FPO<\/td>\n<td>21<\/td>\n<\/tr>\n<tr>\n<td>Grune<\/td>\n<td>14<\/td>\n<\/tr>\n<tr>\n<td>Stronach<\/td>\n<td>6<\/td>\n<\/tr>\n<tr>\n<td>BZO<\/td>\n<td>4<\/td>\n<\/tr>\n<tr>\n<td>KPO<\/td>\n<td>1<\/td>\n<\/tr>\n<tr>\n<td>PIRAT<\/td>\n<td>1<\/td>\n<\/tr>\n<tr>\n<td>NEOS<\/td>\n<td>4<\/td>\n<\/tr>\n<\/table>\n<p>w\u00c3\u00a4hlen w\u00c3\u00bcrden. Diese Verteilung ist also die angenomme &#8222;Wahrheit&#8220; (ich habe eine der letzten Umfragen als Basis genommen). Zum Beispiel bedeudet das, dass in dieser Bev\u00c3\u00b6lkerung 1.350.000 Menschen die SP\u00c3\u2013 w\u00c3\u00a4hlen w\u00c3\u00bcrden.<\/p>\n<p>Zieht man jetzt aus dieser Bev\u00c3\u00b6lkerung jeweils Stichproben von 500 Befragten, so kann man zum Beispiel diese zehn folgenden Resultate erhalten:<\/p>\n<p><html><\/p>\n<p><head><br \/>\n<meta http-equiv=Content-Type content=\"text\/html; charset=windows-1252\"><br \/>\n<meta name=ProgId content=Excel.Sheet><br \/>\n<meta name=Generator content=\"Microsoft Excel 14\">\n<link rel=File-List href=\"umfrage-Dateien\/filelist.xml\">\n<style id=\"umfrage_28664_Styles\">\n<!--table\n\t{mso-displayed-decimal-separator:\"\\.\";\n\tmso-displayed-thousand-separator:\"\\,\";}\n.xl1528664\n\t{padding-top:1px;\n\tpadding-right:1px;\n\tpadding-left:1px;\n\tmso-ignore:padding;\n\tcolor:black;\n\tfont-size:11.0pt;\n\tfont-weight:400;\n\tfont-style:normal;\n\ttext-decoration:none;\n\tfont-family:Calibri, sans-serif;\n\tmso-font-charset:0;\n\tmso-number-format:General;\n\ttext-align:general;\n\tvertical-align:bottom;\n\tmso-background-source:auto;\n\tmso-pattern:auto;\n\twhite-space:nowrap;}\n-->\n<\/style>\n<p><\/head><\/p>\n<p><body><\/p>\n<div id=\"umfrage_28664\" align=center x:publishsource=\"Excel\">\n<table border=0 cellpadding=0 cellspacing=0 width=960 style='border-collapse:\n collapse;table-layout:fixed;width:720pt'><\/p>\n<col width=80 span=12 style='width:60pt'>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 width=80 style='height:15.0pt;width:60pt'>SPO<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>28.8<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>25.6<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>23.2<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>30.2<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>31.2<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>25.8<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>26.6<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>27.2<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>26.2<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>26.4<\/td>\n<td class=xl1528664 align=right width=80 style='width:60pt'>31.6<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>OVP<\/td>\n<td class=xl1528664 align=right>24.4<\/td>\n<td class=xl1528664 align=right>23.6<\/td>\n<td class=xl1528664 align=right>24.8<\/td>\n<td class=xl1528664 align=right>20<\/td>\n<td class=xl1528664 align=right>19.6<\/td>\n<td class=xl1528664 align=right>23.6<\/td>\n<td class=xl1528664 align=right>16<\/td>\n<td class=xl1528664 align=right>25.2<\/td>\n<td class=xl1528664 align=right>25<\/td>\n<td class=xl1528664 align=right>20.6<\/td>\n<td class=xl1528664 align=right>21.4<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>FPO<\/td>\n<td class=xl1528664 align=right>21.2<\/td>\n<td class=xl1528664 align=right>19.4<\/td>\n<td class=xl1528664 align=right>21.4<\/td>\n<td class=xl1528664 align=right>22<\/td>\n<td class=xl1528664 align=right>18.6<\/td>\n<td class=xl1528664 align=right>21<\/td>\n<td class=xl1528664 align=right>23.2<\/td>\n<td class=xl1528664 align=right>20.4<\/td>\n<td class=xl1528664 align=right>22.4<\/td>\n<td class=xl1528664 align=right>20.6<\/td>\n<td class=xl1528664 align=right>17.4<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>Stronach<\/td>\n<td class=xl1528664 align=right>4.8<\/td>\n<td class=xl1528664 align=right>7<\/td>\n<td class=xl1528664 align=right>6.4<\/td>\n<td class=xl1528664 align=right>5.8<\/td>\n<td class=xl1528664 align=right>6.4<\/td>\n<td class=xl1528664 align=right>5.4<\/td>\n<td class=xl1528664 align=right>7.8<\/td>\n<td class=xl1528664 align=right>7<\/td>\n<td class=xl1528664 align=right>5.4<\/td>\n<td class=xl1528664 align=right>6.4<\/td>\n<td class=xl1528664 align=right>5.6<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>Grune<\/td>\n<td class=xl1528664 align=right>11.8<\/td>\n<td class=xl1528664 align=right>15.6<\/td>\n<td class=xl1528664 align=right>14.4<\/td>\n<td class=xl1528664 align=right>15.2<\/td>\n<td class=xl1528664 align=right>14.8<\/td>\n<td class=xl1528664 align=right>13.2<\/td>\n<td class=xl1528664 align=right>14.8<\/td>\n<td class=xl1528664 align=right>11.4<\/td>\n<td class=xl1528664 align=right>13.2<\/td>\n<td class=xl1528664 align=right>15<\/td>\n<td class=xl1528664 align=right>14.2<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>BZO<\/td>\n<td class=xl1528664 align=right>3.2<\/td>\n<td class=xl1528664 align=right>4<\/td>\n<td class=xl1528664 align=right>4<\/td>\n<td class=xl1528664 align=right>2.2<\/td>\n<td class=xl1528664 align=right>3.8<\/td>\n<td class=xl1528664 align=right>5.4<\/td>\n<td class=xl1528664 align=right>3.8<\/td>\n<td class=xl1528664 align=right>3.2<\/td>\n<td class=xl1528664 align=right>3.4<\/td>\n<td class=xl1528664 align=right>5<\/td>\n<td class=xl1528664 align=right>4<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>KPO<\/td>\n<td class=xl1528664 align=right>1.2<\/td>\n<td class=xl1528664 align=right>1<\/td>\n<td class=xl1528664 align=right>1.6<\/td>\n<td class=xl1528664 align=right>0.2<\/td>\n<td class=xl1528664 align=right>1.4<\/td>\n<td class=xl1528664 align=right>0.8<\/td>\n<td class=xl1528664 align=right>1.2<\/td>\n<td class=xl1528664 align=right>0.8<\/td>\n<td class=xl1528664 align=right>1<\/td>\n<td class=xl1528664 align=right>1.4<\/td>\n<td class=xl1528664 align=right>1.6<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>PIRAT<\/td>\n<td class=xl1528664 align=right>1<\/td>\n<td class=xl1528664 align=right>1<\/td>\n<td class=xl1528664 align=right>1.4<\/td>\n<td class=xl1528664 align=right>1.2<\/td>\n<td class=xl1528664 align=right>0.4<\/td>\n<td class=xl1528664 align=right>0.6<\/td>\n<td class=xl1528664 align=right>2.2<\/td>\n<td class=xl1528664 align=right>0.6<\/td>\n<td class=xl1528664 align=right>0.4<\/td>\n<td class=xl1528664 align=right>0.6<\/td>\n<td class=xl1528664 align=right>0.4<\/td>\n<\/tr>\n<tr height=20 style='height:15.0pt'>\n<td height=20 class=xl1528664 style='height:15.0pt'>NEOS<\/td>\n<td class=xl1528664 align=right>3.8<\/td>\n<td class=xl1528664 align=right>3<\/td>\n<td class=xl1528664 align=right>3<\/td>\n<td class=xl1528664 align=right>3.4<\/td>\n<td class=xl1528664 align=right>4<\/td>\n<td class=xl1528664 align=right>4.4<\/td>\n<td class=xl1528664 align=right>4.6<\/td>\n<td class=xl1528664 align=right>4.4<\/td>\n<td class=xl1528664 align=right>3.2<\/td>\n<td class=xl1528664 align=right>4.2<\/td>\n<td class=xl1528664 align=right>4<\/td>\n<\/tr>\n<p> <![if supportMisalignedColumns]><\/p>\n<tr height=0 style='display:none'>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<td width=80 style='width:60pt'><\/td>\n<\/tr>\n<p> <![endif]><br \/>\n<\/table>\n<\/div>\n<p><!-----------------------------><br \/>\n<!--END OF OUTPUT FROM EXCEL PUBLISH AS WEB PAGE WIZARD--><br \/>\n<!-----------------------------><br \/>\n<\/body><\/p>\n<p><\/html><\/p>\n<p>Jede Spalte dieser Tabelle ist also das Ergebnis einer &#8222;Umfrage&#8220;. Alleine die rein mathematische Schwankungsbreite dieser Befragung ist beispielsweise bei der SP\u00c3\u2013 23.20 bis 31.60% oder bei den NEOS 3.00 bis 4.60%! Dabei geht man wie gesagt aber auch noch davon aus, dass die Auswahl der Stichprobe perfekt ist, und auch keiner der Teilnehmer die Unwahrheit sagt. <\/p>\n<p>Die Stichprobengr\u00c3\u00b6\u00c3\u0178e von 500 Teilnehmern habe ich deswegen gew\u00c3\u00a4hlt weil es ersten eine oft gew\u00c3\u00a4hlte Gr\u00c3\u00b6\u00c3\u0178e ist, und zweitens weil es mir auch als realistisches Beispiel f\u00c3\u00bcr den Fehler einer &#8222;realen&#8220; Umfrage mit 1000 Teilnehmern scheint. <\/p>\n<p>Sieht man sich meine Zahlen an, fragt man sich wie es die Meinungsforschungsinstitute schaffen <a href=\"http:\/\/de.wikipedia.org\/wiki\/Nationalratswahl_in_%C3%96sterreich_2013#Umfragen\">derart \u00c3\u00a4hnliche Resultate<\/a> zu produzieren.<br \/>\nWie stichhaltig die Vorhersagen sind, hat man ohnedies bei allen letzten Wahlen gesehen.<\/p>\n<p>F\u00c3\u00bcr diejenigen die es genau interessiert hier das Perl Script mit dem ich die Daten generiert haben &#8211; falls sich jemand damit genauer auseinandersetzen m\u00c3\u00b6chte, kann er mich gerne kontaktieren<\/p>\n<p><code><br \/>\nuse strict;<br \/>\nuse warnings;<\/p>\n<p>use Storable;<br \/>\nuse Data::Dumper;<\/p>\n<p>my $sample_size      = 500;<br \/>\nmy $sample_count     = 10;<br \/>\nmy $filename         = 'wahlausgang2013.nstore';<br \/>\nmy $population_count = 5_000_000;<\/p>\n<p>my %p = (<br \/>\n   SPO      => 27,<br \/>\n   OVP      => 22,<br \/>\n   FPO      => 21,<br \/>\n   Grune    => 14,<br \/>\n   Stronach => 6,<br \/>\n   BZO      => 4,<br \/>\n   KPO      => 1,<br \/>\n   PIRAT    => 1,<br \/>\n   NEOS     => 4,<br \/>\n);<\/p>\n<p>my $population = [];<\/p>\n<p>if (! -f $filename) {<br \/>\n  my @dist;<br \/>\n  foreach my $party (keys %p) {<br \/>\n    printf \"%s: %s%%\\n\", $party, $p{$party};<br \/>\n    for (my $i = 1 ; $i <= $p{$party}; $i++) {\n      push (@dist, $party);\n    }\n  }\n\n  my $stats = {};\n  for (my $i = 0; $i < $population_count; $i++) {\n    my $r = int(rand(100));\n    die \"*** out of bounds\" if $r < 0 || $r > 100;<br \/>\n    push $population, $dist[$r];<br \/>\n    $stats->{$dist[$r]}++;<br \/>\n  }<\/p>\n<p>  foreach my $party (keys %$stats) {<br \/>\n    printf \"%s [%s]%%\\n\", $party, $stats->{$party}\/$population_count;<br \/>\n  }<br \/>\n  Storable::nstore($population, $filename);<br \/>\n} else {<br \/>\n  $population = Storable::retrieve($filename);<br \/>\n}<\/p>\n<p>printf \"Population Size [%s], Sample Size [%s]\\n\", $population_count, $sample_size;<\/p>\n<p>my $stats = [];<br \/>\nfor (my $j = 0; $j <= $sample_count; $j++) {\n  for (my $i = 0; $i <= $sample_size; $i++) {\n    my $r = int(rand($population_count));\n    $stats->[$j]->{$population->[$r]}++;<br \/>\n  }<br \/>\n}<\/p>\n<p>foreach my $party (keys %{$stats->[0]}) {<br \/>\n  printf \"%s\", $party;<br \/>\n  for (my $j = 0; $j <= $sample_count; $j++) {\n    printf \" %3.2f\", $stats->[$j]->{$party}*100\/$sample_size;<br \/>\n  }<br \/>\n  print \"\\n\";<br \/>\n}<br \/>\n<\/code><\/p>\n","protected":false},"excerpt":{"rendered":"<p>In Wahlzeiten wird sehr oft \u00c3\u00bcber den Fehler bei Umfragedaten diskutiert. Dabei gibt es viele Fehlerquellen wie die Wahl der falschen Stichprobe (gewisse W\u00c3\u00a4hlerschichten sind zb schwerer zu befragen als andere), der Befragte sagt nicht die Wahrheit und so weiter. Neben diesen Fehlern gibt es auch den rein mathematischen Stichprobenfehler, der daraus folgt, dass eben [&hellip;]<\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[5,19,3,4,14,12],"tags":[],"class_list":["post-321","post","type-post","status-publish","format-standard","hentry","category-fotographie-photoshop","category-kinder","category-neuigkeiten","category-paragleiten","category-politik","category-zahlenspielereien"],"_links":{"self":[{"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/posts\/321","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/comments?post=321"}],"version-history":[{"count":15,"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/posts\/321\/revisions"}],"predecessor-version":[{"id":335,"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/posts\/321\/revisions\/335"}],"wp:attachment":[{"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/media?parent=321"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/categories?post=321"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.hofstetter.at\/index.php\/wp-json\/wp\/v2\/tags?post=321"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}