Stochastische Vorgänge
Inhalt
Zum Begriff „stochastischer Vorgang
Zum Begriff „Wahrscheinlichkeit“
Formale Aspekte des Wahrscheinlichkeitsbegriffs
Interpretation des Wahrscheinlichkeitsbegriffs im axiomatischen Sinne
Ermitteln von Wahrscheinlichkeiten
Qualitative Angabe von Wahrscheinlichkeiten
Wahrscheinlichkeiten und Chancen
Interpretieren von Wahrscheinlichkeiten
Vorbemerkungen
In diesem Text geht es um eine besondere Art von Vorgängen, die Gegenstand der Statistik und Wahrscheinlichkeitstheorie sind. Es wird ein Konzept unterbreitet, wie diese Vorgänge in den Wissenschaften modelliert und untersucht werden können. Dabei geht es insbesondere um Probleme, die mit den unterschiedlichen Interpretationen des Wahrscheinlichkeitsbegriffs und mit der Planung statistischer Untersuchungen zusammenhängen.
Um eine einheitliche begriffliche Fassung der Sachverhalte zu ermöglichen, wird als zusammenfassende Bezeichnung für die betreffenden Disziplinen der Name „Stochastik“ verwendet. Es geht um folgende Disziplinen (vgl. Krüger et al. 2015, S. 2–3):
- Mit einer über 2000-jährigen Geschichte ist die Beschreibende (Deskriptive) Statistik die mit Abstand älteste der Disziplinen. Ihre Anfänge liegen in den Volkszählungen im Römischen Reich und sie ist heute sogar in staatlichen Behörden, den statistischen Ämtern, institutionalisiert.
- In den 70er Jahren des 20. Jahrhunderts hat sich in Ausweitung der Methoden und Verfahren der Beschreibenden Statistik als neue Richtung in dieser Disziplin die sogenannte Explorative Datenanalyse (EDA), beginnend in den USA, entwickelt. Sie ist eine Alternative zur Mathematischen Statistik.
- Die Anfänge der Wahrscheinlichkeitsrechnung liegen im 17. Jahrhundert. Sie wurde zunächst als eine sogenannte gemischte Mathematik aufgefasst, d. h. als eine Wissenschaft, die analog etwa zur Optik oder Akustik nicht von ihren Anwendungen zu trennen ist. Erst in den 30er Jahren des 20. Jahrhunderts gelang es, die Wahrscheinlichkeitsrechnung axiomatisch zu fundieren und damit losgelöst von konkreten Objekten und realen Vorgängen als ein Teilgebiet der Mathematik aufzubauen.
- Bereits zu Beginn des 20. Jahrhunderts bildete sich, beginnend in den USA und England, als eine Anwendung der Wahrscheinlichkeitsrechnung auf die Auswertung von Daten die Mathematische (Beurteilende, Schließende, Induktive) Statistik (Inferenzstatistik) heraus, die aus zahlreichen Teilgebieten besteht und ein großes Anwendungsgebiet hat.
Diese Auffassung vom Begriff „Stochastik“ wird von den Mitgliedern des Arbeitskreises Stochastik in der Gesellschaft für Didaktik der Mathematik GDM vertreten, zu dem Didaktiker, Fachwissenschaftler und Lehrkräfte gehören, und ist Grundlage von Begriffen wie „Stochastikunterricht“ und „stochastische Allgemeinbildung“ (Arbeitskreis Stochastik der GDM 2003) sowie Titeln von Lehrbüchern zur „Didaktik der Stochastik“ (Krüger et al. 2015; Sill und Kurtzmann 2019).
Die Bezeichnung „Stochastik“ als Zusammenfassung mehrerer Disziplinen wird allerdings in der Literatur in unterschiedlicher Weise verwendet. So stellen z. B. Fahrmeir et al. (2007) fest, dass die Deskriptive Statistik und die Explorative Datenanalyse keine Stochastik verwenden. Hintergrund dieser Auffassungen sind die Irritationen, inwieweit Daten mit Unsicherheiten in Verbindung stehen. Daten werden in der Beschreibende Statistik als gesichert, unangreifbar und nicht mit zufälligen Momenten behaftet angesehen. Das halte ich für einen grundlegenden Irrtum, Daten entstehen im Ergebnis von Vorgängen mit variablen Einflussfaktoren als eine von mehreren Möglichkeiten. Daten sind genauso mit Unsicherheiten behaftet wie das Ergebnis des Würfelns. Bei einer Datenerfassung in der Statistik werden oft nur die Ergebnisse des Vorgangs erfasst und der Vorgang mit seinen Bedingungen nicht weiter betrachtet.
Unter „Stochastik“ wird aus Sicht von Mathematikern oft eine Zusammenfassung von Wahrscheinlichkeitsrechnung und Mathematischer Statistik verstanden (Büchter und Henn 2007; Müller 1991). Eine Ursache ist, dass viele Mathematiker die Beschreibende Statistik nicht als Wissenschaft ansehen. Es gibt auch die Auffassung, dass Stochastik die Zusammenfassung von Wahrscheinlichkeitsrechnung und Statistik ist, wobei die Statistik in die beschreibende und beurteilende Statistik eingeteilt wird (Henze 2023, S. 23).
Nach dem HWPh ist Stochastik „gegenwärtig wesentlich ein mathematischer Begriff der Wahrscheinlichkeitstheorie. Er bezeichnet die Berechnung von Prozessen, die nicht deterministisch sind, die eine Zufallsstreuung aufweisen“ (HWPh Bd. 10, S. 188). Stochastik ist kein Begriff der Wahrscheinlichkeitstheorie und es gibt auch in dieser Theorie nicht die Bezeichnung „Prozesse, die eine Zufallsstreuung aufweisen“.
Neben der Frage zum Inhalt des Begriffs „Stochastik“ zeigen sich in philosophischen Texten aber auch in den fachlichen Publikationen eine Reihe von Ungereimtheiten, Widersprüchen und auch fachlichen Fehlern. Es eröffnet sich damit ein großes Feld von Problemen, deren Diskussion aufgrund der Bedeutung der Stochastik eine vordringliche Aufgabe sein sollte. Stochastische Probleme sind Gegenstand zahlreicher Wissenschaften wie der Medizin, der Biologie, der Psychologie, den Sozialwissenschaften, den technischen und ökonomischen Wissenschaften und anderen. Das Umgehen mit Daten und das Treffen von Entscheidungen in unsicheren Situationen sind Bestandteile des persönlichen, beruflichen und politischen Lebens eines Bürgers. Deshalb müssen ausgewählte zentrale Begriffe der stochastischen Disziplinen auch als philosophische Begriffe expliziert werden. Dazu gehören die Begriffe Merkmal und Wahrscheinlichkeit.
Philosophischen Betrachtungen können zu einem tieferen Verständnis der Fachbegriffe führen. In 3.12 wurden Unzulänglichkeiten von Begriffserklärungen zum Begriff „Merkmal“ in der Statistik nachgewiesen und in 1.4 und 2.4 ein neuer Vorschlag zur Explikation und Anwendung dieses Begriffs unterbreitet und an Beispielen erläutert. Größere Probleme gibt es auch mit dem Begriff „Wahrscheinlichkeit“ sowohl in der Fachwissenschaft als auch in der Philosophie. In 3.26 werden einige dieser Probleme diskutiert. Die folgenden Vorschläge für Begriffsbildungen und Betrachtungsweisen können an dieser Stelle nicht umfassend dargelegt und nur mit wenigen Beispielen illustriert werden.
Zum Begriff „stochastischer Vorgang“
Stochastische Probleme können aus statischer oder dynamischer Sicht betrachtet werden. Bei einer statischen Betrachtung werden lediglich eingetretene Zustände untersucht. Diese Sichtweise ist durchaus sinnvoll, wenn die Entstehung der Zustände nicht betrachtet werden soll bzw. nicht betrachtet werden kann. Beispiele sind geographische Daten wie die Länge von Flüssen oder die Höhe von Bergen. Auch bei vielen statistischen Angaben zu Pflanzen und Tieren ist eine Betrachtung der Phylogenese oft nicht angebracht.
Bei Untersuchungen zum Wachstum einer Pflanze, zum Entwicklungsstand der Kenntnisse eines Kindes oder zum Wahlverhalten von Bürgern werden bei einer statischen Sichtweise wesentliche Zusammenhänge nicht erfasst. Die Daten sind ein Ergebnis von Vorgängen, wie dem Wachstum einer Pflanze, der Entwicklung der Kenntnisse eines Kindes oder der Entwicklung politischer Einstellungen von Bürgern. Um sie tiefgründig interpretieren zu können, müssen die Vorgänge, in deren Ergebnis die Daten entstanden sind und insbesondere die Einflussfaktoren dieser Vorgänge untersucht werden. Einflussfaktoren sind zum Beispiel die Bodenbeschaffenheit oder die Wasserversorgung einer Pflanze, die Gestaltung des Lernprozesses von Kindern oder die Aktivitäten politischer Parteien. Für solche Vorgänge soll der Begriff „stochastischer Vorgang“ verwendet werden.
Ein stochastischer Vorgang ist ein zeitlicher Vorgang der Veränderung eines Objektes in Bezug auf ein Merkmal in einem Zeitabschnitt mit mehreren möglichen Ergebnissen.
Die Möglichkeit unterschiedliche Ergebnisse ergibt sich aus den Bedingungen des Vorgangs. Wenn der Vorgang beendet ist und die Ergebnisse als Endzustand etwa im Ergebnis einer statistischen Untersuchung vorliegen, kann die Tatsache aus dem Blick verloren werden, dass auch andere Ergebnisse möglich gewesen wären. Wenn der Vorgang noch nicht beendet ist und Prognosen über seinen Ausgang angestellt werden sollen, werden die unterschiedlichen Ergebnismöglichkeiten eher in Betracht gezogen. Zu diesen können dann in bestimmten Fällen Wahrscheinlichkeiten für ihr Eintreten angegeben werden.
Die genannten Daten in den Beispielen entstehen im Ergebnis folgender stochastische Vorgänge, wobei auf die Angabe von Bedingungen der Vorgänge verzichtet wird.
- das Wachstum einer Pflanze vom Beginn der Aussaat mit dem Merkmal „Größe (Länge)“
- der Unterricht einer Klasse in einem Jahr mit dem Merkmal „Qualität der mathematischen Kenntnisse der Schüler“
- die Entwicklung politischer Einstellungen eines Bürgers in einem bestimmten Zeitabschnitt mit dem Merkmal „Einstellung zu einer bestimmten politischen Partei“
Bei einer wissenschaftlichen Untersuchung sind die Erfassung und Modellierung wesentlicher Bedingungen des Vorgangs anspruchsvolle Probleme, wobei oft bestimmte Faktoren in einem Realmodell vernachlässigt werden müssen.
Stochastische Vorgänge, die Gegenstand der Beschreibenden Statistik oder Explorativen Datenanalyse sind werden als statistische stochastische Vorgänge bezeichnet. Um einen solchen Vorgang mit diesem Modell zu erfassen, sind folgende Schritte erforderlich.
- Es sind der Vorgang sowie Anfang und Ende des Vorgangs zu bestimmen.
- Es sind das zu betrachtende Merkmal festzulegen und seine Ausprägungen, die sich im Laufe des Vorgangs ändern, zu ermitteln.
- Es muss die Ausprägung des Merkmals zu Beginn des Vorgangs bekannt sein.
- Es sind die Bedingungen zu bestimmen, die auf den Verlauf des Vorgangs Einfluss haben.
- Es sind die Ergebnisse des Vorgangs durch eine statistische Untersuchung zu bestimmen.
Als Beispiel sei ein Projekt zu Lieblingstieren betrachtet, das wir mit Erfolg mit Grundschulkindern durchgeführt haben (Sill und Kurtzmann 2019, S. 97). In Kurzfassung ergeben sich folgende Schritte:
- Es handelt sich um den Vorgang der Herausbildung von Einstellungen zu Tieren. Der Beginn des Vorgangs ist etwa im ersten Lebenshalbjahr eines Menschen zu verorten, insbesondere wenn das Kind mit Tieren im Haushalt aufwächst. Das zwischenzeitliche Ende des Vorgangs ist der Zeitpunkt der Befragung.
- Das Merkmal ist die Frage, welches Tier das Kind am liebsten hat. Als Ausprägungen kommen alle Tiere in Betracht, die im Erfahrungsbereich der Grundschulkinder liegen.
- Zu Beginn des Vorgangs sind noch keine Einstellung vorhanden, wenn man von eventuell vererbten Vorlieben absieht. Im Laufe des Vorgangs ändern sich in der Regel die Einstellungen.
- Als Bedingungen, die Einfluss auf den Vorgang haben, ist die Existenz von Tieren im mittelbaren oder unmittelbaren Umfeld, der eigene Umgang mit Tieren, die Beeinflussung durch Freunde und Familienmitgliedern, der Einfluss von Medien und andere Faktoren anzusehen.
- Die Ergebnisse des Vorgangs können durch eine Befragung der Kinder erfasst werden.
Diese Vorgänge laufen bei allen Kindern einer Grundschulklasse parallel ab. Wenn eine Befragung in der Klasse durchgeführt wird, ermittelt man den aktuellen Stand der Ausprägung des Merkmals bei den Kindern.
Der Unterschied von Vorgang und Zustand und damit die Bestimmung des Merkmals, dessen Ausprägungen sich im Laufe des Vorgangs ändern, ist in vielen Fällen nicht so offensichtlich wie in dem obigen Beispiel. Für den Vorgang „Frühstück essen“ kann das Getränk nicht als Merkmal des Vorgangs angesehen werden. Das von den Personen beim Frühstück verwendet Getränk ist Ergebnis des Vorgangs der Entwicklung von Trinkgewohnheiten der Person, die sich in einer Phase ihres Lebens herausgebildet haben. Das Getränk ist als Zustand eine Bedingung des Vorgangs, die zum Beispiel Einfluss auf ein „gesundes“ Frühstück hat.
Wenn bei einer Urlaubsfahrt das Transportmittel erfasst wird, so ist dies ebenfalls kein Merkmal der Fahrt, sondern das Ergebnis des Vorgangs „Planung der Reise“. Das Merkmal des Planungsvorganges sind die Vorstellung der Teilnehmer zur Art des Transportmittels, die sich im Laufe der Planungsdiskussion ändern können.
In der Statistik wird üblicherweise die Bezeichnung „Grundgesamtheit“ einer statistischen Untersuchung für die Menge der untersuchten Personen verwendet. Bei der vorgeschlagenen Betrachtungsweise ist die Grundgesamtheit die Menge aller parallel verlaufenden Vorgänge. Eine Zusammenfassung von Einzelvorgängen ist nur sinnvoll, wenn die Bedingung der Vorgänge im Wesentlichen gleich bzw. vergleichbar sind. So kann man im Beispiel zu den Lieblingstieren von Kindern nicht die Vorgänge bei Kindern aus Zentralafrika und aus Island in einer Grundgesamtheit zusammenfassen.
Ein zentrales Problem statistischer Untersuchungen ist die Interpretation der ermittelten Daten. Oft werden die Daten lediglich grafisch dargestellt, es werden statistische Kenngrößen ermittelt oder nach Mustern in den Daten gesucht. Um Daten fundiert interpretieren bzw. hinterfragen zu können, muss der Vorgang ihrer Entstehung in der oben angegebenen Weise untersucht werden. Ansonsten können die Ergebnisse von Befragungen lediglich mit Erstaunen, Erschrecken oder gar mit Wut zur Kenntnis genommen werden, wie etwa die zahllosen, in kurzen Abständen präsentierten Befragungsergebnisse zum Wahlverhalten von Bürgern. Angesichts der rapiden Änderung des Wahlverhaltens wäre es erforderlich, zumindest in Fallstudien die Ausprägung des Merkmals „Einstellung zu Parteien“ am Beginn einer längeren Zeitspanne, die in der Zeitspanne wirkenden Bedingungen und ihren Einfluss auf die Änderung der Einstellungen der Personen zu untersuchen.
Generell kann man feststellen:
Daten sind mehr wert, wenn man weiß, wie und woraus sie entstanden sind.
Zum Begriff „Wahrscheinlichkeit“
Stochastische Vorgänge, bei denen das Ergebnis noch nicht eingetreten bzw. unbekannt ist, werden als probabilistische[1] stochastische Vorgänge bezeichnet. Der mit diesen Vorgängen verbundene Begriff der Wahrscheinlichkeit hat zahlreiche Aspekte, zu den ist oft unterschiedliche Auffassungen in der Literatur gibt. Im Text Analysen zu Wahrscheinlichkeit und Chance werden diese in knapper Weise zusammengestellt und diskutiert. Im Folgenden soll ein Vorschlag zu einem System von Aspekten des Wahrscheinlichkeitsbegriffs vorgestellt werden, der im Wesentlichen auch in den Lehrbüchern (Krüger et al. 2015) und (Sill und Kurtzmann 2019) enthalten ist. Meine neuen Überlegungen zu den Begriffen Merkmal, Eigenschaft und Vorgang im Allgemeinen haben zu einer Modifizierung einiger der in den Lehrbüchern angegebenen Betrachtungen geführt. Dies ist ein erneuter Beleg der Bedeutung allgemeiner philosophischer Überlegungen für fachwissenschaftliche Begriffe und Methoden. Für mich wurde deutlich, wie verhaftet man in seinem eigenen Begriffssystem auch nach über 40-jähriger Beschäftigung mit diesen Fragen ist. Dies gilt sicher auch für alle Fachwissenschaftler, die ich mit meinen Überlegungen zu neuen Einsichten anregen möchte.
Formale Aspekte des Wahrscheinlichkeitsbegriffs
Der Begriff „Wahrscheinlichkeit“ wird in der Mathematik wie alle Grundbegriffe axiomatisch festgelegt. Es hat bis zum Jahre 1933 gedauert, bis der sowjetische Mathematiker Andrej Nikolaevič Kolmogorov ein allgemein akzeptiertes Axiomensystem entwickelt hat, das aus lediglich drei Axiomen besteht (vgl. Krüger et al. 2015, S. 239). Damit hat das Wort „Wahrscheinlichkeit“ wie alle axiomatisch festgelegten Begriffe zwei grundlegende Bedeutungen, die formale Bedeutung „Wahrscheinlichkeit im axiomatischen Sinne“ ohne einen konkreten Inhalt und „Wahrscheinlichkeit im interpretierten Sinne“ mit den jeweiligen Inhalten der Interpretation. Der Streit um den „richtigen“ Wahrscheinlichkeitsbegriff ist somit relativiert, alle Interpretationen sind „richtig“, sofern sie die Axiome erfüllen.
Nach dem Axiomensystem sind Wahrscheinlichkeiten reelle Zahlen im Intervall von 0 bis 1. Um die Zahlenwerte anschaulicher zu machen, werden Wahrscheinlichkeiten oft auch als Prozente von 0 % bis 100 % ausgedrückt. Dabei handelt es sich allerdings nicht um Prozente im eigentlichen Sinne, es gibt keinen Grundwert, Prozentwert oder Prozente über 100 %. Für Wahrscheinlichkeiten gilt zum Beispiel 0,1 = 10 %, was in der Prozentrechnung eine sinnlose Angabe ist.
Auf dem Axiomensystem basieren alle Begriffe und Sätze der Wahrscheinlichkeitstheorie, die auch Wahrscheinlichkeitsrechnung genannt wird. Zu den definierten Begriffen gehören unter anderem zufälliges Ereignis, Unabhängigkeit von Ereignissen und Erwartungswert. Auch diese Begriffe und die jeweiligen Sätze haben durch die Definition und Beweise einen formalen Charakter. Für alle gibt es auch nichtformale Aspekte, so hat etwa die Abhängigkeit bzw. Unabhängigkeit in der Alltagssprache und anderen Wissenschaften Gemeinsamkeiten und Unterschiede zu der formalen Bedeutung dieser Wörter in der Wahrscheinlichkeitstheorie. Darauf soll im weiteren nicht weiter eingegangen werden, es erfolgt eine Beschränkung auf den zentralen Begriff Wahrscheinlichkeit.
Interpretation des Wahrscheinlichkeitsbegriffs im axiomatischen Sinne
Die Debatten um den Wahrscheinlichkeitsbegriff drehen sich oft um die Bezeichnungen „objektive“ und „subjektive“ Wahrscheinlichkeit. Die jeweiligen Sichtweisen lassen sich in zwei Arten probabilistischer stochastischer Vorgänge einordnen.
Die erste Art sind Vorgänge mit nichtmentalen Objekten wie Pflanzen, Tiere oder Gegenstände. Für diese Vorgänge gilt: Die Wahrscheinlichkeit der Ergebnisse wird durch das Denken eines Menschen, der den Vorgang untersucht, nicht beeinflusst, d.h. sie existiert in diesem Sinne unabhängig („objektiv“) von Menschen. Auch wenn der den Vorgang betrachtende oder untersuchende Mensch Informationen zum Vorgang erhält, ändert sich dadurch nicht die Wahrscheinlichkeit der Ergebnisse. Menschen können aber durchaus Einfluss auf diese Vorgänge haben, wie etwa bei der Dressur von Tieren. Auch die Ausprägung des Merkmals „Qualität eines Produktes“ bei einem Produktionsprozess wird durch die Tätigkeit von Menschen beeinflusst.
Bei der zweiten Art von Vorgängen geht es um das Denken von Menschen, also um mentale Objekte. Das Merkmal dieser Vorgänge ist eine von dem Menschen geschätzte Wahrscheinlichkeit der Ergebnisse eines Vorgangs der ersten Art. Dieses Resultat des Denkens kann sich ändern, wenn der Mensch neue Informationen über diesen Vorgang erhält.
Es können bei Vorgängen der zweiten Art zwei Fälle unterschieden werden.
- Im ersten Fall ist der Vorgang der ersten Art, zu dem die Wahrscheinlichkeiten seiner möglichen Ergebnisse geschätzt werden sollen, noch nicht beendet. Dies betrifft etwa die Schätzung der Regenwahrscheinlichkeit eines Meteorologen für den morgigen Tag. Je mehr Informationen er über das aktuelle Wetter und vergleichbare Wetterlagen erhält, umso besser wird seine Schätzung der Regenwahrscheinlichkeit sein.
- Im zweiten Fall ist der Vorgang bereits beendet, dem Menschen ist aber das eingetretene Ergebnis nicht bekannt.
Ein einfaches Beispiel zum zweiten Fall liegt vor, wenn jemand würfelt, aber einem anderen nicht mitteilt, welche Augenzahl er gewürfelt hat. Dieser soll nun etwa die Wahrscheinlichkeit für eine „6“ schätzen. Hat der Schätzer keine weiteren Informationen und geht von einem idealen Würfel aus, wird er als Schätzwert 1/6 angeben. Wenn ihm mitgeteilt wird, dass es sich um eine gerade Zahl handelt, verändert sich seine Schätzung auf den Wert 1/3, da es drei gerade Augenzahlen gibt. Erfährt er dann noch, dass die Augenzahl durch 3 teilbar ist, kann er als Wahrscheinlichkeit für eine „6“ den Wert 1 angeben. Ein zweites, weit bedeutsameres Beispiel ist die Diagnosetätigkeit eines Arztes. Er muss die Wahrscheinlichkeit für eine bei einem Patienten eingetretene Krankheit schätzen. Nach den Aussagen des Patienten über seine Symptome zu Beginn der Untersuchung kann er auf dieser Grundlage die Wahrscheinlichkeiten für mögliche Krankheiten einschätzen. Wenn er dann weitere Untersuchungen und Tests durchführt, kann sich mit diesen neuen Informationen seine Wahrscheinlichkeitsschätzung für die möglichen Krankheiten ändern, sodass er am Ende wünschenswerter Weise mit großer Sicherheit seine Diagnose stellen kann.
Bei Vorgängen der zweiten Art und insbesondere im zweiten Fall wird in der Literatur oft von „subjektiven“ Wahrscheinlichkeiten gesprochen. Damit soll zum Ausdruck gebracht werden, dass die Angabe der Wahrscheinlichkeiten von den Kenntnissen und dem Denken eines Menschen abhängt. Weitere bedeutsame Beispiele für diese Vorgänge in der Wissenschaft sind Untersuchungen zur Wirksamkeit eines neuen Medikamentes, einer neuen Psychotherapie oder einer neuen Lernmethode. Aber auch im Alltag spielen sie eine große Rolle, wenn sich Einstellungen eines Menschen zu familiären, moralischen, kulturellen oder politischen Fragen in Abhängigkeit von neuen Erfahrungen oder Informationen ändern. Bei diesen Einstellungen geht es um geschätzte Wahrscheinlichkeiten der Eigenschaften eines Familienmitgliedes, der Bedeutung moralischer Normen, dem Wert eines Kulturguts oder der Qualität der Tätigkeit politischer Parteien. Generell kann man diese Vorgänge als Lernen aus Erfahrungen bezeichnen.
Aussagen über Ergebnisse eines stochastischen Vorgangs werden auch als Hypothesen bezeichnet. So kann bei einem Münzwurf die Hypothese lauten, dass beide Seiten gleichwahrscheinlich sind. Bei einer Diagnose stellt ein Arzt eine Hypothese über die vorliegende Krankheit eines Patienten auf und ein Pharmazeut hat eine Hypothese über die Wirkung eines neuen Medikamentes in einer klinischen Erprobung.
In Wissenschaften gehen die Meinungen auseinander, ob auch eine Hypothese eine Wahrscheinlichkeit haben kann. Dies wird etwa von Popper in seinem Buch Logik der Forschung generell abgelehnt (Keuth und Popper 2013, S. 192) mit Verweis auf den ausschließlich „objektiven“ Charakter des Wahrscheinlichkeitsbegriffs. Diese Meinung wird offensichtlich auch von der Mehrzahl der Statistiker und der Anwender statistischer Methoden vertreten. Zum Überprüfen von Hypothesen werden mehrheitlich sogenannte Signifikanztests bezeichnet werden. Bei diesen Tests werden zwei gegensätzliche Hypothesen, die Hypothese und eine Alternativhypothese anhand vorliegender Daten über zahlreiche Wiederholung des Vorgangs miteinander in Beziehung gesetzt und es wird entschieden, ob die Hypothese abgelehnt oder nicht abgelehnt werden kann. Dem Test wird eine Irrtumswahrscheinlichkeit zugrunde gelegt, die aber nicht die Wahrscheinlichkeit der Hypothese bzw. der Alternativhypothese ist, was oft fälschlicherweise angenommen wird.
Es gibt aber auch Wissenschaftler, die Hypothesen eine Wahrscheinlichkeit zu sprechen und damit den oben genannten Anwendungen von Vorgängen der zweiten Art weiter eher entsprechen. Der in diesem Fall verwendete Wahrscheinlichkeitsbegriffs, der oft als „subjektive“ Wahrscheinlichkeit bezeichnet wird, genügt ebenfalls den Axiomen. Es gibt entsprechende mathematische Verfahren zur Auswertung von Daten, die als Bayes-Statistik bezeichnet werden nach einem Satz der Wahrscheinlichkeitsrechnung, den der englische Geistliche, Philosoph und Mathematiker Thomas Bayes (1701-1761) als erster formuliert hat. Der Satz von Bayes erlaubt in einfachen Fällen die Berechnung der veränderten Wahrscheinlichkeit für unbekannte Zustände nach dem Vorliegen neuer Informationen. Aber auch in allen anderen Fällen lässt sich mit geeigneten Verfahren etwa die Wahrscheinlichkeit für die Wirksamkeit eines neuen Medikamentes auf der Grundlage von Testergebnissen berechnen.
Es gibt innerhalb dieser beiden Gruppen statistischer Verfahren zur Auswertung von Daten zahlreiche spezielle Verfahren für bestimmte Anwendungsgebiete. Es wäre aber sinnvoll und von großer praktischer Bedeutung, wenn die gegensätzlichen Auffassungen zur Wahrscheinlichkeit von Hypothesen auch unter Beteiligung von Philosophen diskutiert werden und generelle Empfehlungen für entsprechende Verfahren ausgesprochen werden.
Neben diesen nichtformalen Aspekten der beiden Interpretationen des axiomatisch schon Wahrscheinlichkeitsbegriffs gibt es noch eine Reihe weiterer (vgl. Krüger et al. 2015, S. 238–247; Sill und Kurtzmann 2019, S. 226–237).
Ermitteln von Wahrscheinlichkeiten
Nur in sehr wenigen Fällen lässt sich die Wahrscheinlichkeit eines Ergebnisses eines probabilistischen stochastischen Vorgangs mit einer Formel berechnen. Die Formel geht auf einen der Begründer der Wahrscheinlichkeitsrechnung zurück, dem französischen Mathematiker, Physiker und Astronomen Pierre-Simon Laplace (1749-1827), und heißt Laplace-Formel.
Berechnen von Wahrscheinlichkeiten mit der Laplace-Formel
Wie bei allen physikalischen Gesetzen müssen auch für die Laplace-Formel vereinfachende Annahmen gemacht, also ein Realmodell aufgestellt werden. Es wird modellhaft angenommen, dass alle möglichen Ergebnisse des Vorgangs die gleiche Wahrscheinlichkeit haben. Diese lässt sich dann mit der Formel als Quotient aus der Anzahl der günstigen zur Anzahl der möglichen Ergebnisse berechnen. Bei Wurf eines Würfels beträgt zum Beispiel unter den Modellannahmen nach dieser Formel die Wahrscheinlichkeit für eine bestimmte Augenzahlen 1/6. Typische Anwendung der Formel sind Glücksspiele sowie das Werfen von Münzen, Drehen von Glücksrädern, Lotto spielen oder blinde Entnahme von gleichen Objekten aus einem Behälter (als „Ziehen aus Urnen“ bezeichnet).
Aber schon beim Würfeln mit einem homogenen Quader gibt es keine Möglichkeit, aus seinen Maßen die Wahrscheinlichkeit für die Seiten zu berechnen, was bei gezinkten Würfeln ebenso nicht möglich ist. Häufig wird die Laplace-Formel als eine Definition der Wahrscheinlichkeit bezeichnet, was nicht zutreffend ist und es sich zudem um eine Zirkeldefinition handeln würde, da die Gleichwahrscheinlichkeit der Ergebnisse vorausgesetzt wird.
Bestimmung der Wahrscheinlichkeit auf der Grundlage von Daten aus Beobachtungen oder Experimenten
Wenn es möglich ist, die Vorgänge unter gleichen bzw. im Wesentlichen gleichen Bedingungen mehrfach zu wiederholen, kann die Wahrscheinlichkeit eines Ergebnisses auf der Grundlage der ermittelten Häufigkeiten geschätzt werden. Bei der Modellannahme einer Wiederholung unter genau gleichen Bedingungen lässt sich beweisen, dass mit zunehmender Anzahl von Wiederholungen die relative Häufigkeit des Ergebnisses im stochastischen Sinne gegen seine Wahrscheinlichkeit strebt (Gesetz der großen Zahlen, (Kütting und Sauer 2011, S. 180)). In der Realität ist immer nur eine endliche Anzahl von Wiederholungen und in den seltensten Fällen auch unter genau gleichen Bedingungen möglich. Mit Mitteln der Wahrscheinlichkeitsrechnung kann in allen Fällen eine sinnvolle Schätzung der Wahrscheinlichkeit durch Angabe eines bestimmten Intervalls vorgenommen werden.
Die so ermittelten Wahrscheinlichkeiten werden oft als frequentistische oder statistische Wahrscheinlichkeiten bezeichnet. Diese Formulierung ist nicht sinnvoll, da es sich nicht um einen neuen Wahrscheinlichkeitsbegriff handelt. Teilweise werden sogar Wahrscheinlichkeit und relativer Häufigkeiten gleichgesetzt oder die Wahrscheinlichkeit als Grenzwert der relativen Häufigkeit definiert wie in MLPh. Diese sogenannte Grenzwertdefinition der Wahrscheinlichkeit wurde erstmalig vom österreichischen Mathematiker Richard von Mieses angegeben. Der Grenzwert einer Folge als Begriff der Analysis ist in diesem Fall nicht anwendbar.
Der Zusammenhang zwischen relativer Häufigkeit und Wahrscheinlichkeit kann als Häufigkeitsinterpretation bezeichnet werden. Diese Interpretation ist Grundlage der objektivistischen Auffassung zum Wahrscheinlichkeitsbegriffs, bei der Wahrscheinlichkeit als ein Häufigkeitsmaß aufgefasst wird. Damit werden alle Vorgänge ausgeschlossen, die sich nicht bzw. nicht unter den gleichen Bedingungen beliebig oft wiederholen lassen, wie etwa ein Fußballspiel oder ein Pferderennen.
Einschätzung der Wahrscheinlichkeit auf der Grundlage von persönlichen Erfahrungen, Kenntnissen oder Vorstellungen
Die Wahrscheinlichkeit eines Ergebnisses kann von einer Person auf der Grundlage von Kenntnissen dieser Person über Bedingungen des Vorgangs geschätzt werden. Beim Schätzen von Wahrscheinlichkeiten allein auf der Grundlage von persönlichen Erfahrungen, Kenntnissen und Vorstellungen kann es zu Abweichungen von dem tatsächlichen Wert der Wahrscheinlichkeit kommen. Wenn es sich um verbreitet auftretende große Abweichungen handelt, wird meist von stochastischen Fehlintuitionen gesprochen. Diese Fälle sind Gegenstand zahlreicher insbesondere psychologischer Forschungen und werden oft als ein besonderes Problem der Ausbildung stochastischen Wissens und Könnens angesehen. Fehlerhafte Schätzungen sind aber an sich nichts Ungewöhnliches, sie treten auch beim Schätzen von Größen wie etwa bei Volumina oder großen Anzahlen auf.
Bestimmen der Wahrscheinlichkeit auf der Grundlage bereits bekannter Wahrscheinlichkeiten
Mit Regeln und Sätzen der Wahrscheinlichkeitsrechnung können aus bekannten Wahrscheinlichkeiten von Ergebnissen die Wahrscheinlichkeiten für weitere Ergebnisse berechnet werden, z. B. von Wahrscheinlichkeiten für zusammengesetzte Ergebnisse bei mehrstufigen Vorgängen, etwa durch Formeln oder sogenannte Fahrradregeln.
Qualitative Angabe von Wahrscheinlichkeiten
Es ist ein besonderes Anliegen der Vorschläge zum Stochastikunterricht in der Primarstufe in (Sill und Kurtzmann 2019) die Kinder mit dem Wahrscheinlichkeitsbegriff frühzeitig vertraut zu machen. Eine Grundlage sind die verständlichen Bedeutungen des Wortes „wahrscheinlich“, das in der Alltagssprache häufig verwendet wird. Neben stochastischen Vorgängen im Glücksspielbereich gibt es zahlreiche Unterrichtsvorschläge zu Vorgängen im familiären Freizeit- und schulischen Bereich. Dabei geht es stets um die Schätzung der Wahrscheinlichkeit künftiger Ergebnisse. In einem ersten Schritt sollen die Kinder entscheiden, welches von zwei möglichen Ergebnissen wahrscheinlicher ist, um dann später qualitative Einschätzungen der Wahrscheinlichkeit mehrere möglicher Ergebnisse mit einer vierstufigen Skala vorzunehmen (vgl. Sill und Kurtzmann 2019, S. 83).
Qualitative Beschreibung werden auch zur Interpretation von quantitativen Wahrscheinlichkeitsangaben benötigt.
Wahrscheinlichkeiten und Chancen
Anstelle von Wahrscheinlichkeit wird im Alltag auch oft von Chancen gesprochen. Während das Wort „Wahrscheinlichkeit“ nur mit mittlerer Häufigkeit verwendet wird, tritt das Wort „Chance“ sehr häufig auf. Es gibt nur im HWPh ein sehr kurzen Beitrag zum Stichwort „Chance“ (Winckelmann 2007), in dem das Verhältnis zu Wahrscheinlichkeitsbegriff unklar ausgedrückt wird. In anderen Publikationen, insbesondere auch in Schulbüchern, wird Chance und Wahrscheinlichkeit teilweise synonym verwendet oder sogar numerisch gleichgesetzt.
Zwischen beiden Begriffen gibt es enge Beziehungen. Wenn die Wahrscheinlichkeit für ein Ergebnis groß ist, sind auch die Chancen für das Eintreten dieses Ergebnisses groß und umgekehrt. Wenn die Wahrscheinlichkeit Null ist, sind auch die Chancen gleich Null. Ansonsten gibt es aber keine numerische Übereinstimmung zwischen beiden Angaben. Dies ist bereits bei der Wahrscheinlichkeit 0,5 ersichtlich, zu der in der Alltagssprache formuliert wird, dass die Chancen 1 : 1 (oder fifty-fifty) stehen.
Unter den Chancen (engl. Odds) für das Eintreten eines Ergebnisses versteht man das Verhältnis der Wahrscheinlichkeit des Ergebnisses zur Wahrscheinlichkeit des gegenteiligen Ergebnisses. So sind die Chancen für das Werfen einer 6 unter der Annahme der Gleichverteilung das Verhältnis von 1/6 zu 5/6, also 1 : 5. Es ist üblich, Chancen als Verhältnisse anzugeben. Wenn umgekehrt die Chancen für ein Ergebnis 9 : 1 stehen, beträgt die Wahrscheinlichkeit des Ergebnisses 9/10. Chancen können also im Unterschied zur Wahrscheinlichkeit beliebig groß werden.
Borovcnik (1992) hat sich ausführlich mit der Bedeutung und den Möglichkeiten der Arbeit mit Chancenverhältnissen insbesondere zur intuitiven Aufklärung des Bayes-Ansatzes beschäftigt.
Interpretieren von Wahrscheinlichkeiten
Im Alltag ist das Interpretieren von Wahrscheinlichkeitsangaben wichtiger als ihr Ermitteln. Dabei können folgende Fälle eintreten.
Aussagen zum zukünftigen Eintreten von Ergebnissen
Vor dem Ablauf eines Vorgangs können mithilfe von Wahrscheinlichkeitsangaben Aussagen über die möglichen Ergebnisse getroffen werden. Dabei kann es sich um bereits bekannte Wahrscheinlichkeiten oder auch um Schätzungen handeln. Mit der Wahrscheinlichkeitsaussage wird zum Ausdruck gebracht, wie sicher man sich sein kann, dass ein bestimmtes Ergebnis eintritt oder auch in welchem Maße man das Ergebnis erwarten kann. Diese Art der Interpretation kann als Grad der Sicherheit bzw. Grad der Erwartung bezeichnet werden. Der Begriff Erwartung ist dabei nicht mit dem Erwartungswert zu verwechseln. Der Grad der Erwartung ist eine Wahrscheinlichkeitsangabe, der Erwartungswert ist eine Größe oder eine reelle Zahl. So kann man vor dem nächsten Wurf eines Würfels auf der Grundlage der bekannten Wahrscheinlichkeit für eine 6 formulieren, dass man viel eher keine 6 als eine 6 erwarten kann
Aussagen über ein eingetretenes und bekanntes Ergebnis
Nach Ablauf eines Vorganges können auf der Grundlage der bekannten oder geschätzten Wahrscheinlichkeit des Ergebnisses geeignete Aussagen formuliert werden, die zum Ausdruck bringen, ob die Erwartungen erfüllt oder eher nicht erfüllt sind. Wenn eine 6 gewürfelt wurde, kann man sagen, dass dies eher nicht zu erwarten war, und kann sich darüber besonders freuen. Würfelt man keine 6, so muss man darüber nicht besonders erstaunt sein und wird im nächsten Wurf auf mehr Glück hoffen.
Aussagen über ein eingetretenes aber unbekanntes Ergebnis
Wenn das eingetretene Ergebnis eines stochastischen Vorganges einer Person nicht bekannt ist, so kann diese durch eine Wahrscheinlichkeitsaussage zum Ausdruck bringen, wie sicher sie sich ist, ob ein bestimmtes Ergebnis eingetreten ist. Die dabei angestellten Überlegungen der Person beruhen auf ihren Kenntnissen über den Vorgang und auf Informationen, die sie zu dem eingetretenen Ergebnis bekommt. Mit der Zunahme weiterer Informationen kann sich die Person immer sicherer sein, welches Ergebnis eingetreten ist. Auch diese Art der Interpretation einer Wahrscheinlichkeitsangabe kann als Grad der Sicherheit bezeichnet werden. Ein Beispiel sind die Überlegungen eines Studenten nach einer Klausur, ob er sie bestanden hat
Prognosen der zu erwartenden Häufigkeit bei mehrmaligem Ablauf des Vorgangs unter gleichen Bedingungen
Wenn man den Vorgang unter gleichen Bedingungen mehrfach wiederholen kann, so sind Vorhersagen der zu erwartenden absoluten Häufigkeiten möglich. Diese entsprechen dem Erwartungswert der Wiederholungen der zugrunde gelegten Binomialverteilung. Wenn das Ergebnis die Wahrscheinlichkeit p hat und der Vorgang n-mal unabhängig voneinander wiederholt wird, so ist der Erwartungswert für die Häufigkeit des Ergebnisses n∙p. Dies wird auch als Häufigkeitsinterpretation der Wahrscheinlichkeit bezeichnet. Die tatsächliche Häufigkeit kann von dem erwarteten Wert mehr oder weniger stark abweichen. Eine Vorhersage für die Häufigkeit des Ergebnisses „Zahl“ bei 30 Münzwürfen sollte in folgender Form erfolgen: Es ist etwa 15-mal das Ergebnis „Zahl“ zu erwarten, die Häufigkeit des Ergebnisses kann aber auch größer oder kleiner sein.
Interpretieren sehr kleiner Wahrscheinlichkeiten
Ergebnisse mit sehr kleiner Wahrscheinlichkeit spielen im alltäglichen Leben eine besondere Rolle. Sie sind entweder mit sehr großen Glücksmomenten (Hauptgewinn im Lotto spielen) oder großem Leid (tödlicher Autounfall) verbunden. Es ist ein Bestandteil stochastischer Bildung der Bürger, für das tägliche Leben geeignete Einstellungen zu solchen Ereignissen zu haben. Dazu gehört die Einsicht, dass Ergebnisse mit sehr geringer Wahrscheinlichkeit zwar äußerst selten vorkommen, aber bei einer genügend großen Zahl von Wiederholungen die Wahrscheinlichkeit, dass dieses Ergebnis mindestens einmal auftritt, recht groß sein kann. Auf dieser Tatsache basieren z.B. die Argumente der Atomkraftgegner. Auch wenn Wahrscheinlichkeit für einen Lottogewinn sehr geringes, gibt es doch häufig Menschen, die im Lotto große Gewinne haben. Es sollte aber auch verhindert werden, dass zu große Hoffnungen in Glücksfälle gesetzt werden bzw. zu große Befürchtungen vor Unglücksfällen bestehen. Nach Kitaigorodski (1977) sollten Ereignisse mit Wahrscheinlichkeiten kleiner als 10-6 von einem einzelnen Menschen in seinem täglichen Leben vernachlässigt werden. In dieser Größenordnung liegen etwa die Wahrscheinlichkeiten für einen Hauptgewinn im Lotto oder für einen tödlichen Autounfall.
Literaturverzeichnis
Arbeitskreis Stochastik der GDM (2003): Empfehlungen zu Zielen und zur Gestaltung des Stochastikunterrichts. In: Stochastik in der Schule 23 (3), S. 21–26.
Borovcnik, Manfred (1992): Stochastik im Wechselspiel von Intuitionen und Mathematik. Mannheim: BI-Wiss.-Verl. (Lehrbücher und Monographien zur Didaktik der Mathematik, 10). Online verfügbar unter http://www.gbv.de/dms/ilmenau/toc/016110897.PDF.
Büchter, Andreas; Henn, Hans-Wolfgang (2007): Elementare Stochastik. Eine Einführung in die Mathematik der Daten und des Zufalls ; mit 45 Tabellen. 2. Aufl. Berlin, Heidelberg, New York: Springer.
Fahrmeir, Ludwig; Künstler, Rita; Pigeot, Iris; Tutz, Gerhard (2007): Statistik. Der Weg zur Datenanalyse. Sechste, überarbeitete Auflage. Berlin, Heidelberg: Springer-Verlag Berlin Heidelberg.
Henze, Norbert (2023): Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 14. Aufl. 2023. Berlin, Heidelberg: Springer Berlin Heidelberg. Online verfügbar unter https://nbn-resolving.org/urn:nbn:de:bsz:31-epflicht-3090915.
Keuth, Herbert; Popper, Karl R. (Hg.) (2013): Logik der Forschung. Herausgegeben von Herbert Keuth. 4., bearb. Aufl. Berlin: Akad.-Verl. (Klassiker Auslegen, 12).
Kitaigorodski, Alexander (1977): Unwahrscheinliches-möglich oder unmöglich? Moskau, Leipzig: Verlag MIR, Fachbuchverlag Leipzig.
Krüger, Katja; Sill, Hans-Dieter; Sikora, Christine (2015): Didaktik der Stochastik in der Sekundarstufe I. Berlin: Springer Spektrum (Mathematik Primarstufe und Sekundarstufe I + II). Online verfügbar unter http://dx.doi.org/10.1007/978-3-662-43355-3.
Kütting, Herbert; Sauer, Martin J. (2011): Elementare Stochastik. Mathematische Grundlagen und didaktische Konzepte. 3., Aufl. Heidelberg: Spektrum Akad. Verl. Online verfügbar unter http://www.worldcat.org/oclc/711835764.
Müller, Paul Heinz (Hg.) (1991): Wahrscheinlichkeitsrechnung und mathematische Statistik. Lexikon der Stochastik. 5. Aufl. Berlin: Akad.-Verl.
Sill, Hans-Dieter; Kurtzmann, Grit (2019): Didaktik der Stochastik in der Primarstufe. Berlin: Springer Spektrum (Mathematik Primarstufe und Sekundarstufe I + II).
Winckelmann, Johannes (2007): Chance. In: Joachim Ritter, Karlfried Gründer und Gottfried Gabriel (Hg.): Historisches Wörterbuch der Philosophie, Bd. 1. 13 Bände. Basel: Schwabe, S. 979–980.
[1] Probabilistisch heißt „der Wahrscheinlichkeit nach“, nach probability (engl.) Wahrscheinlichkeit