Der Begriff Merkmal und andere Grundbegriffe der Beschreibenden Statistik[1]

PDF-Datei

1     Beschreibende Statistik in Schule und Lehrerbildung

Während in den Lehrplänen und Lehrbüchern für nicht gymnasiale Bildungsgänge die Beschreibende Statistik schon immer einen großen Stellenwert besitzt, gewinnt sie – ausgelöst durch die KMK-Bildungsstandards – auch in gymnasialen Bildungsgängen in den letzten Jahren zunehmen an Bedeutung. Zuvor trat sie oft nur am Rande auf.

Probleme der Einordnung der Beschreibenden Statistik in ein Stochastik-Curriculum zeigen sich bereits bei der Erklärung des Begriffs „Stochastik.“ So tritt etwa im Lehrbuch „Didaktik der Stochastik“ von Kütting (1994) die Beschreibende Statistik gar nicht auf. Büchter & Henn (2011) sowie Müller (1991) verstehen unter Stochastik die Zusammenfassung von Wahrscheinlichkeitsrechnung und mathematischer Statistik. Einen interessanten Vorschlag unterbreitet Stahel (2002), der die sich gegenseitig überschneidenden Gebiete Stochastik, Statistik, angewandte Statistik und statistische Datenanalyse unterscheidet (S. 5).

Wenn die Beschreibende Statistik in mathematischen Fachbüchern erwähnt wird, erfolgt lediglich eine knappe Darstellung einiger grundlegender Begriffe und Verfahren. (Henze 2012, Kütting & Sauer 2011, Stahel 2002). Ein aktuelles mathematisches Fachbuch zur Beschreibenden Statistik habe ich vergeblich gesucht und nur umfassende Darstellungen von Wissenschaftlern aus Anwendungsbereichen gefunden (Bourier 2011, Fahrmeir u.a. 2007, Schäfer 2010).

2     Grundbegriffe der Beschreibenden Statistik in der Fachliteratur

Während die Grundbegriffe der Wahrscheinlichkeitsrechnung seit ihrer axiomatischen Fundierung durch Kolmogorov exakt festgelegt werden können, ist dies für die Grundbegriffe der Statistik bisher nicht der Fall. Dies ist sicher eine der Ursachen dafür, dass die Beschreibende Statistik nicht als ein Teilgebiet der Mathematik anerkannt wird. Ihre grundlegenden Begriffe werden oft nur beschrieben und sehr selten wird der Versuch einer Definition unternommen, wie es etwa Ferschl (1978) in ausführlicher Weise versucht hat. So wird etwa der Begriff Merkmal erklärt als

  • eine Klasseneinteilung der Grundgesamtheit. (Ferschl 1978),
  • interessierende Größe einer statistischen Einheit (Fahrmeier 2007), (Henze 2012) oder
  • Bezeichnung für eine Menge von Merkmalsausprägungen (Schäfer 2010).

Eine besonders große Vielfalt findet man bei den Klassifizierungen von Merkmalen, Skalen und Datenarten. So gibt es in der Literatur unter anderem folgende Bezeichnungen für verschiedene Arten von Merkmalen:

  • dichotomes, Nominal-, Rang-, metrisches Merkmal
  • nominalskaliertes, rangskaliertes, metrisch skaliertes Merkmal
  • qualitatives, quantitatives Merkmal
  • artmäßiges, intensitätsmäßig abgestuftes Merkmal
  • kategoriales, numerisches Merkmal
  • diskretes, stetiges, kontinuierliches, quasi-stetiges, diskretisiertes stetiges Merkmal
  • häufbares, nicht-häufbares Merkmal, erschöpfendes Merkmal

Mit dem Ziel der Entwicklung eines möglichst einfachen und minimalen Begriffssystems soll zunächst ein genereller Zugang diskutiert werden.

3     Zum Begriff und zur Modellierung stochastischer Situationen

In der Literatur werden unter stochastischen Situationen oft nur Situationen verstanden, in denen Ereignisse mit einer bestimmten Wahrscheinlichkeit auftreten. Bei der Modellierung dieser Situationen wird der Beschreibenden Statistik, wenn überhaupt nur eine Rolle zur Beschreibung und Bestandsaufnahme der Realität zugewiesen (Wolpers 2002, S. 48). Unter der eigentlichen Modellierung wird dann in der Regel die Anwendung wahrscheinlichkeitstheoretischer Begriffe wie Zufallsexperiment, Ergebnismengen, Zufallsvariable, Wahrscheinlichkeitsmaß sowie von Modellen wie etwa der Binomialverteilung verstanden (Henze 2012, Kütting & Sauer 2011, Wolpers 2002).

In der Schule wird der Begriff „Stochastik“ als Sammelbezeichnung für die Beschreibende Statistik, die Explorative Datenanalyse, die Wahrscheinlichkeitsrechnung und die Mathematische Statistik verwendet. Deshalb sollte der Begriff „stochastische Situation“ so weit gefasst werden, dass er die Gesamtheit der Anwendungsbereiche aller dieser Wissenschaften abdeckt.

Bei der Modellierung stochastischer Situationen, die mit dem Erfassen von Daten verbunden sind, geht es nach Eichler & Vogel (2009) darum, „aus einer realen Ausgangssituation heraus ein Realmodell zu erstellen, das sich in den Daten abbildet. Dieses Realmodell (die Daten) bildet den Ausgangspunkt für die Bearbeitung mit mathematischen Mitteln (dem Mathematisierungsprozess) …“ (S. 17).

Anknüpfend an diese Betrachtungen werden zur theoretischen Analyse der Grundbegriffe der Beschreibenden Statistik drei verschiedene „Ebenen“ unterschieden.

  1. Ebene der realen Vorgänge oder Zustände (Ebene R)
  2. Ebene der Realmodelle (Ebene RM)
  3. Ebene der theoretischen Modelle (Ebene TM)

Bei der Ebene R handelt es sich um objektive, von menschlichen Erkenntnisvorgängen unabhängige Dinge. Zu Elementen dieser Ebene gehören auch Gedanken, Kenntnisse, Interessen, Gefühle und andere psychische Prozesse oder Zustände, wenn sie von erkennenden Subjekten als Gegenstand ihrer Untersuchungen (z. B. einer Befragung zu Einstellungen) gewählt werden.

Um eine Modellierung vornehmen zu können, müssen in der Ebene R Mengen realer Objekte bzw. Zustände identifiziert werden, die hier als Trägermengen bezeichnet werden. In der Literatur werden sie auch als Grundgesamtheit, statistische Einheiten, statistische Masse oder das empirische Relativ (Schäfer 2010) bezeichnet. Für eine statistische Untersuchung müssen diese Mengen sächlich, zeitlich und räumlich klar abgegrenzt werden. Es sind also bereits geistige Prozesse zur Strukturierung von Elementen der Ebene R erforderlich, bevor eine Modellierung erfolgen kann.

Um an den Elementen der Trägermengen Messungen vorzunehmen, sind Vereinfachungen, Abstraktionen notwendig, womit ein erstes Modell, die Ebene RM, entsteht. Auf dieser Ebene können – wie im Folgenden dargestellt – die drei Grundbegriffe der Beschreibenden Statistik Merkmal, Skala und Daten exakt definiert werden. Mit diesen Begriffen sind dann alle Methoden und Verfahren der Beschreibenden Statistik durchführbar, wobei sich diese je nach dem intendierten Hauptanwendungsgebiet unterscheiden. Man könnte also die Beschreibende Statistik als die Theorie der Realmodelle auffassen.

Die axiomatisch fundierten Theorien Wahrscheinlichkeitsrechnung und Mathematische Statistik bewegen sich auf der Ebene TM. Dazu werden Ergebnismengen, Zufallsgrößen, Wahrscheinlichkeitsverteilungen und andere Elemente dieser Theorien auf den Elementen der Ebene RM definiert.

4     Beispiele zur Modellierung stochastischer Situationen

Im Folgenden sollen diese Ebenen an drei exemplarischen Beispielen erläutert werden. Dabei zeigt sich, dass die Ebene der Realmodelle ein entscheidendes Mittel zur theoretischen Fundierung von Grundbegriffen der Beschreibenden Statistik sein kann. Die beschriebenen Prozesse der Modellierung sind prototypische Beispiele und sollten mit Schülern sowie insbesondere mit Lehramtsstudierenden in der skizzierten Weise erarbeitet werden.

Aus Umfangsgründen wird in diesem Beitrag auf die Betrachtung von stochastischen Situationen, die mit Mitteln der Wahrscheinlichkeitsrechnung modelliert werden können, verzichtet. Für diese Situationen sind die gleichen Betrachtungen anwendbar.

Bei der Modellierung stochastischer Situationen soll insbesondere auf der Ebene der Realmodelle eine Prozessbetrachtung verwendet werden, die in Sill (2010) ausführlich an Beispielen erläutert wurde. Der Grundbegriff einer Prozessbetrachtung ist der Begriff „Vorgang mit mehreren möglichen Ergebnissen“ bzw. synonym „stochastischer Vorgang“. Es wird dabei zunächst ein einzelner zeitlich ablaufender Vorgang betrachtet, der bezüglich eines Merkmals unterschiedliche Ergebnisse haben kann. Es werden weiterhin Bedingungen untersucht, die Einfluss auf den Verlauf des Vorgangs und sein Ergebnis haben. Die wiederholten Abläufe eines Vorgangs, die nacheinander oder gleichzeitig erfolgen können sowie die dabei herrschenden Bedingungen werden gesondert betrachtet.

Mit den folgenden Ausführungen wird die Methode der Prozessbetrachtung angewendet, erweitert und vertieft. Es werden drei stochastische Situationen betrachtet, die prototypische für eine bestimmte Art von Skalen bzw. Daten sind.

A: Vera macht einen Weitsprung.

B:  Maria schreibt eine Mathematikarbeit.

Betrachtungen auf der Ebene der realen Vorgänge, Objekte und Zustände

Im Ergebnis der drei in der Realität ablaufenden und z. T. noch andauernden Vorgänge sind reale Objekte oder Zustände entstanden:

A:  ein Abdruck im Sand,

B:  eine geschriebene Arbeit,

Diese realen und konkreten Ergebnisse haben eine Vielzahl konkreter Eigenschaften, so z. B.:

A:  Der Abdruck hat scharfe Kanten.

B:  Die Arbeit ist gut leserlich.

Das Entstehen der Ergebnisse wurde durch ein komplexes System von Bedingungen beeinflusst, so z. B. durch 

A:  Windstärke und Windrichtungen beim Sprung,

B:  konkrete Vorbereitung auf die Arbeit,

Betrachtungen auf der Ebene der Realmodelle

Um die konkret vorliegenden Resultate der realen Vorgänge untersuchen zu können, muss man sich zunächst für ein interessierendes Merkmal entscheiden, wie z. B.

A:  den Abstand des hinteren Randes eines der Abdrücke vom Balken,

B:  die erzielte Note in der Arbeit,

Weiterhin müssen vereinfachende Annahmen getroffen werden, um eine Messung der Eigenschaften der Objekte vorzunehmen. Das könnten z. B. sein:

A:  die Konturen des Abdrucks sind erkennbar,

B:  die Antworten von Maria können eindeutig interpretiert werden,

Anschließend muss man ein Messverfahren festlegen, um die konkreten Ausprägungen des Merkmals zu ermitteln. Dazu muss ein Messinstrument bzw. eine Messskala ausgewählt werden.

A:  Um die Sprungweite zu messen ist ein Bandmaß in Zentimetereinteilung geeignet.

B:  Zur Messung der Leistung von Maria muss die Lehrkraft einen Bewertungsmaßstab und eine Transformation in Noten festlegen.

Zur Messung können auch andere Messverfahren verwendet werden. So kann die Sprungweite mit einem Messgerät mit genauer Einteilung, die Leistung mit den Kategorien „erfüllt“ oder „nicht erfüllt“ gemessen werden. Mit den festgelegten Messverfahren lassen sich die betrachteten Merkmale als Funktionen auf Trägermengen definieren (s. Anhang). Die Definitionen sind identisch mit bzw. analog zur Definition des Größenbegriffs von Griesel (1997).

Betrachtungen auf der Ebene der theoretischen Modelle

Um die Merkmale mit Mitteln der Wahrscheinlichkeitsrechnung und mathematischen Statistik weiter untersuchen zu können, ist ein Übergang in die Ebene der mathematischen Modelle dieser Wissenschaften erforderlich.

So lässt sich die Sprungweite als Zufallsgröße in folgender Weise definieren:

Die Sprungweite S ist eine Funktion W → R , die jedem Größenwert w ∈ W eine Zahl s ∈ R  eindeutig zuordnet, d. h. die Funktion ist surjektiv. Ist z. B. w = a cm, so ist s = a.

Um die Leistung eines Schülers mit dem Modell von Rasch zu erfassen, wird das theoretische Konstrukt „mathematische Fähigkeit“ auf der Trägermenge der Schüler sowie die Lösungswahrscheinlichkeit eines Items als Funktion der „mathematischen Fähigkeit“ definiert.

5     Probleme der Polysemie

Bevor Vorschläge zur Verwendung der Grundbegriffe im Unterricht gemacht werden, müssen das Problem der Polysemie der Begriffe und die damit zusammenhängenden Schwierigkeiten diskutiert werden.

Die Bezeichnung „Vorgang“ wird auf allen drei Ebenen verwendet, ein Vorgang ist einmal etwas tatsächlich Ablaufendes (der Weitsprung von Vera), ein Realmodell (der Weitsprung eines Schülers mit vereinfachenden Annahmen) oder ein abstrakter Begriff auf der theoretischen Ebene (meist als Zufallsexperiment bezeichnet). In unserem Konzept der Prozessbetrachtung (Sill 2010) ist mit der Bezeichnung „Vorgang“ sowohl der reale Vorgang gemeint als auch ein Vorgang auf der Ebene RM im Schema der Prozessbetrachtung.

Das Wort „Ergebnis“ bedeutet auf der Ebene R etwas real Existierendes (ein Abdruck im Sand), auf der Ebene RM ein möglicher Wert eines Merkmals, auch als „Merkmalsausprägung“ bezeichnet, (Sprungweite 2 m) und auf der Ebene TM ein Wert einer Zufallsgröße oder ein Element einer Ergebnismenge.

In der Umgangssprache haben das Wort „Merkmal“ und insbesondere das oft synonym dazu gebrauchte Wort „Eigenschaft“ zwei verschiedene Bedeutungen. Sie bezeichnen sowohl die Eigenschaft bzw. das Merkmal im Allgemeinen (das Alter, die Mitarbeit im Unterricht) als auch eine konkrete Ausprägung dieser Eigenschaft bei einer Person oder einem Objekt (Paul hat ein Alter von 12 Jahren und arbeitet gut im Unterricht mit.). Analog wird auch der Begriff „Größe“ sowohl als Bezeichnung für eine Größenart (die Länge) als auch für einen konkreten Wert (Die Länge ist 2 m.) verwendet. Diese Unterschiede werden in der Regel nicht bewusst wahrgenommen, da sich die Art der Bedeutung implizit aus dem Kontext ergibt.

Auf der Ebene R bezeichnet das Wort „Merkmal“ eine real existierende Eigenschaft von Objekten oder Zuständen (der Abstand von Abdruck und Balken als reale Erscheinung) und auf der Ebene RM ist ein Merkmal der Name einer Funktion (Sprungweite) auf einer Trägermenge. Auf der Ebene TM wird die Bezeichnung „Merkmal“ in der Regel nicht verwendet. Der dazu analoge Begriff ist der Begriff „Zufallsgröße“.

Unter einer „Merkmalsausprägung“ versteht man auf der Ebene R die reale Ausprägung eines Merkmals (der tatsächliche Anstand von Abdruck und Balken), und auf der Ebene RM einen Wert eines Merkmals, also einen Funktionswert. In der Ebene TM entspricht eine Merkmalsausprägung dem Wert einer Zufallsgröße.

6     Probleme der Merkmalsarten

In Fachbüchern zur Beschreibenden Statistik und zur Wahrscheinlichkeitsrechnung ist in Erklärungen des Begriffs Merkmal hauptsächlich seine Bedeutung auf der Ebene R implizit enthalten.

„Die Eigenschaft des Merkmalträgers, die bei der statistischen Untersuchung von Interesse ist, wird als Merkmal bezeichnet.“ Bourier (2011), S. 8

Obwohl aus der Sicht von Statistikern ein enger sächlicher Zusammenhang zwischen der Betrachtung von Eigenschaften eines Objektes und ihrer datenmäßigen Erfassung besteht, wird mit den im Abschnitt 2 aufgeführten Merkmalsarten aus der Literatur allerdings die Ebene R verlassen. In den Bezeichnungen der Merkmalsarten ist die Art der Messung des Merkmals bereits enthalten. Ein Merkmal wie etwa die Sprungweite ist an sich nicht metrisch oder kategorial, sondern erst bei einer bestimmten Art der Messung der Sprungweite können diese adjektivischen Attribute verwendet werden. Dann sollten sie aber nicht auf das Merkmal, sondern auf die verwendetet Messskala bezogen werden. So kann etwa die Sprungweite mit einem Messinstrument mit einer metrischen Skala (Bandmaß), einer Ordinalskala (Zensur für den Sprung) oder einer Nominalskala (gültig oder ungültig) erfasst werden.

Die Stetigkeit ist eine Eigenschaft von Funktionen bzw. Zufallsgrößen und damit ein Modellbegriff auf der Ebene TM. Es ist deshalb nur sinnvoll, von einem stetigen Merkmal zu sprechen, wenn Merkmale als Funktionen definiert werden. Auf der Ebene RM ist allerdings aufgrund der Beschränktheit der Messgenauigkeit der Wertebereich eines Merkmals stets endlich oder abzählbar unendlich. Dies hat wohl zu den Bezeichnungen quasi-stetiges (Fahrmeir u.a. 2007) bzw. diskretisiertes stetiges Merkmal (Henze 2012) geführt.

Der Begriff „diskret“ ist ebenfalls ein Begriff auf der Ebene TM und dort mit den Begriffen „endlich“ bzw. „abzählbar“ verbunden. In Verbindung mit dem Merkmalsbegriff ist die Endlichkeit oder Abzählbarkeit der Wertemenge gemeint, die sich erst aus der Festlegung einer Messskala ergibt.

7     Vorschläge für ein System von Begriffen

Die Vorschläge basieren auf folgenden Überlegungen.

  • Angesichts der Vielfalt von existierenden Bezeichnungen in der Literatur und der noch unzureichenden begrifflichen Klarheit ist es nicht zu empfehlen, ein bestimmtes Begriffssystem aus der Literatur zu übernehmen.
  • Es sollten keine neuen Bezeichnungen für bestimmte Verwendungsaspekte der Begriffe erfunden werden.
  • Es sollten möglichst nur solche Wörter verwendet werden, die auch mehrheitlich in der Literatur vorkommen.
  • Die Bedeutungen der Begriffe sollten möglichst an die umgangssprachliche Bedeutung der Wörter anknüpfen sowie mit ihrer Bedeutung im übrigen Mathematikunterricht übereinstimmen.

Vorgang und Ergebnis

Eine Unterscheidung der verschiedenen Bedeutungen dieser Wörter in den verschiedenen Ebenen sollte nicht mithilfe besonderer Bezeichnungen oder adjektivischer Zusätze erfolgen, da in der Regel aus dem Zusammenhang hervorgeht, welche Bedeutung gemeint ist. Es ist an vielen Stellen im Mathematikunterricht üblich, das gleiche Wort und auch das gleiche Symbol für unterschiedliche Dinge zu verwenden. So wird mit „Radius eines Kreises“ sowohl eine Menge von bestimmten Strecken als auch die Länge einer dieser Strecke bezeichnet.

Mit der vorgeschlagenen Bezeichnung „stochastischer Vorgang“ soll lediglich zum Ausdruck gebracht werden, dass es sich um einen Vorgang handelt, der mit Mitteln der Stochastik (im weiten Sinne) untersucht werden kann.

Merkmal und Merkmalsarten

Im Mathematikunterricht sollte das Wort „Merkmal“ und synonym dazu „Eigenschaft“ in ihren beiden oben genannten Bedeutungen als allgemeine Kategorie und konkrete Ausprägung auf der Ebene R verwendet werden, wie es auch im Alltag und anderen Fächern der Fall ist. Auf der Ebene RM sollte zwischen dem Merkmal als Name einer Eigenschaft (einer Funktion) und einer „Merkmalsausprägung“ als einem der realen Ausprägung des Merkmals zugeordneten Wert unterschieden werden.

Eine Unterscheidung von Merkmalsarten halte ich nicht für sinnvoll und schlage vor, im Unterricht auf sämtliche Klassifizierungen von Merkmalen zu verzichten. Dies entspricht zudem der üblichen Verwendung des Begriffs Merkmal im Unterricht; so wird etwa der Flächeninhalt eines Dreiecks nicht als stetiges Merkmal und die Dreiecksarten werden nicht als kategoriales Merkmal bezeichnet.

Die genannten epistemologischen Unterschiede in der Verwendung des Begriffs Merkmal sollten im Unterricht nicht thematisiert werden.

Genauso wenig wie die Definition des Größenbegriffs von Griesel Gegenstand des Unterrichts ist, sollten die vorgeschlagenen Definitionen des Begriffs Merkmals auf der Ebene RM im Unterricht behandelt werden. Dies kann höchstens Gegenstand der Lehrerausbildung sein.

Skalen und Skalenarten

Betrachtungen zum Messen sollten im Unterricht als eine wesentliche Grundlage der Begriffsbildungen angesehen werden. Messen kann dabei als Zuordnung von Bezeichnungen, Zahlen oder Größen zu Objekten unter Verwendung einer Messskala, kurz Skala, erklärt werden. Das Wort „messen“ wird im Mathematik- und naturwissenschaftlichen Unterricht im engeren Sinne als Bestimmen von Größenwerten mit einem Messinstrument verwendet. Die Schüler kennen den Begriff Skala als Bezeichnung für die Einteilungen auf den Messgeräten, etwa als Temperaturskala.

Im Statistikunterricht wird ein erweiterter Begriff des Messens benötigt, der sich aber implizit durch die Arbeit mit den verschiedenen Skalen ausbildet.

Es ist für die Schule ausreichend, drei verschiedene Skalenarten zu unterscheiden, die durch die unterschiedlichen Relationen zwischen den Skalenwerten charakterisiert werden können.

Eine Nominalskala enthält lediglich Bezeichnungen, zwischen den Bezeichnungen gibt es keine Relationen, ihre Reihenfolge kann beliebig vertauscht werden. Für das Wort Bezeichnung wird auch der Begriff Kategorie verwendet, der aber für die Schule aufgrund seines abstrakten Charakters weniger geeignet ist.

Die Werte einer Rangskala bilden eine Rangfolge, die Größe des Abstandes zwischen zwei Werten der Skala kann nicht angegeben werden. Die in der Literatur auch verwendete Bezeichnung Ordinalskala halte ich in der Schule aus sprachlichen Gründen für weniger günstig.

Die den Schülern bekannten Messskalen zum Messen im engeren Sinne sollten jetzt als metrische Skala bezeichnet werden. Bei dieser Skala lässt sich der Abstand zwischen Werten als Zahlenwert angeben. Eine weitere Unterteilung metrischer Skalen in Intervall-, Verhältnis- oder Absolutskalen ist für unterrichtliche Zwecke nicht erforderlich.

Die Empfehlungen für geeignete statistische Kenngrößen und grafische Darstellungen können auch ohne die Verwendung von Merkmalsarten alleine durch die Unterscheidung der verschiedenen Arten von Messskalen erfolgen.

Mit den Skalenarten wird auf die Beschriftung und Skalierung der Merkmalsachse orientiert, sodass sich gut Empfehlungen für grafische Darstellungen anschließen lassen.

Eine explizite Bezeichnung der Skalenarten sollte erst ab Kl. 7/8 erfolgen. Bis dahin ist eine Unterscheidung der zugeordneten Datenarten ausreichend.

Daten und Datenarten

„Daten“ ist ein zentraler Begriff der Statistik und kann im Unterricht in folgender Weise beschrieben werden: Nachdem zur statistischen Erfassung eines Merkmals ein geeignetes Messverfahren und damit eine Messskala ausgewählt wurde, können die jeweiligen Merkmalsausprägungen an den Merkmalsträgern ermittelt werden. Die so ermittelten Werte werden als Daten bezeichnet. Daten sind also „registrierte Merkmalsausprägungen“ (Kütting & Sauer 2011, S. 10). Eine Unterteilung von Datenarten sollte in Anlehnung an die Skalenarten erfolgen. Dies führt zu den Bezeichnungen Nominaldaten (Bezeichnungen), Rangdaten und metrische Daten. Eine Unterscheidung dieser drei Datenarten sollte in allen Bildungsgängen zum sicheren Wissen und Können gehören und bereits in der Grundschule beispielhaft betrachtet werden. Damit können ebenfalls Überlegungen und Hinweise zur Planung und Auswertung statistischer Untersuchungen formuliert werden, insbesondere zur Transformation von Daten.

8     Bemerkungen zu weiteren Begriffen und Sprechweisen

In der Literatur wird oft anstelle des Begriffs Merkmal der Begriff Variable verwendet (Fahrmeir u.a. 2007, Schäfer 2010). Mit Blick auf die Anwendung der Statistik, insbesondere auch die Verwendung von Statistikprogrammen, sollte in oberen Klassen diese Bezeichnung thematisiert werden.

Unter einem latenten Merkmal (einer latenten Variablen) versteht man ein theoretisches Konstrukt zu einem (realen) Merkmal eines Objektes, das nicht direkt gemessen werden kann, wie z. B. die Sprungfähigkeit oder die mathematische Fähigkeit. Unter Verwendung dieses Wortes sollte der Sachverhalt bei entsprechenden Untersuchungen Gegenstand des Unterrichts sein.

Formulierungen wie „Messen heißt Vergleichen mit Einheiten“ oder „Größen sind messbare Merkmale von Objekten“ können nicht mehr in dieser Allgemeinheit verwendet werden, wenn der Begriff „messen“ in der vorgeschlagenen Weise allgemein gefasst wird. Sie gelten nur bei metrischen Skalen. Auch die Verwendung der Bezeichnung „Messdaten“ als Synonym für „metrische Daten“ ist problematisch, da auch andere Datenarten gemessen werden können. Auf diese Sprechweisen und Bezeichnungen muss aber im Unterricht nicht verzichtet werden, wenn aus dem Zusammenhang hervorgeht, welche Skalenart gemeint ist.

Literatur

Bartz, Stefan (2008): Baumdiagramme als roter Faden der Schulstochastik. In: Stochastik in der Schule 28 (1), S. 6–10.

Borovcnik, Manfred (1984): Zum Anwendungsproblem in der Statistik Teil I und Teil II. In: mathematica didactica 7, S. 21–35, 121-135.

Bourier, Günther (2011): Beschreibende Statistik. 9. Aufl. Wiesbaden: Gabler.

Büchter, Andreas; Henn, Hans-Wolfgang (2007): Elementare Stochastik. Eine Einführung in die Mathematik der Daten und des Zufalls 2. Aufl. Berlin, Heidelberg, New York: Springer.

Eichler, Andreas; Vogel, Markus (2009): Leitidee Daten und Zufall. Von konkreten Beispielen zur Didaktik der Stochastik. Wiesbaden: Vieweg+Teubner Verlag / GWV Fachverlage GmbH Wiesbaden

Fahrmeir, Ludwig; Künstler, Rita; Pigeot, Iris; Tutz, Gerhard (2007): Statistik. Der Weg zur Datenanalyse. 6., überarbeitete Aufl. Berlin, Heidelberg: Springer-Verlag Berlin Heidelberg

Ferschl, Franz (1978): Deskriptive Statistik. Würzburg, Wien: Physica-Verlag

Griesel, Heinz (1997): Zur didaktisch orientierten Sachanalyse des Begriffes Größe. – In: Journal für Mathematik-Didaktik 18/4, S. 259-284

Henze, Norbert (2012): Stochastik für Einsteiger. Eine Einführung in die faszinierende Welt des Zufalls. 9., erw. Aufl. Wiesbaden: Vieweg + Teubner (Studium).

Kütting, Herbert (1994): Didaktik der Stochastik. Mannheim [u.a.]: BI-Wiss.-Verl.

Kütting, Herbert; Sauer, Martin J. (2011): Elementare Stochastik. Mathematische Grundlagen und didaktische Konzepte. 3., Aufl. Heidelberg: Spektrum Akad. Verl.

Müller, Paul Heinz (Hg.) (1991): Wahrscheinlichkeitsrechnung und mathematische Statistik. Lexikon der Stochastik. 5. Aufl. Berlin: Akad.-Verl.

Schäfer, Thomas (2010): Statistik I : Deskriptive und Explorative Datenanalyse. 1. Aufl. Wiesbaden: VS, Verl. für Sozialwiss.

Sill, Hans-Dieter (2010): Zur Modellierung zufälliger Erscheinungen. In: Stochastik in der Schule 30 (3), S. 2–13.

Sill, Hans-Dieter (2014): Grundbegriffe der Beschreibenden Statistik. In: Stochastik in der Schule 34 (2), S. 2–9.

Stahel, Werner A. (2002): Statistische Datenanalyse. Eine Einführung für Naturwissenschaftler. 4., verb. Aufl. Braunschweig, Wiesbaden: Vieweg.

Standards für die Lehrerbildung im Fach Mathematik. Empfehlungen von DMV, GDM und MNU, Juni 2008 (2008). In: Mitteilungen der Gesellschaft für Didaktik der Mathematik (85), S. 4–14.

Winter, Heinrich (1981): Zur beschreibenden Statistik in der Sekundarstufe I. In: Dörfler. W. und R. Fischer (Hg.): Stochastik im Schulunterricht. Wien: Hölder-Pichler-Tempsky, S. 279–304.

Wolpers, Hans (2002): Didaktik der Stochastik. Unter Mitarbeit von Stefan Götz. Braunschweig: Vieweg

Anhang

Definition Merkmal Sprungweite

Es sei T die Menge aller gültigen und messbaren Weitsprünge und W die Menge aller möglichen Messwerte. Die Sprungweite w ist eine Funktion
T → W mit folgenden Eigenschaften:

  1. Zu jedem y ∈ W gibt es ein T mit w(t) = y.
  2. Im Wertebereich W  ist eine Verknüpfung
    / : W x W → R* definiert, die folgende Bedingungen erfüllt:
  3. (x / y) ∙ (y / z) = x / z für alle x, y, z  W
  4. Wenn x / y = 1, dann ist x = y für alle x, y ∈ W

Bei einem Messgerät mit Zentimetereinteilung gilt: W: 1 cm, 2 cm, 3 cm, …, 1000 cm und es ist x / y : = a/b   mit x = a cm und y = b cm für alle a, b ∈ {1, 2, 3, 4, … 1000}

 

Definition Merkmal Note

Es sei T die Menge aller möglichen Schülerarbeiten bei einer Klassenarbeit und W die Menge der Noten. Die Note N ist eine Funktion T → W mit folgenden Eigenschaften:

  1. Zu jedem W gibt es ein T mit N(t) = y.
  2. Im Wertebereich W ist eine Relation R definiert, die folgende Bedingungen erfüllt:
  3. Wenn x R y und y R x, dann ist x = y  für alle x, y ∈ W
  4. Es gilt x R x für x ∈ W
  5. Wenn x R y und y R z, dann gilt  x R z für alle x, y, z ∈ W

Dabei ist W = {Note 1, Note 2, Note 3, Note 4, Note 5, Note 6} und R: Die Note ist besser oder gleich mit Note x R Note y, wenn x £ y für alle x, y ∈ {1, 2, 3, 4, 5, 6}.

[1] Gekürzte Fassung des Artikels Sill (2014)

Kontaktformular

Ich freue mich über kritische Hinweise!