Was ist der zentrale Grenzsatz?

Was ist der zentrale Grenzsatz?
Anonim

Antworten:

Der zentrale Grenzwertsatz macht die intuitive Vorstellung streng, dass Schätzungen des Mittelwerts (aus einigen Stichproben geschätzt) einiger Messungen, die mit einer bestimmten Population in Verbindung stehen, sich mit zunehmender Stichprobengröße verbessern.

Erläuterung:

Stellen Sie sich einen Wald mit 100 Bäumen vor.

Nun stellen Sie sich vor, dass (ziemlich unrealistisch), dass ein Viertel von ihnen, gemessen in Metern, eine Höhe von 2 hat, ein Viertel von ihnen eine Höhe von 3 hat, ein Viertel von ihnen eine Höhe von 4 und ein Viertel von ihnen eine Höhe von 5.

Stellen Sie sich vor, Sie messen die Höhe jedes Baums im Wald und verwenden die Informationen, um ein Histogramm mit entsprechend ausgewählten Behältergrößen zu erstellen (z. B. 1,5 bis 2,5, 2,5 bis 3,5, 3,5 bis 4,5 und 5,5 bis 6,5). Ich erkenne, dass ich dies nicht angegeben habe die Tonne, zu der die Grenzen gehören, spielt hier aber keine Rolle).

Sie können das Histogramm verwenden, um die Wahrscheinlichkeitsverteilung der Bäume zu schätzen. Es wäre eindeutig nicht normal.Wenn die Endpunkte entsprechend gewählt wurden, wäre dies tatsächlich einheitlich, da in jeder Ablage eine gleiche Anzahl von Bäumen vorhanden wäre, die einer der angegebenen Höhen entspricht.

Stellen Sie sich jetzt vor, Sie gehen in den Wald und messen nur die Höhe von zwei Bäumen. Berechnen Sie die mittlere Höhe dieser beiden Bäume und notieren Sie sie. Wiederholen Sie diesen Vorgang mehrmals, damit Sie die Mittelwerte für Stichproben der Größe 2 zusammenstellen können. Wenn Sie ein Histogramm der Mittelwertschätzungen darstellen, ist es nicht mehr einheitlich. Stattdessen ist es wahrscheinlich, dass es mehr Messungen gibt (Schätzungen des Mittelwerts basierend auf Stichproben der Größe 2) in der Nähe der durchschnittlichen Gesamthöhe aller Bäume im Wald (in diesem speziellen Fall

#(2 + 3 + 4 + 5)/4 = 3.5# Meter).

Da gäbe es mehr Schätzungen des Mittelwerts in der Nähe des wahren Bevölkerungsdurchschnitt (was in diesem unrealistischen Beispiel bekannt ist) wäre die Form dieses neuen Histogramms weit entfernt vom Mittelwert eher einer Normalverteilung (mit einem Peak in der Nähe des Mittelwerts).

Stellen Sie sich nun vor, Sie gehen in den Wald und wiederholen die Übung, außer dass Sie die Höhe von 3 Bäumen messen, den Mittelwert in jedem Fall berechnen und sich notieren. Das Histogramm, das Sie erstellen würden, hätte noch mehr Schätzungen des Mittelwerts in der Nähe des wahren Mittelwerts, mit weniger Verbreitung (die Wahrscheinlichkeit, drei Bäume in einer Stichprobe zu pflücken, so dass sie alle aus einer der Endgruppen stammen - entweder der ganzen hoch oder sehr kurz - ist weniger als drei Bäume mit einer Auswahl an Höhen auszuwählen. Die Form Ihres Histogramms, das eine Schätzung der mittleren Größe (jeder Mittelwert basierend auf drei Messungen) umfasst, wäre näher an der einer Normalverteilung, und die entsprechende Standardabweichung (der Schätzungen des Mittelwerts, nicht der Grundgesamtheit) wäre kleiner

Wiederholen Sie dies für 4, 5, 6 usw., Bäume pro Mittelwert, und das Histogramm, das Sie erstellen würden, würde mehr und mehr wie eine Normalverteilung aussehen (mit zunehmend größeren Stichprobengrößen), mit dem Mittelwert von Verteilung von das Schätzungen des Mittelwerts näher an dem wahren Mittelwert liegen und die Standardabweichung der Schätzungen des Mittelwerts immer enger werden.

Wenn Sie die Übung für den (degenerierten) Fall wiederholen, in dem alle Bäume gemessen werden (mehrmals, indem Sie sich den Mittelwert in jedem Fall notieren), wird das Histogramm nur den Mittelwert in einem der Behälter anzeigen (derjenige, der dem wahren Mittelwert entspricht), ohne jegliche Abweichung, so dass die Standardabweichung (aus der die Wahrscheinlichkeitsverteilung geschätzt wird), dass das "Histogramm" Null wäre.

So stellt der zentrale Grenzwertsatz fest, dass der Mittelwert der Schätzung des Mittelwerts einiger Bevölkerungsgruppen asymptotisch dem wahren Mittelwert und der Standardabweichung der Mittelwertschätzung (und nicht der Standardabweichung der Verteilung der Grundgesamtheit) nahekommt. wird bei größeren Stichprobengrößen zunehmend kleiner.