中心極限定理はサンプルサイズNのみを必要としますか?
On 2月 15, 2021 by admin中心極限定理を説明するには、サンプルサイズと抽出されたサンプル数の2つの要素が必要だと思います。
しかし、誰もそうは思わない中心極限定理を使用して
ただし、少なくとも30要素のサンプルがたくさんあるはずだと思ったので、1つのサンプルグループの分布だけでなく、サンプルの「平均」とその分布もたくさんあります。
中心極限定理を正しく理解し、母平均 $ \ mu $ を推測するのを手伝ってください。
コメント
- 質問について'不明な点を誰かが説明できますか?
- @Glen_b私は' "サンプルサイズの数"および"描画サンプルの数"が異なります。
- 'それぞれが複数のサンプルを描画していますサイズN("サンプルサイズ");もう1つの量は、そのようなサンプルをいくつ描画するかです("サンプル数")。編集することで少し明確になると思います。
- @Sycorax:'フレーズを少しクリーンアップしましたが、OPのほかに英語がありません母国語として(そしていくつかの主要な、しかし珍しい誤解ではない)、私には明らかであるように見えました
- @Roy I 'ちょうどそこに気づきました'関連する質問はこちら: stats.stackexchange.com/questions/133931/ …
回答
-
単一の確率変数には分布があります。ランダムサンプルからのサンプル平均は、単一の確率変数です。もちろん、その分布を観察するには、複数のランダムサンプル(複数のサンプル平均など)を確認する必要があります。次に、そのようなサンプルの数が増えると、サンプル(経験)累積分布関数は母集団分布関数に近づきます。母集団累積分布関数に関するサンプル累積分布関数の標準誤差は、サンプルサイズの平方根として減少します(サンプルサイズを4倍にすると、標準誤差は半分になります)。
要するに、取得するサンプルの数(各サイズ $ n $ )は、サンプル平均の分布がどれだけ近いかに影響しません。正常であることに…サンプルのコレクションを見るときにどれだけ正確にそれを見ることができるかについてのみ、同じサイズのサンプルからのすべてを意味します。
あるサンプルサイズで正常にどれだけ近いかを確認するには、かなりの数のサンプル平均が必要になる場合があります。シミュレーション実験では、分布形状をよく理解するために、そのようなサンプルを何千も見るのが一般的です。
図は、偏った分布からのサイズn = 30のサンプルの20、300、および100000のサンプル平均のヒストグラムを示しています。 。最初のものでは広い形状の感覚があり、2番目のものではやや明確な感覚がありますが、3番目のものではサンプル平均のこの分布の形状がかなり明確にわかります。サンプル平均の実現数。
この場合、サンプル平均は正規分布に近くありません。n= 30は、これらの平均をほぼ正規分布として扱うには十分ではありません(少なくとも一般的な目的ではありません)。
分布の裾がどのように動作するかをよく理解したい場合は、かなり多くのサンプル平均が必要になる場合があります。
ただし、実際のデータを処理する場合は、通常、単一のサンプル。 (CLTに依存しているかどうかに関係なく)その1つのサンプルに基づいて推論を行う必要があります。
-
中心極限定理の内容について誤解されている可能性があります。
実際の 中心極限定理はn = 30についても、他の有限のサンプルサイズについても何も述べていません。
代わりに、の標準化された平均(または合計)の動作に関する定理です。 nが無限大になるときの限界。
-
(特定の条件下で)サンプル平均が(特定の近似の意味で)ほぼ正規分布することは事実ですが、サンプルサイズは十分に大きいので、ある目的のために「十分に大きい」とは、いくつかの要因によって異なります。上のプロットに見られるように、歪度は(たとえば)正規性へのアプローチに大きな影響を与える可能性があります(母集団が歪んでいる場合、標本平均の分布も歪んでいますが、サンプルサイズが大きくなるとそれほど大きくなりません)。
コメント
- すばらしい返信をありがとうございます!
In short, the number of samples you take (each of size n) has no impact on how close the distribution of sample means is to being normal
について簡単に質問します。プロットに基づいて、20、300、1000000サンプルを描画し(そして同じ数のサンプル平均を取得し)、サイズの各サンプルは30であり、描画したサンプルの数(またはサンプルを描画した回数に関係なく)を意味しますか? )、distには影響しません。サンプルのは正常であることを意味しますか?または、あなたの記事を逆の方法で理解している可能性があります…? - PythonでCLTを一様分布でシミュレートしたためです。 300個のサンプル(それぞれのサイズは10)で、かなり標準に見えるので、少し混乱しています。
- あなたが描く分布の形は間違いなく重要です。ユニフォームは' nice 'の場合で、nが10より小さい場合でも、ほとんどの目的で通常にかなり近いです(30は高すぎます。 '尾にうまく入っていない限り、バー)。 1000サンプルまたは1(各n = 10)を実行した場合、同じ母集団分布に固執する限り、平均の分布は同じです。私の写真をエミュレートしたい場合は、形状0.05のガンマ分布を試してください(スケールまたはレートパラメータは、' ' t変更);同様に、0.1d.fのカイ2乗を試すことができます。
- ユニフォームからのサンプル平均は見栄えが良く、正常に見えますが、(明らかに)実際には正常ではないことに注意してください。それらは通常よりもテールが軽いです(実際、それらは有限の範囲を持っています)。 'それらを使って何をしているのかによっては、この非正規性はそれほど重要ではないかもしれません。
- うわー、ええ、ガンマ分布。上で説明したことを明確に示しています。サンプル平均の数は影響を与えません。私はCLTを間違って理解しています、ありがとう。また、"点推定"はCLTに基づいていると思い、' tは、点推定が1つのサンプルコレクションのみを使用して母集団パラメーターを推測する理由を理解します。ご協力いただきありがとうございます:)
コメントを残す