統計学の概念

Community College Students and Gender

アメリカ教育協議会の 2010 年のレポートによると、アメリカ合衆国の大学人口の 57% は女性が占めているそうです。 Tallahassee Community College の統計のクラスの学生は、TCC の女子学生の比率を決定したいと考えています。 彼らは135人のTCCの学生から無作為にサンプルを選び、72人が女性であることを発見しました。これは、72 / 135≈ 0.533のサンプル割合となります。

彼らは、大学における女性の割合について何を結論づけることができますか?

これらの質問に答えるために、私たちは信頼区間を見つける必要があります。

条件の確認:

私たちは「確率を統計的推測にリンクする」で、信頼区間がサンプリング分布の正規モデルから来ることを学びました。 まず、正規モデルがここで適切であることを確認しましょう。

  • サンプルはランダムでなければならない。
  • サンプルにおける成功の期待数 np と失敗の期待数 n(1 – p) は、両方とも 10 より大きいか等しくなる。 記号では、np≧10、n(1 – p) ≧10となる。 成功は良い意味ではなく、失敗は悪い意味であることを思い出してください。

これらの条件を確認しようとすると、問題が発生します。 私たちは人口比率であるpを知らないのです。 実は、pこそ、私たちが推定しようとしているものなのです! ですから、成功や失敗の期待数を決定することはできません。 この問題を解決するには、この条件を調整することです。

このサンプルには、72 人の成功者 (女子学生) と 63 人の失敗者 (男子学生) が含まれています。 どちらも10より大きいです。

誤差を見つける:

サンプルの比率は、母集団の比率の推定値に過ぎないことが分かっています。 標本の割合が母集団の割合と同じになることは期待できないので、無作為の偶然による誤差があります。 無作為のサンプルで予想される誤差の量を表すために、サンプル比率の標準偏差を使用します。

「確率と統計的推論の関連付け」では、標本割合の標準誤差は、母集団の割合と標本サイズに依存することを学びました。

サンプリング分布に正規モデルを使用する場合、サンプル比率の 95% は母集団の比率を約 2 標準誤差以内で推定します。 つまり、誤差は次のようになります:

2text{}}

次に、TCC の推定値 53.3% に対する誤差を計算してみましょう。 私たちが以前に持っていたのと同じ問題を抱えていることに注意してください。 私たちは p、つまり人口比率を知らないのです。 だから、誤差を計算することができません。 この問題の解決策は、pの代わりに標本割合を用いて標準誤差を推定することです。 これを推定標準誤差と呼び、式は次のとおりです:

この例では、推定標準誤差は

sqrt{frac{therapeutic{p}(1-therapeutic{p}) }{n}}

この例は、0.1%の誤差を含みます。533(1-0.533)}{135}}\text{}\approx \text{}0.043

つまり、95%信頼区間の誤差は:

2

Sqrt{frac{0.533(1-0.533)}{135}}approx 2(0.043){text{}=0.039} text}

Sqrt {frac{frac{0.533(1-0.533)}{135}approx ===xt{}0.039}text086

信頼区間を求める:

私たちは、TCC のすべての学生のうち女性である人の割合が、サンプルの割合 0.533 の 0.086 以内であることに 95% の自信を持っていると言って、誤差を解釈することができます。

Thomasstackrel{ˆ}{p}text{}± \text{} {margin} {text{}} {mathrm} {f} {error}=0.086.533\text{}±\text{}0.086

標本割合から誤差を加減すると、信頼区間は0.447から0.619となります。

結論:

TCCの全生徒のうち女性である割合は、0.447から0.619であると95%の確信が持てます。 また、パーセントを使用してこのステートメントを作ることもできます。

「確率と統計的推論の関連付け」から、95%の信頼度は、この方法が母集団の割合を約95%の確率で捉えることを意味することを思い出してください。