統計的有意性を評価する方法

著者: Randy Alexander
作成日: 2 4月 2021
更新日: 26 六月 2024
Anonim
【7分で分かる】ビジネスで重要な有意差!どんなシーンで使うのか見ていこう!
ビデオ: 【7分で分かる】ビジネスで重要な有意差!どんなシーンで使うのか見ていこう!

コンテンツ

仮説テストは統計分析によって導かれます。統計的に有意な信頼度は、p値を使用して計算されます。これは、特定の提案(ヌル仮説)が真である場合に観測された結果の確率を示します。 p値が有意水準(通常は0.05)未満の場合、実験者は、ヌル仮説を反証し、逆仮説を認めるのに十分な証拠があると結論付けることができます。単純なtテストを使用して、p値を計算し、2つの異なるデータグループ間の有意性を判断できます。

手順

パート1/3:実験を設定する

  1. あなたの仮説を決定します。 統計的有意性を評価する最初のステップは、回答する質問を特定し、仮説を宣言することです。仮説は、経験的データと人口の可能な不一致のステートメントです。すべての実験には、ヌル仮説と逆仮説があります。一般に、2つのグループを比較して、それらが同じか異なるかを確認します。
    • 一般的に、仮説はそうではありません(H0)2つのデータグループの間に違いがないことを確認します。例:授業の前に資料を読んだ生徒は、最終成績が上がらない。
    • 逆仮説(Ha)はnull仮説に反しており、経験的データでサポートしようとしているステートメントです。例:授業の前に資料を読んだ学生は、実際にはより良い最終成績を取得します。

  2. 重要度レベルを選択して、データで意味があると見なすことができる差異の程度を決定します。 重要度レベル(アルファとも呼ばれます)は、意味を決定するために選択するしきい値です。 p値が特定の有意水準以下の場合、データは統計的に有意であると見なされます。
    • 原則として、有意水準(またはアルファ)は通常0.05レベルで選択されます。つまり、データに見られる差異を観察する確率はわずか5%です。
    • 信頼レベルが高いほど(したがって、p値が低いほど)、結果はより意味のあるものになります。
    • より信頼性が必要な場合は、p値を0.01に下げます。低いp値は、製品の欠陥を検出するために製造でよく使用されます。高い信頼性は非常に重要であるため、すべての部品が正常に機能することが許容されます。
    • ほとんどの仮説ベースの実験では、0.05の有意水準が許容されます。

  3. 片側検定と両側検定のどちらを使用するかを決定します。 tテストの前提の1つは、データが正規分布にあることです。正規分布は、観測の大部分を中心としたベルカーブを形成します。 tテストは、データが曲線の「上部」部分の正規分布の外側、上または下にあるかどうかをチェックする数学的テストです。
    • データがコントロールグループの上にあるか下にあるかわからない場合は、両側検定を使用してください。両方向の重要性を確認できます。
    • データの予想される方向がわかっている場合は、片側検定を使用してください。上記の例では、学生のスコアが向上することを期待しています。したがって、片側検定を使用します。

  4. 力分析でサンプルサイズを決定します。 テストの力は、特定のサンプルサイズで期待される結果を観察する能力です。力(またはβ)の一般的なしきい値は80%です。グループ間の予想平均とその標準偏差に関する情報が必要なため、予備データがないと力の分析は非常に複雑になる可能性があります。オンライン力分析を使用して、データに最適なサンプルサイズを決定します。
    • 研究者は、力の分析に情報を提供し、大規模で包括的な研究に必要なサンプルサイズを決定するために、小さな前提研究を実行することがよくあります。
    • 複雑な前提研究を行う手段がない場合は、記事を読んだり、他の個人が行った可能性のある研究に基づいて、考えられる平均を推定します。これにより、サンプルサイズを決定するための良いスタートを切ることができます。
    広告

パート2/3:標準偏差を計算する

  1. 標準偏差の式を決定します。 標準偏差は、データの分散を測定します。サンプル内の各データポイントのIDに関する情報を提供します。最初に始めたとき、方程式は非常に複雑に見えることがあります。ただし、以下の手順は、計算プロセスを簡単に理解するのに役立ちます。式はs = √∑((x -µ)/(N-1))。
    • sは標準偏差です。
    • ∑は、収集されたすべての観測値を合計する必要があることを示します。
    • バツ それぞれがデータ値を表します。
    • µは、各グループのデータの平均です。
    • Nは観測の総数です。
  2. 各グループの観測数を平均します。 標準偏差を計算するには、最初に個々のグループの観測値の平均を計算する必要があります。この値は、ギリシャ語の文字muまたはµで表されます。これを行うには、単に観測値を追加し、観測値の総数で割ります。
    • たとえば、授業の前に資料を読んだグループの平均スコアを見つけるために、いくつかのデータを見てみましょう。簡単にするために、90、91、85、83、および94(100ポイントスケール)の5ポイントのデータセットを使用します。
    • すべての観測値を合計します:90 + 91 + 85 + 83 + 94 = 443。
    • 上記の合計を観測数N(N = 5)で除算します:443/5 = 88.6。
    • このグループの平均スコアは88.6です。
  3. 各観測値から平均を引きます。 次のステップはパート(x -µ)の式。各観測値から平均値を引きます。上記の例では、5つの減算があります。
    • (90〜88.6)、(91〜88.6)、(85〜88.6)、(83〜88.6)、および(94〜88.6)。
    • 計算値は1.4です。 2.4; -3.6; -5.6および5.4。
  4. 上記の違いを二乗し、それらを合計します。 計算された新しい値はそれぞれ2乗されます。ここでは、負の符号も削除されます。このステップの後または計算の最後に負の符号が表示される場合は、上記のステップを実行するのを忘れている可能性があります。
    • この例では、1.96を使用します。 5.76; 12.96; 31.36および29.16。
    • これらの正方形を合計します:1.96 + 5.76 + 12.96 + 31.36 + 29.16 = 81.2。
  5. 観測の総数から1を引いた数で割ります。 N-1で割ると、母集団全体では実行されないが、すべての学生の母集団の1つのサンプルのみに基づく計算を補正するのに役立ちます。
    • 減算:N-1 = 5-1 = 4
    • 除算:81.2 / 4 = 20.3
  6. 平方根を取得します。 観測数から1を引いた数で割ったら、得られた値の平方根を取ります。これは、標準偏差を計算する最後のステップです。一部の統計プログラムは、元のデータがインポートされた後にこの計算を実行するのに役立ちます。
    • 上記の例では、クラスの前にドキュメントを読んでいる学生の学期末の成績の標準偏差は次のとおりです。s=√20,3= 4.51。
    広告

パート3/3:統計的有意性の決定

  1. 2つの観測グループ間の差異を計算します。 これまで、この例では1つのグループの観測のみを扱ってきました。 2つのグループを比較するには、明らかに両方のデータが必要です。観測の2番目のグループの標準偏差を計算し、それを使用して2つの実験グループ間の分散を計算します。分散の計算式は次のとおりです。d =√((s1/ N1)+(s2/ N2)).
    • Sd グループ間の差異です。
    • S1 グループ1とNの標準偏差です。1 グループ1のサイズです。
    • S2 グループ2とNの標準偏差です。2 グループ2のサイズです。
    • この例では、グループ2(クラスの前にテキストを読んでいない学生)のデータのサイズが5で、標準偏差が5.81であるとします。差異は次のとおりです。
      • Sd =√((s1)/ N1)+((s2)/ N2))
      • Sd = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. データのtスコアを計算します。 T統計を使用すると、データを他のデータに匹敵する形式に変換できます。 t値を使用すると、tテストを実行することもできます。これは、2つのグループが統計的に異なる確率を計算できるテストです。 t統計の計算式は次のとおりです。t=(µ1 – µ2)/ Sd.
    • µ1 最初のグループの平均です。
    • µ2 2番目のグループの平均です。
    • Sd 観測間の差異です。
    • 大きい方の平均をµとして使用します1 負のt統計を取得しないために。
    • この例では、グループ2(前の記事を読んでいない)の観測された平均が80であると仮定します。tスコアは次のとおりです。t=(µ1 – µ2)/ Sd = (88,6 – 80)/3,29 = 2,61.
  3. サンプルの自由度を決定します。 t統計を使用する場合、自由度はサンプルサイズに基づいて決定されます。各グループの観測数を合計してから、2を減算します。上記の例では、最初のグループに5つのサンプルがあり、2番目のグループに5つのサンプルがあるため、自由度(d.f.)は8です((5 + 5)-2 = 8)。
  4. 表tを使用して重要性を評価します。 t値と自由度の表は、標準の統計書またはオンラインで見つけることができます。データの自由度と、使用しているt統計に対応するp値を含む行を見つけます。
    • 自由度8およびt = 2.61の場合、片側検定のp値は0.01から0.025の間にあります。選択した有意水準は0.05以下であるため、データは統計的に有意です。このデータを使用して、ヌル仮説を拒否し、逆仮説を受け入れます。クラスの前に資料を読んだ学生は、最終スコアが高くなります。
  5. さらに調査を行うことを検討してください。 多くの研究者は、より大規模な研究を設計する方法を理解するために、いくつかの指標を使用して前提研究を実行します。より多くの指標を使用して他の調査を行うと、結論に対する信頼が高まります。広告

助言

  • 統計は大きくて複雑な分野です。統計的有意性を理解するために、高校または大学レベルの統計的仮説テスト(またはそれ以上)を受けてください。

警告

  • この分析は、2つの標準的な分布母集団の違いを確認するためのtテストに焦点を当てています。データの複雑さに応じて、異なる統計テストが必要になる場合があります。