線形相関係数の計算方法

著者: Eric Farmer
作成日: 7 行進 2021
更新日: 1 J 2024
Anonim
相関分析の原理&相関係数を使う際の注意点とその解決策を解説します!
ビデオ: 相関分析の原理&相関係数を使う際の注意点とその解決策を解説します!

コンテンツ

相関係数(または線形相関係数)は「r」(まれに「ρ」)として表され、2つ以上の変数の線形相関(つまり、ある値と方向によって与えられる関係)を特徴付けます。係数の値は-1から+1の間にあります。つまり、相関は正と負の両方になります。相関係数が-1の場合、完全な負の相関があります。相関係数が+1の場合、完全な正の相関があります。それ以外の場合は、2つの変数間に正の相関、負の相関、または相関がありません。相関係数は、無料のオンライン計算機、または優れたグラフ電卓を使用して手動で計算できます。

ステップ

方法1/4:相関係数を手動で計算する

  1. 1 データを収集します。 相関係数の計算を開始する前に、これらの数値のペアを調べてください。縦にも横にも並べられるテーブルに書き留めておいたほうがいいです。各行または列に「x」と「y」のラベルを付けます。
    • たとえば、変数「x」と「y」の値(数値)の4つのペアが与えられます。次のテーブルを作成できます。
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 算術平均「x」を計算します。 これを行うには、すべてのx値を合計し、その結果を値の数で除算します。
    • この例では、変数「x」に4つの値があります。算術平均「x」を計算するには、これらの値を加算してから、合計を4で割ります。計算は次のように記述されます。
    • μNS=(1+2+4+5)/4{ displaystyle mu _ {x} =(1 + 2 + 4 + 5)/ 4}
    • μNS=12/4{ displaystyle mu _ {x} = 12/4}
    • μNS=3{ displaystyle mu _ {x} = 3}
  3. 3 算術平均「y」を見つけます。 これを行うには、同じ手順に従います。つまり、すべてのy値を合計してから、その合計を値の数で割ります。
    • この例では、変数「y」の4つの値が与えられています。これらの値を加算してから、合計を4で割ります。計算は次のように記述されます。
    • μy=(1+3+5+7)/4{ displaystyle mu _ {y} =(1 + 3 + 5 + 7)/ 4}
    • μy=16/4{ displaystyle mu _ {y} = 16/4}
    • μy=4{ displaystyle mu _ {y} = 4}
  4. 4 標準偏差「x」を計算します。 「x」と「y」の平均を計算した後、これらの変数の標準偏差を見つけます。標準偏差は、次の式を使用して計算されます。
    • σNS=1NS1Σ(NSμNS)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma(x- mu _ {x})^ {2}}}}
    • この例では、計算は次のように記述されます。
    • σNS=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} *((1-3)^ {2} +(2-3)^ {2} +( 4-3)^ {2} +(5-3)^ {2})}}}
    • σNS=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} *(4 + 1 + 1 + 4)}}}
    • σNS=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} *(10)}}}
    • σNS=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σNS=1,83{ displaystyle sigma _ {x} = 1.83}
  5. 5 標準偏差「y」を計算します。 前の手順で概説した手順に従います。同じ式を使用しますが、y値をプラグインします。
    • この例では、計算は次のように記述されます。
    • σy=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} *((1-4)^ {2} +(3-4)^ {2} +( 5-4)^ {2} +(7-4)^ {2})}}}
    • σy=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} *(9 + 1 + 1 + 9)}}}
    • σy=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} *(20)}}}
    • σy=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σy=2,58{ displaystyle sigma _ {y} = 2.58}
  6. 6 相関係数を計算するための基本式を書き留めます。 この式には、平均、標準偏差、および両方の変数の数のペアの数(n)が含まれます。相関係数は「r」(まれに「ρ」)で表されます。この記事では、式を使用してピアソン相関係数を計算します。
    • ρ=(1NS1)Σ(NSμNSσNS)(yμyσy){ displaystyle rho = left({ frac {1} {n-1}} right) Sigma left({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ここおよび他の情報源では、数量はさまざまな方法で表すことができます。たとえば、「ρ」と「σ」を含む式もあれば、「r」と「s」を含む式もあります。いくつかの教科書は異なる公式を与えていますが、それらは上記の公式に数学的に対応しています。
  7. 7 相関係数を計算します。 両方の変数の平均と標準偏差を計算したので、式を使用して相関係数を計算できます。 「n」は両方の変数の値のペアの数であることを思い出してください。他の値は以前に計算されています。
    • この例では、計算は次のように記述されます。
    • ρ=(1NS1)Σ(NSμNSσNS)(yμyσy){ displaystyle rho = left({ frac {1} {n-1}} right) Sigma left({ frac {x- mu _ {x}} { sigma _ {x}} } right) * left({ frac {y- mu _ {y}} { sigma _ {y}}} right)}
    • ρ=(13){ displaystyle rho = left({ frac {1} {3}} right) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle left({ frac {1-3} {1.83}} right) * left({ frac {1-4} {2.58}} right)+ left({ frac {2 -3} {1.83}} right) * left({ frac {3-4} {2.58}} right)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + left({ frac {4-3} {1.83}} right) * left({ frac {5-4} {2.58}} right)+ left({ frac { 5-3} {1.83}} 右) * 左({ frac {7-4} {2.58}} 右)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = left({ frac {1} {3}} right) * left({ frac {6 + 1 + 1 + 6} {4.721}} right)}
    • ρ=(13)2,965{ displaystyle rho = left({ frac {1} {3}} right) * 2.965}
    • ρ=(2,9653){ displaystyle rho = left({ frac {2,965} {3}} right)}
    • ρ=0,988{ displaystyle rho = 0.988}
  8. 8 結果を分析します。 この例では、相関係数は0.988です。この値は、ある意味で、特定の数値のペアのセットを特徴付けます。値の符号と大きさに注意してください。
    • 相関係数の値は正であるため、変数「x」と「y」の間には正の相関があります。つまり、「x」の値が大きくなると、「y」の値も大きくなります。
    • 相関係数の値は+1に非常に近いため、変数「x」と「y」の値は高度に相関しています。座標平面に点を置くと、それらは直線の近くに配置されます。

方法2/4:オンライン計算機を使用して相関係数を計算する

  1. 1 相関係数を計算するには、インターネットで計算機を見つけてください。 この係数は、多くの場合、統計で計算されます。数値のペアが多い場合、相関係数を手動で計算することはほとんど不可能です。したがって、相関係数を計算するためのオンライン計算機があります。検索エンジンで、「相関係数計算機」(引用符なし)と入力します。
  2. 2 データを入力します。 Webサイトの指示を確認して、正しいデータ(数字のペア)を入力してください。適切な数字のペアを入力する必要があります。そうしないと、間違った結果が得られます。ウェブサイトが異なれば、入力フォーマットも異なることに注意してください。
    • たとえば、http://ncalculators.com/statistics/correlation-coefficient-calculator.htmでは、変数xとyの値が2本の水平線で入力されています。値はコンマで区切られます。つまり、この例では、値「x」は次のように入力されます:1,2,4,5、値「y」は次のように入力されます:1,3,5,7。
    • 別のサイトhttp://www.alcula.com/calculators/statistics/correlation-coefficient/では、データは垂直方向に入力されます。この場合、対応する数字のペアを混同しないでください。
  3. 3 相関係数を計算します。 データを入力したら、「計算」、「計算」などのボタンをクリックするだけで結果が得られます。

方法3/4:グラフ電卓を使用する

  1. 1 データを入力します。 グラフ電卓を取り、統計計算モードに入り、「編集」コマンドを選択します。
    • 電卓が異なれば、押す必要のあるキーも異なります。この記事では、Texas InstrumentsTI-86計算機について説明します。
    • [2nd] -Stat(+キーの上)を押して、統計計算モードに入ります。次に、F2-編集を押します。
  2. 2 以前に保存したデータを削除します。 ほとんどの計算機は、入力した統計を消去するまで保持します。古いデータと新しいデータを混同しないように、最初に保存されている情報を削除します。
    • 矢印キーを使用してカーソルを移動し、「xStat」見出しを強調表示します。次に、Clear and Enterを押して、xStat列に入力されたすべての値をクリアします。
    • 矢印キーを使用して、「yStat」見出しを強調表示します。次に、Clear and Enterを押して、yStat列に入力されたすべての値をクリアします。
  3. 3 初期データを入力します。 矢印キーを使用して、見出し「xStat」の下の最初のセルにカーソルを移動します。最初の値を入力して、Enterキーを押します。画面下部に「xStat(1)= __」と表示され、入力した値がスペースに置き換わります。 Enterキーを押すと、入力した値がテーブルに表示され、カーソルが次の行に移動します。これにより、画面の下部に「xStat(2)= __」と表示されます。
    • 変数「x」のすべての値を入力します。
    • xのすべての値を入力した後、矢印キーを使用してyStat列に移動し、yの値を入力します。
    • 番号のすべてのペアを入力したら、Exitを押して画面をクリアし、集約モードを終了します。
  4. 4 相関係数を計算します。 これは、データが特定の直線にどれだけ近いかを示します。グラフ電卓は、適切な直線をすばやく決定し、相関係数を計算できます。
    • [統計]-[計算]をクリックします。 TI-86で、[2nd]-[Stat]-[F1]を押します。
    • 線形回帰関数を選択します。 TI-86で、「LinR」というラベルの付いた[F3]を押します。画面に「LinR_」の行がカーソルが点滅して表示されます。
    • 次に、xStatとyStatの2つの変数の名前を入力します。
      • TI-86で、名前のリストを開きます。これを行うには、[2番目]-[リスト]-[F3]を押します。
      • 使用可能な変数は、画面の一番下の行に表示されます。 [xStat]を選択し(これを行うにはおそらくF1またはF2を押す必要があります)、カンマを入力してから[yStat]を選択します。
      • Enterキーを押して、入力したデータを処理します。
  5. 5 結果を分析します。 Enterキーを押すと、画面に次の情報が表示されます。
    • y=NS+NSNS{ displaystyle y = a + bx}:これは行を記述する関数です。関数は標準形式(y = kx + b)で記述されていないことに注意してください。
    • NS={ displaystyle a =}..。これは、直線とy軸の交点のy座標です。
    • NS={ displaystyle b =}..。これが直線の傾きです。
    • corr={ displaystyle { text {corr}} =}..。これが相関係数です。
    • NS={ displaystyle n =}..。これは、計算に使用された数値のペアの数です。

方法4/4:基本概念の説明

  1. 1 相関の概念を理解します。 相関は、2つの量の間の統計的関係です。相関係数は、任意の2つのデータセットに対して計算できる数値です。相関係数の値は常に-1から+1の範囲にあり、2つの変数間の関係の程度を特徴づけます。
    • たとえば、子供の身長と年齢(約12歳)を考えると。子供は年齢とともに背が高くなるため、おそらく強い正の相関関係があります。
    • 負の相関関係の例:ペナルティ秒とバイアスロントレーニングに費やされた時間。つまり、アスリートのトレーニングが多いほど、与えられるペナルティ秒は少なくなります。
    • 最後に、靴のサイズと数学のスコアの間など、相関関係がほとんどない場合があります(正または負)。
  2. 2 算術平均の計算方法を覚えておいてください。 算術平均(または平均)を計算するには、これらすべての値の合計を見つけて、それを値の数で割る必要があります。相関係数を計算するには、算術平均が必要であることを忘れないでください。
    • 変数の平均値は、その上に水平バーが付いた文字で示されます。たとえば、変数「x」と「y」の場合、それらの平均値は次のように表されます:x̅とy̅。平均値は、ギリシャ文字の「μ」(mu)で表されることがあります。変数「x」の値の算術平均を書き込むには、表記μを使用しますNS またはμ(x)。
    • たとえば、変数「x」に次の値が与えられた場合:1,2,5,6,9,10。これらの値の算術平均は次のように計算されます:
      • μNS=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} =(1 + 2 + 5 + 6 + 9 + 10)/ 6}
      • μNS=33/6{ displaystyle mu _ {x} = 33/6}
      • μNS=5,5{ displaystyle mu _ {x} = 5.5}
  3. 3 標準偏差の重要性に注意してください。 統計では、標準偏差は、平均に関連して数値が分散する程度を特徴づけます。標準偏差が小さい場合、数値は平均に近くなります。標準偏差が大きい場合、数値は平均からかけ離れています。
    • 標準偏差は、文字「s」またはギリシャ文字「σ」(シグマ)で示されます。したがって、変数「x」の値の標準偏差は次のように表されます。NS またはσNS.
  4. 4 合計演算の記号を覚えておいてください。 合計記号は、数学で最も一般的な記号の1つであり、値の合計を示します。この記号はギリシャ文字の「Σ」(大文字のシグマ)です。
    • たとえば、変数「x」の値が1,2,5,6,9,10の場合、Σxは次のことを意味します。
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

チップ

  • 相関係数は、開発者のカール・ピアソンにちなんで「ピアソン相関係数」と呼ばれることもあります。
  • ほとんどの場合、相関係数が0.8(正または負)より大きい場合、強い相関があります。相関係数が0.5未満(正または負)の場合、弱い相関が観察されます。

警告

  • 相関は、2つの変数の値の間の関係を特徴づけます。ただし、相関関係は因果関係とは何の関係もないことを忘れないでください。たとえば、人の身長と靴のサイズを比較すると、強い正の相関関係が見つかる可能性があります。一般的に、背が高いほど靴のサイズは大きくなります。しかし、これは、身長の増加が靴のサイズの自動増加につながること、またはより大きな足がより速い成長につながることを意味するものではありません。これらの量は単に相互に関連しています。