著者:
Charles Brown
作成日:
9 2月 2021
更新日:
1 J 2024
![【高校 数学Ⅰ】 データ分析11 標準偏差とは? (11分)](https://i.ytimg.com/vi/QBdIWRe352I/hqdefault.jpg)
コンテンツ
二乗和(SSE)は、さまざまなデータ値につながる予備的な統計計算です。データ値のセットがある場合、これらの値がどの程度密接に関連しているかを判断できると便利です。データをテーブルに整理してから、かなり簡単な計算を実行する必要があります。データセットのSSEを見つけると、分散と標準偏差を見つけることができます。
ステップに
方法1/3:手作業でSSEを計算する
3列のテーブルを作成します。 SSEを計算する最も明確な方法は、3列のテーブルから始めることです。 3つの列にラベルを付ける
詳細を入力します。 最初の列には、測定値が含まれています。列に入力します
平均を計算します。 各測定の誤差を計算する前に、データセット全体の平均を計算する必要があります。
- データセットの平均は、値の合計をセット内の値の数で割ったものです。これは、変数を使用して象徴的に表すことができます
個々のエラー値を計算します。 テーブルの2番目の列に、各データ値のエラー値を入力する必要があります。誤差は、測定値と平均値の差です。
- 指定されたデータセットについて、各測定値から平均98.87を引き、2番目の列に結果を入力します。これらの10の計算は次のようになります。
SSEを計算します。 表の3番目の列で、中央の列で結果の各値の2乗を見つけます。これらは、各測定データ値の平均からの偏差の2乗を表します。
- 中央の列の値ごとに、計算機を使用して正方形を計算します。次のように、結果を3番目の列に記録します。
エラーの二乗を合計します。 最後のステップは、3番目の列の値の合計を見つけることです。望ましい結果は、SSE、またはエラーの2乗の合計です。
- このデータセットの場合、SSEは3番目の列に10個の値を追加することによって計算されます:
スプレッドシートの列にラベルを付けます。 上記と同じ3つの見出しを使用して、Excelで3つの列を持つテーブルを作成します。
- セルA1に、見出しとして「値」と入力します。
- ボックスB1に、見出しとして「偏差」と入力します。
- ボックスC1に、見出しとして「偏差の二乗」と入力します。
詳細を入力してください。 最初の列には、測定値を入力する必要があります。セットが小さい場合は、手で簡単に入力できます。大きなデータセットがある場合は、データをコピーして列に貼り付ける必要がある場合があります。
データポイントの平均を決定します。 Excelには、平均を計算する関数があります。データテーブルの下の空のセルに(どのセルを選択してもかまいません)、次のように入力します。
- =平均(A2:___)
- 空白を入力しないでください。そのスペースに最後のデータポイントのセル名を入力します。たとえば、100個のデータポイントがある場合、次の関数を使用します。
- =平均(A2:A101)
- 一番上の行には列見出しが含まれているため、この関数にはセルA2からA101までのデータが含まれています。
- Enterキーを押すか、テーブル内の別のセルをクリックすると、新しくプログラムされたセルにデータ値の平均が自動的に入力されます。
エラー測定の関数を入力します。 [偏差]列の最初の空のセルに、各データポイントと平均の差を計算する関数を入力します。これを行うには、平均が配置されているセル名を使用します。今のところセルA104を使用したとしましょう。
- セルB2に入力するエラー計算関数は次のとおりです。
- = A2- $ A $ 104。計算のためにボックスA104を確実にロックするには、ドル記号が必要です。
- セルB2に入力するエラー計算関数は次のとおりです。
二乗誤差の関数を入力します。 3番目の列では、目的の正方形を計算するようにExcelに指示できます。
- セルC2に、次の関数を入力します。
- = B2 ^ 2
- セルC2に、次の関数を入力します。
関数をコピーして、テーブル全体を埋めます。 各列の一番上のセル、それぞれB2とC2に関数を入力した後、テーブル全体に入力する必要があります。テーブルの任意の行に関数を再入力できますが、これには時間がかかりすぎます。マウスを使用して、セルB2とC2を一緒に強調表示し、マウスボタンを離さずに、各列の一番下のセルにドラッグします。
- テーブルに100個のデータポイントがあると仮定して、マウスをセルB101およびC101にドラッグします。
- マウスボタンを離すと、数式がテーブルのすべてのセルにコピーされます。テーブルには、計算された値が自動的に入力されます。
SSEを見つけます。 テーブルの列Cには、すべての二乗誤差値が含まれています。最後のステップは、Excelにこれらの値の合計を計算させることです。
- 表の下のセル(この例ではおそらくC102)に、次の関数を入力します。
- =合計(C2:C101)
- [Enter]をクリックするか、テーブルの別のセルをクリックすると、データのSSE値が取得されます。
- 表の下のセル(この例ではおそらくC102)に、次の関数を入力します。
- 中央の列の値ごとに、計算機を使用して正方形を計算します。次のように、結果を3番目の列に記録します。
- 指定されたデータセットについて、各測定値から平均98.87を引き、2番目の列に結果を入力します。これらの10の計算は次のようになります。
- データセットの平均は、値の合計をセット内の値の数で割ったものです。これは、変数を使用して象徴的に表すことができます
方法3/3:SSEを他の統計に関連付ける
SSEからの偏差を計算します。 データセットのSSEを見つけることは、通常、他のより有用な値を見つけるための構成要素です。これらの最初のものは分散です。分散は、測定データが平均からどれだけ逸脱しているかの尺度です。これは、実際には平均からの差の2乗の平均です。
- SSEは二乗誤差の合計であるため、値の数で割るだけで平均(分散)を見つけることができます。ただし、母集団全体ではなくサンプル系列の分散を計算する場合は、分散をnではなく(n-1)で除算します。そう:
- 母集団全体の分散を計算する場合、分散= SSE / n。
- データのサンプルの分散を計算する場合、分散= SSE /(n-1)。
- 患者の体温のサンプリング問題については、10人の患者がサンプルにすぎないと仮定できます。したがって、分散は次のように計算されます。
SSEの標準偏差を計算します。 標準偏差は、データセットの値が平均からどれだけ逸脱しているかを示す一般的に使用される値です。標準偏差は分散の平方根です。分散は二乗誤差測定値の平均であることを忘れないでください。
- したがって、SSEを計算した後、次のような標準偏差を見つけることができます。
SSEを使用して共分散を決定します。 この記事では、一度に1つの値のみを測定するデータセットに焦点を当てています。ただし、多くの研究では、2つの別々の値を比較する場合があります。たとえば、データセットの平均だけでなく、これら2つの値が互いにどのように関連しているかを知りたいとします。この値は共分散です。
- 共分散の計算は、データ型ごとにSSEを使用して比較することに注意することを除いて、ここで説明するには詳細すぎます。共分散と関連する計算の詳細については、wikiHowでこのトピックに関する記事を見つけることができます。
- 共分散の使用例として、医学研究における患者の年齢を、発熱温度を下げる薬の有効性と比較することができます。次に、年齢の1つのデータセットと温度の2番目のデータセットがあります。次に、各データセットのSSEを見つけ、そこから分散、標準偏差、共分散を見つけます。
- したがって、SSEを計算した後、次のような標準偏差を見つけることができます。
- SSEは二乗誤差の合計であるため、値の数で割るだけで平均(分散)を見つけることができます。ただし、母集団全体ではなくサンプル系列の分散を計算する場合は、分散をnではなく(n-1)で除算します。そう: