分散と標準偏差について

分散と標準偏差についてまとめます。

偏差とは

変量xのn個の各値\(x_1,x_2,..,x_n\)と平均値\(\displaystyle \overline{x}\)の差\(x_1 - \overline{x},x_2 - \overline{x} ...,x_n - \overline{x}\)
をそれぞれ\(x_1,x_2,...,x_n\)の平均値からの偏差という。

分散:\(s^2\)とは

分散はデータの平均値からの散らばりの度合いを表す量であり、データの各値が平均値から離れるほど大きな値となる。

偏差の2乗の平均値であり

\(\displaystyle s^2 = \frac{1}{n}\{(x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + ... + (x_n - \overline{x})^2\}\)

また、

\(\displaystyle s^2 = \overline{x^2} - (\overline{x})^2\)で計算可能

標準偏差:s

分散の正の平方根で、

\(\displaystyle s = \sqrt{\frac{1}{n}\{(x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + ... + (x_n - \overline{x})^2\}}\)

\(\displaystyle = \sqrt{\overline{x^2} - (\overline{x})^2}\)

分散は\(s^2\)で表すので、
測定単位がmのとき、分散の単位は\(m^2\)、標準偏差の単位はmになります。

初版:2021/8/19

このエントリーをはてなブックマークに追加