分散と標準偏差について
分散と標準偏差についてまとめます。
偏差とは
変量xのn個の各値\(x_1,x_2,..,x_n\)と平均値\(\displaystyle \overline{x}\)の差\(x_1 - \overline{x},x_2 - \overline{x} ...,x_n - \overline{x}\)
をそれぞれ\(x_1,x_2,...,x_n\)の平均値からの偏差という。
分散:\(s^2\)とは
分散はデータの平均値からの散らばりの度合いを表す量であり、データの各値が平均値から離れるほど大きな値となる。
偏差の2乗の平均値であり
\(\displaystyle s^2 = \frac{1}{n}\{(x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + ... + (x_n - \overline{x})^2\}\)
また、
\(\displaystyle s^2 = \overline{x^2} - (\overline{x})^2\)で計算可能
標準偏差:s
分散の正の平方根で、
\(\displaystyle s = \sqrt{\frac{1}{n}\{(x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + ... + (x_n - \overline{x})^2\}}\)
\(\displaystyle = \sqrt{\overline{x^2} - (\overline{x})^2}\)
分散は\(s^2\)で表すので、
測定単位がmのとき、分散の単位は\(m^2\)、標準偏差の単位はmになります。
初版:2021/8/19