For faster navigation, this Iframe is preloading the Wikiwand page for 分散 (確率論).

分散 (確率論)

この記事は英語版の対応するページを翻訳することにより充実させることができます。(2024年5月)翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。 英語版記事を日本語へ機械翻訳したバージョン(Google翻訳)。 万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。 信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。 履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。 翻訳後、((翻訳告知|en|Variance|…))をノートに追加することもできます。 Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があります。

数学統計学における分散(ぶんさん、: variance)とは、データ母集団標本)、確率変数確率分布)の標準偏差自乗のことである。分散も標準偏差と同様に散らばり具合を表し[1]、標準偏差より分散の方が計算が簡単なため、計算する上で分散を用いることも多い。

分散は具体的には、平均値からの偏差2乗の平均に等しい。データ x1, x2, …, xn の分散 s2

ここで x は平均値を表す。

分散が 0 であることは、データの値が全て等しいことと同値である。データの分散は二乗平均から平均の2乗を引いた値に等しくなる。

確率変数 X の分散 V[X][注 1]は、X期待値E[X] で表すと

V[X] = E[(XE[X])2]

となる[2]。 確率変数の分散は確率変数の2次の中心化モーメントである。

統計学では、記述統計学においては標本の散らばり具合を表す指標として標本分散(ひょうほんぶんさん、: sample variance)を、推計統計学においては不偏分散(ふへんぶんさん、: unbiased variance)・不偏標本分散(ふへんひょうほんぶんさん、: unbiased sample variance)を用いる。

言葉の由来

[編集]

英語の variance(バリアンス)という語はロナルド・フィッシャーが1918年に導入した[3]

確率変数の分散

[編集]

2乗可積分確率変数 X の分散は期待値E[X] で表すと

定義される。これを展開して整理すると

とも書ける。また確率変数 X特性関数φX(t) = E[eitX] とおくと(i虚数単位)、これは 2階連続的微分可能

と表示することもできる。

チェビシェフの不等式から、任意の正の数 ε に対して

が成り立つ。これは分散が小さくなるほど確率変数が期待値に近い値をとりやすくなることを示す大まかな評価である。

性質

[編集]

X, X1, …, Xn確率変数a, b, a1, …, an定数とし、共分散Cov[ · , · ] で表すと

  • (非負性)
  • 位置母数英語版に対する不変性)
  • 斉次性

を満たす。したがって、特に X1, …, Xn独立ならば、

より

が成り立つ。

[編集]
  • 確率変数 X一様分布 U(a, b) に従うとき、V(X) = (ba)2/12
  • 確率変数 X正規分布 N(μ, σ2) に従うとき、V(X) = σ2
  • 確率変数 X二項分布 B(n, p) に従うとき、V(X) = np(1 − p)
  • 確率変数 Xポアソン分布 Po(λ) に従うとき、V(X) = λ

データの分散

[編集]

推計統計学では、母集団の分散と標本の分散を区別する必要がある。

母分散

[編集]

大きさが n である母集団 x1, x2, …, xn に対して、平均値μ で表すとき、偏差自乗の平均値

母分散(ぼぶんさん、: population variance)と言う[4]

標本分散・不偏標本分散

[編集]

大きさが n である標本 x1, x2, …, xn に対して、平均値x で表すとき、偏差自乗の平均値

で定義される s2標本分散(ひょうほんぶんさん、: sample variance)と言う。s標準偏差と呼ばれる[4]

定義より、

となるから、標本分散は2乗の平均値と平均値の2乗との差に等しい。ただし、この計算では概して二乗平均が巨大になるため、浮動小数点数による近似計算を行う場合には大きな丸め誤差が生じる可能性がある(桁落ち)。このため、浮動小数点数を扱う場合には定義に従って偏差の二乗和を計算することが一般的である(あるいは一般の総和計算と同じくカハンの加算アルゴリズムpairwise summation英語版のような手法により、誤差を小さくする工夫がなされることもある)。

一般に、標本分散の平均値は母分散より少し小さくなる。実際には、平均と分散を持つ同一分布からの無作為標本に対して、標本分散の期待値 E[s2] について、

が成り立つ。そこで

を用いると、平均値が母分散に等しくなる推定量が得られる。つまり母分散の不偏推定量となる。これを不偏標本分散(ふへんひょうほんぶんさん、: unbiased sample variance)や不偏分散(ふへんぶんさん、: unbiased variance)と呼ぶ[4]

上記の標本分散は不偏でないことを強調する場合偏りのある標本分散: biased sample variance)と言う。

なお、不偏標本分散を単に標本分散と呼ぶ文献もある。

定義から明らかに、標本の大きさが大きくなる程につれて偏りのある標本分散は不偏標本分散に近づく。

注釈

[編集]
  1. ^ 分散を Var[X] と書く場合もある。

出典

[編集]

参考文献

[編集]

関連項目

[編集]
{{bottomLinkPreText}} {{bottomLinkText}}
分散 (確率論)
Listen to this article

This browser is not supported by Wikiwand :(
Wikiwand requires a browser with modern capabilities in order to provide you with the best reading experience.
Please download and use one of the following browsers:

This article was just edited, click to reload
This article has been deleted on Wikipedia (Why?)

Back to homepage

Please click Add in the dialog above
Please click Allow in the top-left corner,
then click Install Now in the dialog
Please click Open in the download dialog,
then click Install
Please click the "Downloads" icon in the Safari toolbar, open the first download in the list,
then click Install
{{::$root.activation.text}}

Install Wikiwand

Install on Chrome Install on Firefox
Don't forget to rate us

Tell your friends about Wikiwand!

Gmail Facebook Twitter Link

Enjoying Wikiwand?

Tell your friends and spread the love:
Share on Gmail Share on Facebook Share on Twitter Share on Buffer

Our magic isn't perfect

You can help our automatic cover photo selection by reporting an unsuitable photo.

This photo is visually disturbing This photo is not a good choice

Thank you for helping!


Your input will affect cover photo selection, along with input from other users.

X

Get ready for Wikiwand 2.0 🎉! the new version arrives on September 1st! Don't want to wait?