辞書: ベイズの定理

投稿日:

ベイズの定理とは

Wikipediaにも記載されている通り、条件付き確率について成り立つ定理で、以下のような形をしています。

$$P(B|A) = \frac{P(A|B)P(B)}{P(A)}$$

一見何でもない数式ですが、これが大論争を引き起こしました。

なぜなら、「確率」と書かれていますが、これは頻度に基づく確率ではありません。 頻度に基づくというのは、 「サイコロの目を1000回振ったら1の目が166回出た。なので1の目が出る確率は0.166(16.6%)」 のような表現です。 要は「たくさん同じことを繰り返す」ことです。

このベイズの定理が示していることは、事前に決めた確率が、 ある出来事の結果によって変わるということです。 例えば、「雨が降る確率」は、天気予報を見たり、空を見ることによって変わります。 その「事前に決めた確率」というのを「事前確率」と呼び、 「出来事によって変わった確率」を「事後確率」と呼びます。

ここで使われる「確率」は「確信度」と呼ばれることもあります。 「確信度」を分かりやすく言い換えると、「賭け」のモデル化です。 AとBという事象があって、Aの確信度が1/4であるということは、 「結果がAなら4倍以上になって返ってくるギャンブルにならAに賭けてもよい」というのと同じです。

問題は、「事前確率」に何を用いるかです。 天気予報の場合、過去のデータから「雨が降る確率」は分かっているため、 これを事前確率として使用するのが自然です。

主観確率

しかし、過去のデータが存在しない、あるいは少ない場合は、 自然な事前確率を定義することが困難です。 客観的なデータが使用できない以上、 どこかで主観的な判断をする必要があります。 よって、これは主観確率と呼ばれています。

この主観確率を認めることで、非常に多くの問題が解決できます1。 現在の人工知能理論のほとんどをしめる 学習理論の基礎にあるのは、この数式と言っていいと思います。

しかし、これは数学としては許せないという人も多くいました。これが大論争です。 このあたりは、「異端の統計学 ベイズ」という読み物が詳しいです。


  1. 正しい答えが出るわけではないので、「解決」というよりは「決定」ですね。 ↩︎