ベイズ理論の応用事例
先日、ウノウでCTOの尾藤による勉強会が行われた。
テーマは『ベイジアンフィルター』。
ベイズ理論を利用した効果的なSPAMフィルター。
そこでちょっと気になったのでSPAM以外でのベイズ理論のIT応用例を調べてみた。

そもそもベイズ理論とは「過去のデータを元に未来の振る舞いを予測する理論」とまとめたらよいか。
とにかく過去のデータを簡単な条件付確率を用いて未来を予測する理論である。
かなりシンプル。
まあ詳細は動画で。↓
まずけっこう昔のCNETの記事から。
検索エンジンにもベイズ理論が使われているらしい。
過去のデータから推定した結果をさらに次の推定に活かす。
学習する、がベイズ理論の本質だが検索エンジンにはうってつけのものだ。
過去の検索結果から自分用にカスタマイズされた検索結果が出てくる。
ただ以下のような関連キーワードをおすすめされる感じではまだまだな感じだがw
時事的なキーワードだからこれでググったらもっとおもろい情報があるよっていうものかもしれんが。

また、Googleでよく見かける「もしかして?xxx」もベイズ理論を使っているのではないだろうか。
けれどもベイズ理論のエキスパートはMicrosoftの方にそろっているらしい。
MSNサーチにその応用がふんだんに盛り込まれてるとのこと。
» MSNサーチの検索順位 – RankNetアルゴリズム対策
また、Coordinateという聞きなれないアプリケーションにも応用されているとの記述。。
このようなデータはアプリケーションを使用する人物への受信メッセージや他の情報の流れを管理するために使われる。例えばあるマネージャーがある社員のコンピュータに午後2時40分に電子メールを送ったとしよう。Coordinateはその社員のスケジュールを調べ、その人物が午後2時からの会議に出席していることを知る。またCoordinateはこの人物の習慣を調べ、例えば通常は会議開始時間の約1時間後にキーボードをたたき始めることを発見する。さらにこの人物は通常はマネージャーからの電子メールには5分以内に返信していることに気付くかもしれない。これらの全てのデータをもとに、Coordinateはこの人物が少なくとも20分間は席に戻らないことを予測し、マネージャーからのメッセージをこの社員の携帯電話に転送する決断をするのである。同時に、このプログラムは他の人からの電子メールは転送しないと判断するかもしれない、と言った具合だ。
他にもOfficeにも微弱ながらベイズ理論が使われいるみたいだ。
また弾さんもベイズ理論に詳しいとの記述が。
実際それ関連のエントリを書かれている。
さらにベイズ理論を用いたおもしろいサービスを発見。
自分のブログとアルファブロガー2006TOP40のブログの近さを分析してくれるツール。

なんでも俺はやたらと大橋さんの情報考学に近いらしい。
ブログをセグメント化してそれぞれで近さを分析してるっぽいけどどうやってベイズ理論を使っているかわからん。
誰かおせーてー。
あ、ちなみにこのサービスは今週中にでも終了するみたいです。
お試しはお早めに。
20070201勉強会_ベイジアンフィルタ posted by (C)フォト蔵
ベイズ理論はあちこちで使われていますが、
学習とかモデル化っていう話だと、ベイジアンネットワークという手法が使われていることが多いです。ベイズとは直接には関係は薄いみたいですが。
典型例はオフィスのヘルプいるかのカイル君にベイジアンネットワークが使われています。