2014年11月4日火曜日

Kobe.R #12 クラスタリング

Kobe.R #12を開催しました。
URL: http://kobexr.doorkeeper.jp/events/16101
日時: 2014/10/26 Sun. 10:00-12:00
場所: 大阪市福島区

Kobe.Rは関西で毎月定期的に開催している、統計用プログラミング言語 R の勉強会です。
次の発表はクラスタリングについてです。様々なクラスタリング手法についてまとめて紹介していただいたあと、実際にirisデータセットの、k-meansで分類した結果を示していただきました。


質疑

irisデータセットにはもともと、種という分類データが含まれています。この元の分類と今回のk-meansによる分類は比べてどうだったか。そこそこ一致していた。単純なユークリッド距離で分けてうまくいったのは、もとがよいデータだということもあるでしょう。

何個のクラスタに分けるべきかという問題がある。分けようと思えば何個にでも分類できる。いくつに分けるのが一番いいのだろうか。これについてはAIC(赤池情報量基準)などの基準がある。この問題はPRML下巻に混合ガウス分布の変分近似として説明されている。読んでみるとおもしろいですよ。

参考文献

The Elements of Statistical Learning: Data Mining, Inference, and Prediction.

「ものまね鳥をまねる会」とは

スライドの2ページ目に紹介されている「ものまね鳥をまねる会」というのは、発表者の @Wakamatz さんが主催されている読書会です。
森に住む鳥たちのファンタジーを読んでいると、いつのまにか、関数型プログラミング言語の理論的基礎「コンビネータ論理」が身についてしまいますよ。「計算」という行為の本質に迫りましょう。
次回は2014/11/16(日)13:00からです。
http://connpass.com/event/9503/

0 件のコメント:

コメントを投稿