多目的クラスタリングの勉強会資料を作ってます

ちゃんとやってるよ〜ってのをアピール。

VIENNAってやつが強敵だ。突然変異しかしないのだが、これはGAなのだろうか?
こいつが紹介されてる(おそらく最初で最後の)論文にパレートの図が無いので、どんなパレートが得られているのかが不明。クラスタ数はおそらく固定だから、あんまりパレート形状が出てこなさそうなんだけどなぁ〜
あと、「random Voronoi cell」がよくわかんない。某ドクターが昔ボロノイボロノイって言ってた気がするが。

まぁでもイメージとしては、MOCKが凝集法をベースにK-means法で香り付けした感じなのに対して、VIENNAはK-means法をベースに凝集法で味付けした感じ。

Read more

さぁ次はOptisだ

Optisに向けて何をしていくか考えないと。

おそらく方向は2つで、
 1.クラスタ数自動決定アルゴリズムの改良
 2.実際にWebデータのクラスタリングをしてみる
のどちらかだと思うのだけど、現状ではセッション/クッキーごとのログを取る仕組みがこちらには無いので、2はちょっと難しいのだと思っている。
だとすると1を突き詰めていく方向だとは思うのだが、まだ具体的なアイディアは無い。

2次元でもクラスタリングできてなかったテストデータは、5次元でも解けなかったしなぁ〜
てか完全に重なっている2つのクラスタが存在するテストデータって。。

Long2をベースにして、テストデータを自分で作ってみる??