TF/IDFの調査をしていたら...
「HyperEstraierを使って文書の類似度計算を行う際に、HyperEstraierのスコアをどう扱えばいいの?」
とか考えていて、フラッとTF/IDFの調査をしていたら...
mon太のISDLレポートに出会った!
数式は分かりずらかったけど、やっぱりそんじょそこらのブログと比べると、質が違うな。4回生のレポートってのはすぐ分かるけどw
で、そのレポート読みながらぼーっと考えてて、類似度計算ツールと検索エンジンって、設計変数はほとんど同じだけど、目的関数は違うんだってのが分かった。だから重みの付け方とか正規化する/しないとかが違うのね。
まぁ当たり前っちゃ当たり前?
で、ついでにコンテンツマッチと行動分析を併用して、何かおもしろいことできないかなぁ?とか調べてたら...
千ちゃんのISDLレポートにも出会った!!
なんだかこのレポート、今の僕にぴったりな気がする。まずは千ちゃんがレポートしてたアルゴリズム動かしてみようかな?とりあえず、Rubyで。
こういう時、ISDLレポートからその人がストックしてる文献リストに飛べたりすると嬉しいな。別にISDLレポートシステムでなくてもいいし。
ところで、ISDL Reports 2007の「ISDL 文献調査テーマ一覧」のリンク先が2006年なのはご愛嬌?2007年度版の文献調査テーマ一覧もちゃんとある。