TF/IDFの調査をしていたら...

「HyperEstraierを使って文書の類似度計算を行う際に、HyperEstraierのスコアをどう扱えばいいの?」

とか考えていて、フラッとTF/IDFの調査をしていたら...

mon太のISDLレポートに出会った!

数式は分かりずらかったけど、やっぱりそんじょそこらのブログと比べると、質が違うな。4回生のレポートってのはすぐ分かるけどw

で、そのレポート読みながらぼーっと考えてて、類似度計算ツールと検索エンジンって、設計変数はほとんど同じだけど、目的関数は違うんだってのが分かった。だから重みの付け方とか正規化する/しないとかが違うのね。

まぁ当たり前っちゃ当たり前?

で、ついでにコンテンツマッチと行動分析を併用して、何かおもしろいことできないかなぁ?とか調べてたら...

Read more