行動ターゲティングの躍進のための課題は、個人情報より先にある。

広告配信の最適化を行う際には、どのレベルの情報をどれくらいの精度で取って来れるのかというのは、最適化アルゴリズム選択以前の問題です。得られる情報の内容や精度が異なれば、当然評価手法も反復可能回数も大きく変わります。

最適化の情報収集ステップとして考えれば、ユーザの Web サイト閲覧履歴を取るという意味では、自社のアドネットワーク内のみを Cookie で追跡しようが、ブラウザの履歴の部分集合を確率的に取得しようが、どちらでも良い訳です。

一定規模のアドネットワークを持っていれば、Cookie を使った手法の方が単純かつ確実に情報を取得可能であり、既存の最適化技術をそのまま応用しやすいでしょう。

いまのところ、ブラウザに高々数千程度の URL のリストを送信し、サイト離脱前(つまり高々2〜3クリック以内)に確実にそのユーザの嗜好を解析できる方法を、僕は知りません。もちろん 0.050% を 0.055% にする方法なら、いろいろあるでしょうが。

現時点でも、ad4U は既存広告より高い CTR を叩き出すので、スーツたちや投資家たちは大注目です。同様に個人情報のグレーゾーンに関わってくる分野なので、セキュリティ専門家たち -- ここ数日でにわかに急増中 -- も大注目です。

が、最適化の問題としてみれば、誰もまだまともに手をつけられさえしていない未開の地かも知れません。だからこそ、こういう問題は貴重であり、チャレンジングでもあります。

そして、そうやっていろいろ考えていくと、個人情報の問題は情報収集段階での(おそらく最もややこしい)制約条件ではありますが、検討課題はその先にあるのです。ブラウザから JavaScript や Flash を使って情報を収集するという方法は、Cookie でのそれに勝てるかどうかすら分からないのですから。

今の段階で Google と Yahoo! が手を組むなら、さすがにちょっと厳しいかなぁ?
入り口をほぼすべて、しかも時系列情報と一緒に把握されたら、いくらなんでも勝てないだろうなぁ。。。

最後に、個人情報の問題単体については、今のようにユーザそれぞれが自分でリスクとリターンのバランスを柔軟に決定できない状況では、国がなんと言おうが専門家がいくら騒ごうが、何の解決にもならないと思います。

robots.txt とか OAuth みたいな標準化されたオプトアウト/オプトインの仕組みと、それらの存在を前提にした規制とかは、比較的良い方向に進むのかも知れませんね。

単一の解が存在し得ない分野なのだから、まずはトレードオフを提示して、バランスをコントロールする方法が必要です。ここを議論することこそが、セキュリティ専門家たちのチャレンジではないですか??

まぁでも、人生には暇つぶしも必要ですよね。
わかります。

2 comments in legacy system
2008年10月28日 確率モデル信者 さん

本業,ゲノム解析.
趣味,Web データ解析.
というものです.

行動ターゲティングにおける最適化の困難さ(=面白さ)とは・・・?
未熟な知識で考えてみたのですが,
・リアルタイム性
・目的関数(のJacobian行列やHessian行列)の計算が難しそう
# ユーザーをジャンルに分類するにあたり,「正解」が未知そうなので
などが,困難な部分なのでしょうか?

種々の最適化問題に興味を持って勉強しております.
ご教示いただければ幸いに思います.

2008年11月01日 nov さん

ごめんなさい、そこのコメントは控えさせてください。