RubyでWebサーバ上の画像ファイルサイズを取得する 〜Get image size on the server (Amazon etc.)〜

Amazon WebAPIを使って取得した画像URLにアクセスすると、画像が見つからなかったり、画像はあるのにデータを返してくれなかったりして、そんな時は1×1ピクセルのGIF画像が返されます。
そしてそれをそのままブラウザに表示すると、altもtitleも表示されず、何の本かさっぱり。。。

ということで、RubyでWebサーバ上の画像ファイルをhttp経由で取ってきて、画像サイズを取得するというのに挑戦。

RAA - image_sizeライブラリを利用すると簡単。
こんな感じ。

==

require 'net/http'
require 'image_size'

proxy_class = Net::HTTP::Proxy( 'proxy.example.com', 8080 )
http = proxy_class.new('images-jp.amazon.com' )
http.start {|h|
responce, @image = h.get('/path/to/images/**.jpg')
# responce, @image = h.get(@book.url)
}

@img_file = ImageSize.new(@image)
print @img_file.get_width
print @img_file.get_height
print @img_file.get_type

Web行動分析に関する論文(翻訳版)

Road to me ... | Web行動分析に関する論文の続き。

Learning Web Request Patterns

アブスト
Web上のほとんどのリクエストは、ユーザ(人間)や人間とPCのインタラクションの結果として生じ、ユーザのアクションは識別可能な行動パターンにより特徴づけることができる。これらの行動パターンの大半は、ユーザ個人、ユーザ間のどちらの場合でも、Webリクエストパターンを解析することで識別および活用が可能となる。本論文は、マルコフモデルの予測能力の高さと、Webマイニングやその他の領域でマルコフモデルが良く用いられていることから、マルコフモデルに基づいた確率論的技術に着目する。時系列履歴を用いるメカニズムも未来のリクエストを予測する強力なツールであるが、その他の付加情報を用いるとパフォーマンスはさらに向上する。
本論ではWebリクエストパターンの一般的な学習および予測方法の一般的なアプローチについて述べる。また(往々にして個別に提案されている)多様なアルゴリズムの一貫した説明を行い、同じデータセットに対するそれらの手法のパフォーマンスを比較する。さらにこれらの手法の正確で現実的な評価についての注意点についても議論する。

==

Measuring and Understanding User Comfort With Resource Borrowing

Resource Borrowingはグリッドコンピューティングとthin-clientコンピューティングで共通する基礎的なアプローチである。どちらの場合でも外部プロセスはエンドユーザとのインタラクションを行うプロセスに提供される外部リソースを利用し、

って、どうも「グリッドを利用する際のユーザのストレスと満足度について理解する」ってことのようなので読むのをやめた。

==

Learning a Model of a Web User's Interests

Web上でユーザに適切な情報を探し出すのを手助けするように設計されたリコメンドシステムは数多く存在する。個々のユーザに適切なリコメンドを行う為に、これらのシステムでは大抵最初にユーザのWebブラウジングモデルを学習することを試みる。本論では一連の注釈付きのWebログ(ユーザによる「各々のページが適切なコンテンツであったかどうか」の評価など)からブラウジングモデルを学習する新たな手法を提案する。本論で提案するシステムはこの学習モデルを用い、以下の2点について学習する。1つめはWebページのどのような特徴が、一連の流れの中でこういった「適切なページ」を特徴づけているのか。そして2つめはどんなブラウジングパターンがそれらのページの「適切なワード」を特徴づけているのかである。こういった手法は特定のURL(やワード) よりもWebページ(およびページに含まれるワード)の特徴を扱うため、Web上のどのような場所でも用いることができる。例えば特定のWebサイトに限定されることも、特定のタスクに限定されることもない。本論では機能拡張ブラウザAIEについても触れる。AIEは注釈付きのWebログを収集し、我々のアプローチの効果を調べる為の実験で用いる為に設計および実装されたブラウザである。 この実験により我々のアプローチとアルゴリズムは効果的に働いていることが確認された。

ってことなので、Learning Web Request Patternsを読むことに決めた。
一番長いやつ...orz

マテラッツィが知的照明を全国に広める!?

イタリア優勝で知的照明が全国に広められるという、信じられない現象が起こっています。
そのキッカケになったのがフランスとの決勝戦でフランスにPKを献上し、その後すぐに同点ゴールを挙げたインテルのお騒がせ男、マテラッツィ。

イタリアが優勝し、一躍日本でも名前が知られるようになったせいもあり、今日はMSNから「マテラッツィ」で検索してこのブログに来る人が多い。(MSN検索結果はMSN検索結果 "マテラッツィ"へ)

そして検索結果の2番目にこのブログのRoad to me ... | 知的照明とネスタ=>マテラッツィの記事が!!

ちなみにこのマテラッツィ、ペルージャ時代の中田の同僚で、DFとしての得点記録を持ってるらしい。
いつもPKを取られる時には必ず彼がそこにいる印象があるけどね(笑

Read more

ITALIA !!!!!!

Italia, Italia, ITALIA !!!!

I
T
A
L
I
A
!!

あぁ、もう最高♪