私的アンテナTYPE-F(赤は48時間以内に更新されたコンテンツ)
<|日々の戯言アニメコミックゲーム美少女系ゲームフィギュアドール全般しーぽんちっちゃなもこちゃんえっくす☆きゅーとアキバ系りとらばU-10BLOGネットネタこのサイトについて|>

2007年10月18日 (木曜日)

Googleイメージ検索の精度が低い件

はみ出しコネタでも取り上げましたが、現在「初音ミク」の画像が各検索エンジンのイメージ検索から消されていることが騒がれています。

「初音ミク」の画像が検索できない ~発売元は「削除は依頼していない」 (INTERNET Watch)
「初音ミク」画像がネットから“消えた”?
“消えた初音ミク”問題 ヤフーとGoogle「原因を調査中」 (以上2つITmedia News)

Google、Yahooの2大エンジンからほぼ同時に消えてしまったので、TBSなどが圧力を掛けた等の陰謀説があるようですが、とりあえず本題と違うのでそのことは置いておきます。

さて本題。
以前どこかの掲示板でアゾンドール関連の画像検索をGoogleで行うと当サイトの関連のない画像ばかり出てくる、と指摘された記憶があります。
その時は同現象を不思議に思ったものの、それほど深くは追求しませんでした。
しかし、その謎の現象は今でも再現が可能だったりします。

ということで極限られたサイトしか使っていないはず(^^;の「1/3HACフィーナ」というキーワードで、各検索エンジンをテストしてみます。
以下ウェブサイト検索、画像検索の結果です。

Googleで1/3HACフィーナを検索
Yahooで1/3HACフィーナを検索
MS Live Searchで1/3HACフィーナを検索

Googleで1/3HACフィーナを画像検索
Yahooで1/3HACフィーナを画像検索
MS Live Searchで1/3HACフィーナを画像検索

ウェブサイト検索では各エンジンともほぼ妥当?な結果が戻ってきていますが、画像検索ではGoogleのみ関連のない画像が並んでいることに気付くと思います。
これら画像はほぼアマゾンの商品画像であり、「1/3HACフィーナ」とは関係ありません。
当然この結果は意図的ではなく、恐らくGoogleの画像関連付けのアルゴリズムに問題があるものと思われます。

但し当サイトがこうなり易いのは、以下のサイト構成に影響されいると思われる節があります。

全ての記事、アーカイブにサイドバーがつく
 サイドバーはBlogの共通パーツでアゾン製品のアマゾンへのリンク集となっています。
 このためGoogleはクロール後、各記事に「1/3 HAC フィーナ」というキーワードが含まれているため、同インデックスを与えていると思われます。

robots.txtでサイト画像をクロール禁止にしている
 当サイトは検索エンジンに対し、画像クロールを全面的に禁止しています。そのためこのサイト(ドメイン)の画像は検索結果には存在しません(多分)。
 しかしながらGoogleはアマゾンの製品も含めた他ドメインへの直リンク画像は拾っていくようです。

そんなわけで申し訳ないのですが、Googleの画像検索ではこのサイトが上のように表示されてしまうようです。

ちなみに上の件を思いついたのは、「初音ミク」Google画像検索の実験をされている方がいたため。
googleの画像検索を試すような事をしてみた (普通のブログというモノは)

初音ミクの画像検索結果にしても関連性は低いものの、各サイトを見れば「初音ミク」が含まれています。
ようは本来出るべき関連性の高いインデックスが、理由は不明ですが削除されているいうことです。

・2007/10/19【追記】
「ググる」から「ビる」へ 初音ミク騒動でLive Search高評価 (やじうまWatch)
 上の画像検索テストでも明らかですが、Live Search最高ってことで・・・。
検索比較::画像検索における「初音ミク」問題の正解となる答え
 画像検索用インデックス更新のタイミングが正解の気もするけど、それだけでもないような気もします。

・2007/10/22【追記】
「意図的削除はしていない」が…… 謎深まる“消えた初音ミク”問題 (ITmedia News)
 NGワードフィルタが原因だとすれば、やはり何らかの人為的操作があったっぽい?
 ただこの問題、技術的なものが原因ならそれほど調査に時間は掛からないはず。
 というのもキーワードを売って広告で稼ぐことを生業としているのに、そのトレースに迅速に答えられない方がおかしいですから。
 このまま世間の興味が薄れるまで適当に引き伸ばされて、うやむやにされそうな予感・・・。

・2007/10/23【追記】
「初音ミク」画像、Googleに復帰 (ITmedia News)
 とりあえず戻ったようですね。関係ない画像が混じるのは上と同じで元からかと。

・2007/10/26【追記】
「初音ミク」画像検索問題で、検索エンジンの“違い”に再び注目が (INTERNET Watch)
ヤフー「画像の収集が遅れた」 初音ミク問題でコメント (ITmedia News)
 Yahooは決算会見で突っ込まれましたしね。公式にはクロールが間に合っていなかった&検索精度の問題ってことでFA?

トラックバック
このエントリーのトラックバックURL:

スパム対策の為、トラックバック元URLに本Blogへのリンクを含まない場合、トラックバックを受け付けない仕様になっています。また、Blogやそれに順ずるシステム以外からのトラックバックも受け付けません。予めご了承ください。
なお、お手数ですがトラックバックURLより「☆★」を取り除いてください(オートディスカバリ非対応です)
コメント
コメントする






情報を保存しますか?


画像の数字を入力