検索エンジンが課す「ニュースヘッドライン」の制約

はてなブックマークに追加する

2006年04月14日 Japan.internet.com アイレップのSEMフロンティア掲載

このブログも含め私はウェブでSEM関連のコラムを執筆・寄稿することが多いのだが、職業柄か自然と記事の見出しやコンテンツ(文章や画像)を検索エンジンに最適化させてしまう。読者が、その情報を欲するときに検索エンジンで利用しそうな検索キーワード・その表現を意識して、コンテンツを最適化させるし、少なくとも、隠喩やユーモアにあふれた、キャッチーなタイトルをつけることは無意識に排除している。それでは検索エンジンに見つけてもらえないのだから。

私は本職がライターでも新聞記者でもないので別に問題とは考えていないが、そうではない人たちもいる。それがNew York Timesの"This Boring Headline Is Written for Google"に記述されている。検索エンジンが新聞社や雑誌サイトに無視できないほどのトラフィックを提供する今日、検索エンジンを意識したニュースヘッドラインを考えなければならない。しかし、そうしたSEOへの意識は事実を明確に記述したものにせざるを得なくなり、今まで知恵を絞って考えてきた、読者の関心をひきつけることを考えたクリエイティブなヘッドラインが作れないというのだ。

2年ほど前に、韓国の検索エンジンがsuicide(自殺)に関連する検索結果を削除したことがあり、それをニュースとしてブログで取り上げたことがある。しかしその数日後から「自殺」という検索キーワードで私のWebサイトに大量の訪問者がたどり着いてしまった出来事があった。きっと「自殺」と検索した人は色々と目的・考えがあって検索しているのだが、少なくとも「韓国の検索エンジンが~」なんてマニアックなニュースを知りたくて探しているわけではなかろう。また、私としてもまさか「自殺」というインテンションを持ったユーザーに探してもらいたくて記事を書いたわけではない。情報発信者、情報探索者双方にとって「望まない人たちに情報を届けてしまった(欲しくもない情報に到達させられてしまった)」という問題がつきつけられている。

これを意図的に(逆手にとって)行うことで遊びとしたのがCNET Blogでも執筆されている中島聡氏の"「サーチエンジン最適化遊び」のススメ"(Life is beautiful)というエントリーで述べられていることなのだが、先述した例も含めここに検索エンジンが抱える課題の1つが浮かび上がっている。

検索エンジンは人間のユーモアや隠喩をそのように捉えることはできない。文章中に出現した言葉が、その言葉どおりの意味で用いられているのか、それとも前後の文章やコンテンツ全体の趣旨から判断すればメタファなの判断することはできず、ただ、その言葉がこのページに出現したというように解釈する。従って、キーワードとして検索された時、こうした検索キーワードの検索意図(インテンション)とは全く関係ない、あくまでメタファやユーモアを目的にしてそのキーワードを用いた、Webページを関連性ありとして検索結果に表示してしまう。逆にヘッドラインの表現に懲りすぎて、本文において重要となるキーワードが含まれないと検索エンジンにヒットしにくくなるし、そのコンテンツにきっと関心を持つであろう読者層にリーチできなくなってしまう。

検索アルゴリズムというのは多数の様々な判断基準(ルール)の組み合わせで成立している。しかし、各々のルールは「まずルールありき」で作られているのではなく、現在のWebの環境の特徴を観察して、適合性の高いWebページが抽出できるルールを考える。例えばGoogleのPageRankは、(少なくとも)当時のWebにおけるリンクの張り方/張られ方の特徴から、それを計算するとインターネットにおける価値あるWebページを見つけ出せることに着目して考案された(※ 現在のWebにおいては、リンクは売買される商品のため、当時のコンセプトのままでは適切なページは見つけ出せない)。同様に検索エンジンにとっては厳密には不都合だけれどもWeb制作の世界において一般的に行われている行為は決してスパムとは判定しない。もしそれをルール違反と判断すれば世の中の価値ある多くのWebページが探し出せなくなってしまうからだ。つまり検索エンジンは私たちの日常普通に行われている行為を否定することは基本的にはない。

しかし、ことニュースヘッドラインの作成に関していえば残念ながら今まで紙媒体でヘッドラインを作成してきた人々に少しばかり適応を迫っていることになる。検索エンジンがもっと進化して - 自然言語処理が進化して、単にヘッドラインの文言だけでなくその裏にこめられた作者の意図を推定できる - ようになればNew York Timesで述べられている問題は解決するのだろうが、そんな時代になるのはまだもう少し時間がかかりそうだ。

(執筆:株式会社アイレップ SEM総合研究所 渡辺隆広)

ページTOPへ戻る

検索エンジンが課す「ニュースヘッドライン」の制約を読んだ方におすすめの記事

ページTOPへ戻る