これだけは知っておきたい検索技術

はてなブックマークに追加する

2008年03月14日 Japan.internet.com コラム

液晶テレビを思い浮かべてみよう。私たち消費者は液晶テレビを通じてテレビ番組や DVD などの映像を見て楽しんだりするわけだが、それをするために必要なことはテレビの電源の入れ方やチャンネルの換え方、DVD との接続方法などであって、液晶テレビが映像を映し出す仕組みを必ずしも知っている必要はない。つまり、対象物の仕組みや構造を知ることと、それを利用するために要求される知識は全く異なるということだ。しかしながら、対象物のことをより詳しく知り、特性を理解することで、より上手に活用できることもある。

普段、Google や Yahoo!などの自然検索から効率的にターゲットユーザーの誘導をはかろうと SEO に取り組む企業担当者は、とりわけ「如何にあのキーワードで検索1位にするか」ばかりを考えているかも知れないが、あちら側 - 検索エンジンがどのような仕組みで動き、何を考えて検索結果を作っているかを理解することにより、SEO の戦略の立て方や適切な取り組み方法が見えてくることもある。今回は、検索エンジンの基本的な技術の仕組みを押さえつつ、SEO のあり方について考えてみよう。

検索エンジンを構成する要素

検索エンジンを構成する要素は大きく分けて3つ。ネット上に膨大に存在する Web ページの情報を集める「クロール」、集めた情報から索引を作成し情報を引き出せるように整理する「インデックス」、そしてユーザーからの検索要求に対して 検索結果を出すまでのプロセス「クエリプロセス」だ。以下、1つずつ解説しよう。

1.クロール

検索対象となる Web ページをはじめとするネット上に散らばるコンテンツを集める役割となるのがクローリングだ。それらを集める収集ロボットはクローラー(crawler)またはスパイダー(spider)とも呼ばれるが、Web ページを結びつけるリンク構造(link structure)を辿りながら数十、数百億の Web ページを次々と集めていく。

ロボット型検索エンジン(人の手を介さない、アルゴリズムで処理する検索エンジン)は基本的に Web ページの収集を検索会社が人力で行ったりしない。

2.インデックス

クロールのプロセスを通じて収集した情報は、集めただけでは意味がない。これは検索エンジンであり、世の中の数千万人もの人々が常時、キーワードという媒介を使って検索要求をする。検索要求に対して答えを返す(検索結果を表示する)まで分、時間単位で待たされていてはイライラして誰も利用しないだろう。

数秒未満で答えを返すために、検索しやすいように書籍の巻頭や巻末についた索引(さくいん)のようなものをあらかじめ作成しておくのだ。これがインデックスだ。Google や Yahoo!は2008年3月現在、インデックスのサイズを公表していないが数百億単位のインデックスを持つといわれている。

3. クエリプロセス

ユーザーからの検索要求に対して、インデックスの中からキーワードに合致する Web ページの文書を素早く見つけ出し、一覧リストを作成して検索結果を表示するまでのプロセスだ。ところで、単にキーワードを含む Web ページをランダムに表示しても意味はない。ユーザーが入力したキーワードは、ほしいと思った情報の断片を言葉で具現化したに過ぎず、それに該当する、ユー ザーにとって有益な、望んでいた情報を返す必要がある。

そこで検索エンジンは、単に当該キーワードを含むだけでなく、適合性が高く、関連し、より信頼できる Web ページから順番に並び替えてあげる必要がある。つまり、Web ページの適合度や重要性、信頼性などをスコアリング(重み付け)し、ランキング表示する必要がある。ユーザーが望み、すぐに必要とした情報が探し出せる検索結果ほど、レレバンシー(relevancy、関連性)が高い「良い」検索エンジンといえる。

「人が良い」と判断するページを機械で判断するためのアルゴリズム

以上が検索エンジンの基本的な仕組みであるが、最後に述べた「Web ページの並び替え、重み付け」それを担うのが SEO の世界でよく出てくる言葉、そして多くの SEO 担当者が踊らされる「アルゴリズム」だ。

アルゴリズムは確かにどの検索会社もブラックボックス化しており、その詳細はよく知られていない、得たいの知れないものだ。

ところで、本当にアルゴリズムは「得たいの知れないもの」なのだろうか。

第1に、アルゴリズムの仕組みを考えるのは宇宙のどこかの異星人ではなく、私たち人間だ。私たちが効率的に有益な情報を取り出すための仕組みとして考案するのがアルゴリズムであって、とりたてて秘密というわけではない。

つまり、効率的に情報を取り出すためにはどのようなロジックを組み立てるのが望ましいのか、その方向性を理解すればいいし、それは理解可能だ。つまり私がここで言いたいことは、情報検索(IR、information retrieval)の世界の理屈がわかれば、100%正確に Google や Yahoo!のアルゴリズムを理解していなくてもさほど問題がないということだ。

第2に、究極の目的として検索エンジンは、「人が見て良いと思う Web ページを機械で見つけ出す仕組み」を作りたいのであって、それを実現するのが数百もの評価要素で構成される複雑なアルゴリズムだ。人が見て良いと思われる 情報、Web ページを機械で同様に判定するには何を見ればいいのかを考えて開発するのがアルゴリズムなので、本来 SEO で行うべきこと、そして最低要件として満たさなければいけないことは「人にとっても有益なコンテンツを作成し、公開すること」だ。

人の脳と同じように機械は処理ができないことがあるので、その分「機械に配慮した」文章を書く必要はないが、それに過度に媚びる必要も全くない。

第3に、アルゴリズムは数百もの評価要素によって構成されており、それらを総合的に点数化して適合性を判断する。従って、よく「タイトルにキーワードはい くつ入れるべきか」「本文は何百文字が望ましいのか」などといった個別論について1つ1つ頭を悩ませている SEO 担当者は少なくないが、その考え方に意味がない。

SEO は、検索エンジンに情報を適切に理解・伝達させようとするベストプラクティスの積み重ねによって行うものであり、自分たちはそのベストプラクティスのどれだけを実践すべきかを考えなければいけない。特定の行為をしただけでどれだけ[特定キーワードの順位に]影響があるのか、という評価をしても企業の投資対 効果の判断基準としては不適切といえよう。

SEO への投資対効果の最大化を忘れずに

さて、マーケットが非常にニッチ、専門的で検索されうるキーワードの絶対数やバリエーションが狭いのであればともかく、地域や車種、メーカーの掛け合わせキーワードにより膨大に潜在顧客にリーチしうる、ターゲットとすべきキーワードが存在するにもかかわらず、特定の検索キーワードでの SEO(というより検索結果1位)を目指して大量のリンクをかき集める手法を採用する企業もある。

もちろん、そのゴールが「検索結果で1位に表示しなければいけない」合理性があれば問題はないわけだが、現実には本来目指すべき集客や売上げ、成果の最大化というゴールを忘れて検索結果での順位遊びに落ち着いてしまっている企業が少なからずいるのではないだろうか。

たとえば、自社のビジネスに密接に関連するキーワードA~Zの26があるとしよう。アルゴリズムが特に加点するリンクだけに特化して対策すれば、キーワードAの順位は上がる。しかし、適切にページ全体、サイ ト全体をまんべんなく最適化した場合、キーワードA~Zの26すべてで最適化ができる。SEO への投資のリターンを最大化するためにはどちらが望ましいだろうか?

SEM だけでなく、行動ターゲティング広告やディスプレイ広告などほかのネット広告も展開しておりオンラインキャンペーン全体の ROI を考えるなら、自然検索からの流入間口の確保としてどちらの SEO が望ましいだろうか。雑誌や交通広告、ラジオなど様々なコンタクトポイントを持ちうるなら、どういった SEO が適切だろうか。SEO は企業と消費者とのコンタクトをつなぐものだ。

また、消費者の検索行動は1セッションあたりたった1回の検索しかしない「点」の行動ではない。1セッションあたり、様々な情報を見つけながら新たな興味・関心が生まれ、そして検索をするという「線」の行動だ。こうした検索行動の観点からも、自然検索で自社のサイトが上位に表示されるチャンスがたった1つのキーワードに限られていては、大きな機会損失にならないだろうか?

(執筆:株式会社アイレップ 取締役 SEM 総合研究所 所長 渡辺隆広)

ページTOPへ戻る

ページTOPへ戻る