GETパラメータが付与されたページがインデックスされているが、重複コンテンツの正規化処理は?

はてなブックマークに追加する

2017年02月28日 

Q

GETパラメータが付与されたページがインデックスされているが、重複コンテンツの正規化処理は?

A

正規化処理をしていない場合、検索エンジンはすべてのページをインデックスしようとするため、正規URLとGETパラメータが付与された非正規URLのどちらもインデックスされます。

しかし、この正規URLと非正規URLは同じコンテンツなため、独自性がないと判断され、どちらもページ評価が低下してしまいます。また、正規URLと非正規URLのそれぞれに対し外部リンクが張られる可能性があり、リンクの分散が評価の分散を招くことになります。

以上の理由から重複コンテンツの正規化処理が必要になります。架空の正規URLと非正規URLの例を用いて、正規化の方法を3種紹介します。

正規URL(例):http://www.example.co.jp/
非正規URL(例):http://www.example.co.jp/?***&GET***

1. 非正規URLから正規URLに向けてcanonical属性を記述

検索エンジンに対して、正規URLがインデックスさせたいページであるということを伝える方法です。非正規URLのHTMLソースコード<head></head>内に以下を記述します。

<link rel="canonical" href="http://www.example.co.jp/">

2-1. 非正規URLから正規URLに向けて301リダイレクト設定

非正規URLから正規URLに301リダイレクト設定をします。ただしWebサイト都合により、非正規URLに301リダイレクト設定ができないケースも存在するので、その際は以下2-2. の方法を検討しましょう。

2-2. ユーザーエージェント「 Googlebot 」に対してのみ、
非正規URLから正規URLに向けて301リダイレクト設定

これは「クローキング行為に該当するのでは?」と懸念されることもありますが、「 Googlebot 」のアクセスのみを対象に301リダイレクトを設定するので、そもそも非正規URLはインデックスしないため、違反行為には当たりません。ユーザーが検索エンジンから直接非正規URLへアクセスすることはできないため、クローキング行為となる「ユーザーと検索エンジンに対しそれぞれ異なるコンテンツまたはURLを表示すること」には該当しません。

3. Google Search Console で、URLパラメータの処理方法を指定

Google Search Console の「クロール」に入り、「URLパラメータ」内の機能を使用します。「 Googlebot 」がパラメータルールを検出し、自動登録するケースもあるため、まずはパラメータルールの「 Googlebot 」による自動登録状況を確認する必要があります。

自動登録されていないパラメータルールは「パラメータを追加」ボタンからルールを記入し、パラメータルールを保存し正規化しましょう。

ただし、Google Search Console にも記述があるように、パラメータルールを正しく理解していないと意図しないページがインデックスされる可能性があり、使用時には注意が必要です。

参考:URL パラメータ ツールでパラメータを分類する(Google 、Search Console ヘルプ)

ページTOPへ戻る

GETパラメータが付与されたページがインデックスされているが、重複コンテンツの正規化処理は?を読んだ方におすすめの記事

ページTOPへ戻る