重複コンテンツとは?SEOの影響・原因・調べ方・対策方法を解説

重複コンテンツとは、異なるWebページのURLにも関わらず、中身が同じコンテンツのことを指します。重複コンテンツによって、SEO上の問題を招くおそれがあります。サイト運営の担当者のなかには「重複コンテンツをどのように見つけて、どう対処すれば良いのか」と悩んでいる方もいるでしょう。 この記事では、重複コンテンツの定義やSEOへの影響、具体的な調べ方、対策方法をわかりやすく解説します。

重複コンテンツとは

重複コンテンツとは、別々のURLで公開されているにもかかわらず内容が同じ、あるいは非常に似ているページのことです。

重複コンテンツには「内部重複」と「外部重複」の2種類があります。内部重複は同じような内容のページが自サイト内に複数存在している状態、外部重複は他サイトと同じ内容を掲載している状態です。

重複コンテンツは、例えば以下のような原因で発生します。

原因 例示
異なるURLで同じ内容を公開している ・「www.」のありとなしの両方が存在する
・PC版とスマートフォン版でURLが異なる
一覧ページなどで自動的にURLが増える 絞り込みや並び替え機能で似た内容のページが多数生成される
複数のページで同じ文章がある 説明文としてテンプレートや共通パーツを使い回している
他サイトとのコンテンツ重複 ・寄稿記事を自サイトにも掲載する
・他サイトにコンテンツを無断転載される

上記のように、重複コンテンツはURL設計やコンテンツ運用上の不備により、意図せず発生する場合があります。SEOを目的としたオウンドメディアの記事などで起こるカニバリゼーションも内部重複の一種です。

カニバリゼーションとは

同一サイト内で似た内容のページが検索結果で競合する状態のこと。

重複コンテンツによるSEOへの悪影響

Googleなどの検索エンジンは同じような内容のページが複数あると、「どれを検索結果に出せばよいか判断できない」状態になります。その結果、どのページも評価されにくくなり、順位が下がったり圏外になることがあります。

原因を細かく解説していきます。

クロール効率の低下

重複が多いと検索エンジンが「価値の低いページ」と判断し、インデックスから除外する可能性も考えられます。検索エンジンへの登録をしないことになるため、検索結果に表示されることはありません。

また、重複コンテンツが存在すると、クロールバジェットと呼ばれる、検索エンジンのクローラーが1サイトに使えるクロール回数やリソースの上限が浪費される問題も発生します。

クローラーが、実質的に同じページを繰り返しクロールしてしまうからです。クロールバジェットが重複ページに費やされることで、本来優先的にクロールすべき新規ページや更新ページが後回しになる可能性があります。

リンク評価の分散

また、本来であればサイトの評価を向上させうる被リンクも、重複コンテンツの存在によりリンク先が分散すると、効果が薄れてしまいます。

そのため、SEO施策を実施する前や実施中に、意図せず重複コンテンツが発生していないかを把握することが重要です。

なお、重複コンテンツは必ずしもGoogleのペナルティの対象にはなりません。ただし、悪質なスクレイピング行為(他サイトのコンテンツをコピーして独自性なく掲載するなど)はGoogleのガイドライン違反とみなされ、ペナルティの対象としてインデックス削除といった措置が取られる可能性があります。

出典:Google ウェブ検索のスパムに関するポリシー|Google 検索セントラル

重複コンテンツの調べ方・確認方法

自サイト・他サイトにある重複コンテンツは、以下の方法で調査・確認できます。

・Googleサーチコンソールで確認する
・重複チェックツールを使う
・Google検索コマンドで調べる

それぞれ詳しくみていきましょう。

Googleサーチコンソールで確認する

Googleサーチコンソール(Google 検索結果でのサイトの掲載順位を監視、管理、改善するのに役立つ Google の無料サービス)では、自サイト内に重複コンテンツが存在していないかをチェックできます。

左メニューの「インデックス作成」内にある「ページ」の項目をチェックすると、「重複しています。」などの表示があり、Googleが重複と判断したURLを把握できます。

なお、「セキュリティと手動による対策」内にある「手動による対策」から、Googleによるペナルティの有無も確認可能です。

Googleサーチコンソールの情報はGoogleが自動で検出してくれるため、定期的に確認することで重複コンテンツのリスクを早めに把握し、SEO対策に役立てられます。

重複チェックツールを使う

重複チェックツールを使用すれば、コンテンツ同士の類似度を簡単に確認でき、重複によるサイト評価低下といったリスクを回避できます

例えば、以下のツールが重複コンテンツの確認に効果的です。

ツール名 特徴
sujiko.jp ・2つのURLを入力するだけで、本文・タイトル・HTMLの類似度を数値で判定可能
・どちらのURLが正規として検索エンジンに伝えられているか(canonicalタグの設定)も確認できる
・他サイトとの重複チェックにも対応
CopyContentDetector ・文章を貼り付けるだけで、他サイトと一致・類似しているか詳細に把握できる
・執筆中の原稿や外注コンテンツのコピーチェックに適している

上記のツールはいずれも無料で使用できるため、目的やサイトの状況に応じて選択しましょう。

Google検索コマンドで調べる

Google検索では特定のコマンドを使うことで、通常の検索結果に表示されない重複ページを確認できます。

まずは重複が疑われるキーワードで通常どおり検索を行います。その後、検索結果ページのURL末尾にコマンドの「&filter=0」を追加して再検索しましょう。

URL末尾に「&filter=0」を追加すると、重複コンテンツとして除外された可能性があるページも表示されるようになります。

重複コンテンツがあった場合の対策方法

重複コンテンツがあると分かった場合は、以下の方法を状況に応じて使いわけることが重要です。

・301リダイレクトを使う
・canonicalタグを設定する
・noindexタグでインデックスを防ぐ
・コンテンツを統合・削除する
・コンテンツの削除を依頼する

それぞれの特徴や方法を詳しくみていきましょう。

301リダイレクトを使う

301リダイレクトを使うと旧URLの評価を新URLに引き継げるため、SEO効果を保ったまま重複コンテンツを解消できます。

301リダイレクトとは、古いURLから新しいURLへ恒久的に転送する設定です。検索エンジンに「正規のURLは新しい方である」と明確に伝えられ、ページ評価の分散を防げます

また、ユーザーが古いURLをクリックした場合でも自動的に新しいページへ遷移するため、ユーザーにとっての使いやすさも保たれます。

301リダイレクトの設定は、サーバー側の設定ファイルである.htaccessを編集する方法や、CMSの管理画面を通じて行う方法が一般的です。

canonicalタグを設定する

canonicalタグを使うことで、類似ページが複数ある場合でも評価をひとつのURLに集約できます

canonicalタグは、検索エンジンに対して「どのURLが正規ページか」を明示するためのものです。例えば、サイズや色が異なる商品ページが複数ある場合などに効果があります。

canonicalタグの記載方法は以下のとおりです。

<link rel=”canonical” href=”正規ページのURL”>

なお、自サイトと同じコンテンツを他サイトにも掲載する場合は、転載先に自サイトを正規URLとしてcanonicalタグで指定してもらうよう依頼する必要があります。

noindexタグでインデックスを防ぐ

noindexタグを使えば、特定のページをインデックスされないようにして、不要な重複を防止できます。noindexタグには、HTML内のタグで設定し、検索エンジンに対して「このページはインデックス不要」と伝える役割があります。

noindexタグの記載例は以下のとおりです。

<meta name=”robots” content=”noindex”>

検索結果ページやアーカイブなど、SEO上評価が不要なページに設定することが多くあります。また、外部サイトへ転載したコンテンツのインデックスを防ぎたい場合にも活用できます。

ただし、noindexタグを設定したページは検索エンジンの評価対象外となるため、重要なコンテンツには安易に使用しないようにしましょう。

コンテンツを統合・削除する

自サイト内で重複するコンテンツがある場合は、統合・非公開・削除などの対応によって重複状態を解消できます。

類似ページはひとつにまとめて統合して情報を整理することで、ユーザーにとってもわかりやすいページ構成になります。

評価を維持したいページを残し、不要なページは非公開または削除しましょう。非公開や削除にしたページには301リダイレクトを設定することで、正規ページへ評価を引き継げます。

再利用の可能性がある場合は、削除ではなく非公開にすることをおすすめします。非公開ページは検索エンジンやユーザーには表示されませんが、管理者は引き続きアクセス可能です。

コンテンツの削除を依頼する

外部サイトに自サイトのコンテンツが無断転載されている場合は、早急な対応が必要です。放置すると、検索結果に転載先のページが先に表示される可能性があります。

まずは外部サイトの運営者に連絡し、コンテンツの削除または非公開を依頼しましょう。

連絡先が不明な場合や依頼に応じてもらえない場合には、Googleの「著作権侵害の報告: ウェブ検索」から削除申請を行う方法があります。申請には無断転載されたページのURL、自サイトのオリジナルURL、著作権者情報、証拠などの提出が必要です。

Googleが著作権侵害を認定すれば、該当ページはインデックスから削除されます。

まとめ

重複コンテンツの存在によって、検索順位の低下や評価の分散といったリスクが生じます。特に自サイトの設計ミスや他サイトによる無断転載など、気づかないうちに重複が発生しているケースも少なくありません。

Googleサーチコンソールやチェックツール、検索コマンドを活用すれば、重複コンテンツの有無を簡単に確認できます。問題が見つかった場合は301リダイレクトやnoindex設定、コンテンツ統合など、状況に応じた対策を早急に実施しましょう。

早めに対応することで、検索エンジンからの評価を守るだけでなく、ユーザーにとっても使いやすいウェブサイトになります。