« ナンバーポータビリティ時代のモバイル SEM | SEM ilog ホーム | モバイル検索に対応するサイトの作り方とは? »
重複コンテンツが招くSEOトラブル
ブログやSNSといった手軽な情報発信ツールや他サイトのコンテンツの取り込み、あるいは他サイトへの提供が簡単にできるRSSフィード技術や関連ツールの広がりによって、SEOを実施する上であらたな問題を引き起こしている。それが重複コンテンツの問題だ。
重複コンテンツとは、同一コンテンツが複数のURLに存在する状態を指す。検索エンジンは重複したコンテンツは基本的に登録を行うことはない。もし同じコンテンツを重複してインデックスしていくと、ある検索クエリに対する検索結果として同一内容を持つ異なるURLを複数表示することになり、検索利用者の検索体験の質低下を招くからだ。従ってGoogleはもっとも評価が高い、あるいは一定以上の評価を受けたページのみを登録するし、Yahoo!は重複コンテンツと判定すればクロールをしないようになっている。
Webサイト運営者からすれば、希望する検索キーワードで上位表示する大前提として検索エンジンのデータベースに登録されることは必須条件であり、それが満たされないのであれば大きな問題となる。しかし、冒頭で述べたようなブログやSNSの存在、RSSフィードによるシンジケーションはもちろん、様々な理由で重複コンテンツが発生してインデックスに支障をもたらすケースがある。
例えばニュースサイトはブラウザ閲覧用のページとは別に、印刷用のページを用意している場合がある。数多くの商品点数を抱えるEコマースの場合、「メーカー別」「ブランド別」「用途別」と複数のカテゴリ階層で構成されている場合、各々の階層に同一商品のページが異なるURLで生成されてしまう場合がある。いずれの場合も、全く同じコンテンツが存在することになり、検索エンジンに適切に登録されない問題を招く場合がある。
冒頭で触れたブログやSNSは、「コンテンツのコピー」により重複コンテンツが生まれる場合がある。ブログやSNSは手軽にページ生成が可能なため、個人的な記事クリップといった悪意のない目的、あるいはコンテンツ連動広告で金銭を稼ぐことを目的に他サイトのコンテンツを借用してページを作成する場合もあるが、いずれにせよこの場合も重複コンテンツが発生する。このケースでは、コンテンツ盗用者の運営するサイトがもともとのコンテンツ保有者のサイトよりも評価が高い場合、関連するキーワードで検索した際にコンテンツ盗用者のサイトが先に表示されてしまいトラフィックが奪われる場合もある。
以上、重複コンテンツの存在は検索エンジンへの登録が妨げられるというケースと、それが発展してコンテンツ盗用者にトラフィックを奪われるという問題が発生するケースもある。いずれにしても、Webサイト運営者はこうした問題への対処法も考えなければいけない。
まず第1に、運営サイト内で発生する重複コンテンツは発生しない仕組みを作ることが必要。基本的に1つのコンテンツは1つのURLのみに存在するようにする。システム上、それが回避できない場合はいずれか一方の重複コンテンツをクロール拒否設定することで、クローラが同じコンテンツを巡回しないように設定をする対策が可能である。例えば印刷用とWeb閲覧用のページはユーザのWeb体験上避けられないものであるから、これは印刷用をrobots.txtなどでクロール拒否すればいいわけである。METAタグにロボットのクロールを拒否するnofollow、noindex を入れてもいいだろう。
第2にコンテンツ盗用者対策だが、まずは盗用者に対して警告を行い削除要請をすることを試みる。応じられなければ、検索エンジンに対して該当コンテンツをインデックスから削除することを要請することが可能だ。デジタルミレニアム著作権法(DMCA法)に沿って必要な手続きを行うことで、GoogleもYahoo!も盗用者のコンテンツをインデックスから排除する作業をしてくれる。
発信した情報を検索エンジンという情報流通システムを通じて必要とするユーザに円滑に伝達できる環境を構築するためにも、検索エンジンにあわせたコンテンツの配置や管理を考えていく必要がある。
(文:リスティンググループ 第2リスティングチーム ストラテジスト 鈴木綾香)
(構成・監修:SEM総合研究所 所長 渡辺隆広)
[PR]
保険探し、生命保険の見直しなら 保険比較サイト 保険市場へ
学資保険、医療保険、生命保険などの最新人気ランキング、豊富な商品数から徹底比較。一括資料請求できます。
[PR] ランキング上位だけで満足ですか?売上げに直結するSEOならアイレップにお問い合わせを
2006年11月20日 21:27 - [SEMコラム]






