Webクローラーツールを活用した事例などをご紹介していきます

SEO+クローラークローラー全般クローラー導入の検討ポイント

SEOに強い競合サイトのcanonical設定やnofollowをはじめとした内部構造を把握して自社サイトを強化するクローラー活用方法

SEOに強い競合サイトのcanonical設定やnofollowをはじめとした内部構造を把握して自社サイトを強化するクローラー活用方法

Webマーケティングで絶対に外せない大切な施策のひとつであるSEO。外部リンクを獲得すればOKという時代はひと昔前の話で、現在ではこれまで以上に内部施策が重要なポイントとなっています。クローラーの活用のなかでもSEOを強化するための活用には、クローラーに対する知識と、SEOに対する知見の両方を持っている必要があり、少しわかりにくいところになります。ここでは、クローラーを使って、SEOが強い競合サイトの設定状況を把握し、自社のサイトを強化するためのToDOをまとめるためのポイントを紹介していきます。まず、最初にSEOにおける内部施策の主要なチェックポイントをみていきます。主なものとしては以下のようなものがあります。

  1. サイト全体の趣旨の一貫性(専門性)
  2. ページ内テキストのインターネット上でのユニーク性
  3. サイト内のページの情報構造と正規化
  4. HTMLの適切な利用
  5. エラーやデッドリンクなどサイト利用者に対するマイナスポイントの有無

このようなポイントを、クローリングしたHTMLを1ページずつ処理して、サイト全体で判定していくことで、様々なことがわかってきます。一見すると同じように見えるサイトでも、SEOに強いサイトというのは、しっかりとやるべきことをやっているということがお分かりいただける結果になるはずです。では、ここからは具体的なポイントを見ていきます。

H1タグやタイトルタグに設定されているテキストとその中に登場する重要なキーワードは何か

最初にやるのは当然ですが、クローラーがサイト内のHTMLページをすべて収集するという作業になります。この後、1ページずつ丁寧に、そのページの文字数、主要なタグの文字数、それらに含まれている重要なキーワードの抽出などを行っていきます。これによって各ページがどんなことを伝えようとしているのかを把握することができます。ここで重要になるのは、ページ内で利用されている各タグのテキストを総合的に判断した時に、ひとつのことを指し示しているかという点です。クローラーをSEOで利用する場合、タイトルタグ、H1タグ、Descriptionタグ、そしてBodyタグの中に記載されている一般的なテキストなど、タグごとにテキストを別に処理します。最終的にそれらをすべて確認し、ページ判断のひとつをしていくことになります。この評価の時、キーワードの有無だけでなく、それらが登場する位置も重要な要素としてスコアに利用します。文章というものの特性上、重要なキーワードはタイトル、本文中など要素を問わず、より前の位置に記載されるというのが一般的なためです。キーワードの位置についてもスコア評価を加えていきます。

そのページにリンクを張っているサイト内のページはどれくらいあるのか、又、それはどんなページか、どんなリンクをつけているのか

次に見ていくのは、各ページがサイトの中でどのような位置づけのものなかを把握するための作業です。最初に見るべきはURLの構造、いわゆるディレクトリ部分です。まず重要なページというのは浅いディレクトリに存在し、かつ、ディレクトリ内でインデックスページに該当する位置づけになっています。こうしたことに加えて、そのページが他のHTMLページから、どのように評価されているのか、位置づけられているのかを把握するためにcanonical、nofollow、noindexなどを見ていき、位置づけをスコアリングしていきます。canonical先として設定されているのであれば、canonical元のページの内容の集大成としてのページとして位置付けられていることになり、非常に重要なページであることがわかります。canonical先ではなく、元ページであった場合は、まとめられるべきページの一部としての位置づけということになります。noindexやnofollowも検索エンジンに対して、そのページの位置づけを伝えるために設定する材料のひとつです。こうした点をチェックすることで、そのページがサイト内でどのような位置づけのものなのかをスコア評価していきます。

デッドリンクやHTMLの記述ミス、重複の有無などエラー関連を調べていく

人がサイトをチェックしていると、見落としがちな部分であっても、クローラーはしっかりと見つけ出してくれます。最もシンプルなものとしてはデッドリンクです。リンクを設定しているものの、その先のページが存在しないというもので、これは利用者にとってマイナスであるため、サイト評価を落とすポイントになります。それ以外にもcanonical設定などがされていないにもかかわらず、一部のタグの設定が重複するページがサイト内に存在するかどうかや、通常、利用するにあたって問題と思われる部分がないかを確認していきます。気を付けたいポイントのひとつに、利用者にとってわかりにくい、テキスト量が少ないページなどの問題もありますので、こうした点もここでチェックします。また、厳密にはエラーなどではありませんが、グーグルなどがチェックするポイントとしている点としてスマホの対応、SSLの対応や設定などがありますので、ここも一緒に見ていきます。ここら辺はリダイレクトなどをうまく使っているサイトもありますが、HTTPステータスコードなどが不適切な場合もあるため、HTTPステータスコードもクローリングの際に収集し、チェックしていきます。

こうしたことを通して、サイト全体、サイトの中の各ページの細かな状況がわかってきます。SEOで強い競合サイトと、自社の両方をクローラーで収集、分析して比較してみると、違いが一目瞭然になりますので、具体的な改善ポイントを作りたいという方にはおすすめです。

Next article クローラーで収集した企業サイトのHTMLページから、取り扱い商品やサービス、支店・支社の有無などを分析することでアタックリストの質は飛躍的に向上
Previous article 企業名の名寄せを的確に行うためにはAI+クローラーの活用がポイント

Related posts