2022.10.27
【2024最新版】SEOに必須!クローラー対策を徹底解説
クローラーという言葉はウェブサイトの制作に携わった方であれば、一度は耳にしたことがあると思います。
しかし具体的にどういったものなのか、細かい部分までは理解しきれていないという方も多いのではないでしょうか。
この記事ではクローラーの具体的な解説から、サイトを運営するうえでどのように活用していくかまで、掘り下げて解説していきます。
クローラーについては、この記事を最後まで読んでいただければバッチリ理解できます!
▶SEO対策のメリット関しては以下の記事で詳しく解説していますので、ぜひ参考にしてください。
中小企業こそSEO対策をすべき!メリットや対策方法を解説します
クローラーそのものに関する詳しい解説
まずはクローラーというものが何であるか、具体的に解説していきます。クローラーの概要や種類、対象となるコンテンツなどを見ていきましょう。
そもそもクローラーとは?
クローラーとはインターネット上のウェブサイトや画像などを取得し、検索エンジンに表示するための巡回ロボットのことです。Web上の情報を網羅的に巡回することから、這うという意味の「クロール」が語源になっています。
例えばウェブサイトを作成するために、サーバーに文章や動画、画像などをアップしたとします。それをクローラーが巡回して情報を取得し、検索エンジンに反映させるという流れです。
クローラーの種類
検索エンジンの数だけクローラーは存在します。有名なクローラーは、下記の通り。
- Googlebot
- Bingbot
- Yahoo Slurp(海外のYahoo!)
- AppleBot(Apple)
他にも様々なクローラーが存在していますが、上記のクローラーは特に多くのユーザーに影響を与えています。
クローリングの対象となるコンテンツ
Googlebotのクローリングの対象となるコンテンツは、以下の通りです。
- HTML
- 画像
- 動画 – サポートされている動画形式のいずれか
- JavaScript
- CSS
- その他の XML – XML をベースとした RSS、KML などの形式を含まない XML ファイル
- JSON
- シンジケーション – RSS フィードまたは Atom フィード
- 音声
- 地理データ – KML または他の地理データ
不明(失敗) – リクエストが失敗した場合、ファイル形式は不明となります。
引用元:クロールの統計情報レポート – Search Console ヘルプ「クロールされるファイル形式」
クローラーというとウェブサイトやページをイメージする方が多いと思いますが、対象となるコンテンツは多種多様です。
▶クローラー対策に必須のSEOのキーワード選定関しては以下の記事で詳しく解説していますので、ぜひ参考にしてください。
クローリングを拒否することも可能
検索エンジンに表示させたくない、クローズドの情報などは、クローリングを拒否することもできます。クローリングの拒否の方法は主に3つございます。
robots.txtによるブロック
「robots.txt」ファイルを作成し、クロールをブロックしたいディレクトリにアップロードする方法です。robots.txtはクローラーの動きを制御するためのファイルで、このファイルにクロールしてほしくないページやファイルを記載します。アップロード先は一番上の階層である、ルートディレクトリになります。
.htaccessを利用する
ファイルにパスワードをかける方式で、クローラーは巡回することができなくなります。「.htaccess」というファイルを作成し、アップロードすると検索結果に表示されないだけでなく、ユーザーもアクセスができなくなります。「.htaccess」ファイルをアップロードした階層内にのみ、影響を与えます。
noindexを利用する
htmlファイル内のメタタグに記載することで、クローラーをブロックすることができます。検索結果には表示されなくなりますが、ユーザーはサイトやページにアクセスすることができます。
検索結果に表示させたくないページにのみメタタグを記載をすることが可能で、重複コンテンツのブロックにも効果的です。メタタグを記載するだけで設定が可能であるため、最も易しい方法といえるでしょう。
クローラーがサイト運営者に与える影響
クローラーはサイト運営者に対して、どのような影響を与えているのでしょうか。大きく2つの影響についてみていきましょう。
検索エンジンにサイトやページを表示してくれる
クローラーが巡回することによって、データが取得され、検索エンジンにサイトやページが表示されます。検索エンジンからユーザーを集客するためには、クローラーの存在は必要不可欠という事です。
検索エンジンに分かりやすく情報を提供するための手段の1つとして、「SEO対策」があげられます。どのようなサイトやページであるのか、そしていかにユーザーに有益な情報を提供しているのかという点を、分かりやすく伝達することが大切です。そのために構造をクローラーが読み取りやすい仕組みにしたり、見出しやタイトルにキーワードを入れたりといった工夫をしていきます。SEO対策が十分になされているサイトやページは、検索結果の上位に表示されやすくなり、集客効果も大きくなります。
定期的にサイトやページを評価し順位を入れ替える
クローラーが定期的に巡回することで、最新のサイトやページの情報を収集し、評価を行います。その評価をもとに検索エンジンで表示される順位が入れ替えられるため、常に上位を狙える環境が整っています。これからウェブサイトを立ち上げて参入する企業やユーザーであっても、きちんと評価してもらえて、上位表示を狙うことができるのは、定期的に巡回を繰り返すクローラーのおかげです。
Googleのクローラーについて
クローラーの種類はここまでお伝えした通り、数多く存在します。その中でも多くのユーザーが利用する、Googleの検索エンジンのクローラーについて、詳しく解説していきます!
最も影響のあるクローラーはGoogle
インターネット上には様々な検索エンジンがあり、その数だけクローラーも存在します。数ある検索エンジンの中でも最も多くのユーザーが利用しているのが、Googleの検索エンジンです。そのため世界的に最も影響力のあるクローラーは、Googlebotといえるでしょう。検索エンジンからの集客を強化するための「SEO対策」は一般的に、Googlebotの対策を意味することが多いです。そんなGoogleのクローラーにサイトやページを認識してもらい、検索エンジンに表示してもらう方法についてもここから解説します。
サイトマップをGoogleに提出する
サイトマップを提出することで、サイト内のページを抜けもれなくクローリングしてもらえます。自動で更新されるサイトマップを用意しておけば、新しくコンテンツを作成しても、そのURLがサイトマップを通して、自動的にクローリングされます。
Google search consoleを通してsitemap.xmlを送信すれば、サイトマップの送信は完了します。Wordpressであればサイトマップを自動で作成してくれるプラグインが何種類かありますので、こちらを活用すると良いでしょう。
Search Consoleでページのインデックス登録をリクエストする
Search Consoleを通して、ページごとにインテックス登録のリクエストをすることも可能です。Search Consoleの上部にあるボックスにURLを入力し、「インデックス登録をリクエスト」をクリックしましょう。更新したページや新規作成したページを、いち早くインデックスさせたいときにおすすめです。リクエストをしなくとも、クローラーは自動的に更新したページや、新規追加したページをクロールしてインデックス登録してくれる可能性が極めて高いです。しかしインデックス登録をリクエストすることで、よりインデックス登録がスムーズに進むと言われています。
Googleのクローラー対策として効果的な手段とは?
Googlebotと呼ばれるクローラーが、Webページをより見つけやすく、そしてより認識しやすくするための対策です。クローラー対策として有効な手段について、ここから解説していきます。
URLの構造を複雑にしない
トップページからの階層が複雑になると、クローラーには不親切になってしまうと言われています。トップページから2階層までで、全てのページにたどり着けるのが理想的です。
またURLの文字列が長くなるのも、好ましくありません。ドメイン名もパーマリンク名も、必要以上に長くならないように注意しましょう。
テキストリンクの割合を高くする
クローラーがウェブサイト内のリンクをたどる際、画像よりもテキストの方がリンク先の情報が読み取りやすいです。「リンクはこちら」というような表記ではなく、どんなページへリンクを貼ってあるのかがわかりやすいよう、キーワードを入れておくことも大切です。もちろん画像へリンクを貼るケースも存在すると思いますが、テキストリンクの比率を増やすことがクローラー対策になります。
被リンクを増やす努力をする
他サイトやSNSからのリンクが増えると、クローラーは参照元が増えるため、巡回しやすくなります。SNSに自分でURLを投稿したり、自分が運営するサイト同士でリンクを貼りあうことももちろん効果的です。加えて自分以外のユーザーがリンクを貼ってくれるようになると、拡散効果も高まり、よりクローラビリティが高まります。
被リンクは検索エンジンが評価する際の基準としても重要で、検索結果に表示される順位にも影響があります。被リンクはユーザーに有益なコンテンツを作っていれば、自然と増えていくものであり、不自然な被リンクはスパムと認定されてしまい、逆効果となってしまうケースもあるので注意しましょう。
URLを正規化する
例えばwwwありのページと、無しのページの両方が存在してしまうと、それぞれのページをクローラーが巡回することになり、クローラビリティが悪くなってしまいます。301リダイレクトなどを活用して、一方のURLに正規化するようにしましょう。
また同一のページが別のURLで存在してしまうと、重複コンテンツとして認識されてしまうこともあります。重複コンテンツはユーザーにとって、正しい情報をスピーディに取得することを妨げてしまいます。そのため検索エンジンにおけるサイト全体の評価も、下がってしまうリスクがあるため、気を付けなければいけません。
ファイルの容量が大きくなり過ぎないようにする
画像やcss、Javascriptなどのファイルの容量が大きくなってしまうと、クロールのリソースが減ってしまいます。リソースが減ってしまうとクロール速度が遅くなったり、クローラビリティが悪くなってしまいます。AMP化の実装や画像ファイルのサイズの縮小など、サイト全体の容量の縮小を心がけましょう。
またファイルの容量が大きくなると、サイトやページの読み込みに時間がかかってしまいます。表示速度はSEOにおいて重要な指標の1つとなっているため、そういった意味でもファイルの容量の縮小はとても大切です。
サーバーの最適化を心掛ける
サーバー応答速度が遅いと、クローラーの正常な巡回を妨げてしまうことがあります。ディスクやメモリの容量を増やす、もしくは性能の高いサーバーへ引っ越すというのも1つの手です。サーバーの応答速度が速くなれば、スムーズな巡回が可能となり、クローラビリティが良くなります。
重要度の低いファイルやページのクロールを拒否する
重要度の低いファイルやページのクロールを拒否することで、クロールの浪費を防ぐことができ、クローラビリティが良くなります。例えば問い合わせフォームやPDFファイル、極端に文字数が少ないコンテンツなどは、クロールを拒否しておくと良いでしょう。
ページやコンテンツの1つ1つがサイト全体の、検索エンジンの評価を左右します。低品質なページやファイルのクロール拒否は、クローラビリティに影響を与えるだけでなく、SEO対策としても効果的です。
クローラーの解説まとめ
クローラーとはインターネット上のウェブサイトや画像などを取得し、検索エンジンに表示するための巡回ロボットのこと。
検索エンジンの数だけクローラーは存在し、Googlebotが最も有名です。
クローラーが定期的に巡回することで検索エンジンにサイトやページなどが表示され、その順位も入れ替わります。
クローラー対策を行い、クローラーがスムーズに巡回できるようなサイト構造を心がけましょう。
malna株式会社のSEO対策代行
とはいえ、
「自社ブログを運営したいけど、初心者だからどうやって対策すればいいかわからない…」
「一から作成するのは難しそうだな…」
とお悩みの方もいらっしゃるはず。
malna株式会社では、総合的なwebマーケティング支援を行っています。20代の若手社員を中心に世の中のトレンドをいち早く掴み、過去の多様な業種へのコンサルティング支援の経験を活かした幅広いサービスを展開しています。スピーディかつ本質的な成果にコミットし、貴社の利益に貢献いたします。
担当者との定期的なミーティングの設置や、日々の円滑なミュニケーションなどサポート体制が非常に充実している点が特徴です。
✔ SEO対策を始めたいが、やり方が分からない
✔ 自社のページを上位表示させたいが、自分たちでできるか不安だ
✔ SEO対策で、幅広いターゲットにアプローチしたい
こんなお悩みを持つ方は、是非一度話だけでも聞いてみませんか?
無料相談はこちら