インデックスとはグーグルのデータベースに登録されること
<スポンサーリンク>
検索エンジンの最大手「グーグル」は、人間ではなく「クローラー」というプログラム(Googlebot)を使ってWeb上の情報を収集を行います。そのため「ロボット検索エンジン」と呼ぶ。SEO診断を目指す方は基本ルールをマスターしてください。
- クローラーがWeb情報を収集することをクローリング
- 収集した情報をデータベースに登録することをインデックス
インデックス登録されていないページは存在しない
インデックスという言葉は、SEOのテクニックで頻繁に使うので覚えてください。
新規にサイトを作成した直後は、インデックス登録されていないので、検索結果に表示されません。SEOを行うためには、ロボットに巡回してもらいインデックス登録ができてからになります。
ロボットは、ページ上のリンクからリンクを辿って巡回します。=リンクやウェブ階層をシンプルにすると人間もロボットも動きやすいのです!
クローラーは、文字情報しか読めない
ページを読んでも必ずインデックス登録されるとは限りません。ページ内に記述された文章の文字情報が十分あり、ページ毎にオリジナルで意味のあるコンテンツであることが必要!
インデックス登録されにくいページやサイト
- 写真や画像ばかり。文章がほとんどないページ
- 広告ばかりでオリジナルの内容がほとんどない
- 同じような言葉を使ったページばかりで独自性や魅力に欠けるサイト
外部からのリンクを得られたページはクローラーが巡回しやすくなりますが、過剰なリンク数増加率を示すページはペナルティとしてインデックスから外される場合がある模様。
Webマーケティングは、グーグルにサイト登録を行うことが第一歩
グーグルにURLを追加:サイト登録を行う。新しいURLを作成した場合にこちらからお知らせを行います。基本的に新規サイトを作成したときに行ってください。
ウェブマスターツールに登録:グーグルと相性の良いウェブサイトを育成するために登録を行いましょう。彼らとの大切なコミュニケーションツール。
クローラーを拒否する設定
サイトを作成途中、広く公開せずに仲間うちだけのアクセスにしたい場合、拒否する設定にすることができます。
その時は、「robots.txt」というファイルを使う。
robots.txtで検索エンジンのクローラーを拒否する場合、以下のように記述します。
すべての検索エンジンを拒否する
User-agent: *
Disallow: /
一部のページだけで拒否したい場合は、以下のようにディレクトリを指定します。
User-agent: *
Disallow: /test
Allow: /
参考サイト(拒否する方法)
- SEO検索エンジン最適化:クローラーとインデクサの制御
- robots.txtの使い方:グーグル(英語)
- Webに関するテクニックメモ
ワードプレスでサイトを構築すると、プライバシー設定で簡単に、検索エンジンのブロックができます。
設定⇒表示設定
ワードプレスの管理画面で上記設定画面の「チェック」を入れるだけでOK。初歩的なミスとしてサイト作成後に全くインデックスされない場合は、管理画面から表示設定を確認してください。
タグ:グーグル