忍者ブログ
  • 2024.04
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 2024.06
[PR]
×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

【2024/05/07 10:13 】 |
グーグル八分 グーグルボット
グーグル八分

Google八分(google ban)

グーグル八分とは、Googleにおいて、特定のページがフィルターされ、検索結果の上位に表示されない、または、まったく表示されないことを指します。

グーグル八分には、以下の2種類が存在するとされます。

1)GoogleがSEOスパムと判断したページ
2)他者からの通報や要請で、Googleが著作権法などで違法または不適切と判断したページ

2)によって実施されたグーグル八分の場合、検索結果ページ(通常は10件)に当該ページが含まれていた場合、それを表示せず、検索結果ページの最下部に以下メッセージが表示されます。

Google 宛に送られた法律に関するリクエストに応じて、検索結果のうち 1 件を削除しました。必要に応じて、ChillingEffects.org で削除が発生したことに至った苦情を確認できます。

★グーグル八分対策センター
http://www.google8bu.com/

★グーグル八分の確認と対応の方法
http://www001.upp.so-net.ne.jp/wakan/Others/Google-Removed.html

関連ページ(施策):
    SEOスパムについて

関連ページ(用語):
    SEOスパム


 SEO新時代   
 最強のSEO       
 クラウド       
 SEO情報宝庫   
 食洗機の情報   
 ウェブ担当者   
 SEO対策の辞典   
 最新SEO       


Googlebot

Googlebot(グーグルボット)

Googlebotとは、Googleが使用するクローラーの名称です。

Googlebotには複数の種類がありますが、主要なHTTP_USER_AGENTは以下です。

    Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)


○Googlebotのアクセス拒否またはアクセス間隔制御の方法

☆.htaccessによる方法

※サイトのトップディレクトリに保管する.htaccessファイルをウェブサーバーが読み取ってアクセス制御する方法です。
※ウェブサーバーの種類や設定状況によっては、使用できないことがあります。
※サイトのトップディレクトリに.htaccessファイルを保管できる権限が必要です。
※この方法が使用可能な場合、アクセス制御として一番確実な方法です。

★全アクセスを拒否(クローラー名称を指定する方法)
┌────────────────────────
│SetEnvIf User-Agent "Googlebot" deny_ua
│Order allow,deny
│Allow from all
│Deny from env=deny_ua
└────────────────────────
 ※ "Googlebot"は、Googlebotを識別可能なHTTP_USER_AGENT中の一部の文字列です。
 ※ HTTP_USER_AGENTが変更された場合などは、必要に応じて変更が必要です。

★全アクセスを拒否(IPアドレスを指定する方法)
┌────────────────────────
│Order allow,deny
│Allow from all
│Deny from IPアドレス1
│Deny from IPアドレス2
│ :
└────────────────────────
 ※ IPアドレスは、クローラーのIPアドレスを、「12.345.6.789」のように指定します。
 ※ 複数のIPアドレスを指定する場合、複数行を指定します。

☆robots.txtによる方法

※サイトのトップディレクトリに保管するrobots.txtファイルをクローラーが読み取ってアクセス制御する方法です。
※クローラーによっては、対応されません。
※Googlebotの場合、対応していることが、下方のURLに明記されています。(最短アクセス間隔には対応せず)
※サイトのトップディレクトリにrobots.txtファイルを保管できる権限が必要です。

★全アクセスを拒否
┌────────────────────────
│User-agent: Googlebot
│Disallow: /
└────────────────────────

★最短アクセス間隔を指定

 ※ Googlebotは、robots.txtファイルによるアクセス間隔指定に対応していません。
 ※ ただし、Googleウェブマスターツールの「クロール率」で「少ない」を指定できます。(下方参照)

☆メタ・ロボットによる方法

※HEADセクション内にメタ・ロボットが記述されたHTMLファイル(URL)をクローラーが読み取ってアクセス制御する方法です。
※HTMLのHEADセクション内に以下の行を追加できることが必要です。
※アクセス制御の対象とする全HTMLファイルに追加が必要です。
※クローラーによっては、対応されません。
※Googlebotの場合、対応していることが、下方のURLに明記されています。

★当該HTMLファイル(URL)のアクセスを拒否
┌────────────────────────
│<META NAME="GOOGLEBOT" CONTENT="NOINDEX,NOFOLLOW">
└────────────────────────

☆Googleウェブマスターツールによる方法

★アクセス間隔(クロール率)を指定

※Googleウェブマスターツールの「クロール率」で「少ない」を指定できます。

・サイト

├ 診断
│ ├ 概要
│ ├ クロール エラー
│ │ ├ ウェブ クロール
│ │ └ 携帯サイト
│ └ 運用ツール
│   ├ robots.txt 解析
│   ├ サイト確認の管理
│   ├ クロール率        ← ★ここ
│   ├ 使用するドメイン
│   └ イメージ検索の機能強化

***

★Googlebotのrobots.txtとメタ・タロボットの説明
http://www.google.com/support/webmasters/bin/answer.py?answer=35303

★Googlebotのアクセス制御用名称の説明
http://www.google.com/support/webmasters/bin/answer.py?answer=40364

★Googlebotのrobots.txtファイル仕様の説明
http://www.google.com/support/webmasters/bin/answer.py?answer=40362

★Googlebotのrobots.txtファイル仕様の説明(ワイルドカード文字)
http://www.google.com/support/webmasters/bin/answer.py?answer=40367

★Googlebotを説明するページの目次
http://www.google.com/support/webmasters/bin/topic.py?topic=8843


関連ページ(用語):
    Googleウェブマスターツール
    Google
    クローラー
    Yahoo Slurp
    msnbot
    Baiduspider
    NaverBot
    .htaccess
    robots.txt
    メタ・ロボット



PR
【2011/01/31 01:50 】 | 未選択 | 有り難いご意見(0) | トラックバック()
HTTPリファラー (SEO)
HTTPリファラー (SEO)

HTTPリファラー(エイチ・ティー・ティー・ピー・リファラー)

HTTPリファラーとは、「HTTP_REFERER」を参照してください。


<有用SEOブログ>

    できるSEO               
    平成SEO
    Search Engine Journal   
    HDDデータ修復      
    SEO対策               
    新人SEO管理者           
    SEO相談まとめ           


HTTP_REFERER

HTTP_REFERER(エイチ・ティー・ティー・ピー・リファラー)、REFERER(リファラー)

HTTP_REFERERとは、ブラウザーがウェブサーバーに伝えるHTTP環境変数の一つであり、直前に表示していたページのURLを伝える情報です。より正確に言うと、リンクをクリックしてページを移動したとき、移動先に伝えられる、移動元ページ(クリックしたページ)のURLです。

HTTP_REFERERは、通常、アクセスログに記録し、そのログを分析することで、到着ページ、退室ページ、途中の操作、検索エンジン別到着数、到着キーワード、逆アクセスランキング(アクセス元URL)、などが提供可能です。

HTTP_REFERERは、リファラー、リファランス、などとも呼ばれます。

HTTP_REFERERの値はサーバーが設定する項目ではなく、クライアント側のプログラムが設定してサーバーに通知する情報です。そのため、詐称が可能な情報であり、その点を留意して利用する必要があります。

HTTP_REFERERの値は主要なブラウザーではユーザーが変更できませんが、そうでないブラウザーや自動ダウンロードツールにはユーザーが設定できるものがあります。もちろん、プログラム開発したシステムにおいては、自分自身でHTTP_REFERERの値を設定するのですから、自由な情報を設定して通知可能です。

関連ページ(用語):
    HTTP環境変数
    HTTP_USER_AGENT


【2010/12/12 09:53 】 | 未選択 | 有り難いご意見(0) | トラックバック()
一方向リンク、相互リンク、三角リンクの評価
一方向リンクは2つのサイトで一方しかリンクしていない状態、相互リンクは2つのサイトが相互にリンクしている状態、三角リンクは3つのサイトが一筆書きのように三角形にリンクしている状態を指します。

「一方向リンクは一方の自主的な評価でリンクされている場合が多いが、相互リンクは双方の合意でリンクされている場合が多い」という考え方から、相互リンクは一方向リンクに比べて評価が低いです。

三角リンクは一筆書きが認識されなければ一方向リンクですので、一方向リンクと同等に評価されます。三角リンクは相互リンクに比べてバックリンク数が半減しますが、それを差し引いても三角リンクの方が評価されます。

つまり、相互リンクによる2つのバックリンクより、一方向リンクによる1つのバックリンクの方が評価が高いということです。


<有用SEOブログ>

    SEO相談まとめ           
    SEO実験まとめ           
    Web担               
    BCP DR研究               
    SEO情報               
    先進のSEO               
    洗練SEO情報           


バックリンクの質の獲得

「評価の高いページがリンク(紹介)するページはよいページ」という考え方から、評価の高いページからのバックリンクは高い評価を受けます。

バックリンクによって与えられる評価(スコア)の大きさは、バックリンク元ページの評価(スコア)をそのページのアウトバウンドリンクの数で割った値が基本になります。

つまり、評価の高いページであっても、アウトバウンドリンクの数が多いページ(たとえばリンク集)からのバックリンクの場合、得られる評価は低くなります。


【2010/10/23 18:32 】 | 未選択 | 有り難いご意見(0) | トラックバック()
| ホーム |