Question 1

robots.txtファイルとは何ですか？

Accepted Answer

robots.txtファイルはウェブサイトのルートに配置されるプレーンテキストファイル（例：https://example.com/robots.txt）で、Webクローラーにサイトのどのページやセクションへのアクセスを許可または禁止するかを指示します。Robots Exclusion Protocol標準に従います。

Question 2

robots.txtはSEOに必須ですか？

Accepted Answer

いいえ、robots.txtファイルは必須ではありませんが、強く推奨されます。robots.txtがない場合、クローラーはサイト上のすべてのページにアクセスを試みます。適切に設定されたrobots.txtは、クロールバジェットの管理、プライベートエリアのインデックス防止、重複や低価値ページの検索結果からの除外に役立ちます。

Question 3

robots.txtでページがGoogleに表示されなくなりますか？

Accepted Answer

正確にはそうではありません。Disallowルールはクローラーがページを取得することを防ぎますが、他のサイトがそのURLにリンクしている場合、GoogleはURLを（コンテンツなしで）インデックスし、検索結果に表示する可能性があります。完全にインデックスを防ぐには、robots.txtと組み合わせてnoindexメタタグまたはHTTPヘッダーを使用してください。

Question 4

robots.txtでAIクローラーをブロックできますか？

Accepted Answer

はい。多くのAI企業はrobots.txtディレクティブを尊重しています。GPTBot、ChatGPT-User、Google-Extended、CCBot、anthropic-aiなどのユーザーエージェントにDisallow: /のルールを追加してブロックできます。「AIクローラーブロック」プリセットを使えば簡単に始められます。

Question 5

Crawl-delayディレクティブとは何ですか？

Accepted Answer

Crawl-delayディレクティブは、連続するリクエスト間に指定された秒数を待つようクローラーに指示します。攻撃的なクローラーからのサーバー負荷を軽減するのに役立ちます。なお、GooglebotはCrawl-delayをサポートしていないため、Googlebotのクロール速度はGoogle Search Consoleで調整してください。BingbotとYandexはこのディレクティブを尊重します。

Question 6

robots.txtファイルはどこに配置すべきですか？

Accepted Answer

ファイルはドメインのルートに配置し、https://yourdomain.com/robots.txtでアクセスできる必要があります。text/plainコンテンツタイプで配信する必要があります。サブディレクトリに配置しても機能しません。クローラーはルートURLのみを確認します。

Question 7

データは安全ですか？

Accepted Answer

はい。robots.txt出力はJavaScriptの文字列結合とArray.prototype.join()で組み立てられます。データがサーバーに送信されることは一切ありません。ブラウザのネットワークタブを確認すれば検証できます。robots.txtファイルの生成やコピー時に外部へのリクエストはゼロです。

robots.txtジェネレーター

このツールについて

使い方

よくある質問

関連ツール

メタタグ生成ツール

URLエンコード/デコード

HTTPステータスコード

テキストソート・重複削除