Apache Combined アクセスログの解析

Apache Combined Log Format エントリを解析して、IP、タイムスタンプ、リクエスト、ステータスコード、バイト数、リファラー、ユーザーエージェントフィールドを抽出します。

Apache

詳細な説明

Apache Combined Log Format

Apache Combined Log Format は最も広く使用されているWebサーバーログフォーマットです。Common Log Formatをリファラーとユーザーエージェントフィールドで拡張し、各HTTPリクエストの完全な情報を提供します。

フォーマット構造

%h %l %u %t "%r" %>s %b "%{Referer}i" "%{User-Agent}i"

各フィールドの対応:

フィールド シンボル
リモートホスト %h 192.168.1.1
アイデンティティ %l -(通常は空)
ユーザー %u admin または -
タイムスタンプ %t [15/Jan/2024:10:30:00 +0000]
リクエスト行 %r GET /api/users HTTP/1.1
ステータスコード %>s 200
送信バイト数 %b 1234
リファラー %{Referer}i https://example.com
ユーザーエージェント %{User-Agent}i Mozilla/5.0 ...

ログ行の例

192.168.1.1 - admin [15/Jan/2024:10:30:00 +0000] "GET /api/users HTTP/1.1" 200 1234 "https://example.com" "Mozilla/5.0 (Windows NT 10.0; Win64; x64)"

重要度の推定

Apacheアクセスログには明示的な重要度レベルがないため、パーサーはHTTPステータスコードから重要度を推定します:

  • 2xxと3xx レスポンスはINFOに分類
  • 4xx レスポンス(404 Not Foundなどのクライアントエラー)はWARNに分類
  • 5xx レスポンス(500 Internal Server Errorなどのサーバーエラー)はERRORに分類

このマッピングにより、大規模なアクセスログファイルで問題のあるリクエストを素早くフィルタリングできます。

ユースケース

Webサーバーのトラフィックパターン分析、404エラーとリンク切れの特定、リファラーソースの追跡、遅延または失敗したHTTPリクエストのデバッグ、IPアドレス別のアクセスパターン監査。

試してみる — Log Format Parser

フルツールを開く