トップ / プロダクト / エラーURL管理

エラーURL管理

このページでできること

  • 最新クロールで HTTP 4xx / 5xx などのエラーになった URL の一覧を確認できます。
  • エラー履歴のみを削除して「再クロールでもう一度評価する」状態に戻せます。
  • 事前登録 URL ごと完全に削除する操作もここから行えます。

URL: pages/errors.php?product_id=<id>。サイドバーの「プロダクト → エラーURL管理」から開きます。システム管理者・プロダクト管理者の両方がアクセスできます。

表示されるのはどんな URL か

本画面の一覧は、各 URL の最新クロール結果が is_error=1 になっているものです(Repository::listErrors())。具体的には次のケースで is_error=1 になります。

過去にエラーだったが、その後の再クロールで成功している URL は、最新が成功扱いなのでこの画面には出ません。

一覧テーブルの列

内容
URLエラーになった対象 URL(別タブで開けます)
HTTPステータスコード。 cURL レベル失敗の場合は N/A
エラー内容error_message。「HTTP 404 Not Found」「Could not resolve host」など
最終取得日時最新クロールの時刻
操作「ログのみ削除」 / 「URL ごと削除」 の 2 ボタン

2 種類の削除操作

① ログのみ削除

その URL の crawl_results 行をすべて削除します(過去の成功・エラー両方)。事前登録 URL(product_urls)は残ります

② URL ごと削除

過去の crawl_results をすべて削除した上で、事前登録 URL(product_urls)からも該当 URL を消します

典型的なエラー対処の流れ
  1. エラーURL管理を開いて、現状の 4xx / 5xx 一覧を把握。
  2. 本当に廃止された URL は「URL ごと削除」で除外。
  3. 一時的なサーバ不調や 5xx は、後で再クロールしたいので「ログのみ削除」で履歴をクリア。
  4. サイト側で本当の不具合が見つかった場合は、サイト改修 → 再クロールで結果が成功に変わるはず。

関連機能