トップ / プロダクト / エラーURL管理
エラーURL管理
このページでできること
- 最新クロールで HTTP 4xx / 5xx などのエラーになった URL の一覧を確認できます。
- エラー履歴のみを削除して「再クロールでもう一度評価する」状態に戻せます。
- 事前登録 URL ごと完全に削除する操作もここから行えます。
URL: pages/errors.php?product_id=<id>。サイドバーの「プロダクト → エラーURL管理」から開きます。システム管理者・プロダクト管理者の両方がアクセスできます。
表示されるのはどんな URL か
本画面の一覧は、各 URL の最新クロール結果が is_error=1 になっているものです(Repository::listErrors())。具体的には次のケースで is_error=1 になります。
- HTTP 4xx(401 / 403 / 404 / 410 / 429 など)または 5xx を返した。
- 名前解決失敗・接続タイムアウト・SSL 検証失敗で cURL レベルから失敗した(
http_status=0)。 - レスポンスは取れたが、HTML 解析中に内部的な例外が出た(極めて稀)。
過去にエラーだったが、その後の再クロールで成功している URL は、最新が成功扱いなのでこの画面には出ません。
一覧テーブルの列
| 列 | 内容 |
|---|---|
| URL | エラーになった対象 URL(別タブで開けます) |
| HTTP | ステータスコード。 cURL レベル失敗の場合は N/A |
| エラー内容 | error_message。「HTTP 404 Not Found」「Could not resolve host」など |
| 最終取得日時 | 最新クロールの時刻 |
| 操作 | 「ログのみ削除」 / 「URL ごと削除」 の 2 ボタン |
2 種類の削除操作
① ログのみ削除
その URL の crawl_results 行をすべて削除します(過去の成功・エラー両方)。事前登録 URL(product_urls)は残ります。
- 「とりあえずエラー履歴をクリアして、次回クロールでまた評価したい」用途。
- 次にクロールが走ると、その URL の結果が新規に追加されます。
- 確認ダイアログ:「この URL のエラーログを削除します。」
② URL ごと削除
過去の crawl_results をすべて削除した上で、事前登録 URL(product_urls)からも該当 URL を消します。
- 「もうこの URL は廃止されたので、二度とクロールしないでほしい」用途。
- 同じ URL を再度追加したくなった場合は URLの追加・修正・削除 画面から入れ直してください。
- 確認ダイアログ:「この URL を事前登録一覧からも削除します。よろしいですか?」
典型的なエラー対処の流れ
- エラーURL管理を開いて、現状の
4xx/5xx一覧を把握。 - 本当に廃止された URL は「URL ごと削除」で除外。
- 一時的なサーバ不調や 5xx は、後で再クロールしたいので「ログのみ削除」で履歴をクリア。
- サイト側で本当の不具合が見つかった場合は、サイト改修 → 再クロールで結果が成功に変わるはず。
関連機能
- 結果が成功している URL の詳細は 結果一覧/詳細。
- HTTP エラーかどうかも含めた一括 CSV エクスポートは CSV ダウンロード(サマリー) から行えます。