トップ / プロダクト / CSV ダウンロード
CSV ダウンロード
このページでできること
- 選択中プロダクトの最新クロール結果を、4 種類の CSV としてエクスポートできます。
- Excel で開いても文字化けしないよう UTF-8 BOM 付きで配信されます。
- 外部レポートやチーム内共有、過去結果のスナップショット保存に使えます。
URL: pages/csv.php?product_id=<id>。サイドバーの「プロダクト → CSV ダウンロード」から開きます。システム管理者・プロダクト管理者の両方がアクセスできます。
共通仕様
- ベースとなるデータは「URL ごとの最新クロール結果」(結果一覧/詳細の元と同じデータソース)です。
- 文字コードは UTF-8 + BOM。Excel で開いた際の文字化けを防ぎます。
- ファイル名:
schema_<type>_<productId>_YYYYMMDD_HHMMSS.csv。 - テーブルヘッダー(1 行目)は固定文字列で出力します。サンプルとして以降の各種類で説明します。
① サマリー(summary)
URL ごとに 1 行。クロール結果のヘッダ部分と件数集計を 1 行にまとめます。外部レポートで「対応 URL 数」「エラー URL 数」「Google 対応機能数」を集計するのに向きます。
| 列 | 内容 |
|---|---|
| URL | crawl_results.url |
| 最終 URL | final_url(リダイレクト追跡後) |
| HTTP ステータス | http_status |
| is_error | 0 / 1 |
| エラー内容 | error_message |
| title / meta_description / canonical / h1 | HTML ヘッダ要素 |
| detected_charset | 判定された文字コード |
| 構造化件数 | entities 配列の長さ |
| Google 対応機能数 / Google 対応機能 | 該当する Google リッチリザルト機能の種類数とラベル(" / " 区切り) |
| 提案件数 / 一致件数 / 不一致件数 | 結果一覧の集計値と同じ |
| 取得日時 | created_at |
② 一致確認(checks)
各 URL の「マークアップ × ページ内容の一致確認」項目を、判定 1 件 = 1 行で出力します。マークアップ × ページ内容の一致確認の検出全件を Excel で並べ替え・フィルタしたい用途に向きます。
| 列 | 内容 |
|---|---|
| URL | 対象 URL |
| 形式 | JSON-LD / Microdata / RDFa / - |
| タイプ | schema.org 型名(Article, BreadcrumbList など) |
| Google 対応 | 「機能名 (URL)」形式の Google 公式ドキュメントリンク |
| 項目 | 判定対象のプロパティ名(headline, author, name, ...) |
| マークアップ値 | schema 側で宣言された値 |
| ページ内容 | HTML から実際に拾えた値 |
| 結果 | 「一致 / 実装済み / 要確認 / 不一致 / 未実装」のいずれか |
| コメント | 判定理由(不一致の場合は差分の説明) |
③ 構造化候補(suggestions)
「ページ内容的にはこのスキーマを追加した方が良さそう」という提案を、提案 1 件 = 1 行で出力します。
| 列 | 内容 |
|---|---|
| URL | 対象 URL |
| 候補タイプ | schema.org 型名(FAQPage / Product / Article など) |
| Google 対応 | 「機能名 (URL)」形式の Google 公式ドキュメントリンク |
| 状態 | 「実装済み / 未実装 / 要確認」 |
| 理由 | 判定根拠(「ページ内に FAQ ライクな見出し-本文ペアを検出した」など) |
| 推奨プロパティ | そのスキーマで埋めるべきプロパティ名のリスト |
④ 検出エンティティ(entities)
各 URL から検出した JSON-LD / Microdata / RDFa の全エンティティを、エンティティ 1 件 = 1 行で出力します。「全ページで Article がいくつ宣言されているか」のように横断集計するのに向きます。
| 列 | 内容 |
|---|---|
| URL | 対象 URL |
| 形式 | JSON-LD / Microdata / RDFa |
| index | 同形式内での連番 |
| タイプ | schema.org 型名 |
| Google 対応機能 | 該当機能ラベル(複数あれば " / " 区切り) |
| Google 対応 URL | 該当機能の公式ドキュメント URL |
| プロパティ (JSON) | そのエンティティの全プロパティを JSON 文字列で 1 セル |
ダウンロードのタイミング
CSV はその瞬間の最新クロール結果を毎回 SQL から組み立てて生成します。事前ファイルとして保存しているわけではないため、新たにクロールを走らせた直後に再ダウンロードすれば、必ず最新の内容になります。