お客様が設定した対象URLに対し、再帰的にページの内容、スクリーンショット(※)を収集・格納処理する機能です。
収集したページ内(PDF、Office文書を除く)を解析し、URLを発見することで再帰的な処理を実現します。
※スクリーンショットが検索結果に反映されるまでに、半日程度お時間がかかる場合があります。
弊社クロールの特徴
弊社クローラは一般的なクローラでは処理しづらいSPA(Single Page Application)のサイトについても対応しています。
マルチバイト文字を含むURLの扱いについて
マルチバイト文字を含むURLを記述する際はURLエンコードして記載ください。エンコードせずにリンクとして記載した場合、リンクを辿れないことがございます。
リダイレクト(301、302)が設定されているページの扱いについて
リダイレクトが設定されているページは、リダイレクト元を検索結果に表示します。
アクセス元IPアドレスについて
クロール時のアクセス元IPアドレスを固定することができます。(デフォルトは非固定です)
固定した場合は、以下のいずれかのIPアドレスになります。
・IPv4
54.150.38.83
54.249.200.50
3.114.44.21
35.72.79.19
18.181.104.37
13.115.195.243
・IPv6 CIDR
2406:da14:8f0:100::/56
2406:da14:df8:3f00::/56
参考