Q.クロール対象のPDFファイルについて、留意事項はありますか。
A.はい、下記の8つにご留意ください。
①パスワードで保護されたPDFは検索結果に表示されません。
②ファイルプロパティのタイトルおよび、PDF本文に埋めこまれたテキストデータが検索対象となります。
③レイヤー化されたPDF、アクセサビリティのための情報が含まれたPDFは、検索結果に表示される内容と実際のPDFの内容に差異がある場合があります。
④アウトライン化されたPDFは検索結果に表示されるスニペットやタイトルが文字化けします。(PDFの内容をコピーアンドペーストした際、文字化けするPDFは検索結果に表示されるスニペットやタイトルが文字化けします)
⑤PDFを作成する際、セキュリティ設定を「セキュリティなし」か、「Acrobat 7.0」 よりも前のバージョン対応に設定していただくようにお願いいたします。
⑥PDFファイル内に記載のあるURLは、クロール対象のURLとはなりません。
⑦別行に表示されるデータは、連続した行とは扱いません。その結果、行途中で切れた語句は別の語句として扱われます。(別行とは、表示上の別行、表枠内の折り返しにより発生する別行が該当します。)
⑧OCRによる画像の取り込みは対応しておりません。