PDFファイルについて留意事項はありますか

PDFファイルについて留意事項はありますか

Q.クロール対象のPDFファイルについて、留意事項はありますか。

A.はい、下記の8つにご留意ください。

パスワードで保護されたPDFは検索結果に表示されません。
ファイルプロパティのタイトルおよび、PDF本文に埋めこまれたテキストデータが検索対象となります。
③レイヤー化されたPDF、アクセサビリティのための情報が含まれたPDFは、検索結果に表示される内容と実際のPDFの内容に差異がある場合があります。
④アウトライン化されたPDFは検索結果に表示されるスニペットやタイトルが文字化けします。(PDFの内容をコピーアンドペーストした際、文字化けするPDFは検索結果に表示されるスニペットやタイトルが文字化けします) 
⑤PDFを作成する際、セキュリティ設定を「セキュリティなし」か、「Acrobat 7.0」 よりも前のバージョン対応に設定していただくようにお願いいたします。
PDFファイル内に記載のあるURLは、クロール対象のURLとはなりません。
別行に表示されるデータは、連続した行とは扱いません。その結果、行途中で切れた語句は別の語句として扱われます。(別行とは、表示上の別行、表枠内の折り返しにより発生する別行が該当します。)
⑧OCRによる画像の取り込みは対応しておりません。



    • Related Articles

    • PDFファイルについて留意事項はありますか

      Q.クロール対象のPDFファイルについて、留意事項はありますか。 A.はい、下記の点にご留意ください。 ①暗号化されたPDFは検索結果に表示されません。 ②画像だけのPDFはテキストが抽出できません。 ③レイヤー化されたPDF、アクセシビリティのための情報が含まれたPDFは、検索結果に表示される内容と実際のPDFの内容に差異がある場合があります。 ...