PDFファイルについて留意事項はありますか

PDFファイルについて留意事項はありますか

Q.クロール対象のPDFファイルについて、留意事項はありますか。

A.はい、下記の点にご留意ください。

①暗号化されたPDFは検索結果に表示されません。
②画像だけのPDFはテキストが抽出できません。
③レイヤー化されたPDF、アクセシビリティのための情報が含まれたPDFは、検索結果に表示される内容と実際のPDFの内容に差異がある場合があります。
④アウトライン化されたPDFは検索結果に表示されるスニペットやタイトルが文字化けします。(PDFの内容をコピーアンドペーストした際、文字化けするPDFは検索結果に表示されるスニペットやタイトルが文字化けします) 
⑤PDFを作成する際、セキュリティ設定を「セキュリティなし」か、「Acrobat 9.0」 までのバージョン対応に設定していただくようにお願いいたします。
OCRによる画像の取り込みは対応しておりません。


    • Related Articles

    • PDFファイルについて留意事項はありますか

      Q.クロール対象のPDFファイルについて、留意事項はありますか。 A.はい、下記の8つにご留意ください。 ①パスワードで保護されたPDFは検索結果に表示されません。 ②ファイルプロパティのタイトルおよび、PDF本文に埋めこまれたテキストデータが検索対象となります。 ③レイヤー化されたPDF、アクセサビリティのための情報が含まれたPDFは、検索結果に表示される内容と実際のPDFの内容に差異がある場合があります。 ...
    • marsfinder_on offタグによる除外

      お客様サイト内へ以下のタグを挿入いただくことで、「タグ内の文字列を検索対象から除外する※」ことができる機能です。 但し、bodyタグ内でのみ有効です。 この機能は、検索DB詳細画面->拡張設定->marsfinderoff~marsfinderonタグ除外を利用する により、有効・無効が設定できます。 設定は、次回検索データベースが作成されると反映されます。 ※タグ内のリンクに関しては、クロール対象のままです。 ■タグ ==== 開始 <!-- marsfinderoff: index --> ...
    • ページ内の特定の箇所を検索結果から除外したいです

      Q. ページ内の特定の箇所を検索結果から除外したいです。 A. お客様側での作業となりますが、marsfinder_on offタグを挿入いただく事で、タグ内の文字列を検索対象から除外する、という事が可能でございます。 参考: 機能説明->marsfinder_on offタグによる除外
    • もしかすると機能を非表示にすることはできますか

      Q.もしかすると機能(MARS SMART KEYWORDS)を非表示にすることはできますか。 A.はい、可能です。設定作業は弊社側の作業となりますので、ご希望の場合は、https://support.marsflag.com/ja-jp/ までお知らせください。 「もしかすると機能」自体は使用したいが、特定の予測ワードを非表示とされたいという場合は、管理画面から除外語設定をご利用ください。 設定方法:管理画面操作説明書 10章除外語 ...
    • CSP (Content-Security-Policy) の記述を教えて下さい

      Q. CSP (Content-Security-Policy) の設定をする必要があるのですが、何を記述すれば良いでしょうか。 A. 大きく以下の 2パターンとなります。 default-src のみを設定している場合 以下を追加して下さい。 'self' 'unsafe-inline' 'unsafe-eval' data: *.marsflag.com *.marsfinder.jp *.marsflag.jp default-src 以外も設定している場合 ...