PDFファイルについて留意事項はありますか

PDFファイルについて留意事項はありますか

Q.クロール対象のPDFファイルについて、留意事項はありますか。

A.はい、下記の点にご留意ください。

①暗号化されたPDFは検索結果に表示されません。
②画像だけのPDFはテキストが抽出できません。
③レイヤー化されたPDF、アクセシビリティのための情報が含まれたPDFは、検索結果に表示される内容と実際のPDFの内容に差異がある場合があります。
④アウトライン化されたPDFは検索結果に表示されるスニペットやタイトルが文字化けします。(PDFの内容をコピーアンドペーストした際、文字化けするPDFは検索結果に表示されるスニペットやタイトルが文字化けします) 
⑤PDFを作成する際、セキュリティ設定を「セキュリティなし」か、「Acrobat 9.0」 までのバージョン対応に設定していただくようにお願いいたします。
OCRによる画像の取り込みは対応しておりません。
⑦ファイルサイズは、100MBまでとなります。


    • Related Articles

    • PDFファイルについて留意事項はありますか

      Q.クロール対象のPDFファイルについて、留意事項はありますか。 A.はい、下記の8つにご留意ください。 ①パスワードで保護されたPDFは検索結果に表示されません。 ②ファイルプロパティのタイトルおよび、PDF本文に埋めこまれたテキストデータが検索対象となります。 ③レイヤー化されたPDF、アクセサビリティのための情報が含まれたPDFは、検索結果に表示される内容と実際のPDFの内容に差異がある場合があります。 ...
    • marsfinder_on offタグによる除外

      お客様サイト内へ以下のタグを挿入いただくことで、「タグ内の文字列を検索対象から除外する※」ことができる機能です。 但し、bodyタグ内でのみ有効です。 この機能は、検索DB詳細画面->拡張設定->marsfinderoff~marsfinderonタグ除外を利用する により、有効・無効が設定できます。 設定は、次回検索データベースが作成されると反映されます。 ※タグ内のリンクに関しては、クロール対象のままです。 ■タグ ==== 開始 <!-- marsfinderoff: index --> ...
    • 検索対象外タグとmarsfinder on/offタグの違いを教えてください

      Q.検索対象外タグとmarsfinder on/offタグの違いを教えてください。 A.両者の効果は同じです。 どちらも該当箇所を検索対象から除外いたします。 「検索対象外タグ」に当てはまれば、自動的に検索対象から除外されるため、marsfinder_on/offの追加は不要となります。HTMLを編集する必要もございません。 marsfinder on/offタグは、「検索対象外タグ」でカバーできない箇所に対して利用いただくものとなります。HTMLを編集して追加してください。 参考: ...
    • MARSFINDERを利用したユーザのアクセスログは、取得していますか

      Q. MARSFINDERを利用したユーザのアクセスログは、取得していますか。 A.はい、取得しています。 取得情報等につきましては、下記の通りです。 尚、これらの情報はシステム運用上保管しているものであり、お客様への開示を目的としたものではございません。 【取得している情報】 アクセス日時 IPアドレスとポート番号 リクエスト処理時間 HTTPステータスコード 送受信バイト数 リクエストURL HTTPバージョン User-Agent SSLプロトコルと暗号アルゴリズム 【用途】 ...
    • 検索対象外となるタグを教えてください

      Q.検索対象外となるタグを教えてください。 A.以下のタグ等の内容を検索対象から除外します。 ・script ・noscript ・style ・header ・footer ・div tag かつ、idまたはclassに"header"を含む ・div tag かつ、idまたはclassに"footer"を含む 上記以外のタグは、検索対象となります。 当該タグは、お客様毎にご変更いただくことはできません。ご了承ください。 参考: 各機能毎の概要 機能説明->marsfinder_on ...