よくあるご質問
CDN導入または変更時の留意事項を教えてください
Q. CDN導入または変更時の留意事項を教えてください。 A.CDNが弊社クローラーを不正なbotアクセスと判定し、アクセスを拒否されるケースが稀に発生いたします。 これを防止するため、弊社クローラーのIPアドレスもしくはUserAgentをホワイトリストに登録する事を推奨しております。 尚、キャッシュによる動作影響はございません。 参考: 機能説明->クロール FAQ->UserAgentを教えてください
受付可能なリクエスト件数を教えてください
Q. 受付可能なリクエスト件数を教えてください。 A.1サービス1分間あたり3000リクエストを推奨値としております。 推奨値を超えたからといって直ちに検索サービスに影響がでるといったものではありません。 尚、サービスに影響が出るようなアクセスに対しては適宜ブロックさせていただく場合がございます。
クロール結果や検索DB作成結果の保管期間を教えてください
Q. クロール結果や検索DB作成結果の保管期間を教えてください。 A.以下が保管期間となります。 保管期間を経過した場合は、改めてクロールや検索DB作成を実行ください。 クロール結果:60日 検索DB作成結果:60日
カスタムエレメントのバージョンが知りたいです
Q. カスタムエレメントのバージョンが知りたいです。 A.カスタムエレメントのバージョンは、管理画面->サービス一覧画面(赤枠)にて確認いただけます。 参考: 仕様->カスタムエレメント技術資料
クロールの速度・所要時間を教えてください
Q. クロールの速度・所要時間を教えてください。 A.1時間あたり、1,000~2,000URL(htmlまたはPDF)をクロールいたします。 但し、通信状況や環境等により前後する可能性がございますので、目安としてご利用ください。 尚、この速度をお客様毎に、調整することはできません。 ご了承ください。
検索窓の入力フィールドに入力できる文字数に制限はありますか
Q. 検索窓の入力フィールドに入力できる文字数に制限はありますか。 A.100文字までに制限されております。 お客様にて、101文字以上入力するように変更することはおやめください。 101文字以上は動作保証外となります。
OSSを使用していますか
Q. MF3.0ではOSS(オープンソースソフトウェア)を使用していますか。 A.はい、利用しています。但し、利用しているソフトウェアについては、非公開とさせていただいております。
CMSで構築したサイトをクロールできますか
Q. CMSで構築したサイトをクロールできますか。 A.はい、可能です。 MARS FINDERはCMSには依存しませんので、一般公開されているサイトでしたらクロールすることが可能です。 (一部、認証配下のサイトもクロールすることが可能です。)
起点URLにsitemap.xmlを登録しクロールすることはできますか
Q. 起点URLにsitemap.xmlを登録しクロールすることはできますか。 A.はい、可能です。MF3.0のクローラは、一般的なsitemap.xmlの形式に対応しており、locタグにあるURLはクロール対象となります。 但し、lastmodタグ、changefreqタグ、priorityタグは検索結果に反映されません。 参考: マニュアル->4. クローラを作成する
検索結果が過去のものと変わっているように感じられます。仕様変更があったのであれば詳細を教えて下さい。
Q. MARS FINDERの検索結果が過去のものと変わっているように感じられます。仕様変更があったのであれば詳細を教えて下さい。 A.MARS FINDERの検索結果表示アルゴリズムについては、弊社としてより良い検索体験の向上を実現するため常に進化を重ねており、今後も継続して不定期にアップデートを重ねて参ります。 個々のアップデート内容についてはMARS Platform管理画面上にて情報提供致しますが、左記に記載の情報以上の詳細については、非公開とさせていただいております。 ...
作成結果ダウンロードのフォーマットを教えてください
Q. サービス一覧画面の作成結果ダウンロードのフォーマットを教えてください。 A.直近の検索DB作成時の結果を示すものです。ファイルのフォーマットは、以下の通りとなります。 1. MF3.0 検索DB作成結果ファイル 1.1 検索DB作成結果ファイル仕様 項目 内容 ファイル名 index_result_detail.zip ファイルフォーマット zip 1.2 索DB作成結果ファイル zipファイル内容 ファイル名 説明 index_result_detail.csv MF3.0 ...
HTMLファイルの検索結果タイトルには何が表示されますか
Q. HTMLファイルの検索結果タイトルには何が表示されますか。 A.DOM上のhead配下にあるtitleタグの内容が表示されます。titleタグはデベロッパーツールのコンソールでも容易に確認できます。 尚、タイトルタグの中にタグを記載された場合、想定される結果とならないことがございます。タイトルタグの中にはタグを記述しないようにお願いします。
「検索DBDoc数」「検索DBDoc処理数」の違いを教えてください
Q. サービス一覧画面で表示されている「検索DBDoc数」「検索DBDoc処理数」の違いを教えてください。 A.以下のように定義しています。 検索DBDoc数: 検索DBに格納されたドキュメント数を示します。 検索DBに格納されたドキュメント数が検索DB詳細画面->割り当てドキュメント数に到達すると、サービス作成を完了します。 尚、サービス作成時に処理はしたが、検索DBに格納されなかった場合は、検索DBDoc数にカウントアップされません。 ...
「クロール済みのURL数」「クロールリクエスト総数」の違いを教えてください
Q. クローラ一覧画面で表示されている「クロール済みのURL数」「クロールリクエスト総数」の違いを教えてください。 A.以下のように定義しています。 クロール済みのURL数: クロールで取得されたURL数を示します。 クロールで取得されたURL数がクローラ詳細画面->割り当てドキュメント数に到達すると、クロールを完了します。 尚、クロール時のHTTP レスポンスステータスコードに関わらず、クロール済みのURL数にカウントアップされます。 ...
サービスにクローラを紐づける操作方法を教えてください
Q. 1つのサービスにクローラを紐づける操作方法を教えてください。 A.サービス一覧画面->クローラ選択->「選択」ボタンを押下いただくことで、紐づけができます。 以下の図は、赤枠を押下いただくことで、サービス#1にクローラAとクローラBの2つのクローラを紐づける操作となります。 注意)不要なクローラをサービスへ紐づけすると、最大ドキュメント処理数の上限に達する可能性がありますのでご留意ください。 参考: FAQ->クローラを複数設定する必要があるのはどのような場合ですか
クローラと検索DBの役割を教えてください
Q. クローラと検索DBの役割を教えてください。 A.クローラは、対象のWebサイトからコンテンツ情報を収集します。 検索DBはクローラで収集したコンテンツ情報を加工し、検索用にデータベース化(インデキシング処理)したものになります。 そのため、クローラ詳細画面では、対象のWebサイトにアクセスするとき、どのコンテンツの情報を収集するかの判定に利用される値を設定します。 検索DB詳細画面では、クローラで収集した情報の中から、どのコンテンツを検索対象とするかの判定に利用される値を設定します。 ...
サジェストを追加・編集・削除することはできますか
Q. サジェストを追加・編集・削除することはできますか。 A.追加・編集・削除の何れもできません。 参考: 機能説明->サジェスト
CSPでアクセス拒否となっています。対応策を教えてください。
Q. 検索結果が表示されなくなりました。CSP(Content Security Policy)でアクセス拒否となっているのすが、対応策を教えてください。 A.お客様側で設定されているCSPに、MF3.0の検索APIのドメインfinder.api.mf.marsflag.comを許可設定してください。 具体的には、以下のように記述ください。 -----ココカラ----- <meta http-equiv="Content-Security-Policy" content="default-src ...
あるキーワードで検索すると、ハイライトしません
Q. あるキーワードで検索すると、ハイライト(黄色)しません。 A.検索DB詳細画面->言語において日本語以外を選択した場合、1文字はハイライトしない仕様となっています。 ハイライトさせるためには、2文字以上の長さの単語である必要があります。 参考: マニュアル->3. サービスを作成する
管理画面上で入力できる文字数や制限を教えてください
Q. 管理画面上で入力できる文字数や制限を教えてください。 A.以下の表の通りとなります。 No 項目 文字種 文字数制限 1 組織 表示名 半角英数字/記号・全角文字 50文字まで 2 アプリケーション 表示名 半角英数字/記号・全角文字 50文字まで 3 アプリケーション 概要 半角英数字/記号・全角文字 100文字まで 4 サービス 表示名 半角英数字/記号・全角文字 50文字まで 5 クローラ 表示名 半角英数字/記号・全角文字 50文字まで 6 Basic認証 ユーザ名 ...
URLパターン(正規表現)について教えてください
Q. 検索DB詳細画面やクローラ詳細画面で使用できるURLパターン(正規表現)について教えてください。 A.MF3.0は設定されたURL範囲指定・URL除外指定をもとにサイト内のページの情報を収集し、検索データベースを作成します。 この範囲指定に使用する正規表現ですが、正確に設定することで検索の利便性を上げることができるため、 下記の点などに注意しながら設定いただくことをおすすめしております。 尚、通常のURLから正規表現のURLを生成する ジェネレータExcel ...
サムネイル画像にCookie同意バナーが表示されてしまいます
Q. サムネイル画像にCookie同意バナーが表示されてしまいます。回避策を教えてください。 A.弊社クローラがクロール対象のWebサイトにアクセスした際、Cookie同意バナーを非表示にするという実装をしていただくことが回避策になります。 この方法ですと、サムネイル画像にCookie同意バナーが表示されることはありません。 弊社クローラの識別には、IPアドレスまたはUserAgentをお使いいただけます。 参考: 機能説明->クロール FAQ->UserAgentを教えてください
予想外のサジェストがされますが、何故ですか?
Q. サジェストに予想外の単語が表示されます A.検索DB設定が日本語の場合に、入力単語の読みに対応するサジェストが表示されている場合がございます。 一例として、「chic」は、読みとして「シック」となります。この「シック」を含む単語として、「シックス」があります。 ドキュメント中に「six」(読みが「シックス」)という単語が存在した場合に、以下のような流れでサジェストが表示されます。 「chic」 →「シック」(読み) →「シックス」(シックのサジェスト候補) ...
テストサイト(テストドメイン)で挙動を確認した後、本番サイト(本番ドメイン)で運用を開始したいと考えています。どのような手順で進めればよいでしょうか
Q. テストサイト(テストドメイン)で挙動を確認した後、本番サイト(本番ドメイン)で運用を開始したいと考えています。どのような手順で進めればよいでしょうか。 A. 以下の方法が管理がしやすく、お勧めをしております。 ・テストサイト用と本番サイト用のクローラを各々、作成いただく。 また、以下の方法を実施いただけますと、より早く本番サイトが検索結果に表示されるようになります。 ・本番サイト用のクロールは、本番サイトを公開の後、なるべく早めに実行いただく。 ...
JavaScriptで動的に表示されるリンクはMF3.0のクローラーが認識できますか
Q. JavaScriptで動的に表示されるリンクはMF3.0のクローラーが認識できますか。 A.動的に生成された <a href=...>のリンクに関しては、認識可能です。
中国語のサイトへの導入は可能でしょうか
Q. 中国語のサイトへの導入は可能でしょうか。 A.はい、MF3.0としては、可能です。 検索結果画面での中国語(簡体字・繁体字)に対応しております。 クローラの言語は日本語をご選択いただければ、問題ございません。 一般的な注意事項として、グレート・ファイアウォールの懸念はございます。 参考: FAQ->検索結果画面の対応言語を教えてください FAQ->検索結果の表示言語の設定方法を教えてください 管理画面の利用ガイド->4. クローラを作成する
UserAgentを教えてください
Q. UserAgentを教えてください。 A. "dbot"という文字列を含むものとなります。
PDFやOffice文書ファイルは、ファイル単位で検索DBに取得されますか
Q.PDFやOffice文書ファイルは、ファイル単位で検索DBに取得されますか。 A.はい、ファイル単位で取得いたします。ページ単位では、取得されませんのでご了承ください。 参考: 機能説明->PDF、MS Office文書の検索
利用約款は、契約前に確認できますか
Q.利用約款は、契約前に確認できますか。 A.はい、こちらからご確認いただけます。
契約プランはどのように選定すればよいですか
Q.契約プランはどのように選定すればよいですか。 A.最大ドキュメント数を、最も基本的な指標としてお使いください。 最大ドキュメント数は、検索結果として検索できる対象ドキュメント数の上限を意味します。 最大クロール回数は、一ヶ月の間にクロールできるWebページ(PDFファイル、MS Officeドキュメント含む)へのリクエスト(アクセス)回数の上限を意味します。 一ヶ月の間に上限に達した場合、次のクロールは実行されません。 ...
契約プランの変更は、いつ適用されますか
Q.契約プランの変更は、いつ適用されますか。 A.契約プラン変更の適用は、翌月からとなります。 一例ですが、1月1日~1月31日の間に契約プランを変更いただきますと、2月1日に変更後の契約プランが適用されます。 参考: MARS FINDER 価格プラン
キャプチャ画像はページのどの部分が利用されますか
Q.検索結果画面のキャプチャ画像は、ページのどの部分が利用されますか。 A.htmlの場合は当該ページの上部、PDF/Office文書の場合は1ページ目全体が利用されます。 現状、サービス単位やページ単位等で利用箇所をご変更いただくことはできません。 参考: 機能説明->キャプチャ画像
検索対象外となるタグを教えてください
Q.検索対象外となるタグを教えてください。 A.以下のタグ等の内容を検索対象から除外します。 ・script ・noscript ・style ・header ・footer ・div tag かつ、idまたはclassに"header"を含む ・div tag かつ、idまたはclassに"footer"を含む 上記以外のタグは、検索対象となります。 当該タグは、お客様毎にご変更いただくことはできません。ご了承ください。 参考: 各機能毎の概要
検索デモ画面の文言や言語を変更できますか
Q.検索デモ画面の「検索」や「検索結果」といた文言や言語を変更できますか。 A.検索デモ画面はあくまで簡易確認用ですので、日本語のみとなり、文言も変更できません。 実際、マニュアルに沿って、MF3.0の設置を行っていただいた場合は、検索窓内の文言や、検索結果画面の言語等を、お客様側にて変更いただくことが可能です。
クローラを複数設定する必要があるのはどのような場合ですか
Q.クローラを複数設定する必要があるのはどのような場合ですか。 A.クローラは、Webサイトの言語毎、ドメイン単位、更新頻度等により使い分けることができます。 一例ではございますが、以下のような場合を想定しております。 【例1】 ・クローラA:日本語 ・クローラB:英語 →言語毎に検索サービスを分けて提供するなどの柔軟性が向上します。 【例2】 ・クローラA:ドメインAをクロール対象とする。クロール周期は週次。 ・クローラB:ドメインBをクロール対象とする。クロール周期は週次。 ...
MARS FINDER3.0はどんなサービスですか?概要と価格体系を知りたいです。
Q.MARS FINDER3.0はどんなサービスですか?概要と価格体系を知りたいです。 A.MARS FINDER3.0とは、Webサイトの能力を最大限に活用するためのサイト内検索サービスです。 Webサイトに訪れたお客様を、必要としている情報へ早く正確に導きます。 高いユーザビリティと充実した検索機能を備えており、お客様のニーズに合わせて検索サービスをセルフで構築することが可能です。 MARS FINDER3.0 概要 ...
利用開始にあたりかかる費用について知りたい。
Q.利用開始にあたりかかる費用について知りたい。 A.MARS FINDER3.0は初期費無料です。 従来、検索ユニットを追加(MARS FINDER3.0ではサービスの追加)する際に発生していた費用も無料となります。 ご契約のプランに合わせて毎月の利用料金が発生いたします。 初回お申込時はその月の利用料が日割で計算され、翌月初旬に請求されます。 請求については詳しくは下記URLを参照ください。 請求のタイミング、基本料金の支払いタイミングが知りたいです ...
最大ドキュメント数と最大ドキュメント処理数の違いは何ですか?
Q.最大ドキュメント数と最大ドキュメント処理数の違いは何ですか? A.それぞれ下記の数を示しています。 最大ドキュメント数:アプリケーション内で指定できる検索DBのドキュメント数の最大合計値 最大ドキュメント処理数:1ヶ月に検索DBに対して登録(処理)できる最大URL数 最大ドキュメント数は「検索DBへの格納数」です。 ※MARS FINDER2.0をご利用のお客様は、2.0の「最大ドキュメント数」と同じであるとお考え下さい。 最大ドキュメント処理数は「1ヶ月間でDBへ格納処理を行う ...
サービス作成前なのですが、サンプルとして使えるajax-URLはありますか
Q.サービス作成前なのですが、サンプルとして使えるajax-URLはありますか。 A.はい、ございます。以下のajax-URLをお使いください。 https://finder.api.mf.marsflag.com/api/v1/finder_service/documents/bbce25dc/search 参考: カスタムエレメント設置ガイド->1. 検索窓を設置する カスタムエレメント設置ガイド->2. 検索結果を設置する
PDFファイルの検索結果タイトルには何が表示されますか
Q.PDFファイルの検索結果タイトル(赤枠)には何が表示されますか。 A.PDFファイル->文書プロパティ->概要タブ->タイトルの部分が表示されます。 PDFファイル->文書プロパティ->概要タブ->タイトルが空の場合は、PDFファイルのファイル名が表示されます。
Next page