テキスト情報のあいまい検索は、検索クエリに類似または近い文字列の検索です。

同時に、テキスト文字列のあいまいさや類似性の程度は、ほとんどの場合、編集距離(レーベンシュタイン距離)を使用して評価されます。 また、2 つの文字列の編集距離は、ある文字列を別の文字列に変換するために必要な文字置換、挿入、および削除操作の最小数です。 隣接する2つの文字の転置は、有効な編集操作(Damerau-Levenshtein距離)と考えることもできます。

特定のあいまいさ値 2 つの編集に対するあいまい検索の例は、検索クエリ "tree" と検索結果 "these" です。 ここでは、文字 "r" は "h" に置き換えられ、文字 "e" と "s" は転置されます。 つまり、この 2 つの単語のダメラウ-レーベンシュタイン距離は、このあいまいな検索例では 2 です。

次のメソッドは、あいまい検索を実装するために最もよく使用されます。

文書内のウェブアプリケーションファジィ検索は、GroupDocs.Search全文検索エンジンをベースに構築されています。 このライブラリでのあいまい一致の実装には、リストされたメソッドの最高の機能があります。

このアプリケーションでは、文書内の単語のあいまい一致を取得するには、1〜9文字の必要なミス数(あいまいさ値)を指定する必要があります。 また、最小数の相違点のみを持つ単語を検索するか、特定の差異数内のすべての単語を検索するようにオプションを設定することもできます。

GroupDocs.Search ライブラリには、他にも多くのファジーマッチングオプションがあります。 たとえば、単語間の差異の数を単語長の一次関数として設定したり、単語長の値ごとに差異の数を個別に設定したりすることもできます。

文書内のテキストのあいまい一致を見つける方法

  • ファイルドロップ領域内をクリックしてファイルをアップロードするか、ファイルをドラッグ&ドロップします。
  • アップロードが完了すると、ファイル内で検索を実行できるようになります。
  • スペースで区切られた 1 つ以上の単語で構成される検索クエリを入力します。
  • 検索の種類 (語句、すべての単語、任意の単語) を選択します。
  • 単語で許可される間違いの数を 1 から 9 に設定します。必要に応じて、最良の結果のみを得るためのフラグを設定します。
  • 「検索」ボタンをクリックして結果を取得します。
  • 「ファイルの追加」ボタンでさらにファイルを追加します。
  • 追加したファイルを選択してインデックスに含め、検索を実行します。

よくある質問

  • オンラインアプリのドキュメント内のあいまい検索はどのように機能しますか?

    検索は2段階で実行されます。まず、ドキュメントがインデックスに追加されます。そしてその時だけ、検索はインデックスで実行されます。
  • プライバシーはどうですか、オンラインアプリのあいまい検索を使用しても安全ですか ドキュメント内?

    アップロードおよびインデックスが作成されたファイルを含むフォルダへのアクセスは、リンクを知っているユーザーのみが利用できます。アップロードされたすべてのファイルは、24時間後にサーバーから削除されます。
  • オンラインアプリのドキュメント内のあいまい検索を使用するには、インターネット接続が必要ですか?

    このアプリケーションはクライアントサーバーです。アプリの使用中にインターネット接続が失われると、検索結果を取得できなくなります。
  • Linux、Mac OS、Androidで検索できますか?

    オペレーティングシステムに関係なく、最新のブラウザとインターネット接続を備えた任意のデバイスから検索できます。

ファジー検索アプリでサポートされているファイル形式

ファジー検索は、多くのファイル形式で実行できます。以下の全リストをご覧ください。

Viewer Annotation Conversion Comparison Signature Assembly Metadata Search Parser Watermark Editor Merger Redaction Classification Splitter Translation Unlock Protect Scanner