Размито търсене на текстова информация е търсене на низове, подобни или близки до заявката за търсене.
В същото време степента на размиване или сходство на текстовите низове най-често се оценява с помощта на разстоянието за редактиране (разстояние Левенштейн). А разстоянието за редактиране на два низа е минималният брой операции за заместване, вмъкване и изтриване на знаци, необходими за трансформиране на един низ в друг. Транспонирането на два съседни знака също може да се счита за валидна операция за редактиране (разстояние Damerau-Levenshtein).
Пример за размито търсене за дадена стойност на размиване от 2 редакции е заявката за търсене „дървета“ и резултатът от търсенето „тези“. Тук символът "r" се заменя с "h", а знаците "e" и "s" се транспонират. Тоест разстоянието Дамерау-Левенщайн за тези две думи е 2 в този пример за размито търсене.
Най-често се използват следните методи за реализиране на размито търсене:
В това приложение, за да получите размито съвпадение на думи в документ, трябва да посочите необходимия брой грешки (стойност на размиването) от 1 до 9 знака. Можете също да зададете опцията за търсене на думи само с минимален брой разлики или за търсене на всички думи в рамките на даден брой разлики.
Библиотеката GroupDocs.Search има много други опции за размито съвпадение. Например, можете да зададете броя на разликите между думите като линейна функция от дължината на думата или дори да зададете броя на разликите поотделно за всяка стойност на дължината на думата.
Можете да извършите размито търсене в много файлови формати. Моля, вижте пълния списък по-долу.