Neaiškia tekstinės informacijos paieška – tai eilučių, panašių į paieškos užklausą ar jai artimų, paieška.
Tuo pačiu metu teksto eilučių neryškumo ar panašumo laipsnis dažniausiai vertinamas naudojant redagavimo atstumą (Levenshtein distance). O dviejų eilučių redagavimo atstumas yra minimalus simbolių pakeitimo, įterpimo ir ištrynimo operacijų skaičius, reikalingas vienai eilutei transformuoti į kitą. Dviejų gretimų simbolių perkėlimas taip pat gali būti laikomas tinkama redagavimo operacija (Damerau-Levenshtein atstumas).
Neaiškios paieškos pavyzdys, kai pateikta 2 redagavimų neapibrėžtumo reikšmė, yra paieškos užklausa „medžiai“ ir paieškos rezultatas „šie“. Čia simbolis „r“ pakeičiamas „h“, o simboliai „e“ ir „s“ perkeliami. Tai reiškia, kad šiame neaiškios paieškos pavyzdyje šių dviejų žodžių Damerau-Levenshtein atstumas yra 2.
Neaiškiai paieškai įgyvendinti dažniausiai naudojami šie metodai:
Šioje programoje, norėdami gauti neaiškią žodžių atitiktį dokumente, turite nurodyti reikiamą klaidų skaičių (neapibrėžtumo reikšmę) nuo 1 iki 9 simbolių. Taip pat galite nustatyti parinktį ieškoti žodžių, turinčių tik minimalų skirtumų skaičių, arba ieškoti visų žodžių pagal nurodytą skirtumų skaičių.
GroupDocs.Search bibliotekoje yra daug kitų neaiškių atitikimo parinkčių. Pavyzdžiui, galite nustatyti žodžių skirtumų skaičių kaip tiesinę žodžio ilgio funkciją arba net nustatyti skirtumų skaičių atskirai kiekvienai žodžio ilgio reikšmei.
Galite atlikti neaiškią paiešką daugeliu failų formatų. Žr. visą sąrašą žemiau.