Мәтіндік ақпаратты бұлыңғыр іздеу - іздеу сұрауына ұқсас немесе жақын жолдарды іздеу.
Бұл ретте бұлыңғырлық дәрежесі немесе мәтіндік жолдардың ұқсастығы көбінесе өңдеу қашықтығын (Левенштейн арақашықтығы) пайдалана отырып бағаланады. Ал екі жолды өңдеу қашықтығы - таңба алмастырудың, кірістірудің және жою операцияларының бір жолды екінші жолға түрлендіру үшін қажетті ең аз саны. Іргелес екі таңбаның транспозициясын дұрыс редакциялау операциясы ретінде де қарастыруға болады (Дамерау-Левенштейн арақашықтығы).
2 өңдеудің берілген бұлыңғыр мәні үшін CSV үлгісіндегі бұлыңғыр іздеу «ағаштар» іздеу сұрауы және «осылар» іздеу нәтижесі болып табылады. Мұнда «р» таңбасы «h» таңбасымен ауыстырылады, ал «е» және «с» таңбалары ауысады. Яғни осы екі сөзге арналған Дамерау-Левенштейн арақашықтығы CSV мысалында осы бұлыңғыр іздеуде 2.
Бұлыңғыр іздеуді жүзеге асыру үшін көбінесе мынадай әдістер қолданылады:
Бұл қосымшада CSV]-дағы сөздердің бұлыңғыр сәйкестігін алу үшін қателердің қажетті санын (бұлыңғырлық мәнін) 1-ден 9 таңбаға дейін көрсету қажет. Сондай-ақ, айырмашылықтардың ең аз саны бар сөздерді іздеу немесе берілген айырмашылықтар шегінде барлық сөздерді іздеу параметрін орнатуға болады.
GroupDocs.Search кітапханасының басқа да көптеген бұлыңғыр сәйкестік параметрлері бар. Мысалы, сөздер арасындағы айырмашылықтар санын сөз ұзындығының сызықтық функциясы ретінде орнатуға, тіпті сөз ұзындығының әрбір мәні үшін айырмашылықтар санын жеке-жеке белгілеуге болады.
Сондай-ақ, басқа да көптеген файл пішімдерінде бұлыңғыр іздеуді орындауға болады. Төмендегі толық тізімді қараңыз.