Metin bilgilerinin bulanık aranması, arama sorgusuna benzer veya yakın dizelerin aranmasıdır.
Aynı zamanda, metin dizelerinin bulanıklık derecesi veya benzerliği en sık düzenleme mesafesi (Levenshtein mesafesi) kullanılarak değerlendirilir. İki dizenin düzenleme mesafesi, bir dizeyi diğerine dönüştürmek için gereken minimum karakter değiştirme, ekleme ve silme işlemi sayısıdır. İki bitişik karakterin aktarılması da geçerli bir düzenleme işlemi olarak düşünülebilir (Damerau-Levenshtein mesafesi).
CSV örneğinde, 2 düzenlemenin belirli bir bulanıklık değeri için bulanık bir arama, "ağaçlar" arama sorgusu ve "bunlar" arama sonucudur. Burada "r" karakteri "h" ile değiştirilir ve "e" ve "s" karakterleri aktarılır. Yani, bu iki kelime için Damerau-Levenshtein mesafesi CSV örneğindeki bu bulanık aramada 2'dir.
Aşağıdaki yöntemler genellikle bulanık arama uygulamak için kullanılır:
Bu uygulamada, CSV içinde bulanık bir kelime eşleşmesi elde etmek için, 1 ila 9 karakter arasında gerekli hata sayısını (bulanıklık değeri) belirtmeniz gerekir. Ayrıca, yalnızca minimum sayıda farklılığa sahip sözcükleri arama veya belirli sayıda farklılık içindeki tüm sözcükleri arama seçeneğini de ayarlayabilirsiniz.
GroupDocs.Search kitaplığında başka birçok bulanık eşleştirme seçeneği vardır. Örneğin, sözcükler arasındaki farkların sayısını sözcük uzunluğunun doğrusal bir işlevi olarak ayarlayabilir, hatta sözcük uzunluğunun her değeri için farklılıkların sayısını ayrı ayrı ayarlayabilirsiniz.
Bulanık aramayı diğer birçok dosya biçiminde de gerçekleştirebilirsiniz. Lütfen aşağıdaki tam listeye bakın.