Carian kabur maklumat teks adalah carian untuk rentetan yang serupa atau dekat dengan pertanyaan carian.
Pada masa yang sama, tahap kekaburan atau persamaan rentetan teks paling sering dinilai menggunakan jarak edit (jarak Levenshtein). Dan jarak edit dua rentetan adalah bilangan minimum penggantian watak, penyisipan, dan operasi penghapusan yang diperlukan untuk mengubah satu rentetan menjadi yang lain. Transposisi dua aksara bersebelahan juga boleh dianggap sebagai operasi penyuntingan yang sah (jarak Damerau-Levenshtein).
Carian kabur dalam contoh CSV untuk nilai kekaburan yang diberikan sebanyak 2 suntingan ialah pertanyaan carian "pokok" dan hasil carian "ini". Di sini watak "r" digantikan oleh "h" dan watak-watak "e" dan "s" ditransposed. Iaitu, jarak Damerau-Levenshtein untuk kedua-dua perkataan ini adalah 2 dalam carian kabur ini dalam contoh CSV.
Kaedah berikut paling sering digunakan untuk melaksanakan carian kabur:
Dalam aplikasi ini, untuk mendapatkan padanan kata-kata yang kabur dalam CSV, anda perlu menentukan bilangan kesilapan yang diperlukan (nilai pening) dari 1 hingga 9 aksara. Anda juga boleh menetapkan pilihan untuk mencari kata-kata dengan hanya bilangan perbezaan minimum, atau untuk mencari semua perkataan dalam beberapa perbezaan tertentu.
Pustaka GroupDocs.Search mempunyai banyak pilihan padanan kabur yang lain. Sebagai contoh, anda boleh menetapkan bilangan perbezaan antara perkataan sebagai fungsi linear panjang perkataan, atau bahkan menetapkan bilangan perbezaan secara individu untuk setiap nilai panjang perkataan.
Anda juga boleh melakukan carian kabur dalam banyak format fail lain. Sila lihat senarai penuh di bawah.