Suddig sökning av textinformation är sökning efter strängar som liknar eller ligger nära sökfrågan.
Samtidigt bedöms graden av suddighet eller likhet av textsträngar oftast med hjälp av redigeringsavståndet (Levenshtein-avståndet). Och redigeringsavståndet för två strängar är det minsta antalet teckenersättnings-, insättnings- och borttagningsåtgärder som krävs för att omvandla en sträng till en annan. Ett införlivande av två intilliggande tecken kan också betraktas som en giltig redigeringsåtgärd (Avstånd Damerau-Levenshtein).
En luddig sökning i CSV exempel för ett givet luddighetsvärde på 2 redigeringar är sökfrågan "träd" och sökresultatet "dessa". Här ersätts tecknet "r" med "h" och tecknen "e" och "s" transponeras. Det vill säga, Avståndet Damerau-Levenshtein för dessa två ord är 2 i denna luddiga sökning i CSV exempel.
Följande metoder används oftast för att implementera fuzzy-sökning:
I den här applikationen, för att få en luddig matchning av ord i CSV, måste du ange det önskade antalet misstag (luddighetsvärde) från 1 till 9 tecken. Du kan också ange alternativet att söka efter ord med bara ett minsta antal skillnader, eller att söka efter alla ord inom ett visst antal skillnader.
GroupDocs.Search-biblioteket har många andra luddiga matchningsalternativ. Du kan till exempel ange antalet skillnader mellan ord som en linjär funktion av ordlängd, eller till och med ange antalet skillnader individuellt för varje värde av ordlängd.
Du kan också utföra suddig sökning i många andra filformat. Se hela listan nedan.