Տեքստային տեղեկատվության մշուշոտ որոնումը որոնման հարցումին նման կամ մոտ տողերի որոնումն է:
Միևնույն ժամանակ, տեքստային տողերի անորոշության կամ նմանության աստիճանը ամենից հաճախ գնահատվում է խմբագրման հեռավորության միջոցով (Լևենշտեյնի հեռավորություն): Եվ երկու տողերի խմբագրման հեռավորությունը նիշերի փոխարինման, տեղադրման և ջնջման գործողությունների նվազագույն քանակն է, որն անհրաժեշտ է մի տողը մյուսի փոխակերպելու համար: Երկու հարակից նիշերի փոխադրումը կարող է նաև դիտարկվել որպես վավեր խմբագրման գործողություն (Դամերաու-Լևենշտեյն հեռավորություն):
Մշուշոտ որոնումը CSV օրինակում 2 խմբագրման տրված մշուշոտության արժեքի համար է որոնման հարցումը «ծառեր» և որոնման արդյունք «այս»: Այստեղ «r» նշանը փոխարինվում է «h»-ով, իսկ «e» և «s» նիշերը փոխադրվում են: Այսինքն, այս երկու բառերի համար Դամերաու-Լևենշտեյն հեռավորությունը 2 է այս անորոշ որոնման մեջ CSV օրինակում:
Հետևյալ մեթոդները առավել հաճախ օգտագործվում են անորոշ որոնման իրականացման համար.
Այս հավելվածում CSV-ում բառերի անհասկանալի համընկնում ստանալու համար անհրաժեշտ է նշել սխալների անհրաժեշտ քանակը (անորոշության արժեքը) 1-ից 9 նիշ: Կարող եք նաև սահմանել տարբերակ՝ բառեր որոնելու միայն նվազագույն թվով տարբերություններով, կամ որոնելու բոլոր բառերը որոշակի թվով տարբերությունների մեջ:
GroupDocs.Search գրադարանն ունի բազմաթիվ այլ անհասկանալի համապատասխանող տարբերակներ: Օրինակ, դուք կարող եք սահմանել բառերի միջև եղած տարբերությունների թիվը որպես բառի երկարության գծային ֆունկցիա, կամ նույնիսկ առանձին-առանձին սահմանել տարբերությունների քանակը բառի երկարության յուրաքանչյուր արժեքի համար:
Կարող եք նաև անորոշ որոնում կատարել բազմաթիվ այլ ֆայլերի ձևաչափերով: Խնդրում ենք տեսնել ստորև ներկայացված ամբողջական ցանկը: