Una base de datos solo provee de valor siempre y cuando pueda ser utilizada y su información acezada, y mientras una buena calidad de datos asegura que ese valor se mantenga y prospere, la eficiencia con la cual uno puede acceder y navegar a través de esta base de datos directamente afecta su valor tangible. Las buenas herramientas para buscar dentro de una base de datos son también determinantes del impacto que esta puede tener en su uso.
Cuando uno está en la búsqueda de una cierta entrada dentro de una base de datos, como lo son una biblioteca, un directorio, o un maestro de materiales, usualmente se utiliza una herramienta de búsqueda exacta. Con esta herramienta uno simplemente proporciona una palabra o frase y la herramienta lo busca dentro de la base de datos. Mientras este método es eficiente y adecuado al tratarse con una base de datos familiar o simple, tiene sus límites; ahí donde llega a la mesa la búsqueda fuzzy.
La busqueda fuzzy es, en esencia, un método de busqueda donde la herramienta utilizada busca no nada más aquello que es idéntico a los que se le ha alimentado, si no que busca resultados similares dentro de cierto margen.
Por ejemplo, al hacer una busqueda exacta, uno podría buscar utilizando la palabra “coches”, esto resultando en todos los registros que contengan la palabra “coches”; mientras una busqueda fuzzy buscaría en adición a aquello que contenga “coches”, aquello que contenga “c0ches” o “coche”. Permitiéndole a uno buscar entradas con cierto grado de similitud.
Métodos de busqueda exacta funcionan. Con buena calidad de datos, una busqueda de la palabra “coches” resultara en todo registro relevante, siempre y cuando contenga la palabra “coches”. Con datos más inteligentes, esta busqueda resultaría en contenido de relevancia a nuestra busqueda de “coches”, como manuales de mecánica. Pero, que sucede si la palabra “coches” no aparece textualmente en los registros, ¿aunque sea información relacionada y de relevancia? O si alguien busca datos relacionados a “coches” pero comete el error de buscar con “cochws”?
La busqueda Fuzzy lo que busca es mejorar la relevancia, busca que el proceso de busqueda sea uno que favorezca a que ejecute dicha investigación y le permita hacerlo de una manera más intuitiva y a grandes rasgos más eficiente.

Hay diversas herramientas hoy en día que implementan iteraciones de busqueda fuzzy con el objetivo de agilizar el proceso para quien ejecuta la busqueda.
Un uso de busqueda fuzzy, el cual comúnmente puede uno ver en motores de busqueda como Google o Yahoo, es aquel que provee de correcciones ortográficas así de como búsquedas con palabras alternativas.
En nuestro sistema Kontenix hemos implementado el algoritmo de busqueda fuzzy para buscar registros con cierto grado de similitud. Estableciendo un porcentaje de similitud, somos capaces de ejecutar una busqueda y el sistema arrojara resultados que cumplan con ese porcentaje de similitud.
Por ejemplo, buscando el valor “6417190”, podemos pedirle al sistema que utilizando un algoritmo fuzzy nos indique que entradas son similares. El rubro cual queremos que utilice para comparar es el de “numero parte fabricante”; con esto el sistema arrojándonos entradas que tengan un “numero de parte fabricante” similar a aquel de nuestra busqueda inicial.

Esto permite a un usuario buscar datos similares, buscar duplicados, o hasta le asiste en la busqueda de un registro en específico cuando se cuenta con información parcial o fragmentada.
Contar con datos de calidad se puede desaprovechar si uno no cuenta con las herramientas adecuadas para administrarlos y consultarlos. La busqueda fuzzy es una de muchas funcionalidades que tiene a su disposición una herramienta de busqueda y el buen uso de esta puede mejorar los procesos de investigación y consulta dentro de nuestro ambiente de datos.
En Kontenix ofrecemos soluciones de calidad de datos, como nuestro sistema de catalogación y nuestras capacitaciones y cursos. Contáctanos para conocer mas sobre nuestros servicios.