Se conoce como "búsqueda difusa" ("fuzzy search") a aquellas búsquedas que permiten recuperar términos que coinciden en un tanto por ciento elevado con los términos de la consulta. Se utiliza bastante como forma rápida de prevenir errores ortográficos. La consulta "Shakspeare", en una búsqueda difusa, reconocería "Shakespeare", por ejemplo.
A veces también se utiliza como sustituto de los lematizadores: dado que entre "casa" y "casas" hay una diferencia de solo un carácter, la búsqueda difusa permitiría encontrar ambas con una sola consulta.
Pero el problema es que también encontraría "cara", "cosa" y "masa", que difieren igualmente en un solo carácter. Esta impredecibilidad, debida al hecho de que no utiliza ningún tipo de conocimiento lingüístico, hace que normalmente genere más ruido que beneficio.
Esto ocurre, por ejemplo, en el buscador de un importante ayuntamiento de España. Una aplicación demasiado laxa de la búsqueda difusa hace que, preguntando en su buscador por "intensidad media diaria", nos devuelva artículos que contienen estas palabras... o alguna parecida. Así, el usuario recibe resultados como "medidas homologadas" y "medios personales" (en vez de "media", que es lo que se buscó), o "por razones de interés público" e "intereses de demora" (en vez de "intensidad").
Y sin embargo, dada la falta de conocimiento lingüístico del buscador, las respuestas que contienen "intensidades medias diarias", frase totalmente relevante, aparecen en su mayoría al final de los resultados.
Las soluciones "difusas" son imaginativas, y en determinados contextos pueden ser útiles. Pero parece claro que no pueden sustituir a las expansiones "que saben de lo que hablan", esto es, las basadas en lenguaje natural.