2007/10/19

Invitación: Lenguaje natural y Web semántica, en el SIMO 2007

Estimados amigos de Buscarama:

En nombre de las empresas Bitext y iSOCO nos es grato invitaros a asistir gratuitamente a nuestra ponencia sobre "Lenguaje natural y web semántica, nuevas formas de acceso a la información", que realizaremos el próximo martes día 6 de Noviembre dentro del programa del SIMO 2007.

Como ya sabrás, la edición del SIMO de este año cuenta con un apartado especial sobre la Web 2.0 enfocado a explicar cómo esta nueva forma de entender la tecnología puede aportar grandes ventajas mediante el esfuerzo colaborativo de los usuarios de Internet.

Pero para conseguir que todos hablemos el mismo idioma en Internet y conseguir así la comprensión no sólo entre personas sino también entre máquinas, es necesario incorporar unas reglas de acceso a la información que faciliten que todos podamos entenderla independientemente de cómo ésta se exprese.

Es en este marco donde el uso del Lenguaje Natural y la Web Semántica cobran especial relevancia, pues ofrecen las soluciones adecuadas para acceder a la información de forma fácil y efectiva.

Desde Bitext e iSOCO hemos implantado ya soluciones exitosas en este campo, tales como pueden ser el caso del Ayuntamiento de Zaragoza o el del Real Instituto Elcano entre otros. En esta conferencia les presentaremos estos casos, las facilidades que ofrecemos a los usuarios y las herramientas que hacen posible estos servicios. Además les presentaremos ideas de futuro sobre la aplicación práctica de estas tecnologías, tales como los asistentes o avatares virtuales.

Será para nosotros un placer contar con su asistencia. Recuerde que aunque el evento es gratuito, el aforo es limitado, por lo que deben confirmar su asistencia dirigiéndose a la organización del SIMO, que podrán encontrar en los siguientes vínculos. Si precisan cualquier aclaración, por favor no duden en ponerse en contacto con nosotros. En caso de no poder asistir pero está interesado en recibir una copia de la presentación, escríbanos a info@bitext.com o marketing@isoco.com

Información y registros:

-Información General: http://web20simo.youlivek.com/pages/index/40-programa?lang=es

-Registros: http://web20simo.youlivek.com/members/new

En la confianza de contar con su asistencia, reciba un cordial saludo


Antonio S. Valderrábanos, Director General de Bitext
Pedro Solís, Director de Marketing y Comunicación de iSOCO

2007/10/05

Difusas

Se conoce como "búsqueda difusa" ("fuzzy search") a aquellas búsquedas que permiten recuperar términos que coinciden en un tanto por ciento elevado con los términos de la consulta. Se utiliza bastante como forma rápida de prevenir errores ortográficos. La consulta "Shakspeare", en una búsqueda difusa, reconocería "Shakespeare", por ejemplo.

A veces también se utiliza como sustituto de los lematizadores: dado que entre "casa" y "casas" hay una diferencia de solo un carácter, la búsqueda difusa permitiría encontrar ambas con una sola consulta.

Pero el problema es que también encontraría "cara", "cosa" y "masa", que difieren igualmente en un solo carácter. Esta impredecibilidad, debida al hecho de que no utiliza ningún tipo de conocimiento lingüístico, hace que normalmente genere más ruido que beneficio.

Esto ocurre, por ejemplo, en el buscador de un importante ayuntamiento de España. Una aplicación demasiado laxa de la búsqueda difusa hace que, preguntando en su buscador por "intensidad media diaria", nos devuelva artículos que contienen estas palabras... o alguna parecida. Así, el usuario recibe resultados como "medidas homologadas" y "medios personales" (en vez de "media", que es lo que se buscó), o "por razones de interés público" e "intereses de demora" (en vez de "intensidad").

Y sin embargo, dada la falta de conocimiento lingüístico del buscador, las respuestas que contienen "intensidades medias diarias", frase totalmente relevante, aparecen en su mayoría al final de los resultados.

Las soluciones "difusas" son imaginativas, y en determinados contextos pueden ser útiles. Pero parece claro que no pueden sustituir a las expansiones "que saben de lo que hablan", esto es, las basadas en lenguaje natural.