2009/07/31

Viaje al auto-complete

El laboratorio de LastMinute nos sorprende con una interesante innovación: su buscador Pronto, un paso más hacia las búsquedas en lenguaje natural.

Este buscador es una mezcla de dos elementos:

  • Un "auto-complete", un asistente que da sugerencias al usuario sobre cómo ir escribiendo su búsqueda (en la línea también del lenguaje controlado), y

  • un conjunto de estructuras lingüísticas posibles.


De esta manera, cuando te sitúas en la caja, el buscador te ofrece "I want to" y "I'd like to". Si aceptas una de ella te ofrecerá "travel to" o "stay in". Si aceptas "travel to" te pedirá que pongas un sitio, y después te ofrecerá "on (date)", "for (duration)", "from (origin)"... y de esta manera te ayuda a ir construyendo la consulta.

No es lenguaje natural real, dado que no permite usar más que las estructuras que tiene codificadas (por ejemplo, si pones "I'd want to" la rechaza como inválida), pero es un paso más en la dirección del lenguaje natural, y una interesante forma de implantarlo.

2009/07/24

El "hybris" del lenguaje natural

Para el autor de este artículo del blog Unqualified Reservations (en inglés), pretender construir un interfaz de lenguaje natural es un acto de "hybris", del orgullo insano que hace que un ser humano pretenda ponerse a la altura de los dioses.

El artículo es en realidad una crítica a Wolfram Alpha. Analizando este buscador, identifica en él tres grandes partes: unas bases de datos inmensas con "conocimiento del mundo" acumulado en ellas, unas muy interesantes aplicaciones que devuelven visualmente información sobre esos datos, y por último, un interfaz en lenguaje natural donde se entiende lo que el usuario pide y se ejecuta una aplicación u otra.

Ésta es la parte que el autor considera un "tremendo error", pues afirma que el cerebro humano ha necesitado millones de años de evolución para aprender a determinar qué acción tomar en cada momento, y que un sistema que pretenda saber esto encontrará muy pronto sus límites, como opina que los ha encontrado ya el propio Wolfram Alpha.

El artículo entero parece una crítica global al lenguaje natural (y una loa al "full-text search"), pero a mi entender, lo que se está criticando es otra cosa: la pretensión de querer responder de forma directa a cualquier pregunta de un usuario con un dato de la realidad. No se critica Wolphram Alpha como un "natural language interface", sino como un "question-answering system", que es lo que en realidad pretende ser. Y esa tarea, como hemos defendido siempre desde Bitext, es irrealista.

El lenguaje natural puede y debe ser implementado en las máquinas, pero conociendo su limitación, y usándolo sólo para facilitar (en términos de usabilidad) la vida a los usuarios; no para pretender convertir a las máquinas en los nuevos cerebros pensantes.

Efectivamente, el sector del lenguaje natural peca de "hybris", y ese orgullo hace que caiga una vez tras otra en estos grandes (y costosos) errores, complicando el futuro a quienes pretenden ir dando los pasos de uno a uno, sin querer llegar a la inteligencia artificial cuando las máquinas todavía tienen dificultades para distinguir un "caso" de una "casa". Wolfram Alpha, efectivamente, no va a ayudar en esta tarea.

2009/07/08

Cada vez más búsquedas en lenguaje natural

Lo habíamos anunciado ya hacía tiempo, pero la tendencia continúa y es clara:

Cada vez se realizan más consultas en lenguaje natural. En concreto, según indica Google (http://www.marketingvox.com/search-queries-with-8-words-continue-to-rise-043547/), el número de búsquedas de más de 8 palabras creció otro 20% de febrero de 2008 a febrero de 2009. Mientras tanto, el número de consultas de una a cuatro palabras decreció un 2%.

Estas cifras ya se empiezan a analizar como el inicio de que el lenguaje natural pronto será una de las claves de las búsquedas (http://luisgarciadelafuente.com/2009/05/20/mas-busquedas-genericas-hacia-el-lenguaje-natural/).

Sin embargo, en este enlace se dice que este cambio no será "revolucionario" (por la aparición de un nuevo buscador, el famoso "Google killer") sino "evolutivo", por el hecho de que Google irá entendiendo cada vez mejor el lenguaje natural. El argumento nos parece convincente. Pero lo que está claro es que para que esto ocurra, Google, o quien sea, deberá continuar investigando en cómo comprender mejor lo que los usuarios escriben, y en afianzar estas tecnologías. En Bitext seguimos trabajando en ello.

2009/07/03

Bitext ahora en Twitter

Ahora es posible estar al tanto de las novedades en lenguaje natural también en Twitter. Bitext se ha unido a esta red social, en la dirección http://twitter.com/bitext.

En Twitter el mundo del lenguaje natural está muy presente, es un buen lugar para mantenerse al tanto de lo que ocurre por el mundo en esta disciplina.

La única prevención: ¡no busquéis por la etiqueta #nlp... o acabaréis con vuestra página repleta de noticias sobre Neuro-Linguistic Programming! Por ahora no existe #naturallanguage, quizás sea cosa de crearla...