2009/10/30

Evento - Business Intelligence y Búsqueda Empresarial

Bitext participará en un nuevo evento, esta vez en Madrid, el 11 de noviembre de 2009.

La compañía InformationBuilders ha invitado a nuestro CEO, Antonio Valderrábanos, a hablar sobre "Tecnología de Lenguaje Natural para Inteligencia de Negocio y Buscadores", en el marco de las jornadas "Convergencia de Business Intelligence y Búsqueda Empresarial". Puede verse la agenda completa aquí.

El evento se realizará en el Hotel Intercontinental, en el número 49 del Paseo de la Castellana, en Madrid.

Una nueva oportunidad para explicar por qué es necesario el lenguaje natural en entornos con necesidades tan específicas como las del Business Intelligence.

2009/09/21

Bitext en el Online Information 2009 en Londres

El fundador y director de Bitext, Antonio Valderrábanos, ha sido invitado a participar en la jornada inaugural de la Online Information 2009, una feria dedicada a la industria de la información, a la que asisten más de 9.000 personas de 70 países, y cuyo programa completo se puede ver aquí.

Antonio impartirá la charla "Language and semantics: what can you do for my search engine (and for me)?" en la primera jornada de esta feria, que tendrá lugar en Londres del 1 al 3 de diciembre de 2009.

2009/09/16

"Bitext: tecnología impresionante" según Beyond Search

Hemos hablado en otras ocasiones del blog Beyond Search, de Stephen Arnold, una de las referencias más útiles para estar al día en el sector de las búsquedas.

Beyond Search ha publicado hoy una "Tabla de vendedores europeos de tecnologías de búsqueda" (que ha actualizado unas horas después).

En esta tabla se muestran fabricantes de tecnología tan conocidos como Autonomy o Fast, entre otras quince.

Una de las empresas cubiertas es Bitext, de la que Beyond Search opina de forma muy concisa:

Bitext - Semantic components - Impressive technology

Agradecemos a Beyond Search la referencia, que nos anima a continuar en el camino de traer el procesamiento de lenguaje natural a nuestra vida cotidiana, de ayudar a que las máquinas entiendan a las personas.

2009/09/14

Super-Size Google!

Google ha cogido la indirecta. ¿Los usuarios de buscadores utilizan cada vez más palabras en sus búsquedas?

Bien, pues ¡démosles más espacio!


 

2009/09/07

Mide tus sentimientos

Una de las tecnologías de lenguaje natural más en boga actualmente es el "Sentiment Analysis" u "Opinion Analysis", en la que también trabaja Bitext.

De forma resumida, consiste en rastrear la web (foros, tweets, blogs...), identificar textos donde los usuarios estén valorando algún producto o marca, y, por medio de un análisis de lenguaje natural, interpretar si la referencia es positiva o negativa y pasarla a una base de datos. De esta forma cualquier empresa podrá saber lo que piensa de sus productos "la web" (que parece un ente etéreo, pero está formada por usuarios que consumen).

El New York Times ha publicado recientemente un artículo a este respecto, llamado "Mining the Web for Feelings, Not Facts". En él se mencionan varias empresas estadounidenses que están ya trabajando en este campo.

Como suele ocurrir, el idioma supone una barrera para que estas compañías puedan emplear sus algoritmos para dar servicio a empresas españolas. Un análisis lingüístico (semántico) del español, y de otras lenguas, se hace imprescindible para poder acometer esta tarea de forma correcta. ¿Interesa esta información a nuestras empresas?

(Curiosidad: según Twitrratr, "natural language" recibe en este momento un 10% de opiniones positivas y sólo un 3% de negativas. No demasiado correctas, por otra parte: una de las positivas decía "natural city is an excellent korean version of blade runner-- same amount of cheese, but different language". Y "lenguaje natural", desde luego... cero)

2009/09/02

¿Cómo funciona el "Quiso decir"?

Gracias a nuestro Twitter (que podéis seguir desde http://www.twitter.com/bitext) hemos encontrado un interesantísimo hilo de discusión sobre una de las características más comentadas de Google: el "Quiso decir" o "Did you mean".

En él se explica (de forma poco técnica, muy accesible para profanos) cómo Google emplea métodos estadísticos para determinar cuándo debe darte una sugerencia para determinada consulta.

También explica por qué este método es muy arriesgado, y de dónde provienen algunos de sus errores (errores que se van incrementado cuanto más osado es Google con sus correcciones, pero de esto hablaremos otro día).

Y también se explica por qué lo que tiene Google NO es un "corrector ortográfico" (como sí es nuestro DataSpell), sino una especie de "sugeridor de palabras frecuentes", que no se preocupa de si una palabra es correcta o no, sino sólo de si su uso es frecuente, lo que hace que muchas consultas perfectamente razonables sean "corregidas" automáticamente por Google.

Sufrimos esto nosotros mismos hace unos meses, cuando queriendo preguntar sobre buscadores de la empresa Atos, la consulta "buscadores de Atos" nos devolvió 7 millones de resultados... ¡de "buscadores de autos" y de "buscadores de datos"! Y ni un sólo resultado, entre los doscientos primeros, sobre lo que realmente buscábamos.

Un buen ejemplo sobre los problemas del mal llamado "corrector ortográfico" de Google. De todo esto, y de más, se habla en este hilo (en inglés).

2009/08/31

Un listado de buscadores

Por medio de Beyond Search descubrimos un interesantísimo listado de buscadores (en un blog coreano, uno nunca sabe dónde va a encontrar la siguiente perla).

No es un listado completo (falta alguno como Bing) ni totalmente al día (alguno, como Acoona, han cerrado ya), pero es más que interesante para localizar nichos de buscadores que pueden ser menos conocidos.

El listado organiza los buscadores en varios grupos: multipropósito, buscadores específicos (de blogs, de torrents...), sectoriales (de negocios, de empleo...), de internet o de intranet... en resumen, un listado muy útil para completar el conocimiento del sector de buscadores.

Como curiosidad: mencionan "natural language" en su descripción Ask (aunque ya abandonó el lenguaje natural), Brainboost, Lexxe, y AskMeNow.

2009/08/14

"Sé qué quieres hacer"

Al menos eso es lo que asegura OpenAmplify, una nueva herramienta de lenguaje natural que analiza el contenido de mensajes de correo electrónico, twits, foros, etc, y extrae la "intención" del autor. Un paso más dentro del campo del "Opinion Analysis": ¿"Intention Analysis"?

Según se explica, de un mensaje como "My beautiful girlfriend's birthday is this weekend. Should I purchase her a nice necklace this year? Or, we could fly to some island for the weekend" se extraería un fichero XML que contendría las acciones que el autor del mensaje quiere realizar (en este caso, comprar un collar o viajar), ayudando así a la selección de anuncios.

Parece que se consolida la tendencia: es necesario entender a los usuarios tal y como escriben. Por ahora, para poder venderles más y mejor. Pero la gama de posibles usos de la comprensión inteligente del texto es casi infinita. ¿Se te ocurren algunos?

2009/08/10

Akibot: ¿un twitter con lenguaje natural?

Por medio de Twitter hemos conocido Akibot, un nuevo sistema que pretende ser un "twitter para empresas" con características de lenguaje natural.

La filosofía de Akibot es la de "leer y entender" todos los mensajes puestos por los usuarios, e "interactuar" con ellos basándose en ese conocimiento. Un ejemplo: si un usuario escribe "el mejor libro sobre X es Y", Akibot almacenará esa información; y cuando otro usuario pregunte "¿cuál es el mejor libro sobre X?", el propio Akibot le responderá "Y".

No sabemos si en algún momento ofrecerán una demo abierta al público. Por ahora no es más que unas cuantas capturas de pantalla que muestra una idea... y no está demasiado claro el porvenir de esa idea. Esperaremos noticias.

2009/08/05

Adiós, Yahoo

Ya han pasado unos días desde la noticia: Yahoo abandona su motor de búsqueda y lo sustituye por el nuevo Bing de Microsoft.

Stephen Arnold, en su indispensable blog Beyond Search, lo describe con términos tan certeros como melancólicos:

En su búsqueda por un segundo acto, Yahoo ha decidido dejar de ser una empresa de tecnología [...].

El único cambio real para los millones de usuarios de Yahoo es que probablemente verán alguna aparición de la marca "Bing" por algún sitio, y que los resultados de las búsquedas tendrán una apariencia ligeramente distinta.

Pero para los empleados y accionistas de Yahoo, el anuncio significa algo más: Yahoo es ahora un portal de entretenimiento, una confederación de "destinos". Es la nueva AOL, pero sin contenido original.


Se ha hablado de una "revolución" en el mundo de las búsquedas. Pero es justo al contrario. La revolución, si acaso, vendrá en el mundo de la publicidad, donde los efectos de este cambio pueden ser devastadores. Pero en las búsquedas sólo significa que se elimina un esfuerzo de innovación, que un contendiente arroja la toalla y deja de intentar descubrir cosas nuevas; en resumen, que estamos peor que hace una semana. Ya tenemos el duopolio. Porque Google hace como que no se entera...

¿Habrá alguien capaz de romper esta situación?