2009/09/21

Bitext en el Online Information 2009 en Londres

El fundador y director de Bitext, Antonio Valderrábanos, ha sido invitado a participar en la jornada inaugural de la Online Information 2009, una feria dedicada a la industria de la información, a la que asisten más de 9.000 personas de 70 países, y cuyo programa completo se puede ver aquí.

Antonio impartirá la charla "Language and semantics: what can you do for my search engine (and for me)?" en la primera jornada de esta feria, que tendrá lugar en Londres del 1 al 3 de diciembre de 2009.

2009/09/16

"Bitext: tecnología impresionante" según Beyond Search

Hemos hablado en otras ocasiones del blog Beyond Search, de Stephen Arnold, una de las referencias más útiles para estar al día en el sector de las búsquedas.

Beyond Search ha publicado hoy una "Tabla de vendedores europeos de tecnologías de búsqueda" (que ha actualizado unas horas después).

En esta tabla se muestran fabricantes de tecnología tan conocidos como Autonomy o Fast, entre otras quince.

Una de las empresas cubiertas es Bitext, de la que Beyond Search opina de forma muy concisa:

Bitext - Semantic components - Impressive technology

Agradecemos a Beyond Search la referencia, que nos anima a continuar en el camino de traer el procesamiento de lenguaje natural a nuestra vida cotidiana, de ayudar a que las máquinas entiendan a las personas.

2009/09/14

Super-Size Google!

Google ha cogido la indirecta. ¿Los usuarios de buscadores utilizan cada vez más palabras en sus búsquedas?

Bien, pues ¡démosles más espacio!


 

2009/09/07

Mide tus sentimientos

Una de las tecnologías de lenguaje natural más en boga actualmente es el "Sentiment Analysis" u "Opinion Analysis", en la que también trabaja Bitext.

De forma resumida, consiste en rastrear la web (foros, tweets, blogs...), identificar textos donde los usuarios estén valorando algún producto o marca, y, por medio de un análisis de lenguaje natural, interpretar si la referencia es positiva o negativa y pasarla a una base de datos. De esta forma cualquier empresa podrá saber lo que piensa de sus productos "la web" (que parece un ente etéreo, pero está formada por usuarios que consumen).

El New York Times ha publicado recientemente un artículo a este respecto, llamado "Mining the Web for Feelings, Not Facts". En él se mencionan varias empresas estadounidenses que están ya trabajando en este campo.

Como suele ocurrir, el idioma supone una barrera para que estas compañías puedan emplear sus algoritmos para dar servicio a empresas españolas. Un análisis lingüístico (semántico) del español, y de otras lenguas, se hace imprescindible para poder acometer esta tarea de forma correcta. ¿Interesa esta información a nuestras empresas?

(Curiosidad: según Twitrratr, "natural language" recibe en este momento un 10% de opiniones positivas y sólo un 3% de negativas. No demasiado correctas, por otra parte: una de las positivas decía "natural city is an excellent korean version of blade runner-- same amount of cheese, but different language". Y "lenguaje natural", desde luego... cero)

2009/09/02

¿Cómo funciona el "Quiso decir"?

Gracias a nuestro Twitter (que podéis seguir desde http://www.twitter.com/bitext) hemos encontrado un interesantísimo hilo de discusión sobre una de las características más comentadas de Google: el "Quiso decir" o "Did you mean".

En él se explica (de forma poco técnica, muy accesible para profanos) cómo Google emplea métodos estadísticos para determinar cuándo debe darte una sugerencia para determinada consulta.

También explica por qué este método es muy arriesgado, y de dónde provienen algunos de sus errores (errores que se van incrementado cuanto más osado es Google con sus correcciones, pero de esto hablaremos otro día).

Y también se explica por qué lo que tiene Google NO es un "corrector ortográfico" (como sí es nuestro DataSpell), sino una especie de "sugeridor de palabras frecuentes", que no se preocupa de si una palabra es correcta o no, sino sólo de si su uso es frecuente, lo que hace que muchas consultas perfectamente razonables sean "corregidas" automáticamente por Google.

Sufrimos esto nosotros mismos hace unos meses, cuando queriendo preguntar sobre buscadores de la empresa Atos, la consulta "buscadores de Atos" nos devolvió 7 millones de resultados... ¡de "buscadores de autos" y de "buscadores de datos"! Y ni un sólo resultado, entre los doscientos primeros, sobre lo que realmente buscábamos.

Un buen ejemplo sobre los problemas del mal llamado "corrector ortográfico" de Google. De todo esto, y de más, se habla en este hilo (en inglés).