¿Entender opiniones leyendo palabras?
El análisis de opiniones (sentiment analysis, opinion mining, etc.) es un área tan interesante como complicada. Existen ya varias empresas que están desarrollando (y mostrando) tecnología para analizar las opiniones sobre determinados temas encontradas en Twitter.
Sin embargo, la falta de tecnología lingüística en la mayoría de esas empresas llevan a que esos análisis se realicen mirando únicamente palabras sueltas dentro de esas opiniones, y valorándolas de acuerdo a esas palabras.
Eso nos lleva a resultados que, al mirarlos en un poco de detalle, se revelan como poco satisfactorios. Una búsqueda que acabamos de hacer sobre "Obama" en una de estas aplicaciones detecta como negativas opiniones como las siguientes:
- obama does get it. he understands the basic problems tha americans have
- i am a little confused too. obama for the win
- fox is wrong and just plain scary. obama up 10 points over mccain
- who cares if obama was muslim? muslims are not bad people
Como se ve, ni siquiera la aparición de un "not" en "not bad" cambia la definición de la opinión; y el lenguaje, desde luego, es mucho más complejo que un "not".
Es necesario aplicar verdadera tecnología lingüística al tratamiento de opiniones, para conseguir resultados aceptables. Y esta tecnología, como sabemos, ya existe. Sólo falta empezar a emplearla.

0 comentarios:
Publicar un comentario en la entrada