>Metaweb es una empresa dedicada a hacer que buscar sea sencillo y efectivo. Resulta cuando menos curioso que Google, el más listo de la clase en lo que a buscar se refiere, busque apoyos en este campo.
Metaweb es conocida sobre todo por su proyeecto Freebase. Freebase es una colección de datos estructurados relativos a entidades, es decir, a nombres de personas, empresas, lugares, etc. En su propia descripción: “Freebase is an open, Creative Commons licensed repository of structured data of more than 12 million entities”.
Y probablemente aquí está la clave. Metaweb afronta el problema de la búsqueda desde un ángulo que es a la vez efectivo y novedoso, su objetivo es convertir información no estructurada (texto sin más) en información estructurada: entidades y sus relaciones.
Es decir, Metaweb no se dedica al buscar, no es su campo de trabajo. Lo que sucede es que la información que almacenan, como en Freebase, ayuda y mucho a que los buscadores hagan mejor su trabajo. De hecho, en palabras de de Metaweb: “Metaweb helps site owners, bloggers, and developers make their sites richer and more engaging”. Nada de búsqueda.
Nuestra conclusión: extraer información estructurada de texto es uno de los pasos clave en el proceso continuo de mejora de los buscadores actuales. Y es un paso que pertenece ya al presente más que al futuro. La búsquedas basadas en “facets” (faceted search) son otro ejemplo de esta misma tendencia; fabricantes de buscadores como Endeca o FAST (Microsoft) ya lo están haciendo.
Nuestra contribución: poner en marcha este proceso de extracción de información estructurada de texto sólo es viable si analizamos lingüísticamente el texto. Esto es lo que hace nuestra solución NaturalOpinions. Y lo hace muy bien, como podéis ver en estas demos.