Jueves, 8 de Noviembre de 2007

Lenguaje cotidiano en el buscador perfecto

Dos empresas españolas diseñan una web de búsquedas inteligentes

MIGUEL ÁNGEL CRIADO ·08/11/2007 - 08:08h

¿Qué tienen que ver las canas con las cañas? Para Google, parece que mucho. Si se busca dónde tomar una caña, el buscador devuelve resultados de tintes para el cabello. Y al revés, a los preocupados por el devenir de su pelo, les saca una lista de bares. Es lo que tiene pedirle cosas a una máquina. Sin embargo, hay quien está trabajando en el desarrollo de un buscador inteligente que sí entiende.Una empresa madrileña y otra de Barcelona se han unido para crear Naveganza, una plataforma de buscadores inteligentes. La primera, Bitext, aporta una tecnología de lenguaje natural por la que el usuario puede preguntar a las máquinas usando términos coloquiales. La segunda, Isoco, se encarga de la parte de web semántica.

Jesús Contreras, director de Isoco, reconoce que es muy difícil explicar lo que es la web semántica. "Siempre uso ejemplos para que se entienda", dice. El que propone tiene que ver con los amigos de Picasso en París. Lo primero que hace un buscador convencional es destrozar la frase. Google descarta los artículos, preposiciones, acentos y la morfología en general. Lo suyo es buscar una o dos palabras clave. Si encuentra un documento que contiene los términos amigos-Picasso-París, devolverá los resultados en función del número de veces que se repitan esas palabras en las páginas, entre otros criterios.

La Internet de los conceptos

Naveganza funciona de otra manera. Lo que hace un buscador de este tipo es, en este caso, acudir a tres estándares para entender lo que se le pide. En el ejemplo, tendría en cuenta una base de datos de artistas, una norma que diferencia entre relaciones de amistad o profesionales en pintores y, por último, otra que ofrece información de ciudades. La web semántica se encarga de establecer relaciones entre estas normas. Lo explica Jesús Contreras: "La Internet actual se fija en la forma, no en los conceptos".

Ya hay mucho hecho, pero la tarea de recopilar la información, hacer categorías y establecer relaciones entre ellas requerirá décadas de trabajo. Naveganza va dirigido a sectores concretos, empresas o administraciones que tengan buena parte de sus datos organizados bajo los criterios de web semántica. En España, la página del Ayuntamiento de Zaragoza es uno de los pocos ejemplos.

Una vez que se tiene la información, hay que saber ofrecérsela al usuario. En la actualidad, el internauta tiene que adaptar sus búsquedas a la máquina, no puede hacer peticiones complejas. Aquí es donde entra Bitext. Su tecnología de lenguaje natural permite que la pregunta se haga de forma coloquial. Eso sí, aclara Jesús Contreras, "las máquinas nunca entenderán cosas como la ironía, pero sí frases simples".