Realizan un estudio sobre búsquedas en la Red en 34 idiomas

Fuente: INFORMATION RETRIEVAL 12 (3): 324-351, junio de 2009
Autor principal: Roi Blanco
Centro: Universidad de A Coruña

SINC | 29 mayo 2009 15:39

Título original: Búsqueda mixta de páginas de inicio monolingües en 34 idiomas: la función de la escritura del idioma y del dominio de búsqueda.

Resumen: La información que está disponible o que se busca en la Red de Redes (la Red) es cada vez más multilingüe. Los sistemas de búsqueda de información, como los motores de búsqueda gratuitos de los que dispone la Red, tienen que proporcionar un acceso justo y equitativo a esta información, independientemente del idioma en que esté escrito el texto de la consulta o del lugar del que ésta proceda. En este trabajo, nos hacemos dos preguntas: ¿Cómo trabajan los motores de búsqueda de tecnología punta con idiomas escritos con distintos alfabetos (escrituras)? ¿Los dominios de búsqueda basados en el idioma local realmente facilitan el acceso a la información?

Realizamos un estudio en profundidad del efecto que tienen las consultas multilingües en la búsqueda de páginas de inicio, donde el objetivo del sistema de búsqueda es dar como resultado un único documento, en concreto la página de inicio descrita en la consulta. Evaluamos el efecto de las consultas multilingües en el resultado de la búsqueda en cuanto a (i) el alfabeto en que está escrita la consulta (por ejemplo, latino, ruso, árabe) y (ii) el dominio lingüístico en que se hacen las consultas (por ejemplo, google.com, google.fr).

Hacemos consultas en cuatro importantes motores de búsqueda gratuitos, con 764 consultas en 34 idiomas diferentes, y buscamos la página de inicio correcta entre los primeros resultados encontrados. A fin de contar con un contexto experimental multilingüe justo, usamos una ontología comparable para los distintos idiomas y además representativa de las búsquedas reales que se hacen en la Red: las ligas de fútbol de primera división de distintos países; el nombre oficial del equipo representa nuestra consulta, y la página de inicio oficial del equipo representa el documento que se busca.

Una serie de experimentos exhaustivos con más de 10.000 búsquedas, con consultas escritas tanto con los caracteres originales como con los latinos, y también empleando dominios de búsqueda tanto mundiales como locales, revela que las consultas realizadas usando la escritura original de un idioma tienen más probabilidades de producir un resultado correcto y que se encuentre entre los tres primeros puestos, mientras que las consultas hechas en idiomas con escrituras no latinas que, sin embargo, se realizan con escritura latina tienen menos probabilidades de producir un resultado correcto; además, las consultas realizadas en el dominio local correcto de un motor de búsqueda (por ejemplo, consultas en francés hechas en yahoo.fr) es probable que tengan un mejor rendimiento de la búsqueda que las consultas realizadas en el dominio mundial del motor de búsqueda. Por lo que sabemos, éste es el primer estudio sobre búsquedas en la Red que usa un rango tan amplio de idiomas.

Autores: Blanco, Roi; Lioma, Christina.

Dirección: Universidad de A Coruña (Departamento de Ciencias de la Computación) y Universidad Católica Lovaina (Departamento de Ciencias de la Computación), Bélgica.

Contacto: rblanco@udc.es

Zona geográfica: Internacional
Fuente: SINC

Comentarios

Queremos saber tu opinión