Digital Library

cab1

 
Title:      CARACTERISTICAS PARA MEJORAR EL CLUSTERING DE DOCUMENTOS WEB
Author(s):      Montserrat Mateos Sánchez, Encarnación Beato Gutiérrez, Roberto Berjón Gallinas, Ana Mª Fermoso García, Miguel Angel Sánchez Vidales, Carlos García-Figuerola Paniagua
ISBN:      978–972–8924–72-0
Editors:      Flavia Maria Santoro, Pedro Isaías e José María Gutiérrez
Year:      2008
Edition:      Single
Keywords:      Documentos Web, Clustering de documentos, Clustering de documentos Web, texto completo, snippet
Type:      Full Paper
First Page:      321
Last Page:      329
Cover:      cover          
Full Contents:      click to dowload Download
Paper Abstract:      Para mejorar las búsquedas de los usuarios en la Web, se ha propuesto en numerosas ocasiones, agrupar temáticamente las páginas Web que un buscador devuelve como resultado a una consulta de usuario utilizando técnicas de clustering. En dichos trabajos las características que se utilizan para generar las soluciones de clustering son los términos obtenidos de los snippets que el buscador devuelve para cada página Web; esta decisión es motivada básicamente por el coste computacional necesario para el cálculo de las soluciones de clustering. En este artículo, se hace una evaluación y se confirma que las soluciones de clustering generadas utilizando como características los términos obtenidos a partir del texto completo del documento/página Web, son de mayor calidad que las generadas a partir solamente del snippet, además se generan en un tiempo y coste computacional aceptable. Por ello, sería viable que los motores de búsqueda Web previamente a la visualización de los resultados, los agrupe temáticamente aplicando técnicas de agrupamiento utilizando para ello el texto completo de las páginas.
   

Social Media Links

Search

Login