Title:
|
CARACTERISTICAS PARA MEJORAR EL CLUSTERING DE DOCUMENTOS WEB |
Author(s):
|
Montserrat Mateos Sánchez, Encarnación Beato Gutiérrez, Roberto Berjón Gallinas, Ana Mª Fermoso García, Miguel Angel Sánchez Vidales, Carlos García-Figuerola Paniagua |
ISBN:
|
978972892472-0 |
Editors:
|
Flavia Maria Santoro, Pedro Isaías e José María Gutiérrez |
Year:
|
2008 |
Edition:
|
Single |
Keywords:
|
Documentos Web, Clustering de documentos, Clustering de documentos Web, texto completo, snippet |
Type:
|
Full Paper |
First Page:
|
321 |
Last Page:
|
329 |
Cover:
|
|
Full Contents:
|
click to dowload
|
Paper Abstract:
|
Para mejorar las búsquedas de los usuarios en la Web, se ha propuesto en numerosas ocasiones, agrupar temáticamente las páginas Web que un buscador devuelve como resultado a una consulta de usuario utilizando técnicas de clustering. En dichos trabajos las características que se utilizan para generar las soluciones de clustering son los términos obtenidos de los snippets que el buscador devuelve para cada página Web; esta decisión es motivada básicamente por el coste computacional necesario para el cálculo de las soluciones de clustering. En este artículo, se hace una evaluación y se confirma que las soluciones de clustering generadas utilizando como características los términos obtenidos a partir del texto completo del documento/página Web, son de mayor calidad que las generadas a partir solamente del snippet, además se generan en un tiempo y coste computacional aceptable. Por ello, sería viable que los motores de búsqueda Web previamente a la visualización de los resultados, los agrupe temáticamente aplicando técnicas de agrupamiento utilizando para ello el texto completo de las páginas. |
|
|
|
|