1. Nuevos retos de la tecnología web crawler para la recuperación de información
- Author
-
Blázquez Ochando, Manuel
- Subjects
web crawler ,recuperación de información ,marcado semántico ,Apache Nutch ,Heritrix ,WIRE ,SocSciBot ,Mbot ,Bibliography. Library science. Information resources - Abstract
El web crawler constituye una parte importante de la cadena documental en la recuperación de información, dado que genera el corpus documental necesario sobre el que aplicar los distintos algoritmos de recuperación. Dada su relevancia, se analiza el papel que desempeña. Algunas de las conclusiones obtenidas, apuntan a la introducción del reconocimiento, sus distintos enfoques, aportaciones significativas y estado de la técnica, marcado semántico en la web, al desarrollo de un web crawler más polivalente, capaz de interactuar con la web social y realizar campañas de comunicación.
- Published
- 2014
- Full Text
- View/download PDF