lunes, 26 de mayo de 2014

Similaridad de coseno en blogs

Prediciendo temas centrales en un Blog Corpus desde una Perspectiva de Redes 
Srayan Datta
http://arxiv.org/abs/1405.2386

En centrado en el contenido de Internet de hoy en día, los blogs se están convirtiendo cada vez más popular e importante desde una perspectiva de análisis de datos. De acuerdo a Wikipedia, había más de 156 millones los blogs públicos en Internet a partir de febrero de 2011. Los blogs son un reflejo de nuestra sociedad contemporánea. Los contenidos de las diferentes entradas del blog son importantes desde las perspectivas sociales, psicológicos, económicos y políticos. El descubrimiento de los temas importantes en la blogosfera es un área que todavía necesita mucho explorar. Tratamos de llegar a un procedimiento utilizando medidas probabilístico modelado tema y centralidad de red, que identifica los temas centrales en un corpus blog.

No hay comentarios:

Publicar un comentario