Método no supervisado para la sugerencia de tags utilizando información semántica basada en conocimiento
Fecha
2012-10Autor
Bokan Garay, Alessandro
Lopez Condori, Roque
Metadatos
Mostrar el registro completo del ítemResumen
En este artículo, se presenta un método no supervisado orientado a la sugerencia de tags para posts de blogs. El método propuesto tiene 3 etapas. En la primera, se crea la Base de Conocimiento con todos los post existentes del blog, en un intervalo de tiempo dado. En esta etapa, se aplica el proceso de etiquetado gramatical para extraer los sustantivos de todos los posts previamente seleccionados, y así poder generar una base de relaciones semánticas entre sustantivos y temas de cada post. En la segunda etapa, dado un post, se extraen los sustantivos y éstos son ponderados por frecuencia de aparición. En la última etapa, se hace un matching de los sustantivos ponderados con las relaciones semánticas ofrecidas por la Base de Conocimiento. Se aplica un algoritmo de ranking que otorga las palabras más importantes, las cuales serán sugeridas al autor del post como posibles tags. Para la comprobación de los resultados
del algoritmo, se utilizó el método Gold Standard, en el cual una persona, experta en el tema, sugiere tags, y éstos se comparan con los tags sugeridos por el método no supervisado. Los resultados experimentales son satisfactorios, ya que el 70% de los tags sugeridos son efectivos para el autor.