Artículo Científico: Online Courses Recommendation Based On LDA

GRUPO DE ANÁLISIS DE REDES SOCIALES

 

RESUMEN En este artículo proponemos un sistema de recomendación de cursos basados en el histórico de notas de estudiantes universitarios. Nuestro modelo será capaz de recomendar cursos disponibles en sitios web como: Coursera, Udacity, Edx, etc. Para hacer esto, se usaron modelos de tópicos probabilísticos, los cuales fueron usados de la siguiente manera. Por un lado, el modelo de tópico Latent Dirichelet Allocation (LDA) infiere tópicos del contenido dado en los sílabos de cursos de la universidad. Por otro lado, los tópicos son extraídos de los sílabos de cursos en línea (MOOC). Estos dos grupos de tópicos y la información sobre las notas son emparejados usando un sistema de recomendación basado en contenido, de manera que se pueda recomendar cursos en línea relevantes a los estudiantes.

 

GALERIA DE IMÁGENES

 

 

Conclusiones

  • Introducimos un nuevo enfoque para la recomendación de cursos en línea que combina el modelo de tópicos probabilístico LDA y sistemas de recomendación basados en contenido.
  • Momentáneamente usamos un enfoque de aprendizaje de máquina donde LDA permite extraer descriptores de características de los cursos, mientras que la predicción de ratings se halla infiriendo parámetros del perfil del usuario, usando regresión multilineal.
  • Los resultados de los experimentos preliminares muestran que el algoritmo tiene un buen rendimiento comparado con un enfoque similar que usa similaridad de coseno y LDA.
  • Aunque nos hemos enfocado en MOOCS como fuente para la recomendación por contenido, nada nos evita usar este enfoque entro dominio. De hecho, futuros dominios pueden ser incluidos utilizando extracción de características por tópico.
  • En un trabajo futuro se investigará los problemas de escalabilidad. En este sentido, modelos como LDA, tiene versiones escalables disponibles, por ejemplo existe una implementación basada en MapReduce dada por la Librería Apache Mahout. También podemos encontrar versiones escalables de regresión multilineal.

 

ENLACES

 

Phone: +51 054 282700 +51 054 285298
Fax: citec@unsa.edu.pe
Francisco Velasco 125
Parque Industrial de Arequipa