Lehr- und Forschungseinheit für Programmier- und Modellierungssprachen, Institut für Informatik
print

Sprachumschaltung

Navigationspfad


Inhaltsbereich

Datenanalyse für "Massive Open Online Course" (Master-­ oder Bachelor-Studienarbeit) - bereits vergeben

18.02.2016

Im Rahmen der angebotenen Studienarbeit soll eine Clusteranalyse für "Massive Open Online Course" (MOOCs) durchgeführt werden. Dabei sollte die Textbeschreibungen von MOOC-Kursen von allen bekannten MOOC-Anbietern automatisch mittels eines Crawlers gesammelt werden. Basierend auf den gesammelten Daten sollen die MOOC-Kurse anhand von Kursbeschreibungen mittels eines "unsupervised learning algorithmus" nach Cluster untersucht werden. Die Cluster-Informationen dienen dazu, weitere wissenschaftliche Fragen im Bereich Learning Analytics zu untersuchen.

Ihre Aufgaben:

  • Einarbeiten in Apache Solr, Apache Spark und Apache Hadoop
  • Planung und Konzeption der Integration von verschiedenen Systemen.
  • Implementierung der automatisierten Text-Analyse mit "unsupervised learning algorithmen"

Wir bieten:

  • Software-Entwicklung und Datenanalyse in der Praxis (kennen-)lernen
  • Die weit verbreitete Open Source Suchplattform Apache Solr erlernen
  • Die weit verbreitete Open Source Analyseplattform Apache Spark erlernen
  • Kreatives Arbeiten im aktuellen Forschungsumfeld

Voraussetzungen:

  • Programmierung und Softwareentwicklung in Java oder Python
  • Kenntnisse (oder Bereitschaft zu lernen) in XML, Reguläre Ausdrücke und Bash-­Scripting
  • Kenntnisse (oder Bereitschaft zu lernen) in Data Mining und Big Data 
    (vgl. die Vorlesungen "Knowledge Discovery in Databases" und "Big Data Tools")
  • Spaß am Lernen
  • Interesse an Machine Learning und Datenanalyse

Zeiten:

  • Anfang im März - April 2016

Dauer:

  • 6 Monate in Vollzeit für eine Master-Studienarbeit
  • 3 Monate in Vollzeit für eine Bachelor-Studienarbeit

Kontaktpersonen und Betreuer:  Prof. François Bry, Yingding Wang