Studentische Hilfskraft für das Web Data Commons Forschungsprojekt

Immer mehr Webseiten haben damit begonnen strukturierte Daten über Personen, Produkte, Orte und Veranstaltungen innerhalb ihren HTML-Seiten einzubinden und verfügbar zu machen. Das Open Source Projekt Web Data Commons (www.webdatacommons.org) extrahiert diese Daten aus mehreren Milliarden Webseiten und stellt die so gewonnen Daten als Download zur Verfügung. Somit ermöglicht es Web Data Commons jedem, die Daten zu nutzen und mit ihnen zu Arbeiten ohne selbst das ganze Web zu crawlen.

Um auf die ständige Weiterentwicklung im Bereich strukturierter Daten und Auswertungen von WebCrawls zeitnah reagieren zu können sucht der Lehrstuhl Wifo V tatkräftige Unterstützung bei der

  • Weiterentwicklung des WebDataCommons Extraktionsframeworks
  • Analyse der extrahierten Daten

Anforderungen

  • Solide Kenntnisse in Java
  • Erste Erfahrungen mit strukturierten (Web) Daten (RDF(a), Microformats und Microdata)
  • Erfahrungen mit Cloud Computing (AWS) und/oder Web Crawlern sind ein Plus
  • Motivation und Begeisterung sich in neue Themengebiete einzuarbeiten
  • Selbstständiges Arbeiten

Was bieten wir:

  • Flexible Arbeitszeiten
  • Mitarbeit an einem OpenSource Projekt
  • Anwendung von an der Uni Gelerntem in der Praxis
  • Kaffeemaschine am Lehrstuhl ;)

Interessierte senden ihre Bewerbung inkl. Auflistung der IT-Kenntnisse und Erfahrungen sowie einer Notenübersicht an Prof. Dr. Christian Bizer und Robert Meusel.