MA: Opinion Mining from User-generated Content

(MA Arbeit, Betreuer: Matthias Hartung, Philipp Cimiano)

Wissenschaftliche Publikationen zu aktuellen Studien in der pharmakologischen Forschung werden im World Wide Web mitunter kontrovers diskutiert. Aus der Sicht von Pharmaunternehmen stellen nutzergenerierte Kommentare zu wissenschaftlichen Publikationen daher eine wertvolle Ressource zur Beantwortung folgender Fragestellungen dar: Welche zentralen inhaltlichen Aspekte der Publikation werden von Lesern bzw. unterschiedlichen Lesergruppen in welcher Weise rezipiert? An welchen Stellen besteht weiterer Informationsbedarf? In welcher Weise beeinflusst die Publikation bei Lesern bestehendes Vorwissen oder Einstellungen gegenüber dem beschriebenen Produkt? 

Im Rahmen der Arbeit sollen große Bestände von Nutzerbeiträgen aus dem Web und/oder sozialen Medien extrahiert werden, die zu einer bestimmten wissenschaftlichen Publikation in Bezug stehen. Diese Beiträge sollen mithilfe von Methoden aus der maschinellen Sprachverarbeitung (Topic Modeling, Paraphrase Acquisition, Sentiment Analysis) inhaltlich analysiert werden, sodaß der Abgleich zentraler thematischer Aspekte in beiden Texten sowie die Bestimmung von Einstellungen, Meinungen und Wertungen bzgl. dieser Aspekte möglich wird.

Als Voraussetzungen werden erwartet: Kenntnisse in "Statistical Natural Language Processing", gute Programmierkenntnisse sowie die Fähigkeit zu selbständiger Arbeit. Kontakt