Der Fokus dieser Lehrveranstaltung liegt auf den computerlinguistischen Verfahren zur Analyse von Texten in sozialen Medien.
Zu Beginn werden wir generell die Besonderheiten dieser Daten (von verschiedenen Quellen, in deutscher und englischer Sprache) und daraus möglicherweise resultierende Schwierigkeiten für maschinelle Sprachverarbeitungen diskutieren. Wir werden gemeinsam aktuelle Forschungsartikel erschließen, in denen Werkzeuge und Verfahren auf diese spezielle Textsorte/Themengebiete angewandt werden.
In diesem Semester liegt der Fokus auf der Analyse von Daten mit Large Language Models (also großen Sprachmodellen, wie z.B. diverse GPT-Modelle). Hier betrachten wir z.B. Methoden für das Prompt Engineering, angewandt im Zero- oder Few-Shot Learning für Textklassifikationen.
Es geht in diesem Seminar nicht darum, solche Methoden zu entwickeln/programmieren, sondern Sie lernen Besonderheiten/Probleme von existierenden Ansätzen zu erkennen und diese zu bewerten. Wir werden uns allerdings schon anschauen, wie man solche Methoden in der Praxis anwendet. In weiterführenden Forschungsarbeiten (z.B. Masterarbeit, Hiwi-job, Doktorandenstelle) können Sie dann Möglichkeiten entwickeln, um diese zu verbessern. |