Lerninhalte |
In diesem Seminar werden aktuelle Methoden der Sprachtechnologie und der Digital Humanities vorgestellt und praktisch erprobt.
- Wir untersuchen, wie Textdaten für die Computerlinguistisk maschinell aufbereitet werden. Wie kann beispielsweise ein Part of Speech-Tagger wissen, welche Wortart und welche Grundform einem Wort zuzuweisen sind, und wie verlässlich sind die angewendeten Verfahren?
- Wir beschäftigen wir uns mit Methoden zur Termextraktion, um einen domänenspezifischen Fachwortschatz aufzubauen.
- Es wird gezeigt, wie über Verfahren der distributionellen Semantik die Bedeutung von Wörtern, Sätzen und Texten gewissermaßen berechnet werden kann.
- Wir wenden aktuelle Methoden zum maschinellen Lernen (BERT, SBERT) an.
- Schließlich werden Vorgehensweisen der maschinellen Übersetzung vorgestellt.
IIM-Studierende sollen bitte das Seminar 4326 belegen.
Die Studienleistung besteht aus vier begleitenden Übungen und einer Präsentation. Eine Prüfungsleistung kann über eine Seminararbeit erbracht werden, worin die Ergebnisse der Abschlusspräsentation ausgearbeitet werden.
|