Lerninhalte |
In diesem Seminar werden aktuelle Methoden der Sprachtechnologie und der Digital Humanities vorgestellt und praktisch erprobt.
- Wir untersuchen, wie Textdaten für die Computerlinguistisk maschinell aufbereitet werden. Wie kann beispielsweise ein Part of Speech-Tagger wissen, welche Wortart und welche Grundform einem Wort zuzuweisen sind?
- Wir beschäftigen wir uns mit Methoden zur Termextraktion, um einen domänenspezifischen Fachwortschatz aufzubauen.
- Der Kurs behandet, wie über Verfahren der distributionellen Semantik die Bedeutung von Wörtern, Sätzen und Texten gewissermaßen "berechnet" werden kann.
- Darauf aufbauend beschäftigen wir uns mit Verfahren der Textgenerierung (GTP-3) und mit Schreibassistenzsystemen (z. B. Quillbot).
- Schließlich werden Vorgehensweisen der maschinellen Übersetzung vorgestellt.
Die Studienleistung besteht aus vier begleitenden Übungen und einer Präsentation. Eine Prüfungsleistung kann über eine Seminararbeit erbracht werden, worin die Ergebnisse der Abschlusspräsentation ausgearbeitet werden.
|