Gruppe 2: Korpuslinguistik in der Praxis
Am Anfang eines jeden korpuslinguistischen Projekts steht eine wissenschaftliche Fragestellung; das Ziel ist, diese mithilfe empirisch gewonnener Daten beantworten zu können.
Die Sammlung frei verfügbarer textueller Daten, ihre Aufbereitung und Anreicherung mit linguistischen und evtl. weiteren Informationen stehen daher im Mittelpunkt dieses MSV Praktikums, welches das Seminar MSV zur Korpuslinguistik ergänzt (es können gerne beide Lehrveranstaltungen in demselben Semester besucht werden). Desweiteren werden die selbst erstellten Korpora quantitativ im Hinblick auf die Fragestellung untersucht und die gewonnenen Daten zielbezogen ausgewertet.
Gruppe1 : Python for Natural Language Processing (findet im SoSe22 nicht statt)
In diesem Kurs lernen Sie, wie Sie Python für die Textverarbeitung verwenden.Der Kurs ist in zwei Teile gegliedert. Im ersten Teil lernen wir, wie man Daten aus dem Internet herunterlädt und bereinigt, wie man grundlegende statistische Analysen an den verarbeiteten Korpora durchführt, wie man die Ergebnisse in Diagrammen darstellt und wie man einfache Aufgaben der natürlichen Sprachverarbeitung durchführt.Der zweite Teil des Kurses ist der Gruppenarbeit gewidmet: Durchführung einer NLP-Analyse an einem Korpus eigener Wahl und Präsentation der Ergebnisse, kombiniert mit individuellen Kurzberichten der durchgeführten Experimente.
Voraussetzungen: Programmiergrundkenntnisse |