Bemerkung |
Der Kurs führt anhand von Aufgaben wie den in den Lerninhalten angegebenen in die Programmiersprache perl ein. Es werden Konzepte, Programmieransätze, Typen von Aufgaben und Lösungen diskutiert und praktisch erprobt.
Interessierte Studierende können diesen Kurs thematisch mit dem Seminar e-Lexikographie verknüpfen. |
Lerninhalte |
Texte sind online in verschiedenen Formaten verfügbar und oft verschieden enkodiert. Wenn man daraus Daten extrahieren möchte, muss man sie umformatieren, anders kodieren, neue Information (Metadaten) annotieren usw. Das geschieht in der Regel mit Skripten der "String-handling"-Sprachen perl oder python. In diesem Praktikum werden nacheinander einfach linux-shell Befehle zur Textmanipulation, dann shellskripte und am Ende perl-Programme entwickelt, mit denen man automatisch Textsammlungen herstellen kann, auf deren Basis dann z.B sprachwissenschaftliche oder auch andere Forschung ermöglicht wird. Ein besonderer Schwerpunkt im Sommersemester 2015 ist die elektronische Lexikographie, da parallel ein Seminar MSV mit demselben Thema stattfindet. Wir behandeln daher noch die folgenden Fragen: Wie kann man mithilfe von perl Daten für Wörterbucheinträge aus Textsammlungen sammeln? Wie geht man mit Daten ursprünglich gedruckter Wörterbücher um, die nun für das Füllen einer Datenbank aufbereitet werden sollen? |