Projektseminar – Sommersemester 2008
Maik Stührenberg & Ulli Waltinger
| Linguistik B.A., Texttechnologie B.A., Interdisziplinäre Medienwissenschaft, M.A. | 4-6 LP/4 SWS | |
| Mittwoch, 12-16 Uhr, Raum C01-277 | Beginn: 09.04.2008 | |
| Veranstaltungsnummer/Modul: | 230138/BaLinTT4.1/Modul 3, Modul 6 (Wahlpflicht) |
Das Projektseminar knüpft an die Arbeit der Teilprojekte A2 und A4 der DFG-Forschergruppe "Texttechnologische Informationsmodellierung" an und verfolgt zwei Projektziele: die Entwicklung eines webbasierten Fachsprachenlexikons und die Implementierung einer Architektur zur Manipulation multipel annotierter Daten.
Die Projektarbeit soll den Studierenden einen Einblick in die angewandte Computerlinguistik und Texttechnologie gewähren, indem beginnend mit der Materialsammlung, -aufbereitung (Tokenisierung, Lemmatisierung, Filterung) eine auf Wortkokkurrenzen aufbauende Darstellung von Fachsprachen entwickelt wird, die anschließend durch eine Schnittstelle für Benutzer zugänglich gemacht werden soll. Durch die Projektarbeit soll eine Brücke zwischen dem texttechnologischen Wissen und seiner praktischen Anwendung geschlagen werden. Das Projektseminar bietet einen Einstieg in die praktische Linguistik, indem den Studierenden die Möglichkeit gegeben wird, eine praxisorientierte texttechnologische Aufgabe in Gruppenarbeit zu bewältigen.
Das Projektseminar ist in eine Folge von teils aufeinander aufbauenden Teilprojekten gegliedert. Dabei sollen weitestgehend bereits existierende Tools zur Bewältigung der Aufgaben wieder verwendet werden. Programmierarbeit erfordert die Berechnung statistischer Maße. Als Programmiersprachen kommt neben Java auch XSLT zur Verarbeitung XML-annotierte Daten zum Einsatz. Die Teilaufgaben gliedern sich im Einzelnen wie folgt:
- Parsen der Rohdaten (Java/C+)
- Berechnung der Kookkurrenzen und Annotation der Daten (Java/C+/XML/XSLT)
- Modellierung einer Datenbank/eines Repräsentationsformats zur Speicherung der Daten (RDBMS/native XML DBMS/XQuery)
- Erarbeitung von Methoden zur Verarbeitung multipel annotierter Daten
- Visualisierung (PHP/XSLT/XHTML)
In den ersten Sitzungen findet eine Einführung in die Programmiersprache Java statt, in der alle nötigen Grundlagen für die einzelnen Projekte vermittelt werden. Programmierkenntnisse für die Projektarbeit sind nicht zwingend erforderlich. Kenntnisse in den anderen verwendeten Techniken wie XML/XSLT werden bei Bedarf vermittelt. Alle Projektgruppen werden an die Thematik zur Bearbeitung und Lösung der Projektaufgaben herangeführt.
Für den Erwerb eines Leistungsnachweises ist neben der aktiven Teilnahme das erfolgreiche Bearbeiten eines Teilprojekts (in Einzel- oder Gruppenarbeit) nebst zugehöriger Dokumentation erforderlich. Seminarunterlagen und Seminarplan werden in Stud.IP bereit gestellt.
Weitere Veranstaltungen im aktuellen Semester:
Bisher veranstaltete Seminare:
- an der Universität Bielefeld: Auszeichnungssprachen (WiSe 2007/2008) — Hypertext (SoSe 2007) — Auszeichnungssprachen (WiSe 2006/07) — Projektseminar "Texttechnologische Informationsmodellierung" (SoSe 2006)
- an der Justus-Liebig-Universität Gießen): "eLearning in Theorie und Praxis" (SoSe 2004) — "Einführung in die Texttechnologie" (WiSe 2003/04)