Zur alten DWDS-Webseite

Projekte mit Beteiligung des DWDS

1. Partnerprojekte

  • DLex: DLex ist ein von der DFG gefördertes kooperatives Projekt der Universität Potsdam (Allgemeine Psychologie 1 und theoretische Computerlinguistik) und dem DWDS. Die Laufzeit dieses Projekts erstreckt sich von Mai 2008 bis April 2011. Ziel ist die Erstellung einer lexikalischen Datenbank für den Einsatz in der psychologischen und linguistischen Forschung. Es soll die gewöhnlich benutzte, aber veraltete CELEX-Datenbank ersetzen. Neben Frequenzdaten auf superlexikalischer (n-Gramme), sublexikalischer (Morphem- und Silbenabfolge) und lexikalischer Ebene sollen auch speziellere Variablen wie kontextuelle Diversität und orthografische Nachbarschaft erhoben werden. Diese Daten sind für die quantitative Charakterisierung des im Rahmen der Neubearbeitung auszuwählenden Vokabulars relevant.
  • Deutsches Textarchiv: Das deutsche Textarchiv ist ein DFG-gefördertes Projekt am Zentrum Sprache der BBAW. Die Laufzeit der ersten Projektphase ist Juli 2007 bis Juni 2010, die der zweiten Phase Juli 2010 bis Juni 2014. Hauptziel des Projekts ist die digitale Erfassung, Aufbereitung und Erschließung von deutschsprachigen Texten aus dem 17.-19. Jahrhundert. Im Projekt DTA wurden und werden Texte im Umfang von ca. 220.000 Druckseiten digitalisiert und aufbereitet. Die Texte wurden sorgfältig, unter Hinzuziehung von Spezialisten sowie auf der Basis der Ergebnisse einer Umfrage unter den Akademiemitgliedern ausgewählt. Die Auswahl der Texte erfolgte mit dem Ziel, ein ausgewogenes Korpus repräsentativer Texte aus dem genannten Zeitraum zu schaffen. Die Mitnutzung dieses Textkorpus wird den vom DWDS erfassten zeitlichen Bereich des deutschen Wortschatzes erheblich erweitern. Weiterhin ergeben sich Synergieeffekte bei der standardgerechten Erfassung von Metadaten, deren Kodierung für Korpora beider Projekte notwendig ist und sich in beiden Projekten an den Richtlinien der "Text Encoding Initiative" (TEI) orientiert. Außerdem profitiert das DWDS von der gemeinsamen Software-Entwicklung bei der linguistischen Vorverarbeitung (Tokenizing) sowie der "unscharfen" Suche (Graphem-Phonem-Konversion).

2. Aktuelle Projektbeteiligungen / Kooperationen

  • Clarin sowie das deutsche CLARIN-Projekt
  • D-Spin: Ziel des vom BMBF für zunächst drei Jahre geförderten Verbundprojekts D-Spin (Deutsche Sprachressourcen-Infrastruktur) ist der Aufbau einer Forschungsinfrastruktur für Geisteswissenschaften auf nationaler Ebene, in enger Kooperation mit dem durch die EU geförderten Infrastrukturprojekt CLARIN (Common Language Resources and Tools Infrastructure). Es geht in diesem Projekt insbesondere um: a) Etablierung von Servicezentren, die jeweils spezielle Ressourcen und Dienste vorhalten; b) Erfassung der existierenden Ressourcen über ihre Metadaten, die in Katalogen vorgehalten werden; c) Kombinierbarkeit von Ressourcen zu virtuellen Kollektionen; d) Kombinierbarkeit von Ressourcen und sprachtechnologischen Komponenten zu neuen Applikationen. Das Zentrum Sprache der BBAW ist Konsortialpartner. D-Spin eröffnet neben den genannten langfristigen Perspektiven die Gelegenheit, die Ressourcen standardkonform zu machen und Ressourcen und Tools über Webservices leichter und für einen weiteren Benutzerkreis verfügbar zu machen.
  • C4-Korpus
  • LEO: Mit dem Anbieter zweisprachiger Onlinewörterbücher wurde vereinbart, dass von den deutschsprachigen Äquivalenten aus auf die Definitionen im WDG verlinkt wird. Mehr als 20.000 Seitenaufrufe erfolgen von diesem Portal aus täglich auf die DWDS-Plattform.
  • Die ZEIT: Mit der Wochenzeitung Die ZEIT kooperiert das DWDS seit 2005. Die ZEIT setzt seitdem die am DWDS entwickelte Suchmaschine DDC für ihre online-Suche ein . Im Gegenzug erhält das Projekt den tagesaktuellen linguistisch aufbereiteten Index der ZEIT mit momentan ca. 550.000 Artikeln.

3. Beendete Projekte / Kooperationen