FD-LEX

Forschungsdatenbank Lernertexte

Die webbasierte Datenbank ermöglicht die Recherche in mehreren Korpora, die aus Texten von Lernenden bestehen. Die Korpora stammen aus unterschiedlichen Forschungsprojekten und umfassen insgesamt mehrere tausend Texte in verschiedenen Sprachen, darunter Deutsch, Türkisch und Russisch. Detaillierte Informationen und Dokumente zu den entsprechenden Forschungsprojekten sind in der Datenbank einsehbar oder stehen dort zum Download bereit. Interessierte Wissenschaftlerinnen und Wissenschaftler können die Datenbank nach einer Registrierung kostenfrei nutzen.

FD-LEX ist Teil des Verbunds Forschungsdaten Bildung am DIPF | Leibniz-Institut für Bildungsforschung und Bildungsinformation. Der VerbundFDB betreibt das Onlineportal forschungsdaten-bildung.de, das bildungsbezogene Forschungsdaten standortübergreifend nachweist sowie ein Angebot zur Meldung von Studien und zur Übermittlung von Daten beinhaltet. So können Forschende auch die Daten, die in FD-LEX enthalten sind, über die Verbundsuche finden oder auch Daten aus eigenen Projekten an FD-LEX übermitteln.

Fragen und Antworten

Welche Texte stehen in der Datenbank zur Verfügung?

Die Datenbank beinhaltet insgesamt mehrere tausend Texte von Lernerinnen und Lernern aus verschiedenen Forschungsprojekten. Entsprechend der unterschiedlichen Forschungsdesigns und Fragestellungen der Projekte liegen Texte in verschiedenen Sprachen und von Schülerinnen und Schülern unterschiedlicher Altersgruppen und Schulformen vor. Auch die Textsorten variieren je nach Korpus. Alle Texte werden in transkribierter Form im .pdf-Format und zum Teil auch als Scans der handschriftlichen Originale bereitgestellt.

Aus welchen Projekten/Forschungszusammenhängen stammen die Texte?

Scriptoria-Korpus

Das Scriptoria-Textkorpus umfasst 5.628 Texte von 938 Schülerinnen und Schülern auf Deutsch. Es handelt sich hierbei um Berichts- und Argumentationstexte, die in fünften und neunten Klassen an Gesamtschulen und Gymnasien in Hannover und Köln zwischen den Jahren 2013 und 2015 erhoben wurden. Von den Schülerinnen und Schülern wurden zu drei Messzeitpunkten je zwei Texte geschrieben. Dies geschah im Rahmen des Forschungsprojekts Unterrichtliche Förderung von Teilkomponenten der Schreibkompetenz, einem Verbundvorhaben der Professur für Pädagogische Psychologie an der Leibniz Universität Hannover (Prof. Dr. Grabowski) und der Professur für Deutsche Sprache und ihre Didaktik an der Universität zu Köln (Prof. Dr. Becker-Mrotzek). Dieses war die Weiterführung des Projekts Diagnose und Förderung von Teilkomponenten der Schreibkompetenz.

TSK-Korpus

Das TSK-Korpus umfasst 585 Texte von 39 Schülerinnen und Schülern auf Deutsch. Die Texte stammen aus einer Längsschnittstudie zur Entwicklung der Textkompetenz im Grundschulalter, die an der Universität Siegen durchgeführt wurde. Es wurde anhand von zwei Klassen ermittelt, wie sich die Fähigkeit von Kindern in der 2., 3. und 4. Klasse entwickelt, Texte im Rahmen verschiedener kommunikativer Anforderungen (Textsorten) zu schreiben: Erzählung, Bericht, Instruktion, Beschreibung, Argumentation. Der Erhebungszeitraum lag zwischen den Jahren 2001 und 2003.

SchriFT-Korpus

folgt im Jahr 2022

MEZ-Korpus

folgt im Jahr 2022

Wie können die Daten genutzt werden?

Die Inhalte der Forschungsdatenbank Lernertexte sind grundsätzlich nach Registrierung und Anmeldung frei zugänglich. Jedoch wird die Nutzung der Datenbank ausschließlich für wissenschaftliche Zwecke gestattet. Bei der Registrierung werden die Institution sowie das konkrete Forschungsinteresse abgefragt.
Um missbräuchliche Nutzung der Daten auszuschließen, werden die Registrierungsdaten sowie die Suchanfragen mit Datum, Benutzername und verwendeten Filterkriterien in einem Event-Log gespeichert, zu dem die Administratorinnen und Administratoren der Datenbank Zugriff haben.

Die Nutzerinnen und Nutzer sind dazu angehalten, sich an die Vorgaben der guten wissenschaftlichen Praxis und des Datenschutzes zu halten. Dazu gehört unter anderem, Versuche der De-Anonymisierung zu unterlassen. Die Herausgeber behalten sich vor, die Nutzungsrechte im Einzelfall zu erteilen oder zu widerrufen.

Die Texte liegen für jeden Datensatz in transkribierter Form vor. Ebenso werden die den Texten zugrundeliegenden Schreibimpulse zur Verfügung gestellt. Je nach datenschutzrechtlichen Vorgaben liegen zum Teil auch die Scans der handschriftlichen Texte in der Datenbank vor. Die Schreibimpulse sowie die Scans der handschriftlichen Texte werden dabei nur zur Information bereitgestellt; ihr Abdruck in Publikationen und ihre Verwendung in anderen Forschungszusammenhängen bedarf der expliziten Genehmigung durch die jeweiligen Projektleiterinnen und Projektleiter.

In der Lehre an wissenschaftlichen Hochschulen dürfen die bereitgestellten Materialien mit Verweis auf die geltenden Nutzungsrechte verwendet werden.

Aus den Daten entstandene Publikationen müssen zudem über die Kontaktadresse FD-LEX-MI(at)uni-koeln[dot]de gemeldet werden. Ein Dokument mit Vorgaben für die Meldung von Publikationen liegt auf der Datenbankseite bereit.

Wie werden die Daten zitiert?

Allgemein gilt, dass in Publikationen, in denen Informationen aus der Datenbank FD-LEX genutzt werden, das jeweilige Korpus in der auf FD-LEX genannten Form zitiert werden muss.

Die genaue Zitationsangabe für das jeweilige Korpus ist auf der Datenbank-Website unter dem Reiter Weiteres zu finden.

Wenn Sie auf die Datenbank allgemein verweisen möchten – ohne Bezug auf ein bestimmtes Korpus –, ist die folgende Zitationsangabe zu verwenden:

FD-LEX (2018). Forschungsdatenbank Lernertexte. Herausgegeben von Michael Becker-Mrotzek und Joachim Grabowski. Köln: Mercator-Institut für Sprachförderung und Deutsch als Zweitsprache. Verfügbar unter: fd-lex.uni-koeln.de.

Wie kann in der Datenbank gesucht werden?

Die Daten der einzelnen Korpora lassen sich anhand verschiedener Kriterien filtern. Zu jeder Filtervariable sind kurze Erläuterungen hinterlegt. Filtervariablen sind zum Beispiel Klassenstufe, Sprachbiografie, Textsorte oder Schulform. Hier sehen Sie ein Beispiel der Suchmaske für das Scriptoria-Korpus aus dem Projekt Unterrichtliche Förderung von Teilkomponenten der Schreibkompetenz.

Eine Übersicht über die jeweiligen Filtervariablen, ihre Ausprägung und Erhebung finden Sie unter dem Reiter Weiteres auf der jeweiligen Korpus-Seite der Website von FD-LEX.

Wie können die Suchergebnisse ausgegeben werden?

Beispiel einer Suchanfrage samt der ersten aufgelisteten Treffer

Die Rechercheergebnisse können Sie downloaden und für Ihre eigene Forschung und Lehre nutzen. Die fallbezogenen Daten und Testergebnisse der Suchanfrage können als Excel- und Datentabelle ausgegeben werden, die Lernertexte in transkribierter Form (PDF-Dateien) sowie – falls vorhanden – als Scans der handschriftlichen Originaltexte (PDF-Dateien). Außerdem liegen auch die verwendeten Schreibimpulse zur Ansicht als PDF-Dateien vor.

Bei großen ausgewählten Datenmengen kann der Download der Transkripte und der Originaltexte längere Zeit in Anspruch nehmen. Sie werden in diesem Fall per E-Mail benachrichtigt, sobald die Daten Ihrer Suchanfrage zum Download bereitstehen.

Hier sehen Sie ein Beispiel einer Suchanfrage samt der ersten aufgelisteten Treffer.

Deckblatt

Zu jeder Ausgabe der Suchanfrage gibt es ein Deckblatt, auf dem noch einmal die verwendeten Filterkriterien und die Anzahl der Treffer und die Zitationsangabe aufgelistet sind. Auf den darauffolgenden Seiten stehen dann oben in der Kopfzeile lediglich der Probandencode sowie die Klassenstufe, Gruppe, Schulform, der Messzeitpunkt, die Textsorte und die Anzahl der Wörter im Text, gefolgt vom eigentlichen Text.

Scans der Original-Schülertexte

Auch hier gibt es zu jeder Ausgabe der Suchanfrage ein Deckblatt, auf dem noch einmal die verwendeten Filterkriterien, die Anzahl der Treffer und die Zitationsangabe aufgelistet sind.

Datentabelle

In der Datentabelle finden Sie ausgewählte Meta- und Testdaten zu den Probandinnen und Probanden. Insbesondere enthält die Datentabelle immer auch die Anzahl der Wörter des jeweiligen Textes zu einem Messzeitpunkt. Eine Übersicht über alle Variablen der Datentabelle finden Sie auf der Seite der Datenbank im jeweiligen Korpus-Bereich unter Weiteres bei den Downloads.

Beispiel Transkript

Beispiel Schülertexte

Beispiel Datentabelle

Können noch weitere Textkorpora in die Datenbank aufgenommen werden?

Ja, die Aufnahme weiterer Korpora in FD-LEX ist möglich. Hierfür sind verschiedene inhaltliche und technische Anforderungen zu erfüllen.

Als Anhaltspunkt kann die Collection Policy dienen, die am Ende der Seite unter den Downloads zu finden ist.

Kontaktieren Sie uns bei Fragen und für Absprachen bezüglich der Aufnahme Ihres Datenkorpus gerne über FD-LEX-MI(at)uni-koeln[dot]de.

Auf einen Blick

Kooperationspartner

Institut für Psychologie der Leibniz Universität Hannover

Regionales Rechenzentrum der Universität zu Köln

Verbund Forschungsdaten Bildung

Projektleiter

Prof. Dr. Michael Becker-Mrotzek

Prof. Dr. Joachim Grabowski, Leibniz Universität Hannover

Projektteam

Sabine Hachmeister

Sandra Tietjens

Downloads

Nach oben