Editor

JLLT edited by Thomas Tinnefeld

Journal of Linguistics and Language Teaching
Volume 1 (2010) Issue 1
pp. 145 - 152


Dlaska, Andrea / Christian Krekeler: Sprachtests. Leistungsbeurteilungen im Fremdsprachenunterricht evaluieren und verbessern. Baltmannsweiler: Schneider Verlag Hohengehren 2009, 195 Seiten (ISBN 978-3-8340-0579-3), 19,00 €.

Die vorliegende Publikation beschäftigt sich mit dem Thema 'Sprachtests' unter Berücksichtigung unterschiedlicher Perspektiven, die nachfolgend anhand der Kapitelüberschriften wiedergegeben werden:
-         Kapitel 1: Testwelten (5ff)
-         Kapitel 2: Qualitätskriterien (33ff),
-         Kapitel 3: Tests zum Lesen (78ff),
-         Kapitel 4: Tests zum Schreiben (95ff)
-         Kapitel 5: Sprachtests mit Fachbezug (120ff) und
-         Kapitel 6: Alternative Leistungsbeurteilungen (136ff)
Schlussbemerkung (174ff), Literatur (176) und Index (191) bilden den Abschluss der Publikation.

Für die Lektüre des Buches – und für seine Bewertung – ist von Bedeutung, dass es sich „sowohl an Praktikerinnen und Praktiker, die Fremdsprachen vermitteln, als auch an Leserinnen und Leser, die sich in der Ausbildung befinden“ (IV) wendet. In der Tat ist es recht allgemein gehalten und erhebt nicht den Anspruch, in die Tiefe zu gehen. Es liefert jedoch einen leicht verständlichen Überblick über den behandelten Themenbereich.

Die Stoßrichtung liegt darin zu untersuchen, „welchen Beitrag Tests im Unterricht zum Lernen leisten; weniger wichtig ist, ob die Ergebnisse der Tests zur Zertifizierung genutzt werden können“ (IV). Es geht hier somit um die Erarbeitung von Qualitätskriterien für speziell auf den Unterricht bezogene Testverfahren, die deren Entwicklung und Evaluierung dienen können. Es geht in der vorliegenden Publikation somit nicht um Testverfahren im Allgemeinen, sondern um solche mit einer ganz spezifischen – unterrichtlichen  Orientierung. Die rezensierte Publikation ist somit nicht im allgemeinen Sinne auf Sprachprüfungen oder Sprachtests ausgerichtet, sondern greift lediglich einen relativ eng begrenzten Teilbereich dieser heraus. Sie ist zudem nicht auf Sprachtests im Besonderen bezogen – also auf solche, die im Sinne der Testtheorie standardisierte Verfahren darstellen -, sondern auf im schulischen Fremdsprachenunterricht verwendbare und verwendete Beurteilungsmethoden. Auf diesem Hintergrund erscheint der Titel – „Sprachtests“ – dem Fachmann auf den ersten Blick irreführend.

Im ersten Kapitel (5ff) werden mehrere „Testwelten“ angesprochen: TestDaf (5f), informelle Minitests wie Zettelarbeiten (6f), computerbasierte Tests (7f), C-Tests (9), Sprachtests für Spätaussiedlerbewerber (9f) und für Kinder (10f). Diese recht heterogen anmutenden Typen von Tests werden anschließend im Sinne von standardisierten und nichtstandardisierten Testverfahren (12), formellen und informellen Testverfahren (12f), konventionellen und alternativen. Leistungsbeurteilungen (13f), im Sinne von Tests und Prüfungen (14f) und des Beurteilens und Bewertens (15) gegeneinander abgegrenzt, wobei für Leistungsbeurteilungen im Unterricht die Standardisierung in moderater Form als Maßstab gesetzt wird (16f). In testmethodischer Hinsicht werden unterschieden: kriteriumsorientierte vs. normorientierte Tests (18f), zentrale vs. dezentrale Testadministration (20), unverbundene und integrierte Aufgabenstellungen (20ff), Performanztests vs. Kompetenztests (24f) und direkte vs. indirekte Tests (25f). Als Testfunktionen werden ausgewiesen: Lernfortschritts- und Kursabschlusstests (27f), Feststellungsprüfungen (28f), Diagnosetests (29), Eignungstests (30), Einstufungstests (30), sowie Zulassungsprüfungen (30f). Wie diese Auflistung und die jeweils in Klammern ausgewiesenen Seitenzahlen deutlich werden lassen, werden alle diese Bereiche recht kurz abgehandelt. Sie vermitteln dem Sprachtestnovizen sicherlich erste Erkenntnisse, dem erfahrenen Sprachlehrer und -prüfer können sie hingegen relativ wenig Neues bieten. Zudem überzeugen die jeweiligen Einteilungen nicht in allen Fällen: Dies gilt beispielsweise für die testmethodische Darstellung, in der Testtypen, die Testadministration und Aufgabenstellungen zusammengruppiert werden. Die erarbeitete Systematik hätte an dieser Stelle also ruhig stringenter sein dürfen. Zudem sind die Aussagen zu den einzelnen behandelten Kategorien recht allgemein gehalten. Dies gilt beispielsweise für die pauschale Ablehnung von C-Tests für die Verwendung im Fremdsprachenunterricht, weil ihnen der Bezug zum Lernen fehle (9).

In sich stringenter sind dagegen die von den Autoren herausgearbeiteten Qualitätskriterien informeller Leistungsbeurteilungen (Kap. 2; 42ff). Als solche identifizieren sie GerechtigkeitRückmeldungAuswirkungen und Aktivität, die ihrerseits jedoch - wie die Autoren selbst ausführen - Überschneidungen aufweisen (75f). Diese Qualitätskriterien werden durch entsprechende Subkriterien näher bestimmt, z B das Qualitätskriterium Gerechtigkeit  durch  TransparenzBewertungReliabilität und Validität (44): Gerechtigkeit in der Leistungsbeurteilung kann demnach durch das Vorhandensein von Transparenz (45f), durch die Art der Bewertung (46f), durch hohe Reliabilität (47ff) sowie durch valide Ergebnisinterpretation (52ff) erzielt werden. Dabei werden Reliabiltät (50) und Validität (53) in entsprechenden Übersichten weiter untergliedert. Diese Übersichten, die Erstellern informeller Leistungstests einen raschen Überblick über die jeweils relevanten Kriterien liefern, werden jedoch nicht für alle Qualitätskriterien (vgl. Auswirkungen (66ff)) bzw. nicht in hinreichend konkreter Form (vgl. Aktivität (71)) vorgelegt, und auch nicht für die entwickelten Subkriterien. Wäre dies geschehen, so hätte die Darstellung für die anvisierte Zielgruppe an Konkretheit und Verwendbarkeit gewonnen. Zudem hätte man sich gewünscht, dass der mögliche Umfang und die möglichen Ausprägungen der Überschneidungen zwischen den einzelnen Kriterien detaillierter erläutert worden wären, als dies tatsächlich geschehen ist (75f): Die Darstellung bleibt hier recht abstrakt und ist auch für Praktiker nur von begrenztem Wert.

In Kapitel drei (78ff) folgt eine Behandlung von Lesevertehenstests, die anhand eines Beispiels aus dem Zertifikat Deutsch exemplifiziert wird, das einen Lesetext in Verbindung mit Multiple-Choice-Aufgaben umfasst. Im Hinblick auf die Reliabilität solcher Tests wird auf die Schwierigkeit verwiesen, geeignete Multiple-Choice-Aufgaben zu erstellen, und davon abgeraten, selbst erstellte Multiple-Choice-Aufgaben zu verwenden (78f), was jedoch - nebenbei bemerkt - in der Schulwirklichkeit eher die Regel als die Ausnahme darstellt. Zu Recht wird in diesem Zusammenhang auf das Problem verwiesen, dass Multiple-Choice-Aufgaben nicht selten auf Grund des Weltwissens der Prüflinge - nicht jedoch auf Grund von deren Textverständnis - korrekt beantwortet werden können, was natürlich nicht wünschenswert ist. Als grundsätzlich problematisch weisen die Autoren die nicht hinreichende Rückmeldung und die mangelnde Gerechtigkeit von Multiple-Choice-Items aus (85ff), wobei erstere sich allein dadurch verbessern ließe, dass Leseverstehenstests als Lernfortschrittstests genutzt würden (87) und letztere dadurch, dass die Anzahl der Items erhöht und die Multiple-Choice-Aufgaben durch offenere Aufgabentypen ersetzt würden (88f).  Es findet hier somit keine eigentliche Analyse von Leseverstehenstests statt, sondern vielmehr eine Kritik an einem gängigen Aufgabentyp - dem Multiple-Choice-Test, der seinerseits natürlich nicht nur mit Leseverstehensaufgaben kombinierbar ist. Lediglich in sehr kurzer Form werden kombinierte Leseverstehenstests (Lesen und Schreiben bzw. Lesen und Sprechen) abgehandelt (92ff). Die Erwartung des Lesers, hilfreiche Hinweise für die Testung des Leseverstehens insgesamt zu erhalten, wird hier somit lediglich partiell erfüllt. 

Mit Blick auf "Tests zum Schreiben" (Kap. 4; 95ff) geben die Autoren zahlreiche Hinweise. Auch diese verbleiben jedoch nicht selten im Allgemeinen. Interessant ist ihre Übersicht  zu den Rückmeldungen zum Schreiben (99), in der mögliche Notationen zu einem gegebenen Fehler aufgelistet werden. Zu bedauern ist, dass von den Autoren keinerlei Hinweise auf wirklich geeignete Rückmeldungsverfahren gegeben werden. Dies gilt beispielsweise ebenso für die von ihnen aufgeworfenen Fragen, ob Fehler gekennzeichnet werden sollen (100ff), ob Kennzeichnungen sich auf alle oder nur auf ausgewählte Fehler beziehen sollen (102f) oder ob eine Positivkorrektur erfolgen soll (103). Die Darstellung ist hier sehr ausgewogen und objektiv, was positiv ist. Für die eigentliche Zielgruppe des Buches -  praktizierende Lehrer und Lehrerinnen und solche, die sich in der Ausbildung befinden -, die sich vielleicht konkrete Hinweise auf oder die Bestätigung bzw. Modifikation ihres eigenen Korrekturverhaltens erhofft, ist diese Form der Darstellung jedoch lediglich von bedingtem Nutzen.

Hinsichtlich der Bewertung von Schreibfertigkeitstests zeigen die Autoren grundlegende Möglichkeiten auf: die ganzheitliche Bewertung (105ff), die systematische oder auch analytische Bewertung mit Berücksichtigung von Inhalt, Sprachrichtigkeit und Sprachkomplexität (108ff) - in deren Rahmen sie den Ansatz des Fehlerprozentsatzes gegenüber demjenigen des Fehlerquotienten zu bevorzugen scheinen - und die Bewertung mittels eines Computerprogramms (110f). Auch hier ist ihr Ansatz jedoch eher derjenige, eine distanzierte Darstellung der sich bietenden Möglichkeiten zu geben, als konkrete Hinweise zu formulieren oder klare Entscheidungen zugunsten der einen oder der anderen Methode zu treffen.

Der Versuch, Chancen der Verbesserung von Schreibaufgaben aufzuzeigen (112ff), ist dagegen überzeugender. Der Ansatz der ausführlichen Kommentierung der Leistung des Prüflings durch den Prüfer (112ff), der zu begrüßen ist, scheitert in der Praxis jedoch in aller Regel an dem dafür benötigten, erheblichen Zeitaufwand. Anschaulich ist auch die Exemplifizierung einer Schreibaufgabe mit unterschiedlicher Vorstrukturierung (114ff), die Prüfern entsprechende Variationsmöglichkeiten aufzeigt. Wegen der nicht ausreichenden technischen Ausstattung vieler Schulen und Hochschulen als gegenwärtig noch unrealistisch muss hingegen der Vorschlag gewertet werden, Schreibfertigkeitsprüfungen direkt am Computer durchführen zu lassen, und ebenso die indirekt formulierte Anregung, zu diesem Zwecke die gesamte Infrastruktur an Hilfsmitteln, die moderne Textverarbeitungsprogramme beinhalten, zuzulassen (117).

Im Rahmen der Behandlung fachsprachlich orientierter Tests (Kap. 5; 120ff) werden anschauliche Beispiele zu allen vier grundlegenden sprachlichen Fertigkeiten für einen Test mit geringem (124ff) und einen Test mit ausgeprägtem (126ff) Fachbezug gegeben und im Anschluss relativ detailliert ausgewertet (130ff). Recht gegeben werden kann den Autoren in ihrer Einschätzung, dass fachbezogene Sprachtests die kombinierte Prüfung der sprachlichen Fertigkeiten fördern, einen hohen Realitätsbezug aufweisen und ein hohes Motivationspotential mit sich bringen (135).

Im Rahmen des Kapitels "Alternative Leistungsbeurteilungen" (136ff) werden drei prinzipiell miteinander kombinierbare Verfahren vorgestellt. Zunächst wird das Verfahren Selbstbeurteilung (139ff) behandelt, das am Schreiben und Sprechen exemplifiziert wird und dem von den Autoren - trotz seiner grundsätzlichen Ungenauigkeit - im Konzert mit anderen Testverfahren ein Platz im Fremdsprachenunterricht eingeräumt wird (150). Als ein weiteres alternatives Verfahren wird die Beurteilung durch die Lernergruppe (151ff) dargestellt, das anhand des Prüfungstyps Präsentation veranschaulicht wird, jedoch wegen der prinzipiell wechselnden Lerner- und somit auch Beurteilergruppen nicht für eine durchgängige Verwendung empfohlen wird (156). Schließlich wird das Beurteilungsverfahren Portfolio (163ff) behandelt. wobei je ein Beispiel aus dem Sprachenportfolio für Grundschüler (165f) und ein Nachrichten-Portfolio (= Hören einer Nachricht und Zusammenfassung dieser) (166f) herangezogen werden. Obwohl das Portfolio als Weg zur Leistungsermittlung hier mitberücksichtigt wird, stellen die Autoren zu Recht fest, dass es in erster Linie auf Kreativität und Individualität abzielt und sich somit letztlich dem Bewertungsgedanken entzieht (172). 

Insgesamt ist festzuhalten, dass die vorgelegte Publikation durch ein grundlegendes Problem gekennzeichnet ist, das die Autoren in ihren Schlussbemerkungen prägnant hervorheben:

Bei den in diesem Buch diskutierten Verfahren ist die Grenze zwischen Tests und Übungen nicht immer klar zu ziehen. (174)

Dieser, den Autoren somit durchaus bewusste Gesichtspunkt lässt die Lektüre an einigen Stellen unzugänglicher als nötig erscheinen, so beispielsweise bei dem alternativen Verfahren Selbstbewertung, das naturgemäß keinen Platz im Kanon der notenorientierten Leistungbeurteilung haben kann. Eine klarere Abgrenzung zwischen der Leistungsbeurteilung  im Rahmen von Prüfungen einerseits und einer Leistungsbeurteilung zur Förderung des Lernens im Rahmen des Fremdsprachenunterrichts andererseits hätte dem Buch gut getan, jedoch zugleich den Intentionen der Autoren widersprochen. Aus diesem Grunde muss die von ihnen gewählte Stoßrichtung akzeptiert werden.

Beizupflichten ist den Autoren dagegen, wenn sie die Bedeutung der und den Glauben an die standardisierten Testverfahren relativieren:

Auch in Zeiten, in denen standardisierten Tests eine große Bedeutung beigemessen wird, sollten die besonderen Qualitäten informeller und alternativer Leistungsbeurteilungen nicht vernachlässigt werden. (174)

Diese Feststellung gilt aus unserer Sicht besonders für die informellen Bewertungsverfahren.
Insgesamt haben die Autoren - trotz aller hier geäußerten Kritik - eine lesenswerte Publikation vorgelegt, die durch ihre zahlreichen, anschaulichen Graphiken und Übersichten besticht und besonders den mit geringer bis mittlerer Erfahrung ausgestatteten Fremdsprachenlehrern eine erste Orientierung hinsichtlich der Identifikation und Einschätzung der gegebenen Bewertungsverfahren geben kann. Dabei können die weitgehend auf das Deutsche als Fremdsprache bezogenen Ausführungen in aller Regel mehr oder minder unproblematisch auf die in Deutschland gängig gelehrten Fremdsprachen übertragen werden. Der informierte Leser hätte sich dabei jedoch an vielen Stellen außer der reinen Darstellung eine weitergehende Analyse gewünscht, wodurch dann auch die Chance bestanden hätte, einen Beitrag zu der Weiterentwicklung fremdsprachlicher Prüfungen zu leisten.




Adresse des Verfassers:

Prof. Dr. Thomas Tinnefeld
Hochschule für Technik und Wirtschaft (HTW) des Saarlandes
Fakultät für Wirtschaftswissenschaften
Lehrstuhl für Angewandte Sprachen
Campus Rotenbühl
Waldhausweg 14
66123 Saarbrücken
E-Mail: thomas_tinnefeld@htw-saarland.de