Volume 5 (2014) Issue 1
Modell
zur Entwicklung von Rettungsmechanismen für Sprachlernprogramme —
am Beispiel von Systemfehlschlägen bei der Spracherkennung
Shing-lung
Chen陳欣蓉
(Kaohsiung, Taiwan)
Abstract
(English)
Since
communication in conventional language teaching usually only takes
place between the classroom interlocutors (learners and instructors),
learners usually have little opportunity and time to practice
communication in the foreign language. Therefore, language learning
programmes that help learners practice and improve foreign language
communication outside of class are urgently needed. Modern language
learning programmes are typically based on the development of speech
recognition techniques for the correct decoding of users' utterances.
They are usually based on a linear rather than a circular model, and
therefore proceed according to this particular linear structure,
which is not able to take potential system failures into account. As
a consequence, the programmes can, in the event of a communication
failure, not proceed with the communication, and thus, the
communication process is interrupted. Learners may soon lose interest
in the use of that particular programme. Based on the description of
these facts, it can be shown that a language learning programme solely
based on speech recognition techniques, does not fulfill learners'
needs. The present article examines which inherent potential failures
language learning programmes have and how these failures can be reduced
or eliminated so that the programmes will run smoothly.
Keywords:
software, language learning programme, computer programme, programme,
system failure, rescue model, rescue measure, Learning system design, failure
Abstract
(Deutsch)
Da
die Kommunikation im konventionellen Sprachunterricht meist nur
zwischen den Teilnehmern (Lernern und Dozenten) erfolgt, bleibt
Lernern in der Regel kaum Gelegenheit und auch wenig Zeit zur
Einübung fremdsprachlicher Kommunikation. Daher werden dringend
Sprachlernprogramme benötigt, mit deren Hilfe die Lerner die
fremdsprachliche Kommunikation fern des Unterrichts am Computer
praktizieren und verbessern können. Moderne Sprachlernprogramme
orientieren sich in der Regel an der Entwicklung von
Spracherkennungstechniken zur korrekten Dekodierung der Äußerungen
der Anwender. Da Sprachlernprogramme statt auf einem zirkulären
meist auf einem linearen Modells basieren, verlaufen sie gemäß
einer bestimmten linearen Struktur, die nicht in der Lage ist,
potentielle Systemfehlschläge zu berücksichtigen. So können die
Programme im Falle eines kommunikativen Misserfolgs nicht weiter
kommunizieren, und folglich wird der Kommunikationsablauf
unterbrochen. Entsprechend verlieren die Lerner das Interesse an
derartigen Programmen. Aus der Beschreibung dieser Konstellation wird
ersichtlich, dass ein Sprachlernprogramm, das einzig und allein auf
Spracherkennungstechniken basiert, nicht den Bedürfnissen der Lerner
gerecht wird. In dem vorliegenden Artikel wird untersucht, welches
Misserfolgspotential Sprachlernprogrammen inhärent ist und wie
dieses verringert bzw. behoben werden kann, damit die Programme
reibungslos funktionieren.
Stichwörter:
Software, Sprachlernprogramm, Computerprogramm, Programm,
Systemfehlschlag, Rettungsmodell, Rettungsmaßnahme, Design des
Lernsystems, Misserfolg
1
Einleitung
Obwohl
das Fremdsprachenlernen darauf abzielt, in der gelernten
Fremdsprache kommunizieren zu können, haben Lerner im Unterricht
leider meist wenig Gelegenheit und Zeit, Kommunikation einzuüben.
Aus diesem Grunde werden dringend Sprachlernprogramme benötigt, die
die Lerner dazu befähigen, die gelernte Fremdsprache ohne Scheu am
Computer anzuwenden und die fremdsprachliche Kommunikation zu
praktizieren. Vorhandene Programme gründen meist auf
Spracherkennungstechniken zur Entschlüsselung der Sprache der
Lerner. Derzeit ist die Technik der Spracherkennung noch nicht in
der Lage, jede Äußerung des Lerners problemlos zu dekodieren. Aus
diesem Grund benötigt ein Programm zusätzliche Lösungsansätze
zur besseren Analyse der Lernersprache. Nur durch eine solche kann
ein Programm trotz potentieller Systemfehlschläge fortgesetzt
funktionieren.
Die
vorhandenen Lernprogramme laufen meist nach einem linearen Modell
ab, in dem die auftretenden Probleme oder Systemfehlschläge weder
berücksichtigt noch behandelt werden. Dies führt dazu, dass die
Kommunikation zwischen Sprachlernprogramm und Lerner unterbrochen
wird. Das Programm benötigt daher entsprechende Rettungsmaßnahmen,
damit es fließend und vollständig funktionieren kann. In dem
vorliegenden Artikel wird statt eines linearen Systems ein
zirkuläres System entwickelt, das trotz potentieller Misserfolge
fortgesetzt funktionieren kann.
Die
derzeitige Forschung fokussiert mehrheitlich darauf, die
Spracherkennungstechnik zu verbessern und somit die Äußerungen der
Lerner besser zu dekodieren (z.B. Chang & Glass 2011, Dehak,
Torres-Carrasquillo, Reynolds & Dehak 2011, Zue 1985). Weitere
Ansätze zur Analyse potentieller Fehlschläge und entsprechender
Reaktionsmöglichkeiten eines Computerprogramms fehlen zur Zeit
noch. Im vorliegenden Artikel wird daher untersucht, wie ein
Programm - bei allen vorhandenen Einschränkungen der
Spracherkennungstechnik – die Äußerungen der Lerner anhand von
Rettungsmaßnahmen dennoch dekodieren kann.
Da
Lernprogramme aus verschiedenen Gründen unterbrochen werden, sind
die folgenden Fragestellungen von Bedeutung:
(1) Wie
soll ein Programm reagieren, wenn es die Äußerungen des Lerners
nicht erkennen kann?
(2) Wie
soll ein Programm reagieren, wenn der Lerner die Frage des Programms
nicht beantwortet bzw. das Programm keine Reaktion des Lerners
erhält?
Ziel
des vorliegenden Artikels ist es, ein zirkuläres Modell zu
entwickeln, das entspreche Rettungsmaßnahmen zur Behebung der
genannten Probleme bereithält.
2
Stand der Forschung
Im
Folgenden wird zunächst die auf dem Markt erhältliche Lernsoftware
analysiert und ihre Reaktion auf Fehlschläge untersucht. Es
schließt sich eine Analyse der existierenden Fachliteratur an.
2.1
Aktuelle Lernsoftware
Im
Allgemeinen lassen sich bei Sprachlernprogrammen die folgenden
Reaktionsschemata unterscheiden:
- Beim Systemfehlschlag wartet das System, bis der Lerner eine richtige Antwort gibt. Ein Beispiel dafür ist MyET (http://www.myet.com.tw):
Falls
das Sprachlernprogramm die Äußerungen des Lerners nicht erkennt
oder der Lerner nicht antwortet, wartet es auf dessen Reaktion oder
darauf, dass der Lerner das Programm schließt.
- Die Software wartet eine vorgeschriebene Zeit und läuft dann gemäß dem vorgeschriebenen Plan weiter. Ein Beispiel ist die deutsche Version des Programms Tell me more (2006). Im Programm erscheint der Hinweis:
Befolgen Sie die Anweisungen im Spracherkennungsfeld am oberen Bildschirmrand...Machen Sie keine Pause innerhalb Ihrer Antworten. Sobald eine Pause eintritt, geht TELL ME MORE davon aus, dass der Satz beendet ist... Sie verfügen über 5 Sekunden Sprechzeit. Längere Sätze müssen Sie deshalb relativ schnell sprechen. (Tell me more 2006)
Aus
dem Hinweis lässt sich ersehen, dass das oben genannte Programm mit
der nächsten Handlung anfängt (wie z. B. mit der Bewertung), falls
der Lerner eine Pause macht. Dies bedeutet, dass das Programm im
Falle eines Misserfolgs - wie z.B. einer unterlassenen Reaktion des
Lerners - während einer vorgegebenen Zeit mit der nächsten
Handlung weiterläuft.
- Manche Lernprogramme eröffnen dem Lerner - wenn dessen Äußerungen weder empfangen noch erkennen können - dreimal die Möglichkeit, eine Antwort zu geben. Falls es dreimal zu Fehlern kommt, schließt das Programm automatisch (wie z.B. Just talk 1999).
Falls
das Sprachlernprogramm die Äußerung des Lerners nicht dekodieren
kann, bittet es mittels geplanter Äußerungen wie „Pardon“, „I
don’t understand what you are saying“, „please say it one more
time“ um Wiederholung (Handbook Just talk 1999 : 18). Dabei
hat der Lerner nur dreimal die Möglichkeit, die Kommunikation zu
retten. Nach drei Fehlschlägen unterbricht das Programm die
Kommunikation ab und schließt.
2.2
Literatur zu Sprachlernprogrammen
Da
Systemfehlschläge von Sprachlernprogrammen in der Fachliteratur
kaum behandelt werden, gehen wir hier auf solche Software ein, die
im Forschungslabor entwickelt worden ist. Im Mittelpunkt der Analyse
steht dabei, welche Art von Systemfehlschlägen bei dieser Software
vorkommt. Im Folgenden sollen die aktuellen Modelle aus dem
Forschungslabor im Mittelpunkt stehen:
2.2.1 Software mit
Frage-Antwort - Modell
Das
aktuelle Softwaremodell basiert darauf, dass im Datenkorpus die
Kategorie Fragen in
den Konversationsübungen
mit deren Antworten
verbunden sind. Wenn das Programm die Fragen der Lerner im
Datenkorpus findet, kann es sie beantworten.
Dieses
Modell findet bei vielen Robotern Anwendung. Falls der Roboter die
Fragen der Kunden im Datenkorpus findet, werden die Antworten
angegeben, als ob er die Fragen der Kunden beantworten könnte. Ein
authentischer Beleg dafür ist, dass Roboter beispielsweise in
Krankenhäusern in der Lage sind, Routinefragen
von Patienten zu beantworten,
also beispielsweise Fragen danach, wo
der Operationsssal, wo die Kasse oder wo die Toilette ist1.
Wenn der Roboter die die
Fragen von Kunden oder Patienten im Datenkorpus findet, kann er die
vorgeschriebenen Antworten wiedergeben. Kann der Roboter die
entsprechenden Fragen im Datenkorpus jedoch nicht finden, schlägt
die Kommunikation fehl.
Litman
& Silliman (2004) versuchten, den Computer in die Lage zu versetzen,
die Fragen des Lerners zu beantworten. Zu diesem Zweck sammelten sie
in authentischen Situationen vorkommende Fragen und potentiell
passende Antworten. Das von ihnen entwickelte Programm heißt
"Itspoke“ und ist ein Tutor-Programm, das Studierenden hilft,
Begriffe der Physik besser zu verstehen. Beim Aufbau des
Datenkorpus‘ stellt die Software zu einem bestimmten Begriff der
Physik eine Reihe häufig vorkommender Fragen der Studierenden an
die Computer-Tutoren. Die Antworten der Tutoren werden dann mit den
gestellten Fragen verbunden. Schließlich ist die Software in der
Lage, sämtliche Fragen zu Begriffen der Physik zu beantworten.
Viele Lernprogramme bauen ihr Datenkorpus auf textorientierter
Kommunikation auf. Dabei fehlen jedoch Eigenschaften oder auch
emotionellen Ausdrücke der mündlichen Kommunikation. Litman
& Silliman erklären, warum
sie mündliche Erklärungen sammeln, aber keine schriftlichen:
The development of computational tutorial dialogue systems has become more and more prevalent (Aleven and Rose, 2003), as one method of attempting to close the performance gap between human and computer tutors. While many such systems have yielded successful evaluations with students, most are currently text-based (Evens et al., 2001; Aleven et al., 2001; Zinn et al., 2002; Van- Lehn et al., 2002). There is reason to believe that speech-based tutorial dialogue systems could be even more effective. Spontaneous self-explanation by students improves learning gains during human-human tutoring (Chi et al., 1994), and spontaneous self-explanation occurs more frequently in spoken tutoring than in text-based tutoring (Hausmann and Chi, 2002). (2004: 233)2
Solch
ein Programm birgt aber auch die Gefahr,
nicht weiter zu funktionieren, wenn es die Frage des Lerners im
Datenkorpus nicht auffinden kann. Der Mechanismus kann
nur dann die jeweilige Antwort liefern, wenn er die Frage des
Gesprächspartners mit der dafür vorgesehenen
Antwort im Datenkorpus findet. In diesem Fall erkennt das
Programm jedoch nicht die Bedeutung der Frage des
Gesprächspartners.
Im Folgenden wird auf
die Frage eingegangen, wie Programme dazu befähigt werden können,
die Äußerungen der Lerner inhaltlich zu dekodieren und sie darüber
hinaus im Zusammenhang der gesamten Konversation zu erkennen.
2.2.2
Lernsoftware mit Dekodierung der Lerneräußerungen hinsichtlich
ihres Bedeutungsgehalts
Die
Äußerungen von Lernern können mittels eines Sprachdatenkorpus und
der Spracherkennungstechnik nur auf der Ebene der
Oberflächenstruktur, nicht jedoch auf der Bedeutungsebene dekodiert
werden. Um die Bedeutung einer gegebenen Äußerung zu
interpretieren, muss aber in der Regel die Äußerungsabsicht
des Lerners zunächst erkannt werden. Daraus ergibt sich, dass die
Dekodierung der Kommunikationsabsicht
viel wichtiger ist als die Dekodierung der einzelnen Äußerungen
auf inhaltlicher Ebene.
Im
Folgenden werden drei verschiedene Softwaremodelle vorgestellt, die
den Sinn der Lerneräußerungen zu dekodieren versuchen.
Seneff
& Polifroni
(2000)
und Seneff (2002) entwickelten ein Konversationprogramm mit dem
Namen "Mercury Flight Reservation System" zum Zwecke der
Verwendung für die Buchung von Flügen. Dieses Lernprogramm soll
beim Benutzer so lange nachfragen, bis es alle benötigten
Informationen gesammelt hat, um geeignete Flugangebote für ihn als
Kunden finden zu können. Dazu
Seneff:
The MERCURY system (Seneff & Polifroni, 2000a), which provides information about flights available for over 500 cities worldwide, is our most sophisticated system to date in terms of its dialogue model. We have invested considerable effort into making MERCURY intuitive to use and robust in handling a wide range of different ways users might express their flight constraints and select the flights of the itinerary. Our goal in doing this research was to demonstrate that, given the current constraints on the state of the art in telephone-based speech understanding, it is possible to design a telephone-access spoken dialogue system that people would be willing to use to plan their air travel. (2002: 284)
Dabei
sucht die Software anhand der Information des Benutzers die
entsprechenden Flugangebote heraus. Bei der Flugbuchung ist es
notwendig zu erfahren, wohin, wann, mit welcher Fluggesellschaft der
Gesprächspartner fliegen möchte. Auf diesem Hintergrund stellt das
Lernprogramm Fragen an den Benutzer, damit es mittels seiner
Antworten die benötigten Informationen sammeln und somit die
vorausgegangenen Äußerungen des Benutzers richtig dekodieren kann.
Versteht das Programm beispielsweise nicht, zu welchem Zeitpunkt der
Benutzer abfliegen möchte, dann stellt es die entsprechende Frage
(z. B. „Wann wollen Sie fliegen?“), um die benötigte
Information zu erhalten.
Chen
entwickelte im Jahre 2009 das Modell eines
Sprachlernprogramms, das im Datenkorpus die
Kommunikationssituation mit dem jeweiligen Kommunikationsschritt
sowie den entsprechenden Fragen und
dazugehörigen Antworten als
eine Verhältnisgruppe aufbaut. Dieses
Programm kann anhand der Äußerung des
Lerners erkennen, in welcher Situation dieser sich befindet, und ihm
die benötigten Sätze für die jeweilige
Kommunikation anbieten, wenn dieser
selbständig nicht weiterkommt.
Im
Folgenden soll nun am Beispiel einer Einkaufssituation dargestellt
werden, wie die Verhältnisgruppen aufgebaut sind. Beim Aufbau der
Verhältnisgruppen wird zunächst festgestellt, welche
Kommunikationsschritte die jeweilige Kommunikationssituation
enthält: Entsprechend eines Handlungsmusters kann die Kommunikation
in verschiedene Kommunikationsschritte eingeteilt werden. Eine
Einkaufskommunikation wird z. B. in die folgenden Schritte
untergliedert:
(1) Feststellung des Angebotes(2) Vergleich verschiedener ähnlicher Angebote(3) Feststellung des Preises(4) Vergleich des Preises mit dem Wert des Angebotes (eventuell Feilschen bzw. Aushandeln des Preises)(5) Realisierung der Bezahlung(6) Entscheidung für oder gegen den Erwerb der Ware. (vgl. Chen 2009: 105)
Anschließend
werden unter jedem Kommunikationsschritt die entsprechenden Fragen
mit den dazugehörigen Antworten gesammelt:
Einkaufssituation
|
||
Kommunikationsschritt
|
Fragen
(Beispiele)
|
Antworten
(Beispiele)
|
A.
Feststellung des
Angebotes
|
Haben
Sie Äpfel?
Wo
sind die Äpfel?
Ich
hätte gern Äpfel.
|
Hier
sind die Äpfel.
Hier
bitte
Wir
haben leider keine mehr.
|
B.
Vergleich verschiedener
ähnlicher
Angebote
|
Haben
Sie andere Sorten?
Gibt
es Äpfel aus anderen Ländern?
|
Hier
sind Äpfel aus Tokio und aus Soul.
Hier
sind Äpfel aus Griechenland, aus Korea und aus Japan.
|
C.
Feststellung des Preises
|
Wie
viel kostet ein Kilo Äpfel?
Wie
teuer ist ein Apfel?
|
Ein
Kilo Äpfel kostet drei Euro.
Ein
Apfel 50 Cent.
|
D.
Vergleich des Preises
mit dem Wert des
Angebotes
(eventuell Feilschen
bzw.
Aushandeln des
Preises)
|
Gibt
es noch billigere Äpfel?
Haben
Sie noch andere, billigere Äpfel?
Bekomme
ich Rabatt?
|
Die
Äpfel aus Griechenland sind
billig.
Mit
dem Preis kann ich leider nicht heruntergehen.
|
E.
Realisierung der
Bezahlung
|
Kann
ich mit US-Dollar bezahlen?
|
Nein,
wir nehmen nur Euro.
Ja,
gern.
|
F.
Entscheidung für oder
gegen den Erwerb der
Ware
|
Ich
nehme ein Kilo Äpfel.
Geben
Sie mir bitte ein Kilo Äpfel.
|
Gern.
Moment.
Ich werde das sofort erledigen.
Hier
sind Ihre Äpfel.
|
Abb.
1: Kommunikationsschritte mit Fragen und Antworten (Chen 2010: 46f)
Im
Datenkorpus werden jede Kommunikationssituation mit dem jeweiligen
Kommunikationsschritt und sowie dessen Fragen mit den dazugehörigen
Antworten kombiniert. Das Lernprogramm erkennt an den Äußerungen,
an welcher Stelle der Kommunikation sich der Lerner befindet. An der
Äußerung “Haben Sie Äpfel?“, erkennt es, dass der Lerner sich
in der Einkaufs-Kommunikation befindet und zwar beim
Kommunikationsschritt „Feststellung des Angebotes“.3
Im Datenkorpus werden unter der Kommunikationssituation Einkaufen
und dem Kommunikationsschritt Feststellung
des Preises,
die Frage „Wie viel kostet ein Kilo Äpfel?“ und die dazu
gehörige Antwort „Ein Kilo Äpfel kostet drei Euro“ als eine
Verhältnisgruppe gewertet. Damit kann das Lernprogramm während der
Kommunikation anhand der Äußerung des Lerners „Wie viel kostet
ein Kilo Äpfel?“ erkennen, dass der Lerner bei der Kommunikation
Einkaufen
und beim Kommunikationsschritt Feststellung
des Preises
ist. Da im Datenkorpus jede Frage mit ihrer Antwort verbunden ist,
beantwortet das Programm die Fragen des Lerners. Außerdem kann es
an der Reihenfolge der Kommunikationsschritte derselben
Konversationssituation erkennen, wie die Kommunikation weiterlaufen
soll (vgl. Abb. 1). Falls der Lerner nicht weiß, wie er weiter
kommunizieren soll, kann das Programm ihm die entsprechenden Sätze
des Kommunikationsschrittes anbieten, so dass er weiter
kommunizieren kann. Sollte der Lerner nach der Feststellung des
Preises aber nicht weiter wissen, bietet das Programm ihm die Sätze
des nächsten Kommunikationsschrittes (Vergleich
des Preises mit dem Wert des Angebotes“)
an, wie z. B.
„Gibt es noch billigere Äpfel? “„Haben Sie noch andere billigere Äpfel? “„Bekomme ich Rabatt? “
Im
Folgenden wollen wir darauf eingehen, bei welchen Systemfehlschlägen
die obigen Lernprogramme nicht funktionieren. Seneff entwickelte im
Jahre 2002 ein Modell, das mit Hilfe von W-Fragen den
Kommunikationszweck des Lerners zu dekodieren versucht. Das Programm
kann nur einseitig die geplanten Informationen sammeln, um den
Kommunikationszweck der Lerner zu erschließen. Wenn es dagegen um
komplizierte Handlungen geht - wie z.B. den Austausch von Waren
oder das Verhandeln des Kaufpreises -, bei denen das Programm aus
der Information keine Absicht des Lerners erschließen kann,
funktioniert es nicht komplikationslos.
Um
diesem Problem abzuhelfen, teilt Chen (2009) anhand der
Handlungstheorie die Kommunikation in einzelne
Kommunikationsschritte ein. Unter jedem Kommunikationsschritt
findet sich die Verhältnisgruppe Fragen mit den dazu gehörigen
Antworten, die sprachlich den Kommunikationsschritt realisieren.
Somit kann die Software anhand der Äußerung des Lerners erkennen,
in welcher Kommunikationssituation und bei welchem
Kommunikationsschritt er sich befindet. Das System integriert also
die Struktur des gesamten Konversationsablaufs, und da unter jedem
Kommunikationsschritt Fragen mit den dazu gehörigen
Antwortvarianten zu finden sind, kann das Programm dem Lerner die
Kommunikationssätze des nächsten Kommunikationsschrittes anbieten,
so dass der Lerner die Kommunikation fortsetzen kann.
Aus
der obigen Analyse wird ersichtlich, dass die aktuellen
Sprachlernprogramme die Fragen mit dazu gehörigen Antworten im
Sprachdatenkorpus sammeln. Wenn das System die Fragen der Lerner im
Datenkorpus findet, kann es sie beantworten. Aber selbst wenn
ein Programm die Fragen des Lerners
beantwortet, handelt es sich dabei - meist - nur
um einen Mechanismus, der die mit der Frage verbundene Antwort
angibt: Es scheint nur so, als könne
das Programm den Lerner verstehen.
Tatsächlich kann es die Fragen der Lerner
inhaltlich jedoch nicht
interpretieren. Um den Sinn
der Lerneräußerungen zu verstehen, braucht das Sprachlernprogramm
noch ein weiteres Modell.
Im
Folgenden soll auf Rettungsmaßnahmen
eingegangen werden, die die Software befähigen, den
Kommunikationszweck der Lerner bei kommunikativem Misserfolg zu
dekodieren.
3
Entwicklung von Rettungsmechanismen zur Vermeidung von
Systemfehlschlägen
Im
Folgenden soll statt eines linearen Systems ein zirkuläres
entwickelt werden, das eine ungeplante Unterbrechung des Systems zu
vermeiden hilft. Zur Entwicklung eines zirkulären Systems werden
zunächst die in den Lernprogrammen vorkommenden Systemfehlschläge
gesammelt und analysiert. Danach wird versucht, Rettungsmechanismen
zu entwickeln, damit die Programme trotz der Systemfehlschläge
weiter funktionieren können.
In
dem vorliegenden Artikel geht es nicht nur darum,
programmsystematisch bedingte Fehlschläge zu beseitigen, sondern
vielmehr auch die Software darin zu unterstützen, die
Kommunikationsabsicht des Lerners zu erkennen. Nur so kann ein
Lernprogramm die Äußerungen des Lerners dekodieren: Selbst wenn
die Spracherkennungstechnik die Äußerungen des Lerners akustisch
identifiziert, kann sie den Kommunikationszweck des Lerners nicht
dekodieren. Wir brauchen daher andere Lösungsmodelle zur Erkennung
der Kommunikationsabsicht des Lerners. Seneff (2002) versucht,
diese Kommunikationsabsicht des Lerners durch Fragen zu erkennen.
Dabei bleibt jedoch unklar, wie
das Programm erkennt, in welcher Situation sich der Lerner befindet,
und somit welches Datenkorpus aktiviert wird. Chen (2009)
versuchte anhand der Verhältnisgruppen Kommunikationssituation +
Kommunikationsschritt + Fragen und dazugehörige Antworten, den
Zweck des Lerners zu erkennen. Anhand der Äußerung des Lerners -
also anhand von Sprache - erkennt die Software, in welcher
Kommunikationssituation und in welchem Kommunikationsschritt sich
der Lerner befindet (Chen 2009: 108f). Wenn das Programm die
Äußerungen des Lerners hingegen nicht dekodieren oder der Lerner
nicht weiter kommunizieren kann - also er nicht auf die Frage des
Computers antworten kann -, kommt es zu Fehlschlägen. Dies führt
dann dazu, dass das ganze Lernprogramm nicht
funktioniert.
Wir
versuchen nun durch ein innovatives Design, das mit Hilfe
vorhandener Technik implementiert werden kann, solche
Systemfehlschläge zu beseitigen. Es exisieren zwei Prinzipien, ein
Modell zur Rettung der Kommunikation zu entwickeln:
a. Innovatives
Design statt hochentwickelter Technik.
b. Festlegung
der Variablen als Hilfe für die Dekodierung des
Kommunikationszwecks: Durch die Beherrschung der Variablen der
Kommunikation wird der Kommunikationszweck des Lerners leichter
erkannt, und die Spracherkennung wird erleichtert. In jeder
Kommunikation existieren viele Variablen und
Entscheidungsmöglichkeiten, die es dem Programm erschweren, den
Kommunikationszweck des Lerners korrekt zu dekodieren. Wenn die
einzelnen Äußerungen dazu dienen, den Kommunikationszweck zu
realisieren, wird folglich der Kommunikationszweck erkannt, bevor
die einzelnen Äußerungen richtig dekodiert werden. Außerdem
können viele Äußerungen einen gemeinsamen Zweck erfüllen.
Deshalb sollte das Sprachlernprogramm bestenfalls die
Kommunikationsabsicht der Lerner erkennen, um folglich sowohl den
Sinn der einzelnen Äußerung richtig zu erkennen als auch die
Äußerungen gleichen Zwecks korrekt zuordnen. Dies bedeutet, dass
das Design des Programms zunächst den Kommunikationszweck
feststellen muss, um anschließend erst seine Äußerungen richtig
dekodieren zu können. Es muss z.B. beim Bewerbungsgespräch
zunächst feststellen, um welche Stelle sich der Lerner bewirbt,
weil jede Stelle eine andere fachliche Qualifikation verlangt und
somit der inhaltliche Schwerpunkt der Kommunikation je nach
Stellenangebot anders ist. So muss zunächst festgestellt werden,
für welche Anzeige sich der Lerner interessiert oder der Lerner
muss zunächst ein Bewerbungsformular ausfüllen, damit das
Programm erkennen kann, um welche Stelle er sich bewirbt.4
Dann erst kann das Programm im Bewerbungsgespräch die zutreffenden
Fragen stellen. Ein anderes Beispiel ist, dass der Inhalt der
Kommunikation je nach Tätigkeit, die der Lerner auszuüben
beabsichtigt (z.B. Schwimmen, Karten spielen, Bergsteigen), anders
sein wird.5
In diesem Fall soll der Lerner das benötigte Werkzeug für seine
Tätigkeit, wie z.B. den Badeanzug, das Kartenspiel oder den
Rucksack, kaufen. Auf diese Weise erkennt die Software die Absicht
des Lerners. Folglich müssen bei der Entwicklung der Software
zunächst die Variablen der Kommunikation festgestellt und
entsprechend behandelt werden, damit das Programm im Voraus den
Kommunikationszweck des Lerners erkennen und dessen Äußerungen
richtig dekodieren kann. Außerdem sollen die Anwender das
Entscheidungsrecht behalten können, damit sie die Kommunikation
auf natürliche Weise führen können.
Bei
der Entwicklung eines Rettungsmodells, wird oft zuerst an die
Technologie gedacht. Die Entwicklung eines Hochtechnologie-Modells
ist jedoch zeit- und ressourcenintensiv. Zudem ist ein
Hochtechnologie- Modell meist komplexer Art, so dass häufig
Probleme auftreten. Daher soll möglichst ein innovatives Design
bevorzugt werden.
In
einer Lernsoftware kommen folgende Systemfehlschläge am häufigsten
vor:
- Die Software kann die Aussprache des Lerners nicht erkennen.
- Die Software kann die Äußerung des Lerners nicht im Datenkorpus finden.
- Der Kommunikationszweck des Lerners ist schwer zu erkennen.
- Der Lerner weiß nicht, wie er weiter in der Fremdsprache kommunizieren kann.
Abb. 2: Rettungsmaßnahmen bei Misserfolgen in Sprachlernprogrammen
Um diesen in Sprachlernprogrammen häufig vorkommenden Systemfehlschlägen entgegenzuwirken, werden hier durch ein innovatives Design die folgenden Rettungsmaßnamen entwickelt (Abb. 2)
Im
Folgenden wird darauf einzugehen sein, wie ein Sprachlernprogramm
mit Hilfe der in dem vorliegenden Artikel entwickelten 13
Rettungsmaßnahmen die am häufigsten vorkommenden Systemfehlschläge
beseitigen kann. Die entwickelten Rettungsmaßnahmen sollen dabei
nicht als Einzelfälle angesehen werden, sondern haben für die
Beseitigung der in der Software vorhandenen Fehlfunktionen
Modellcharakter:
(A).
Das Sprachlernprogramm kann die
Aussprache des Lerners nicht erkennen, obwohl seine Äußerung
sich im Datenkorpus befindet. In diesem Fall existieren folgende
Lösungsmöglichkeiten:
- Die Aussprache der Lerner wird als Grundlage der Spracherkennung verwendet. Muttersprachler und ausländische Lerner sprechen zwar dieselbe Sprache und doch mit eigenen Variationen. Somit kann es vorkommen, dass das Sprachlernprogramm denselben Laut dieser beiden zu unterschiedlichen Modellen zuordnet. Das Programm sollte daher die Aussprache der Lerner, nicht jedoch diejenige der Muttersprachler als Erkennungsmodell zugrunde legen. Wenn z.B. das Programm die Aussprache der chinesischen Deutschlerner richtig erkennen will, muss es die deutsche Aussprache der chinesischen Lerner, nicht diejenige der deutscher Muttersprachler, als Erkennungsmodell verwenden. Somit werden die Chancen einer korrekten Zuordnung gesteigert.
- Das Lernprogramm fordert den Lerner auf, seine Äußerung umzuformulieren. Diese wird anschließend zur weiteren Bearbeitung an die Forschungsgruppe geschickt.Wenn das Programm die Äußerung des Lerners nicht interpretieren kann, fordert es ihn auf, sie umzuformulieren (wie z.B. „ Ich kann Sie nicht verstehen. Wiederholen Sie bitte“ oder „Verwenden Sie bitte andere Ausdrücke“), damit er erneut eine inhaltlich ähnliche Äußerung formuliert, die die Software im Datenkorpus gegebenenfalls finden kann. Gleichzeitig wird die Originaläußerung des Lerners an die Softwareentwickler geschickt, die diese in das Programm implementieren.
- Schriftliche Eingabemöglichkeiten anbieten.Wenn das Programm die Aussprache des Lerners nicht dekodieren kann, verliert dieser bald das Interesse daran, weiter zu kommunizieren. Deswegen bietet das Programm dem Lerner nach zweimaligem Systemfehlschlag an, die Äußerungen nicht erneut oral, sondern nunmehr über die Tastatur einzugeben, damit die Kommunikation fortgesetzt werden kann.
- Anhand von Stichwörter zu den Lerneräußerungen werden im Datenkorpus entsprechende Äußerungen gesucht und zur Auswahl angeboten.Wenn das Programm von der Äußerung des Lerners nur einzelne Wörter dekodieren kann, kann es die erkannten Wörter als Stichwörter verwenden und im Datenkorpus die entsprechenden Äußerungen suchen und sie dem Lerner zur Auswahl anbieten. Dieser muss anschließend die gewünschte Äußerung auswählen, so dass kann das Programm die Äußerungen des Lerners dekodieren kann.
- Mittels der sechs W-Fragen (Wer?, Wann?, Wie?, Wo?, Was?, Welcher?) kann der Kommunikationszweck des Lerners dekodiert werden.Wenn das Programm die Äußerung des Lerners nicht dekodieren kann, kann es ihm eine allgemeine W-Frage stellen, um so zu ermitteln, was der Lerner ausdrücken möchte. Anhand der entsprechenden Äußerung des Lerners, dass er beispielsweise ein Zimmer reservieren möchte, entschlüsselt die Software, dass er sich in der Hotel-Kommunikation befindet. Anhand der Äußerung, dass er Obst kaufen möchte, erkennt das Programm, dass er sich in der Einkaufssituation befindet.6
B. Das
Lernprogramm kann die Äußerung des Lerners nicht im Datenkorpus
finden: Bei
der ersten Maßnahme war die Äußerung des Lerners im Datenkorpus
zu finden. Jedoch konnte das Programm die Aussprache des Lerners
nicht dekodieren. Im vorliegenden Fall existiert die Äußerung des
Lerners nicht im Datenkorpus. Die Lösung des Problems kann in
folgende Weise erfolgen:
6. Die Kommunikationssituation wird eingeschränkt. Daraus folgt,
dass das Datenkorpus auf bestimmte Kommunikationssituationen
begrenzt wird und sich so die Zuordnungsmöglichkeit erhöht.
Ein
Computerprogramm verfügt meist über ein Datenkorpus. Sobald das
System einen Satz des Lerners wahrnimmt, vergleicht es ihn mit den
Sätzen aus dem Datenkorpus. Wenn ein Datenkorpus sehr groß ist,
ist dieser Vergleich sehr zeitintensiv. Das Programm kann aus
diesem Grund nicht schnell genug reagieren, so dass die
Kommunikation schnell langweilig sein wird. Wenn man die Anzahl
der Kommunikationssituationen reduziert, können für jede
ausgewählte Kommunikationssituation mehr Sätze aufgenommen
werden. Somit kann das Programm die Lerneräußerungen leichter im
Datenkorpus finden und diese dann dekodieren. Es erhöht sich so
die Zuordnungsmöglichkeit der Lerneräußerungen. Kann das
Programm die Lerneräußerung immer noch nicht problemlos
zuordnen, werden die Auswahlmöglichkeiten innerhalb derselben
Situation weiterhin eingrenzt: Das Einkaufszentrum bietet z.B.
nur bestimmte Produkte wie Äpfel, Birnen oder Eier an. In der
Bank finden sich beispielsweise nur zwei Schalter zur Auswahl
(Geldwechsel und Geldabhebung).
Durch die Einschränkung der angebotenen Mittel kann der Lerner
nur die entsprechende Kommunikation durchführen, wodurch die
sprachlichen Variationen reduziert werden. Auf diese Weise erfolgt
die Zuordnung der Lerneräußerungen mit denen aus dem
Datenkorpus nicht nur problemloser, sondern auch exakter.
7. Mit
Hilfe eines Synonymwörterbuches steigt die Zuordnungsmöglichkeiten.
Da
unterschiedliche Ausdrücke bedeutungsgleich verwendet werden
können, z. B. „wie teuer?“ ein Synonym für „wie viel
kostet?“ ist, erhöhen sich mit der
Verwendung eines Synonymwörterbuchs die
Zuordnungsmöglichkeiten. Folglich reduziert sich die
Belastung des Datenkorpus‘.
Außerdem können die
Rettungsmaßnahmen 2, 3, 4 und 5 aktiviert werden. Bei
Rettungsmaßnahme 2 wird der Lerner darum gebeten, die
Originaläußerung umzuformulieren, damit es die neue Äußerung
gegebenenfalls im Datenkorpus finden kann. Mit der Rettungsmaßnahme
3 bietet das Sprachlernprogramm dem Lerner eine schriftliche
Eingabemöglichkeit, damit es die Lerneräußerung besser
interpretieren kann. Wenn das Lernprogramm die Lerneräußerung nur
zum Teil dekodieren kann, kann es mit Rettungsmaßnahme 4 die
dekodierten Wörter als Stichwörter im Datenkorpus den bereits
entschlüsselten Äußerungen, die diese Wörter enthalten, zuordnen
und versteht so den Lerner. Mittels der 5. Rettungsmaßnahme stellt
das System 6W-Fragen an den Lerner, damit es an der nächsten
Äußerung die Redeabsicht des Lerners erkennen kann.
(8)
Äußerungen, die im Datenkorpus nicht vorhanden sind, werden an die
Forschungsgruppe / Softwareentwickler weitergeleitet und in das
Datenkorpus aufgenommen.
Die
neuen Äußerungen des Lerners werden überprüft und in das
Datenkorpus aufgenommen, damit das Programm sie in Zukunft erkennen
kann. Dadurch wird das Korpus inhaltlich immer wieder erneuert und
somit umfangreicher.
Dabei können die
Rettungsmaßnahmen von 2, 3, 4 und 5 aktiviert werden. Somit ist die
Reihenfolge der Rettungsmaßnahmen 6, 7, 2, 8, 3, 4 und 5 (s. Abb.
2).
(C) Der
Kommunikationszweck des Lerners ist schwer zu erkennen. Hier greifen
die folgenden Möglichkeiten der Abhilfe:
(9)
Durch
die Auswahl der angebotenen Mittel kann das Programm den
Kommunikationszweck des Lerners erkennen: Bei
der Kommunikation über Sport oder Hobbys bietet das
Computerprogramm dem Lerner eine Auswahl an Sportwerkzeugen wie z.B.
ein Schwert, einen Fußball oder einen Volleyball an. An der Auswahl
des Lerners erkennt es, welchen Sport er treibt und welchem Hobby er
nachgeht. Im weiteren Verlauf bittet das Sprachlernprogramm den
Lerner, einen Geldbetrag zu definieren. Am Preis der Ware und am
Geldbetrag des Kunden kann das Programm als Geschäftsbesitzer
ausrechnen, wie viel Geld es dem Kunden (also dem Lerner) nach dem
Einkaufen zurückgeben soll.
Ein
weiteres Beispiel ist
die Auswahl
einer
Arztpraxis
(Zahnarzt, Augenarzt, Hals-Nasen-Ohren-Arzt) durch
den
Lerner. An dieser Auswahl erkennt das
Programm,
woran der Lerner erkrankt ist, welches Medikament es dem Lerner
verordnen und welches Rezept es ihm ausstellen soll.7
Außerdem kann die 5. Rettungsmaßnahme aktiviert werden. Die
Software stellt dem Lerner Fragen zwecks Entschlüsselung seines
Kommunikationszwecks, wie z.B. „Was wollen Sie?“, „ Wie kann
ich Ihnen helfen?“, „Wann soll es geschehen?“.
Zu
den bereits beschriebenen tritt die folgende Rettungsmaßnahme:
(10)
Durch eigenes
Nachfragens kann das Lernprogramm ein Nichtverstehen in Verstehen
umwandeln.
Falls
das Programm den Kommunikationszweck oder die Äußerung des Lerners
nicht versteht, kann es Rettungsmaßnahme 5 aktivieren. Dabei kann
es dem Lerner zur Dekodierung seiner Kommunikationsabsicht die
genannten W-Fragen stellen. Diese werden nur dann eingesetzt, wenn
das Programm die Lerneräußerungen gar nicht dekodieren kann. Wenn
es die Äußerung des Lerners nur zum Teil nicht versteht, kann es
beim Lerner nachfragen, um den Verstehensprozess zu
vervollständigen. Ein Beispiel:
Der Lerner äußert: „Ich möchte Äpfel kaufen“. Die Software versteht jedoch das pluralische Substantiv Äpfel nicht. Anschließend formuliert es diese Lerneräußerung in eine Frage um. Was nicht verstanden wurde, wird in ein Fragewort umgewandelt. In dem Fall „Ich möchte Äpfel kaufen“ wird „Äpfel“ durch „was“ ersetzt zu: „Ich möchte was kaufen“. Danach wird das Pronomen „ich“ in „Sie“ umgewandelt, um den Lerner zu fragen: „Was möchten Sie kaufen?“
Somit
kann das Programm auf eigene Initiative durch Nachfragen das
Nichtverstandene ins Verstehen umgewandelt.8
Die
Reihenfolge der Rettungsmodelle ist hier 9, 10 und 5 (Abb. 2).
9
(D)
Der
Lerner weiss nicht, wie er weiter mit dem System kommunizieren soll.
Bei der Kommunikation mit der
Software treten nicht nur Probleme seitens des Sprachlernprogramms,
sondern auch auf Seiten des Lerners auf, so zum Beispiel dann, wenn
er nicht weiter in der Fremdsprache kommunizieren kann.
11. Unter
Einsatz der Verhältnisgruppen
Kommunikationssituation+Kommunikationsschritt
+
Fragen
mit dazugehöriger Antwort
kann das Programm dem Lerner die benötigten Sätze anbieten, damit
er weiter kommunizieren kann.
Im
Datenkorpus wird nach dem Modell von Chen (2009) eine
Verhältnisgruppe Kommunikationssituation+Kommunikationsschritt
+
Fragen
mit dazugehöriger Antwort
gebildet. Anhand dieser Verhältnisgruppe erkennt das Programm an
der Äußerung des Lerners, in welcher Situation und in welchem
Kommunikationsschritt sich dieser befindet. Wenn der Lerner das
Gespräch unterbricht oder nicht weiter weiß, kann das
Sprachlernprogramm ihm die Sätze des jeweiligen
Kommunikationsschrittes sowie diejenigen der nächsten
Kommunikationsschritte anbieten, damit die Kommunikation fortgeführt
werden kann.
Sollte
der Lerner die Äußerung nicht vollständig formulieren können,
kann das Sprachlernprogramm mittels der Stichwörter der
Lerneräußerung im Datenkorpus der Software die entsprechenden
Äußerungen
zur Auswahl anbieten, damit der Lerner weiter kommunizieren kann (s.
Rettungsmaßnahme 4).10
12. Mit
zweisprachig parallelen Datenkorpora oder Nachschlagewerken kann der
Lerner die benötigten Sätze finden und somit in der Fremdsprache
kommunizieren.
Wenn
die fremdsprachliche Kommunikation vom Lerner unterbrochen wird,
liegt es oft daran, dass dieser nicht weiß, wie er seine eigenen
Gedanken in der Fremdsprache ausdrücken soll. Mit Hilfe des
zweisprachigen Nachschlageprogramms - wie z.B. des
deutsch-chinesischen Sprachlernprogramms (Chen 2008a und Chen 2008b)
- kann er vollständige fremdsprachlichen Sätze finden.11
13. Der
digitale Assistent kann eine vollständige Kommunikation vorspielen,
damit der Lerner sie nachahmt.
Sollte
der Lerner nicht weiter wissen, kann das Sprachlernprogramm (Chen
2009) ihm die entsprechenden Sätze des jeweiligen
Kommunikationsschrittes bzw. diejenigen des nächsten
Kommunikationsschrittes anbieten. Falls der Lerner trotzdem nicht
weiter weiss, wird der digitale Assistent aktiviert. Er spielt dem
Lerner - je nach seinem eigenen Bedarf und seiner eigenen
Entscheidung - entweder den jeweiligen Kommunikationsschritt oder
die ganze Kommunikation vor. Die jeweilige Kommunikation steht ihm
dabei in vollständiger Form und in die verschiedenen
Kommunikationsschritte untergliedert zur Verfügung, so dass der
Lerner auswählen kann, ob der jeweilige Kommunikationsschritt oder
die gesamte Kommunikation angezeigt werden soll.12
Die
Reihenfolge der Rettungsmaßnahmen ist dabei 11, 4, 12 und 13 (Abb.
2).
4 Abschließende
Bemerkungen
Weder
in der Fachliteratur noch in den meisten, derzeit auf dem Markt
befindlichen Sprachlernprogrammen werden
mögliche Systemfehlschläge in der Kommunikation behandelt.
Folglich werden die Programme oft unplanmäßig unterbrochen und die
Anwender verlieren schnell die Geduld an der Beschäftigung mit
ihnen. Im vorliegenden Artikel wird zunächst festgestellt, welche
Systemfehlschläge der derzeitigen Programme bei der Spracherkennung
am häufigsten vorkommen. Daraufhin werden entsprechende
Rettungsmaßnahmen analysiert und Vorschläge dahingehend gemacht,
die Wirkungsweise der Lernprogramme zur verbessern, um letztlich
kommunikative Misserfolge zu beseitigen.
Bei
der Entwicklung von Lösungsmodellen denkt man meist an
hochentwickelte Technologie. Ein Hochtechnologie-Modell erfordert
jedoch viel Energie und zudem einiges an finanziellen Mitteln.
Außerdem sind Hochtechnologie-Modelle oft so kompliziert, dass sie
recht fragil sind. Vorteile gegenüber Hightech-Systemen bietet
daher ein innovatives Design, das mittels vorhandener Technik
implementiert werden kann.
Die
Spracherkennungstechnik kann bislang nur die wörtliche Bedeutung
der Lerneräußerungen, aber kaum deren Kommunikationszweck
erkennen. Erst nachdem ein System den Kommunikationszweck des
Lerners erkannt hat, kann es jedoch dessen Äußerungen inhaltlich
korrekt dekodieren. Ein innovatives Design der Sprachlernprogramme
soll dem Lerner zudem das Entscheidungsrecht hinsichtlich seiner
eigenen Äußerungen gewähren. Mit dieser Einschränkung ergeben
sich bei dem Design die folgenden Prinzipien, mit denen das Programm
den Kommunikationszweck des Lerners besser erkennen und potentielle
Systemfehlschläge beseitigen kann:
- Durch die Verhältnisgruppe wird der Kommunikationszweck erkannt.Werden zwei Kommunikationsvariablen in ein Verhältnis setzt, kann das Programm mittels der einen die andere Variable dekodieren. Bildet das Lernprogramm (Chen 2009) aus Kommunikationssituation, Kommunikationsschritt und Fragen mit dazugehörigen Antworten eine Verhältnisgruppe, so kann es an der Äußerung des Lerners erkennen, in welcher Situation und in welchem Kommunikationsschritt er sich befindet. Folglich versteht es den Lerner besser.
- Durch die Auswahl des Lerners erkennt die Software den Kommunikationszweck.Bietet das Konversationssystem dem Lerner eine Kommunikationssituation anhand verschiedener Elemente zur Auswahl an, kann es die Redeabsicht des Lerners anhand der von ihm getroffenen Auswahl erkennen. Entsprechend kann es dessen Äußerungen adäquater dekodieren.
- Durch gezielte Fragen erkennt das Programm den jeweiligen Kommunikationszweck.Wenn das System den Kommunikationszweck des Lerners nicht interpretieren kann, stellt es ihm zielgerichtete Fragen zur Entschlüsselung seiner Redeabsicht. Erkennt das Programm eine Äußerung des Lerners nur zum Teil - d.h. ist der Dekodierungsprozess unvollständig -, kann es mit Hilfe der Äußerung des Lerners die entsprechende Frage umformulieren, um das Nichtverstehen in ein Verstehen umzuwandeln.
- Wenn der Lerner nicht weiterkommt, bietet ihm das Sprachlernprogramm die benötigten Informationen oder Hilfsmittel an, die ihm eine Fortsetzung der Kommunikation ermöglichen.Wenn der Lerner an einem Punkt nicht weiter weiß, muss das Programm die Konversation mittels folgender Maßnahmen retten: Es bietet dem Lerner zweisprachige Nachschlagewerke, Internetquellen, oder auch die benötigten Kommunikationselemente an oder zeigt ihm mittels digitalem Assistenten, wie er weiter kommunizieren kann.
In
dem vorliegenden Artikel wird verdeutlicht, dass ein problemlos
funktionierendes Sprachlernprogramm nicht ausschließlich auf
ausgefeilter Technologie beruhen muss. Funktionstüchtigkeit und
Zuverlässigkeit einer Software zur Verbesserung fremdsprachlicher
Kommunikation werden eher dann sicher gestellt, wenn letztere -
insbesondere die Implementierung ihrer Rettungsmechanismen - auf
effektivem Design statt auf Hochtechnologie beruht. In diesem
Zusammenhang stellt auch die Reduzierung der (Entwicklungs)Kosten
einen wesentlichen Faktor dar.
Literatur
Chang,
Hung-An & Glass, James (2011). Multi-level
Context-dependent Acoustic Modeling for Automatic Speech Recognition.
Proc. ASRU, Waikoloa, Hawaii, December, 89-94.
Chen,
Shing-lung (2008a). The foreign language learning assistance-system
by means of searching the foreign language equivalents of the mother
language – Using German-Chinese and Chinese-German as an example.
In: Language,
Literary Studies and International Studies: An International Journal
(THCI), 89-112.
Chen,
Shing-lung (2008b). Developing a Model for the Chinese- German Corpus
of Communication Sentences. In: Journal of European Languages,
44-73.
Chen,
Shing-lung (2009). Developing a Model for Interactive Conversation
Systems. In: Journal of Applied Foreign Languages, 95-122.
Dehak,
Najim; Torres-Carrasquillo, Pedro A; Reynolds, Douglas & Dehak,
Reda (2011) .Language Recognition via Ivectors and Dimensionality
Reduction. In: Proc. Interspeech, 857-860.
Just
talk. Sohomedia (1999). Taipei: Sohomedia.
Just
talk. Handbook ( 1999). Taipei: Sohomedia.
Litman,
Diane & Scott Silliman (2004). ITSPOKE: An intelligent tutoring
spoken dialogue system. In Proceedings
of the Human Language.
Technology Conference /Third Meeting of the North American Chapter of
the Association for Computational Linguistics (HLT/NAACL) (Companion
Vol.), 233-236.
Qin,
Jun-hong & Zhang, De-lu (2005). Der Sprechwechsel in der
Kommunikation im Internet. [網上會話中的話輪轉換]
In: Wai Yu Dian Hua Jiao Xue, 41-45.
Seneff,
Stephanie.
(2002).
Response
Planning and Generation in the Mercury Flight Reservation System. In:
Computer
Speech and Language,
Volume 16, 283–312.
Seneff,
Stephanie. & Polifroni,
Joseph
H. (2000).
Dialogue
management in the Mercury flight reservation system. In: Proceeding
ANLP/ NAACL-ConvSyst '00 Proceedings of the 2000 ANLP/NAACL Workshop
on Conversational systems.
Volume 3. 11-16.
Tell
me More (2006). Premium 8.0 DaF 1-3 . ScanSoft.
Köln : Auralog.
Yang,
ping (2007). Die Analyse der Sprechhandlungsklassifikation in
Gesprächen der Natursprachen [面向自然語言處理的會話行為分類研究].
In: Applied Linguistics (Yu Yan Wen Zi Ying Yong). 128-135.
Zue,
Victor (1985). The Use of Speech Knowledge in Speech Recognition, In:
Invited paper, Special issue on Man-Machine Communication,
Proc. IEEE, vol. 73, no. 11, 1602-1615.
Autorin:
Prof.
Dr. Shing-Lung Chen
National Kaohsiung First University of
Science and Technology (NKFUST)
Seminar
für deutsche Sprache und Literatur,
2, Jhuoyue
Rd.
Nanzih
District
Kaohsiung City 811
Taiwan,
R.O.C.
E-Mail:
chensl@nkfust.edu.tw
1
Zu den Einzelheiten vgl.
2Das
System „Itspoke“ sammelt die Erklärungen von Tutoren über
Fragen zu Begriffen aus der Physik. Diese Methode hat u.E. den
Vorteil, dass Studierenden die Erklärungen ihrer Kommilitonen
(Tutoren) besser verstehen können als die Erklärungen ihrer
Professoren.
3
Ein weiteres Beispiel ist die
Hotel-Kommunikation.
An der Frage
nach dem
Preis für die
Übernachtung
erkennt das System,
dass der Lerner sich in der Hotelkommunikation befindet und zwar im
Kommunikationsschritt Feststellung
des Preises.
4
Das Programm kann den Lerner am Anfang des Gesprächs
fragen, um welche Stelle er sich bewerben will. Wenn das Programm
erst im Gespräch danach fragt, kann es nicht rechtzeitig das
entsprechende Sprachdatenkorpus für diese Stelle finden. Aus diesem
Grunde sollte diese Feststellung möglichst vor
der Konversation stattfinden.
5
Im
Internet gibt es
viele Sprachlernprogramme (wie
z.B.:
http://www.cola.itri.org.tw)
in der Form einer Pfadlandkarte, auf der die
Kommunikationssituationen aufgelistet werden.
Nachdem der Lerner eine Kommunikationssituation ausgewählt hat,
werden bei jeder Frage drei Antworten zur Auswahl angeboten, damit
das Programm die Antwort des Lerners dekodieren kann. Dies zeigt an,
dass es in der Kommunikation viele Variablen gibt, die dazu führen
können, den Lerner falsch zu verstehen. Bei einem solchen Programm
kann der Lerner nur schriftlich und nicht frei kommunizieren.
6
Falls an der Äußerung des Lerners das Sprachprogramm nicht
erkennen kann, in welcher Situation er sich genau befindet, kann es
weiterhin eine Auswahlfrage stellen. An der Äußerung „Wie ist
der Preis?“ kann es beispielsweise nicht feststellen, ob der
Lerner sich im Hotel, beim Einkaufen oder beim Reisebüro befindet.
In diesem Falle kann es ihm eine Auswahlfrage (z.B. „ Sind Sie im
Hotel, im Restaurant oder ...“) stellen, um zu ermitteln, wo er
sich gerade befindet.
7
Bei dieser Lösungsmöglichkeit kann der Lerner die
Kommunikationssituation Stadtbummel auswählen. Mit der
Auswahl weiß das Programm, in welcher Situation er sich befindet,
und kann das entsprechende Teilkorpus aktiviert.
8
Der Unterschied zwischen der 5. und der 10. Rettungsmaßnahme
besteht darin, dass die 5. Rettungsmaßnahme mittels der W-Fragen
den Kommunikationszweck des Lerners zu ermitteln versucht, während
die 10. Rettungsmaßnahme die Äußerung des Lerners in eine Frage
umformuliert, um das Nichtverstehen der Teilinformation in ein
Verstehen umzuwandeln.
9
Die Reihenfolge der Maßnahmen lässt sich in
Abhängigkeit von dem jeweiligen Problem ändern.
10
In dem Fall, dass der Lerner sich nicht vollständig
äußert, soll das Programm planmäßig die vom Lerner geäußerten
Stichwörter sowohl im Datenkorpus der Software als auch im Internet
suchen und denn Lerner einen entsprechenden Satz zur Auswahl
anbieten, damit das Programm erkennt, was er gemeint hat. Wenn der
Lerner aber die Option einer Äußerung aus dem Internet auswählt
und diese im Datenkorpus nicht zu finden ist, kann das Programm
nicht adäquat darauf reagieren. Aus diesem Grunde soll das Programm
mit der unvollständigen Äußerung des Lerners nur in seinem
eigenen Datenkorpus nach entsprechenden, vollständigen Sätzen
suchen.
11
In dem deutsch-chinesischen und chinesisch-deutschen
Sprachlernprogramm (Chen 2008b) können mittels deutscher Ausdrücke
vollständige chinesischen Sätze sowie mittels chinesischer
Ausdrücke vollständige deutschen Sätze gefunden werden. Die
derzeitigen Suchsysteme geben dem Lerner direkt die
fremdsprachlichen Ausdrücke an, und der Lerner soll anhand der
fremdsprachlichen Kenntnisse einen Ausdruck auswählen. Dagegen
stellt das Lernprogramm von Chen (2008b) gemäß dem
muttersprachlichen Suchbefehl eine Reihe muttersprachlicher Sätze
zur Auswahl, so dass der Lerner anhand seiner eigenen
muttersprachlichen Kenntnisse die gewünschten Sätze auswählt.
Erst danach erscheinen die fremdsprachlichen Entsprechungen der
gewählten muttersprachlichen Sätze. Somit kann der Lerner auf der
Basis seiner muttersprachlichen Kenntnisse den zutreffenden
fremdsprachlichen Ausdruck finden.
12
Falls das Sprachlernprogramm erkennt, dass der Lerner
jedes Mal nur bestimmte Kommunikationssituationen auswählt (wie
z.B. nur die Situation Einkaufszentrum,
Postamt oder Bank),
bietet es dem Lerner beim nächsten Mal andere Situationen zur
Auswahl an (z.B. die Situationen Bibliothek,
Arztpraxis oder
Hotel), damit er
seinen Lernhorizont erweitert.