Editor

JLLT edited by Thomas Tinnefeld
Journal of Linguistics and Language Teaching
Volume 5 (2014) Issue 1





Modell zur Entwicklung von Rettungsmechanismen für Sprachlernprogramme — am Beispiel von Systemfehlschlägen bei der Spracherkennung

Shing-lung Chen陳欣蓉 (Kaohsiung, Taiwan)


Abstract (English)
Since communication in conventional language teaching usually only takes place between the classroom interlocutors (learners and instructors), learners usually have little opportunity and time to practice communication in the foreign language. Therefore, language learning programmes that help learners practice and improve foreign language communication outside of class are urgently needed. Modern language learning programmes are typically based on the development of speech recognition techniques for the correct decoding of users' utterances. They are usually based on a linear rather than a circular model, and therefore proceed according to this particular linear structure, which is not able to take potential system failures into account. As a consequence, the programmes can, in the event of a communication failure, not proceed with the communication, and thus, the communication process is interrupted. Learners may soon lose interest in the use of that particular programme. Based on the description of these facts, it can be shown that a language learning programme solely based on speech recognition techniques, does not fulfill learners' needs. The present article examines which inherent potential failures language learning programmes have and how these failures can be reduced or eliminated so that the programmes will run smoothly.
Keywords: software, language learning programme, computer programme, programme, system failure, rescue model, rescue measure, Learning system design, failure


Abstract (Deutsch)
Da die Kommunikation im konventionellen Sprachunterricht meist nur zwischen den Teilnehmern (Lernern und Dozenten) erfolgt, bleibt Lernern in der Regel kaum Gelegenheit und auch wenig Zeit zur Einübung fremdsprachlicher Kommunikation. Daher werden dringend Sprachlernprogramme benötigt, mit deren Hilfe die Lerner die fremdsprachliche Kommunikation fern des Unterrichts am Computer praktizieren und verbessern können. Moderne Sprachlernprogramme orientieren sich in der Regel an der Entwicklung von Spracherkennungstechniken zur korrekten Dekodierung der Äußerungen der Anwender. Da Sprachlernprogramme statt auf einem zirkulären meist auf einem linearen Modells basieren, verlaufen sie gemäß einer bestimmten linearen Struktur, die nicht in der Lage ist, potentielle Systemfehlschläge zu berücksichtigen. So können die Programme im Falle eines kommunikativen Misserfolgs nicht weiter kommunizieren, und folglich wird der Kommunikationsablauf unterbrochen. Entsprechend verlieren die Lerner das Interesse an derartigen Programmen. Aus der Beschreibung dieser Konstellation wird ersichtlich, dass ein Sprachlernprogramm, das einzig und allein auf Spracherkennungstechniken basiert, nicht den Bedürfnissen der Lerner gerecht wird. In dem vorliegenden Artikel wird untersucht, welches Misserfolgspotential Sprachlernprogrammen inhärent ist und wie dieses verringert bzw. behoben werden kann, damit die Programme reibungslos funktionieren.
Stichwörter: Software, Sprachlernprogramm, Computerprogramm, Programm, Systemfehlschlag, Rettungsmodell, Rettungsmaßnahme, Design des Lernsystems, Misserfolg




1 Einleitung

Obwohl das Fremdsprachenlernen darauf abzielt, in der gelernten Fremdsprache kommunizieren zu können, haben Lerner im Unterricht leider meist wenig Gelegenheit und Zeit, Kommunikation einzuüben. Aus diesem Grunde werden dringend Sprachlernprogramme benötigt, die die Lerner dazu befähigen, die gelernte Fremdsprache ohne Scheu am Computer anzuwenden und die fremdsprachliche Kommunikation zu praktizieren. Vorhandene Programme gründen meist auf Spracherkennungstechniken zur Entschlüsselung der Sprache der Lerner. Derzeit ist die Technik der Spracherkennung noch nicht in der Lage, jede Äußerung des Lerners problemlos zu dekodieren. Aus diesem Grund benötigt ein Programm zusätzliche Lösungsansätze zur besseren Analyse der Lernersprache. Nur durch eine solche kann ein Programm trotz potentieller Systemfehlschläge fortgesetzt funktionieren.

Die vorhandenen Lernprogramme laufen meist nach einem linearen Modell ab, in dem die auftretenden Probleme oder Systemfehlschläge weder berücksichtigt noch behandelt werden. Dies führt dazu, dass die Kommunikation zwischen Sprachlernprogramm und Lerner unterbrochen wird. Das Programm benötigt daher entsprechende Rettungsmaßnahmen, damit es fließend und vollständig funktionieren kann. In dem vorliegenden Artikel wird statt eines linearen Systems ein zirkuläres System entwickelt, das trotz potentieller Misserfolge fortgesetzt funktionieren kann.

Die derzeitige Forschung fokussiert mehrheitlich darauf, die Spracherkennungstechnik zu verbessern und somit die Äußerungen der Lerner besser zu dekodieren (z.B. Chang & Glass 2011, Dehak, Torres-Carrasquillo, Reynolds & Dehak 2011, Zue 1985). Weitere Ansätze zur Analyse potentieller Fehlschläge und entsprechender Reaktionsmöglichkeiten eines Computerprogramms fehlen zur Zeit noch. Im vorliegenden Artikel wird daher untersucht, wie ein Programm - bei allen vorhandenen Einschränkungen der Spracherkennungstechnik – die Äußerungen der Lerner anhand von Rettungsmaßnahmen dennoch dekodieren kann.

Da Lernprogramme aus verschiedenen Gründen unterbrochen werden, sind die folgenden Fragestellungen von Bedeutung:
(1) Wie soll ein Programm reagieren, wenn es die Äußerungen des Lerners nicht erkennen kann?
(2) Wie soll ein Programm reagieren, wenn der Lerner die Frage des Programms nicht beantwortet bzw. das Programm keine Reaktion des Lerners erhält?

Ziel des vorliegenden Artikels ist es, ein zirkuläres Modell zu entwickeln, das entspreche Rettungsmaßnahmen zur Behebung der genannten Probleme bereithält.


2 Stand der Forschung

Im Folgenden wird zunächst die auf dem Markt erhältliche Lernsoftware analysiert und ihre Reaktion auf Fehlschläge untersucht. Es schließt sich eine Analyse der existierenden Fachliteratur an.


2.1 Aktuelle Lernsoftware

Im Allgemeinen lassen sich bei Sprachlernprogrammen die folgenden Reaktionsschemata unterscheiden:
  1. Beim Systemfehlschlag wartet das System, bis der Lerner eine richtige Antwort gibt. Ein Beispiel dafür ist MyET (http://www.myet.com.tw):
Falls das Sprachlernprogramm die Äußerungen des Lerners nicht erkennt oder der Lerner nicht antwortet, wartet es auf dessen Reaktion oder darauf, dass der Lerner das Programm schließt.
  1. Die Software wartet eine vorgeschriebene Zeit und läuft dann gemäß dem vorgeschriebenen Plan weiter. Ein Beispiel ist die deutsche Version des Programms Tell me more (2006). Im Programm erscheint der Hinweis:
Befolgen Sie die Anweisungen im Spracherkennungsfeld am oberen Bildschirmrand...Machen Sie keine Pause innerhalb Ihrer Antworten. Sobald eine Pause eintritt, geht TELL ME MORE davon aus, dass der Satz beendet ist... Sie verfügen über 5 Sekunden Sprechzeit. Längere Sätze müssen Sie deshalb relativ schnell sprechen. (Tell me more 2006)
Aus dem Hinweis lässt sich ersehen, dass das oben genannte Programm mit der nächsten Handlung anfängt (wie z. B. mit der Bewertung), falls der Lerner eine Pause macht. Dies bedeutet, dass das Programm im Falle eines Misserfolgs - wie z.B. einer unterlassenen Reaktion des Lerners - während einer vorgegebenen Zeit mit der nächsten Handlung weiterläuft.
  1. Manche Lernprogramme eröffnen dem Lerner - wenn dessen Äußerungen weder empfangen noch erkennen können - dreimal die Möglichkeit, eine Antwort zu geben. Falls es dreimal zu Fehlern kommt, schließt das Programm automatisch (wie z.B. Just talk 1999).
Falls das Sprachlernprogramm die Äußerung des Lerners nicht dekodieren kann, bittet es mittels geplanter Äußerungen wie „Pardon“, „I don’t understand what you are saying“, „please say it one more time“ um Wiederholung (Handbook Just talk 1999 : 18). Dabei hat der Lerner nur dreimal die Möglichkeit, die Kommunikation zu retten. Nach drei Fehlschlägen unterbricht das Programm die Kommunikation ab und schließt.


2.2 Literatur zu Sprachlernprogrammen

Da Systemfehlschläge von Sprachlernprogrammen in der Fachliteratur kaum behandelt werden, gehen wir hier auf solche Software ein, die im Forschungslabor entwickelt worden ist. Im Mittelpunkt der Analyse steht dabei, welche Art von Systemfehlschlägen bei dieser Software vorkommt. Im Folgenden sollen die aktuellen Modelle aus dem Forschungslabor im Mittelpunkt stehen:

2.2.1 Software mit Frage-Antwort - Modell


Das aktuelle Softwaremodell basiert darauf, dass im Datenkorpus die Kategorie Fragen in den Konversationsübungen mit deren Antworten verbunden sind. Wenn das Programm die Fragen der Lerner im Datenkorpus findet, kann es sie beantworten.

Dieses Modell findet bei vielen Robotern Anwendung. Falls der Roboter die Fragen der Kunden im Datenkorpus findet, werden die Antworten angegeben, als ob er die Fragen der Kunden beantworten könnte. Ein authentischer Beleg dafür ist, dass Roboter beispielsweise in Krankenhäusern in der Lage sind, Routinefragen von Patienten zu beantworten, also beispielsweise Fragen danach, wo der Operationsssal, wo die Kasse oder wo die Toilette ist1.

Wenn der Roboter die die Fragen von Kunden oder Patienten im Datenkorpus findet, kann er die vorgeschriebenen Antworten wiedergeben. Kann der Roboter die entsprechenden Fragen im Datenkorpus jedoch nicht finden, schlägt die Kommunikation fehl.

Litman & Silliman (2004) versuchten, den Computer in die Lage zu versetzen, die Fragen des Lerners zu beantworten. Zu diesem Zweck sammelten sie in authentischen Situationen vorkommende Fragen und potentiell passende Antworten. Das von ihnen entwickelte Programm heißt "Itspoke“ und ist ein Tutor-Programm, das Studierenden hilft, Begriffe der Physik besser zu verstehen. Beim Aufbau des Datenkorpus‘ stellt die Software zu einem bestimmten Begriff der Physik eine Reihe häufig vorkommender Fragen der Studierenden an die Computer-Tutoren. Die Antworten der Tutoren werden dann mit den gestellten Fragen verbunden. Schließlich ist die Software in der Lage, sämtliche Fragen zu Begriffen der Physik zu beantworten. Viele Lernprogramme bauen ihr Datenkorpus auf textorientierter Kommunikation auf. Dabei fehlen jedoch Eigenschaften oder auch emotionellen Ausdrücke der mündlichen Kommunikation. Litman & Silliman erklären, warum sie mündliche Erklärungen sammeln, aber keine schriftlichen:
The development of computational tutorial dialogue systems has become more and more prevalent (Aleven and Rose, 2003), as one method of attempting to close the performance gap between human and computer tutors. While many such systems have yielded successful evaluations with students, most are currently text-based (Evens et al., 2001; Aleven et al., 2001; Zinn et al., 2002; Van- Lehn et al., 2002). There is reason to believe that speech-based tutorial dialogue systems could be even more effective. Spontaneous self-explanation by students improves learning gains during human-human tutoring (Chi et al., 1994), and spontaneous self-explanation occurs more frequently in spoken tutoring than in text-based tutoring (Hausmann and Chi, 2002). (2004: 233)2
Solch ein Programm birgt aber auch die Gefahr, nicht weiter zu funktionieren, wenn es die Frage des Lerners im Datenkorpus nicht auffinden kann. Der Mechanismus kann nur dann die jeweilige Antwort liefern, wenn er die Frage des Gesprächspartners mit der dafür vorgesehenen Antwort im Datenkorpus findet. In diesem Fall erkennt das Programm jedoch nicht die Bedeutung der Frage des Gesprächspartners.

Im Folgenden wird auf die Frage eingegangen, wie Programme dazu befähigt werden können, die Äußerungen der Lerner inhaltlich zu dekodieren und sie darüber hinaus im Zusammenhang der gesamten Konversation zu erkennen.


2.2.2 Lernsoftware mit Dekodierung der Lerneräußerungen hinsichtlich ihres Bedeutungsgehalts

Die Äußerungen von Lernern können mittels eines Sprachdatenkorpus und der Spracherkennungstechnik nur auf der Ebene der Oberflächenstruktur, nicht jedoch auf der Bedeutungsebene dekodiert werden. Um die Bedeutung einer gegebenen Äußerung zu interpretieren, muss aber in der Regel die Äußerungsabsicht des Lerners zunächst erkannt werden. Daraus ergibt sich, dass die Dekodierung der Kommunikationsabsicht viel wichtiger ist als die Dekodierung der einzelnen Äußerungen auf inhaltlicher Ebene.

Im Folgenden werden drei verschiedene Softwaremodelle vorgestellt, die den Sinn der Lerneräußerungen zu dekodieren versuchen.

Seneff & Polifroni (2000) und Seneff (2002) entwickelten ein Konversationprogramm mit dem Namen "Mercury Flight Reservation System" zum Zwecke der Verwendung für die Buchung von Flügen. Dieses Lernprogramm soll beim Benutzer so lange nachfragen, bis es alle benötigten Informationen gesammelt hat, um geeignete Flugangebote für ihn als Kunden finden zu können. Dazu Seneff:
The MERCURY system (Seneff & Polifroni, 2000a), which provides information about flights available for over 500 cities worldwide, is our most sophisticated system to date in terms of its dialogue model. We have invested considerable effort into making MERCURY intuitive to use and robust in handling a wide range of different ways users might express their ight constraints and select the ights of the itinerary. Our goal in doing this research was to demonstrate that, given the current constraints on the state of the art in telephone-based speech understanding, it is possible to design a telephone-access spoken dialogue system that people would be willing to use to plan their air travel. (2002: 284)
Dabei sucht die Software anhand der Information des Benutzers die entsprechenden Flugangebote heraus. Bei der Flugbuchung ist es notwendig zu erfahren, wohin, wann, mit welcher Fluggesellschaft der Gesprächspartner fliegen möchte. Auf diesem Hintergrund stellt das Lernprogramm Fragen an den Benutzer, damit es mittels seiner Antworten die benötigten Informationen sammeln und somit die vorausgegangenen Äußerungen des Benutzers richtig dekodieren kann. Versteht das Programm beispielsweise nicht, zu welchem Zeitpunkt der Benutzer abfliegen möchte, dann stellt es die entsprechende Frage (z. B. „Wann wollen Sie fliegen?“), um die benötigte Information zu erhalten.

Chen entwickelte im Jahre 2009 das Modell eines Sprachlernprogramms, das im Datenkorpus die Kommunikationssituation mit dem jeweiligen Kommunikationsschritt sowie den entsprechenden Fragen und dazugehörigen Antworten als eine Verhältnisgruppe aufbaut. Dieses Programm kann anhand der Äußerung des Lerners erkennen, in welcher Situation dieser sich befindet, und ihm die benötigten Sätze für die jeweilige Kommunikation anbieten, wenn dieser selbständig nicht weiterkommt.

Im Folgenden soll nun am Beispiel einer Einkaufssituation dargestellt werden, wie die Verhältnisgruppen aufgebaut sind. Beim Aufbau der Verhältnisgruppen wird zunächst festgestellt, welche Kommunikationsschritte die jeweilige Kommunikationssituation enthält: Entsprechend eines Handlungsmusters kann die Kommunikation in verschiedene Kommunikationsschritte eingeteilt werden. Eine Einkaufskommunikation wird z. B. in die folgenden Schritte untergliedert:

(1) Feststellung des Angebotes(2) Vergleich verschiedener ähnlicher Angebote(3) Feststellung des Preises(4) Vergleich des Preises mit dem Wert des Angebotes (eventuell Feilschen bzw. Aushandeln des Preises)(5) Realisierung der Bezahlung(6) Entscheidung für oder gegen den Erwerb der Ware. (vgl. Chen 2009: 105)

Anschließend werden unter jedem Kommunikationsschritt die entsprechenden Fragen mit den dazugehörigen Antworten gesammelt:

Einkaufssituation
Kommunikationsschritt
Fragen (Beispiele)
Antworten (Beispiele)
A. Feststellung des
Angebotes

Haben Sie Äpfel?
Wo sind die Äpfel?
Ich hätte gern Äpfel.
Hier sind die Äpfel.
Hier bitte
Wir haben leider keine mehr.
B. Vergleich verschiedener
ähnlicher Angebote
Haben Sie andere Sorten?
Gibt es Äpfel aus anderen Ländern?
Hier sind Äpfel aus Tokio und aus Soul.
Hier sind Äpfel aus Griechenland, aus Korea und aus Japan.
C. Feststellung des Preises

Wie viel kostet ein Kilo Äpfel?
Wie teuer ist ein Apfel?
Ein Kilo Äpfel kostet drei Euro.
Ein Apfel 50 Cent.

D. Vergleich des Preises
mit dem Wert des
Angebotes
(eventuell Feilschen bzw.
Aushandeln des Preises)
Gibt es noch billigere Äpfel?
Haben Sie noch andere, billigere Äpfel?
Bekomme ich Rabatt?
Die Äpfel aus Griechenland sind
billig.
Mit dem Preis kann ich leider nicht heruntergehen.
E. Realisierung der
Bezahlung
Kann ich mit US-Dollar bezahlen?
Nein, wir nehmen nur Euro.
Ja, gern.
F. Entscheidung für oder
gegen den Erwerb der
Ware
Ich nehme ein Kilo Äpfel.
Geben Sie mir bitte ein Kilo Äpfel.
Gern.
Moment. Ich werde das sofort erledigen.
Hier sind Ihre Äpfel.
Abb. 1: Kommunikationsschritte mit Fragen und Antworten (Chen 2010: 46f)

Im Datenkorpus werden jede Kommunikationssituation mit dem jeweiligen Kommunikationsschritt und sowie dessen Fragen mit den dazugehörigen Antworten kombiniert. Das Lernprogramm erkennt an den Äußerungen, an welcher Stelle der Kommunikation sich der Lerner befindet. An der Äußerung “Haben Sie Äpfel?“, erkennt es, dass der Lerner sich in der Einkaufs-Kommunikation befindet und zwar beim Kommunikationsschritt „Feststellung des Angebotes“.3

Im Datenkorpus werden unter der Kommunikationssituation Einkaufen und dem Kommunikationsschritt Feststellung des Preises, die Frage „Wie viel kostet ein Kilo Äpfel?“ und die dazu gehörige Antwort „Ein Kilo Äpfel kostet drei Euro“ als eine Verhältnisgruppe gewertet. Damit kann das Lernprogramm während der Kommunikation anhand der Äußerung des Lerners „Wie viel kostet ein Kilo Äpfel?“ erkennen, dass der Lerner bei der Kommunikation Einkaufen und beim Kommunikationsschritt Feststellung des Preises ist. Da im Datenkorpus jede Frage mit ihrer Antwort verbunden ist, beantwortet das Programm die Fragen des Lerners. Außerdem kann es an der Reihenfolge der Kommunikationsschritte derselben Konversationssituation erkennen, wie die Kommunikation weiterlaufen soll (vgl. Abb. 1). Falls der Lerner nicht weiß, wie er weiter kommunizieren soll, kann das Programm ihm die entsprechenden Sätze des Kommunikationsschrittes anbieten, so dass er weiter kommunizieren kann. Sollte der Lerner nach der Feststellung des Preises aber nicht weiter wissen, bietet das Programm ihm die Sätze des nächsten Kommunikationsschrittes (Vergleich des Preises mit dem Wert des Angebotes“) an, wie z. B.
Gibt es noch billigere Äpfel? “Haben Sie noch andere billigere Äpfel? “Bekomme ich Rabatt? “

Im Folgenden wollen wir darauf eingehen, bei welchen Systemfehlschlägen die obigen Lernprogramme nicht funktionieren. Seneff entwickelte im Jahre 2002 ein Modell, das mit Hilfe von W-Fragen den Kommunikationszweck des Lerners zu dekodieren versucht. Das Programm kann nur einseitig die geplanten Informationen sammeln, um den Kommunikationszweck der Lerner zu erschließen. Wenn es dagegen um komplizierte Handlungen geht - wie z.B. den Austausch von Waren oder das Verhandeln des Kaufpreises -, bei denen das Programm aus der Information keine Absicht des Lerners erschließen kann, funktioniert es nicht komplikationslos.

Um diesem Problem abzuhelfen, teilt Chen (2009) anhand der Handlungstheorie die Kommunikation in einzelne Kommunikationsschritte ein. Unter jedem Kommunikationsschritt findet sich die Verhältnisgruppe Fragen mit den dazu gehörigen Antworten, die sprachlich den Kommunikationsschritt realisieren. Somit kann die Software anhand der Äußerung des Lerners erkennen, in welcher Kommunikationssituation und bei welchem Kommunikationsschritt er sich befindet. Das System integriert also die Struktur des gesamten Konversationsablaufs, und da unter jedem Kommunikationsschritt Fragen mit den dazu gehörigen Antwortvarianten zu finden sind, kann das Programm dem Lerner die Kommunikationssätze des nächsten Kommunikationsschrittes anbieten, so dass der Lerner die Kommunikation fortsetzen kann.

Aus der obigen Analyse wird ersichtlich, dass die aktuellen Sprachlernprogramme die Fragen mit dazu gehörigen Antworten im Sprachdatenkorpus sammeln. Wenn das System die Fragen der Lerner im Datenkorpus findet, kann es sie beantworten. Aber selbst wenn ein Programm die Fragen des Lerners beantwortet, handelt es sich dabei - meist - nur um einen Mechanismus, der die mit der Frage verbundene Antwort angibt: Es scheint nur so, als könne das Programm den Lerner verstehen. Tatsächlich kann es die Fragen der Lerner inhaltlich jedoch nicht interpretieren. Um den Sinn der Lerneräußerungen zu verstehen, braucht das Sprachlernprogramm noch ein weiteres Modell.

Im Folgenden soll auf Rettungsmaßnahmen eingegangen werden, die die Software befähigen, den Kommunikationszweck der Lerner bei kommunikativem Misserfolg zu dekodieren.


3 Entwicklung von Rettungsmechanismen zur Vermeidung von Systemfehlschlägen

Im Folgenden soll statt eines linearen Systems ein zirkuläres entwickelt werden, das eine ungeplante Unterbrechung des Systems zu vermeiden hilft. Zur Entwicklung eines zirkulären Systems werden zunächst die in den Lernprogrammen vorkommenden Systemfehlschläge gesammelt und analysiert. Danach wird versucht, Rettungsmechanismen zu entwickeln, damit die Programme trotz der Systemfehlschläge weiter funktionieren können.

In dem vorliegenden Artikel geht es nicht nur darum, programmsystematisch bedingte Fehlschläge zu beseitigen, sondern vielmehr auch die Software darin zu unterstützen, die Kommunikationsabsicht des Lerners zu erkennen. Nur so kann ein Lernprogramm die Äußerungen des Lerners dekodieren: Selbst wenn die Spracherkennungstechnik die Äußerungen des Lerners akustisch identifiziert, kann sie den Kommunikationszweck des Lerners nicht dekodieren. Wir brauchen daher andere Lösungsmodelle zur Erkennung der Kommunikationsabsicht des Lerners. Seneff (2002) versucht, diese Kommunikationsabsicht des Lerners durch Fragen zu erkennen. Dabei bleibt jedoch unklar, wie das Programm erkennt, in welcher Situation sich der Lerner befindet, und somit welches Datenkorpus aktiviert wird. Chen (2009) versuchte anhand der Verhältnisgruppen Kommunikationssituation + Kommunikationsschritt + Fragen und dazugehörige Antworten, den Zweck des Lerners zu erkennen. Anhand der Äußerung des Lerners - also anhand von Sprache - erkennt die Software, in welcher Kommunikationssituation und in welchem Kommunikationsschritt sich der Lerner befindet (Chen 2009: 108f). Wenn das Programm die Äußerungen des Lerners hingegen nicht dekodieren oder der Lerner nicht weiter kommunizieren kann - also er nicht auf die Frage des Computers antworten kann -, kommt es zu Fehlschlägen. Dies führt dann dazu, dass das ganze Lernprogramm nicht funktioniert.

Wir versuchen nun durch ein innovatives Design, das mit Hilfe vorhandener Technik implementiert werden kann, solche Systemfehlschläge zu beseitigen. Es exisieren zwei Prinzipien, ein Modell zur Rettung der Kommunikation zu entwickeln:

a. Innovatives Design statt hochentwickelter Technik.

b. Festlegung der Variablen als Hilfe für die Dekodierung des Kommunikationszwecks: Durch die Beherrschung der Variablen der Kommunikation wird der Kommunikationszweck des Lerners leichter erkannt, und die Spracherkennung wird erleichtert. In jeder Kommunikation existieren viele Variablen und Entscheidungsmöglichkeiten, die es dem Programm erschweren, den Kommunikationszweck des Lerners korrekt zu dekodieren. Wenn die einzelnen Äußerungen dazu dienen, den Kommunikationszweck zu realisieren, wird folglich der Kommunikationszweck erkannt, bevor die einzelnen Äußerungen richtig dekodiert werden. Außerdem können viele Äußerungen einen gemeinsamen Zweck erfüllen. Deshalb sollte das Sprachlernprogramm bestenfalls die Kommunikationsabsicht der Lerner erkennen, um folglich sowohl den Sinn der einzelnen Äußerung richtig zu erkennen als auch die Äußerungen gleichen Zwecks korrekt zuordnen. Dies bedeutet, dass das Design des Programms zunächst den Kommunikationszweck feststellen muss, um anschließend erst seine Äußerungen richtig dekodieren zu können. Es muss z.B. beim Bewerbungsgespräch zunächst feststellen, um welche Stelle sich der Lerner bewirbt, weil jede Stelle eine andere fachliche Qualifikation verlangt und somit der inhaltliche Schwerpunkt der Kommunikation je nach Stellenangebot anders ist. So muss zunächst festgestellt werden, für welche Anzeige sich der Lerner interessiert oder der Lerner muss zunächst ein Bewerbungsformular ausfüllen, damit das Programm erkennen kann, um welche Stelle er sich bewirbt.4 Dann erst kann das Programm im Bewerbungsgespräch die zutreffenden Fragen stellen. Ein anderes Beispiel ist, dass der Inhalt der Kommunikation je nach Tätigkeit, die der Lerner auszuüben beabsichtigt (z.B. Schwimmen, Karten spielen, Bergsteigen), anders sein wird.5 In diesem Fall soll der Lerner das benötigte Werkzeug für seine Tätigkeit, wie z.B. den Badeanzug, das Kartenspiel oder den Rucksack, kaufen. Auf diese Weise erkennt die Software die Absicht des Lerners. Folglich müssen bei der Entwicklung der Software zunächst die Variablen der Kommunikation festgestellt und entsprechend behandelt werden, damit das Programm im Voraus den Kommunikationszweck des Lerners erkennen und dessen Äußerungen richtig dekodieren kann. Außerdem sollen die Anwender das Entscheidungsrecht behalten können, damit sie die Kommunikation auf natürliche Weise führen können.

Bei der Entwicklung eines Rettungsmodells, wird oft zuerst an die Technologie gedacht. Die Entwicklung eines Hochtechnologie-Modells ist jedoch zeit- und ressourcenintensiv. Zudem ist ein Hochtechnologie- Modell meist komplexer Art, so dass häufig Probleme auftreten. Daher soll möglichst ein innovatives Design bevorzugt werden.

In einer Lernsoftware kommen folgende Systemfehlschläge am häufigsten vor:
  1. Die Software kann die Aussprache des Lerners nicht erkennen.
  2. Die Software kann die Äußerung des Lerners nicht im Datenkorpus finden.
  3. Der Kommunikationszweck des Lerners ist schwer zu erkennen.
  4. Der Lerner weiß nicht, wie er weiter in der Fremdsprache kommunizieren kann.



Abb. 2: Rettungsmaßnahmen bei Misserfolgen in Sprachlernprogrammen

Um diesen in Sprachlernprogrammen häufig vorkommenden Systemfehlschlägen entgegenzuwirken, werden hier durch ein innovatives Design die folgenden Rettungsmaßnamen entwickelt (Abb. 2)

Im Folgenden wird darauf einzugehen sein, wie ein Sprachlernprogramm mit Hilfe der in dem vorliegenden Artikel entwickelten 13 Rettungsmaßnahmen die am häufigsten vorkommenden Systemfehlschläge beseitigen kann. Die entwickelten Rettungsmaßnahmen sollen dabei nicht als Einzelfälle angesehen werden, sondern haben für die Beseitigung der in der Software vorhandenen Fehlfunktionen Modellcharakter:
(A). Das Sprachlernprogramm kann die Aussprache des Lerners nicht erkennen, obwohl seine Äußerung sich im Datenkorpus befindet. In diesem Fall existieren folgende Lösungsmöglichkeiten:
  1. Die Aussprache der Lerner wird als Grundlage der Spracherkennung verwendet. Muttersprachler und ausländische Lerner sprechen zwar dieselbe Sprache und doch mit eigenen Variationen. Somit kann es vorkommen, dass das Sprachlernprogramm denselben Laut dieser beiden zu unterschiedlichen Modellen zuordnet. Das Programm sollte daher die Aussprache der Lerner, nicht jedoch diejenige der Muttersprachler als Erkennungsmodell zugrunde legen. Wenn z.B. das Programm die Aussprache der chinesischen Deutschlerner richtig erkennen will, muss es die deutsche Aussprache der chinesischen Lerner, nicht diejenige der deutscher Muttersprachler, als Erkennungsmodell verwenden. Somit werden die Chancen einer korrekten Zuordnung gesteigert.
  2. Das Lernprogramm fordert den Lerner auf, seine Äußerung umzuformulieren. Diese wird anschließend zur weiteren Bearbeitung an die Forschungsgruppe geschickt.
    Wenn das Programm die Äußerung des Lerners nicht interpretieren kann, fordert es ihn auf, sie umzuformulieren (wie z.B. „ Ich kann Sie nicht verstehen. Wiederholen Sie bitte“ oder „Verwenden Sie bitte andere Ausdrücke“), damit er erneut eine inhaltlich ähnliche Äußerung formuliert, die die Software im Datenkorpus gegebenenfalls finden kann. Gleichzeitig wird die Originaläußerung des Lerners an die Softwareentwickler geschickt, die diese in das Programm implementieren.
  3. Schriftliche Eingabemöglichkeiten anbieten.
    Wenn das Programm die Aussprache des Lerners nicht dekodieren kann, verliert dieser bald das Interesse daran, weiter zu kommunizieren. Deswegen bietet das Programm dem Lerner nach zweimaligem Systemfehlschlag an, die Äußerungen nicht erneut oral, sondern nunmehr über die Tastatur einzugeben, damit die Kommunikation fortgesetzt werden kann.
  4. Anhand von Stichwörter zu den Lerneräußerungen werden im Datenkorpus entsprechende Äußerungen gesucht und zur Auswahl angeboten.
    Wenn das Programm von der Äußerung des Lerners nur einzelne Wörter dekodieren kann, kann es die erkannten Wörter als Stichwörter verwenden und im Datenkorpus die entsprechenden Äußerungen suchen und sie dem Lerner zur Auswahl anbieten. Dieser muss anschließend die gewünschte Äußerung auswählen, so dass kann das Programm die Äußerungen des Lerners dekodieren kann.
  5. Mittels der sechs W-Fragen (Wer?, Wann?, Wie?, Wo?, Was?, Welcher?) kann der Kommunikationszweck des Lerners dekodiert werden.
    Wenn das Programm die Äußerung des Lerners nicht dekodieren kann, kann es ihm eine allgemeine W-Frage stellen, um so zu ermitteln, was der Lerner ausdrücken möchte. Anhand der entsprechenden Äußerung des Lerners, dass er beispielsweise ein Zimmer reservieren möchte, entschlüsselt die Software, dass er sich in der Hotel-Kommunikation befindet. Anhand der Äußerung, dass er Obst kaufen möchte, erkennt das Programm, dass er sich in der Einkaufssituation befindet.6

B. Das Lernprogramm kann die Äußerung des Lerners nicht im Datenkorpus finden: Bei der ersten Maßnahme war die Äußerung des Lerners im Datenkorpus zu finden. Jedoch konnte das Programm die Aussprache des Lerners nicht dekodieren. Im vorliegenden Fall existiert die Äußerung des Lerners nicht im Datenkorpus. Die Lösung des Problems kann in folgende Weise erfolgen:

6. Die Kommunikationssituation wird eingeschränkt. Daraus folgt, dass das Datenkorpus auf bestimmte Kommunikationssituationen begrenzt wird und sich so die Zuordnungsmöglichkeit erhöht.

Ein Computerprogramm verfügt meist über ein Datenkorpus. Sobald das System einen Satz des Lerners wahrnimmt, vergleicht es ihn mit den Sätzen aus dem Datenkorpus. Wenn ein Datenkorpus sehr groß ist, ist dieser Vergleich sehr zeitintensiv. Das Programm kann aus diesem Grund nicht schnell genug reagieren, so dass die Kommunikation schnell langweilig sein wird. Wenn man die Anzahl der Kommunikationssituationen reduziert, können für jede ausgewählte Kommunikationssituation mehr Sätze aufgenommen werden. Somit kann das Programm die Lerneräußerungen leichter im Datenkorpus finden und diese dann dekodieren. Es erhöht sich so die Zuordnungsmöglichkeit der Lerneräußerungen. Kann das Programm die Lerneräußerung immer noch nicht problemlos zuordnen, werden die Auswahlmöglichkeiten innerhalb derselben Situation weiterhin eingrenzt: Das Einkaufszentrum bietet z.B. nur bestimmte Produkte wie Äpfel, Birnen oder Eier an. In der Bank finden sich beispielsweise nur zwei Schalter zur Auswahl (Geldwechsel und Geldabhebung). Durch die Einschränkung der angebotenen Mittel kann der Lerner nur die entsprechende Kommunikation durchführen, wodurch die sprachlichen Variationen reduziert werden. Auf diese Weise erfolgt die Zuordnung der Lerneräußerungen mit denen aus dem Datenkorpus nicht nur problemloser, sondern auch exakter.

7. Mit Hilfe eines Synonymwörterbuches steigt die Zuordnungsmöglichkeiten.
Da unterschiedliche Ausdrücke bedeutungsgleich verwendet werden können, z. B. „wie teuer?“ ein Synonym für „wie viel kostet?“ ist, erhöhen sich mit der Verwendung eines Synonymwörterbuchs die Zuordnungsmöglichkeiten. Folglich reduziert sich die Belastung des Datenkorpus‘.

Außerdem können die Rettungsmaßnahmen 2, 3, 4 und 5 aktiviert werden. Bei Rettungsmaßnahme 2 wird der Lerner darum gebeten, die Originaläußerung umzuformulieren, damit es die neue Äußerung gegebenenfalls im Datenkorpus finden kann. Mit der Rettungsmaßnahme 3 bietet das Sprachlernprogramm dem Lerner eine schriftliche Eingabemöglichkeit, damit es die Lerneräußerung besser interpretieren kann. Wenn das Lernprogramm die Lerneräußerung nur zum Teil dekodieren kann, kann es mit Rettungsmaßnahme 4 die dekodierten Wörter als Stichwörter im Datenkorpus den bereits entschlüsselten Äußerungen, die diese Wörter enthalten, zuordnen und versteht so den Lerner. Mittels der 5. Rettungsmaßnahme stellt das System 6W-Fragen an den Lerner, damit es an der nächsten Äußerung die Redeabsicht des Lerners erkennen kann.

(8) Äußerungen, die im Datenkorpus nicht vorhanden sind, werden an die Forschungsgruppe / Softwareentwickler weitergeleitet und in das Datenkorpus aufgenommen.
Die neuen Äußerungen des Lerners werden überprüft und in das Datenkorpus aufgenommen, damit das Programm sie in Zukunft erkennen kann. Dadurch wird das Korpus inhaltlich immer wieder erneuert und somit umfangreicher.
Dabei können die Rettungsmaßnahmen von 2, 3, 4 und 5 aktiviert werden. Somit ist die Reihenfolge der Rettungsmaßnahmen 6, 7, 2, 8, 3, 4 und 5 (s. Abb. 2).

(C) Der Kommunikationszweck des Lerners ist schwer zu erkennen. Hier greifen die folgenden Möglichkeiten der Abhilfe:

(9) Durch die Auswahl der angebotenen Mittel kann das Programm den Kommunikationszweck des Lerners erkennen: Bei der Kommunikation über Sport oder Hobbys bietet das Computerprogramm dem Lerner eine Auswahl an Sportwerkzeugen wie z.B. ein Schwert, einen Fußball oder einen Volleyball an. An der Auswahl des Lerners erkennt es, welchen Sport er treibt und welchem Hobby er nachgeht. Im weiteren Verlauf bittet das Sprachlernprogramm den Lerner, einen Geldbetrag zu definieren. Am Preis der Ware und am Geldbetrag des Kunden kann das Programm als Geschäftsbesitzer ausrechnen, wie viel Geld es dem Kunden (also dem Lerner) nach dem Einkaufen zurückgeben soll.

Ein weiteres Beispiel ist die Auswahl einer Arztpraxis (Zahnarzt, Augenarzt, Hals-Nasen-Ohren-Arzt) durch den Lerner. An dieser Auswahl erkennt das Programm, woran der Lerner erkrankt ist, welches Medikament es dem Lerner verordnen und welches Rezept es ihm ausstellen soll.7 Außerdem kann die 5. Rettungsmaßnahme aktiviert werden. Die Software stellt dem Lerner Fragen zwecks Entschlüsselung seines Kommunikationszwecks, wie z.B. „Was wollen Sie?“, „ Wie kann ich Ihnen helfen?“, „Wann soll es geschehen?“.

Zu den bereits beschriebenen tritt die folgende Rettungsmaßnahme:

(10) Durch eigenes Nachfragens kann das Lernprogramm ein Nichtverstehen in Verstehen umwandeln.

Falls das Programm den Kommunikationszweck oder die Äußerung des Lerners nicht versteht, kann es Rettungsmaßnahme 5 aktivieren. Dabei kann es dem Lerner zur Dekodierung seiner Kommunikationsabsicht die genannten W-Fragen stellen. Diese werden nur dann eingesetzt, wenn das Programm die Lerneräußerungen gar nicht dekodieren kann. Wenn es die Äußerung des Lerners nur zum Teil nicht versteht, kann es beim Lerner nachfragen, um den Verstehensprozess zu vervollständigen. Ein Beispiel:
Der Lerner äußert: „Ich möchte Äpfel kaufen“. Die Software versteht jedoch das pluralische Substantiv Äpfel nicht. Anschließend formuliert es diese Lerneräußerung in eine Frage um. Was nicht verstanden wurde, wird in ein Fragewort umgewandelt. In dem Fall „Ich möchte Äpfel kaufen“ wird „Äpfel“ durch „was“ ersetzt zu: „Ich möchte was kaufen“. Danach wird das Pronomen „ich“ in „Sie“ umgewandelt, um den Lerner zu fragen: „Was möchten Sie kaufen?“
Somit kann das Programm auf eigene Initiative durch Nachfragen das Nichtverstandene ins Verstehen umgewandelt.8 Die Reihenfolge der Rettungsmodelle ist hier 9, 10 und 5 (Abb. 2). 9

(D) Der Lerner weiss nicht, wie er weiter mit dem System kommunizieren soll. Bei der Kommunikation mit der Software treten nicht nur Probleme seitens des Sprachlernprogramms, sondern auch auf Seiten des Lerners auf, so zum Beispiel dann, wenn er nicht weiter in der Fremdsprache kommunizieren kann.

11. Unter Einsatz der Verhältnisgruppen KommunikationssituationKommunikationsschritt Fragen mit dazugehöriger Antwort kann das Programm dem Lerner die benötigten Sätze anbieten, damit er weiter kommunizieren kann.

Im Datenkorpus wird nach dem Modell von Chen (2009) eine Verhältnisgruppe KommunikationssituationKommunikationsschritt Fragen mit dazugehöriger Antwort gebildet. Anhand dieser Verhältnisgruppe erkennt das Programm an der Äußerung des Lerners, in welcher Situation und in welchem Kommunikationsschritt sich dieser befindet. Wenn der Lerner das Gespräch unterbricht oder nicht weiter weiß, kann das Sprachlernprogramm ihm die Sätze des jeweiligen Kommunikationsschrittes sowie diejenigen der nächsten Kommunikationsschritte anbieten, damit die Kommunikation fortgeführt werden kann.

Sollte der Lerner die Äußerung nicht vollständig formulieren können, kann das Sprachlernprogramm mittels der Stichwörter der Lerneräußerung im Datenkorpus der Software die entsprechenden Äußerungen zur Auswahl anbieten, damit der Lerner weiter kommunizieren kann (s. Rettungsmaßnahme 4).10

12. Mit zweisprachig parallelen Datenkorpora oder Nachschlagewerken kann der Lerner die benötigten Sätze finden und somit in der Fremdsprache kommunizieren.
Wenn die fremdsprachliche Kommunikation vom Lerner unterbrochen wird, liegt es oft daran, dass dieser nicht weiß, wie er seine eigenen Gedanken in der Fremdsprache ausdrücken soll. Mit Hilfe des zweisprachigen Nachschlageprogramms - wie z.B. des deutsch-chinesischen Sprachlernprogramms (Chen 2008a und Chen 2008b) - kann er vollständige fremdsprachlichen Sätze finden.11

13. Der digitale Assistent kann eine vollständige Kommunikation vorspielen, damit der Lerner sie nachahmt.

Sollte der Lerner nicht weiter wissen, kann das Sprachlernprogramm (Chen 2009) ihm die entsprechenden Sätze des jeweiligen Kommunikationsschrittes bzw. diejenigen des nächsten Kommunikationsschrittes anbieten. Falls der Lerner trotzdem nicht weiter weiss, wird der digitale Assistent aktiviert. Er spielt dem Lerner - je nach seinem eigenen Bedarf und seiner eigenen Entscheidung - entweder den jeweiligen Kommunikationsschritt oder die ganze Kommunikation vor. Die jeweilige Kommunikation steht ihm dabei in vollständiger Form und in die verschiedenen Kommunikationsschritte untergliedert zur Verfügung, so dass der Lerner auswählen kann, ob der jeweilige Kommunikationsschritt oder die gesamte Kommunikation angezeigt werden soll.12 Die Reihenfolge der Rettungsmaßnahmen ist dabei 11, 4, 12 und 13 (Abb. 2).


4   Abschließende Bemerkungen

Weder in der Fachliteratur noch in den meisten, derzeit auf dem Markt befindlichen Sprachlernprogrammen werden mögliche Systemfehlschläge in der Kommunikation behandelt. Folglich werden die Programme oft unplanmäßig unterbrochen und die Anwender verlieren schnell die Geduld an der Beschäftigung mit ihnen. Im vorliegenden Artikel wird zunächst festgestellt, welche Systemfehlschläge der derzeitigen Programme bei der Spracherkennung am häufigsten vorkommen. Daraufhin werden entsprechende Rettungsmaßnahmen analysiert und Vorschläge dahingehend gemacht, die Wirkungsweise der Lernprogramme zur verbessern, um letztlich kommunikative Misserfolge zu beseitigen.

Bei der Entwicklung von Lösungsmodellen denkt man meist an hochentwickelte Technologie. Ein Hochtechnologie-Modell erfordert jedoch viel Energie und zudem einiges an finanziellen Mitteln. Außerdem sind Hochtechnologie-Modelle oft so kompliziert, dass sie recht fragil sind. Vorteile gegenüber Hightech-Systemen bietet daher ein innovatives Design, das mittels vorhandener Technik implementiert werden kann.

Die Spracherkennungstechnik kann bislang nur die wörtliche Bedeutung der Lerneräußerungen, aber kaum deren Kommunikationszweck erkennen. Erst nachdem ein System den Kommunikationszweck des Lerners erkannt hat, kann es jedoch dessen Äußerungen inhaltlich korrekt dekodieren. Ein innovatives Design der Sprachlernprogramme soll dem Lerner zudem das Entscheidungsrecht hinsichtlich seiner eigenen Äußerungen gewähren. Mit dieser Einschränkung ergeben sich bei dem Design die folgenden Prinzipien, mit denen das Programm den Kommunikationszweck des Lerners besser erkennen und potentielle Systemfehlschläge beseitigen kann:
  1. Durch die Verhältnisgruppe wird der Kommunikationszweck erkannt.
    Werden zwei Kommunikationsvariablen in ein Verhältnis setzt, kann das Programm mittels der einen die andere Variable dekodieren. Bildet das Lernprogramm (Chen 2009) aus Kommunikationssituation, Kommunikationsschritt und Fragen mit dazugehörigen Antworten eine Verhältnisgruppe, so kann es an der Äußerung des Lerners erkennen, in welcher Situation und in welchem Kommunikationsschritt er sich befindet. Folglich versteht es den Lerner besser.
  2. Durch die Auswahl des Lerners erkennt die Software den Kommunikationszweck.
    Bietet das Konversationssystem dem Lerner eine Kommunikationssituation anhand verschiedener Elemente zur Auswahl an, kann es die Redeabsicht des Lerners anhand der von ihm getroffenen Auswahl erkennen. Entsprechend kann es dessen Äußerungen adäquater dekodieren.
  3. Durch gezielte Fragen erkennt das Programm den jeweiligen Kommunikationszweck.
    Wenn das System den Kommunikationszweck des Lerners nicht interpretieren kann, stellt es ihm zielgerichtete Fragen zur Entschlüsselung seiner Redeabsicht. Erkennt das Programm eine Äußerung des Lerners nur zum Teil - d.h. ist der Dekodierungsprozess unvollständig -, kann es mit Hilfe der Äußerung des Lerners die entsprechende Frage umformulieren, um das Nichtverstehen in ein Verstehen umzuwandeln.
  4. Wenn der Lerner nicht weiterkommt, bietet ihm das Sprachlernprogramm die benötigten Informationen oder Hilfsmittel an, die ihm eine Fortsetzung der Kommunikation ermöglichen.
    Wenn der Lerner an einem Punkt nicht weiter weiß, muss das Programm die Konversation mittels folgender Maßnahmen retten: Es bietet dem Lerner zweisprachige Nachschlagewerke, Internetquellen, oder auch die benötigten Kommunikationselemente an oder zeigt ihm mittels digitalem Assistenten, wie er weiter kommunizieren kann.
In dem vorliegenden Artikel wird verdeutlicht, dass ein problemlos funktionierendes Sprachlernprogramm nicht ausschließlich auf ausgefeilter Technologie beruhen muss. Funktionstüchtigkeit und Zuverlässigkeit einer Software zur Verbesserung fremdsprachlicher Kommunikation werden eher dann sicher gestellt, wenn letztere - insbesondere die Implementierung ihrer Rettungsmechanismen - auf effektivem Design statt auf Hochtechnologie beruht. In diesem Zusammenhang stellt auch die Reduzierung der (Entwicklungs)Kosten einen wesentlichen Faktor dar.


Literatur

Chang, Hung-An & Glass, James (2011). Multi-level Context-dependent Acoustic Modeling for Automatic Speech Recognition. Proc. ASRU, Waikoloa, Hawaii, December, 89-94.

Chen, Shing-lung (2008a). The foreign language learning assistance-system by means of searching the foreign language equivalents of the mother language – Using German-Chinese and Chinese-German as an example. In: Language, Literary Studies and International Studies: An International Journal (THCI), 89-112.

Chen, Shing-lung (2008b). Developing a Model for the Chinese- German Corpus of Communication Sentences. In: Journal of European Languages, 44-73.

Chen, Shing-lung (2009). Developing a Model for Interactive Conversation Systems. In: Journal of Applied Foreign Languages, 95-122.

Dehak, Najim; Torres-Carrasquillo, Pedro A; Reynolds, Douglas & Dehak, Reda (2011) .Language Recognition via Ivectors and Dimensionality Reduction. In: Proc. Interspeech, 857-860.

Just talk. Sohomedia (1999). Taipei: Sohomedia.

Just talk. Handbook ( 1999). Taipei: Sohomedia.

Litman, Diane & Scott Silliman (2004). ITSPOKE: An intelligent tutoring spoken dialogue system. In Proceedings of the Human Language. Technology Conference /Third Meeting of the North American Chapter of the Association for Computational Linguistics (HLT/NAACL) (Companion Vol.), 233-236.

Qin, Jun-hong & Zhang, De-lu (2005). Der Sprechwechsel in der Kommunikation im Internet. [網上會話中的話輪轉換] In: Wai Yu Dian Hua Jiao Xue, 41-45.

Seneff, Stephanie. (2002). Response Planning and Generation in the Mercury Flight Reservation System. In: Computer Speech and Language, Volume 16, 283–312.

Seneff, Stephanie. & Polifroni, Joseph H. (2000). Dialogue management in the Mercury flight reservation system. In: Proceeding ANLP/ NAACL-ConvSyst '00 Proceedings of the 2000 ANLP/NAACL Workshop on Conversational systems. Volume 3. 11-16.

Tell me More (2006). Premium 8.0 DaF 1-3 . ScanSoft. Köln : Auralog.

Yang, ping (2007). Die Analyse der Sprechhandlungsklassifikation in Gesprächen der Natursprachen [面向自然語言處理的會話行為分類研究]. In: Applied Linguistics (Yu Yan Wen Zi Ying Yong). 128-135.


Zue, Victor (1985). The Use of Speech Knowledge in Speech Recognition, In: Invited paper, Special issue on Man-Machine Communication, Proc. IEEE, vol. 73, no. 11, 1602-1615.



Autorin:
Prof. Dr. Shing-Lung Chen  
National Kaohsiung First University of Science and Technology (NKFUST)
Seminar für deutsche Sprache und Literatur,
2, Jhuoyue Rd.
Nanzih District
Kaohsiung City 811
Taiwan, R.O.C.
E-Mail: chensl@nkfust.edu.tw




2Das System „Itspoke“ sammelt die Erklärungen von Tutoren über Fragen zu Begriffen aus der Physik. Diese Methode hat u.E. den Vorteil, dass Studierenden die Erklärungen ihrer Kommilitonen (Tutoren) besser verstehen können als die Erklärungen ihrer Professoren.

3 Ein weiteres Beispiel ist die Hotel-Kommunikation. An der Frage nach dem Preis für die Übernachtung erkennt das System, dass der Lerner sich in der Hotelkommunikation befindet und zwar im Kommunikationsschritt Feststellung des Preises.

4 Das Programm kann den Lerner am Anfang des Gesprächs fragen, um welche Stelle er sich bewerben will. Wenn das Programm erst im Gespräch danach fragt, kann es nicht rechtzeitig das entsprechende Sprachdatenkorpus für diese Stelle finden. Aus diesem Grunde sollte diese Feststellung möglichst vor der Konversation stattfinden.

5 Im Internet gibt es viele Sprachlernprogramme (wie z.B.: http://www.cola.itri.org.tw) in der Form einer Pfadlandkarte, auf der die Kommunikationssituationen aufgelistet werden. Nachdem der Lerner eine Kommunikationssituation ausgewählt hat, werden bei jeder Frage drei Antworten zur Auswahl angeboten, damit das Programm die Antwort des Lerners dekodieren kann. Dies zeigt an, dass es in der Kommunikation viele Variablen gibt, die dazu führen können, den Lerner falsch zu verstehen. Bei einem solchen Programm kann der Lerner nur schriftlich und nicht frei kommunizieren.

6 Falls an der Äußerung des Lerners das Sprachprogramm nicht erkennen kann, in welcher Situation er sich genau befindet, kann es weiterhin eine Auswahlfrage stellen. An der Äußerung „Wie ist der Preis?“ kann es beispielsweise nicht feststellen, ob der Lerner sich im Hotel, beim Einkaufen oder beim Reisebüro befindet. In diesem Falle kann es ihm eine Auswahlfrage (z.B. „ Sind Sie im Hotel, im Restaurant oder ...“) stellen, um zu ermitteln, wo er sich gerade befindet.

7 Bei dieser Lösungsmöglichkeit kann der Lerner die Kommunikationssituation Stadtbummel auswählen. Mit der Auswahl weiß das Programm, in welcher Situation er sich befindet, und kann das entsprechende Teilkorpus aktiviert.

8 Der Unterschied zwischen der 5. und der 10. Rettungsmaßnahme besteht darin, dass die 5. Rettungsmaßnahme mittels der W-Fragen den Kommunikationszweck des Lerners zu ermitteln versucht, während die 10. Rettungsmaßnahme die Äußerung des Lerners in eine Frage umformuliert, um das Nichtverstehen der Teilinformation in ein Verstehen umzuwandeln.

9 Die Reihenfolge der Maßnahmen lässt sich in Abhängigkeit von dem jeweiligen Problem ändern.

10 In dem Fall, dass der Lerner sich nicht vollständig äußert, soll das Programm planmäßig die vom Lerner geäußerten Stichwörter sowohl im Datenkorpus der Software als auch im Internet suchen und denn Lerner einen entsprechenden Satz zur Auswahl anbieten, damit das Programm erkennt, was er gemeint hat. Wenn der Lerner aber die Option einer Äußerung aus dem Internet auswählt und diese im Datenkorpus nicht zu finden ist, kann das Programm nicht adäquat darauf reagieren. Aus diesem Grunde soll das Programm mit der unvollständigen Äußerung des Lerners nur in seinem eigenen Datenkorpus nach entsprechenden, vollständigen Sätzen suchen.
11 In dem deutsch-chinesischen und chinesisch-deutschen Sprachlernprogramm (Chen 2008b) können mittels deutscher Ausdrücke vollständige chinesischen Sätze sowie mittels chinesischer Ausdrücke vollständige deutschen Sätze gefunden werden. Die derzeitigen Suchsysteme geben dem Lerner direkt die fremdsprachlichen Ausdrücke an, und der Lerner soll anhand der fremdsprachlichen Kenntnisse einen Ausdruck auswählen. Dagegen stellt das Lernprogramm von Chen (2008b) gemäß dem muttersprachlichen Suchbefehl eine Reihe muttersprachlicher Sätze zur Auswahl, so dass der Lerner anhand seiner eigenen muttersprachlichen Kenntnisse die gewünschten Sätze auswählt. Erst danach erscheinen die fremdsprachlichen Entsprechungen der gewählten muttersprachlichen Sätze. Somit kann der Lerner auf der Basis seiner muttersprachlichen Kenntnisse den zutreffenden fremdsprachlichen Ausdruck finden.

12 Falls das Sprachlernprogramm erkennt, dass der Lerner jedes Mal nur bestimmte Kommunikationssituationen auswählt (wie z.B. nur die Situation Einkaufszentrum, Postamt oder Bank), bietet es dem Lerner beim nächsten Mal andere Situationen zur Auswahl an (z.B. die Situationen Bibliothek, Arztpraxis oder Hotel), damit er seinen Lernhorizont erweitert.