Den gesamten Duolingo-Baum abzuschließen, eine Streak von tausend Tagen zu halten und trotzdem zu verstummen, wenn ein Kellner eine einfache Frage stellt, das ist kein persönliches Versagen. Die Hauptlektionen von Duolingo trainieren, Sprache zu erkennen und abzurufen, nicht sie zu produzieren. Erkennen und Produzieren sind verschiedene Fähigkeiten, und die, die das Sprechen ermöglicht, übt das kostenlose Produkt am wenigsten. Hier ist der Grund, und was die Lücke schließt.

Erkennen ist nicht Produzieren

Den größten Teil der Zeit in Duolingo verbringt man mit Auswählen, nicht mit Erstellen. Man wählt Wörter aus einem Wortpool. Man wählt zwischen Multiple-Choice-Antworten. Man tippt die Kacheln in der richtigen Reihenfolge. Laut Duolingos eigener Beschreibung seines Ansatzes zu Sprechfertigkeiten bitten selbst die Sprechübungen darum, Wörter zu wiederholen, einen Satz laut zu übersetzen oder eine Antwort zu sprechen statt zu tippen. Das Mikrofon vergleicht die Aussprache mit einem Muttersprachler-Modell und hebt Wörter hervor.

Das ist genuinement nützlich. Es baut Verständnis, Wortschatz und Aussprache auf. Aber man beachte, was all diese Aufgaben gemeinsam haben: Die Sprache steht bereits auf dem Bildschirm. Man reproduziert einen Satz, den die App geliefert hat. Man erkennt die richtige Antwort unter Optionen, oder imitiert ein Modell.

Sprechen ist die entgegengesetzte Bewegung. Niemand liefert den Satz. Man hat einen Gedanken, und muss ihn in der Zielsprache zusammensetzen, in Echtzeit, während eine andere Person wartet und dann etwas sagt, das man nicht geplant hat. Die Kacheln sind weg. Die Optionen sind weg. Das ist ein anderer kognitiver Akt, und er ist der, den der Lektionenbaum selten einfordert.

Was die Forschung dazu sagt

Die klarste Erklärung kommt von der Linguistin Merrill Swain. Bei der Arbeit mit kanadischen Schülern in französischer Immersion in den 1980er Jahren bemerkte sie etwas Merkwürdiges: Nach Jahren der Immersion verstanden die Schüler Französisch fast perfekt, aber ihre Sprachproduktion lag weit zurück. Verständlicher Input allein hatte keine fließenden Sprecher erzeugt.

Ihre Schlussfolgerung wurde zur Output-Hypothese: Sprache zu produzieren, nicht nur zu verstehen, ist das, was den Spracherwerb antreibt. Produzieren erzwingt drei Dinge, die Input nicht kann. Man bemerkt die Lücke zwischen dem, was man sagen will, und dem, was man sagen kann. Man testet eine Hypothese darüber, wie die Sprache funktioniert, und stellt durch die Reaktion fest, ob sie hält. Und man reflektiert bewusst über die Struktur, was hilft, sie zu verankern. Das ist der Motor des Sprechens, und er läuft nur, wenn man die eigene Sprache produziert.

Stephen Krashens Input-Hypothese ist das bekannte Gegengewicht: die Idee, dass verständlicher Input der Hauptantrieb ist. Die beiden sind keine Gegner. Man braucht Input zum Verstehen und Produktion zum Sprechen. Das Problem ist, dass erkennungsbasiertes Üben viel von Ersterem und sehr wenig von Letzterem liefert. Das Ergebnis ist ein Lernender, der viel versteht und auf Abruf kaum etwas produzieren kann. Das ist genau die Erfahrung des Duolingo-Veteranen: man liest die Speisekarte problemlos, wird dann aber still, wenn man gefragt wird, was man möchte.

Das Einfrieren ist real, und hat einen Namen

Es gibt einen Grund, warum das Schweigen sich fast körperlich anfühlt. Das Unbehagen, in einer noch nicht beherrschten Sprache bloßgestellt zu werden, ist als Fremdsprachenangst dokumentiert. Eines ihrer Kernkomponenten ist Kommunikationsangst, die Angst, mit oder vor anderen zu sprechen. Sie treibt Lernende zur Vermeidung: Schweigen, um das Risiko eines Fehlers und das darauf folgende Urteil zu umgehen.

Hier liegt die Falle. Das Einzige, was diese Angst abbaut, ist genau das, was sie vermeiden lässt: sprechen, oft, in Situationen mit geringem Einsatz, bis es aufhört, wie eine Darbietung zu wirken. Eine erkennungsbasierte App löst diese Angst nie aus, weil man nie wirklich bloßgestellt wird, und desensibilisiert daher auch nicht dagegen. Das erste Mal vor einem echten Gespräch ist das Einfrieren ungemindert, egal wie viele Lektionen man hinter sich hat.

Anerkennung, wo sie verdient ist: Duolingo hat echtes Gespräch

Das ist wichtig, und es ist der Punkt, an dem viele Kritiken des Typs „Duolingo kann nicht Sprechen beibringen" falsch liegen. Duolingo hat eine genuinement offene Gesprächsfunktion, und sie ist gut.

Sie heißt Videoanruf mit Lily. In Duolingos eigenen Worten kann man Lily anrufen, um ein „spontanes, freies Gespräch in der Zielsprache" zu führen. Lily beginnt, man kann über alles sprechen und sie bitten, langsamer zu sprechen oder zu wiederholen. Das ist echte Produktion, die Art, die die Output-Hypothese für nötig hält. Es ist keine geführte Übung.

Das ehrliche Argument gegen das Verlassen darauf ist nicht, dass sie nicht existiert. Es geht um Zugang und Dosis. Der Videoanruf mit Lily ist nur für Abonnenten von Duolingo Max verfügbar, dem teuersten Niveau des Unternehmens, und Gespräche sind kurz von Natur: etwa eine Minute zu Kursbeginn, bis zu etwa drei Minuten mit fortschreitendem Kurs. Er deckt sechs Sprachen auf allen Plattformen ab (Englisch, Spanisch, Französisch, Deutsch, Italienisch und Portugiesisch), plus Japanisch und Koreanisch auf iOS. Die einzige Funktion, die echte Produktion trainiert, ist also die, die die meisten Menschen im kostenlosen Produkt nie anfassen. Die Standarderfahrung bleibt Erkennung. Die Produktion lebt hinter der Zahlschranke, in kurzen Schüben.

Was die Lücke wirklich schließt

Wenn die fehlende Fähigkeit das Produzieren eigener scriptfreier Sprache ist, lautet die Lösung: eigene scriptfreie Sprache produzieren, häufig, mit jemandem, der antwortet. Das ist die gesamte Empfehlung. Es ist auch der Teil, der genuinement schwer zu organisieren ist, weshalb die meisten Lernenden ihn auslassen. Man braucht einen geduldigen Partner, einen Rhythmus und genug Mut, unbeholfen zu klingen. Wir haben darüber geschrieben, wie sich das in den Alltag integrieren lässt, in der Wissenschaft der Sprachimmersion zu Hause, und wie die effizientesten Lernenden Sprechen über Perfektion stellen, in was Polyglotten anders machen.

Mintza wurde gebaut, um die Reibung bei diesem einen fehlenden Stück zu beseitigen. Es ist ein KI-Sprachlehrer, mit dem man in einem echten, offenen, gesprochenen Gespräch über alles reden kann. Kein Skript, kein Multiple-Choice, keine Kacheln. Es antwortet in Echtzeit wie eine Person und folgt, wohin man das Gespräch lenkt, was bedeutet: man tut das, was der Lektionenbaum selten einfordert, nämlich eigene Sätze auf der Stelle generieren und eine Antwort erhalten.

Einige Eigenschaften machen es praktisch für den Lernenden, der nach Duolingo stecken geblieben ist:

  • Es hilft, wenn man feststeckt. Wenn man blockiert, wechselt Mintza zur bereits beherrschten Sprache, hilft und führt zurück. Man bleibt nie mitten in einem Satz stecken, was meist der Moment ist, der ein echtes Gespräch beendet und die Angst nährt.
  • Es trifft einen dort, wo man steht. Vier Niveaus, Einstieg, Anfänger, Mittelstufe und Fortgeschrittene, mit Wortschatz und Tempo angepasst. Man kann auch einen regionalen Akzent wählen, britisches oder australisches Englisch, Spanisch aus Madrid oder Buenos Aires, und andere.
  • Es erinnert sich. Es speichert vergangene Gespräche und gewählte Themen, sodass man Kontinuität aufbaut statt jedes Mal von vorn zu beginnen.
  • Es gibt Raum. Gespräche dauern bis zu 30 Minuten, ohne tägliches Limit. Das reicht, um sich einzusprechen und die Befangenheit zu verlieren, nicht das Ein-bis-drei-Minuten-Fenster eines Premium-Ergänzungstools.

Es deckt fünfzehn Sprachen in beide Richtungen ab: Englisch, Spanisch, Portugiesisch, Französisch, Italienisch, Deutsch, Griechisch, Chinesisch, Russisch, Türkisch, Schwedisch, Arabisch, Japanisch, Koreanisch und Hebräisch. Man startet mit 10 kostenlosen Minuten, ohne Abonnement und ohne Karte, und diese Minuten verfallen nie. Bezahlpläne sind einfache monatliche Minutenpools: Basic für $22.99 mit 180 Minuten, Plus für $39.99 mit 360 Minuten und Pro für $59.99 mit 600 Minuten, jederzeit kündbar. Eine Internetverbindung ist erforderlich, weil das Gespräch in Echtzeit von KI verarbeitet wird, und die Stimme wird live gestreamt, nicht aufgezeichnet oder gespeichert.

Das ehrliche Fazit

Duolingo ist ein gutes Werkzeug für das, was seine Hauptlektionen tatsächlich trainieren: Wörter erkennen, Wortschatz abrufen und Aussprache gegenüber einem Modell üben. Wer den Baum beendet hat und immer noch nicht sprechen kann, dem gegenüber hat die App nicht versagt. Man hat schlicht nie die andere Fähigkeit geübt, die Sprechen erfordert, weil das Hauptprodukt einem die Sprache meist liefert, statt zu fordern, sie zu produzieren. Duolingos einzige Funktion, die echtes offenes Gespräch trainiert, der Videoanruf mit Lily, ist real und verdient Anerkennung, aber sie lebt hinter dem teuersten Niveau und läuft in kurzen Schüben.

Der Weg zum Sprechen ist nicht mehr Erkennung. Es ist Produktion, häufig, mit Rückmeldung, bis eigene Sätze ohne Verzögerung kommen. Das ist genau die Lücke, für die Mintza gebaut wurde.

Mintza ist verfügbar für iOS und Android.