Hinter dem Erlernen der meisten Sprachen steckt eine stille Annahme: dass die schwierigsten Teile die wichtigsten sind. Dass man die Sprache verdient hat, wenn man die Töne des Mandarins, die Fälle des Russischen, das Geschlecht im Deutschen oder eine makellose Pariser Aussprache beherrscht. Schwierigkeit fühlt sich wie Tugend an, wie die echte Arbeit. Aber Schwierigkeit und Wert sind nicht dasselbe, und sie zu verwechseln ist einer der kostspieligsten Fehler, den Lernende machen können. Die Merkmale, die am schwierigsten wirken, sind oft jene, die am wenigsten darüber entscheiden, ob man verstanden wird.
Schwierigkeit ist relativ, keine Eigenschaft der Sprache
Das Erste, was auffällt: “Schwer” ist keine feste Eigenschaft einer Sprache. Es hängt vollständig davon ab, wo man steht.
Den klarsten Beleg liefert das Foreign Service Institute, die Schule des US-Außenministeriums für Diplomaten. Jahrzehntelang hat das FSI gemessen, wie lange ein englischer Muttersprachler ungefähr braucht, um die Allgemeine Berufskompetenz zu erreichen, etwa B2 bis C1 auf dem europäischen Referenzrahmen. Spanisch, Französisch, Italienisch und Portugiesisch liegen in der leichtesten Gruppe, mit etwa 600 bis 750 Unterrichtsstunden. Mandarin, Japanisch, Koreanisch und Arabisch liegen in der schwersten, mit rund 2.200 Stunden. Der Unterschied besteht nicht, weil Japanisch von Natur aus komplizierter wäre als Spanisch. Er besteht, weil Japanisch weiter vom Englischen entfernt ist. Ein koreanischer Muttersprachler würde Japanisch weit leichter finden als Spanisch, und die FSI-Zahlen würden sich umkehren.
Das ist wichtig, weil es die gesamte Idee einer “schweren Sprache” neu rahmt. Es gibt kein universelles Schwierigkeitsranking. Es gibt nur den Abstand zu dem, was man bereits kennt. Die schwierigen Teile der Zielsprache sind schlicht jene, die sich nicht auf die Muttersprache abbilden lassen. Sie fühlen sich wie die Essenz der Herausforderung an, sind aber in Wirklichkeit nur die Reibung der Übersetzung zwischen zwei spezifischen Systemen.
Die schwierigsten Merkmale tragen am wenigsten
Jetzt die nützlichere Beobachtung. Selbst innerhalb einer einzelnen Sprache sind die Merkmale, die Menschen als den schwierigen Teil behandeln, jene, auf die sie das Sprechen verschieben, bis sie sie beherrschen, meist jene, die am wenigsten dazu beitragen, verstanden zu werden.
Was bricht das Verstehen wirklich? Sagt jemand “Ich gegessen einen Sandwich gestern,” versteht jeder Deutschsprachige es sofort. Der Fehler liegt im grammatikalischen Gerüst, der falschen Verbform, und kostet nichts. Greift man aber nach dem Wort “Sandwich” und sagt stattdessen “Briefmarke,” bricht der Satz zusammen. Der Zuhörer hat keine Ahnung, was man gegessen hat. Das Inhaltswort hat die ganze Arbeit geleistet. Die Grammatik war fast dekorativ.
Das ist nicht nur Intuition. Forschung dazu, welche Fehler Lesende tatsächlich bemerken, bestätigt es. Eine Studie von 2023 in Frontiers in Psychology mit dem Titel Not all grammar errors are equally noticed fand genau das: Fehler sind nicht austauschbar, und das Gehirn verteilt seine Aufmerksamkeit ungleich auf sie. Die Studie baut auf einem breiteren Befund der Leseforschung auf: Menschen achten stärker auf Veränderungen in lexikalischen Elementen, den Vollverben und Inhaltswörtern, die Bedeutung tragen, als auf Veränderungen in grammatikalischen Elementen wie Hilfsverben und Artikeln. Das grammatikalische Gerüst ist für das Verstehen weitgehend redundant. Lesende oder Zuhörende rekonstruieren den Sinn aus den Inhaltswörtern und dem Kontext und ergänzen die Funktionswörter automatisch, oft ohne zu bemerken, dass sie falsch waren.
Stellt man das den Schwierigkeitsrankings gegenüber, wird die Fehlinvestition offensichtlich. Grammatikalisches Geschlecht, Kasusendungen, Verbkongruenz, Konjunktiv: Das sind die Merkmale, die Lernende als die Mauer beschreiben, gegen die sie stoßen. Sie sind wirklich schwierig. Aber Fehler dabei hindern kaum jemanden daran, einen zu verstehen. Der Aufwand fließt in den Teil der Sprache, der am wenigsten dazu beiträgt, dass die Botschaft ankommt.
Der Akzent, an dem man sich festbeißt, ist nicht das Problem
Akzent ist das reinste Beispiel für diese Falle, weil er die größte emotionale Last trägt und das geringste kommunikative Gewicht.
Viele Lernende behandeln eine muttersprachliche Aussprache als die Ziellinie, das, was einen echten Sprecher von einem Touristen unterscheidet. Sie verschieben das Sprechen, weil sie sich für ihr Klingen schämen. Aber die Belege deuten darauf hin, dass Akzent und Verständlichkeit weitgehend getrennte Dinge sind. In einer Studie von 1995 in der Zeitschrift Language Learning ließen Murray Munro und Tracey Derwing englische Muttersprachler die Sprache von Zweitsprachsprechern bewerten und transkribieren. Sie stellten fest, dass Akzent, Verständlichkeit und Intellegibilität zusammenhängende, aber teilweise unabhängige Dimensionen sind. Ihr Kernergebnis: Ein starker ausländischer Akzent reduziert nicht notwendigerweise, wie gut ein Sprecher verstanden wird. Sprache kann stark akzentuiert und dennoch vollkommen verständlich sein.
Das verdient nochmaliges Lesen, weil es eine tief verwurzelte Überzeugung umwirft. Der Akzent, für den man sich am meisten schämt, ist allein genommen oft nicht das, was bestimmt, ob Menschen einen verstehen. Man kann unverkennbar ausländisch klingen und gleichzeitig vollkommen klar sein. Der Aufwand, der in das Perfektionieren des Akzents investiert wird, bevor man sich traut zu sprechen, ist Aufwand für das Merkmal, das am wenigsten dazu beiträgt, ob man ein Gespräch führen kann.
Den Ertrag pro Aufwandseinheit optimieren
Die Umdeutung ist einfach. Aufhören, auf Schwierigkeit zu optimieren. Auf kommunikativen Ertrag pro Aufwandseinheit optimieren.
Schwierigkeit ist ein schlechtes Ziel, weil sie dafür belohnt, an dem zu arbeiten, was am schwersten ist, unabhängig davon, ob es hilft zu kommunizieren. Ertrag pro Aufwandseinheit zeigt in eine völlig andere Richtung: zu den einfachen, wirkungsstarken Teilen der Sprache, die es ermöglichen, heute verstanden zu werden.
Der Schritt mit dem höchsten Ertrag ist zugleich der günstigste: die kleine Menge an Wörtern und Phrasen, die in fast jedem Gespräch vorkommen. Das haben wir ausführlich in was Polyglotten anders machen besprochen, wo die Forschung zeigt, dass einige tausend häufige Wörter die überwiegende Mehrheit des alltäglichen Sprechens abdecken. Man braucht nicht den gesamten Wortschatz, um zu kommunizieren. Man braucht den Teil, der ständig vorkommt, und dieser Teil ist nicht schwierig. Er ist nur häufig.
Der zweite wirkungsstarke Schritt ist, die Sprache laut zu produzieren, bevor man sich bereit fühlt. Sprechen ist der Punkt, an dem Verstehen zu Kommunikation wird, und es ist das, was Lernende am meisten vermeiden, meistens aus Angst, bei den schwierigen Merkmalen Fehler zu machen. Aber wie wir in der Wissenschaft der Sprachimmersion zu Hause untersucht haben, ist die Produktion das, was passives Wissen in nutzbare Fähigkeit umwandelt. Die grammatikalische Präzision, auf die man wartet, stellt sich durch Gebrauch schneller ein als durch Studium. Kasus und Geschlecht werden geschliffen, indem man hundertmal unvollkommen spricht, nicht dadurch, dass man sie beherrscht, bevor man den Mund aufmacht.
Das alles bedeutet nicht, dass die schwierigen Merkmale keine Rolle spielen. Töne unterscheiden Wörter im Mandarin. Kasus tragen echte Information im Russischen. Sie lohnen das Erlernen. Der Punkt betrifft Reihenfolge und Verhältnis. Sie sind nicht der Eintrittspreis. Sie sind die Politur, die man einer Sprache hinzufügt, die man bereits verwendet, nicht das Tor, durch das man muss, bevor man sprechen darf.
Wie Mintza hier hineinpasst
Hier lassen die meisten Werkzeuge eine große Lücke. Sie üben die schwierigen Merkmale endlos, Konjugationstabellen, Geschlechtsquizze, perfekte Aussprache, während das Einzige, das kommunikative Fähigkeit wirklich aufbaut, Sprechen und unvollkommen verstanden werden, unerreichbar bleibt, weil es einen geduldigen Menschen auf der anderen Seite erfordert.
Mintza ist für den Ertrag-pro-Aufwand-Ansatz gebaut. Es ist ein KI-Sprech-Konversationslehrer in sechs Sprachen, Englisch, Spanisch, Französisch, Deutsch, Italienisch und Portugiesisch, und ermöglicht das Sprechen ab der ersten Minute, bevor die Grammatik sauber und der Akzent auch nur annähernd muttersprachlich ist. Es versteht trotz falschem Geschlecht, falscher Kasusendung oder starkem Akzent, was genau das ist, was die Forschung von Munro und Derwing für einen echten Zuhörer vorhersagt. Wenn ein Fehler korrigiert werden sollte, korrigiert es ihn innerhalb des Gesprächs, anstatt es in einem Bericht einzufrieren. Und bei echten Blockaden wechselt es zur bereits beherrschten Sprache, um weiterzukommen, und kehrt dann zur Zielsprache zurück.
Dieses Design ist die These in Softwareform. Die Zeit wird auf das verwendet, was den höchsten kommunikativen Ertrag hat: Sprechen, anstatt das schwierigste Merkmal zu perfektionieren, bevor man anfangen darf.
Das Fazit
Schwierigkeit ist verführerisch, weil sie sich wie ein Beweis für Aufwand anfühlt, und Aufwand fühlt sich wie Fortschritt an. Aber die schwierigsten Merkmale einer Sprache, Töne, Kasus, Geschlecht, Kanji, Konjunktiv, muttersprachlicher Akzent, sind weitgehend jene, die am wenigsten darüber entscheiden, ob man verstanden wird. Sie sind schwierig genau deshalb, weil sie weit von der Muttersprache entfernt sind, nicht weil sie für die Kommunikation unverzichtbar wären.
Den Aufwand dort investieren, wo der Ertrag ist. Die häufigen Wörter lernen. Sprechen, bevor man bereit ist. Zulassen, dass andere einen unvollkommen verstehen, denn das werden sie. Die schwierigen Teile kommen, durch Gebrauch geschliffen, sobald man bereits im Gespräch ist. Dort beginnen, und Schwierigkeit hört auf, eine Mauer zu sein, und wird zu dem, was sie immer hätte sein sollen: die Abschlussarbeit an einer Sprache, die man bereits sprechen kann.