Hallo! Verstehst du mich?

Die Zeit

Mit künstlicher Intelligenz wollen Forscher einen Menschheitstraum verwirklichen: Die Sprache der Tiere entschlüsseln.

Die Gesänge der Buckelwale sind weltberühmt. Mit lang gezogenen, oft klagend klingenden Liedern verständigen sich die Ozeanriesen über Hunderte von Kilometern. Man kann die Walgesänge auch als Meditations-CDs kaufen, unterlegt mit einem meist kitschigen Musikteppich.

Die Sprache der Pottwale klingt erheblich sperriger. Sie besteht aus kurzen Knacklauten, in schneller Folge artikuliert, und erinnert an Morsezeichen oder das Knattern eines fehlerhaften elektronischen Bauteils. Sie wirkt eher digital als meditativ – und just diese Eigenschaft soll die Sprache der Pottwale zur ersten Tiersprache machen, die der Mensch mithilfe künstlicher Intelligenz komplett entschlüsselt.

Michael Bronstein hat noch nie einen Wal von Nahem gesehen. Der 41-jährige israelische Informatiker, der am Imperial College in London lehrt, hörte die Pottwal-Codas, wie die kurzen Knacksalven in der Fachsprache genannt werden, zum ersten Mal, als er ein Forschungssemester an der amerikanischen Harvard-Universität verbrachte. Dort spielte ihm der Biologe David Gruber die Aufnahmen vor, und sofort war Bronsteins Gedanke: Da steckt eine Struktur drin, die wir mit modernen Computerverfahren analysieren könnten. Er probierte ein paar gängige maschinelle Lernverfahren an den Daten aus, und die Sache sah vielversprechend aus.

Die Forscher stellten ein multidisziplinäres Team zusammen, das nun unter dem Projektnamen Ceti (Cetacean Translation Initiative, zu Deutsch: Wal-Übersetzungs-Initiative) die größte Sammlung von Pottwal-Codas erstellen und analysieren will. Mit von der Partie ist die Informatikerin Shafi Goldwasser aus Berkeley, eine Expertin für Verschlüsselung und Codierung. Und, ganz wichtig: der Biologe Shane Gero, der seit 2005 auf der Karibikinsel Dominica mit Pottwalen arbeitet und schon eine Menge Sprachdaten der Meeressäuger gesammelt hat.

Aber haben Tiere überhaupt eine Sprache? Die Frage ist schwer umstritten. Die Sprache ist für viele eine der letzten Bastionen menschlicher Exklusivität. Wir Menschen, sagt der Linguist Steven Pinker, kommen mit einem „Sprach-Instinkt“ auf die Welt, sind von Natur aus begierig, sprechen zu lernen. Davon soll es im Tierreich keine Spur geben? Der Verhaltensbiologe Konrad Lorenz, der viel mit Tieren kommunizierte und 1949 darüber ein Buch schrieb (Er redete mit dem Vieh, den Vögeln und den Fischen), sagte lapidar: „Eine Sprache im eigentlichen Sinne des Wortes jedoch haben die Tiere nicht.“

„Also, ich glaube eher, dass wir noch nicht genau genug hingeguckt haben“, entgegnet der in Erfurt lebende Meeresbiologe Karsten Brensing. Er hat zwei Bücher über Tiersprachen geschrieben und ist überzeugt davon, dass man die Kommunikation vieler Tiere durchaus als Sprache bezeichnen kann.

Einfaches Hundebellen will er nicht dazuzählen. „Zu einer Sprache gehört zunächst einmal die Semantik. Also dass bestimmte Lautäußerungen eine bestimmte Bedeutung haben, die sich nicht verändert.“ Dazu komme aber ein zweites Kriterium: die Grammatik. „Man muss in einer Sprache Sätze bauen können, und die müssen gewissen Regeln gehorchen.“

Dass Tiere über ein Vokabular verfügen, ist seit Langem bekannt. Der Eichelhäher beherrscht etwa 25 Rufe, von denen einige eine feste Bedeutung haben. Nach tierischem Satzbau dagegen suchte man lange vergeblich. Vor fünf Jahren veröffentlichten japanische Forscher in Nature Communications eine Studie über Kohlmeisen: Die Vögel kombinieren in bestimmten Situationen zwei verschiedene „Wörter“ zu einem „Satz“ mit neuer Bedeutung. Das ist Grammatik.

Konrad Lorenz glaubte noch, dass Tiere über ein angeborenes Repertoire an Äußerungen verfügten und im Lauf ihres Lebens nicht viel dazulernten. Alle Ausdruckslaute der Tiere, „wie das Kja und Kjuh der Dohle, der viel- und der wenigsilbige Stimmfühlungslaut der Graugans“, seien mit unserer Wortsprache nicht vergleichbar, nur mit Stimmungsäußerungen wie Gähnen, Stirnrunzeln oder Lächeln. Inzwischen haben sich aber viele Tierarten als „vokale Lerner“ erwiesen – sie erwerben neue Vokabeln, entwickeln Dialekte, identifizieren einander.

Auch Kinder lernen ohne Vokabelliste und Regelwerk

Die Pottwale sind nicht nur aufgrund der – zumindest auf den ersten Blick – einfachen Struktur ihrer Rufe ideale Kandidaten für den Versuch einer Entschlüsselung. Sie tauchen in die tiefsten Meerestiefen hinab und kommunizieren über große Entfernungen. Während bei anderen Tieren Körpersprache und Mimik wichtige Verständigungsmittel sind, „ist es realistisch, anzunehmen, dass die Kommunikation der Wale hauptsächlich akustisch ist“, sagt Bronstein. Pottwale haben das größte Gehirn im Tierreich, sechsmal so groß wie unseres. Wenn sich zwei von ihnen über längere Zeit miteinander austauschen, darf man vermuten, dass sie sich etwas zu sagen haben. Geben sie sich Tipps zu den besten Fischgründen? Reden sie ähnlich wie menschliche Eltern über die Aufzucht ihres Nachwuchses?

Das Erschließen einer unbekannten Sprache würde enorm erleichtert, wenn es so etwas gäbe wie den berühmten Stein von Rosette. Diese 1799 entdeckte Stele enthielt denselben Text in drei Sprachen und lieferte so die Grundlage für die Entschlüsselung der ägyptischen Hieroglyphen. So etwas gibt es fürs Tierreich natürlich nicht. Wir haben weder ein Wörterbuch „Mensch–Wal/Wal–Mensch“ noch ein Nachschlagewerk mit den Grammatikregeln der Pottwale.

Aber das muss kein Hindernis sein. Auch Kinder lernen ihre Muttersprache ohne Vokabelliste und Regelwerk. Und in den letzten zehn Jahren sind maschinelle Lernverfahren entwickelt worden, die Strukturen in Sprachen erkennen, ohne dass man ihnen irgendetwas über den Inhalt mitteilt.

Das bekannteste Sprachmodell trägt den Namen GPT-3. Veröffentlicht hat es die Firma OpenAI (ZEIT Nr. 54/20). Solche Sprachmodelle sind „Vervollständigungsmaschinen“: Gibt man ihnen einen Satz vor, spinnen sie diesen Wort für Wort weiter. Durch die statistische Verarbeitung riesiger Textmengen, die wie mit einem Staubsauger aus dem Internet gezogen werden, wissen sie nicht nur, welche Wörter häufig neben anderen auftauchen. Sie lernen auch die Regeln des Satzbaus. Sprachmodelle machen keinen Unterschied zwischen Semantik und Grammatik – sie formulieren einfach „richtig klingende“ Sätze, und das oft in frappierend guter Qualität. Sie sind in der Lage, erfundene Meldungen zu einem vorgegebenen Thema zu verfassen, komplizierte juristische Texte in einfachen Worten zusammenzufassen und sogar akzeptabel zwischen zwei Sprachen zu übersetzen.

Diese Leistungen haben ihren Preis: Unvorstellbar große Datenmengen sind erforderlich. Das neuronale Netz von GPT-3 wurde mit etwa 175 Milliarden Wörtern trainiert. Zum Vergleich: Das an Ceti beteiligte Dominica Sperm Whale Project von Shane Gero hat weniger als 100.000 Pottwal-Codas gesammelt – nicht einmal ein Millionstel der Trainingsmasse von GPT-3. Die erste Anstrengung des neuen Forschungsprojekts wird darin bestehen, diese Sammlung gewaltig zu vergrößern. Vier Milliarden „Wörter“ soll sie umfassen – wobei noch gar nicht klar ist, was ein „Wort“ in der Walsprache ist. Dazu braucht es noch eine Menge Technik, etwa um einzelne Laute eindeutig einem bestimmten Tier zuordnen zu können.

Klappt Bronsteins Idee, ist analog zu menschlichen Sprachmodellen ein System denkbar, das grammatisch und inhaltlich plausible Sätze in der Pottwalsprache erzeugt. Der nächste Schritt wäre ein interaktiver Chatbot, der mit frei lebenden Walen in Dialog zu treten versucht. Niemand kann heute sagen, ob die Tiere ihn als Gesprächspartner akzeptierten. „Vielleicht würden sie auch nur antworten: Erzähl nicht so einen Unsinn!“, sagt Bronstein.

Selbst wenn es funktionierte – die Achillesferse aller Sprachmodelle ist, dass sie nichts über den Inhalt der Sprache wissen, in der sie so geschickt drauflosplappern. Es wäre natürlich fatal, wenn die Forscher einen Bot erschaffen würden, der fließend mit einem Wal parlierte – sie selbst aber verständnislos zurückließe. Deshalb wollen sie die Sprachaufnahmen mit Daten zum Verhalten der Wale kombinieren – wo befanden sich die Tiere, wer sprach mit wem, wie war die Reaktion? Dazu sollen die Tiere mit Sensoren versehen werden, Kameras sollen von oben das Geschehen im Meer beobachten. Ganz schön aufwendig.

Sprache ist kein Computercode

Eine zweite KI-Technik, mit der man dem Übersetzungsproblem zu Leibe rücken könnte, ist word embedding, die Einbettung von Wörtern in eine Sprachlandschaft. Darauf weist Aza Raskin hin. Der Internet-Designer ist einer der Gründer des Earth Species Project, das sich ebenfalls die Entschlüsselung der Tiersprachen zum Ziel gesetzt hat.

Im Jahr 2013 haben Google-Forscher einen Algorithmus entwickelt, der aus Sprachdaten eine Art mehrdimensionale Landschaft erstellt, in der Wörter mit verwandten Bedeutungen nahe beieinanderliegen. Diese Modelle erkennen auch Verwandtschaftsbeziehungen: „Lehrer“ verhält sich zu „Mann“ wie „Lehrerin“ zu „Frau“. Vier Jahre später wurde dieses Verfahren erstmals zur automatischen Übersetzung angewendet: Es zeigte sich, dass diese Repräsentationen zweier Sprachen sich tatsächlich zur Deckung bringen lassen. Zwar hat nicht jedes Wort ein exaktes Pendant in einer anderen Sprache, aber letztlich reden Menschen überall auf der Welt über dieselben Dinge. Inzwischen sind Verfahren in der Lage, nur auf Basis von Tonaufnahmen von einer Sprache in die andere zu übersetzen, ohne den Umweg über die Schrift.

Lassen sich diese Methoden erfolgreich auf die Klicklaute der Wale anwenden? Steven Pinker, der Linguist und Autor des Buchs Der Sprachinstinkt, sieht das Projekt mit Skepsis. „Ich bin gespannt, was die finden“, verrät er der ZEIT, „aber ich vermute, da wird nicht viel mehr herauskommen, als was wir schon wissen: dass sie über individuelle Rufe mit einer begrenzten Semantik verfügen – sie sagen, wer sie sind, und äußern vielleicht Emotionen.“ Dass Wale eine Grammatik haben, glaubt er nicht. „Wenn sie komplexe Nachrichten kommunizieren können, warum beobachten wir dann nicht, dass sie komplexe Dinge zusammen tun, wie wir es bei Menschen sehen?“

Selbst wenn die Kommunikation der Wale komplexer sei, als Skeptiker glauben – das heiße noch nicht, dass eine Art Übersetzung zwischen den Arten möglich sei, sagt Bronstein. „Das ist wahrscheinlich eine naive Vorstellung. Wir müssen uns darauf einstellen, einem anderen Geist mit anderen Vorstellungen zu begegnen. Wale reden wahrscheinlich über Dinge, die für uns keinen Sinn ergeben, und umgekehrt.“ Kein Wal könnte den Satz „Ich bin im Regen nass geworden“ verstehen – Wale sind immer nass.

Aza Raskin dagegen hegt Hoffnungen: „Es gibt mit ziemlicher Sicherheit einen Bereich, in dem sich die Erfahrungen aller Säugetiere überschneiden. Sie müssen atmen, sie müssen essen, sie trauern um verstorbene Familienmitglieder.“ Wie groß dieser Bereich der gemeinsamen Erfahrungen ist – das sei eine der spannenden Fragen, die man an den zukünftigen Datensatz des Ceti-Projekts stellen könne.

Sprache ist kein Computercode, der eine unmissverständliche Bedeutung hat. Um mit einem anderen Menschen zu kommunizieren, muss man vieles wissen, was gar nicht gesagt wird. Das lässt sich mit „gesunder Menschenverstand“ umreißen – und der unterscheidet sich wahrscheinlich vom gesunden Walverstand. Wir machen uns auch ständig eine Vorstellung vom Innenleben des anderen und verstehen dessen Sprache vor diesem Hintergrund. Welche Überzeugungen hat mein Gegenüber, welche Gefühle bringen es zu dieser Aussage? Schon in der zwischenmenschlichen Kommunikation ist das eine Quelle für Missverständnisse. Wie viel größer ist die Gefahr des Aneinandervorbeiredens, wenn wir mit Tieren kommunizieren, die über andere Sinne und eine andere Lebenswelt verfügen? Muss ich wissen, wie es ist, ein Wal zu sein, um mit einem Wal zu sprechen?

„Vielleicht führt das dazu, dass wir die Erde anders behandeln“

Diana Reiss von der City University of New York versucht seit Jahren, mit Delfinen ins Gespräch zu kommen. In Gefangenschaft lebenden Tieren brachte sie bei, über eine Tastatur mit ihr zu kommunizieren. Ihr Ansatz ähnelt der Situation, in der Menschen aufeinandertreffen, die unterschiedliche Sprachen sprechen – ohne eine Übersetzungshilfe zu haben.

Reiss begrüßt die Ambitionen von Ceti, insbesondere den interdisziplinären Ansatz. Sie betont aber, dass Kommunikation, insbesondere zwischen Mensch und Tier, nur funktioniert, wenn eine persönliche Beziehung hergestellt wird.

Dabei beruft sie sich auf Konrad Lorenz, der in seinem bereits erwähnten Buch auch über den magischen Ring schrieb, den König Salomo besessen haben soll und der es ihm erlaubte, mit den Tieren zu reden. „Ich rede mit einigen Arten, die ich gut kenne; ich brauche dazu jedoch keinen Zauberring“, schrieb Lorenz. „Ohne jede Zauberei erzählen einem die lebendigen Wesen die schönsten Geschichten, nämlich solche, die wahr sind.“ Genau das meint Diana Reiss: „Ich sage meinen Studierenden: Versucht nicht auf Teufel komm raus, alles zu analysieren – lasst die Tiere eure Lehrer sein!“

Doch auch in noch größerem Zusammenhang, gleichsam in planetarischer Perspektive, ist das Ceti-Projekt interessant. Denn sein Name erinnert nicht ganz zufällig an das Kürzel Seti – die Suche nach extraterrestrischen Intelligenzen. Könnten die Ergebnisse von Ceti eines Tages vielleicht sogar helfen, mit Außerirdischen zu kommunizieren?

Für die beteiligten Forscher wird eher umgekehrt ein Schuh daraus, weil die Suche nach außerirdischer Intelligenz bislang nicht ein einziges Signal zutage gefördert hat, an dem die Menschheit ihre Entschlüsselungskünste erproben könnte. Statt die Antennen auf den Weltraum zu richten, argumentieren die Ceti-Forscher, könnten wir im Meer eine Kultur belauschen, die uns ähnlich fremd ist. „Ich glaube, es ist sehr arrogant von uns zu glauben, Homo sapiens sei das einzige denkende und fühlende Wesen auf der Erde“, sagt Michael Bronstein. „Wenn wir entdecken, dass da eine ganze Zivilisation sozusagen vor unserer Nase existiert, von der wir nichts ahnen – vielleicht führt das dazu, dass wir die Erde anders behandeln. Wenn wir wissen, dass wir nicht allein sind, haben wir vielleicht ein bisschen mehr Respekt vor der belebten Welt.“