INSPIRATION: Wer heute an KI denkt, denkt in der Regel an ChatBots. Das ist jedoch bloß ein Ausschnitt aus dem KI-Spektrum – wenn auch ein prominenter. Und zugleich faszinierender: Dass Maschinen sprechen können. Wie das?
Sprache galt traditionell als Domäne des Menschen. Tiere, so die landläufige Meinung, könnten das nicht. Oder nur bedingt, körpersprachlich. Da denkt man sogleich an die alte Unterscheidung von Watzlawick & Co., die zwischen digitaler und analoger Sprache (Kommunikationsaxiom Nr. 4). Und könnte sich einen Spaß draus machen, in nettem Ton und zugewandter Haltung einem Hund beispielsweise die größten Unverschämtheiten an den Kopf zu werfen. Der Hund würde freundlich mit dem Schwanz wedeln. Er versteht unsere Sprache nicht.
Anzeige:
CYQUEST kombiniert wissenschaftlich-fundiertes psychologisches Know-how mit State-of-the-Art-Webdesign und -Programmierung. Wir sind spezialisiert auf die unternehmens- und hochschulspezifische Erstellung sowie Anpassung von Lösungen aus den Bereichen Online-Assessment, SelfAssessment, Berufsorientierungsverfahren u.a. Zur Webseite...
Aber umgekehrt war das immer schon ein Menschheitstraum, Tiere verstehen zu können. Der heilige Franziskus soll das gekonnt haben. Und beim französischen Komponisten Olivier Messiaen (1908-92), der in seinen Musikstücken immer wieder Vogelstimmen imitiert hat, war man sich nicht ganz so sicher. Wieder andere meinen, die Natur spricht doch, wir hören nur nicht zu …
Wer da spricht, muss vernünftig sein
Autor Stefan Höltgen (Von der Sprachphilosophie zu ELIZA) führt in seinem Kapitel im „Philosophischen Handbuch Künstliche Intelligenz“ sogleich den griechischen Philosophen Aristoteles an. Für ihn war Sprache und Vernunft miteinander verbunden (=Logos). Das wurde im Laufe der Geschichte oft kausal verstanden: die Bedingung für Sprachvermögen ist Vernunft. Oder umgekehrt: Wer da spricht, muss vernünftig sein. So war das Erstaunen groß, als in der zweiten Hälfte des 18. Jahrhunderts der slowakische Erfinder Wolfgang von Kempelen, zahlreiche roboterähnliche Automaten erfand, die sprechen konnten. Sie reproduzierten jedoch lediglich Laute mit mechanischen Mitteln. Die wenigsten Zeitgenossen werden sich heute wundern, wenn ein Aufzug spricht: „Erster Stock“. Das ist doch bloß eine Audiokonserve. Das ist keine künstliche Intelligenz.
Wäre es aber Ausdruck von Intelligenz, wenn Maschinen Texte generieren könnten, die syntaktisch korrekt wären? Oder bräuchte es intelligente Menschen, die als Schiedsrichter solches überprüfen? Und wenn sie sich irren würden? Die Literaturgeschichte ist voll von solchen Beispielen. Schon die alten Griechen (Ovid) berichten von Pygmalion, der sich in die von ihm aus Stein gemeißelte Dame unsterblich verliebt. Im 19. Jahrhundert hat das Sujet E. T.A. Hofmann mit seiner Erzählung „Der Sandmann“ wieder aufgegriffen. Und wer würde sich nicht an HAL 9000 erinnern? Den „verrückten“ Bordcomputer im Film „2001“ von Arthur C. Clarke und Stanley Kubrick.
Der andere Weg: Maschinensprache
Wenn man die natürlichen Sprachen mit all ihren Doppeldeutigkeiten beiseiteschiebt, könnte es vielleicht besser sein, sich auf eine Formalsprache zu beziehen. Auch das beginnt schon bei Aristoteles und seinem Beweisverfahren für logische Schlüsse (Syllogismus). Der mallorquinischen Theologe Ramon Lullus entwickelte um das Jahr 1300 herum als erster eine Maschine („Ars Magna“), die mit Hilfe von Logik aus zwei bekannten Prämissen einen „neuen“ Schluss ziehen konnte.
Vielleicht ist die Mathematik die „wahre“ Sprache? Oder wie der Philosoph Wilhelm Gottlieb Leibniz bereits im 17. Jahrhundert meinte: Denken ist Mathematik. Das von ihm entwickelte Dualzahlensystem war die Vorlage für die moderne Computerindustrie. Die Maschinensprache besteht nur aus zwei Zeichen: Null und Eins. Und die Programmiersprachen sind rein logische Kalküle. Sie versetzen programmierbare Maschinen in spezifische Zustände.
Bewusstsein?
Aber zurück zur Frage: Ist, was spricht, vernünftig? Oder lassen wir uns bloß beeindrucken? Sind wir es, die Rechnern (fälschlicherweise) Bewusstsein zuschreiben? Man nennt es Evokation. Wir sprechen psychologisierend über Maschinen, so als ob sie Bewusstsein oder eine „Seele“ hätten – so wie wir unserem alten Auto liebevoll aufs Blech klopfen und es beim Namen nennen. Zugleich sprechen wir in einer technisierenden Sprache über Menschen („Sprung in der Schüssel“), reduzieren Menschen auf Dinge – als ob sie keine „Seele“ hätten.
Alan Turing, der britische Mathematiker, empfahl das Imitationsspiel zur Klärung der Frage, ob ein Computer intelligent sei. Wenn ein Mensch nicht mehr unterscheiden könne, ob eine Antwort vom Menschen oder vom Computer stamme, sei die Maschine intelligent. Der Philosoph John R. Searle konterte mit dem Gedankenexperiment des „chinesischen Zimmers“: Man muss kein Chinesisch beherrschen, wenn man mithilfe einer Anleitung erfährt, wie man die ins Zimmer hereingereichten Zettel zueinander in Beziehung zu setzen hat. Für den Außenstehenden sieht es so aus, als ob der Output sinnvoll ist und der Mensch im Zimmer Chinesisch versteht. Maschinen rechnen, sie verstehen nichts.
Sprachphilosophie
Was ist dann diese Sprache, mit der man einerseits so logische Dinge anstellen kann, andererseits aber auch lügen und sich täuschen kann? Mit Begriffen wie Sprache, Intelligenz, Vernunft herumzufuchteln, sie als gegeben, als objektiv zu verstehen, ist verführerisch, aber offensichtlich naiv. Erst in der Neuzeit wurde man sich dieser Ambivalenz und Tragik bewusst.
In voller Wucht entspann sich die Kontroverse in der Sprachphilosophie jedoch erst im 19. Jahrhundert. Philosophen wie Friedrich Schleiermacher und Wilhelm Diltey wandten sich gegen ein objektivistisches (positivistisches) Verständnis von Sprache. Ihre Überzeugung: Die Bedeutung eines Textes kann nicht losgelöst von seinem Kontext erfasst werden. Sprache ist das Medium von Sinn, der sich prozesshaft im Dialog zwischen Kommunizierenden entfaltet (Da sagst Du was …). Neue Erkenntnis ist abhängig vom Vorverständnis – wir sehen bloß, was wir sehen können und wollen. Und neue Erkenntnis verändert wiederum unser Vorverständnis (Hermeneutik).
Leibniz träumte seinerzeit – und viele Zeitgenossen heutzutage immer noch – von einer Universalsprache. Der Turmbau zu Babel als Erfolgsmodell: Wir können uns alle verstehen, egal welche Sprache wir sprechen. Klasse, nicht wahr? Erst die Sprachphilosophie und moderne Linguistik zeigte auf, neben einer Oberflächenstruktur weist Sprache auch eine Tiefenstruktur auf. Sprache wird situativ und kontextsensibel gebraucht. Wer Nuancen nivelliert, macht es sich viel zu einfach. Wir meinen, uns zu verstehen, missverstehen uns aber allzu oft. Diese alte Kontroverse spiegelt sich in der aktuellen Diskussion um ChatBots.
Im Dialog mit ELIZA
ChatBots „sind Programme, die natürlichsprachliche Ausgaben (als Schrift- oder Lautsprache) erzeugen – und zwar auf Basis der Eingaben eines Users. Solche Systeme funktionieren also dialogisch.“ ELIZA ist der Prototyp eines ChatBots. Der deutschstämmige Informatiker Joseph Weizenbaum entwickelte ELIZA in den 1960er-Jahren am MIT. Über ein Keyboard (Typewriter) konnte der Nutzer mit ELIZA kommunizieren. Alle Ein- und Ausgaben wurden auf Papier ausgedruckt.
Zumeist begrüßte ELIZA sein Gegenüber so: HALLO, ICH BIN ELIZA. ERZÄHL MIR DEIN PROBLEM. Der Dialog zwischen der Nutzerin und dem System war ein Frage-/Antwortspiel. ELIZA stellte die Fragen, der Nutzer gab die Antworten. Die Fragen von ELIZA hatten zum Ziel, vorherige Antworten zu erweitern, zu erläutern oder zu reflektieren. Kommt dieses „Ich hab‘ da mal ’ne Frage“-Format heutzutage etwa irgendjemanden bekannt vor?
Zur Überraschung Weizenbaums wurde ELIZA nicht als Parodie eines Gesprächspsychotherapeuten wahrgenommen, sondern als Gesprächspartner ernst genommen. Die User waren überzeugt, ELIZA sei eine „Intelligenz“. Es brauchte noch nicht einmal ein „Verkleidung“ wie in Turings Imitationsspiel. Dieser Trugschluss (offenen Auges) wurde später „Eliza-Effekt“ genannt.
Das Programm
ELIZA „scannt die Eingaben des Nutzers nachbestimmten Schlüsselwörtern. Das sind Begriffe, die in einer Datenbank hinterlegt wurden – zusammen mit Antwortphrasen, die zu den bestimmten Schlüsselbegriffen ‚passen‘. Diese Passgenauigkeit wird auf Basis einer logischen Konjunktion erreicht (…) So können auch passende Antwortsätze gefunden werden, in denen nicht der Schlüsselbegriff aus der Nutzereingabe selbst auftaucht.“ Weil sog. Token logische Verknüpfungen zwischen Begriffen darstellen. Damit erzeugt das System sogar den Eindruck von Kontextwissen und erscheint intelligent.
Findet es keinen Schlüsselbegriff in der Antwort, stellt ELIZA eine zufällige allgemeine Nachfrage aus einem Fragepool. Das Gespräch am Laufen zu halten, erscheint wichtiger als den User zur Reflexion anzuleiten. Fragen und Wiederholungen erzeugen den Eindruck von Aufmerksamkeit und Anteilnahme. ELIZA arbeitet wie der Mann im chinesischen Zimmer: ohne jedes Verständnis – aber busy.
„ELIZA simuliert einen Sprecher in dem Sinne, wie ein Textverarbeitungsprogramm eine Schreibmaschine und ein 3D-Ego-Shooter das Schießen simuliert: als Spiel.“ Dabei offenbart der Blick in den Maschinenraum, wie Weizenbaum mittels Konjugationstabellen, die Generierung syntaktisch korrekter Satzstrukturen bis zur pragmatischen Gestaltung von Thema-Rhema-Beziehungen oder Anaphorik vorgegangen ist. Vor etlichen Monaten wurde uns bei MWonline im WebTalk von Michaela Ritter ein Beispiel vorgestellt, wie man mittels eines Fragebaums einen ChatBot auf der eigenen Website implementieren kann.
Heute sehen wir eine nächste Stufe in der Entwicklung von ChatBots. Aber das ist eine andere Geschichte …
