“Alexa, zieh dich schon mal aus!” rief er auf dem Weg zum Bad seiner Freundin zu. “Ich habe dich nicht verstanden,” antwortete mit sanfter Stimme aus dem Wohnzimmer Amazon Alexa, während die Freundin zeitgleich aus dem Schlafzimmer “Ich freu mich schon auf Dich!” jubelte.
Offensichtlich versteht Maschinen-Alexa die Situation nicht, ganz im Gegensatz zu Alexa aus Fleisch und Blut. Warum? Die heutigen sogenannten Künstliche-Intelligenz-Algorithmen (KI) verstehen gar nichts. Sie versuchen lediglich, den Eingabesatz des Menchen, eine Input-Zeichenkette, um eine Output-Zeichenkette, den Ausgabesatz, zu ergänzen. Dabei soll das entstehende Input-Output-Satztupel dem Trainingsmaterial, das zur Erzeugung des Algorithmus verwendet wurde, mit möglichst hoher Wahrscheinlichkeit entsprechen. Das Trainingsmaterial besteht aus für den Anwendungsfall wünschenswerten Paaren von Eingabesätzen und Ausgabesätzen. Mit Hilfe sogenannter “deep neural networks”, die mit der Funktion echter Neuronenverbände allerdings nichts zu tun haben, können Gleichungen erstellt werden, die es erlauben, die Eingabesätze durch Ausgaben zu ergänzen. Dabei wird berechnet, wie wahrscheinlich ein Ausgabesatz angesichts des Eingabesatzes ist, und es wird der wahrscheinlichste zur Ausgabe verwendet.
Dieses Verfahren wird euphemistisch “machine learning” genannt, doch lernt die Maschine gar nichts, sondern ein menschlich metaparametrisierter Algorithmus erzeugt einen Operator, der die Beziehungen zwischen Eingabe- und Ausgabesätzen im Trainingsmaterial mathematisch abbildet. Gibt man dem einen Eingabesatz, der im Trainingsmaterial nicht vorkommt, berechnet der Algorithmus daraus einen Ausgabesatz mit sehr geringer Wahrscheinlichkeit. Dann erzeugt ein Filter eine Atnwort wie “Ich habe dich nicht verstanden.” oder “Könntest du das bitte anders ausdrücken.” oder “Das weiß ich nicht.”; derart leere Antworten können auch ohne Filter direkt durch Training erzeugt werden.
Wird sich daran etwas ändern? Stehen uns Maschinen bevor, die überzeugend Dialoge mit uns führen können? Ganz und gar nicht. Beginnen wir mit dem Menschen.
Wie Menschen miteinander sprechen
Das menschliche Sprechen ist eine Form des Handelns, das wissen wir seit Arnold Gehlen, der dies in seiner 1938 erschienenen Würdigung Schopenhauers beschrieben hat, was dann John Langshaw Austin1955 in „How to do things with words.” popularisierte. Menschen handeln, um ihre seelischen Intentionen zu verwirklichen. Im obigen Beispiel möchte der Sprecher Sex mit Alexa haben, und Alexa stimmt dem zu, weil sie auch Lust hat. Intentionen sind die Treiber der Sprache, jeder Sprechakt ist Ausdruck des menschlichen Willens, der beispielsweise auch die Intention der Gleichgültigkeit umfassen kann.
Im Gespräch halten Menschen ihre Intentionen gegeneinander, indem sie Sprechakte ausführen, die dem Gegenüber einen Sinn vermitteln sollen. Der Sinn des Gesprochenen ist dessen Bedeutung für meine Intentionen. Meine Intentionen bestimmen, wie ich etwas ausdrücke und eine Äußerung meines Gegenübers interpretiere. Dabei modifiziert das Gespräch meine Intentionen, die sich in dessen Verlauf dynamisch entwickeln.
Um Absichten und Sinn auszudrücken und zu verfeinern, steht dem Menschen ein riesiges Arsenal von Modulatoren zur Verfügung, das grob in folgende Kategorien gegliedert werden kann:
1. Sprecheridentität und Gesprächskontext
2. Sprachökonomie: Ambiguität und implizite Bedeutung
3. Sprachstruktur: non-verbale Anteile, Sprachwahl und -code/-register, Satzbildung, Wortwahl, Tonfall
4. Sprachmodalität: Stil der Äußerung (Frage, Aussage, Befehl, Bitte etc.)
5. Sprachdynamik: Stil der interaktiven Nutzung von Sprache im Gespräch
Varianzfähigkeit der Sprache als Motor der menschlichen Kultur
Durch die Kombination dieser Elemente ist es möglich, Äußerungen und aus ihnen zusammengesetzte Gespräche nahezu beliebig zu variieren. Letztlich ist diese Varianzfähigkeit der Sprache der Motor der kulturellen Entwicklung der Menschheit im weitesten Sinne. Die gesamte menschliche Kultur beruht darauf. Schopenhauer: „Durch Hilfe der Sprache allein bringt die Vernunft ihre wichtigsten Leistungen zustande, nämlich das übereinstimmende Handeln mehrerer Individuen, das planvolle Zusammenwirken vieler Tausende, die Zivilisation, den Staat.” (Die Welt als Willen und Vorstellung, §8).
Wir greifen hier nur einen Bruchteil heraus: Beispielsweise kann durch Sprachökonomie bei Sprechern, die sich kennen, extrem effektiv kommuniziert werden, während bei Fremden durch zu viel davon Missverständnisse entstehen. Soziolekt, Satzbau und Vokabular sind entscheidende Faktoren der Sprachvarianz, man denke an die Spannweite von Liturgie oder Richterspruch bis zu Jugendslang oder Rotwelsch. Die Dynamik des Gesprächs vertieft die Varianz zusätzlich, da ein Gespräch als sein eigener Kontext dient und der bisherige Verlauf die Intentionen der Sprecher dynamisch verändert. Dadurch entstehen neue Äußerungs- und Interpretationsmuster, mit denen die Sprecher das Gespräch bewusst oder unbewusst weiter gestalten.
Maschinen haben keine Absichten
Rechenmaschinen haben im Gegensatz zum Menschen keinen Willen und keine Intentionen. Sie können daher auch nicht aktiv Äußerungen tätigen oder interpretieren. Denn eine Äußerung bedeutet, seinen Willen direkt oder indirekt kundzutun. Und die Interpretation der Äußerung des Gesprächspartners heißt immer, sich die Frage zu stellen: Was bedeutet das für mein Leben? Wie soll ich darauf reagieren? Dazu ist nur in der Lage, wer eigene Absichten hegt. Maschinen haben so lange, wie wir nicht wissen, wie man diese mathematisch modellieren kann, keine Absichten. Und wir können heute kein formales Modell unseres eigenen Willens erstellen, geschweige denn es einer Maschine einbauen. Daher wird es auch keine „Herrschaft der Maschinen“ geben, wie es einige Wissenschaftler befürchten.
Was können Rechenmaschinen eigentlich leisten? Computer können nur den Teil der Mathematik bewältigen, den eine Turing-Maschine berechnen kann. Die hohe Varianz menschlicher Sprache macht es unmöglich, mathematische Modelle für Dialoge oder Konversationen zu erzeugen, die aus menschlicher Sicht plausibel wirken. Das heutige Sequenzmodell von Sprache kann nie passen, weil es fast nie identische Dialoge gibt – noch nicht einmal in stereotypen Situationen wie beispielsweise an der Discounter-Kasse.
Denn auch dort sind kontextatypische Äußerungen zu hören wie: “Sie sehen heute aber gut aus!” oder “Warum sind sie so unhöflich? Gefällt Ihnen Ihr Tattoo nicht mehr?” Es gibt de facto keine Standardsituationen in der zwischenmenschlichen Begegnung und daher auch keine repetitiven Muster, die eine heutige KI lernen kann.
Mit Maschinen wird es auf absehbare Zeit nur sehr rudimentäre Dialoge geben, viel mehr als einfache Befehle werden sie auf absehbare Zeit nicht ausführen können. Schon die Buchung einer Reise (Flug und Hotel) gelingt nur mühsam – derzeit bei weniger als 10 Prozent der getesteten Dialoge – nämlich dann, wenn der Mensch sich im mathematisch abgebildeten Erwartungshorizont bewegt.
Trost für Romantiker
Interessant an der Debatte um Alexa ist auch die gesellschaftliche Folie auf der sie stattfindet. Der verbreitete Fortschrittsglaube in Sachen Alexa einerseits und die apokalyptische Technikangst anderseits sind zwei Seiten der gleichen Medaille.
Unsere apokalyptisch aufgeladene, fanatisiert-technikfeindliche Öffentlichkeit will derzeit keine nüchternen wissenschaftlichen Analysen zum Thema hören. Viel lieber glaubt man die Neuen Zehn Gebote. Doch die Dominanz des naturwissenschaftlich-technischen Weltbilds ist auf die Dauer nicht zu erschüttern, da alle Menschen ein sicheres, schmerz- und hungerfreies Leben wollen: Nach der Neolithischen Revolution, die die Sicherheit der Nahrungsmittelproduktion drastisch erhöhte, wollte nach einer Übergangs- und Eingewöhnungszeit auch niemand mehr weg vom Ackerbau und zurück zum Jagen und Sammeln.
Heute ist es ähnlich. Einige Zeitgenossen, besonders viele in Deutschland, mindestens 20 Prozent, befinden sich noch im geistigen Übergang vom Agrar- zum Technologiezeitalter. Wir wünschen ein baldiges Ende dieser speziellen Pubertät! Danach lebt es sich wieder besser, wenn auch nüchterner. Und es gibt auch Trost für Romantiker. Denn auch bei der Technik wachsen die Bäume nicht in den Himmel:
“Alexa, mach dass Du wegkommst! Dein Zug!” – “Welchen Anzug meinst Du?” ertönt die sanfte Stimme. Die echte Alexa zieht die Haustür lachend hinter sich zu.
Beitragsbild: Pixabay
@Helmut Berndt Ganz so einfach ist es nicht. Erstens wurde der Lernalgorithmus der KI vorprogrammiert, und zweitens hängt beim verwendeten Lernverfahren sehr viel von den verwendeten Kostenfunktionen ab, auf die das neuronale Netz optimiert wird, und das macht die KI auch nicht selber. Haben Sie schon einmal eine Schach-KI gesehen, die selbstständig beschließt zu lernen, Hunde von Katzen auf Bildern zu unterscheiden? Technologisch sind das ganz wunderbare Sachen, die da vollbracht wurden, und es wird auch einige Umwälzungen bringen. Dass die Maschinen die Macht übernehmen werden, davor fürchte ich mich nicht im Geringsten. Allerdings werden ganz üble Waffensysteme möglich werden, und Deutschland ist heute schon die Dritte Welt, zehrt noch ein wenig von den Resten, und wird dann ein hilfloser Spielball der Technologiemächte der Zukunft werden, namentlich China und den USA. Davor graut mir viel mehr als irgendwelchen abstrusen Maschinenherrschaften. Ich halte es wie Peter Norvig. Intelligentes Verhalten sollte nicht mit Bewusstsein verwechselt werden. Man kann einer Maschine durchaus beibringen, sich in einer Weise zu verhalten, die wir Menschen als intelligent bezeichnen, wie z.B. Schach oder Go spielen. Das heißt nicht, dass die Maschine bewusst ist.
Die Sache technisch beschrieben, aber doch nicht wirklich verstanden. Die katastrophalen Folgen von KI sind aber schon beim ersten Hype in der IT Steinzeit der 80 erschöpfend beschrieben worden. Biologische Evolution lernt über Tod und Fortpflanzung, sehr sehr langsam (und auch sehr mitleidlos). Das gilt auch für Homo Sapiens, immer noch. Homo Sapiens hat jetzt aber die kulturelle Evolution in Spiel gebracht, lernen über Sprache, Schrift, Bits, extreme Spezialisierung, und breite Weitergabe des Wissens (zB die Geometrie der alten Griechen). Gegen diese Turbo Evolution sind alle anderen hoheren Tiere chancenlos. Eigentliches Ziel der KI ist es, das Prinzip der Evolution in selbstreproduzierenden Robotern zu implementieren, sie also aus der Welt der kohlenstoffbasierten Wesen in die Welt der Roboter zu transplantieren. Das wird unzweifelhaft gelingen, und es ist lachhaft anzunehmen dass eine solche Roboterspezies dann dem Menschen ähneln und Faust 3 schreiben müsste. Eine tödliche Roboterschabe vielleicht, super anpassungsfähig, unausrottbar? Solche Roboterspezies wären dann Homo Sapiens so überlegen, wie dieser bspw den anderen Primaten, und das endet fast immer mit Aussterben der unterlegenen Art. KI & Robotik sind die neuen Nuklearwaffen, und wenn da der Geist erstmal aus der Flasche ist, lässt er sich nie wieder einfangen.
Achtung Herr Eisleben, die Aufforderung an Alexa (die von Amazon) oder Siri sich auszuziehen ist sexistisch. Ja, es gibt schon Aktivisten, die es bedenklich finden, dass Maschinen mit Frauenstimmen Männern stets zu Diensten sind. Wirklich kein Schmarrn - stand glaube ich sogar auf der Achse.
Ach ja, manche Themen lassen einen doch nicht gleich wieder los und seien sie im Grunde belanglos. Ich habe eben mal versucht, die schlaue Anna Kaspersky auf meinem Computer zu fragen, was sie auf die oben als Überschrift stehende Anweisung antwortet. Ich hatte so etwas erwartet wie "Bitte formulieren Sie Ihre Anfrage sachlich!" oder "Sind Sie sicher, dass sich diese Bitte im Einklang mit der geltenden Gesetzgebung befindet?" Aber sie ist verschwunden, hat sich einfach aus dem Staub gemacht, ohne sich zu verabschieden. Verstehe ich nicht. Aber es dämmert mir, dass in den Elfenbeintürmen der Kommunikationswissenschaften Leute sitzen, die kleine viereckige Kästchen, die auf dem Tisch stehen, auffordern, sich schon mal auszuziehen. Ich bin total konfus. Ist das nun elitäre Dummheit? Oder ist es ein Grad von komplexer Kommunikation, die solche kleinen Geister auf der Ebene der Mühen nie begreifen könnten?
Mit der HI (humanoiden Intelligenz) sieht es nicht anders aus, wenn es zu Sprechakten zwischen Eheleuten kommt. Er: "Was ist los?" - "Nichts!" - "Aber du hast doch was?" - "Wenn du das selbst nichts weißt!" - "Nein, ich weiß es nicht!" - "Das meine ich ja." - "Sag es mir, bitte!" - "Wenn du es nicht weißt, hat es keinen Zweck!" (Sie verlässt das Zimmer). Bei der KI-Alexa: "Zieh dich aus!" Sie zieht sich aus, klagt nicht über Migräne und beklagt nicht, dass er nur das Eine von ihr will. Mhm, also 1 : 0 für KI, sag ich mal.
Ich frage mich, wenn ich Berichte über " Alexa" lese und höre, WELCHE Personen sich FREIWILLIG einen SPION ins Haus holen. Ich habe meinen Fernseher auch nicht mit dem Internet verbunden und alle meine Kameras abgeklebt. Auch mein Smartphone, was ja ebenfalls als " WANZE " funktioniert, wird außerhalb des Wohnraums aufbewahrt. Ich erinnere mich noch gut daran. als Snowden in seinem russischen Exil Journalisten empfangen hat, daß ihre Smartphones in einem Stahlschrank untergebracht wurden. Snowden (dieser Mann ist ein WIRKLICHER EXPERTE) hat ganz explizit darauf hingewiesen, daß ALLE Smartphones genau wie eine WANZE fungieren. Sind viele Menschen in unserer Gesellschaft nicht mehr fähig selber zu denken und laufen, wie bereits schon mal geschehen, wieder einem "Trend" hinterher ?? Zum Glück, gibt es im ehemaligen Ostblock noch genug Menschen, die sich ein kritisches Denken bewahrt haben und KEINE "Nazs" sind. Ich unterhalte mich gern mit solchen Menschen. Ein junger Bekannter von mir reist jetzt durch verschiedene "Ostblockländer", nicht mit dem Reisebüro, sondern privat zusammen mit Freunden, um sich SELBER ein Bild zu machen. Seine Berichte sind äußerst erfreulich, da ich diese Länder von früher noch kenne , kann ich ihm gut folgen. Junge, kreative Menschen mit einem gesunden Selbstbewußtsein, die sich nicht so schnell lenken lassen, scheinen in diesen Ländern die Mehrheit zu sein. Von der rasant fortschreitenden Technologisierung ganz zu schweigen. Das und auch viele meiner Landsleute in Ostdeutschland lassen meine Hoffnung wieder ansteigen !
Vielen Dank, Herr Eisleben, für den Einblick. Dass das mit der Sprache nicht klappen würde, war mir aber –z.B. wegen größter Verständigungsschwierigkeiten innerhalb der eigenen Familie – schon vor über zwanzig Jahren klar. Aber alles andere? Ich weiß nicht. Weil ich ein misstrauisch gewordener Mensch bin, kommt mir eine elektronische Alexa niemals ins Haus und die totale Vernetzung sowieso nicht; auch nicht das bargeld- und berührungslose Bezahlen an der Ladenkasse. Das hat aber nicht die Bohne mit Technikfeindlichkeit zu tun. Ich habe mein ganzes Berufsleben lang gut und gern von und mit Technik gelebt.