Fuzzy Logic und neuronale Netze

Geschwurbel von Daniel Schwamm (03/1994)

Inhalt

1. Einführung

Seit der griechische Philosoph Aristoteles vor über 2.000 Jahren die Gesetze der formalen Logik begründet hat, ist die westliche Welt dazu übergegangen, die Wahrheit als etwas Zweiwertiges (Bivalentes) anzusehen: Eine Aussage kann entweder WAHR oder NICHT-WAHR, also FALSCH sein, aber niemals beides zusammen. Das Gesetz vom ausgeschlossenen Dritten verbietet es der logischen Aussagen A UND NICHT-A, ein anderes Ergebnis als FALSCH hervorzubringen. Die Philosophie und die Wissenschaft lehnen daher Halbwahrheiten ab. Nach ihnen muss alles klar und deutlich als WAHR oder FALSCH erkennbar sein, um ernst genommen zu werden. Die philosophische Position des Positivismus dominiert das Denken des Westens. Auch sie ist bivalent, schwarz und weiss. Auch sie behauptet, dass etwas ist oder etwas nicht ist, dass es eine klare Trennlinie für Sein oder Nicht-Sein gibt. Ein sinnlich erfahrbares Objekt ist z.B. ein Stuhl oder kein Stuhl und dazwischen gibt es nichts. Wenn also jemand behauptet, dieses Objekt sei ein Stuhl UND gleichzeitig auch nicht ein Stuhl, dann wird er vom Wissenschaftler ausgelacht und für unlogisch erklärt. Die bivalente Logik und der bivalente Positivismus finden ihren Niederschlag in der bivalenten Informatik. Ein Bit ist entweder gesetzt oder gelöscht, WAHR oder FALSCH, Strom an oder Strom aus, 1 oder 0, aber niemals 0.5 oder 0.2. Der Computer versteht nur klare, eindeutige Aussagen, mit vagen, unsicheren Aussagen der Form "WENIG WAHR" oder "SEHR FALSCH" kann er nichts anfangen. Die Wissenschaft ebenso wenig. Der Mensch aber schon.

Im Osten der Welt prägte Buddha das Denken, wie es Aristoteles im Westen getan hat. Er glaubte jedoch im Gegensatz zu dem Griechen daran, dass etwas Sein und doch auch gleichzeitig Nicht-Sein kann. Ying und Yang, die zwei extremsten Formen des Seins in der östlichen Philosophie, befinden sich in der Welt als Ganzes in Balance. Die Welt ist also weder nur Ying, noch nur Yang, sie ist beides zusammen, genauer: Sie ist zur Hälfte Ying und zur Hälfte Yang. Und diese Annahme prägt auch das logische Denken - es ist vielwertig (multivalent), d.h., eine Aussage kann nicht nur WAHR ODER FALSCH sein, sondern auch WAHR UND FALSCH, also dem aristotelischen Satz vom ausgeschlossenen Dritten widersprechen. WAHR UND FALSCH heisst aber nicht, wie man in der Schwatz-Weiss-Denkart des Westens vermuten könnte, dass eine Aussage zu 100% WAHR UND zu 100% FALSCH sein kann. Dies wäre tatsächlich unlogisch und würde dem gesunden Menschenverstand widersprechen. Aber sie kann durchaus zu 80% WAHR UND zu 20% FALSCH sein. Sie kann also durchaus "fuzzig" (unscharf) sein.

2. Das Problem der Welt-Wissenschaft-Fehlpassung

Zenon, der grosse griechische Philosoph, tritt vor seine Schüler und weist auf etwas vor ihm auf dem Tisch. "Was ist das?", fragt er.

"Ein Haufen Sand" bekommt er als Antwort zurück.

"Richtig, das ist ein Haufen Sand", sagt Zenon lächelnd, nimmt ein paar Sandkörner vom Haufen weg und streut dafür Salzkörner rein. Dann fragt er erneut: "Was ist das?"

Die Schüler sind verblüfft. "Es ist immer noch ein Haufen Sand."

Zenon entnimmt dem Haufen Sand weitere Sandkörner und ersetzt sie durch Salzkörner. "Was ist das?", fragt er ein drittes Mal.

Unsicherheit spiegelt sich in den Gesichtern der Schüler. "Ein Haufen Sand", sagt ein Teil von ihnen. "Ein Haufen Salz", sagt ein anderer.

Zenon wiederholt die Prozedur des Austauschs von Sand durch Salz, sodass vom ursprünglichen Sandhaufen nur noch wenig Körner übrig sind. "Was ist das?"

"Jetzt ist es ein Haufen Salz", behaupten nun seine Schüler.

"Richtig, das ist ein Haufen Salz. Aber wann", fragt Zenon triumphierend, "hat der Haufen Sand aufgehört, ein Haufen Sand zu sein und wurde zu einem Haufen Salz?"

Darauf wusste keiner seiner Schüler eine eindeutige Antwort.

So oder so ähnlich könnte es sich zugetragen haben, als Zenon der Ältere bzw. Zenon von Elea (490-430 v. Chr.) seinen Schülern das berühmte Sandhaufen-Paradoxon vorgetragen hat. Und obwohl es seit über 2.000 Jahre bekannt ist, kann bis heute niemand - nicht einmal die Wissenschaft - eine Antwort auf Zenons letzte Frage geben. Wann hört ein Haufen Sand auf, ein Haufen Sand zu sein, wenn man ihm ständig Sandkörner entnimmt und durch Salzkörner ersetzt? Lässt sich ein Sandkorn bestimmen, an dem der Wechsel vom Sandhaufen zum Nicht-Sandhaufen vollzogen wird? Nein, sicher nicht. Der Wechsel vom Sandhaufen zum Nicht-Sandhaufen vollzieht sich offensichtlich ganz allmählich - es gibt keine scharfe Trennlinie zwischen Sandhaufen und Nicht-Sandhaufen. Es heisst also nicht an einer Stelle: Das Objekt ist ein Sandhaufen ODER ein Nicht-Sandhaufen. Sondern es heisst kontinuierlich: Das Objekt ist zu x% ein Sandhaufen UND zu 100-x% ein Nicht-Sandhaufen. Die Wahrheit ist nicht bivalent, sondern multivalent. Sie ist nicht schwarz-weiss, sondern sie ist grau.

Die (positivistische) Wissenschaft ist bestrebt, Aussagen zu treffen, die WAHR ODER FALSCH sind. Ein WAHR UND NICHT-WAHR hat sie - Aristoteles Gesetz vom ausgeschlossenen Dritten folgend - als unzulässig erklärt. Logisch gesehen gibt es also nichts, was einerseits WAHR ist, anderseits aber auch gleichzeitig NICHT-WAHR sein kann. Die Wissenschaft sieht demnach die Welt schwarz und weiss, und Grautöne ignoriert sie einfach. Das Zenon-Paradoxon von oben zeigt uns aber, dass die Welt sehr wohl Grautöne kennt. Mehr noch, der Grossteil allen Seins ist grau, denn nur Sonderfälle sind ausschliesslich das eine, ohne auch - und sei es noch so gering - ein bisschen das andere zu sein. So sieht die Welt in Wahrheit aus: Männer sind männlich UND ein wenig weiblich, also Mann UND Nicht-Mann, Pazifisten sind friedfertig UND ein wenig kriegerisch, also Pazifisten UND Nicht-Pazifisten, Kugeln sind rund UND ein wenig eckig, also rund UND nicht-rund, Menschen sind klein UND ein wenig gross, also klein und nicht-klein usw. Die Wissenschaft, die die bivalente Logik des Aristoteles zum einzigen Instrument der Wahrheitsfindung erkoren hat, sieht dagegen nur Männer ODER Frauen, Pazifisten ODER Nicht-Pazifisten, rund ODER nicht-rund, klein ODER nicht-klein.

Das ist das Problem der Fehlpassung: Die herkömmliche Wissenschaft ist schwarz-weiss, die Welt aber grau. Daher kann die Wissenschaft auch bisher nur Aussagen über Sonderfälle in der Natur treffen, ihr aber über die bivalente Logik niemals im grösseren Umfang gerecht werden.

3. Fuzzy Logic oder multivalente Logik

Im vorherigen Kapitel wurde auf die Fehlpassung zwischen der Welt und der herkömmlichen Wissenschaft hingewiesen, die auf die bivalente Logik des Aristoteles zurückzuführen ist, die nur 100%ig WAHR und 100%ig FALSCH als Wahrheitswerte anerkennt. Wie wir gesehen haben, dominieren in der Welt jedoch Grautöne, die mit "WENIG WAHR", "SEHR WAHR", "FAST NICHT WAHR" oder ähnlichen linguistischen Ausdrücken beschrieben werden müssen, wie dies der Mensch beim Gebrauch der natürlichen Sprache auch schon immer getan hat. Nötig ist also eine Logik, die nicht nur zwei Wahrheitswerte kennt, sondern viele - unter Umständen sogar unendlich viele. Eine solche multivalente Logik gibt es seit einiger Zeit: die Fuzzy Logic. Sie erlaubt im Gegensatz zur bivalenten Logik Operationen mit unscharfen Mengen, womit sie dem menschlichen Denken wesentlich näher rückt. Doch bevor wir näher auf sie eingehen, wenden wir uns zunächst einmal ihrer Entstehungsgeschichte zu.

3.1. Entstehungsgeschichte der Fuzzy Logic

Vor fast 3.000 Jahren erkannte der indische Religionsstifter Buddha (Siddhartha Gautama, ca. 544 v. Chr. gestorben), dass alle Dinge zwei Seiten in sich vereinbaren. Das Gute trägt auch stets das Böse in sich, das Weiche stets auch das Harte, das Unlebendige stets auch das Lebendige und das Sein stets auch das Nichtsein. Es gibt keine klare Trennlinie zwischen den Dingen. Werden solche künstlich geschaffen - etwa durch Sprache oder mathematische Definitionen -, so werden die Verschränkungen der beiden Seiten in jedem Ding leicht übersehen. Buddha sagt daher nicht: "Der Geist denkt Gedanken über Dinge", was eine einseitige und in diesem Falle unnatürliche Aussage wäre, sondern er sagt: "Der Nichtgeist nichtdenkt Nichtgedanken über Nichtdinge."

Laotse, ein legendärer chinesischer Philosoph, der im 6. Jahrhundert v. Chr. gelebt haben soll, griff die Ideen Buddhas auf und schuf das Ying-Yang-Prinzip des Taoismus, welches besagt, dass sich die Welt im Gleichgewicht zwischen zwei extremen Polen befindet, sie also beide gleichzeitig in sich vereint. Somit ist jedes Ding gleichzeitig auch Nicht-Ding. Ein Stock ist z.B. auch ein Nicht-Stock, was man daran erkennen kann, dass man ihn immer weiter zerbrechen kann, ohne dass er dadurch irgendwann einseitig zum Stock oder Nicht-Stock würde. Ying und Yang befinden sich auch in Balance bei den Aussagen: "Das Glas ist halb voll" und "Das Glas ist halb leer".

Der griechische Philosoph Heraklit von Ephesos (gestorben um 460 v. Chr.) erkannte, dass es nichts Absolutes gibt, dass sich alles in ewiger Veränderung befindet. "Alles fliesst", wie er sich ausdrückte, "nur die Veränderung selbst ist ewig".

Demokrit, ebenfalls ein griechischer Philosoph, der um 400 v. Chr. verstarb, behauptete dagegen mit dem Atomismus zwei eindeutige Zustände der Welt: Alles Sein besteht demnach aus Atomen, alles Nicht-Sein aus nichts - und Zwischenstufen können nicht existieren.

Aristoteles verfeinerte den Atomismus durch die Logik auch auf sprachliche Aussagen. Eine Aussage kann nach ihm nur 100%ig WAHR ODER 100%ig FALSCH sein, niemals aber zu x% WAHR UND zu 100-x% FALSCH. Dies besagt das von ihm geschaffenen - oder besser behauptete - Gesetz des ausgeschlossenen Dritten. In den folgenden Jahrhunderten galt die bivalente Logik als einzige legitime Methode, um mathematische und naturwissenschaftliche Theorien logisch beweisen zu können.

Zenon der Ältere wollte diese Logik nicht akzeptieren. Und so schuf er die sogenannten Sorites-Paradoxien, die durch nicht klar ziehbare Trennlinie entstehen, um auf die Mängel der bivalenten Logik hinzuweisen, wie z.B. das oben beschriebene Sandhaufen-Paradoxon. Oder auch das Inzest-Paradoxon, bei dem die Frage gestellt wird, ab wann Inzest zu Inzest wird. Wenn man die Beine der Mutter berührt? Oder erst, wenn man intimere Stellen berührt? Die Gelehrte nach Zenon räumten diese Paradoxien allerdings nicht etwa aus, sondern verdrängten sie, in der optimistischen Annahme, sie würde früher oder später schon gelöst werden. Doch dies geschah nie.

Etliche Jahrhunderte nach Zenon kamen beim britischen Mathematiker Bertrand Russell (1872-1970) erneut Zweifel an der Richtigkeit der bivalenten Logik auf. Er kreierte das Barbier-Paradoxon. Ein Barbier behauptet hier auf einem Schild in seinem Geschäft: "Alle Männer der Stadt, die sich nicht selbst rasieren, werden von mir rasiert." Frage: Wer rasiert den Barbier? Diese Frage ist logisch nicht zu beantworten, denn wenn der Barbier sich selbst rasiert, dürfte er dies nach seinem Schild gerade nicht tun. Wenn er sich aber nicht selbst rasiert, dann müsste er es nach seinem Schild wiederum gerade doch tun - nur so kann die Aussage des Schildes WAHR werden. Russels Kritik an der Logik verunsicherte die Gelehrten durchaus, liessen sie die bivalente Logik aber nicht kategorisch infrage stellen. Dabei schlug Russel auch erstmals vor, wie man das Paradoxon aus dem Weg räumen könnte: Man musste dazu nur Aristoteles Gesetz vom ausgeschlossenen Dritten aufgeben, also A UND NICHT-A gleichzeitig zulassen.

Im 20. Jahrhundert wies die Unschärferelation des deutschen Physikers Werner Heisenberg (1901-1876) daraufhin, dass der Naturwissenschaft ganz natürliche Grenzen gesetzt sind, die verhinderten, dass Dinge in eindeutiger Weise definiert werden können. So ist es z.B. nicht möglich, den Ort und die Geschwindigkeit eines Elementarteilchens gleichzeitig festzustellen. Daraus resultierte eine dreiwertige Logik: Ein Teilchen ist existent, ist unbestimmt oder aber nicht-existent. Es ist also WAHR, UNBESTIMMT oder FALSCH. Der grosse Traum der Wissenschaft, die Welt in eindeutiger Weise zu beschreiben, war ausgeträumt.

Der polnische Philosoph Jan Lukasiewicz (1878-1956) ging noch einen Schritt weiter. Er zerhackte den UNBESTIMMT-Wahrheitswert Heisenbergs und schuf so ein Kontinuum von 0 bis 1, in dem sich ein beliebiger Wahrheitswert befinden darf. Die multivalente Logik war geboren.

Noch einmal weiter ausgebaut wurde die multivalente Logik des US-amerikanischen Philosophen Max Black (1909-1988), der sie im Zusammenhang mit der Informationstheorie einsetzte. Allerdings sprach er noch von vager Logik.

Den Begriff Fuzzy Logic schuf schliesslich der persisch-amerikanische Ingenieur Lotfi Zadeh (geboren 1921). Sein Verdienst ist es hauptsächlich, dass diese neue Form der Logik, die die bivalenten Wahrheitswerte WAHR und FALSCH nur als Grenzwerte beinhaltete, so populär wurde. Allerdings nicht an den Universitäten, sondern zuerst und vor allem in der Wirtschaft. Die Informatiker konnten und können sich vermutlich nur schwer damit abfinden, dass das digitale Prinzip, das man gerade mühsam allgemein durchgesetzt hatte, nun wieder zum analogen Prinzip werden soll. Denn die multivalente Logik fordert nicht nur Bits mit zwei Wahrheitswerten, sondern "Fips" mit unendlich vielen Wahrheitswerten.

Dass es heute bereits viele Fuzzy Logic-Produkte gibt, die die Ergebnisse der herkömmlichen KI-Applikationen bei Weitem übertreffen, ist v.a. den Japanern zu verdanken. Deren Philosophie - durch Buddha geprägt -, kann die multivalente Logik viel eher akzeptieren, als dies den aristotelisch geprägten Westlern möglich ist. 1989 bereits schufen in Japan 48 Firmen das Forschungszentrum LIFE, um die Fuzzy Logic auf Anwendungsmöglichkeiten hin zu analysieren. Der Westen hinkt dazu im Vergleich - wieder einmal - weit, weit hinterher.

3.2. Das Abstufungsprinzip

Wie weiter vorne beschrieben wurde, kann eine Aussage bei der Fuzzy Logic unendlich viele Wahrheitswerte zwischen 0 und 1 annehmen. I.d.R. werden diese unendlich vielen Wahrheitswerte in der Praxis auf mehr als zwei diskrete Werte beschränkt. Üblich ist es z.B., die Wahrheitswerte ähnlich wie bei der Wahrscheinlichkeitsrechnung in Prozentwerten anzugeben, also von 80% WAHR, 20% WAHR usw. zu sprechen. Um dem Logikempfinden des Menschen nahe zu kommen, kann auch eine linguistische Abstufung vorgenommen werden, z.B. WAHR, FAST WAHR, HALBWAHR, KAUM WAHR und FALSCH. Und falls es nötig oder angebracht sein sollte, kann natürlich auch wieder die gewohnte bivalente WAHR-FALSCH-Abstufung zum Einsatz kommen.

3.3. Das Unscharfe-Mengen-Prinzip

Die Fuzzy Logic ermöglicht es, mit sogenannten unscharfen Mengen zu operieren. Bei einer mathematisch scharfen Menge sind alle Elemente voll oder gar nicht enthalten. Man kann zwei solche scharfen Mengen z.B. bilden, indem man Menschen fragt, ob sie männlich oder weiblich sind. Doch nur selten lassen sich Elemente so eindeutig einer Menge zuordnen wie in diesem Fall. Die Fragen "Wer ist mit seinem Job zufrieden?" und "Wer ist mit seinem Job nicht zufrieden?" wird vermutlich zwei Mengen hervorbringen, die dennoch gemeinsame Elemente haben - denn Menschen sind häufig mit ihrem Job zufrieden UND auch gleichzeitig nicht zufrieden, daher können sie sich nicht eindeutig, also zu 100%, für eine der beiden Mengen entscheiden. Dies erlebt man ebenso in Schulklassen, wenn man fragt: "Wer weiss die Antwort auf die Frage?" Oft versuchen Schüler, die sich bei der Antwort nicht ganz sicher sind, diesen Zwiespalt dadurch zu lösen, dass sie sich nicht richtig melden, sondern den Arm nur ein wenig anheben. Jeder hat wohl schon einmal für sich selbst erlebt, dass Fragen alleine mit "Ja" und "Nein" zu beantworten schwerer ist, als wenn man auch noch weniger absolute Antworten wie "fast richtig", "völlig falsch", "jein" usw. geben darf.

3.4. Das Ganze-im-Teil-Prinzip und die Teilmengigkeit

Weiss man, dass ein Element einer unscharfen Menge nur zum Teil darin enthalten ist, dann weiss man auch, inwieweit die ganze Menge im Teil enthalten ist. Dies lässt sich mathematisch konkretisieren: Ist das Element x in der unscharfen Menge X zu y% enthalten, dann weiss man auch, dass die unscharfe Menge X zu y% in x enthalten ist. Dieser Tatbestand liest sich zwar ähnlich wie eine Wahrscheinlichkeitsrechnung - und tatsächlich werden hier auch die gleichen Rechenmethoden und Rechenmittel angewendet. Jedoch ist die Aussage letztlich eine ganz andere: Es wird bei der multivalenten Logik nicht behauptet, dass sich Element x zu y% Wahrscheinlichkeit ganz in X aufhält, sondern dass sich x zu 100% Wahrscheinlichkeit mit y% in X aufhält. Es geht hier also um eine Teilmengigkeit und nicht um ein wahrscheinlichkeitsbedingtes Enthaltensein. Die Wahrscheinlichkeitsrechnung würde das Ganze-im-Teil-Prinzip im Übrigen auch gar nicht zulassen, denn wie sollte die unscharfe Menge X mit einer Wahrscheinlichkeit von y% ganz in x enthalten sein können?

3.5. Fuzzy-logische Entropie

Der Begriff der Entropie gibt den Grad der Unsicherheit oder Unordnung in einem System an. Herkömmliche binäre Systeme verleugnen diese Unsicherheit, in dem sie Ereignisse aufrunden bzw. abrunden, sodass sie zwischen zwei eindeutigen Zuständen wählen können. Das vereinfacht die Realität, geht aber auf Kosten der Genauigkeit. Die Fuzzy Logic erlaubt es hingegen, die Unsicherheit oder die Unschärfe einer Menge zu messen, also den Grad, inwieweit sie von einem sicheren Zustand entfernt ist. Nehmen wir dazu als Beispiel eine Menge von drei Menschen: Wenn diese sich für ein gegebenes Problem exakt zwischen "Ja" oder "Nein" entscheiden sollen, gibt es 2^3=8 verschiedene Möglichkeiten für die Werte der Dreiermenge: 000, 001, 010, 011, 100, 101, 110 und 111. Grafisch kann man sich dazu einen dreidimensionalen Würfel vorstellen, dessen 8 Kanten jeweils eine scharfe Ausprägung der Dreiermenge wiedergeben.

Gestattet es man nun der Gruppe, nicht nur zwischen "Ja" oder "Nein" zu wählen, sondern "Ja" mit x% anzugeben, dann füllt sich das Innere des oben aufgespannten Würfels mit unscharfen Elementwerten. Möchte man nun die Entropie eines inneren Punktes messen, kann man nach dem KI-Forscher Bart Kosko folgende Formel einsetzen:

                           Strecke vom Punkt zur nächsten Ecke
fuzzy-logische Entropie =  ------------------------------------ 
                           Strecke vom Punkt zur weitesten Ecke

Mathematisch für eine unscharfe Menge A ausgedrückt:

       A UND NICHT-A 
E(A) = --------------
       A ODER NICHT-A

4. Zur Wahrheit

Was ist Wahrheit? Der US-amerikanische analytische Philosoph Donald Davidson antwortete darauf: Wahr oder falsch gibt es nur für Gegenstände oder Ereignisse, weil es denkenden Kreaturen wie den Menschen gibt. Ausserdem reduzierte die Philosophie die Wahrheit weiter auf die Sprache, machte sie dadurch zu einem alleinigen Problem der Sprache. Man kann jeder sprachlichen Aussage eine 1 oder eine 0 zuweisen, je nachdem, ob sie WAHR oder FALSCH ist. Doch diese Auffassung ist wieder nur bivalent, kann also (vermutlich) nur begrenzte Gültigkeit für sich beanspruchen. Sehen wir uns dazu zwei verschiedene Wahrheitsbegriffe an.

4.1. Kohärenztheorie

Im Rahmen von Kohärenztheorien wird mit einem logischen Wahrheitsbegriff gearbeitet. Wahr ist hier etwas, wenn es kohärent, also zusammenhängend zum Ganzen ist, wenn es sich also aus irgendwelchen Axionen herleiten lässt. Alle formalen Systeme (z.B. die Mathematik) sind Kohärenzsysteme. Ihre logischen Wahrheitsbegriffe benötigen dabei keinerlei Korrespondenz zur Realität und sie müssen nicht interpretiert werden, aber sie müssen innerhalb des Systems konsistent sein.

4.2. Korrespondenztheorie

Im Rahmen von Korrespondenztheorien wird dagegen mit einem faktischen Wahrheitsbegriff gearbeitet. Hier ist eine Aussage dann und nur dann WAHR, wenn sie mit den Tatsachen übereinstimmt. Der faktische Wahrheitsbegriff korrespondiert also mit der Raumzeit, was bedeutet, dass er sich unter Umständen auch ändern kann. Z.B. ist die Aussage "Die Erde dreht sich" nur WAHR, falls die Erde sich tatsächlich dreht.

4.3. Fuzzy Logic und die Wahrheitsfindung

Die oben beschriebenen Wahrheitsbegriffe sind beide bivalent, d.h. entweder 100%ig WAHR oder 100%ig FALSCH. Auch wenn der faktische und der logische Wahrheitswert dieselbe Aussage beurteilen, müssen sie nicht übereinstimmen. Der deutsche Philosoph Immanuel Kant (1724-1804) jedoch glaubte, dass es einen idealisierten Wahrheitsbegriff gibt, der logisch wie faktisch stets denselben bivalenten Wahrheitswert trägt. Dazu müsste der Mensch Kraft der a priori vorhandenen Ideen in der menschlichen Vernunft ein formales System erschaffen (wie z.B. die Mathematik). Die philosophische Bewegung des Positivismus verwarf diese Vorstellung wieder, denn für sie existiert keine Verbindungen zwischen Geist und Materie. Für sie zählt alleine der faktische Wahrheitsbegriff: Eine Aussage ist WAHR, wenn sie mit den Tatsachen übereinstimmt, ansonsten ist sie FALSCH. Wie bereits erwähnt, reduzierten die Positivisten, allen voran Rudolf Carnap (1891-1970), die Wahrheit schliesslich auf das Studium von Worten. Hier bekamen sie aber Problemen, denn wie soll man z.B. die Aussage "Gras ist grün" beurteilen? WAHR wäre positivistisch gesehen nicht zulässig, denn neben grünem Gras existiert auch stets braunes oder schwarzes Gras - Gras ist daher eine unscharfe Menge. Die Aussage "Gras ist grün" ist also FALSCH, genauso wie auch alle anderen Aussagen mit unscharfen Mengen FALSCH wären. Doch da diese wie oben gezeigt eindeutig in der Natur dominieren, endet der strenge Positivismus unweigerlich im Nihilismus. Auch der Versuch, sich durch Prozentangaben aus der Klemme zu helfen, muss scheitern. "Gras ist zu 90% grün" ist WAHR bedeutet ja, dass das Gras mit einer 90%igen Wahrscheinlichkeit ganz grün ist - aber ganz grün ist natürliches Gras nie, daher ist im positivistischen Sinne die Behauptung WAHR in diesem Falle wiederum nicht möglich.

Wenden wir dagegen die Fuzzy Logic an, haben wir keine Probleme. Auch hier wird der faktische Wahrheitsbegriff eingesetzt. Jedoch gibt es diesmal keine klare Trennung zwischen WAHR und FALSCH, denn der fuzzy-logische Wahrheitsbegriff ist nicht bivalent, sondern multivalent. Wenn wir also die Aussage "Gras ist grün" hören, können wir sie fuzzy-logisch mit z.B. 90% WAHR beantworten. Ein anderer könnte antworten: zu 85% WAHR. Wieder ein anderer: zu 93% WAHR. Jeder könnte den Wahrheitswert nennen, der seinem eigenem Gefühl und seiner eigenen positivistischen Erfahrung entspricht, ohne dabei zu einer unnatürlichen Aufrundung oder Abrundung gezwungen zu sein. Als Endergebnis könnte man den Mittelwert aller Wahrheitswerte nehmen. Das ist dann zwar kein objektiver, dafür aber ein intersubjektiver und demokratisch ermittelter Wert für die Wahrheit einer Aussage, der sicher mehr Akzeptanz findet, als ein dogmatisches WAHR oder FALSCH.

5. Fuzzy Logic und die Wahrscheinlichkeitsrechnung

5.1. Die Bivalenz der Wahrscheinlichkeitsrechnung

Oft hört man von Kritikern der Fuzzy Logic, sie sei im Prinzip nichts anderes als Wahrscheinlichkeitsrechnung in neuem Gewand. Doch dies trifft nicht zu. Einzig die Formeln, also die Mathematik der Fuzzy Logic, ähnelt der der Wahrscheinlichkeitsrechnung sehr - sie will aber letztlich etwas ganz anderes beweisen. Die Wahrscheinlichkeitsrechnung ist wie die herkömmliche Logik bivalent. In ihren Mengen geht es um Elemente, die entweder ganz oder gar nicht, nie aber nur zum Teil irgendwo enthalten sind. Daran ändern auch Wahrscheinlichkeitsangaben nichts. Dazu ein Beispiel:

Bei der Wahrscheinlichkeitsrechnung werden stets Annahmen aufgestellt, die die Realität vereinfachen. So soll es z.B. fair zugehen. Es wird dann gesagt: Auf einem Parkplatz stehen 100 Parkplätze zur Verfügung, d.h., das gerade eben parkende Auto wird mit einer Wahrscheinlichkeit von (100/100)% auf einen bestimmten Parkplatz stehen bleiben, das nächste Auto wird wiederum mit einer Wahrscheinlichkeit von (100/99)% auf einem bestimmten Parkplatz stehen bleiben usw. Am Ende dieses Prozesses ist nur noch ein Parkplatz frei; kommt jetzt noch ein Auto dazu, so wird dieses zu (100/1)% auf dem letzten freien Parkplatz parken.

Nach obigem Muster befinden sich also zuletzt 100 Fahrzeuge auf genau 100 Parkplätzen. Doch entspricht dies der Realität? Läuft man über einen beliebigen Parkplatz, wird man ein ganz anderes Bild zu sehen bekommen: Parkplätze sind nur häufig nur halb belegt, sodass sich drei Autos zwei Parkplätze teilen, breite Fahrzeuge belegen nicht nur einen Parkplatz, sondern gleich zwei usw. Es ist letztlich sehr unwahrscheinlich, dass auf einem hinreichend grossen realen Parkplatz die Anzahl der belegten Plätze mit denen der Fahrzeuge exakt übereinstimmt.

Selbst wenn man nun versuchen sollte, die Wahrscheinlichkeitsrechnung zu bemühen, dass ein Fahrzeug nicht nur auf einem Parkplatz, sondern auf deren Zweien steht, trifft man den realen Sachverhalt damit nicht. Denn "das Auto steht zu 30% auf Parkplatz A und zu 70% auf Parkplatz B" heisst ja nur, dass das Fahrzeug mit einer Wahrscheinlichkeit von 30% auf Parkplatz A bzw. 70% auf Parkplatz B als Ganzes steht, also ENTWEDER-ODER und VOLL-UND-GANZ. Die Fuzzy Logic erlaubt dagegen die abgestufte Teilhaftigkeit. Hier wäre "das Fahrzeug steht auf Parkplatz A" zu 30% WAHR und "das Fahrzeug steht auf Platz B" zu 70% WAHR, der tatsächliche Tatbestand wiedergegeben, der Wahrheitswert also faktisch korrekt.

Fassen wir noch einmal zusammen:

  • Die Wahrscheinlichkeitsrechnung beschreibt, ob zufällige Ereignisse ganz oder gar nicht stattfinden.
  • Die Fuzzy Logic beschreibt, bis zu welchem Grad Ereignisse stattfinden.

5.2. Der Tod des Zufall

Der deutsche Physiker Albert Einstein (1879-1955) war massgeblich an der Entwicklung der Quantenmechanik beteiligt. Nach dieser Theorie herrschen im Mikrokosmos der Elementarteilchen die Gesetze der Wahrscheinlichkeitsrechnung, d.h., es kann nicht genau bestimmt werden, wo sich ein Teilchen befindet, sondern es kann nur bis zu einem gewissen Grad vermutet werden, dass es sich dort befindet. Atombewegungen sind zufällig und können daher nur durch Wahrscheinlichkeiten eingegrenzt werden. Da nun aber der gesamte Makrokosmos auf dem Mikrokosmos aufsitzt, hält der Zufall auch dort Einzug. Einstein gefiel diese Vorstellung nicht, daher distanzierte er sich später von der Quantenmechanik. "Gott würfelt nicht", erklärte er dazu.

Man kann sich tatsächlich die Frage stellen: Gibt es so etwas wie Zufall? Oder ist doch letztlich alles auf deterministische Zusammenhänge, auf Kausalitäten, zurückzuführen? Der österreichische Zoologe Konrad Lorenz (1903-1989) dachte, nur Ereignisse, zwischen denen ein Energieübertrag stattgefunden hat, können kausal zusammenhängen, d.h., der Zufall ist in der Welt durchaus vorhanden. Doch möglicherweise erliegt hier Lorenz - ebenso wie auch die meisten anderen - einem angeborenen Instinkt, den man den Wahrscheinlichkeitsinstinkt nennen könnte. Es bringt dem Menschen zweifellos grosse biologisch-selektive Vorteile, wenn er in der Lage ist, zukünftige Ereignisse im Voraus vermuten zu können. Ein dem Zeitstrom unterworfenes Wesen kann sich mittels eines Wahrscheinlichkeitsinstinkts wesentlich besser auf Probleme einstellen, die sein Überleben gefährden, als ein Wesen, das diesen Instinkt nicht besitzt. Doch ein angeborener Wahrscheinlichkeitsinstinkt muss nicht unbedingt die Tatsachen wiedergeben, um effektiv zu sein. Man denke dazu an den menschlichen Rauminstinkt: Auch er gaukelt uns verschiedene Höhen und Längen von ein und denselben Strecken vor, um uns davor zurückzuhalten, irgendwo hinunterzuspringen.

Wir postulieren also einen Wahrscheinlichkeitsinstinkt, der uns den Zufall als gegeben annehmen lässt, der uns aber gleichzeitig hilft, diesen Zufall in gewissem Grad berechenbar zu machen. Wie erwähnt, ist die Existenz für einen solchen Wahrscheinlichkeitsinstinkt kein Grund, dass es in der Realität tatsächlich so etwas wie Zufall gibt. Wir behaupten sogar, es gibt ihn nicht. Um es mit dem schottischen Philosophen David Hume (1711-1776) zu sagen: Der Zufall ist nur ein Glaube aufgrund unserer Unkenntnis von den wirklichen Ursachen eines Ereignisses. Zwar scheinen einige Dinge tatsächlich rein zufällig zu geschehen, doch letztlich lassen sie sich immer auf irgendwelche Ursachen zurückführen, die sich ihrerseits auf Ursachen zurückführen lassen usw. Die Ursachenfindung ist allerdings so aufwendig, so vielfältig, dass der Mensch dazu nicht in der Lage ist - selbst unter Einsatz modernster Technik nicht. Dies hat auch die Chaostheorie erkannt, die ebenfalls von einem deterministischen Universum ausgeht und nicht von einem zufälligen Universum.

Um noch einmal zu verdeutlichen, dass es keines Zufalls bedarf, um Ereignisse zu erklären, kann man sich einen Film vorstellen, der einen Apfel an einem Baum zeigt. Nun sagt der Wahrscheinlichkeitsinstinkt: Es ist zu erwarten, dass dieser Apfel mit x% Wahrscheinlichkeit vom Baum fällt. Und tatsächlich: Minuten später fällt der Apfel plötzlich und - offenbar - zufällig vom Baum herunter und landet im Gras. Nun stelle man sich vor, wie dieser Film rückwärts abläuft: Der Apfel springt aus dem Gras an den Baum zurück und bleibt dort hängen. Hier ist der Zufall nicht mehr zu sehen, die Wahrscheinlichkeit verschwunden, denn der Apfel ist vorher nicht wahrscheinlich heruntergefallen, sondern definitiv, was man nun zurückverfolgen kann. Bei mehrmaligem Betrachten erkennt man vielleicht sogar den Grund dafür, dass der Apfel vom Baum fiel, z.B. weil Wind aufgekommen war oder Ähnliches.

Wahrscheinlichkeiten und damit Zufall kennt nur ein Wesen, das vorwärts in die Zeit blickt. Könnte es rückwärts blicken, würde es nur eine Kette von Kausalitäten erkennen. Viele Formeln, die die Arbeitsweise des Universums annäherungsweise wiedergeben, gelten vorwärts wie rückwärts in der Zeit, sind also unabhängig von Wahrscheinlichkeiten und Zufall. Der Zufall ist kein Faktum der Natur, sondern bloss eine Illusion des vorwärtsdenkenden Menschen. Aber ist es nicht so, dass die Gesetze der Quantenmechanik auf der Wahrscheinlichkeit basieren? Ist die Quantenmechanik also unzutreffend? Nicht unbedingt, denn die Wahrscheinlichkeiten lassen sich auch über die Teilmengigkeit von unscharfen Mengen darstellen, und diese kommen völlig ohne Zufall aus. Gleichzeit wird die Quantenmechanik dadurch erweitert, dass sie mithilfe der Fuzzy Logic auch nicht von nur zwei Zuständen ausgehen muss - ein Elementarteilchen existiert oder existiert nicht -, sondern sagen kann: Ein Elementarteilchen existiert zu x%. Dass in subatomarer Ebene auch noch Teilmengigkeit möglich ist, hat uns die Spaltung der Atome bewiesen. Es ist zu erwarten, dass auch die Quarks irgendwann weiter geteilt werden können. D.h., die Welt wird auch in den kleinsten Dimensionen nie schwarz-weiss werden, sondern bleibt immer grau - grau wie die Fuzzy Logic.

6. KI und Fuzzy Logic

6.1. Die misslungene Intelligentwerdung der Computer

Vor 30 Jahren sagte die Forscher der Künstlichen Intelligenz (KI) eine glänzende Zukunft voraus. Zukunftsvisionen von hyperintelligenten Robotern machten die Runde. Die Menschheit richtete sich darauf ein, dass in naher Zukunft die Maschinen das Denken übernehmen würden. Doch was ist von all diesen Erwartungen geblieben? Nichts. Die KI hat nicht auch nur ein einziges, halbwegs intelligentes System hervorgebracht, ausser auf Gebieten, die mathematisch zu bearbeiten sind, wie z.B. Schach. Die viel diskutierten Expertensysteme (XPS) verpufften zur Beinahe-Bedeutungslosigkeit. Computer stehen in jedem Büro, doch das Denken nehmen sie einem damit noch lange nicht ab. Was ist passiert? Warum haben sich die Hoffnungen der KI-Forscher nicht erfüllt?

Die KI-Forscher sagen: Bisher waren die Ergebnisse enttäuschend, da die Computer noch nicht über genügend Kapazität verfügen, um alle bivalenten Wenn-dann-Regeln der Experten aufnehmen zu können. Derzeit kann ein XPS ca. 1.000 Regeln bearbeiten, ein System müsste aber schon aus über 100.000 Regeln Schlüsse ziehen können, um intelligent zu sein. Es sei jedoch nur eine Frage der Zeit, bis dieses Ziel erreicht würde.

Die Fuzzy Logic-Forscher sagen dagegen: Falsch, ihr braucht nicht mehr bivalente Wenn-dann-Regeln, sondern nur multivalente Wenn x% A-dann y% B-Regeln einzusetzen. Mithilfe einer einzigen multivalenten Regel kann man etliche bivalente Regeln ersetzten. Aus diesem Grund benötigen Fuzzy Logic-Systeme vergleichsweise wenige Regeln, um intelligent und sogar "menschlich" zu agieren. Sie sind auch wesentlich einfacher zu programmieren, da sie ohne ein mathematisches Modell auskommen. Und darüber hinaus sind sie auch noch flexibler: Der Wenn-Teil muss nicht 100%ig erfüllt sein, damit die Regel feuert, sondern nur zu einem beliebig kleinen Prozentsatz. Ändert sich also eine Regel im Laufe der Zeit geringfügig, wird sie in Fuzzy Logik-Systemen noch immer berücksichtigt, während sie in KI-Systemen zum nutzlosen Ballast wird.

6.2. Das Fuzzy-Approximation-Theorem der Fuzzy Logic-Systeme

Fuzzy Logic-Systeme arbeiten nach dem Fuzzy-Approximation-Theorem (FAT), welches besagt, dass jede Kurvenfunktion, die z.B. ein natürliches Verhalten von irgendetwas widerspiegelt, mithilfe endlich vieler "fuzziger", d.h. sich selbst überlappender, "Flecken" überdeckt werden kann. Solche Flecken werden in Fuzzy Logic-Systemen mittels einfacher Wenn-dann-Regeln repräsentiert, die bei unscharfem Input unscharfen Output produzieren können. D.h., die Fuzzy Logic-Systeme versuchen nicht die Kurvenfunktion mathematisch exakt zu bestimmen, sondern sie nur ungefähr zu approximieren. Dabei wird die Annäherung absichtlich nicht zu weit getrieben, sodass die Kette der FAT-Flecken auch noch dynamische Funktionen erfassen können. Auf diese Weise können äusserst komplizierte Vorgänge in der Natur, deren exakte Funktion aufgrund der meist üblichen Linearität der Mathematik kaum herauszubekommen ist, auf relativ einfache Weise "erschlagen" werden. Auch Menschen gehen auf diese Weise vor, wenn sie zukünftige Ereignisse auf annähernd funktionelle Weise bestimmen wollen.

Dem japanischen Physiker Michio Sugeno des LIFE-Forschungsinstituts gelang es, mit fuzzy-logischen Regeln eine äusserst komplizierte Funktion in den Griff zu bekommen, die das Flugverhalten eines Hubschraubers mit nur einem Rotorblatt wiedergibt. Es gibt keinen Menschen und erst recht kein KI-System, was einen solchen Hubschrauber fliegen könnte. Aber das Fuzzy Logic-System Sugenos gelingt dies mit Leichtigkeit, obwohl es dazu nur lächerliche 100 fuzzy-logische Regeln benötigt.

6.3. KI-Vorschriften versus Fuzzy Logic-Prinzipien

Um zu demonstrieren, wie es sein kann, das ein Fuzzy Logic-System so viel weniger Regeln benötigt als ein KI-System, kann man sich den Unterschied zwischen den Vorschriften und den Prinzipien im Rechtssystem klarmachen. Ein KI-System arbeitet mit Vorschriften, die nur in einigen Fällen greifen, und zwar genau dann, wenn exakt ihr Wenn-Teil erfüllt wurde. Um alle möglichen Wenn-Fälle abzudecken, muss es daher eine sehr grosse Anzahl von Vorschriften geben. Die Komplexität des Vorschriftensystems expandiert noch dadurch, dass Vorschriften häufig Änderungen erfahren (im Gegensatz zu den ihnen zugrunde liegenden Prinzipien), dass z.B. Falschparken in der Innenstadt irgendwann 15 DM, statt wie bisher 10 DM kostet.

Die Fuzzy Logic verzichtet auf eindeutige Wenn-dann-Regel, genauso wie sie nicht wartet, bis ein Fall einen Wenn-Teil zu 100% erfüllt. Fuzzy Logic-Systeme arbeiten mit relativ wenigen Prinzipien, aus denen die Vorschriften abgeleitet werden können. Ein solches Prinzip ist im Rechtssystem z.B. "Vor dem Gesetz sind alle gleich". Im Gegensatz zu Vorschriften, greifen bei beliebigen Fällen alle Prinzipien, zumindest bis zu einem gewissen Grad. Fuzzy Logic-Systeme summieren also einfach den Output der Wenn-dann-Regel-Anteile und erhalten nach einer "Entfuzziierung" einen gemittelten Output zurück.

Wir fassen zusammen: KI-Systeme arbeiten mit vielen, veränderlichen und eindeutigen Wenn-dann-Vorschriften, die nur bei ebenso eindeutigen Mengen greifen, während Fuzzy Logic-Systeme mit wenigen, relativ konstanten und gewichtenden Wenn-dann-Prinzipien arbeiten, die alle bei unscharfen Mengen bis zu einem gewissen Grad greifen.

7. Neuronale Netze und Fuzzy Logic

7.1. Neuronale Energietücher

Neuronale Netze simulieren die Arbeitsweise des Gehirns. Die Neuronen sind dabei Bausteine, die Strom speichern können und erst ab einer gewissen Spannung zu feuern beginn, d.h. sie arbeiten nach dem Alles-oder-Nichts-Prinzip. Jedes Neuron ist vernetzt mit vielen anderen Neuronen. Wenn ein Neuron feuert, gibt es seine Stromstärke an die anderen angeschlossenen Neuronen weiter, die dann eventuell ebenfalls feuern. Da Neuronale Netze i.d.R. rückkoppelnd arbeiten, kann es eine Weile dauern, bis das Neuronale Netz nach einem Input einen stabilen Zustand eingenommen hat. Ein solcher stabiler Zustand stellt ein gelerntes Faktum dar.

Stellt man sich das Neuronale Netz als ein Energietuch vor, dann gräbt ein gelernter Zustand einen Graben in das Tuch hinein. Erfolgt der gleiche Input noch einmal, erfährt das Loch eine weitere Vertiefung. Erfolgen dagegen ständig andere Inputs, dann kann es passieren, dass der Graben im Energietuch allmählich verwischt, weil er durch andere Gräben von neu Gelerntem in der Nähe überdeckt wird - das Neuronale Netz beginnt dadurch, das gelernte Faktum zu vergessen. Man kann sich das ähnlich vorstellen wie bei einem Rasen, in dem man ein Wort hineingemäht hat: Wird das Wort nicht regelmässig nachgemäht, dann wird es irgendwann verblasst sein.

Ein in ein Neuronales Netz eingespeister Input - i.d.R. die gleichzeitige Aktivierung einiger Neuronen - wirkt wie ein Ball, der an einer bestimmten Stelle auf das Energietuch fällt und sofort in den nächsten Graben zu rollen beginnt. D.h., der Input muss nicht jedes Mal alle Gräben durchsuchen, bis er den richtigen gelernten Output-Graben findet. Beim Menschen funktioniert dies genauso: Man erinnert sich z.B. an das Bild der Eltern immer gleich schnell, auch wenn man im Laufe seines Lebens Tausende von Gesichtern im Gedächtnis gespeichert hat. Auch das Vergessen funktioniert beim Menschen ähnlich: Fehlt der Input, dann werden die Synapsen zwischen den Neuronen gekappt. Denkt man ständig den gleichen Input, dann sorgen Myelinscheiden dafür, dass die ursprünglich dünnen Neuronenbahnen zu den reinsten "Autobahnen" werden.

Ein Neuronales Netz kann genau dann auf einen bestimmten Input einen bestimmten Output liefern, wenn es diesen Output zuvor gelernt hat. Gelernt heisst, dass das Neuronale Netz an seinen Neuronen einen bestimmten Energiewert eingenommen hat, die vorzugsweise in Form lokaler Minima im Energietuch anzutreffen sind. Hat ein Neuronales Netz viele Inputs gelernt, dann gleicht sein Energietuch einem Gebirge. D.h., die Stromwerte der einzelnen Neuronen haben sich auf einen bestimmten Wert eingependelt, der sich bei neuen Inputs - ausser an bestimmten Stellen (nämlich dort, wo das neue Faktum gelernt wird) - nur wenig ändert, da sonst das alte Gelernte wieder gelöscht würde. Daran erkennt man: Die Kapazität von Neuronalen Netzen ist begrenzt, jeder neue Input ändert das Neuronale Netz, jede Wiederholung eines Inputs verstärkt die spezifische Ausprägung im Energietuch, die den Output ausmacht - das Neuronale Netz pendelt sich auf einen bestimmten Energiezustand ein, der vorher nicht absehbar ist. Neuronale Netze sind selbstorganisierend, d.h., die Neuronen brauchen nicht zu wissen, wie sie einen Information speichern sollen, sondern sie tun dies einfach aufgrund der Inputs und des eigenen Potenzials. Durch die Rückkopplung und die hohe Anzahl der Neuronen verhalten sich Neuronale Netze auf ungeheuer komplexe Weise. Daher kann man auch nicht den Neuronen von Beginn an bestimmte Energiewerte zuweisen, um bestimmte Outputs zu erhalten. Man muss es ihnen konsequent durch immer wieder gleiche Inputs beibringen.

7.2. Neuronale Fuzzy Logic-Regelproduzenten

Neuronale Netze verarbeiten bestimmte Inputs und liefern daraufhin bestimmte Outputs. Sie tun dies in sehr ähnlicher Weise wie der Mensch. Keiner kann genau sagen, warum ein Neuronales Netz auf bestimmte Inputs gerade dieses und kein anderes Energiemuster bildet, aber das ist auch gar nicht nötig. Wichtig ist nur, dass es seinen Zustand zunehmend stabilisiert, selbst wenn der Input leicht variiert. D.h., das Neuronale Netze früher oder später genauso unscharfe Inputs verarbeiten können, wie das menschliche Gehirn. Die Outputs, die sie liefern, stabilisieren sich aber dagegen. Und genau das können sich Fuzzy-Logiker zunutze machen.

Das grosse Problem der Fuzzy-Logiker ist es nämlich, multivalente Wenn-dann-Regeln aufzustellen, die bei unscharfem Input einen gewünschten, möglichst scharfen Output liefern können. Solche Regeln zu finden ist sehr schwierig - so schwierig, dass sie möglicherweise in Zukunft sogar patentierbar werden. Ein Neuronales Netz kann den Fuzzy-Logikern helfen, diese angestrebten scharfen Outputs auf unscharfe Inputs zu liefern, wie wir oben gesehen haben. Sie sind hervorragend als DIRO-Systeme (Data-in-Rule-out) einsetzbar. Und genau hier werden wohl Neuronale Netze ihr Haupteinsatzgebiet finden, denn die Fuzzy Logic, diese multivalente Logik einer neuen grauen Welt, die hält nun niemand mehr auf.