Fuzzy Logic und neuronale Netze
Geschwurbel von Daniel Schwamm (03/1994)
Inhalt
Seit der griechische Philosoph Aristoteles vor über 2.000 Jahren die Gesetze der
formalen Logik begründet hat, ist die westliche Welt dazu
übergegangen, die Wahrheit als etwas Zweiwertiges (Bivalentes) anzusehen:
Eine Aussage kann entweder WAHR oder NICHT-WAHR, also FALSCH sein, aber niemals
beides zusammen. Das Gesetz vom ausgeschlossenen Dritten verbietet es der
logischen Aussagen A UND NICHT-A, ein anderes Ergebnis als FALSCH
hervorzubringen. Die Philosophie und die Wissenschaft lehnen daher
Halbwahrheiten ab. Nach ihnen muss alles klar und deutlich als WAHR oder
FALSCH erkennbar sein, um ernst genommen zu werden. Die philosophische Position
des Positivismus dominiert das Denken des Westens. Auch sie ist bivalent,
schwarz und weiss. Auch sie behauptet, dass etwas ist oder etwas
nicht ist, dass es eine klare Trennlinie für Sein oder Nicht-Sein
gibt. Ein sinnlich erfahrbares Objekt ist z.B. ein Stuhl oder kein Stuhl und
dazwischen gibt es nichts. Wenn also jemand behauptet, dieses Objekt sei ein
Stuhl UND gleichzeitig auch nicht ein Stuhl, dann wird er vom Wissenschaftler
ausgelacht und für unlogisch erklärt. Die bivalente Logik und der
bivalente Positivismus finden ihren Niederschlag in der bivalenten Informatik.
Ein Bit ist entweder gesetzt oder gelöscht, WAHR oder FALSCH, Strom an
oder Strom aus, 1 oder 0, aber niemals 0.5 oder 0.2. Der Computer versteht nur
klare, eindeutige Aussagen, mit vagen, unsicheren Aussagen der Form "WENIG
WAHR" oder "SEHR FALSCH" kann er nichts anfangen. Die Wissenschaft ebenso wenig.
Der Mensch aber schon.
Im Osten der Welt prägte Buddha das Denken, wie es
Aristoteles im Westen getan hat. Er glaubte jedoch im Gegensatz zu dem Griechen
daran, dass etwas Sein und doch auch gleichzeitig Nicht-Sein kann. Ying
und Yang, die zwei extremsten Formen des Seins in der östlichen
Philosophie, befinden sich in der Welt als Ganzes in Balance. Die Welt ist also
weder nur Ying, noch nur Yang, sie ist beides zusammen, genauer: Sie ist zur
Hälfte Ying und zur Hälfte Yang. Und diese Annahme prägt auch
das logische Denken - es ist vielwertig (multivalent), d.h., eine Aussage kann
nicht nur WAHR ODER FALSCH sein, sondern auch WAHR UND FALSCH, also dem
aristotelischen Satz vom ausgeschlossenen Dritten widersprechen. WAHR UND
FALSCH heisst aber nicht, wie man in der Schwatz-Weiss-Denkart des
Westens vermuten könnte, dass eine Aussage zu 100% WAHR UND zu 100%
FALSCH sein kann. Dies wäre tatsächlich unlogisch und würde dem
gesunden Menschenverstand widersprechen. Aber sie kann durchaus zu 80% WAHR UND
zu 20% FALSCH sein. Sie kann also durchaus "fuzzig" (unscharf) sein.
Zenon, der grosse griechische Philosoph, tritt vor seine Schüler und weist auf
etwas vor ihm auf dem Tisch. "Was ist das?", fragt er.
"Ein Haufen Sand" bekommt er als Antwort zurück.
"Richtig, das ist ein Haufen Sand", sagt Zenon lächelnd,
nimmt ein paar Sandkörner vom Haufen weg und streut dafür
Salzkörner rein. Dann fragt er erneut: "Was ist das?"
Die Schüler sind verblüfft. "Es ist immer noch ein Haufen Sand."
Zenon entnimmt dem Haufen Sand weitere Sandkörner und ersetzt sie durch Salzkörner.
"Was ist das?", fragt er ein drittes Mal.
Unsicherheit spiegelt sich in den Gesichtern der Schüler. "Ein Haufen Sand",
sagt ein Teil von ihnen. "Ein Haufen Salz", sagt ein anderer.
Zenon wiederholt die Prozedur des Austauschs von Sand durch Salz, sodass vom
ursprünglichen Sandhaufen nur noch wenig Körner übrig sind. "Was ist das?"
"Jetzt ist es ein Haufen Salz", behaupten nun seine Schüler.
"Richtig, das ist ein Haufen Salz. Aber wann", fragt Zenon triumphierend,
"hat der Haufen Sand aufgehört, ein Haufen Sand zu sein und wurde zu einem
Haufen Salz?"
Darauf wusste keiner seiner Schüler eine eindeutige Antwort.
So oder so ähnlich könnte es sich zugetragen haben, als Zenon der Ältere bzw.
Zenon von Elea (490-430 v. Chr.) seinen Schülern das berühmte Sandhaufen-Paradoxon
vorgetragen hat. Und obwohl es seit über 2.000 Jahre bekannt ist, kann bis heute
niemand - nicht einmal die Wissenschaft - eine Antwort auf Zenons letzte Frage geben.
Wann hört ein Haufen Sand auf, ein Haufen Sand zu sein, wenn man ihm ständig
Sandkörner entnimmt und durch Salzkörner ersetzt? Lässt sich ein Sandkorn bestimmen,
an dem der Wechsel vom Sandhaufen zum Nicht-Sandhaufen vollzogen wird? Nein,
sicher nicht. Der Wechsel vom Sandhaufen zum Nicht-Sandhaufen vollzieht sich
offensichtlich ganz allmählich - es gibt keine scharfe Trennlinie zwischen
Sandhaufen und Nicht-Sandhaufen. Es heisst also nicht an einer Stelle: Das Objekt
ist ein Sandhaufen ODER ein Nicht-Sandhaufen. Sondern es heisst kontinuierlich:
Das Objekt ist zu x% ein Sandhaufen UND zu 100-x% ein Nicht-Sandhaufen. Die
Wahrheit ist nicht bivalent, sondern multivalent. Sie ist nicht schwarz-weiss,
sondern sie ist grau.
Die (positivistische) Wissenschaft ist bestrebt, Aussagen zu
treffen, die WAHR ODER FALSCH sind. Ein WAHR UND NICHT-WAHR hat sie -
Aristoteles Gesetz vom ausgeschlossenen Dritten folgend - als unzulässig
erklärt. Logisch gesehen gibt es also nichts, was einerseits WAHR ist,
anderseits aber auch gleichzeitig NICHT-WAHR sein kann. Die Wissenschaft sieht
demnach die Welt schwarz und weiss, und Grautöne ignoriert sie
einfach. Das Zenon-Paradoxon von oben zeigt uns aber, dass die Welt
sehr wohl Grautöne kennt. Mehr noch, der Grossteil allen Seins ist
grau, denn nur Sonderfälle sind ausschliesslich das eine, ohne auch -
und sei es noch so gering - ein bisschen das andere zu sein. So sieht die
Welt in Wahrheit aus: Männer sind männlich UND ein wenig weiblich,
also Mann UND Nicht-Mann, Pazifisten sind friedfertig UND ein wenig
kriegerisch, also Pazifisten UND Nicht-Pazifisten, Kugeln sind rund UND ein
wenig eckig, also rund UND nicht-rund, Menschen sind klein UND ein wenig
gross, also klein und nicht-klein usw. Die Wissenschaft, die die bivalente
Logik des Aristoteles zum einzigen Instrument der Wahrheitsfindung erkoren hat,
sieht dagegen nur Männer ODER Frauen, Pazifisten ODER Nicht-Pazifisten,
rund ODER nicht-rund, klein ODER nicht-klein.
Das ist das Problem der Fehlpassung: Die herkömmliche
Wissenschaft ist schwarz-weiss, die Welt aber grau. Daher kann die
Wissenschaft auch bisher nur Aussagen über Sonderfälle in der Natur
treffen, ihr aber über die bivalente Logik niemals im grösseren
Umfang gerecht werden.
Im vorherigen Kapitel wurde auf die Fehlpassung zwischen der
Welt und der herkömmlichen Wissenschaft hingewiesen, die auf die bivalente
Logik des Aristoteles zurückzuführen ist, die nur 100%ig WAHR und
100%ig FALSCH als Wahrheitswerte anerkennt. Wie wir gesehen haben, dominieren
in der Welt jedoch Grautöne, die mit "WENIG WAHR", "SEHR WAHR", "FAST
NICHT WAHR" oder ähnlichen linguistischen Ausdrücken beschrieben
werden müssen, wie dies der Mensch beim Gebrauch der natürlichen
Sprache auch schon immer getan hat. Nötig ist also eine Logik, die nicht
nur zwei Wahrheitswerte kennt, sondern viele - unter Umständen sogar
unendlich viele. Eine solche multivalente Logik gibt es seit einiger Zeit:
die Fuzzy Logic. Sie erlaubt im Gegensatz zur bivalenten Logik Operationen
mit unscharfen Mengen, womit sie dem menschlichen Denken wesentlich näher
rückt. Doch bevor wir näher auf sie eingehen, wenden wir uns zunächst einmal
ihrer Entstehungsgeschichte zu.
Vor fast 3.000 Jahren erkannte der indische Religionsstifter Buddha
(Siddhartha Gautama, ca. 544 v. Chr. gestorben), dass alle Dinge
zwei Seiten in sich vereinbaren. Das Gute trägt auch stets das Böse
in sich, das Weiche stets auch das Harte, das Unlebendige stets auch das
Lebendige und das Sein stets auch das Nichtsein. Es gibt keine klare
Trennlinie zwischen den Dingen. Werden solche künstlich geschaffen - etwa
durch Sprache oder mathematische Definitionen -, so werden die
Verschränkungen der beiden Seiten in jedem Ding leicht übersehen.
Buddha sagt daher nicht: "Der Geist denkt Gedanken über Dinge", was eine
einseitige und in diesem Falle unnatürliche Aussage wäre, sondern er
sagt: "Der Nichtgeist nichtdenkt Nichtgedanken über Nichtdinge."
Laotse, ein legendärer chinesischer Philosoph, der im 6. Jahrhundert v. Chr.
gelebt haben soll, griff die Ideen Buddhas auf und schuf das Ying-Yang-Prinzip
des Taoismus, welches besagt, dass sich die Welt im Gleichgewicht zwischen zwei
extremen Polen befindet, sie also beide gleichzeitig in sich vereint. Somit ist
jedes Ding gleichzeitig auch Nicht-Ding. Ein Stock ist z.B. auch ein Nicht-Stock,
was man daran erkennen kann, dass man ihn immer weiter zerbrechen kann, ohne dass
er dadurch irgendwann einseitig zum Stock oder Nicht-Stock würde. Ying und Yang
befinden sich auch in Balance bei den Aussagen: "Das Glas ist halb voll" und
"Das Glas ist halb leer".
Der griechische Philosoph Heraklit von Ephesos (gestorben um 460 v. Chr.) erkannte,
dass es nichts Absolutes gibt, dass sich alles in ewiger Veränderung befindet.
"Alles fliesst", wie er sich ausdrückte, "nur die Veränderung selbst ist ewig".
Demokrit, ebenfalls ein griechischer Philosoph, der um 400 v. Chr. verstarb,
behauptete dagegen mit dem Atomismus zwei eindeutige Zustände der Welt: Alles Sein
besteht demnach aus Atomen, alles Nicht-Sein aus nichts - und Zwischenstufen können
nicht existieren.
Aristoteles verfeinerte den Atomismus durch die Logik auch auf
sprachliche Aussagen. Eine Aussage kann nach ihm nur 100%ig WAHR ODER 100%ig
FALSCH sein, niemals aber zu x% WAHR UND zu 100-x% FALSCH. Dies besagt das von
ihm geschaffenen - oder besser behauptete - Gesetz des ausgeschlossenen Dritten.
In den folgenden Jahrhunderten galt die bivalente Logik als einzige legitime
Methode, um mathematische und naturwissenschaftliche Theorien logisch beweisen
zu können.
Zenon der Ältere wollte diese Logik nicht akzeptieren. Und so schuf er die
sogenannten Sorites-Paradoxien, die durch nicht klar ziehbare Trennlinie
entstehen, um auf die Mängel der bivalenten Logik hinzuweisen, wie z.B. das oben
beschriebene Sandhaufen-Paradoxon. Oder auch das Inzest-Paradoxon, bei dem die
Frage gestellt wird, ab wann Inzest zu Inzest wird. Wenn man die Beine der Mutter
berührt? Oder erst, wenn man intimere Stellen berührt? Die Gelehrte nach Zenon
räumten diese Paradoxien allerdings nicht etwa aus, sondern verdrängten sie,
in der optimistischen Annahme, sie würde früher oder später schon gelöst werden.
Doch dies geschah nie.
Etliche Jahrhunderte nach Zenon kamen beim britischen Mathematiker Bertrand Russell
(1872-1970) erneut Zweifel an der Richtigkeit der bivalenten Logik auf. Er kreierte
das Barbier-Paradoxon. Ein Barbier behauptet hier auf einem Schild in seinem Geschäft:
"Alle Männer der Stadt, die sich nicht selbst rasieren, werden von mir rasiert."
Frage: Wer rasiert den Barbier? Diese Frage ist logisch nicht zu beantworten,
denn wenn der Barbier sich selbst rasiert, dürfte er dies nach seinem Schild gerade
nicht tun. Wenn er sich aber nicht selbst rasiert, dann müsste er es nach seinem Schild
wiederum gerade doch tun - nur so kann die Aussage des Schildes WAHR werden.
Russels Kritik an der Logik verunsicherte die Gelehrten durchaus,
liessen sie die bivalente Logik aber nicht kategorisch infrage stellen. Dabei
schlug Russel auch erstmals vor, wie man das Paradoxon aus dem Weg räumen könnte:
Man musste dazu nur Aristoteles Gesetz vom ausgeschlossenen Dritten aufgeben,
also A UND NICHT-A gleichzeitig zulassen.
Im 20. Jahrhundert wies die Unschärferelation des deutschen Physikers Werner
Heisenberg (1901-1876) daraufhin, dass der
Naturwissenschaft ganz natürliche Grenzen gesetzt sind, die verhinderten,
dass Dinge in eindeutiger Weise definiert werden können. So ist es z.B.
nicht möglich, den Ort und die Geschwindigkeit eines Elementarteilchens
gleichzeitig festzustellen. Daraus resultierte eine dreiwertige Logik:
Ein Teilchen ist existent, ist unbestimmt oder aber nicht-existent. Es
ist also WAHR, UNBESTIMMT oder FALSCH. Der grosse Traum der Wissenschaft,
die Welt in eindeutiger Weise zu beschreiben, war ausgeträumt.
Der polnische Philosoph Jan Lukasiewicz (1878-1956) ging noch einen Schritt weiter.
Er zerhackte den UNBESTIMMT-Wahrheitswert Heisenbergs und schuf so ein Kontinuum
von 0 bis 1, in dem sich ein beliebiger Wahrheitswert befinden darf. Die multivalente
Logik war geboren.
Noch einmal weiter ausgebaut wurde die multivalente Logik des US-amerikanischen
Philosophen Max Black (1909-1988), der sie im Zusammenhang mit der Informationstheorie
einsetzte. Allerdings sprach er noch von vager Logik.
Den Begriff Fuzzy Logic schuf schliesslich der persisch-amerikanische Ingenieur
Lotfi Zadeh (geboren 1921). Sein Verdienst ist es hauptsächlich, dass
diese neue Form der Logik, die die bivalenten Wahrheitswerte WAHR und FALSCH
nur als Grenzwerte beinhaltete, so populär wurde. Allerdings nicht an den
Universitäten, sondern zuerst und vor allem in der Wirtschaft. Die
Informatiker konnten und können sich vermutlich nur schwer damit abfinden,
dass das digitale Prinzip, das man gerade mühsam allgemein
durchgesetzt hatte, nun wieder zum analogen Prinzip werden soll. Denn die
multivalente Logik fordert nicht nur Bits mit zwei Wahrheitswerten, sondern
"Fips" mit unendlich vielen Wahrheitswerten.
Dass es heute bereits viele Fuzzy Logic-Produkte gibt, die die Ergebnisse
der herkömmlichen KI-Applikationen bei Weitem übertreffen, ist v.a. den
Japanern zu verdanken. Deren Philosophie - durch Buddha geprägt -, kann die
multivalente Logik viel eher akzeptieren, als dies den aristotelisch
geprägten Westlern möglich ist. 1989 bereits schufen in Japan 48 Firmen
das Forschungszentrum LIFE, um die Fuzzy Logic auf Anwendungsmöglichkeiten
hin zu analysieren. Der Westen hinkt dazu im Vergleich - wieder einmal -
weit, weit hinterher.
Wie weiter vorne beschrieben wurde, kann eine Aussage bei
der Fuzzy Logic unendlich viele Wahrheitswerte zwischen 0 und 1 annehmen.
I.d.R. werden diese unendlich vielen Wahrheitswerte in der Praxis auf mehr als
zwei diskrete Werte beschränkt. Üblich ist es z.B., die
Wahrheitswerte ähnlich wie bei der Wahrscheinlichkeitsrechnung in
Prozentwerten anzugeben, also von 80% WAHR, 20% WAHR usw. zu sprechen. Um dem
Logikempfinden des Menschen nahe zu kommen, kann auch eine linguistische Abstufung
vorgenommen werden, z.B. WAHR, FAST WAHR, HALBWAHR, KAUM WAHR und FALSCH. Und
falls es nötig oder angebracht sein sollte, kann natürlich auch wieder die
gewohnte bivalente WAHR-FALSCH-Abstufung zum Einsatz kommen.
Die Fuzzy Logic ermöglicht es, mit sogenannten unscharfen Mengen zu
operieren. Bei einer mathematisch scharfen Menge sind alle Elemente voll
oder gar nicht enthalten. Man kann zwei solche scharfen Mengen z.B. bilden,
indem man Menschen fragt, ob sie männlich oder weiblich sind. Doch nur selten
lassen sich Elemente so eindeutig einer Menge zuordnen wie in diesem
Fall. Die Fragen "Wer ist mit seinem Job zufrieden?" und "Wer ist mit seinem
Job nicht zufrieden?" wird vermutlich zwei Mengen hervorbringen, die dennoch
gemeinsame Elemente haben - denn Menschen sind häufig mit ihrem Job zufrieden
UND auch gleichzeitig nicht zufrieden, daher können sie sich nicht eindeutig,
also zu 100%, für eine der beiden Mengen entscheiden. Dies erlebt man ebenso in
Schulklassen, wenn man fragt: "Wer weiss die Antwort auf die Frage?" Oft
versuchen Schüler, die sich bei der Antwort nicht ganz sicher sind, diesen
Zwiespalt dadurch zu lösen, dass sie sich nicht richtig melden, sondern den
Arm nur ein wenig anheben. Jeder hat wohl schon einmal für sich selbst erlebt,
dass Fragen alleine mit "Ja" und "Nein" zu beantworten schwerer ist, als wenn
man auch noch weniger absolute Antworten wie "fast richtig", "völlig falsch",
"jein" usw. geben darf.
Weiss man, dass ein Element einer unscharfen Menge
nur zum Teil darin enthalten ist, dann weiss man auch, inwieweit die
ganze Menge im Teil enthalten ist. Dies lässt sich mathematisch
konkretisieren: Ist das Element x in der unscharfen Menge X zu y% enthalten,
dann weiss man auch, dass die unscharfe Menge X zu y% in x enthalten
ist. Dieser Tatbestand liest sich zwar ähnlich wie eine
Wahrscheinlichkeitsrechnung - und tatsächlich werden hier auch die gleichen
Rechenmethoden und Rechenmittel angewendet. Jedoch ist die Aussage letztlich
eine ganz andere: Es wird bei der multivalenten Logik nicht behauptet,
dass sich Element x zu y% Wahrscheinlichkeit ganz in X aufhält, sondern dass
sich x zu 100% Wahrscheinlichkeit mit y% in X aufhält. Es geht hier also
um eine Teilmengigkeit und nicht um ein wahrscheinlichkeitsbedingtes Enthaltensein.
Die Wahrscheinlichkeitsrechnung würde das Ganze-im-Teil-Prinzip im
Übrigen auch gar nicht zulassen, denn wie sollte die unscharfe Menge X mit
einer Wahrscheinlichkeit von y% ganz in x enthalten sein können?
Der Begriff der Entropie gibt den Grad der Unsicherheit oder Unordnung in
einem System an. Herkömmliche binäre Systeme verleugnen diese Unsicherheit,
in dem sie Ereignisse aufrunden bzw. abrunden, sodass sie zwischen zwei
eindeutigen Zuständen wählen können. Das vereinfacht die Realität, geht aber
auf Kosten der Genauigkeit. Die Fuzzy Logic erlaubt es hingegen, die Unsicherheit
oder die Unschärfe einer Menge zu messen, also den Grad, inwieweit sie von einem
sicheren Zustand entfernt ist. Nehmen wir dazu als Beispiel eine Menge von drei
Menschen: Wenn diese sich für ein gegebenes Problem exakt zwischen "Ja" oder "Nein"
entscheiden sollen, gibt es 2^3=8 verschiedene Möglichkeiten für die Werte der
Dreiermenge: 000, 001, 010, 011, 100, 101, 110 und 111. Grafisch kann man sich
dazu einen dreidimensionalen Würfel vorstellen, dessen 8 Kanten jeweils eine
scharfe Ausprägung der Dreiermenge wiedergeben.
Gestattet es man nun der Gruppe, nicht nur zwischen "Ja" oder
"Nein" zu wählen, sondern "Ja" mit x% anzugeben, dann füllt sich das
Innere des oben aufgespannten Würfels mit unscharfen Elementwerten.
Möchte man nun die Entropie eines inneren Punktes messen, kann man nach
dem KI-Forscher Bart Kosko folgende Formel einsetzen:
Strecke vom Punkt zur nächsten Ecke
fuzzy-logische Entropie = ------------------------------------
Strecke vom Punkt zur weitesten Ecke
Mathematisch für eine unscharfe Menge A ausgedrückt:
A UND NICHT-A
E(A) = --------------
A ODER NICHT-A
Was ist Wahrheit? Der US-amerikanische analytische Philosoph Donald Davidson
antwortete darauf: Wahr oder falsch gibt es nur für Gegenstände oder Ereignisse,
weil es denkenden Kreaturen wie den Menschen gibt. Ausserdem reduzierte die
Philosophie die Wahrheit weiter auf die Sprache, machte sie dadurch zu einem
alleinigen Problem der Sprache. Man kann jeder sprachlichen Aussage eine 1 oder
eine 0 zuweisen, je nachdem, ob sie WAHR oder FALSCH ist. Doch diese Auffassung
ist wieder nur bivalent, kann also (vermutlich) nur begrenzte Gültigkeit für sich
beanspruchen. Sehen wir uns dazu zwei verschiedene Wahrheitsbegriffe an.
Im Rahmen von Kohärenztheorien wird mit einem logischen
Wahrheitsbegriff gearbeitet. Wahr ist hier etwas, wenn es kohärent, also
zusammenhängend zum Ganzen ist, wenn es sich also aus irgendwelchen
Axionen herleiten lässt. Alle formalen Systeme (z.B. die Mathematik)
sind Kohärenzsysteme. Ihre logischen Wahrheitsbegriffe benötigen
dabei keinerlei Korrespondenz zur Realität und sie müssen nicht
interpretiert werden, aber sie müssen innerhalb des Systems konsistent
sein.
Im Rahmen von Korrespondenztheorien wird dagegen mit einem faktischen
Wahrheitsbegriff gearbeitet. Hier ist eine Aussage dann und nur dann WAHR,
wenn sie mit den Tatsachen übereinstimmt. Der faktische Wahrheitsbegriff
korrespondiert also mit der Raumzeit, was bedeutet, dass er sich unter
Umständen auch ändern kann. Z.B. ist die Aussage "Die Erde dreht sich" nur
WAHR, falls die Erde sich tatsächlich dreht.
Die oben beschriebenen Wahrheitsbegriffe sind beide bivalent,
d.h. entweder 100%ig WAHR oder 100%ig FALSCH. Auch wenn der faktische und der
logische Wahrheitswert dieselbe Aussage beurteilen, müssen sie nicht
übereinstimmen. Der deutsche Philosoph Immanuel Kant (1724-1804) jedoch glaubte,
dass es einen idealisierten Wahrheitsbegriff gibt, der logisch wie faktisch stets
denselben bivalenten Wahrheitswert trägt. Dazu müsste der Mensch Kraft der a priori
vorhandenen Ideen in der menschlichen Vernunft ein formales System erschaffen
(wie z.B. die Mathematik). Die philosophische Bewegung des Positivismus verwarf
diese Vorstellung wieder, denn für sie existiert keine Verbindungen zwischen Geist
und Materie. Für sie zählt alleine der faktische Wahrheitsbegriff: Eine Aussage
ist WAHR, wenn sie mit den Tatsachen übereinstimmt, ansonsten ist sie
FALSCH. Wie bereits erwähnt, reduzierten die Positivisten, allen voran Rudolf
Carnap (1891-1970), die Wahrheit schliesslich auf das Studium von Worten. Hier
bekamen sie aber Problemen, denn wie soll man z.B. die Aussage "Gras ist grün"
beurteilen? WAHR wäre positivistisch gesehen nicht zulässig, denn neben grünem
Gras existiert auch stets braunes oder schwarzes Gras - Gras ist daher eine
unscharfe Menge. Die Aussage "Gras ist grün" ist also FALSCH, genauso wie auch
alle anderen Aussagen mit unscharfen Mengen FALSCH wären. Doch da diese wie oben
gezeigt eindeutig in der Natur dominieren, endet der strenge Positivismus
unweigerlich im Nihilismus. Auch der Versuch, sich durch Prozentangaben aus der
Klemme zu helfen, muss scheitern. "Gras ist zu 90% grün" ist WAHR bedeutet ja,
dass das Gras mit einer 90%igen Wahrscheinlichkeit ganz grün ist - aber ganz
grün ist natürliches Gras nie, daher ist im positivistischen Sinne die
Behauptung WAHR in diesem Falle wiederum nicht möglich.
Wenden wir dagegen die Fuzzy Logic an, haben wir keine
Probleme. Auch hier wird der faktische Wahrheitsbegriff eingesetzt. Jedoch gibt
es diesmal keine klare Trennung zwischen WAHR und FALSCH, denn der
fuzzy-logische Wahrheitsbegriff ist nicht bivalent, sondern multivalent. Wenn
wir also die Aussage "Gras ist grün" hören, können wir sie
fuzzy-logisch mit z.B. 90% WAHR beantworten. Ein anderer könnte antworten:
zu 85% WAHR. Wieder ein anderer: zu 93% WAHR. Jeder könnte den
Wahrheitswert nennen, der seinem eigenem Gefühl und seiner eigenen
positivistischen Erfahrung entspricht, ohne dabei zu einer unnatürlichen
Aufrundung oder Abrundung gezwungen zu sein. Als Endergebnis könnte man den
Mittelwert aller Wahrheitswerte nehmen. Das ist dann zwar kein objektiver,
dafür aber ein intersubjektiver und demokratisch ermittelter Wert für
die Wahrheit einer Aussage, der sicher mehr Akzeptanz findet, als ein
dogmatisches WAHR oder FALSCH.
Oft hört man von Kritikern der Fuzzy Logic, sie sei im Prinzip
nichts anderes als Wahrscheinlichkeitsrechnung in neuem Gewand. Doch dies
trifft nicht zu. Einzig die Formeln, also die Mathematik der Fuzzy Logic,
ähnelt der der Wahrscheinlichkeitsrechnung sehr - sie will aber letztlich etwas
ganz anderes beweisen. Die Wahrscheinlichkeitsrechnung ist wie die herkömmliche
Logik bivalent. In ihren Mengen geht es um Elemente, die entweder ganz oder gar
nicht, nie aber nur zum Teil irgendwo enthalten sind. Daran ändern auch
Wahrscheinlichkeitsangaben nichts. Dazu ein Beispiel:
Bei der Wahrscheinlichkeitsrechnung werden stets Annahmen aufgestellt,
die die Realität vereinfachen. So soll es z.B. fair zugehen. Es wird dann
gesagt: Auf einem Parkplatz stehen 100 Parkplätze zur Verfügung, d.h.,
das gerade eben parkende Auto wird mit einer Wahrscheinlichkeit von (100/100)%
auf einen bestimmten Parkplatz stehen bleiben, das nächste Auto wird wiederum
mit einer Wahrscheinlichkeit von (100/99)% auf einem bestimmten Parkplatz
stehen bleiben usw. Am Ende dieses Prozesses ist nur noch ein Parkplatz frei;
kommt jetzt noch ein Auto dazu, so wird dieses zu (100/1)% auf dem letzten
freien Parkplatz parken.
Nach obigem Muster befinden sich also zuletzt 100 Fahrzeuge auf
genau 100 Parkplätzen. Doch entspricht dies der Realität? Läuft
man über einen beliebigen Parkplatz, wird man ein ganz anderes Bild zu
sehen bekommen: Parkplätze sind nur häufig nur halb belegt, sodass sich drei
Autos zwei Parkplätze teilen, breite Fahrzeuge belegen nicht nur einen Parkplatz,
sondern gleich zwei usw. Es ist letztlich sehr unwahrscheinlich, dass auf einem
hinreichend grossen realen Parkplatz die Anzahl der belegten Plätze mit denen
der Fahrzeuge exakt übereinstimmt.
Selbst wenn man nun versuchen sollte, die Wahrscheinlichkeitsrechnung zu bemühen,
dass ein Fahrzeug nicht nur auf einem Parkplatz, sondern auf deren Zweien steht,
trifft man den realen Sachverhalt damit nicht. Denn "das Auto steht zu 30% auf
Parkplatz A und zu 70% auf Parkplatz B" heisst ja nur, dass das Fahrzeug mit einer
Wahrscheinlichkeit von 30% auf Parkplatz A bzw. 70% auf Parkplatz B als Ganzes steht,
also ENTWEDER-ODER und VOLL-UND-GANZ. Die Fuzzy Logic erlaubt dagegen die abgestufte
Teilhaftigkeit. Hier wäre "das Fahrzeug steht auf Parkplatz A" zu 30% WAHR und
"das Fahrzeug steht auf Platz B" zu 70% WAHR, der tatsächliche Tatbestand wiedergegeben,
der Wahrheitswert also faktisch korrekt.
Fassen wir noch einmal zusammen:
-
Die Wahrscheinlichkeitsrechnung beschreibt, ob zufällige Ereignisse ganz oder gar
nicht stattfinden.
- Die Fuzzy Logic beschreibt, bis zu welchem Grad Ereignisse stattfinden.
Der deutsche Physiker Albert Einstein (1879-1955) war massgeblich an der Entwicklung
der Quantenmechanik beteiligt. Nach dieser Theorie herrschen im Mikrokosmos der
Elementarteilchen die Gesetze der Wahrscheinlichkeitsrechnung, d.h., es kann
nicht genau bestimmt werden, wo sich ein Teilchen befindet, sondern es kann nur
bis zu einem gewissen Grad vermutet werden, dass es sich dort befindet.
Atombewegungen sind zufällig und können daher nur durch
Wahrscheinlichkeiten eingegrenzt werden. Da nun aber der gesamte Makrokosmos
auf dem Mikrokosmos aufsitzt, hält der Zufall auch dort Einzug.
Einstein gefiel diese Vorstellung nicht, daher distanzierte er sich später
von der Quantenmechanik. "Gott würfelt nicht", erklärte er dazu.
Man kann sich tatsächlich die Frage stellen: Gibt es so etwas wie Zufall? Oder ist doch
letztlich alles auf deterministische Zusammenhänge, auf Kausalitäten, zurückzuführen?
Der österreichische Zoologe Konrad Lorenz (1903-1989) dachte, nur Ereignisse,
zwischen denen ein Energieübertrag stattgefunden hat, können kausal zusammenhängen,
d.h., der Zufall ist in der Welt durchaus vorhanden. Doch möglicherweise erliegt hier
Lorenz - ebenso wie auch die meisten anderen - einem angeborenen Instinkt, den man den
Wahrscheinlichkeitsinstinkt nennen könnte. Es bringt dem Menschen
zweifellos grosse biologisch-selektive Vorteile, wenn er in der Lage ist,
zukünftige Ereignisse im Voraus vermuten zu können. Ein dem Zeitstrom
unterworfenes Wesen kann sich mittels eines Wahrscheinlichkeitsinstinkts
wesentlich besser auf Probleme einstellen, die sein Überleben
gefährden, als ein Wesen, das diesen Instinkt nicht besitzt. Doch
ein angeborener Wahrscheinlichkeitsinstinkt muss nicht unbedingt die Tatsachen
wiedergeben, um effektiv zu sein. Man denke dazu an den menschlichen
Rauminstinkt: Auch er gaukelt uns verschiedene Höhen und Längen von
ein und denselben Strecken vor, um uns davor zurückzuhalten, irgendwo
hinunterzuspringen.
Wir postulieren also einen Wahrscheinlichkeitsinstinkt, der
uns den Zufall als gegeben annehmen lässt, der uns aber gleichzeitig
hilft, diesen Zufall in gewissem Grad berechenbar zu machen. Wie erwähnt,
ist die Existenz für einen solchen Wahrscheinlichkeitsinstinkt kein Grund,
dass es in der Realität tatsächlich so etwas wie Zufall gibt. Wir
behaupten sogar, es gibt ihn nicht. Um es mit dem schottischen Philosophen
David Hume (1711-1776) zu sagen: Der Zufall
ist nur ein Glaube aufgrund unserer Unkenntnis von den wirklichen Ursachen
eines Ereignisses. Zwar scheinen einige Dinge tatsächlich rein
zufällig zu geschehen, doch letztlich lassen sie sich immer auf
irgendwelche Ursachen zurückführen, die sich ihrerseits auf Ursachen
zurückführen lassen usw. Die Ursachenfindung ist allerdings so aufwendig,
so vielfältig, dass der Mensch dazu nicht in der Lage ist - selbst
unter Einsatz modernster Technik nicht. Dies hat auch die Chaostheorie erkannt,
die ebenfalls von einem deterministischen Universum ausgeht und nicht von einem
zufälligen Universum.
Um noch einmal zu verdeutlichen, dass es keines Zufalls
bedarf, um Ereignisse zu erklären, kann man sich einen Film vorstellen,
der einen Apfel an einem Baum zeigt. Nun sagt der Wahrscheinlichkeitsinstinkt:
Es ist zu erwarten, dass dieser Apfel mit x% Wahrscheinlichkeit vom Baum
fällt. Und tatsächlich: Minuten später fällt der Apfel
plötzlich und - offenbar - zufällig vom Baum herunter und landet im
Gras. Nun stelle man sich vor, wie dieser Film rückwärts abläuft:
Der Apfel springt aus dem Gras an den Baum zurück und bleibt dort
hängen. Hier ist der Zufall nicht mehr zu sehen, die Wahrscheinlichkeit
verschwunden, denn der Apfel ist vorher nicht wahrscheinlich heruntergefallen,
sondern definitiv, was man nun zurückverfolgen kann. Bei mehrmaligem
Betrachten erkennt man vielleicht sogar den Grund dafür, dass der
Apfel vom Baum fiel, z.B. weil Wind aufgekommen war oder Ähnliches.
Wahrscheinlichkeiten und damit Zufall kennt nur ein Wesen, das
vorwärts in die Zeit blickt. Könnte es rückwärts blicken,
würde es nur eine Kette von Kausalitäten erkennen. Viele Formeln, die
die Arbeitsweise des Universums annäherungsweise wiedergeben, gelten
vorwärts wie rückwärts in der Zeit, sind also unabhängig
von Wahrscheinlichkeiten und Zufall. Der Zufall ist kein Faktum der Natur,
sondern bloss eine Illusion des vorwärtsdenkenden Menschen. Aber ist
es nicht so, dass die Gesetze der Quantenmechanik auf der
Wahrscheinlichkeit basieren? Ist die Quantenmechanik also unzutreffend? Nicht
unbedingt, denn die Wahrscheinlichkeiten lassen sich auch über die
Teilmengigkeit von unscharfen Mengen darstellen, und diese kommen völlig
ohne Zufall aus. Gleichzeit wird die Quantenmechanik dadurch erweitert,
dass sie mithilfe der Fuzzy Logic auch nicht von nur zwei Zuständen
ausgehen muss - ein Elementarteilchen existiert oder existiert nicht -,
sondern sagen kann: Ein Elementarteilchen existiert zu x%. Dass in subatomarer
Ebene auch noch Teilmengigkeit möglich ist, hat uns die Spaltung der Atome
bewiesen. Es ist zu erwarten, dass auch die Quarks irgendwann weiter
geteilt werden können. D.h., die Welt wird auch in den kleinsten
Dimensionen nie schwarz-weiss werden, sondern bleibt immer grau - grau wie
die Fuzzy Logic.
Vor 30 Jahren sagte die Forscher der Künstlichen Intelligenz (KI) eine glänzende
Zukunft voraus. Zukunftsvisionen von hyperintelligenten Robotern machten die Runde.
Die Menschheit richtete sich
darauf ein, dass in naher Zukunft die Maschinen das Denken übernehmen
würden. Doch was ist von all diesen Erwartungen geblieben? Nichts. Die KI
hat nicht auch nur ein einziges, halbwegs intelligentes System hervorgebracht,
ausser auf Gebieten, die mathematisch zu bearbeiten sind, wie z.B. Schach.
Die viel diskutierten Expertensysteme (XPS) verpufften zur
Beinahe-Bedeutungslosigkeit. Computer stehen in jedem Büro, doch das
Denken nehmen sie einem damit noch lange nicht ab. Was ist passiert? Warum haben sich
die Hoffnungen der KI-Forscher nicht erfüllt?
Die KI-Forscher sagen: Bisher waren die Ergebnisse
enttäuschend, da die Computer noch nicht über genügend Kapazität
verfügen, um alle bivalenten Wenn-dann-Regeln der Experten aufnehmen zu
können. Derzeit kann ein XPS ca. 1.000 Regeln bearbeiten, ein System
müsste aber schon aus über 100.000 Regeln Schlüsse ziehen können, um
intelligent zu sein. Es sei jedoch nur eine Frage der Zeit, bis dieses Ziel
erreicht würde.
Die Fuzzy Logic-Forscher sagen dagegen: Falsch, ihr braucht nicht mehr
bivalente Wenn-dann-Regeln, sondern nur multivalente Wenn x% A-dann y% B-Regeln
einzusetzen. Mithilfe einer einzigen multivalenten Regel kann man etliche
bivalente Regeln ersetzten. Aus diesem Grund benötigen Fuzzy Logic-Systeme
vergleichsweise wenige Regeln, um intelligent und sogar "menschlich" zu
agieren. Sie sind auch wesentlich einfacher zu programmieren, da sie ohne ein
mathematisches Modell auskommen. Und darüber hinaus sind sie auch noch
flexibler: Der Wenn-Teil muss nicht 100%ig erfüllt sein, damit die
Regel feuert, sondern nur zu einem beliebig kleinen Prozentsatz. Ändert
sich also eine Regel im Laufe der Zeit geringfügig, wird sie in Fuzzy
Logik-Systemen noch immer berücksichtigt, während sie in KI-Systemen
zum nutzlosen Ballast wird.
Fuzzy Logic-Systeme arbeiten nach dem Fuzzy-Approximation-Theorem (FAT),
welches besagt, dass jede Kurvenfunktion, die z.B.
ein natürliches Verhalten von irgendetwas widerspiegelt, mithilfe
endlich vieler "fuzziger", d.h. sich selbst überlappender, "Flecken"
überdeckt werden kann. Solche Flecken werden in Fuzzy Logic-Systemen mittels
einfacher Wenn-dann-Regeln repräsentiert, die bei unscharfem Input
unscharfen Output produzieren können. D.h., die Fuzzy Logic-Systeme
versuchen nicht die Kurvenfunktion mathematisch exakt zu bestimmen, sondern sie
nur ungefähr zu approximieren. Dabei wird die Annäherung absichtlich
nicht zu weit getrieben, sodass die Kette der FAT-Flecken auch noch
dynamische Funktionen erfassen können. Auf diese Weise können
äusserst komplizierte Vorgänge in der Natur, deren exakte
Funktion aufgrund der meist üblichen Linearität der Mathematik kaum
herauszubekommen ist, auf relativ einfache Weise "erschlagen" werden. Auch
Menschen gehen auf diese Weise vor, wenn sie zukünftige Ereignisse auf
annähernd funktionelle Weise bestimmen wollen.
Dem japanischen Physiker Michio Sugeno des LIFE-Forschungsinstituts gelang es,
mit fuzzy-logischen Regeln eine äusserst komplizierte Funktion in den
Griff zu bekommen, die das Flugverhalten eines Hubschraubers mit nur einem
Rotorblatt wiedergibt. Es gibt keinen Menschen und erst recht kein KI-System,
was einen solchen Hubschrauber fliegen könnte. Aber das Fuzzy Logic-System
Sugenos gelingt dies mit Leichtigkeit, obwohl es dazu nur lächerliche 100
fuzzy-logische Regeln benötigt.
Um zu demonstrieren, wie es sein kann, das ein Fuzzy
Logic-System so viel weniger Regeln benötigt als ein KI-System, kann man
sich den Unterschied zwischen den Vorschriften und den Prinzipien im
Rechtssystem klarmachen. Ein KI-System arbeitet mit Vorschriften, die nur in
einigen Fällen greifen, und zwar genau dann, wenn exakt ihr Wenn-Teil erfüllt
wurde. Um alle möglichen Wenn-Fälle abzudecken, muss es daher eine
sehr grosse Anzahl von Vorschriften geben. Die Komplexität des
Vorschriftensystems expandiert noch dadurch, dass Vorschriften häufig
Änderungen erfahren (im Gegensatz zu den ihnen zugrunde liegenden
Prinzipien), dass z.B. Falschparken in der Innenstadt irgendwann 15 DM,
statt wie bisher 10 DM kostet.
Die Fuzzy Logic verzichtet auf eindeutige Wenn-dann-Regel,
genauso wie sie nicht wartet, bis ein Fall einen Wenn-Teil zu 100%
erfüllt. Fuzzy Logic-Systeme arbeiten mit relativ wenigen Prinzipien, aus
denen die Vorschriften abgeleitet werden können. Ein solches Prinzip ist
im Rechtssystem z.B. "Vor dem Gesetz sind alle gleich". Im Gegensatz zu
Vorschriften, greifen bei beliebigen Fällen alle Prinzipien, zumindest
bis zu einem gewissen Grad. Fuzzy Logic-Systeme summieren also einfach
den Output der Wenn-dann-Regel-Anteile und erhalten nach einer
"Entfuzziierung" einen gemittelten Output zurück.
Wir fassen zusammen: KI-Systeme arbeiten mit vielen,
veränderlichen und eindeutigen Wenn-dann-Vorschriften, die nur bei ebenso
eindeutigen Mengen greifen, während Fuzzy Logic-Systeme mit wenigen,
relativ konstanten und gewichtenden Wenn-dann-Prinzipien arbeiten, die alle bei
unscharfen Mengen bis zu einem gewissen Grad greifen.
Neuronale Netze simulieren die Arbeitsweise des Gehirns. Die
Neuronen sind dabei Bausteine, die Strom speichern können und erst ab
einer gewissen Spannung zu feuern beginn, d.h. sie arbeiten nach dem
Alles-oder-Nichts-Prinzip. Jedes Neuron ist vernetzt mit vielen anderen
Neuronen. Wenn ein Neuron feuert, gibt es seine Stromstärke an die anderen
angeschlossenen Neuronen weiter, die dann eventuell ebenfalls feuern. Da Neuronale
Netze i.d.R. rückkoppelnd arbeiten, kann es eine Weile dauern, bis das
Neuronale Netz nach einem Input einen stabilen Zustand eingenommen hat. Ein
solcher stabiler Zustand stellt ein gelerntes Faktum dar.
Stellt man sich das Neuronale Netz als ein Energietuch vor,
dann gräbt ein gelernter Zustand einen Graben in das Tuch hinein. Erfolgt
der gleiche Input noch einmal, erfährt das Loch eine weitere Vertiefung.
Erfolgen dagegen ständig andere Inputs, dann kann es passieren, dass
der Graben im Energietuch allmählich verwischt, weil er durch andere
Gräben von neu Gelerntem in der Nähe überdeckt wird - das
Neuronale Netz beginnt dadurch, das gelernte Faktum zu vergessen. Man kann sich
das ähnlich vorstellen wie bei einem Rasen, in dem man ein Wort
hineingemäht hat: Wird das Wort nicht regelmässig nachgemäht,
dann wird es irgendwann verblasst sein.
Ein in ein Neuronales Netz eingespeister Input - i.d.R. die
gleichzeitige Aktivierung einiger Neuronen - wirkt wie ein Ball, der an einer
bestimmten Stelle auf das Energietuch fällt und sofort in den
nächsten Graben zu rollen beginnt. D.h., der Input muss nicht jedes Mal
alle Gräben durchsuchen, bis er den richtigen gelernten Output-Graben
findet. Beim Menschen funktioniert dies genauso: Man erinnert sich z.B. an das
Bild der Eltern immer gleich schnell, auch wenn man im Laufe seines Lebens
Tausende von Gesichtern im Gedächtnis gespeichert hat. Auch das Vergessen
funktioniert beim Menschen ähnlich: Fehlt der Input, dann werden die
Synapsen zwischen den Neuronen gekappt. Denkt man ständig den gleichen
Input, dann sorgen Myelinscheiden dafür, dass die ursprünglich
dünnen Neuronenbahnen zu den reinsten "Autobahnen" werden.
Ein Neuronales Netz kann genau dann auf einen bestimmten Input
einen bestimmten Output liefern, wenn es diesen Output zuvor gelernt hat.
Gelernt heisst, dass das Neuronale Netz an seinen Neuronen einen
bestimmten Energiewert eingenommen hat, die vorzugsweise in Form lokaler Minima
im Energietuch anzutreffen sind. Hat ein Neuronales Netz viele Inputs gelernt,
dann gleicht sein Energietuch einem Gebirge. D.h., die Stromwerte der einzelnen
Neuronen haben sich auf einen bestimmten Wert eingependelt, der sich bei neuen
Inputs - ausser an bestimmten Stellen (nämlich dort, wo das neue
Faktum gelernt wird) - nur wenig ändert, da sonst das alte Gelernte wieder
gelöscht würde. Daran erkennt man: Die Kapazität von Neuronalen
Netzen ist begrenzt, jeder neue Input ändert das Neuronale Netz, jede
Wiederholung eines Inputs verstärkt die spezifische Ausprägung im
Energietuch, die den Output ausmacht - das Neuronale Netz pendelt sich auf
einen bestimmten Energiezustand ein, der vorher nicht absehbar ist. Neuronale
Netze sind selbstorganisierend, d.h., die Neuronen brauchen nicht zu wissen, wie
sie einen Information speichern sollen, sondern sie tun dies einfach aufgrund
der Inputs und des eigenen Potenzials. Durch die Rückkopplung und die hohe
Anzahl der Neuronen verhalten sich Neuronale Netze auf ungeheuer komplexe Weise.
Daher kann man auch nicht den Neuronen von Beginn an bestimmte Energiewerte
zuweisen, um bestimmte Outputs zu erhalten. Man muss es ihnen konsequent
durch immer wieder gleiche Inputs beibringen.
Neuronale Netze verarbeiten bestimmte Inputs und liefern
daraufhin bestimmte Outputs. Sie tun dies in sehr ähnlicher Weise wie der
Mensch. Keiner kann genau sagen, warum ein Neuronales Netz auf bestimmte Inputs
gerade dieses und kein anderes Energiemuster bildet, aber das ist auch gar
nicht nötig. Wichtig ist nur, dass es seinen Zustand zunehmend
stabilisiert, selbst wenn der Input leicht variiert. D.h., das Neuronale Netze
früher oder später genauso unscharfe Inputs verarbeiten können,
wie das menschliche Gehirn. Die Outputs, die sie liefern, stabilisieren sich
aber dagegen. Und genau das können sich Fuzzy-Logiker zunutze machen.
Das grosse Problem der Fuzzy-Logiker ist es nämlich, multivalente
Wenn-dann-Regeln aufzustellen, die bei unscharfem Input einen gewünschten,
möglichst scharfen Output liefern können. Solche Regeln zu finden ist
sehr schwierig - so schwierig, dass sie möglicherweise in Zukunft
sogar patentierbar werden. Ein Neuronales Netz kann den Fuzzy-Logikern helfen,
diese angestrebten scharfen Outputs auf unscharfe Inputs zu liefern, wie wir
oben gesehen haben. Sie sind hervorragend als DIRO-Systeme (Data-in-Rule-out)
einsetzbar. Und genau hier werden wohl Neuronale Netze ihr Haupteinsatzgebiet
finden, denn die Fuzzy Logic, diese multivalente Logik einer neuen grauen Welt,
die hält nun niemand mehr auf.