Maik Pickl | Interaktive Lektion: Eine Einführung in Neuronale Netze

Teil 1: Das intelligente Papier

Was ist eigentlich künstliche Intelligenz? Denkt ihr, ein einfaches Blatt Papier kann euch im Tic-Tac-Toe schlagen? Finden wir es heraus!

Die Regeln des Papiers (Ich bin X und ich fange an)

Zug 1: Gehe in eine Ecke.
Zug 2: WENN der Gegner NICHT in die Ecke gegenüber von Zug 1 gegangen ist, DANN gehe in diese Ecke. SONST gehe in eine andere freie Ecke.
Zug 3: WENN es eine Reihe mit zwei X und einem leeren Feld gibt, DANN gehe in dieses leere Feld (GEWINN). SONST, WENN es eine Reihe mit zwei O und einem leeren Feld gibt, DANN gehe in dieses leere Feld (BLOCK). SONST gehe in eine freie Ecke.
Zug 4: WENN es eine Reihe mit zwei X und einem leeren Feld gibt, DANN gehe in dieses leere Feld (GEWINN). SONST, WENN es eine Reihe mit zwei O und einem leeren Feld gibt, DANN gehe in dieses leere Feld (BLOCK). SONST gehe in ein freies Feld.
Zug 5: Gehe in das letzte freie Feld.

Teil 2: Brain-in-a-Bag

Ein neuronales Netz ist ein Versuch, die Funktionsweise des Gehirns im Computer nachzubilden. Es besteht aus einfachen Einheiten, den "Neuronen", die miteinander verbunden sind. Jedes Neuron empfängt Signale, verarbeitet sie nach einer einfachen Regel und sendet dann selbst ein Signal weiter. Durch das Zusammenspiel vieler solcher Neuronen können komplexe Muster erkannt oder Entscheidungen getroffen werden.

Jetzt bauen wir selbst ein solches Gehirn. Wir simulieren die Neuronen und ihre Verbindungen mit einfachen Materialien.

Was ihr braucht:

Freiwillige ("Neuronen")
Signalbecher oder Pappröhren als "Signale"
Lange Seile oder Schnüre als "Axone" (die Verbindungen)
Spielkarten

Wählt eine Variante:

Eure Aufgabe: Versucht herauszufinden, was das neuronale Netz tut! Welche Eingabe (Kartenkombination) führt zum finalen Output ("Snap!" oder "Katsching!")?

Jedes Neuron hat eine feste Regel. Finde deine Rolle:

Wer bist du? (Neuron-Nummer) Passwort:

Teil 3: Das Gehirn im Computer

Was wir mit Seilen und Röhren gemacht haben, können wir auch im Computer simulieren. Probiere es selbst aus und bringe dem digitalen Gehirn bei, das XOR-Problem zu lösen!

Netzwerk-Ansicht & Steuerung

X

0.0

Y

0.0

H1

0.0

H2

0.0

Out

0.0

Inputs

X-Achse:

Y-Achse:

Gewichte & Biases

w (X → H1):

w (Y → H1):

Bias H1:

w (X → H2):

w (Y → H2):

Bias H2:

w (H1 → O):

w (H2 → O):

Bias Out:

Fehlerhafte Fläche: ...

Legende:Blau = Bereich A | Orange = Bereich B

Teil 4: Wie eine Maschine lernt – Mit Mathematik!

In unserer Simulation haben wir die Regler so lange verschoben, bis der Fehler möglichst klein war. Aber wie macht das ein Computer ganz allein? Er benutzt Mathematik, um systematisch die "beste" Einstellung zu finden. Wir schauen uns das an einem stark vereinfachten Beispiel an, das ihr mit Schulmathematik lösen könnt.

Der Sachkontext: Eisverkauf

Ein Eisverkäufer stellt fest: Je wärmer es ist, desto mehr Eiskugeln verkauft er. Er hat zwei Messungen gemacht:

Bei 10 °C hat er 22 Eiskugeln verkauft. (Punkt P₁)
Bei 20 °C hat er 38 Eiskugeln verkauft. (Punkt P₂)

Er möchte eine einfache Formel (ein "Modell") finden, um zukünftige Verkäufe vorherzusagen. Sein Modell ist eine simple Gerade durch den Ursprung:

$$ \text{Verkauf} = a \cdot \text{Temperatur} $$

Unsere Aufgabe ist es, den besten Wert für die Steigung $a$ zu finden, sodass die Gerade "so gut wie möglich" zu beiden Datenpunkten passt.

Schritt 1: Der Fehler für jeden Punkt

Die "beste" Gerade ist die, bei der der Gesamtfehler am kleinsten ist. Der Fehler an einem Punkt ist der Abstand zwischen dem echten Wert und dem vorhergesagten Wert unserer Geraden.

Fehler bei P₁ (10, 22): Der echte Wert ist 22. Unsere Gerade sagt $a \cdot 10$ voraus. Der Fehler ist $ \text{Fehler}_1 = 22 - 10a $.
Fehler bei P₂ (20, 38): Der echte Wert ist 38. Unsere Gerade sagt $a \cdot 20$ voraus. Der Fehler ist $ \text{Fehler}_2 = 38 - 20a $.

Schritt 2: Die Gesamtfehler-Funktion F(a)

Um positive und negative Fehler gleich zu behandeln und große Fehler stärker zu bestrafen, quadrieren wir die einzelnen Fehler und addieren sie. Das nennt man den "quadratischen Fehler" (Sum of Squared Errors).

$$ F(a) = (\text{Fehler}_1)^2 + (\text{Fehler}_2)^2 $$
$$ F(a) = (22 - 10a)^2 + (38 - 20a)^2 $$

Jetzt multiplizieren wir die Klammern (mit den binomischen Formeln) aus und fassen zusammen:

$$ F(a) = (484 - 440a + 100a^2) + (1444 - 1520a + 400a^2) $$
$$ F(a) = 500a^2 - 1960a + 1928 $$

Das ist eine nach oben geöffnete Parabel! Der "beste" Wert für $a$ ist genau der x-Wert des Scheitelpunkts dieser Parabel – denn dort ist der Fehler $F(a)$ am kleinsten.

Grafische Darstellung des quadratischen Fehlers als Abstand von Punkten zu einer Geraden.

Der quadratische Fehler ist die Summe der Flächen der Quadrate (Fehler²).

Schritt 3: Den besten Wert für $a$ finden

Um den Scheitelpunkt (das Minimum) zu finden, setzen wir die erste Ableitung der Fehlerfunktion gleich Null. Dieser Vorgang, bei dem man schrittweise das Minimum einer Fehlerfunktion sucht, wird Gradientenabstieg genannt. Man startet an einem zufälligen Punkt und "geht" immer in die Richtung des steilsten Abfalls, bis man im Tal (Minimum) ankommt.

Ableitung von $F(a)$:
$$ F'(a) = 2 \cdot 500a - 1960 = 1000a - 1960 $$

Minimum finden, indem wir die Ableitung Null setzen:
$$ 1000a - 1960 = 0 $$
$$ 1000a = 1960 $$
$$ a = \frac{1960}{1000} = 1.96 $$

Das beste $a$ ist also 1.96! Die optimale Formel für den Eisverkäufer lautet: $ \text{Verkauf} = 1.96 \cdot \text{Temperatur} $.

Visualisierung des Gradientenabstiegs auf einer Fehleroberfläche.

Beim Gradientenabstieg folgt man dem steilsten Gefälle der Fehlerfunktion, um das Minimum zu finden.

Jetzt bist du dran!

Ein anderer Eisverkäufer hat folgende Daten gesammelt:

Bei 5 °C hat er 15 Eiskugeln verkauft. (Punkt P₁)
Bei 25 °C hat er 45 Eiskugeln verkauft. (Punkt P₂)

Berechne nach dem oben gezeigten Schema den optimalen Wert für die Steigung $a$ in seinem Modell $ \text{Verkauf} = a \cdot \text{Temperatur} $. Runde dein Ergebnis auf zwei Nachkommastellen.

Dein berechneter Wert für a: