Ein Rendezvous am Fuße der technologischen Singularität

Mathematik und ChatGPT


Rezension

ChatGPT ist ein fortschrittliches Sprachmodell, das von OpenAI entwickelt wurde. Es basiert auf der GPT (Generative Pre-trained Transformer) Architektur, wobei "GPT-3" und die nachfolgenden Versionen zu den bekanntesten und leistungsfähigsten Beispielen gehören. ChatGPT ist darauf trainiert, menschenähnliche Texte zu generieren und auf eine Vielzahl von Eingabeaufforderungen zu reagieren. Dies umfasst das Beantworten von Fragen, das Schreiben von Essays, das Erstellen von kreativen Geschichten, das Übersetzen von Sprachen, das Generieren von Programmcode und viele weitere Aufgaben. Das erste GPT-Modell wurde bereits im Jahr 2018 vorgestellt. Es demonstrierte die Fähigkeit, kohärente und manchmal überzeugende Textabschnitte auf der Grundlage einer gegebenen Eingabeaufforderung zu generieren. GPT-1 war ein wichtiger Meilenstein in der Entwicklung von Sprachmodellen, da es zeigte, dass vorab trainierte Modelle auf einer Vielzahl von Sprachaufgaben ohne aufgabenspezifisches Training effektiv sein können. Bereits ein Jahr später, Im Jahr 2019, veröffentlichte OpenAI GPT-2, ein wesentlich leistungsfähigeres Modell, das eine deutliche Verbesserung in der Qualität der Textgenerierung zeigte. GPT-2 erregte öffentliche Aufmerksamkeit wegen seiner Fähigkeit, überzeugende Texte zu generieren, die oft von menschlich geschriebenen Texten kaum zu unterscheiden waren. Aufgrund von Bedenken hinsichtlich möglicher Missbräuche, wie die Erstellung von Desinformation, zögerte OpenAI zunächst, das vollständige Modell öffentlich zugänglich zu machen. GPT-3 wurde Mitte 2020 vorgestellt und markierte einen weiteren bedeutenden Fortschritt in der KI-Forschung. Mit 175 Milliarden Parametern war es zum Zeitpunkt der Veröffentlichung eines der größten und leistungsfähigsten Sprachmodelle. GPT-3 beeindruckte durch seine Fähigkeit, eine breite Palette von Sprachaufgaben mit wenig bis gar keinem aufgabenspezifischen Training zu bewältigen, von der Beantwortung von Fragen bis hin zur Erstellung von Inhalten und Code-Generierung. Die Einführung von GPT-3 führte zur Entwicklung von Anwendungen und Diensten, die auf seine fortschrittlichen Textgenerierungsfähigkeiten aufbauten, einschließlich ChatGPT.

Das Buch von Andreas Helfrich-Schkarbanenko, Professor für Mathematik an der Fakultät für Maschinenbau und Mechatronik an der Hochschule Karlsruhe, widmet sich dem AI-basierten Dialogsystem ChatGPT-4.0, um mittels einer umfassenden Analyse den konkreten Mehrwert dieses Instruments für mathematische Anwendungen und die Lehre herauszustellen und potenzielle Synergien darzustellen.

Der erste Teil des Buches beschäftigt sich mit der Transformer-Architektur als "Herz" von GPT. Der Schlüsselaspekt der Transformer-Architektur ist der Mechanismus der "Selbst-Attention" (Selbstzuwendung), der es dem Modell ermöglicht, Gewichtungen der Wichtigkeit einzelner Teile eines Eingabetextes zu berechnen. Dies ermöglicht es dem Transformer-Modell, die Beziehungen zwischen allen Wörtern in einem Satz zu bewerten, unabhängig von ihrem Abstand zueinander. Diese Fähigkeit unterscheidet Transformer von älteren Ansätzen, wie rekurrenten neuronalen Netzwerken (RNNs) oder Long Short-Term Memory (LSTM)-Netzwerken, die sequentielle Daten linear verarbeiten und daher mit langen Abhängigkeiten in Texten zu kämpfen haben.

Die Transformer-Architektur bildet die Grundlage für die GPT-Reihe und viele andere fortschrittliche Modelle im Bereich des Natural Language Processing (NLP) und darüber hinaus. Ihre Fähigkeit, komplexe Beziehungen und Kontexte innerhalb von Textdaten effektiv zu modellieren, hat zu signifikanten Verbesserungen in Aufgaben wie Textgenerierung, Übersetzung, Zusammenfassung und Frage-Antwort-Systemen geführt.

Außerdem werden im ersten Teil Begriffe wie Prompt, Prompting, Prompt-Tuning, Chain-of-Thought-Prompting sowie Prompt-Engineering vorgestellt. "Generative KI-Technologien stellen die Welt auf den Kopf und könnten die Landschaft der Hochschulbildung maßgeblich prägen. ChatGPT steht exemplarisch für die beeindruckenden Möglichkeiten, die solche Modelle wie GPT-4 bieten", so der Autor.

Einen Eindruck von der Leistungsfähigkeit der Kombination von ChatGPT mit TikZ/PGF vermittelt Teil II (GPT als Plotter und Solver) des Buches. Im Fokus des zweiten Teils stehen zwei Themen: 1. Die profunde Kenntnis der PGF/TikZ-Syntax, welche für die Erstellung hochwertiger Vektorgrafiken unerlässlich ist sowie 2. die Expertise im Umgang mit dem für die mathematische Notation essenziellen Textsatzsystem LATEX. Kapitel 2 präsentiert anhand konkreter Beispiele, wie man mit Hilfe von PGF/TikZ präzise Vektorgrafiken im Kombination mit der Leistungsfähigkeit von LATEX erstellen kann. Da ChatGPT auch das Textsatzzeichensystem LATEX beherrscht und u.a. mit mathematischen Inhalten trainiert wurde, ist es möglich, sich mit dieser über Mathematik auszutauschen und als Lehr- und Lernplattform zu verwenden. Zahlreiche Aufgaben, sogar Beweise und verschiedene Szenarien hierzu sind ebenfalls im Teil II aufbereitet. LATEX stellt somit eine Brücke zwischen der sprachbasierten KI und der Mathematik dar.

Kapitel 4 widmet sich Übungen im Bereich der Analytischen Geometrie der Vorlesungsreihe Höhere Mathematik. Auch werden Themen wie Matrizen mit Parametern sowie Lineare Abbildungen in Vektorräumen und deren Charakteristika behandelt. Kapitel 5 setzt sich mit dem Einsatz von ChatGPT für eine Auswahl von Themen der Analysis auseinander. Kapitel 6 setzt mit dem Einsatz von ChatGPT (und MATLAB) für Partielle Differentialgleichungen auseinander.

Kapitel 7 setzt sich mit ChatGPT und Beweisen auseinander. In der Mathematik ist ein Beweis eine logische Argumentation, die zeigt, dass eine bestimmte Aussage oder Vermutung wahr ist, basierend auf vorher akzeptierten Aussagen, wie Axiomen, Definitionen und bereits bewiesenen Sätzen. Ein mathematischer Beweis verwendet deduktive Logik und folgt strengen Regeln der Inferenz, um sicherzustellen, dass die Schlussfolgerung zwangsläufig und unumstößlich aus den Prämissen folgt. Das Ziel eines mathematischen Beweises ist es, überzeugend zu demonstrieren, dass eine Aussage unter den gegebenen Voraussetzungen wahr ist, unabhängig von der Intuition oder experimentellen Evidenzen. Anhang verschiedener Beispiele werden die Fähigkeiten von ChatGPT zur Beweisführung gezeigt. Im dritten Teil des Buches werden verschiedene Ansätze präsentiert, wie ChatGPT effektiv zur Unterstützung von Lernprozessen eingesetzt werden kann. Insbesondere wird im Kapitel 8 aufgezeigt, wie man eine Lernstatistik erstellen kann. Die dargelegten Methoden lassen sich ebenso auf zahlreiche andere Bildungsinhalte und den außerschulischen Kontext übertragen, so der Autor.

Im Sinne des differenzierten Lehrens wird in Kapitel 9 gezeigt, dass man mit ChatGPT komplexe Lehrinhalte durch didaktische Reduktion sowie Analogie-Modelle vereinfachen lassen kann. Zur deutlichen Erkennung des Effekts hat der Autor relativ komplizierte Fachthemen ausgewählt und das Alter der Zielpersonen auf 5 oder 10 Jahren festgelegt. So wird beispielsweise ChatGPT die folgende Frage gestellt: "Wie würdest Du den Satz von Pythagoras einem 5-jährigen Kind erklären?". Hier ist die Antwort von ChatGPT: "Stell dir vor, du hast ein Dreieck, das wie ein Berg aussieht, mit einer geraden Linie unten und zwei schrägen Seiten, die nach oben laufen. Dieses besondere Dreieck hat eine spezielle Regel: Wenn du ein Quadrat auf jeder der drei Seiten des Dreiecks zeichnest, ist das größte Quadrat auf der Bodenlinie (wir nennen diese Linie die 'lange Seite') immer so groß wie die beiden anderen Quadrate auf den schrägen Seiten zusammen.

Ein Quadrat ist eine Form mit vier gleichen Seiten, wie ein perfektes Fenster. Wenn wir also drei Fenster haben, eines auf jeder Seite des Dreiecks, sagt uns die Regel, dass das große Fenster auf der langen Seite genau so viel Platz braucht wie die zwei kleineren Fenster auf den schrägen Seiten zusammen.

Wir können das sogar mit Bauklötzen oder Legosteinen ausprobieren! Wenn wir die 'lange Seite' des Dreiecks mit einer Reihe von Klötzen nachbilden und dann versuchen, ein großes Quadrat zu bauen, und dasselbe mit den schrägen Seiten machen, um zwei kleinere Quadrate zu bauen, werden wir sehen, dass, wenn wir die beiden kleineren Quadrate zusammenlegen, sie genau so groß sind wie das große Quadrat. Das ist ein Zaubertrick der Mathematik!"

Oder ChatGPT wird die folgende Frage gestellt: "Wie würdest Du die komplexen Zahlen einem 5-jährigen Kind erklären?" Die Antwort: "Stell dir vor, du hast eine Zauberkiste, die zwei Arten von Zahlen enthalten kann: die gewöhnlichen Zahlen, die du kennst und zum Zählen verwendest, und spezielle Zauberzahlen, die wir 'Springzahlen' nennen können. Die gewöhnlichen Zahlen können nach vorne und hinten entlang einer geraden Linie gehen – das ist wie beim Hüpfen auf einem Weg von einer Zahl zur nächsten. Aber die Springzahlen haben eine magische Kraft: Sie können dich nicht nur vorwärts und rückwärts springen lassen, sondern auch hoch in die Luft und wieder herunter.

Jetzt, wo wir diese Springzahlen haben, können wir sie mit den gewöhnlichen Zahlen in der Zauberkiste mischen. Wenn wir das tun, entsteht eine Superzahl, die beides kann: auf dem Weg hin und her hüpfen und gleichzeitig hoch und runter springen. Diese Superzahl nennt man eine 'komplexe Zahl'. Sie ist besonders, weil sie uns in zwei Richtungen gleichzeitig bewegen lässt – nicht nur auf dem Boden entlang, sondern auch in die Luft hinauf.

Um mit diesen Superzahlen zu spielen, benutzen wir ein spezielles Sprungbrett, das 'imaginäre Einheit' genannt wird. Stell dir vor, dieses Sprungbrett ist wie ein Trampolin, das dich hoch in die Luft springen lässt, wenn du auf ihm hüpfst. Die imaginäre Einheit hilft den Springzahlen, hoch in die Luft zu springen, während die gewöhnlichen Zahlen auf dem Boden bleiben.
Also, komplexe Zahlen sind wie eine magische Mischung aus gewöhnlichen Zahlen und Springzahlen, die uns erlauben, in zwei Richtungen gleichzeitig zu gehen: auf dem Boden und in der Luft!"

In Kapitel 12 wird ChatGPT mit der folgenden Aufgabe betraut: "Schreibe für Studierende einen spannenden, einleitenden Absatz über die Graphentheorie."

Kapitel 13 setzt sich mit der "Korrektur von Programmieraufgaben" auseinander. Im Teil V wird die Synergie des Zusammenspiels zwischen ChatGPT und einer Programmiersprache (hier MATLAB) dargestellt. Kapitel 16 konzentriert sich auf die Kombination von ChatGPT mit dem Plugin ”Wolfram" zur Behandlung von mathematischen Aufgaben mittels eines Computer-Algebra-Systems. Wolfram Alpha ist ein Online-Rechenwerkzeug, das von Wolfram Research entwickelt wurde und im Mai 2009 gestartet ist. Es handelt sich um einen "Computational Knowledge Engine" oder eine "Rechenwissensmaschine", die darauf ausgelegt ist, Fakten und Daten zu analysieren, zu berechnen und direkte Antworten auf eine breite Palette von Fragen zu liefern. Im Gegensatz zu herkömmlichen Suchmaschinen, die Webseiten als Suchergebnisse auflisten, die relevante Informationen enthalten könnten, versucht Wolfram Alpha, spezifische Antworten auf Benutzeranfragen zu generieren, basierend auf strukturierten Daten und einem umfangreichen System von Algorithmen.

Fazit: Das Buch von Andreas Helfrich-Schkarbanenko liefert spannende Beispiel zum Einsatz von ChatGPT in Zusammenarbeit mit LATEX, PGF/TikZ, MATLAB, Wolfram und vielen anderen Werkzeugen. Das Buch besteht zum großen Teil aus den Protokollen des Dialogs zwischen dem Autor und der AI. Die Lektüre des Buches zeigt vor allem die beeindruckende Leistungsfähigkeit fortschrittlicher Sprachmodelle. Störend im Buch sind allerdings die vielen Rechtschreibfehler, die ChatGPT sicherlich alle entdeckt hätte, wenn man das Buch der AI zur Korrektur vorgelegt hätte. 

[ Bildquelle Titelbild: Springer Verlag ]

Details zur Publikation

Autor: Andreas Helfrich-Schkarbanenko
Seitenanzahl: 289
Verlag: Springer Verlag
Erscheinungsort: Berlin
Erscheinungsdatum: 2023

RiskNET Rating:

sehr gut Praxisbezug
sehr gut Inhalt
sehr gut Verständlichkeit

sehr gut Gesamtbewertung

Risk Academy

Die Intensiv-Seminare der RiskAcademy® konzentrieren sich auf Methoden und Instrumente für evolutionäre und revolutionäre Wege im Risikomanagement.

Seminare ansehen
Newsletter

Der Newsletter RiskNEWS informiert über Entwicklungen im Risikomanagement, aktuelle Buchveröffentlichungen sowie Kongresse und Veranstaltungen.

jetzt anmelden
Lösungsanbieter

Sie suchen eine Softwarelösung oder einen Dienstleister rund um die Themen Risikomanagement, GRC, IKS oder ISMS?

Partner finden
Ihre Daten werden selbstverständlich vertraulich behandelt und nicht an Dritte weitergegeben. Weitere Informationen finden Sie in unseren Datenschutzbestimmungen.