Kurvenanpassung (curve fitting)


Durch die CAS ist eine Art von Berechnungen in die Schulmathematik gewandert, die in vielen Wissenschaften schone lange eine große Bedeutung hat: die Kurvenanpassung (curve fitting). Generell geht es darum, zu einzelnen Punkten in einem Koordinatensystem eine Kurve zu finden, die zu den Punkten besonders gut passt. Die Punkte können z.B. Messwerte sein oder ein Designer hat sie als generelle Form eines Bauteils festgelegt. Was bedeutet aber: „Die Kurve passt!“ Auf diese Frage gibt es verschiedene Antworten, die zu unterschiedlichen Rechenverfahren führen. Wir sehen uns hier einige an.

Ganz generell ist zu sagen, dass Kurvenanpassung – wie viele anderen praxisnähere Fragestellungen – keine reinen Rechenexempel sind. Zum mathematischen Wissen sollte das Wissen des Praktikers kommen. Darüber verfügen aber in der Regel weder der Mathematiklehrer noch seine Schüler. Sofern bei den hier verwendeten Beispielen Anlehnungen an die Praxis gemacht werden, sollten diese in vielen Fällen nur als Illustration gesehen werden. Lambert und Peter von der Universität Saarbrücken stellen 2005 in einem Aufsatz klar: Straßen sind keine Splines. Entweder greift der Praktiker zu Abfolgen von Gerade und Kreis (Was keine schöne Aufgabe ergibt.) oder er verwendet Klothoiden, die nicht im Lehrplan vorkommen.

Aus dem Abschnitt über das Betaspektrum verwenden wir als Einstieg die folgenden Messergebnisse. Die Daten sind mit unseren Möglichkeiten nur schwierig zu bearbeiten, zeigen so aber auch deutlich einige Probleme der Kurvenanpassung. Klarere Analysen sind möglich, wenn die Daten besser zu bekannten Funktionen passen, z.B. bei der Absorption von Gammastrahlen oder dem Aufladen eines Kondensators. Eine Liste von solchen Kurvenanpassungsaufgaben steht am Ende dieses Abschnittes. Wer Lust hat, das Betaspektrum genauer mathematisch zu fassen, kann es mit einem Produkt Potenzfunktion ⋅ Exponentialfunktion versuchen. Hier nun trotz aller Bedenken die Daten:

I/A00,20,40,60,81,01,21,41,6
Zählrate1,11,73,54,55,54,03,32,72,2

Mit dem Nspire dargestellt sehen sie so aus. Wenn man sie sich eine Weile ansieht, erkennt man einige Besonderheiten. Es gibt ein offensichtliches Maximum. Die ersten drei Werte scheinen auf einer Parabel zu liegen. Der abfallende Teil der Messreihe sieht fast wie eine abfallende Exponentialfunktion aus. Aber wie passt das alles zusammen? Vor der weiteren Analyse steht die Frage: Wollen wir eine Kurve finden, die durch alle Punkte genau hindurch führt. Das wäre eine Interpolationsaufgabe. Oder erlauben wir der Kurve, an den gegebenen Punkten immer ein bisschen vorbeizulaufen und den generellen Trend mit einem möglichst einfachen Funktionsterm wiederzugeben. Das ist die Idee der Regression.
Interpolierende Kurven treffen die vorgegebenen Punkte genau, erlauben sich dazwischen aber einige Freiheiten. Sie scheinen dann nicht mehr gut zu den Daten zu passen. Das Verhalten von Interpolationskurven kann man durch zusätzliche Bedingungen etwas bändigen, z.B. durch die zusätzliche Verwendung der ersten und zweiten Ableitungen (Krümmungsverhalten). Auf dieser Idee basiert die Spline-Interpolation.
Regressionskurven zeigen einen einfacheren und deutlicheren Trend, lassen aber einzelne Punkte machmal zu sehr außer acht. In jedem Fall ist die Wahl der richtigen Kurve keine rein mathematische: Wenn man es mit dem radioaktiven Zerfall zu tun hat, wird man aus physikalischen Gründen eine Exponentialfunktion wählen.

Wir probieren mit dem Nspire jetzt einiges aus. Die tns-Datei ist hier. Wenn die Punkte angezeigt werden, kann man sie mit ctrl-menu verbinden lassen. Das zeigt den Verlauf etwas deutlicher, bringt aber sonst nicht viel und wir schalten die Linien wieder aus. Interessanter sind die Möglichkeiten unter menu - Analysieren - Regression. Dort werden verschiedene Funktionstypen angeboten, die mit Regressionsverfahren an die Daten angepasst werden können. Die beiden ersten Optionen lassen wir aus, weil die Daten wirklich nicht linear aussehen. Auch der nächste Punkt (Median Median) liefert eine Gerade, allerdings nach einer anderen Methode. Quadratische Regression, kubische Regression und Regression vierter Ordnung liefern Kurven, die mit den Daten wenigstens eine gewisse Ähnlichkeit haben. Besonders an den Enden des Datenbereiches sehen sie aber nicht mehr gut aus. Durch Anklicken einer Ausgleichsfunktion wird ihr Term angezeigt. Mit ctrl - Click kann man die Ausgleichsfunktion auch wieder abschalten, um eine andere zu probieren. Bei einigen Funktionstypen wird eine Fehlermeldung angezeigt. Das liegt daran, dass bei ihrer Berechnung logarithmiert werden muss und einer der Werte in der Tabelle Null ist. Was man in solchen Fällen macht, zeigt ein späteres Beispiel. Wir werden jetzt etwas systematischer und untersuchen einige typische Aufgabenstellungen genauer.

Zusammenstellung wichtiger Kurvenanpassungen