MathProf - Regressionsanalyse

MathProf 5.0 - Mathematik interaktiv

 

Regressionsanalyse

Im Unterprogramm [Stochastik] - Regressionsanalyse können Regressionsanalysen mit verschiedenen Modellen durchgeführt werden.
 
MathProf - Regression

Durch eine Anwendung von Regressionsanalysen können vermutete Zusammenhänge daraufhin überprüft werden, ob diese mit ermittelten Daten konsistent sind.
 
Dieses Modul ermöglicht die Durchführung von Untersuchungen mit folgenden Modellen:
 
  • Lineare Regression Y = M·X+N
  • Logarithmische Regression Y = A+B·LN(X)
  • Geometrische Regression Y = A·X^B
  • Reziproke Regression Y = A+B/X
  • Exponentielle Regression Y = A·B^X
  • Trigonometrische Regression Y = A+B·SIN(X)
  • Reziproke quadratische Regression Y = A+B/X²
  • Quadratische Regression Y = A+B·
  • Kubische Regression Y = A+B·
Zudem werden nachfolgend aufgeführte Größen ermittelt und ausgegeben:
 
  • Kleinster und größter Messwert (Minimum, Maximum)
  • Mittelwert
  • Median
  • Varianz
  • Standardabweichung (quadr. Streuung, durchschnittliche Abweichung der Messwerte vom Erwartungswert)
  • Mittlerer Fehler des Mittelwerts
  • Geometrisches Mittel
  • Quadratisches Mittel
  • Harmonisches Mittel
  • Variationskoeffizient
  • Stichprobenvarianz
  • Stichproben-Standardabweichung
  • Standardfehler
  • Streubreite
  • Mittlere Abweichung
  • Mittelwert ohne größten Ausreißer (Max.)
  • Mittelwert ohne kleinsten Ausreißer (Min.)
Lineare Regression

MathProf - Lineare Regression

Die Methode der linearen Regression dient dem Zweck, eine möglichst gut an Messwerte angepasste, lineare Funktion zu ermitteln. Gesucht wird somit die Gleichung y = m·x+n einer Ausgleichsgeraden (Korrelationsgerade), von welcher gegebene Messwerte möglichst geringe Abstände aufweisen. Verwendet wird hierfür die Gauß'sche Methode der kleinsten Quadrate. Um die Güte eines, auf diese Weise ermittelten, Zusammenhangs beurteilen zu können, wird der Korrelationskoeffizient ermittelt (-1 r 1, wobei r = 0 darauf hinweist, dass kein Zusammenhang zwischen den beiden Variablen x und y existiert).
 
Nach Festlegung eines Konfidenzintervalls (Vertrauensbereichs) für die Korrelation, kann mit Hilfe einer Student-t-Verteilung für kleine Stichproben untersucht werden, mit welcher anzunehmender Wahrscheinlichkeit der ermittelte lineare Zusammenhang sicher ist.
 
Das Programm ermittelt die zu dieser Beurteilung erforderlichen Werte und führt eine entsprechende Analyse durch. Es vergleicht anhand des eingestellten Konfidenzintervalls, ob mit der entsprechenden Wahrscheinlichkeit ein linearer Zusammenhang zwischen den x- und y-Werten besteht. Wird beispielsweise eine Irrtumswahrscheinlichkeit von α = 0,1 gewählt und vom Programm ausgegeben, dass der "Zusammenhang wahrscheinlich" ist, so ist mit einer anzunehmenden Wahrscheinlichkeit von 99% davon auszugehen, dass ein linearer Zusammenhang zwischen den Messgrößen besteht. Wird hingegen eine Irrtumswahrscheinlichkeit von α = 0,01 gewählt und vom Programm ermittelt, dass der Zusammenhang unwahrscheinlich ist, so muss die Annahme verworfen werden, dass mit 99,9%-iger Wahrscheinlichkeit ein linearer Zusammenhang zwischen den Messwerten vorliegt.
 
Führen Sie Folgendes aus, um eine lineare Regressionsanalyse mit Datenpaaren von Messwertreihen durchführen zu lassen:
 
  1. Selektieren Sie den Eintrag Linear Y = M·X+N aus der aufklappbaren Box Auswahl Modell.
     
  2. Geben Sie die auszuwertenden Messdaten in die dafür vorgesehenen Felder X und Y ein, bedienen Sie die Schaltfläche Übernehmen und wiederholen Sie diesen Vorgang, bis alle erforderlichen Messwerte aufgenommen sind.
     
  3. Möchten Sie einen Eintrag in der Tabelle löschen, so fokussieren Sie diesen und bedienen die Schaltfläche Löschen. Soll ein bereits eingetragener Wert geändert werden, so fokussieren Sie zunächst den entsprechenden Eintrag in der Tabelle, geben den neuen Wert in das Eingabefeld ein und bedienen hierauf die Schaltfläche Ersetzen. Um alle Einträge zu löschen, kann die Schaltfläche Alle löschen verwendet werden.
     
  4. Wählen Sie durch die Selektion des entsprechenden Eintrags aus der Box Irrtumswahrsch. den Wert (0,1, 0,01, 0,05 bzw. 0,005) der zuzulassenden Irrtumswahrscheinlichkeit α.
     
  5. Bedienen Sie hierauf die Schaltfläche Berechnen.
     
  6. Möchten Sie sich die Verteilung der Messwerte, sowie den Verlauf der ermittelten Regressionsgeraden grafisch veranschaulichen, so klicken Sie hierauf auf die Schaltfläche Darstellen.
Hinweis:
Die Anzahl eingegebener X-Werte muss mit der Anzahl eingegebener Y-Werte übereinstimmen, bevor die Durchführung von Berechnungen, bzw. die Ausgabe einer grafischen Darstellung ermöglicht wird. Ferner muss hierfür eine Mindestanzahl von 3 Datenwertpaaren definiert sein.
 
Nichtlineare Regression

MathProf - Nichtlineare Regression

Da in der Praxis häufig die Analyse nichtlinearer Zusammenhänge erforderlich ist, ermöglicht das Programm auch die Durchführung einiger dieser. Hierbei werden die Parameter a und b der entsprechenden Funktion, sowie der zugehörige Korrelationskoeffizient, welcher Auskunft über die Qualität des Zusammenhangs der Messgrößen gibt, ermittelt.
 
Führen Sie Folgendes aus, um eine nichtlineare Regressionsanalyse mit Datenpaaren von Messwertreihen durchführen zu lassen:
 
  1. Wählen Sie den entsprechenden Eintrag aus der aufklappbaren Box Auswahl Modell.
     
  2. Geben Sie die auszuwertenden Messdaten in die dafür vorgesehenen Felder X und Y ein, bedienen Sie die Schaltfläche Übernehmen und wiederholen Sie diesen Vorgang, bis alle erforderlichen Messwerte aufgenommen sind.
     
  3. Möchten Sie einen Eintrag in der Tabelle löschen, so fokussieren Sie diesen und bedienen die Schaltfläche Löschen. Soll ein bereits eingetragener Wert geändert werden, so fokussieren Sie zunächst den entsprechenden Eintrag in der Tabelle, geben den neuen Wert in das Feld ein und bedienen hierauf die Schaltfläche Ersetzen. Um alle Einträge zu löschen, kann die Schaltfläche Alle löschen verwendet werden.
     
  4. Bedienen Sie die Schaltfläche Berechnen.
     
  5. Um sich die Verteilung der Messwerte, sowie den Verlauf der Kurve der ermittelten Regressionsfunktion grafisch zu veranschaulichen, klicken Sie hierauf auf die Schaltfläche Darstellen.
Hinweis:
Die Anzahl eingegebener X-Werte muss mit der Anzahl eingegebener Y-Werte übereinstimmen, bevor die Durchführung von Berechnungen, bzw. die Ausgabe einer grafischen Darstellung ermöglicht wird. Ferner muss hierfür eine Mindestanzahl von 3 Datenwertpaaren definiert sein.
 
Bei Auswahl der entsprechenden Methode gilt es Folgendes zu beachten:
 
· Logarithmische Regression:
Alle X-Werte müssen > 0 sein
· Geometrische Regression:
Alle X-Werte und alle Y-Werte müssen > 0 sein
· Reziproke Regression:
Kein X-Wert darf 0 sein
· Reziproke quadr. Regression:
Kein X-Wert darf 0 sein
· Exponentielle Regression:
Alle Y-Werte müssen > 0 sein
 
Bedienformular
 
MathProf - Regression - Analyse
 
Auf dem Bedienformular, welches durch Anklicken im obersten schmalen Bereich und bei Gedrückthalten der linken Maustaste verschiebbar ist, können Sie u.a. durch die Aktivierung bzw. Deaktivierung der entsprechenden Kontrollkästchen folgende zusätzliche Einstellungen vornehmen:
 
  • Punkte: Darstellung der Punktbeschriftung ein-/ausschalten
  • Koordinaten: Darstellung der Koordinatenwerte der Punkte ein-/ausschalten
Datenverwaltung
 
Möchten Sie eingegebene Messwerte speichern, so kann dies über den Menüeintrag Datei - Speichern durchgeführt werden. Um mit bereits gespeicherten Daten eine Analyse durchzuführen, verwenden Sie den Menüeintrag Datei - Öffnen. Beim Öffnen einer Datei werden bereits eingegebene Werte durch die Dateidaten überschrieben!
 
Es besteht auch die Möglichkeit die auszuwertenden Datenpaare in einer Excel-Tabelle zu definieren. Die Zahlenwerte sind nach folgendem Schema in der Excel-Tabelle festzulegen:
 
In Spalte A der Excel-Tabelle legen Sie die Werte für die X-Koordinaten und in Spalte B die Y-Koordinaten der Messwerte fest. Beginnen Sie mit der Eingabe in den obersten Feldern der entsprechenden Spalten.
 
Speichern Sie diese Tabelle hierauf in einer Datei ab.
 
Sollen diese Daten wieder geladen werden, so wählen Sie im Programm den Menüeintrag Datei - Excel-Daten importieren und öffnen Sie die entsprechende Datei. Eingelesen werden alle Werte bis zum ersten leeren Feld in einer Excel-Tabellen-Spalte.
 
Allgemein
 
Allgemeines zum Handling des Programms bzgl. der Darstellung zweidimensionaler Grafiken wird unter Zweidimensionale Grafiken - Handling beschrieben. Wie Sie das Layout einer 2D-Darstellung konfigurieren können, erfahren Sie unter Layoutkonfiguration. Methoden zur Implementierung und zum Umgang mit grafischen Objekten werden unter Implementierung und Verwendung grafischer Objekte behandelt.
 
Beispiele
 
Beispiel 1 - Lineare Regression:
 
Es ist eine Analyse folgender Messwertpaare auf lineare Zusammenhänge durchzuführen:
 
X -Werte
Y-Werte
-15,722
-1,274
-13,852
-0,456
-6,968
-0,288
-3,484
0,793
0,4
1,658
1,0
1,0
2,33
1,899
14,872
2,596
19,971
1,0
 
Vorgehensweise und Lösung:
 
Nach einer Selektion des Eintrags Linear Y = M·X+N aus der aufklappbaren Auswahlbox und der Eingabe der o.a. Daten in die Tabelle, wird bei Festlegung einer Irrtumswahrscheinlichkeit von 10% (α = 0,1) nach einer Bedienung der Schaltfläche Berechnen ausgegeben:
 
Ermittelte Funktion: Y = 0,081142·X+0,782878
Student-t-Wert: 1,4149
Irrtumswahrscheinlichkeit: 0,1
Vergleichswert: 3,257911
Korrelationskoeffizient: 0,776266
Korrelation wahrscheinlich
 
Dies bedeutet: Da der ermittelte Vergleichswert größer dem Student-t-Wert der festgelegten Irrtumswahrscheinlichkeit ist, ist ein Zusammenhang zwischen der ermittelten Regressionsfunktion (Korrelationsgeraden) und den vorhandenen Werten zu 90% wahrscheinlich.
 
Bei Festlegung einer Irrtumswahrscheinlichkeit von 0,5% (α = 0,005) stellt das Programm hingegen fest, dass ein derartiger Zusammenhang unwahrscheinlich ist:
 
Ermittelte Funktion: Y = 0,081142·X+0,782878
Student-t-Wert: 3,499483
Irrtumswahrscheinlichkeit: 0,005
Vergleichswert: 3,257911
Korrelationskoeffizient: 0,776266
Korrelation nicht wahrscheinlich
 
Für die Auswertung der X-und Y-Werte der Messwertreihe gibt das Programm aus:
 
Auswertung der X-Werte:
 
Anzahl der X-Werte:
9
Minimum:
-15,722
Maximum:
7
Mittelwert:
-0,161444
Median:
0,4
Varianz:
140,765252
Standardabweichung:
11,864453
Mittlerer Fehler des Mittelwerts:
3,954818
Geometrisches Mittel:
-----------
Harmonisches Mittel:
2,586087
Quadratisches Mittel:
11,187079
Variationskoeffizient:
-871,911401
Stichprobenvarianz:
125,124668
Stichproben-Standardabweichung:
11,185914
Standardfehler:
1,318273
Streubreite:
19,571
Mittlere Abweichung:
8,75116
Mittelwert ohne Ausreißer(max):
-2,678
Mittelwert ohne Ausreißer(min):
-0,231625
 
Auswertung der Y-Werte:
 
Anzahl der Y-Werte:
9
Minimum:
-1,274
Maximum:
2,596
Mittelwert:
0,769778
Median:
1
Varianz:
1,538021
Standardabweichung:
1,24017
Mittlerer Fehler des Mittelwerts:
0,41339
Geometrisches Mittel:
-----------
Harmonisches Mittel:
-5,375822
Quadratisches Mittel:
1,399888
Variationskoeffizient:
1,998006
Stichprobenvarianz:
1,36713
Stichproben-Standardabweichung:
1,169243
Standardfehler:
0,137797
Streubreite:
2,884
Mittlere Abweichung:
0,96163
Mittelwert ohne Ausreißer(max):
0,5415
Mittelwert ohne Ausreißer(min):
0,902

Beispiel 2 - Nichtlineare Regression:
 
Es ist eine Analyse folgender Messwertpaare auf nichtlineare Zusammenhänge durchzuführen:
 
X -Werte
Y-Werte
1
1
4,2
3,6
7,6
4
10,2
4,2
12,9
4,7
 
Vorgehensweise und Lösung:
 
Nach Eingabe der Daten in die Tabelle, der aufeinanderfolgenden Selektion der entsprechenden Einträge aus der aufklappbaren Auswahlbox Auswahl Modell und anschließender Durchführung der Berechnungen wird ausgegeben: 
 
Logarithmische Regression: Y = 1,166894+1,398267·LN(X)
Korrelationskoeffizient: 0,984631
 
Geometrische Regression: Y= 1,136655·X^(0,600445)
Korrelationskoeffizient: 0,961305
 
Reziproke Regression: Y = 4,635431-3,673982/X
Korrelationskoeffizient: -0,989391
 
Exponentielle Regression: Y = 1,388152·(1,118177)^X
Korrelationskoeffizient: 0,825075
 
Trigonometrische Regression: Y = 3,569435-0,614022·SIN(X)
Korrelationskoeffizient: -0,362257
 
Reziprok quadratische Regression: Y = -3,226025+4,20303/X²
Korrelationskoeffizient: -0,971994
 
Quadratische Regression: Y = 2,347932+0,016608·X²
Korrelationskoeffizient: 0,769171
 
Kubische Regression: 2,665857+0,001121·X³
Korrelationskoeffizient: 0,685883
 
Da der entsprechende Korrelationskoeffizient bei logarithmischer, geometrischer sowie reziproker Regression nahe den Werten 1 bzw. -1 liegt, lässt dies die Vermutung zu, dass sich die Zusammenhänge der Messwerte ggf. mit Hilfe einer dieser Funktionen beschreiben lassen.
 
Für die Auswertung der X-und Y-Werte dieser Messwertreihe gibt das Programm aus:
 
Auswertung der X-Werte:
 
Anzahl der X-Werte:
5
Minimum:
1
Maximum:
12,9
Mittelwert:
7,18
Median:
7,6
Varianz:
22,272
Standardabweichung:
4,719322
Mittlerer Fehler des Mittelwerts:
2,110545
Geometrisches Mittel:
5,304574
Harmonisches Mittel:
3,235758
Quadratisches Mittel:
8,328865
Variationskoeffizient:
3,10195
Stichprobenvarianz:
17,8176
Stichproben-Standardabweichung:
4,22109
Standardfehler:
0,943864
Streubreite:
11,9
Mittlere Abweichung:
3,664
Mittelwert ohne Ausreißer(max):
5,75
Mittelwert ohne Ausreißer(min):
8,725
 
Auswertung der Y-Werte:
 
Anzahl der Y-Werte:
5
Minimum:
1
Maximum:
4,7
Mittelwert:
3,5
Median:
4
Varianz:
2,11
Standardabweichung:
1,452584
Mittlerer Fehler des Mittelwerts:
0,649615
Geometrisches Mittel:
3,095579
Harmonisches Mittel:
2,52699
Quadratisches Mittel:
3,733363
Variationskoeffizient:
0,602857
Stichprobenvarianz:
1,688
Stichproben-Standardabweichung:
1,299231
Standardfehler:
0,290517
Streubreite:
3,7
Mittlere Abweichung:
1
Mittelwert ohne Ausreißer(max):
3,2
Mittelwert ohne Ausreißer(min):
4,125