Verfasste Forenbeiträge
-
AutorBeiträge
-
als Antwort auf: Versuchsplanung #48589
Hallo Barbara,
Du hast mich ja fast erschlagen mit der ganzen Information!.. ;-)
Ich warte dann erstmal auf alle Ergebnisse. Und melde ich mich bestimmt wieder, mit vielen Fragen..
Eine Frage noch: Wenn fast alle Versuche ‚dazwischen‘ sind, kein richtiger 2^5 Versuchsplan mehr, wie wertet man denn die Ergebnisse aus?!
Gruß, TB
als Antwort auf: Regressionsanalyse #48588Hallo Barbara,
hab inzwischen schon zwei verschiedene Härten berechnet.. zum einen lag es daran, dass die Formel zur Berechnung des Querschnittes für Flachdraht falsch war (falscher Parameter, mein Fehler), zum anderen daran, dass die Härten für jede Legierung nur in der graphischen Form vorhanden sind (in Abhängigkeit vom Umformgrad) und ich diese erstmal mit der Schrittweite 5 (also 5% Umformung) in eine Tabelle gepackt habe, um dann zu interpolieren und den vorliegenden Aufträgen die richtige Härte zuzuordnen (per Hand wäre ich auch in zwei Wochen nicht fertig, bei mehr als 2000 Datensätzen..).
Das schlimme ist, dass ich jetzt sowohl Umformgrad als auch die Härte hab, und alle Legierungen kleiner 2.5% rausgeschmiessen habe, hab aber kein gutes Modell.. 54% Bestimmtheitsmaß und keine normalverteilten Residuen.. (irgendwie, war die Güte am Anfang viel besser.. – wie kann das bloß sein?!)
Entweder stimmt was mit den Härteberechnungen nicht oder die Laufzeit hängt nicht von der Härte ab..
Zur Info: Diese Laufzeit ist die Gesamtlaufzeit, d.h. Nettozeit+Rüstzeit+Wartungszeit usw. Ausserdem wird nach Erfahrung und je nach Situation verfahren. Also kann’s auch daran liegen, dass es nicht klappt..
Was könnte man da noch ausprobieren?!..
Viele Grüße,
***geändert von – TB on 11/12/2007 16:20:06
als Antwort auf: Regressionsanalyse #48442Hallo Barbara.
Ja, genau: Aus Runddraht – Flachdraht. :-) Tut mir leid, wenn ich das nur oberflächlich erwähnt habe.. Runddraht wird gewalzt und dabei entsteht ein Flachdraht von Breite x und Stärke y sozusagen.
Die kleinste Gruppe der Legierungen hat nur einen Datensatz, also 0,05%.. Was hälst Du davon, wenn ich alle Legierungen kleiner 5% rausschmeiße?! Könnte das helfen?
P.S. Danke für die Infos!
Gruß, ***
geändert von – TB on 11/12/2007 16:18:44
als Antwort auf: Regressionsanalyse #48434Hallo Barbara,
(*): Habe einfach einige Einflußgrößen entfernt aus dem GLM, weil diese sowieso weder graphisch noch nach Pearson lineare Zus.hänge hatten und ich als Ergebniss immer wieder ‚Rangfolgefehler aufgrund von […]‘ hatte und damit kein Modell.
(**): Habe jetzt auch ‚Legierung‘ im GLM (s. unten).
(***): Härtegrad ist immer noch nicht drin, kommt noch später.
Mein momentaner GLM:
Zielgröße: Laufzeit
Einflussgrößen:
– Breite Flachdraht
– Stärke Flachdraht
– Durchmesser Runddraht
– Menge Flachdraht
– Legierung
– Verformung in %
– Umformgrad (Runddraht -> Flachdraht)
– Länge Flachdraht
– Verhältnis Breite zu StärkeFaktorinteraktionen:
– Breite Flachdraht * Durchmesser Runddraht
– Stärke Flachdraht * Durchmesser Runddraht
– Länge Flachdraht * Umformgrad
– Drahtdurchmesser * Umformgradmit dazugehörigen Kovariaten.
Habe als Ergebnis:
R-Qd = 93,37% und R-Qd(kor) = 82,40%,
wobei keine weitere Analyse aufrund von […] ausgeführt wird.Frage: Wie kann ich eigentlich die Seq SS Werte interpretieren? Bei einigen Einflußgrößen sind diese gleich 0, bei anderen sehr große Zahlen.. Und was sind Modell-DF’s?
P.S. Das SOM-Toolbox for Matlab (Neuronale Netze) hat eine ziemlich gute Dokumentation, im Vergleich zu vielen anderen KNN-Software. Da kann sich schon ganz gut vorstellen, was da passiert – wird übrigens immer weiter entwickelt und ist Open Source. KKN sind aber natürlich noch in der Entwicklung, können aber bei betimmten Fragestellungen (wenn nichts anderes hilft) mit Erfolg angewendet werden.
Gruß, ***
geändert von – TB on 11/12/2007 16:17:26
als Antwort auf: Regressionsanalyse #48410Vielen Dank für die schnelle Antwort, Barbara!
So, jetzt werde ich versuchen alles geordneter zu beschreiben als letztes Mal..
Habe 2038 Datensätze insgesamt (nach der Bereinigung), davon 877 einer meist vertretenen Legierung (also ca. 43%), alle übrigen 28 Legierungen sind selten vertreten: max. 9% aller Daten.
Ich rechne momentan noch mit dem Minitab (hab die Demoversion diesmal auf dem Computer meines Kollegen installiert :-) – bald gehen mir die Computer aus und ich muss mich dann mit R auseinandersetzen, bisher hatte ich leider noch keine Zeit dafür).
Habe zunächst versucht, für nur diese eine Legierung Daten zu analysieren (werde nächste Woche das für alle Datensätze machen).
Zielgröße: Laufzeit
Einflussgrößen:
– Durchmesser Runddraht
– Querschnitt Runddraht
– Stärke Flachdraht
– Breite Flachdraht
– Querschnitt Flachdraht
– Produzierte Menge
– Länge Flachdraht
– Verhältnis Breite-Stärke
– Verformung in %
– UmformgradDie Legierungen nach ‚hart‘ und ‚weich‘ aufzuteilen ist viel zu ungenau, daher möchte ich noch den Härtegrad berechnen. Daher erstmal Verformung in % und Umformgrad genommen (in Abhängigkeit von den Querschnitten des Runddrahtes und des Flachdrahtes).
Im Matrixplot erkennt man lineare Zus.hänge zw.:
– Laufzeit und Menge
– Stärke und Querschnitt Flachdraht, Durchmesser Runddraht
– Breite und Querschnitt Flachdraht, Verhältnis Breite-Stärke, Durchmesser Runddraht
– Querschnitt Flachdraht und Querschnitt Runddraht
– Verhältnis Breite-Stärke und UmformgradNach Pearson gibt es Korrelationen zwischen:
– Länge und Laufzeit
– Menge und Laufzeit
– Umformgrad und Breite
– Umformgrad und StärkeDie Regression liegt bei ca. 50%.
Hab dann folgendes GLM gewählt:
Antwort: Laufzeit
Modell:
– Stärke
– Breite
– Menge
– Umformgrad
– Länge
– Länge*Umformgrad
– Länge*Stärke
– Länge*BreiteKovariaten:
– Umformgrad
– Länge
– Breite
– StärkeIch erhalte R-Qd = 82% und R-Qd(korr) = 72%, wobei p-Werte für Stärke, Umformgrad und Länge*Stärke über 5% liegen und es sehr viiieeel ungewöhnliche Beobachtungen gibt..
Könntest Du mir bitte noch ein Sückchen von Deinem Voodoo-Zauber verraten?!.. :-))
Schönes Wochenende,
***geändert von – TB on 11/12/2007 16:16:35
als Antwort auf: Regressionsanalyse #48367Hallo Barbara!
Da bin ich wieder, mit meinen Fragen zur Regressionsanalyse.. :-)
Die Regressionsanalyse muss jetzt warten, weil ich noch andere Projekte habe und wir ja ausserdem Versuchsplanung machen (habe noch keine Ergebnisse, da die geschmolzenen Proben noch beim Schmieden sind). Aber vielen Dank nochmal für Deine Hilfe!
Hab jetzt einen anderen Datensatz, zu einem anderen Thema. Die Zielgröße ist ‚Laufzeit'(Anzahl der Stiche ist nicht bekannt, dafür aber die Gesamtlaufzeit, die allerdings per Hand eingegeben wird), Einflussgrößen sind Breite und Stärke des Erzeugnisses (Flachdraht), eingesetzter Drahtdurchmesser (der aber nicht unbedingt richtig ist), produzierte Menge und Name der jeweiligen Legierung (was sehr wichtig ist, weil das Material je nach Legierung weich oder hart sein kann).
Habe den ganzen Tag damit verbracht, unplausible Daten nachzuvollziehen und korrigieren, falls man sicher ist, dass sie genau so auszusehen haben. Ich war eine artige und fleißige Schülerin und habe mir Deine Tipps zur Hilfe genommen :-) Merkmalsliste erstellt, Kennzahlen-Tabelle, verschiedene Grafiken gemacht usw. Die Daten sind überhaupt nicht normalverteilt (na, wie immer..). Habe dann versucht mit BoxCox die Zielgröße zu transformieren. Hat auch geklappt, aber die Johnson-Transformation war noch besser (welche Transformation ist eigentlich besser?). Die Einflußgrößen lassen sich aber nicht transformieren, weder mit Johnson noch mit BoxCox (oder besser gesagt liefern keine Normalverteilung). Habe mir auch andere Verteilungen angeguckt, ob die zu irgendeiner Einflußgröße passen – die Daten scheinen überhaupt nicht verteilt zu sein.. ;-) Ein Häufchen..
Habe aber lineare Zusammenhänge zwischen Breite und Durchmesser (logisch), schwachen lin. Zus.hang zw. Stärke und Durchmesser. Und einen linearen (auch schwach) Zus.hang zw. Laufzeit und Menge. Hab dann eine Regressionsgleichung mit R-Qd von 81% erhalten, deren Residuen allerdings nicht normalverteilt sind.. Kann ich was daraus schließen? Bzw. reichen 81% und keine normalverteilten Residuen für eine qualitative Aussage???
Mit Dank im Voraus.
Gruß, ***
geändert von – TB on 11/12/2007 16:18:01
als Antwort auf: Usertreffen 2007 #47898Hallo alle zusammen,
möchte hiermit ein besonderes Dankeschön Barbara ausrichten und allen, die sich bei der Diskussion meiner wahren :-) Messdaten beteiligt haben! Ich fand das sehr informativ und hab einige Anregungen und Vorschläge mitgenommen.
Wünsche allen noch eine schöne Arbeitswoche.
Gruß, TB
als Antwort auf: Regressionsanalyse #47471Hallo Barbara,
vielen Dank für die schnelle Antwort mit Links und Ratschlägen! (habe auch die Hilfe von Minitab zu Box-Cox durchgeblättert) Werde mich nächste Woche damit intensiv beschäftigen.
Schöne Pfingsten!
Gruß, ***
geändert von – TB on 11/12/2007 16:12:31
als Antwort auf: Regressionsanalyse #47465Hallo Barbara,
vielen Dank erstmal für die wie immer ausführlichen Erläuterungen!
Ich versuche dem roten Faden zu folgen:
Der Einfluss der Temperatur auf T ist nicht linear. Aber auch der Einfluss der chem. Elemente auf die Zielgröße T ist nicht linear. Muss man sie auch linearisieren? Ich habe mir diese Box-Cox-Trafo angeguckt – da muss man ja Lambda bestimmen. Du meinst, einfach ausprobieren und das beste nehmen?! Ich habe bereits so was Ähnliches für Einflussgröße ‚chem. Elemente‘ ausprobiert, jedoch ohne Erfolg..
Damit ich das richtig verstehe: Du meinst jetzt, man sollte die Temperatur transformieren? Du meinst wahrscheinlich, dass man die Zielgröße transformieren sollte (also z.B. die Zielgröße zu logarithmieren), oder?! Dient die Transformation nicht dazu, die Normalverteilung zu erhalten? Wie fasse ich überhaupt alle T’s zusammen? Mehrere Zielgrößen darf man ja nicht haben..
Wir haben bereits einen Versuchsplan erstellt, aufgrund der zur Verfügung stehenden Informationen und Zwischenergebnisse. Wir haben extreme Fälle gewählt (aber nicht zu extreme), damit man nach den Versuchen wirklich signifikante Unterschiede feststellen kann.
Gruß, ***
geändert von – TB on 11/12/2007 16:12:01
als Antwort auf: Regressionsanalyse #47375Hallo Barbara,
Du hast natürlich Recht, dass man SOLL erst nachdem das Modell steht anwenden sollte (bzw. mit SOLL vergleichen). Ich hatte aber gar keine Muster in den Daten, sodass ich mir gedacht hab, über SOLL einen Ausweg zu finden, und dabei war diese ‚Distanz‘ das erste, was mir in den Sinn kam.. Ok, muss diese Idee wohl ganz aufgeben.. :-)
Die Zielgröße ‚T‘ hängt von den einzelnen chem. Elementen (chem. Analyse) und der Temperatur ab.
Wichtig ist, wie Du richtig vermutest, der Kurvenverlauf. Also sind sowohl der Wert bei einer bestimmten Temperatur als auch die Veränderung von T interessant. Wie ich das in ein Modell reinbekommen soll, weiß ich leider nicht..
Das größte Problem ist, dass man kein Muster in den Daten erkennen kann.. Wir überlegen schon, ob wir Versuchsplanung machen, um an brauchbare Daten zu kommen – das werden aber nur wenige Daten sein (ca. 50).
Danke für sehr gute Erläuterungen!
Gruß, ***
geändert von – TB on 11/12/2007 16:10:08
als Antwort auf: Regressionsanalyse #47235Hallo Barbara,
ich glaube, ich gehe die ganze Sache irgendwie falsch an..
<<Zitat: Wenn Du den Absolutbetrag Ist-Soll verwendest, gibt es zwei Schwierigkeiten:
1. Es fehlt die Richtung der Abweichung. 2. Du machst mit einem (statistischen) Prozessmodell ein Modell für das IST.>>Die Richtung der Abweichung ist in diesem Fall nicht von Bedeutung. Mich interessierte nur, wie weit sozusagen die Abweichung vordringt, also wie schlecht Ist von Soll entfernt ist.
Du hast Recht, die Abmessungen ändern sich mit der Temperatur, sie steigen.
<<Zitat: Ich würde deshalb die Temperatur als Einflussgröße mit in das Modell aufnehmen und erstmal gar nichts zusammenfassen. Das hat den Vorteil, dass dann auch mehr Messwerte (=Informationen) vorhanden sind.>>
Meinst Du jetzt die Temperatur oder die Messwerte für die jeweilige Temperatur?
Wie würde das denn aussehen: Zielgröße: ?? Einflussgrößen: ?? Irgendwie bin ich total verwirrt.. Die Messungen M_j kann man doch nicht wirklich alle in das Modell reinnehmen, oder? – die hängen voneinander ab, aber leider nicht von den Elementen, was aber gesucht wird.Zusammenfassen muss ich die Messwerte nicht, hatte aber davon ausgegangen, dass das sinnvoll wäre..
Mit Dank im Voraus!
Gruß, ***
geändert von – TB on 11/12/2007 16:08:31
als Antwort auf: Regressionsanalyse #47180Hallo Barbara,
hab inzwischen die Regression und auch GLM mit Wechselwirkungen mit allen vorhandenen Daten (mit Ausreißern) durchgeführt und leider keine besseren Ergebnisse damit erzielt.. Bei Regression erhalte ich R-Qd/R² bei ca. 35%, bei GLM sieht die Güte vielversprechend aus (mehr als 80%), es wird aber keine weitere Analyse durchgeführt (wie davor auch).. Die schrittweise Regression liefert auch einen Bestimmtheitsmaß von ca. 35%, was natürlich ungenügend ist.
Vielleicht habe ich die sogenannte ‚Distanz‘ (das ist meine Antwort ‚T‘) nicht besonders clever berechnet!? Die Situation ist die: Ich habe Messungen für eine Probe in 50°C-Schritten (also 20 Messungen pro Probe). Diese Messungen sind also IST-Messungen, die ich mit den vorgegebenen SOLL-Messungen vergleichen kann. Ich habe mich dafür entschieden, die ‚Distanz‘, also den Abstand zwischen jeder Messung und dem Soll-Wert zu berechnen und diese dann über alle Temperaturen zu summieren (wird ja das Minimum, also 0, angestrebt) – war das erste, was mir so in den Sinn gekommen ist. Also Summe_i=1:20(Betrag_i(IST_i-SOLL_i)). Hast Du (oder jemand anderer aus dem Forum) vielleicht eine Idee, wie man das geschickter macht? Diese Kennzahl soll ja dann von den Analysen der Legierung (chem.Elemente) abhängen, was sie aber leider nicht macht.. P.S. Die Wurzel aus der summe der quadrierten Abstände habe ich auch schon untersucht – kein Erfolg..
Bin für jede Hilfe dankbar!
Gruß, ***
geändert von – TB on 11/12/2007 16:06:47
als Antwort auf: Regressionsanalyse #47114Vielen Dank für den Tipp, Barbara, werde den auf jeden Fall nutzen!
Wünsche schönes Wochenende!
(hab die nächsten fünf Tage frei und versuche nicht zuviel an Regression zu denken, damit ich keine Depression bekomme.. ;-) )Gruß, ***
geändert von – TB on 11/12/2007 16:04:47
als Antwort auf: Regressionsanalyse #47112Hallo Barbara,
danke für die schnelle Antwort.
Zunächst mal waren es ca. 100 Datensätze. Nachdem ich aber alle Ausreißer rausgeschmiessen hab, sind es nur noch 58 da geblieben.. eigentlich nicht zu wenig, aber auch nicht gerade viel..
Das Modell habe ich genauso wie Du es geschrieben hast aufgebaut:
Antwort: T
Modell: Element1 Element2 Element1*Element2
Kovariaten: Element1 Element2natürlich mit viel mehr Elementen (=Einflußgrößen) drin.
R-Qd ist ca. 10% und die p-Werte bei allen Einflußgrößen sehen nicht gerade gut aus..
Habe auch im Vorfeld mit Matrixplot fast alle möglichen Variablen gegeneinander visuell untersucht – es gibt keine erkennbaren Zusammenhänge – das ist ja das Problem.. :-( Muss also alle möglichen Kombinationen von Elementen noch durchgehen, um ganz sicher zu sein.
Vielen Dank für den Tipp der schrittweise Regression – werde es demnächst ausprobieren.
Gruß, ***
geändert von – TB on 11/12/2007 16:03:19
als Antwort auf: Regressionsanalyse #47109Hallo Barbara!
Vielen vielen vielen Dank für die sehr gute und detaillierte Erklärung!!! Da solltest Du einen Orden für bekommen! :-)
Zu meinem Beispiel noch kurze Erläuterung: Es geht also um eine neue Legierung. Die Einflußgrößen sind verschiedene chem. Elemente (also variabel). Die Zielgröße ist die Thermospannung (bzw. die Summe der Abstände Ist-Soll, von der natürlich erwartet wird, dass sie minimal sein sollte, nennen wir sie ‚T‘). Eine direkte lineare Abhängigkeit gibt es zwischen der Ziel- und den Einflußgrößen nicht, das weiß man.
-> Regressionsanalyse mit unterschiedlichen Abhängigkeiten muss her – also: x*x, x*y usw.Wenn ich bei GLM in Minitab ‚T‘ als Antwort eingebe, kann ich aber leider solche Wechselwirkungen wie x*y nicht eingeben, also bsp. Element1*T.. Mache ich grundsätzlich was falsch?
Ich habe zur Sicherheit (auch wenn ich weiß, dass ich da kein gutes Modell bekomme) alle x(i)*x(j) ausprobiert, mit Angabe von x(i) als Kovariate – da wird ein Modell geliefert, allerdings, wie erwartet, mit sehr kleiner Anpassunggüte und p-Werte von einzelnen x waren auch alle >0,05.. Muss also die Wechselwirkungen betrachten, aber wie?!..
Danke im Voraus.
Gruß, ***
geändert von – TB on 11/12/2007 16:01:20
-
AutorBeiträge