Verfasste Forenbeiträge
-
AutorBeiträge
-
als Antwort auf: Regressionsanalyse #48880
P.S. Eine blöde Frage noch:
Du sagst “wenn der Prozess stabil ist und immer ein ähnlich strukturiertes Prozess-Ergebnis liefert, dann müssen (nach dem Zentralen Grenzwertsatz / ZGWS) die Mittelwerte von Stichprobengruppen normalverteilt sein“
Das gilt in beide Richtungen (also ‚genau dann wenn‘), oder?!
Hab bissl im Internet gesurft, auf der Suche nach dem ZGWS, und bin dann auf Deine Diplomarbeit gestoßen! :-))
Gruß, ***
geändert von – TB on 12/12/2007 08:13:51
als Antwort auf: Regressionsanalyse #48879Hallo Barbara,
alles klar, vielen Dank! Ich wusste nicht, dass eine IMR-Karte nur dann hilft, wenn Messdaten normalverteilt sind. Meine Messdaten sind natürlich nicht normalverteilt.. ;-)
Was sagt dann folgendes aus:
Die Mittelwerte meiner Stichprobengruppen der Zielgröße sind nicht normalverteilt, genau wie die Ausgangsdaten selbst.
Aber, wenn ich die transformierte Zielgröße betrachte, dann sind die Mittelwerte derselben Stichproben (Kalenderwoche z.B.) normalverteilt, genau wie transformierte Zielgröße selbst.Kann man dann etwa sagen, dass der transformierte Prozess stabil ist und der ursprüngliche instabil?!?!?..
Gruß, ***
geändert von – TB on 12/12/2007 08:13:28
als Antwort auf: Regressionsanalyse #48870Vielen Dank für die schnelle Antwort, Barbara!
Kann ich eigentlich in diesem Fall den Prozess auf Stabilität untersuchen? Oder besser gefragt: Was nützt mir dann die Stabilitätsanalyse? Die habe ich schon vor paar Wochen gemacht (IMR-Karten) und hab festgestellt, dass das ein instabiler Prozess war. Kann ich dann behaupten, dass die Vorhersagen bei diesem Prozess auch unsicher sind?! Was macht man dann (was kann man machen) mit einem instabilen Prozess? Wie kann man Stabilität erreichen?
Gruß, ***
geändert von – TB on 12/12/2007 08:12:40
als Antwort auf: Regressionsanalyse #48863Hallo Barbara,
noch eine kleine allgemeine Frage vor dem Wochenende..
Was kann ich daraus ableiten:– Wahrscheinlichkeitsnetz von Residuen: An den Enden leichte Abweichungen von der Linie, ansonsten ok.
– Histogramm sieht sehr gut aus.
– Aber: Residuen vs. Anpassungen haben eine Bananenform, nach unten gebogen, wobei die Streuung zunimmt je größer angepasster Wert ist.Was kann ich da tun? Die RJ- und AD-Test fielen natürlich schlecht aus..
Gruß, ***
geändert von – TB on 12/12/2007 08:12:01
als Antwort auf: Regressionsanalyse #48788Hallo Barbara,
Dir sollte doch nichts leid tun – Du hast mir super geholfen! Hab jetzt einfach die Ergebnisse zusammengefasst. So ein Ergebnis ist ja auch ein Ergebnis, auch wenn es nicht so aussieht wie wir es gerne hätten.. Wir müssen uns einfach dem Problem von einer anderen Seite nähern.
Vielen Dank nochmal und viele Grüße,
***geändert von – TB on 12/12/2007 08:10:35
als Antwort auf: Regressionsanalyse #48720Hallo Barbara,
habe leider keine bahnbrechenden Erkenntnisse während der letzten Woche gewonnen..
Habe mir jetzt die aktuellen Geschwindigkeiten geholt. Sind nur von der Stichfolge und der Abmessung abhängig (nicht von der Legierung, wird aber nach Erfahrung bei härteren Legierungen langsamer gefahren), angefangen mit X m/min, dann X+20 und am Ende X+40. Mal sehen, ob ich da was rauskriege..
Zu Deiner Frage:
Habe zunächst intuitiv und der Fachliteratur nach, Logarithmus- und Potenzen-Trafo genommen. Bei manchen Legierungen hat dies aber nicht funktioniert. Deshalb habe ich mich für die Johnson-Trafo entschieden und diese einfach in Minitab berechnet. Deswegen habe ich bei manchen Legierungen Areasinus erhalten.
Danke für die Hilfe und schönes Wochenende,
***geändert von – TB on 12/12/2007 08:09:41
als Antwort auf: Versuchsplanung #48700Hallo Barbara,
:-) nein, Pfusch ist nicht mein Ziel!
Die Frage bezog sich auf eine andere Versuchsplanung. Meine Kollegin hat halt sozusagen einen 4^2 Versuchsplan, also zwei Faktoren mit vier Stufen. Aber dann sollte man sich also auf einen 3^2 Versuchsplan festlegen – dann hat man die Eckpunkte mit mittleren Einstellungen. Wäre das idealste, oder?!
Die obenbeschriebene Versuchsplanung wird wiederholt, und zwar in einem richtigen Versuchsofen, also hoffe ich auf wirklich gute Ergebnisse, die man auch gut auswerten kann.
Gruß, TB
als Antwort auf: Versuchsplanung #48695Hallo Barbara,
eine kurze Frage:
Wenn man einen 4^2 Versuchsplan machen und dann die Effekte etc. ausrechnen möchte, wie geht man da denn vor?! Ich meine, wie rechnet man die Effekte aus? Hab im Internet nur Informationen zu den 2^k und 3^k Versuchsplänen gefunden, aber nicht zu 4^k..
Gruß, TB
als Antwort auf: Temperaturmessgerät/-drucker #48694Hallo qualyman,
:-) treffe oft Ingenieure, die sich auch in der Freizeit mit den Prozessen auseinander setzen.. darunter auch mein Mann.. zwar haben wir noch keine eigene Heizungsanlage oder Ähnliches, überwachen aber alle möglichen Prozesse, angefangen mit dem Verbrauch des Autos.. :o)
Nun zu Deinem Anliegen: Ist mir gleich in den Sinn gekommen, dass ich bei einer Firma arbeite, die beispielsweise USB-Präzisions-
Temperatur-Mess-System herstellt (Isa-Asic). Ist keine Werbung! :-)Gruß, TB
als Antwort auf: Regressionsanalyse #48615Hallo Barbara,
Zitat: ‚bei Heteroskedastizität werden beide Seiten der Modellgleichung transformiert (was das Ganze deutlich anstrengender macht, deshalb der Hinweis)‘
Meinst Du jetzt, dass man zunächst die Zielgröße transformiert und dann noch die ganze Regressionsgleichung transformieren muss, um an die Zielgröße zu kommen und nicht an Trafo(Zielgröße)? Verstehe ich das richtig?
Ich habe gestern schon mal ‚Laufzeit‘ über Johnson-Transformation transformiert, der Art: a + b * Areasinus((Y + c)/d), und das obige GLM laufen lassen. R-Qd(kor)=73,40% Man erhält so keine Trompetenform mehr, sondern einfach ein Häufchen. :-) Das Histogramm ist dann auch nicht mehr rechtsschief, sondern so wie es sein sollte, symmetrisch. Das Wahrscheinlichkeitsnetz sieht auch viel besser aus (keine typische S-Form mehr), man hat aber immer noch Abweichungen von der Referenzgeraden, und zwar an den beiden Enden, also noch genug ungewöhnliche Beobachtungen mit großen standardisierten Residuen – nun aber im Wertebereich von -4 bis 6, also besser. Trotzdem sind die Residuen nicht normalverteilt..
Schafft man dann überhaupt die ganze Regressionsgleichung (mit Areasinus) zurück zu transformieren oder sollte man sich mit ln(Y) zufrieden geben?!
Hab dann ‚Laufzeit‘ auch für einzelne Legierungen transformiert (einige mit ln(Y), einige mit Areasinus(Y)) und das obige GLM durchgeführt. Hab folgende Ergebnisse erhalten:
Leg Nr. | R-Qd(kor) | Residuen normalverteilt oder nicht
L1 | ca. 80% | nicht normalverteilt
L2 | ca. 83% | nicht normalverteilt
L3 | ca. 67% | NORMALVERTEILT
L4 | keine Transformation möglich
L5 | ca. 70% | nicht normalverteilt
L6 | ca. 81% | NORMALVERTEILT
L7 | ca. 75% | nicht normalverteilt
L8 | ca. 72% | NORMALVERTEILT
L9 | ca. 88% | NORMALVERTEILT
L10| keine Transformation möglichAlso vier Ergebnisse mit normalverteilten Residuen. Aber ich bin natürlich mit den Ergebnissen nicht zufrieden.. Ist alles irgendwie willkürlich.. mal so, mal so..
Versuche was über die Netto-Laufzeit herauszufinden.
P.S. Die Aufnahme von KW und Jahr ins GLM hat nichts genützt.
Gruß, ***
geändert von – TB on 12/12/2007 08:07:49
als Antwort auf: Regressionsanalyse #48603Hallo Barbara,
leider kann ich mehr Daten nicht auftreiben, da diese Erfassung erst seit Ende 2005 läuft.
Es liegt also Heteroskedastizität vor..
Also muss ich die Zielgröße ‚Laufzeit‘ versuchen zu transformieren. Ist eigentlich Box-Cox oder Johnson-Transformation besser?Was könnte man noch für die Verbesserung des Modells tun? Werde, wie Du es vorgeschlagen hast, noch KW und Jahr dazu nehmen. Mal sehen, ob das hilft.
Nun zu Deinen Fragen:
(*) Der Wertebereich der Residuen ist von -7 bis 13, wenn ich alle Legierungen zusammen laufen lasse.
Bei den einzelnen Legierungen, deren Ergebnisse gut waren, z.B. L6, war der Wertebereich für Residuen von -3 bis 4 (hier gab es 10% ungewöhnlicher Beobachtungen, dabei aber nur 4% der Beobachtungen mit einem großen standardisierten Residuum – das muss man doch unterscheiden, oder?!).(**) ‚p-Wert zu hoch‘ heißt für mich, dass er höher als 0.05 ist, wie es halt in der Literatur steht. Wie klein darf denn dieser Wert im Idealfall sein bzw. wie hoch darf er maximal sein? (ich meine, abgesehen von diesen überall propagierten 5%, sondern fallabhängig)
(***) Hauptformänderung ist ein Logarithmus von ‚Fläche Runddraht geteilt durch Fläche Flachdraht‘. Hab diese Größe auch dazugenommen, weil ich dachte, sie wird einen Einfluß auf Zielgröße haben.
(****) Anzahl Datensätze pro Legierung:
Leg Nr. | Anz.DS | % von Ges.Anz.DS
L1 | 111 | 6.2
L2 | 93 | 5.2
L3 | 58 | 3.3
L4 | 850 | 47.8
L5 | 126 | 7.1
L6 | 94 | 5.3
L7 | 178 | 10.0
L8 | 68 | 3.8
L9 | 87 | 4.9
L10| 114 | 6.4Wie hoch die Anteile der drei Laufzeit-Arten an der Gesamt-Laufzeit sind, weiß ich nicht – könnte man nur vermuten.. Meinst Du, das ließe sich irgendwie modellieren, wenn ich die die Anteile kennen würde?
Gruß, ***
geändert von – TB on 11/12/2007 16:24:26
als Antwort auf: Versuchsplanung #48600:-) Danke für die moralische und fachliche Unterstützung, Barbara!
Ich hoffe, die restlichen Versuche werden besser ausfallen!..Gruß, TB
als Antwort auf: Regressionsanalyse #48599Hallo nochmal.
Habe gerade das oben angegebene GLM für alle Legierungen einzeln laufen lassen.
Einige Legierungen hatten genauso schlechte Ergebnisse (oder noch schlechtere) wie beim großen Modell (mit allen Legierungen).
Hier die Ergebnisse:
Leg Nr. | R-Qd(kor) | R-Qd | Residuen normalverteilt oder nicht
L1 | 17,85% | 33,53% | nicht normalverteilt
L2 | 89,58% | 91,96% | nicht normalverteilt
L3 | 70,66% | 81,47% | nicht normalverteilt
L4 | 57,60% | 58,65% | nicht normalverteilt
L5 | 94,50% | 95,43% | nicht normalverteilt
L6 | 84,97% | 88,36% | NORMALVERTEILT
L7 | 27,67% | 36,26% | nicht normalverteilt
L8 | 94,94% | 96,52% | nicht normalverteilt
L9 | 91,10% | 93,27% | NORMALVERTEILT (aber alle p-Werte > 0,05)
L10 | 95,38% | 96,24% | nicht normalverteiltMuss ich jetzt individuell für jede Legierung das passende Modell suchen?! – wäre das die richtige Vorgehensweise? Kann ich schon mal zumindest für die Legierung L6 definitive Aussage machen?
Mit Dank im Voraus,
***geändert von – TB on 11/12/2007 16:23:06
als Antwort auf: Versuchsplanung #48595Hallo Barbara,
vielen Dank für die Erklärungen!
Hab unglücklicherweise gerade den 3. Fall, den Du beschrieben hast.. Wenn es nach mir ginge, dann würde ich diese Ergebnisse einfach zu den anderen nehmen, also meine Datenbank vergrößern, aber keine Auswertung der Versuchsplanung machen, weil ich mit so einem Würfen nicht spielen möchte – der ist leider seeehr schief. Aber von mir werden Ergebnisse erwartet und ich höre immer wieder: ‚vielleicht kannst du dir noch was dazu überlegen?!‘.. Ja, klar, aber leider nichts vernünftiges..
Hab schon versucht, einen 2^2 Versuchsplan aus den bereits vorliegenden Versuchen zu basteln, also halt solche Versuche zusammen zu fassen, die einem solchen Plan genügen. Hab dann auch Effekte manuell berechnet (ist ja nicht so viel Arbeit). Das Problem ist aber, dass man wirklich 2^5 Versuchsplan bräuchte oder zumindest 2^3, weil die Zusammenhänge wirklich sehr kompliziert sind und man diese mit einem 2^2 Versuchsplan leider nicht abdecken kann..
Gruß, TB
als Antwort auf: Regressionsanalyse #48594Morgen Barbara!
Mir ist gestern ein Fehler unterlaufen: 64% ist der Bestimmtheitsmaß, aber das ändern leider nichts an der Tatsache, dass es viel zu wenig ist..
(*) Das Wahrscheinlichkeitsnetz der Residuen für Normalverteilung sieht wie eine ‚S‘ aus, mit Wendepunkt bei 50%. Es gibt auch viele Punkte ganz weit von der Referenz-Geraden entfernt, also viele ungewöhnliche Beobachtungen. Residuen gegen angepasster Wert sehen aus wie Wasser aus dem Schlauch (super Beschreibung.. ;-) ), also etwa wie ein Trichter. Histogramm sieht normalverteilt aus. Und Residuen gegen Beobachtungsreihenfolge auch ganz normal, mit eben ein paar Ausreißern, die, soweit ich das verstehe, gerade die ungewöhnlichen Beobachtungen sind.
(**) Das ist ja das Problem: Die Gesamtlaufzeit kann ich nicht aufsplitten – diese wird manuell eingegeben, inklusive aller möglichen Rüstzeiten und Wartungszeiten (falls man welche hatte). Und wie ich dies modellieren soll, wenn ich keine Vergleichsdaten hab, weiß ich auch nicht..
(***) Daten für die Tageszeit habe ich auch nicht, nur Kalenderwoche und Jahr.
(****) Hier das GLM:
Zielgröße: Laufzeit
Einflussgrößen:
– Breite Flachdraht
– Stärke Flachdraht
– Durchmesser Runddraht
– Menge Flachdraht (p-Wert komischerweise zu hoch)
– Legierung– Länge Flachdraht
– Verhältnis Breite zu Stärke
– Fläche Runddraht
– Fläche Flachdraht
(Querschnitte gemeint)– Umformgrad (Runddraht -> Flachdraht) (p-Wert zu hoch)
– Hauptformänderung (ist ein ln)
– HärteFaktorinteraktionen:
– Durchmesser Runddraht * Menge (p-Wert zu hoch)
– Durchmesser Runddraht * Länge
– Länge * Menge
– Breite Flachdraht * Menge (p-Wert zu hoch)
– Breite Flachdraht * Durchmesser Runddraht (p-Wert zu hoch)
– Stärke Flachdraht * Durchmesser Runddraht
– Länge Flachdraht * Umformgrad
– Drahtdurchmesser * Umformgrad (p-Wert zu hoch)
– Härte * Länge
– Härte * Menge (p-Wert zu hoch)mit dazugehörigen Kovariaten.
R-Qd = 64% und R-Qd(kor) = 63%
mit 1779 Datensätze und 139 ungewöhnlichen Beobachtungen (also fast 8% – ist doch zu viel, oder?!)Gruß, ***
geändert von – TB on 11/12/2007 16:21:33
-
AutorBeiträge