QM-Forum › Foren › Qualitätsmanagement › Anzahl Versuchswiederholung Streuung als Zielgröße
-
AutorBeiträge
-
Hallo Forengemeinde,
ich stehe vor folgendem statistischen Problem. Ich möchte dir notwendige Anzahl an Versuchswiederholungen eines Versuchsplanes bestimmen (Bsp.: vollfaktoriell 2^4 Plan – 16 Versuchspunkte).
Wenn mein Ziel die Bestimmung der Effekte auf den Mittelwert einer Zielgröße ist kann ich dafür ja noch den t-Test nehmen mit der Formel:
nges= s*Sigma²/d² * [t(v,Palpha)+t(v,Pbeta)]²wobei d die minimal nachzuweisende Differenz sein soll.
Die Anzahl der Versuchswiederholungen wird dann berechnet aus:Wiederholungen = nges/N (N ist die Anzahl der Versuchspunkte im Beispiel 16)
Sollen jetzt Effekte auf die Zielgöße die gleich oder größer als die einfache Streuung der Zielgröße sind nachgewiesen werden sind dafür bei ((alpha = 5% beta = 10%)) nges = 22 Versuche nötig also :
Wiederholungen = 22/16 = 1,375 also mindestens 2 Versuchswiederholungen pro Punkt.
Das ganze gilt aber auch nur wenn die Versuchsstreuung in allen Versuchspunkten vergleichbar ist.
Gut – also erste Frage – istd as ganze so weit richtig? Falls ja meine eigentlich Frage:
Was mache ich wenn meine Ziel nicht die Bestimmung der Effekte auf die Mittelwerte der Zielgröße ist sondern auf die Streuung der Zielgröße?
Im Grunde könnte ich dann ja über den F-Test herangehen.
Hier bekomme ich z.B. wenn ich einen Varianzunterschied von 20% nachweisen möchte, dass ein Stichprobenumfang von 300 notwenig ist. ABER – teilen die sich dann auch auf nach der Formel nges = c*N (wobei c die Anzahl der Wiederholungen eines Versuchspunktes wäre)?
Das wäre doch nicht zulässig, da das ja auch nur zuläßig ist wenn die Varianzen der einzelnen Versuchspunkte gleich sind – was sie ja aber per se nicht sein können wenn ich einen Unetrschied zwischen ihnen nachweisen will. Kann mir noch jemand folegn?
Also meine (einfache) Frage ist: Wenn ich einen faktoriellen Versuchsplan mache und Effekte meiner Parameter auf die Treuung der Zielgröße nachweisen möchte – wie bestimme ich die notwendige Anzahl an Versuchswiederholungen. (Z.B. ich will einen Effekt nachweisen der 10% der Versuchsstreuung ist)
Hoffe irgendjemand konnte mir folgen und kann mir helfen.
Gruß
monacon
Hallo monacon,
cool, eine echt anspruchsvolle Statistik-Frage :-)
Also:
Deine Zielgröße Y soll die Streuung S sein. Du brauchst also sowieso einige Mess-Wiederholungen pro Versuchspunkt, um die Streuung überhaupt berechnen zu können.Je weniger Mess-Wiederholungen Du machst, desto breiter wird das dazu gehörende Konfidenzintervall, da die Streuung umso genauer geschä*tzt werden kann, je mehr Messwerte vorliegen.
Allgemein ist die Standardabweichung S einer normalverteilten Zufallsgröße X²-verteilt (Chi-Quadrat). Der Konfidenzbereich für die theoretische Streuung sigma² ist:
[(n-1)sigma²/X²(n-1;1-alpha/2) ; (n-1)sigma²/X²(n-1;alpha/2)]
und damit für die geschä*tzte Standardabweichung S:
[S*Wurzel(n-1/X²(n-1;1-alpha/2)) ; S*Wurzel(n-1/X²(n-1;alpha/2))]Mit der X²-Verteilung kannst Du dann den notwendigen Stichprobenumfang ausrechnen (lassen). Hilfreiche Links:
http://www.jeremymiles.co.uk/misc/power/
http://www.psycho.uni-duesseldorf.de/aap/projects/gpower/
(GPower ist Freeware und allein die Oberfläche im MS-DOS-Stil ein echter Hingucker ;-) )Du brauchst natürlich um das KI bestimmen zu können erstmal Vorinformationen oder Vorversuche, wie groß die Standardabweichung ist.
Soweit die Planung. Wenn Du dann die Versuche gemacht hast, sollte das Modell validiert werden, damit Du ausschließen kannst, dass etwas Wichtiges fehlt (R², Residualplots, NV-Tests).
Und erst dann kommt die Analyse der Versuchsplanungsergebnisse. Die Nullhypothese ist immer die Gleichheit, d. h. Du nimmst an, dass es keinen Effekt durch die Änderungen der Einstellungen auf die Streuung gibt und kannst mit dem F-Test (Vergleich der Streuungen) diese Nullhypothese ablehnen oder beibehalten.
In der Statistik wird fast immer das in die Nullhypothese gepackt, was abgelehnt werden soll (z. B. „Es gibt keinen Effekt“, „alle Varianzen sind gleich“, usw.)
Da das Thema ziemlich komplex ist, hier noch zwei Buchtipps:
Kleppmann: Taschenbuch Versuchsplanung
-> Kapitel 7-9, ISBN 3-446-22319-3
Montgomery: Design and Analysis of Experiments
-> Chapter 6,8,12,13, ISBN 0-471-48735-X (gibt es bei booxtra.de und ist wirklich richtig schön, umfassend und anschaulich erklärt)Ich hoffe, das hilft Dir weiter. Weitere Fragen kann ich erst nächste Woche beantworten, weil ich den Rest der Woche ohne Mail-Zugriff bin.
Viele Grüße
Barbara
_____________________________________
Fakten hören nicht auf zu existieren, wenn man sie absichtlich übersieht. (Aldous Huxley)
Hallo Barbara,
mit einer Antwort von Dir habe ich gerechnet – und freue mich. ich werde mir jetzt Deine Antwort in Ruhe zu Gemüte führen und versuchen sie zu verstehen. Den Kleppmann habe ich notfalls auch. Das Buch von Monrgomery muss langsam auch mal in meinen Besitz.
Wenn ich noch Fragen habe schreibe ich sie hierhin.
Schöne Grüße
monacon
geändert von – monacon on 30/05/2006 09:59:34
Ok Barbara, ich gebe mich geschlagen – vorerst. Ich habe Deine Antwort nur teilweise verstanden und die weitere Lektüre Deiner Verweise haben mich mehr verwirrt als erhellt. Also fassen wir das ganze doch mal mit einem konrketen Beispiel. Gegeben sei folgender Versuchsplan
A|B|Y|s
-|-| |
+|-| |
-|+| |
+|+| |
Erfahrungsgemäß liegt der Mittelwert der Zielgröße bei ca. 2 und ihre Standardabweichung bei 0,5.Meine Frage ist nur – wie bestimme ich die notwendige Anzahl an Versuchswiederholungen wenn ich einen Effekt der Parameter auf den Mittelwert von sagen wir 0,3 und auf die Streuung der Zielgößr von 0,1 sicher nachweisen will (a=0,05 b=0,1).
Für den Mittelwert habe ich bisher diese Lösung:
nges=2*sigma²/delta²*[t(v,Palpha)+t(v,Pbeta)]²
hier:
nges=2*0,5²/0,3²*(3,182+1,638)²=129(was mir viel zu groß vorkommt)
mit N=4 käme dann herausAnzahl Versuchswiederholungen= nges/N=ca. 32 Das kann doch nicht stimmen? Habe ich das d falsch verstanden?
Und dann zur Bestimmung der notwendigen Anzahl an Versuchswiederholungen um einen Effekt auf die Streuung von mindestens 0,1 nachzuweisen habe ich keine so rechte Idee – kannst Du versuchen mir das an diesem Beispiel zu erklären?
Auf erhellung hoffend
monacon
geändert von – monacon on 30/05/2006 16:15:14
ein kurzer schubs nach oben damit Barbara den Beitrag nicht übersieht wenn wieder in eMail reichweite.
So noch mal der Schubs nach oben – Barbara? hast DU eine Idee?
Hallo monacon,
jepp, sorry für die Verspätung, hab letzte Woche ein Six Sigma Seminar gehalten ;-)
Also:
Du kannst mit einem zweifaktoriellen Versuchsplan ENTWEDER den Effekt auf den Mittelwert absichern ODER den Effekt auf die Streuung. Beides zusammen gibt der nicht her, weil Du zwei Zielgrößen hast, die voneinander unabhängig sind.Die Unabhängigkeit der Lage und Streuung ist eine Eigenschaft der Normalverteilung. Und die Normalverteilung ist die Grundlage für die vorab-Berechnung der notwendigen Anzahl Versuche.
Wenn Du z. B. den Effekt von 0,3 auf den Mittelwert absichern willst und als Standardabweichung 0,5 hast, dann rauschen Deine Daten ziemlich stark verglichen mit dem Effekt, so dass Du bei einer Wiederholung von 30 bei allen Versuchsplan-Punkten landest.
Die 32 Versuche pro Punkt bekommst Du, wenn Du das direkt mit dem t-Test ausrechnest. Da wird allerdings nicht berücksichtigt, dass Du das Ganze vier Mal machst, deshalb kommst bei einem 2^4-Plan mit 30*4=120 Versuchen statt 32*4=132 Versuchen aus.
Wenn Du als Zielgröße die Streuung nimmst, dann kannst Du die Anzahl Versuche über die Anwendung des Zentralen Grenzwertsatzes (ZGWS) bestimmen. Nach dem ZGWS ist der Mittelwert der Streuungen normalverteilt (wenn das Ganze aus einem stabilen Prozess kommt, Lage und Streuung bekannt) bzw. t-verteilt (wenn Prozess stabil ist und Lage und Streuung geschä*tzt werden). Damit kannst Du genauso wie im ersten Fall die Anzahl notwendiger Messwiederholungen berechnen.
Beispiel 1:
Du hast als mittlere Streuung 0,5 ausgerechnet und festgestellt, dass dieser Wert eine Streuung von +/- 0,2 (Streuung der Streuung) hat. (Die 0,2 musst Du über Vorversuche bestimmen, das ist hier nur ein Beispiel.) Wenn Du dann einen Effekt von 0,1 mit einem alpha=5% und beta=10% entdecken willst, brauchst Du 43 Ergebnisse für die Streuung pro Versuchspunkt, d. h. 43*4=172 Ergebnisse für die Streuung.Da die Streuung immer aus mehreren Werten geschä*tzt wird, brauchst Du für die Berechnung eines Streuungs-Werts deutlich mehr Versuche. Wenn Du beispielsweise für jede Streuungs-Berechnung 5 Werte nimmst, brauchst Du insgesamt 172*5=360 Versuche.
Beispiel 2:
Mittlere Streuung (aus Vorversuch): 0,5
Zu identifizierender Effekt: 1,8
alpha=5%
beta=10%
Anzahl Streuung-Werte: 2,
d. h. bei 4 Versuchsplan-Punkten: 2*4=8 Werte für die Streuung,
d. h. bei 5 Messwerten je Streuungs-Schä*tzung: 2*4*5=40 VersucheBeispiel 3:
Mittlere Streuung (aus Vorversuch): 0,5
Zu identifizierender Effekt: 0,8
alpha=5%
beta=10%
Anzahl Streuung-Werte: 5,
d. h. bei 4 Versuchsplan-Punkten: 5*4=20 Werte für die Streuung,
d. h. bei 5 Messwerten je Streuungs-Schä*tzung: 5*4*5=100 VersucheWas auf jeden Fall sinnvoll ist, ist die Verwendung einer Software, die Dir das alles ausrechnet. Du kannst zwar mit einem 2^4-Plan anfangen und die Anzahl der Messwiederholungen berechnen, nur kannst Du mit einem 2^4-Plan ausschließlich die Aussage machen, ob ein Haupteffekt einen Einfluss hat. Wechselwirkungen können nicht berücksichtigt werden, genausowenig quadratische Effekte.
Deshalb ist ein zweifaktorieller Plan auch nur für ein erstes grobes Sieben der Einflussgrößen sinnvoll. Für die Optimierung sind D-optimale Pläne oder central composite designs deutlich mächtiger.
Ich hoffe das hilft Dir.
Viele Grüße
Barbara
_____________________________________
Fakten hören nicht auf zu existieren, wenn man sie absichtlich übersieht. (Aldous Huxley)
Hallo Barbara,
vielen Dank für Deine erhellende Antwort so in der Art habe ich mir das gedacht. Das d-optimale Pläne oder ccd besser geeignet ist für eine optimierung ist klar, darum gings mir nicht, den 2 faktoriellen 2^2 Plan habe ich als einfaches Beispiel gewählt. Mit der Berechnung der versuchswiederholungen für den Mittelwert ist mir alles klar aber mit der Berechnung für die Streuung noch nicht 100%.
In Deinem Beispiel 1 berechnest Du 43 Werte pro Versuchspunkt (á 5 Wiederholungen pro Wert um die Streuung zu berechnen wenn ich Dich richtig verstanden habe). Wie kommst Du konkret auf diese 43? Über den Zentralen grenzwertsatz? Der sagt mir gerade nichts. Muss ich mich mal schlau machen.
Was für eine Software empfiehlst Du für solche Berechnungen? Als Versuchsplanungssoftware habe ich bisher Design Expert, aber das scheint so etwas nicht zu ermöglichen. Das kleine Dosprogramm das Du empfiehlst habe ich geladen aber wie ich damit auf die von Dir berechneten 43 komme hab ihc noch nicht ganz raus – was muss ich wo eingeben?
Gruß monacon
Hallo monacon,
für die Berechnung der 43 Punkte hab ich mit Minitab gearbeitet (muss natürlich ein 2^2 und nicht ein 2^4-Plan sein). Da gibt es bei Power & Sample Size auch das Menu mit dem der benötigten Versuchsumfang für zweifaktorielle Pläne bestimmt werden kann. Wenn Du das Ganze mit Deiner t-Test-Formel rechnest, kriegst Du als Ergebnis 44 raus (statt 43).
In Design Expert geht das so nett direkt nicht, da kannst Du nur über Power-Kurven iterativ herausfinden, wie viele Versuche Du machen musst.
Viele Grüße
Barbara
_____________________________________
Fakten hören nicht auf zu existieren, wenn man sie absichtlich übersieht. (Aldous Huxley)
-
AutorBeiträge
- Sie müssen angemeldet sein, um auf dieses Thema antworten zu können.