QM-Forum › Foren › Qualitätsmanagement › Stichprobengröße definieren bei MP
-
AutorBeiträge
-
Hallo Timo,
Gegenfrage: Gibt es eine Möglichkeit, Deine aktuelle Testsituation ein bisschen mehr zu beschreiben, damit ich besser verstehe, worum es geht? Danke!
Viele Grüße
Barbara
_____________________________________
Ich fühle, dass Kleinigkeiten die Summe des Lebens ausmachen.
(Charles Dickens, Schriftsteller)Hallo,
also, ich habe meine Diplomarbeit meinem Betreuer präsentiert. Da die Formel zur Berechnung der Stichprobengröße nur bei normalverteilten Daten funktioniert, können nicht alle gemessenen Parameter berücksichtigt werden.
Ein Beispiel wäre die Anzahl von Leukozyten, habe mal ein Bild eines Histogrammes hochgeladen.
http://www.picfront.org/d/E0ZMiahP/OUTPUT0.JPG
Die Prüfung auf Nomralverteilung mit Hilfe eines Kolmogorov-Smirnov Tests zeigt, das keine Normalverteilung vorliegt.
Jetzt suche ich schon ewig nach einer Möglichkeit eine andere Formel zur Berechnung der Stichprobengröße zu finden oder eine Möglichkeit die Daten in eine Normalverteilung zu bringen (z.B. LOG) oder so. Kannst du mir da helfen?Lieben Gruß
Timo
Hallo Timo,
53 Messwerte sind ein bisschen mager für eine Verteilungsbestimmung. Irgendwie sieht Dein Histogramm so aus, als wären da häufiger dieselben Werte eingetragen worden (der große Balken), das find ich ein bisschen merkwürdig, kann aber natürlich vorkommen. Auch da helfen mehr Messwerte und eine Validierung des Mess-Systems (die Ihr eigentlich irgendwo haben müsstet).
Ich würde einfach mal einen Biologen fragen, mit welcher Verteilung er die Leukozyten-Konzentration annähern würde bzw. mit welcher Verteilung da normalerweise gearbeitet wird.
Dann würde ich diese Verteilung in eine Normalverteilung transformieren, weil es für andere Verteilungen keine einfachen Formeln gibt. (Um genau zu sein kenne ich keine Quelle von Formeln für andere Verteilungen.) Das ist für mich also eine der seltenen Situationen, in denen Transformationen einen echten Sinn haben.
Ich würde auf jeden Fall testen, ob die transformierten Werte auch tatsächlich normalverteilt sind. Allerdings hat der Kolmogorov-Smirnov-Test eine so geringe Güte, dass Du ein geringeres Risiko eingehst, wenn Du eine Münze wirfst. (Da ist das Risiko für eine falsche Entscheidung „nur“ 50 %, beim KS-Test kann das deutlich höher liegen.) Bessere Testverfahren sind der Anderson-Darling-Test, der Shapiro-Wilks/Shapiro-Francia-Test oder der Cramér-von Mises-Test.
Mit den (abgesichert) normalverteilten transformierten Werten würd ich dann den notwendigen Stichprobenumfang bestimmen.
Viele Grüße
Barbara
_____________________________________
Ich fühle, dass Kleinigkeiten die Summe des Lebens ausmachen.
(Charles Dickens, Schriftsteller)hi,
okay vielen dank, also konnte ich bei meiner suche auch nicht so viel finden. Kannst du mir einen Tipp geben, wie ich die Daten in eine Normalverteilung transformiere?
Gruß
Timo
Hallo Timo,
kommt auf die Verteilung an. Bei der Lognormal-Verteilung läuft das über den Logarithmus (wie der Name schon sagt).
Viele Grüße
Barbara
_____________________________________
Ich fühle, dass Kleinigkeiten die Summe des Lebens ausmachen.
(Charles Dickens, Schriftsteller)hi,
habe mich jetzt eingelesen. ich habe drei Möglichkeiten zur Transformation gefunden:
-die Wurzel ziehen (sqrt)
-Logarithmus
-Kehrwertbei dem Beispiel mit den Leukos (Bild siehe oben) war mir der Logarithmus am logischsten. Aber auch nach der Transformation war laut tests keine Normalverteilung vorhanden. Die grafik jedoch hat sich gebessert. Ich habe zum Spass eine Transformation mit sqrt gemacht, da sieht die grafik noch besser aus. habe beide mal verlinkt.
log: http://picfront.de/d/StcJQQqlWW/OUTPUT2.JPG
sqrt: http://picfront.de/d/k7tQrwh0z/OUTPUT1.JPG
Was mache ich wenn auch eine Transformation nichts bringt? heißt das, ich kann keine Stichprobengröße bestimmen?
gruß
Timo
geändert von – alttimo on 05/12/2007 23:34:49
Hallo Timo,
oje, ich hatte gehofft, dass die Messwerte zu dem von Dir hochgeladenen ersten Bild nur Fake-Werte waren…
Also:
Du kannst mit den Werten a) keine zuverlässige Absicherung hinkriegen, weil es einfach zu wenig Werte sind. Für die Verteilungsbestimmung sollten es n=100 sein, da sind n=53 zu schmal. b) wirst Du bei dem Aussehen auch keine Verteilung finden, die ein gutes Transformationsergebnis liefert. Der riesige Balken in einer schmalen Klasse zusammen mit deutlich schwächer und nicht-besetzten anderen Klassen passt zu keiner Verteilung.Damit hast Du leider die (übliche) Situation vor Dir, dass es irgendwelche systematischen Einflüsse auf die Leukozyten-Zahlen gibt, z. B. bei den Herstellungsbedingungen oder durch verschiedene Maschinen oder Laboranten oder… Durch diese Einflüsse verändern sich die Ergebnisse (hier: die Leukozyten-Zahl).
Theoretisch würde also beispielsweise für die Leukozyten eine Lognormal-Verteilung in Frage kommen. In der Praxis siehst Du, dass Einflüsse die Ergebnisse so stark verändern, dass im Ergebnis die Lognormal-Verteilung kein passendes Verteilungs-Modell ist.
Bevor Du also einen zuverlässigen Stichprobenplan aufstellen kannst, musst Du erstmal den Prozess so weit verstanden haben und seine Einflüsse kennen, dass Du das Ergebnis mathematisch beschreiben kannst.
Die einfachste Möglichkeit für die Prozess-Beschreibung ist eine Verteilungsfunktion (wie Normalverteilung, Lognormalverteilung, usw.) Wenn das nicht funktioniert, weil so eine Verteilungsfunktion nie systematische Einflüsse berücksichtigen kann, musst Du die Einflüsse finden und unter Kontrolle bringen, um wieder etwas mathematisch Beschreibbares zu kriegen.
Ganz kurz heißt das: Du hast keine Kontrolle über den Prozess. In dem Fall nutzt Dir keine Stichprobenanweisung, sondern eine Prozess-Untersuchung und -Beschreibung, um zu wissen, was im Prozess passiert.
Falls das für Deine Diplomarbeit zu spät kommt, würd ich sehr deutlich über den Absatz mit den Stichprobenberechnungen schreiben: „Achtung: Nur Theorie, nicht für die praktische Anwendung geeignet!“ um zu zeigen, dass Du das theoretisch verstanden hast und anwenden könntest, wenn der Prozess unter Kontrolle wäre. Und wie der Prozess dann unter Kontrolle gebracht werden kann, kannst Du Dir ja als Thema für die Dissertation wählen :o)
Viele Grüße
Barbara
_____________________________________
Ich fühle, dass Kleinigkeiten die Summe des Lebens ausmachen.
(Charles Dickens, Schriftsteller)Hallo,
ich habe meine Diplomarbeit bereits abgegeben. Jetzt ist mir aber in den letzten Tagen eine Frage durch den Kopf gegangen (die mir leider jetzt erst gekommen ist:) ). Die da wäre:
Ich benutze zu Berechnung der Stichprobengröße Daten eines Jahres, die Anzahle der Messungen sind aber auf den Monat defieniert. Jetzt meine Frage auf welchen Zeitraum bezieht sich meine Berechnung, auch auf den Monat oder aufs Jahr? Gruß
Timo
Hallo Timo,
Grundlage für die Berechnung von Stichproben-Umfängen ist *immer* ein stabiles System, d. h. ein System, was keine (signifikanten) Änderungen von Monat zu Monat zeigt.
Damit ist Dein Stichprobenumfang repräsentativ für das Gesamtsystem und es ist schnurps, ob Du Dir einen kleinen Ausschnitt anschaust (einen Monat) oder einen großen (mehrere Jahre). Du gehst davon aus, dass Du immer einen Teil ein und desselben Systems vor Dir hast.
Viele Grüße
Barbara
_____________________________________
Ich fühle, dass Kleinigkeiten die Summe des Lebens ausmachen.
(Charles Dickens, Schriftsteller)Hallo,
also verstehe ich das richtig:
Grundlage Daten eines Monats => Berechnete Stichprobengröße für einen Monat.
Grundlage Daten eines Jahres => Berechnete Stichprobengröße für ein Jahr.
oder steh ich ma wieder aufm Schlauch :D
Lieben Gruß
Hallo Timo,
wenn Du ein stabiles System hast (was Du als Voraussetzung für die Berechnung von *zuverlässigen* Stichprobenumfängen brauchst), dann dürfte es keinen großen / signifikanten Unterschied zwischen den Stichprobenumfängen pro Monat und pro Jahr geben.
Denn wenn das alles aus einem stabilen System stammt, dann hast Du auch immer (in etwa) die gleichen Kennzahlen wie Mittelwert und Standardabweichung und damit auch das gleiche Ergebnis in der Formel zur Bestimmung des Stichprobenumfangs. Wenn Du die gleichen Kennzahlen in die Formel steckst, kommt auch der gleiche erforderliche Stichprobenumfang raus.
D. h.:
Sind die Stichprobenumfänge zwischen Monat und Jahr deutlich unterschiedlich, dann hast Du auch starke Unterschiede in den Kennzahlen. Damit ist das System instabil bzw. nicht vorhersagbar, d. h. Du kannst mit Deinem Stichprobenumfang keine Risiken absichern, weil Du nicht vorhersagen kannst, was morgen oder im nächsten Monat passiert.Insofern ist es für den Stichprobenumfang egal, mit welchem Zeitraum er berechnet wurde. Er gibt Dir an wie viele Teile Du prüfen musst um zu entscheiden „System ist gleich geblieben“ oder „System hat sich verändert“. Ob Du nun einen Tag, eine Woche, einen Monat oder ein Jahr als Prüfintervall nimmst, ist dabei gleich bzw. hängt von der Prüfsituation ab und den Anforderungen, wie schnell eine System-Änderung entdeckt werden muss.
Viele Grüße
Barbara
_____________________________________
Ich fühle, dass Kleinigkeiten die Summe des Lebens ausmachen.
(Charles Dickens, Schriftsteller)Ah danke, jetzt habe ich verstanden!
Gruß
Timo
Hi,
ich bins schon wieder :D. Ich hoffe ich nerve nicht. Ich bin nochmal den Thread durchgegangen, da kam mir eine Idee. Ist es evtl. möglich, bei den nicht normalverteilten Leukozyten den Balken der nicht rein pass quasi einfach abzuschneiden und somit wieder eine Normalverteilung herzustellen?
Das Diagramm stammt von einem Produkt das Leukozytenreduziert ist, deshalb entsteht ein sollcher Balken da durch die Reduktion fast immer der gleiche Wert erreicht wird.
Ich hoffe du hast mich verstanden, worauf ich hinaus will.
Lieben Gruß
Timo
Hallo Timo,
es ist gut, wenn Du weißt, warum Deine Balken so aussehen, wie sie aussehen. Wenn Du allerdings hingehst und manuell an den Daten herumschnibbelst und für das Ergebnis eine Stichprobengröße bestimmst, dann hast Du für die reduzierte Version eine Stichprobengröße.
Damit müsstest Du auch die zu testenden Daten genauso reduzieren, um mit dieser Stichprobengröße arbeiten zu können. Das halte ich für schwierig.
Abgesehen davon hast Du so stark voneinander unterschiedliche Balken, dass – egal wie Du den größten Balken reduzierst – niemals (auch bei den transformierten Skalen) etwas herauskommt, dass kontinuierlich über die gesamte x-Skala verteilt ist. Damit wird das auch mit Balken-Reduzierung keine Normalverteilung werden.
Viele Grüße
Barbara
_____________________________________
Ich fühle, dass Kleinigkeiten die Summe des Lebens ausmachen.
(Charles Dickens, Schriftsteller)Hi,
verdammt. Also kann ich mich drehen und machen wie ich will ich bekomm da kein richtiges Ergebnis? Das ist schlecht, weil bei fast jedem Produkt ein Parameter dabei ist der nicht normal verteilt ist.
Trotzdem vielen Dank
Gruß
Timo
-
AutorBeiträge
- Sie müssen angemeldet sein, um auf dieses Thema antworten zu können.