cpk – unterschiedliche Stichprobenumfänge2013-06-12T13:46:42+01:00

QM-Forum Foren Qualitätsmanagement cpk – unterschiedliche Stichprobenumfänge

Ansicht von 2 Beiträgen – 1 bis 2 (von insgesamt 2)
  • Autor
    Beiträge
  • Alfalfa
    Mitglied
    Beitragsanzahl: 1

    Hallo an alle,

    ich bin neu hier und vorweg möchte ich sagen, dasss ich kein gelernter Statistiker sondern Software-Entwickler bin, d.h. man möge mir Ausdruckfehler verzeihen aber mich bitte korrigieren [:)].
    Ich habe zur Zeit die Aufgabe eine Berechnung der Maschinen-/Prozessfähigkeit zu programmieren. Ich habe dazu die DIN ISO 21747 vorliegen und das allgemeine geometrische Verfahren umgesetzt. Dort gibt es mehrere Berechnungsmethoden der Schätzer für Lage und Streuung.
    Es kann nun den Anwendungsfall geben, dass bei einer Prozessfähigkeitsberechnung mehrere Unterstichproben unterschiedlicher Größe vorliegen. Ich kann nun die Berechnungsmethoden wählen, welche die Schätzer aus dem gesamten Datensatz berechnen, also eigentlich kein Problem.
    Gibt es aber auch die Möglichkeit, die entsprechenden Schätzer abhängig von ihren Unterstichproben zu berechnen? Ich finde in der DIN nur Methoden für jeweils gleichen Stichprobenumfang der Unterstichproben.
    Ich denke nämlich, dass bei einem „Zusammenlegen“ aller Stichproben durchaus Informationen verloren gehen, und der cpk-Wert so nicht ganz „richtig“ ist? Stimmt das?
    Hilft mir hier das „gewichtete arithmetische Mittel“ weiter? Gibt es auch eine „gewichtete Varianz“?

    Ich freue mich über Antworten,

    mfg, Christian

    Barbara
    Senior Moderator
    Beitragsanzahl: 2766

    Hallo Christian,

    herzlich willkommen im Qualitäter-Forum [:)]

    Erstmal ein paar Wort vorweg zu den Prozessfähigkeits-Normen:

    DIN ISO 21747:2007 „Statistische Verfahren – Prozessleistungs- und Prozessfähigkeitskenngrößen für kontinuierliche Qualitätsmerkmale“
    Status: veröffentlicht
    Ersatz für DIN 55319 „Qualitätsfähigkeitskenngrößen“
    Übersetzung der ISO 21747:2006

    ISO 21747:2006 „Statistical methods – Process performance and capability statistics for measured quality characteristics“
    Status: ersetzt durch ISO/FDIS 22514-2

    ISO/FDIS 22514-2:2013 „Statistical methods in process management — Capability and performance — Part 2: Process capability and performance of time-dependent process models“ (auf deutsch übersetzt „Statistische Verfahren im Prozessmanagement – Fähigkeit und Leistung – Teil 2: Prozessleistungs- und Prozessfähigkeitskenngrößen für zeitabhängige Prozess-Modelle
    Status: in Bearbeitung / Norm-Entwurf

    ISO/TR 22514-4:2007 „Statistical methods in process management – Capability and performance – Part 4: Process capability estimates and performance measures“ (auf deutsch übersetzt „Statistische Verfahren im Prozessmanagement – Fähigkeit und Leistung – Teil 4: Prozessfähigkeitsschätzer und Prozessleistungsmaße“)

    Das heißt zusammengefasst: Die deutsche Prozessfähigkeits-Norm DIN ISO 21747 hat bei der ISO den Status „ersetzt durch ISO/FDIS 22514-2“. In der ISO/FDIS 22514-2 steht etwas sehr ähnliches wie in der DIN ISO 21747 bzw. ISO 21747 mit zwei wesentlichen Unterschieden:
    1. ISO/FDIS 22514-2 ist speziell für zeitabhängige Prozesse. (Prozessfähigkeiten für nicht-zeitabhängige Prozesse werden in ISO 22514-4 beschrieben.)
    2. Für die Verteilungszeitmodelle B, C1, C2, C3, C4 und D ist der Prozess nicht unter statistischer Kontrolle (not under statistical control) bzw. nicht beherrscht.

    Der zweite Punkt hat direkte Auswirkungen auf die Angabe der Kennzahlen, denn nach DIN ISO 21747 (3.1.4.2-3.1.4.4 jeweils Anmerkung 1) , ISO/FDIS 22514-2 (7.1 vor der Definition von Cp und Cpk) und ISO/TR 22514-4 (6.1 erster Absatz) gilt:
    Cp und Cpk (Prozessfähigkeit): nur wenn für Prozesse bei denen statistische Kontrolle nachgewiesen ist
    Pp und Ppk (Potentielle Prozessleistung): auch für Prozesse bei denen noch kein Nachweis der statistischen Kontrolle vorliegt

    Wenn Du also einen Cp/Cpk-Wert berechnen willst, brauchst Du nicht-zeitabhängige Prozesse, bei denen nachgewiesen worden ist, dass sie beherrscht sind.

    In der Praxis macht das (zumindest in Deutschland) kaum jemand so. Ich kenne diverse Firmen die immer nur Cp/Cpk (egal ob der Prozess beherrscht ist oder nicht) angeben und es gibt auch einige Firmen bei denen per Arbeitsanweisung vorgegeben ist, dass alle Prozessdaten normalverteilt sind. Beides ist eine Abweichung von den Prozessleistungs-/Prozessfähigkeits-Normen.

    Diese ganzen Informationen sind wichtig, weil mit der Auswahl der Norm auch die Berechnungsmethoden variieren:
    DIN ISO 21747, ISO/FDIS 22514-2: geometrisches Verfahren und andere Methoden
    ISO 22514-4: Berechnung auf Basis von Verteilungsquantilen Q50%, Q99,865% und Q0,135%

    Jetzt mal konkret zu Deinen Fragen zu Kennzahlen für ungleiche Stichprobenumfänge [;)]

    quote:


    Ursprünglich veröffentlicht von Alfalfa

    Gibt es aber auch die Möglichkeit, die entsprechenden Schätzer abhängig von ihren Unterstichproben zu berechnen? Ich finde in der DIN nur Methoden für jeweils gleichen Stichprobenumfang der Unterstichproben.


    Klar gibt es in der Statistik auch Formeln für den mittleren Wert oder die Streuung, in denen unterschiedliche Stichproben-Umfänge berücksichtigt werden. Nach DIN ISO 21747 ist M1 das allgemeine geometrische Verfahren. Die Berechnungsformeln werden bei M1 durch zwei Indizes l (location/Lage) und d (dispersion/Streuung) angegeben.

    Wenn Du einfach nur Kennzahlen nach DIN ISO 21747 berechnen willst, könntest Du für den mittleren Wert mit l=4 den Mittelwert der Stichprobenmittelwerte verwenden.

    Für die Streuung-Kennzahlen wären d=1, d=2 oder d=3 möglich, bei denen auch unterschiedliche Stichprobenumfänge berücksichtigt werden können. Die allgemeineren Formeln findest Du z. B. in Formulas for Estimating the Standard Deviation for Capability Analysis (S. 2):

    d=1: Durchschnitt der Stichproben-Standardabweichungen (englisch: Sbar, average of subgroup standard deviation)
    d=2: zusammengefasste Stichproben-Standardabweichungen (englisch: pooles standard deviation)
    d=3: Durchschnitt der Stichproben-Spannweiten (englsich: Rbar, average of subgroup ranges)

    quote:


    Ursprünglich veröffentlicht von Alfalfa

    Ich denke nämlich, dass bei einem „Zusammenlegen“ aller Stichproben durchaus Informationen verloren gehen, und der cpk-Wert so nicht ganz „richtig“ ist? Stimmt das?


    Bei der Prozessfähigkeit geht es um die Gesamt-Bewertung eines Prozesses. Hierfür werden alle Werte in einen Topf geworfen und daraus die Streubreite ermittelt. (Deinem Kunden ist es schließlich auch herzlich wurscht, ob Ihr zwischendurch mal besser oder schlechter gewesen seid. Er möchte eine Aussage für den gesamten Prozess haben.)

    Es gibt auch die Möglichkeit, eine Prozessfähigkeit mit Berücksichtigung der Stichprobengruppen zu berechnen (heißt dann auch Prozessfähigkeit innerhalb oder potentielle Prozessfähigkeit). Die liefert aber keine Informationen zum Gesamt-Prozess, sondern zeigt auf wie gut Ihr sein könntet, wenn Ihr alle Stichproben auf ein gleiches Lage-Niveau kriegen würdet. Hier werden dann die Formeln für d=1, d=2 oder d=3 verwendet. Die Lage wird allerdings immer über den Gesamt-Mittelwert berechnet (l=1).

    ACHTUNG: Diese Formeln liefern nur dann Informationen zur Prozessfähigkeit(innerhalb), wenn die Prozessdaten normalverteilt sind (Verteilungszeitmodell A1 oder A2). Bei anderen Verteilungen können diese Werte zwar berechnet werden, sind aber als Streuungs-Kennzahlen unbrauchbar. Eine ausführlichere Begründung dazu gibt es in dem Artikel Why Minitab does not calculate within-subgroup capability indices in capability analysis with nonnormal data.

    Bevor Du jetzt mit der Programmierung anfängst wäre es deshalb sinnvoll darüber nachzudenken, worum es Dir geht:
    a) Prozessleistungs-Kennzahlen Pp/Ppk nach DIN ISO 21747, die bei nicht-beherrschten Prozessen irreführend sein können weil sie die Leistungsfähigkeit sowohl über- als auch unter-schätzen können
    b) Prozessfähigkeits-Kennzahlen Cp/Cpk für die Du eine Verteilung brauchst und dann über die Verteilungsquantile die Fähigkeitswerte berechnest (unabhängig von der Anzahl Messwerte je Stichprobengruppe) bzw. bei normalverteilten Daten Prozessfähigkeit(gesamt) und Prozessfähigkeit(innerhalb)

    Mit den Prozessfähigkeits-Kennzahlen ist es ein bisschen so wie mit dem Eisberg und der Titanic: Auf den ersten Blick sieht der Eisberg harmlos aus und wenn Du dann näher kommst wirds gefährlich. Denn nichts ist schlimmer als ein gut aussehender Fähigkeitswert, der das Qualitätsniveau eines Prozesses überschätzt: Du glaubst die Prozesse funktionieren und kriegst unerwartet jede Menge Probleme.

    Ich hoffe das hilft Dir trotzdem ein bisschen weiter [;)]

    Viele Grüße

    Barbara

    ————
    Eine gute wissenschaftliche Theorie sollte einer Bardame erklärbar sein.
    (Ernest Rutherford, Physiker)

Ansicht von 2 Beiträgen – 1 bis 2 (von insgesamt 2)
  • Sie müssen angemeldet sein, um auf dieses Thema antworten zu können.
Nach oben