CHI² Anpassungstest2012-12-11T11:12:59+01:00

QM-Forum Foren Qualitätsmanagement CHI² Anpassungstest

Ansicht von 4 Beiträgen – 1 bis 4 (von insgesamt 4)
  • Autor
    Beiträge
  • MartinS
    Mitglied
    Beitragsanzahl: 3

    Hallo,

    ich bin schwer am Verzweifeln bei der Berechnung eines CHI² Anpassungstest auf Normalverteilung.

    Mein Referenzwert kommt aus einer bekannten Statistiksoftware und mein Wert sollte doch diesem sehr ähnlich sein. Momentan rechne ich mit Excel nach.

    Dass dabei Abweichungen bei der Normalverteilung und dadurch auch bei der Berechnung von chi² entstehen ist mir klar.

    Was mir nicht klar ist, ist wie die Referenzsoftware die Klassierung meiner (kontinuierlichen) Daten vornimmt. Da von der Klassierung extrem viel beim CHI² Anpassungstest abhängt schwanken meine berechneten Ergebnisse entsprechend stark.

    Kann mir jemand die gängige Klassierungsmethode aufzeigen ? Die Anzahl Klassen ist mir bekannt (zurückgerechnet aus den Freiheitsgraden der Testschranken), die Lage und Breite der Klassen und ob gleich breite Klassen oder gleich wahrscheinliche Klassen vorliegen aber nicht.

    Danke für jeden Hinweis

    Grüße

    Martin

    Barbara
    Senior Moderator
    Beitragsanzahl: 2766

    Hallo Martin,

    nur kurz vorab als Hinweis: Der Chi²-Anpassungstest ist so ziemlich der schlechteste aller möglichen Tests, wenn es um die Qualität von Verteilungstests geht. Er sollte deshalb niemals für die Prüfung auf Verteilung eingesetzt werden.

    Eine Möglichkeit, die Daten zu klassieren, stammt von Moore [1]. Eine kurze Beschreibung dieses Verfahrens findest Du auch in Groß [2], S. 107ff.

    Dazu wird zuerst die Anzahl Klassen k berechnet:
    k* = 2n^(2/5)
    n: Anzahl Messwerte

    Die Anzahl Klassen k ist die nächstgrößere ganze Zahl von k*, also z. B. bei n=100
    k*= 2*100^(2/5) = 12,6
    und damit k=13.

    Die Klassengrenzen berechnen sich aus den Quantilen der Normalverteilung mit Mittelwert und Standardabweichung der zu prüfenden Messdaten.
    erste Klasse: (-unendlic;q1]
    zweite Klasse: (q1;q2]

    vorletzte Klasse: (q(k-2);q(k-1)]
    letzte Klasse: (q(k);+unendlich)
    mit
    q(j): (j/k)-tes Quantil der Normalverteilung mit Mittelwert und Standardabweichung der Messdaten
    runde Klammer ( oder ): Wert gehört zum Intervall
    eckige Klammer ]: Wert gehört nicht zum Intervall

    Nehmen wir an, dass Mittelwert xquer=30 und Standardabweichung S=5 für unsere 100 Messwerte mit k=13 Klassen ist.

    Die erste Klasse beginnt bei -unendlich und endet bei
    q1 = NV-Quantil(1/k,xquer,S) = NV-Quantil(1/13,30,5) = 22,8696
    q2 = NV-Quantil(2/k,xquer,S) = NV-Quantil(2/13,30,5) = 24,8996

    q11 = NV-Quantil(11/k,xquer,S) = NV-Quantil(11/13,30,5) = 35,1004
    q12 = NV-Quantil(12/k,xquer,S) = NV-Quantil(12/13,30,5) = 37,1304

    Dann wird gezählt, wie viele Werte in den Intervallen liegen und mit dem Chi²-Test ausgerechnet, ob die erwarteten Anzahlen und die beobachten Häufigkeiten gut genug übereinstimmen.

    Werden die Klassen wie oben beschrieben ermittelt, sind theoretisch gleich viele Werte in jeder Klasse:
    erwartete Anzahl Werte = n/k
    Im Beispiel:
    n/k = 100/13 = 7,69 Werte
    Die erwartete Anzahl Werte ist also selten eine ganze Zahl, wird aber dennoch so verwendet.

    Ich hoffe das hilft Dir, die Werte aus der Statistik-Software nachzuvollziehen. (Darf ich noch kurz anmerkent, dass eine gute Statistik-Software auch die verwendeten Methoden so dokumentiert, dass sie nachgerechnet werden können? Aber das ist ein anderes Thema.)

    Viele Grüße

    Barbara

    [1] Moore, D. S.: „Tests of the chi-squared type.“ In: D’Agostino, R. B. ; Stephens, M. ; Dagostino, Dagostino: Goodness-of-Fit Techniques. New York: Dekker, 1986. -ISBN 978-0-824-77487-5. S. 1-560
    [2] Groß, J.: „A normal distribution course.“ Frankfurt: Peter Lang, 2004. -ISBN 978-0820473482. S. 1-221

    _____________________________________

    Eine gute wissenschaftliche Theorie sollte einer Bardame erklärbar sein.
    (Ernest Rutherford, Physiker)

    MartinS
    Mitglied
    Beitragsanzahl: 3

    Hallo Barbara,

    vielen Dank für Deine (wie gewohnt) sehr ausführliche Antwort.

    Leider scheint meine Referenz (es handelt sich übrigens um QS-STAT) anders zu klassieren.

    Bei N=100 Datenwerten werden wohl 8 Klassen gebildet. Davon gehe ich aus, weil die CHI-Testschranken mit 5 Freiheitsgraden berechnet werden (Anzahl Klasssen – Anzahl unbekannte Parameter (hier NV = 2) -1)

    Leider wird explizit der CHI² Anpassungstest und auch eine Übereinstimmung mit QS-Stat gefordert…

    Dann werde ich mich weiter der Literaturrecherche hingeben und hoffentlich das implemntierte Verfahren finden…

    Grüße

    Martin

    Barbara
    Senior Moderator
    Beitragsanzahl: 2766

    Hallo Martin,

    ach so. Die Beschreibung zu den qs-stat-Verfahren findest Du in deren Handbuch:

    Dietrich, Edgar ; Schulze, Alfred: Statistische Verfahren 6. Aufl.. 6. aktualisierte Auflage. München, Wien: Hanser Verlag, 2009. -ISBN 978-3-446-41525-6. S. 1-722

    Der Chi²-Test wird auf Seite 196 beschrieben. Dort steht nur leider auch nichts zur Ermittlung von k, allerdings findet sich da der Hinweis, dass Randklassen so zusammengefasst werden, dass
    a) alle Erwartungswerte >1 sind
    b) max. 20% der Erwartungswerte <5 sein dürfen

    Die Klassierung ist also vermutlich äquidistant (gleich große Klassen), sonst wären die Erwartungswerte nach der oben beschriebenen Methode alle gleich groß.

    Auf Seite 79 in dem Buch steht etwas zur Klassenwahl bei Histogrammen. U. a. gibt es die Angabe, dass nach CNOMO-Norm k als nächsthöhere Ganzzahl von
    k* = 1 + 10*log(n)/3
    verwendet werden soll (passt hier nicht, denn da wäre k*=16.4, also k=17). Alternativ wird noch ein Wert zwischen der zweiten und dritten Wurzel (DIN 55302) als Klassenanzahl beschrieben:
    100^(1/2) = 10
    100^(1/3) = 4,6
    mit der Forderung, dass zwischen 50-100 Werten mind. 10 Klassen, zwischen 100-1000 mind. 13 Klassen verwendet werden sollen.

    Viel Spaß beim Basteln ;)

    Barbara

    _____________________________________

    Eine gute wissenschaftliche Theorie sollte einer Bardame erklärbar sein.
    (Ernest Rutherford, Physiker)

Ansicht von 4 Beiträgen – 1 bis 4 (von insgesamt 4)
  • Sie müssen angemeldet sein, um auf dieses Thema antworten zu können.
Nach oben