QM-Forum › Foren › Qualitätsmanagement › Ausreißer
-
AutorBeiträge
-
Hallo zusammen.
Wie lässt sich bei kleiner Datenmenge ein Ausreißer mathematisch exakt ermittelen?
Dank im Voraus
WH
Hallo Q-Planer,
ein Ausreißer ist immer das, was Du als außerhalb deiner gewünschten Eigenschaften definierst. Somit ist es an dir, ihn entsprechend zu definieren.
Als mathematische Methoden bieten sich zum Beispiel Diskriminanz- oder Clusteranalysen an. Wie groß ist denn dein Datensatz?
Viele Grüße
Qmarc
____
Wie verlassen sind die Wege des geringsten Widerstands?Hallo WH,
Antwort: Gar nicht.
Du kannst mit einem Modell (z. B. einem statistischen Verteilungsmodell wie der Normalverteilung oder Distanzmaßen) mit einer gewissen Wahrscheinlichkeit angeben, ob ein Messwert ein Ausreißer ist oder noch im üblichen Wertebereich liegt.
Nur den Bereich der Wahrscheinlichkeit wirst Du niemals verlassen, jedenfalls nicht mit mathematisch-statistischen Verfahren. Für eine exakte Aussage brauchst Du absolute Grenzen.
Wenn Du z. B. ein Auto gegen eine Wand fahren lässt und die Geschwindigkeit ist -10 km/h beim Aufprall, dann weißt Du sicher, dass das ein sehr merkwürdiger Wert ist.
Wenn Du in einem Prozess ein komisches Ergebnis hast und der Prozess liefert üblicherweise normalverteilte Messwerte, dann gibt es (aus statistischer Sicht) immer noch eine kleine Wahrscheinlichkeit dafür, dass dieser Messwerte doch zu den anderen Messwerten passt.
In dem Beispiel mit dem Auto-Crashtest könnte eine Aufprallgeschwindigkeit von +10 km/h vorgegeben sein. Diese wird mit +/-2,5 km/h Schwan*kung eingehalten; die Geschwindigkeit ist normalverteilt. Die Wahrscheinlichkeit für den Messwert -10 km/h ist dann
6.22096e-16
also ziemlich klein, aber eben nicht Null.Ausreißer bzw. extreme Werte sind übrigens wirklich interessant. Sie geben nämlich deutlich mehr Informationen her als die anderen Messwerte.
Denn irgend etwas muss dazu geführt haben, dass es diesen merkwürdigen Wert gibt. Das kann ein Tippfehler sein, das kann ein Mess-System-Fehler sein, das kann eine Schwan*kung in den Einstellgrößen sein, etc. Die Ursache dafür zu finden hilft den Prozess besser zu verstehen.
Erstes Kriterium bei der Beurteilung von Messwerten ist immer der gesunde Menschenverstand. Da hilft zwar die Statistik weiter, die Entscheidung ob ein Wert ein Ausreißer ist oder nicht, liegt letztendlich bei Dir und Deinem Prozess-Wissen.
Viele Grüße
Barbara
_____________________________________
Fakten hören nicht auf zu existieren, wenn man sie absichtlich übersieht. (Aldous Huxley)
Hallo zusammen,
die Voraussetzung, Fehler und Ausreißer ernstzunehmen ist natürlich wichtig und die Gründe dafür sollte man nach Möglichkeit auch untersuchen bzw. wissen.
Meine Erfahrung ist eher, dass sie aus Unkenntnis, „Unwichtigkeit“ oder schlicht Zeitmangel unter den Tisch fallen. Meist wird erst genauer hingeschaut, wenn sich ein bestimmter Ausreißertyp öfters wiederholt oder teuer wird.
Viele Grüße
Qmarc
Das Crashmodell kann ich so nicht nachvollziehen.
In einem abgeschlossenen System ist da also eine Wand, die da vermutlich mit der Grundgeschwindigkeit V²=0 m/s rumsteht.
Nehme ich diese Wand jetzt als Bezugssystem ist jede Bewegung auf die Wand zu ein positiver Geschwindigkeitsvektor -> v³>0.
In einem solchen System ist ein Geschwindigkeitsvektor mit negativem Vorzeichen jedoch von der Wand weg gerichtet, d.h. ein Aufprall ist aufgrund falscher Richtung nicht möglich.
Sehe ich aber die Geschwindigkeit als skalar an, so hat sie kein Vorzeichen, da keine Richtung sondern nur einen Betrag – und der ist per Definition positiv.
Ergo ist das Auto bei minus 10Km/h „Aufprallgeschwindigkeit“ eigentlich gerade dabei sich von der Wand zu entfernen – und damit bleibt das heilige Blech dann also heil.Wollte ich doch unbedingt noch loswerden, bevor jetzt einer versucht Blech kalt zu verformen.
Gruß
Rossy
> „Der Vorteil der Klugheit besteht darin, dass man sich dumm stellen kann. Das Gegenteil ist schon schwieriger.“
Kurt Tucholsky <OT
Zitat:Wollte ich doch unbedingt noch loswerden, bevor jetzt einer versucht Blech kalt zu verformen.
Wieso? mach ich doch jetzt jeden Tag.. ;-)
—
Wäre es nicht adequat, den Usus heterogener Termini zu minimieren?
(Sollte man nicht weniger Fremdworte verwenden?)
—Hy Loretta,
ja, ist auch mein tägl. Brot.
Ich dachte auch mehr an eine Zusammenfaltprüfung des Fertigprodukts – OK, bei manchen Karren wärs nicht schade, aber da gibts andere, da täte das schon weh.Gruß
Rossy
> „Der Vorteil der Klugheit besteht darin, dass man sich dumm stellen kann. Das Gegenteil ist schon schwieriger.“
Kurt Tucholsky < -
AutorBeiträge
- Sie müssen angemeldet sein, um auf dieses Thema antworten zu können.