|
|
|
Analys av data med statistiska metoder
|
|||||||||||||||||||
|
Mål |
|
Målet är att ge förståelse för hur man med enkla statistiska metoder kan få en uppfattning om vilka slutsatser man kan dra utgående från insamlade data. |
|||||||||||||||||||
|
|
|
|
|||||||||||||||||||
|
Användning
"Det vi kallar slumpen är inte och kan inte vara något
annat än den förbisedda orsaken till en känd verkan."
|
|
Här kommer endast metoder för bedömning av mätvärden att
behandlas. Processtyrning och duglighet kommer i senare del av kursen. I
arbetet med ständiga förbättringar är det grundläggande att kunna avgöra om
de mätningar som man gör är relevanta och tillförlitliga. Dessutom är det
väsentligt att kunna avgöra om en uppmätt förändring är verklig eller beror
på slumpen.
|
|||||||||||||||||||
|
Exempel |
|
Exempel på frågor som kan besvaras
|
|||||||||||||||||||
|
Konfidensintervall för variabler
|
|
Konfidensintervall används för att utgående från ett stickprov från en population kunna uppskatta för en parameter inom vilket intervall den kommer att ligga för hela populationen. Exempel: Ett stickprov (sampel) med 4 batterier är uttagna från en stor mängd batterier. Med en viss belastning finner man att medelvärdet av livslängden är 31,0 timmar för de 4 batterierna. Konfidensintervallet anger med vald sannolikhet (konfidensgraden) det intervall inom vilket medelvärdet för den verkliga livslängden ligger. Beräkning se nedan. Konfidensintervall för variabler µ (my) är väntevärde (använd x om inte hela populationen ingår i
underlaget, µ gäller när hänsyn tas till hela populationen, men man ser ofta
att x och µ inte används konsekvent utan blandas samman).
Konfidensgraden anger med vilken säkerhet konfidensintervallet innehåller det sanna värdet på den aktuella parametern. Exempel: Bestäm med 95 % konfidensgrad
konfidensintervallet för batterierna ovan utgående från att sigma är 5
timmar. Om inte sigma är känd utan uppskattad utgående från vårt stickprov måste istället en t-fördelning användas. Samma formel som ovan men z byts mot t. t beror på hur många oberoende observationer som ingår i vårt sampel. t-fördelning tar vi inte upp i den här kursen.
|
|||||||||||||||||||
|
Länk |
|
Fördjupad information om konfidensintervall och t-fördelning
|
|||||||||||||||||||
|
Konfidensintervall för attribut |
|
Konfidensintervall för
proportioner (attribut)
f är relativa frekvensen
|
|||||||||||||||||||
|
|
|
Exempel: Man tar ut 40 maskiner från en stor population och finner att 12 av dem är behäftade med något fel. Inom vilket intervall ligger det sanna värdet på andelen med fel behäftade maskiner? Konfidensgrad 90%.
|
|||||||||||||||||||
|
|
|
|
|||||||||||||||||||
|
Hypotesprövning |
|
Konfidensintervall kan användas för att genomföra hypotesprövning. En vanlig metod är att man antar en nollhypotes dvs att ingen förändring inträffat och provar sedan hypotesen. Exempel: Gjutna isolatorer har haft en styrka på 6,98 Nm (medelvärde). Man
tar 12 isolatorer från tillverkningen och mäter nu upp styrkan till 6,71 Nm
(medelvärde). Är detta ett bevis på att det skett en förändring i styrkan?
Antag nollhypotesen att ingen förändring inträffat
och testa den med konfidensgraden 95%.
Standardavvikelsen (sigma) är given 0,34 Nm. Härav ser vi att 6,71 Nm ligger utanför
intervallet 6,79 - 7,17 Nm. Alltså förkastar vi nollhypotesen.
Förändringen är statistiskt säkerställd på 95%
nivån.
|
|||||||||||||||||||
|
CHI-två metoden |
|
CHI-två (CHI-square) metoden är en metod för att pröva hypoteser när mer komplexa situationer ska analyseras. Utgående från en nollhypotes, kan man förvänta sig ett bestämt mönster i observationerna. Om de faktiska observationerna inte följer detta mönster förkastas hypotesen. Testfunktion och frihetsgrader beräknas enligt följande:
Notera att om man enbart har en rad med observationer beräknas antalet frihetsgrader enligt f = (n-1). n är antalet observationer. nedan används för att avgöra om nollhypotesen ska förkastas eller inte. Värden över de som anges i tabellen medför att nollhypotesen förkastas med en osäkerhet på 5% respektive 1% (signifikansnivå).
Exempel: Ett företag har tre fabriker och vill se om det är någon statistiskt säkerställd skillnad mellan de olika fabrikerna när det gäller hur många arbetsledare som har kvalitetsutbildning.
|
|||||||||||||||||||
|
|
|
|
Med utb |
Utan utb |
Tot |
||||||||||||||||
Fabr 1 |
12 (13) |
14 (13) |
26 |
|||||||||||||||||||
Fabr 2 |
21 (19,5) |
18 (19,5) |
39 |
|||||||||||||||||||
Fabr 3 |
17 (17,5) |
18 (17,5) |
35 |
|||||||||||||||||||
Tot |
50 |
50 |
100 |
|||||||||||||||||||
|
|
|
|
|||||||||||||||||||
|
|
|
Eftersom det totalt är lika många med som utan utbildning förväntar
vi oss denna fördelning också på varje fabrik. Vi sätter upp nollhypotesen att det inte är någon statistiskt
säkerställd skillnad mellan de olika fabrikerna i förhållandet mellan
utbildade och inte utbildade. De värden som hypotesen ger finns inom parentes
i tabellen.
Antalet frihetsgrader är f=(2-1)(3-1)=2 och vi ser för att förkastelsegränsen är 5,99 för f=2 och 5% signifikansnivå. Vi kan alltså inte förkasta vår nollhypotes.
|
|||||||||||||||||||
|
Referens |
|
Juran, Gryna, 1993, Quality Planning and Analysis |
|||||||||||||||||||
|
Övningsuppgift A |
|
|
|||||||||||||||||||
|
Övningsuppgift B |
|
I en stor population av TV-ägare var för ett antal år sedan 30% icke märkestrogna. Efter en intensiv kundcentrerad kvalitetssatsning vill vi nu undersöka om andelen icke märkestrogna har ändrats. Vi tar ett stickprov med 400 individer och testar med 95% konfidensnivå. Inom vilket intervall kan resultatet variera utan att vi säkert kan säga att en förändring inträffat. Dvs vi testar gränserna för en nollhypotes.
|
|||||||||||||||||||
|
Övningsuppgift C |
|
En firma tillverkar dörrar med bredden 60cm. För 10 dörrar mäts bredden till 59.6 59.8 60.0 59.7 59.9 59.6 59.7 59.9 59.5 59.9. Vi antar att materialet är normalfördelat med sigma 0,16cm.. Bestäm med 95% konfidensgrad inom vilket intervall dörrarnas bredd kommer att variera. Jämför ditt resultat med de aktuella bredderna som är angivna i uppgiften. Är ditt resultat rimligt? Var ligger felet?
|
|||||||||||||||||||
|
Övningsuppgift D |
|
För att testa nya typer av handverktyg
på ett företag bestämde man sig för att låta personalen prova 3 typer av
mejslar. Mejslarna var avsedda för samma typ av arbetsuppgifter men hade
olika ergonomiskt utförande. Man såg till att personalen alltid hade samma
tillgång till de tre typerna och noterade hur valen utföll för de första 120
personerna.
|
|||||||||||||||||||
|
Övningsuppgift E |
|
Ett företag vill undersöka om tre olika kundgrupper är lika nöjda med med den personliga servicen eller ej. Om någon grupp är mindre nöjd kommer utbildning att skräddarsys för att förbättra servicen för denna grupp. Det var olika många i varje grupp som framgår av tabellen. |
|||||||||||||||||||
|
|
|
|
|||||||||||||||||||
|
|
|
Hypotesen är att alla kunderna är lika nöjda. Beräkna totala andelen nöjda kunder och använd denna som en jämförelse mot de enskilda grupperna. Hur många frihetsgrader? Testa om avvikelsen är signifikant med CHI-två metoden. Bestäm CHI-två och jämför med tabellen. |
|||||||||||||||||||
|
|
|
|
|||||||||||||||||||
|
Svar |
|
A: 0,168
± 0,046 |
|||||||||||||||||||
|
LSN 2003 |
|
|