kualitatif

Transkript

kualitatif
KULLANIM ALANLARI
İSTATİSTİKSEL
ÖNEMLİLİK TESTLERİ
İstatistiksel önemlilik testleri çeşitli durumlarda ve
farklı amaçlarla uygulanır. Bu testlerin başlıca
kullanım alanları şunlardır:
1. Evrenden seçilen tek örneklemden elde
edilen
veriler
yardımıyla,
evren
parametresinin belli bir değere eşit olup
olmadığının test edilmesinde.
2. Evrenden seçilen iki ya da daha fazla grup
arasındaki farkın önemli olup olmadığının test
edilmesinde.
KAPSAM
Örneklemden elde edilen sonuçların tesadüfe
bağlı olup olmadığını (önemli olup olmadığını)
belirlemek amacıyla uygulanan testlerdir.
Burada ifade edilen önemlilik (significancy)
elde edilen sonuçların tesadüfe bağlı olmadığını,
yani istatistiksel açıdan anlamlı olduğunu ifade
eder
2. Aynı grupta farklı koşullar altında elde edilen veriler
arasındaki farkın
edilmesinde.
önemli
olup
olmadığının
test
3. Bir örnek gruptan elde edilen dağılışın belli bir teorik
dağılışa uygun olup olmadığının test edilmesinde
n
Yukarda belirtilen amaçlarla uygulanan çok sayıda
önemlilik testi vardır.
n
Önemlilik testlerinin uygulanmasında en önemli adım,
uygulanacak testin doğru seçilmesidir.
n
Uygun testin seçiminde göz önünde bulundurulması
gereken çeşitli faktörler vardır.
Önemlilik Testinin Seçimini
Etkileyen Faktörler
Testin Sonucunu Etkileyen Faktörler
1. Hipotezler
Her önemlilik testinde, testin sonunda varılacak kararla ilgili
hipotezler belirlenir. Bu nedenle, önemlilik testlerin hipotez testleri adı
da verilir. Her testte birbirinin zıddı hükümler içeren iki hipotez
kurulur.
1. Verinin karakteri
Ölçümle ve sayımla belirtilen veriler farklı dağılış
özellikleri gösterirler. Ölçümle belirtilen veriler sürekli,
sayımla belirtilen veriler ise kesikli dağılış özelliğine
sahiptir. Bu nedenle, genel olarak ölçümle ve sayımla
belirtilen verilerde farklı testler kullanılır.
2. Grup sayısı
Test edilecek veriler; bir, iki veya ikiden fazla gruba
ayrılmış olabilir. Grup sayısının ikiden fazla olması, çoklu
karşılaştırma olarak kabul edilir. Grup sayısı uygulanacak
testin seçimini etkiler. Örneğin bazı testler sadece iki
grubu karşılaştırabilirken, bazıları ikiden fazla grubun
karşılaştırılmasına izin verir.
Temel hipotez H0 hipotezi olup, farksızlık hipotezi veya sıfır
hipotezi adı verilir. Bu hipotez, örneklemden elde edilen sonuçların
tesadüfe bağlı olduğunu ve istatistiksel açıdan önemli olmadığını
ifade eder
İkinci hipotez ise H1 (HA) hipotezi olup, alternatif hipotez adını alır.
Bu hipotez örneklemden elde edilen sonuçların tesadüfe bağlı
olmadığını, yani istatistiksel açıdan önemli olduğunu ifade eder.
2. Yanılma düzeyi
Test sonucunda H0 hipotezi kabul veya ret edilir. Ancak, her iki
durumda da kararın doğru olması kesin değildir.
Bu nedenle, karar verilirken düşülebilecek hataya bir üst sınır koymak
gerekir.
HİPOTEZ TESTLERİ
Grupların bağımlı veya bağımsız olması durumunda
uygulanacak önemlilik testleri birbirinden farklıdır.
Veriler nicel
ise;
Veriler nitel
ise;
ORTALAMALAR TESTİ
n ≥ 30
KİKARE TESTİ
n < 30
Parametrik testler
Tek değişkenli
ONE SAMPLE T-TEST
(TEK ÖRNEKLEM TESTİ)
Değişken sayısına bakılır
3. Örneklem büyüklüğü (veri sayısı)
Gruplardaki veri sayısı hem uygulanacak testin seçimini
hem de elde edilen test sonucunun güvenirliğini etkiler.
Bazı testlerin uygulanabilmesi için gruplarda belli sayıda
veri bulunması gerekir.
4. Grupların bağımsızlığı
Grupların ayrı ayrı bireylerden oluşması ve bir deneğin
seçiminin diğeri ile bağlantılı olmaması durumunda
gruplar bağımsızdır.
Aynı bireyler üzerinde gözlemlerin tekrarlanması ya da
bireylerin tek tek birbirinin eşi olarak seçildiği
durumlarda ise gruplar bağımlıdır.
İki değişkenli
Değişkenler BAĞIMSIZ
INDEPENDENT SAMPLES T-TEST
(BAĞIMSIZLIK T-TESTİ)
Değişkenler BAĞIMLI
PAIRED SAMPLES T-TEST
(EŞLEŞTİRİLMİŞ T-TESTİ)
İkiden fazla değişkenli + Değişkenler BAĞIMSIZ
ANOVA TESTİ
(VARYANS ANALİZİ)
Parametrik olmayan testler
Tek değişkenli
Kolmogrov-Smirnov testi
İki değişkenli
Bağımsız
Mann-Whitney U testi
Bağımlı
Wilcoxon testi
İkiden fazla değişkenli
Bağımsız
Kruskal Wallis testi
Bağımlı
Friedman testi
Parametrik Testler
Nonparametrik testler
Parametrik Metotlar
Evren ortalamasının
önemlilik testi
İşaret testi
Unpaired t testi
Mann Whitney U testi
Paired t testi
Wilcoxon T testi
Tek yönlü varyans
analizi
Kruskal Wallis
varyans analizi
Kitle dağılımının doğası hakkındaki varsayımlara dayanan
Çıkarımlar Genellikle: Kitle normaldir
Test Çeşitleri
n
İki popülasyonun ortalamalarının veya oranlarının
karşılaştırılması
Popülasyonun ortalamasının veya oranının test değeri
n
Evren oranının
önemlilik testi
İki yüzde arasındaki
farkın önemlilik testi
n
n
n
n
ANOVA
Birkaç popülasyonun ortalamalarının eşitliğini test etme
Ki kare
testleri
Parametrik test varsayımları
n
z-testi veya t-testi
Evrenin normal dağılıma uyması
Varyansların homojen olması
Deneklerin evreden rasgele seçilmiş olması
Deneklerin birbirinden bağımsız olması
Denek sayılarının yeterli olması
Parametrik Olmayan Testler
Popülasyon dağılımı hakkında hiçbir varsayın yapmayan
Dağılımsız Testler
Test Çeşitleri
n işaret Testleri
İşaret Testi: Eşleştirilmiş Gözlemlerin Karşılaştırılması
n
n
n
McNemar Testi: Kantitatif Değişkenlerin Karşılaştırılması
Cox ve Stuart Testi: Trendi Belirleme
Dizilim testleri
n
n
Dizilim Testi: Rastsallığı Belirleme
Wald-Wolfowitz Testi: İki Dağılımı Karşılaştırma
Parametrik Olmayan Testler
Sıra Testleri
n
n
Mann-Whitney U Testi: İki popülasyonu karşılaştırma
Wilcoxon İşaretli Sıra Testi: Eşleştirilmiş Karşılaştırmalar
Birkaç popülasyonu karşılaştırma: Sıralı ANOVA
n
n
Kruskal-Wallis Testi
Friedman Testi: Tekrarlanan Ölçümler
Spearman Sıra Korelasyon Katsayısı: Ki-Kare Testleri
n
n
n
Uyum İyiliği
Bağımsızlık Testi: Olasılık Tablosu Analizi
Oranların Eşitliği
Parametrik Olmayan Testler
n
n
n
Sıralı (frekans sayımları) veriler ile çalışır.
Aritmetik ortalama veya Standard sapma
gibi belirli popülasyon parametreleri ile
çalışmaz.
Belirli popülasyon dağılımları (özelde,
normallik varsayımı) hakkında varsayımlar
gerektirmez.
İşaret testi
Bir örneklemde nicel veriler elde
edilmiş, fakat veriler parametrik
varsayımları yerine getirmiyorsa,
evren ortancasının belli bir değere
eşit olup olmadığını test etmek
amacıyla işaret testi kullanılabilir.
Yapılışı
Örnek
Evren ortancası 7’den farklı mıdır
Hazırlık İşlemleri
Dağılımdaki bütün veriler tek tek evren
ortancası ile karsılaştırılır. Evren
ortancasından büyük olanlar (+), küçük
olanlar (-) olarak işaretlenir. Evren
ortancasına eşit skorlar değerlendirmeden
çıkarılır.
2. (+) ve (-) işaretler sayılır. Az olan işaret
sayısı k değeri olarak alınır
1.
Veri sayısı 25 veya daha az ise;
n ve k değerlerine karşılık gelen P değeri İşaret testi
tablosundan bulunur
nBulunan
n = 11
k = 3 P = 0.113
nP
nP
≤ α ise, H0 ret
> α ise, H0 kabul
0.113 > 0.05 olduğu için, H0 kabul edilir.
Veri sayısı 25’ten fazla ise;
Bulunan k değeri z değerine dönüştürülür
Bu z değerine karşılık gelen yanılma olasılığı
(P değeri) z tablosundan bulunur.
P değeri aynı şekilde α değeri ile karsılaştırılır.
işaret Testi
Eşleştirilmiş Gözlemlerin Karşılaştırılması X ve Y
p = P(X/Y)
• iki-kuyruklu (uçlu) test
n
+
k
= 11
=3
=8
=3
Test Hipotezi
H0: Ortanca = 7
H1: Ortanca ≠7
α = 0.05
H0: p = 0.50
H1:p≠0.50
• Sağ kuyruk(uç) testi
H0:p≤0.50
H1:p>0.50
• Sol kuyruk(uç) testi
H0:p≥0.50
H1:p< 0.50
• Test İstatistiği: k = + işaretlerinin sayısı
Örnek
CEO
n Önce Sonra S/Ö* İşaret
1
3
4
1
+
2
5
5
0
3
2
3
1
+
4
2
4
1
+
5
4
4
0
6
2
3
1
+
7
1
2
1
+
8
5
4
-1
9
4
5
1
+
10
5
4
-1
11
3
4
1
+
12
2
5
1
+
13
2
5
1
+
14
2
3
1
+
15
1
2
1
+
16
3
2
-1
17
4
5
1
+
Dizilim Testi
Binomial Test
Gruplar
N
Observed
Prop.
H0
P-degeri
+
1.00
12
Örnek
-1.00
3
.80
.20
Total
15
1.00
.50
.035
n=15
- =3
+ =12
k =12
H0:p = 0.5
H0:p ≠ 0.5
Test İstatistiği:
k= 12 için p-değeri = 0.035<α = 0.05
olduğundan sıfır hipotezi reddedilir.
Tablo 8:
Dizilim Sayısı (r)
(n1, n2)
11 12
13
14
15
16
17
18
19
20
…
…
(10,10)
0.586 0.758 0.872 0.949 0.981 0.996 0.999 1.000 1.000 1.000
Durum 1: n1 =10 n2 = 10 R = 20 p-değeri≈0
Durum 2: n1 =10 n2=10 R = 2 p-değeri ≈ 0
Durum 3: n1 =10 n2=10 R = 12
3. Durum için: p-değeri =2[P(R≥12)] = 2[1-R(11)]
= (2)(1-0.586) = (2)(0.414) = 0.828
H0 reddedilmez: Gözlemler rastlantısal olarak oluşturulmuştur
* sonra/önce> 1 ise değer 1
sonra/önce< 1 ise değer -1
Dizilim Testi:
Rastsallık İçin Bir Test
Dizilim farklı elemanlar tarafından takip edilen veya kendinden önce
farklı elemanlar bulunan ya da kendinden önce veya sonra hiçbir
eleman bulunmayan benzer elemanların oluşturduğu bir sıradır.
Büyük Örnek Dizilim Testi:
Normal Yakınsamanın Kullanımı
Dizilim sayıları normal dağılımı ortalaması:
Durum 1: S|E|S|E|S|E|S|E|S|E|S|E|S|E|S|E|S|E|S|E : R = 20 Açıkça Rastsal Değil
Durum 2: SSSSSSSSSS|EEEEEEEEEE
: R = 2 Açıkça Rastsal Değil
Durum 3: S|EE|SS|EEE|S|E|SS|E|S|EE|SSS|E
: R = 12 Belki Rastsal
Rastsallık için iki uçlu hipotez testi:
n H0: Gözlemler rastlantısal olarak oluşturulmuştur.
n H1: Gözlemler rastlantısal olarak oluşturulmamıştır.
Test İstatistiği:
R=Dizilim Sayısı Eğer Tablo 8’de verildiği şekilde. R ≤ C1 veya R ≥ C2 ise
toplam kuyruk(uç) olasılığı
P(R ≤ C1) + P(R ≥ C2) = α olmak üzere, H0'ı α. derecede reddedilir.
Standart Sapma:
Standart Normal Test istatistiği:
H0: Gözlemler rastlantısal olarak oluşturulmuştur.
H1: Gözlemler rastlantısal olarak oluşturulmamıştır.
Satış
35
44
39
48
60
75
49
66
17
23
13
24
33
21
18
16
32
Satış
Satışlar
Memuru (Sıralı)
A
13
A
16
A
17
A
21
A
24
A
29
A
32
A
33
B
35
B
39
B
44
B
48
B
49
B
50
B
60
B
66
B
75
Satış
Memuru
(Sıralı) Dizilim
B
B
B
B
B
1
A
2
B
B
3
A
A
A
A
A
A
A
A
A
4
n1 = 10 n2 = 9 R=4
p-değeri = 2[1-P(R ≤ 4)] = 0.998>α
H0 reddedilebilir : iki popülasyon
farklı dağılımlara sahiptir
Tablo
Dizilim Sayısı (r)
(n1,n2)
2
3
4
5
••
(9,10) 0.000 0.000 0.002 0.004...
Not: tablo R’ye kadar toplam alanı
veriyor
p-değeri = 2[1-P(z ≤-3.47)]
p-değeri ≤ α ise H0 ret
Wald-Wolfowitz (Runs) Testi
iki Popülasyonun Dağılımlarını (Ortalamalarını)
Karşılaştırmak için Dizilim Testinin Kullanılması:
Test için hipotezler:
n H0: iki popülasyon aynı dağılıma sahiptir.
n H1: iki popülasyon farklı dağılımlara sahiptir.
Test istatistiği:
R = Her iki örnekteki veriler tasnif edildiğinde,
Örnekler serisindeki Dizilim Sayısı
Satış Memuru A:
Satış Memuru B:
35 44 39 50 48 29 60 75 49 66
17 23 13 24 33 21 18 16 32
Dizilim Testleri
n
n
n
Mann-Whitney U Testi: iki Popülasyonun Karşılaştırılması
Wilcoxon Sıralı işaret Testi: Eşleştirilmiş Karşılaştırmalar
Birkaç Popülasyonun Karşılaştırılması: Sıralı ANOVA
n Kruskal-Wallis Testi
n Friedman Testi: Tekrarlanan Ölçümler
Mann Whitney U testi
İki bağımsız grupta nicel veriler elde
edilmişse ve veriler parametrik
varsayımları yerine getirmiyorsa, gruplar
bu testle karsılaştırılabilir.
Yapılışı
n Gruplar arasındaki fark istatistiksel açıdan
önemli midir?
n
Hazırlık işlemleri
Her iki gruptaki veriler tek dağılış gibi ele
alınarak, küçükten büyüğe doğru sıralanır
ve 1’den itibaren numaralandırılır.
2. Eşit değerlerin her birine, olması gereken
sıra numaralarının ortalaması verilir.
1.
3. Her iki gruptaki verilerin sıra numaraları toplanarak,
R1 ve R2 değerleri bulunur.
R1 = 65.5
R2 = 124.5
R1 + R2 = n (n + 1) / 2= 65.5 + 124.5 = 19 X20 /2 = 190
4. U değerleri hesaplanır.
n1(n1 + 1)
U1 = n1 n2 +
2
– R1
U1 = 90 + 90 /2 – 65.5 = 69.5
U2 = n1 n2 - U1 = 90 - 69.5 = 20.5
Test hipotezi:
H0 : Gruplar arasındaki fark önemli değildir.
H1: Gruplar arasındaki fark önemlidir.
α = 0.05
1. n1 ≤ 20 ve n2≤ 20 ise;
U1 ve U2 değerlerinden büyük olanı UH değeri olarak
kabul edilir. Bu değer, U tablosundan bulunan değerle
(UT) karsılaştırılır.
Karsılaştırma
UH ≥UT ise; H0 ret (P ≤ α)
UH < UT ise; H0 kabul (P > α)
69.5 > 66
önemlidir
H0 ret, P < 0.05 : Gruplar arasındaki fark
2. n1> 20 ve/veya n2 >20 ise;
Hesaplanan U1 veya U2 değeri z değerine
dönüştürülür. Hesaplanan z değerine
karşılık gelen yanılma olasılığı (P değeri) z
tablosundan bulunur. Bu P değeri α
değeri ile karsılaştırılır
Mann-Whitney U Testi
(İki Popülasyonun Karşılaştırılması)
Test hipotezleri:
n H0: Popülasyonların dağılımı benzerdir
n H1: iki popülasyonun dağılımları benzer değildir.
Mann-Whitney U istatistiği:
n1 popülasyon 1'in örneklem büyüklüğü ve n2 popülasyon 2'nin örneklem
büyüklüğüdür.
Mann-Whitney U Testi
Model
A
A
A
A
A
A
B
B
B
B
B
B
Zaman
35
38
40
42
41
36
29
27
30
33
39
37
Sıra
Sıra Toplamı
5
8
10
12
11
6
52
2
1
3
4
9
7
26
Mann-Whitney U istatistiğinin Kümülatif
Dağılım fonksiyonu:
n2=6
n1=6
u
.
.
4 0.0130 < α=0.05 H0 ret
5 0.0200
6 0.0325
Puan
Sıra
Sıra Toplamı
2
3
Puan
57
2
4
59
2
5
60
1
6
60
2
7
62
1
8
62
2
9
65
2
10
69
2
11
70
2
12
72
1
13
72
2
14
73
1
15
74
2
16
75
1
17
80
2
18
85
1
19
87
1
20
88
1
21
88
1
22
88
2
23
89
1
24
90
1
25
92
1
26
93
1
27
93
2
28
96
1
29
98
1
30
1
20.0
20.0
65
2 10.0
10.0
87
1
21.0
41.0
57
2
4.0
14.0
92
1
27.0
69.0
74
2 16.0
30.0
98
1
30.0
98.0
43
2
2.0
32.0
90
1
26.0
124.0
39
2
1.0
33.0
147.0
2
50
85
23.0
1
2
Sıra
Toplamı
Pro.
1
2
43
Puan
Pro. Sıra
Puan
88
39
88
2 23.0
56.0
75
1
17.0
164.0
62
2
8,5
64.5
72
1
13,5
177.5
69
2 11.0
75.5
60
1
6,5
184.0
70
2 12.0
87.5
93
1
28.0
212.0
72
2 13,5
101.0
88
1
23.0
235.0
59
2
5.0
106.0
89
1
25.0
260.0
60
2
6,5
112.5
96
1
29.0
289.0
80
2 18.0
130.5
73
1
15.0
304.0
93
2 19.0
149.5
62
1
8,5
312.5
50
2
152.5
3.0
Wilcoxon T Testi
6,5
8,5
13,5
21,5
İki eş grupta nicel veriler elde edilmiş ve veriler
parametrik varsayımları yerine getirmiyorsa, bu test
kullanılabilir.
Hazırlık İşlemleri
n Verileri bağımsız hale getirebilmek için, eş verilerin
farkları alınır.
n Fark değerler, işaretleri göz önünde bulundurulmadan,
küçükten büyüğe doğru sıralanır ve 1’den itibaren
numaralandırılır.
n Eşit değerler varsa, bunların her birine olması gereken
sıra numaralarının ortalaması verilir.
n
27,5
Mann-Whitney U Testi
Test istatistiği
z = -3.32 olduğundan
p-değeri ≈0.0005<α, ve H0 reddedilir
Wilcoxon T Testi
Fark kolonunda sıfır varsa;
1. Bir tane sıfır varsa, bu veri değerlendirmeden çıkarılır,
veri sayısı 1 azaltılır.
2. Çift sayıda sıfır varsa, sıralamaya sıfırlardan başlanır,
bunların yarısı eksi, yarısı artı kabul edilir
3. Tek sayıda sıfır varsa, bir tanesi değerlendirmeden
çıkarılır, veri sayısı 1 azaltılır, isleme ikinci maddedeki
gibi devam edilir.
Daha sonra sıra numaralarının işaretleri verilir
Sıra
no
1.5
1.5
4
6.5
4
6.5
4
Artı ve eksi işaretli sıra numaraları toplanarak, T1 ve
T2 değerleri bulunur.
T1 : 20
T2: 8
T1 + T2 = n (n+1) / 2
20 + 8 = 7 x 8 / 2 = 28
Test hipotezi:
H0 : İki grup arasındaki fark önemli değildir.
H1: İki grup arasındaki fark önemlidir.
α = 0.05
1. n < 25 ise;
n T1 ve T2 değerlerinden küçük olanı TH
değeri olarak alınır. Bu değer α yanılma
düzeyinde Wilcoxon T tablosundan elde
edilen değerle (TT) karsılaştırılır.
n TH ≤ TT ise; H0 ret, P ≤ α
n TH > TT ise; H0 kabul, P> α
TH=8 > TT=2 H0 kabul, P > 0.05
2. n > 25 ise;
T1 veya T2 değeri z değerine dönüştürülür.
Hesaplanan z değerine karşılık gelen yanılma
olasılığı (P değeri) z tablosundan bulunur.
Bu P değeri α değeri ile karsılaştırılır.
Wilcoxon T Testi
Büyük örnekler için (n>25)
Test hipotezleri;
n H0: İki grup arasındaki farkı sıfırdır
n H1: İki grup arasındaki fark sıfır değildir.
Kruskal Wallis Varyans Analizi
İkiden fazla bağımsız grupta nicel veriler elde edilmiş ve
veriler parametrik varsayımları yerine getirmiyorsa,
grupları birbirleriyle ayni anda karsılaştırmak amacıyla
bu test kullanılabilir
Hazırlık İşlemleri
n Bütün gruplardaki veriler, tek dağilim gibi ele alınarak,
küçükten büyüğe doğru sıralanır ve 1’den itibaren
numaralandırılır.
Her gruptaki sıra numaraları toplanarak, Ti (T1, T2,......Tk)
değerleri bulunur.
n Kruskal Wallis değeri (KW=H) hesaplanır
A
D =x1 –x2
Toplam: 163.5 161.5
KW = 7.36
Sıra
B Sıra
C Sıra
120
1
140
9.5
140
9.5
130
4
130
4
135
7
125
2
145
11
160
13
135
7
150
12
175
14
130
4
135
7
Ti
18
43.5
43.5
Test İşlemleri
H0 : Gruplar arasındaki fark önemli değildir.
H1: En az bir grup diğerlerinden farklıdır.
α = 0.05
1. k = 3 ve 3 ≤ni ≤ 5 ise;
Hesaplanan KW değerine karşılık gelen P değeri
Kruskal Wallis tablosundan bulunur. Bu değer
α değeri ile karsılaştırılır
KW= 7.36
5.666
P = 0.049 < 0.05, H0 ret
Yazılım Süre
Toplamı
1
45
1
38
1
56
1
60
1
47
1
65
2
30
2
40
2
28
2
44
2
25
2
42
3
22
3
19
3
15
3
31
3
27
3
17
Sıra
Grup Sıra
14
10
16
17
15
18
8
11
7
13
5
12
4
3
1
9
6
2
1
2
3
90
56
25
ileri Analizler
2. k>3 ve/veya ni>5 ise;
Hesaplanan KW değeri Ki Kare değeri
olarak kabul edilir. Bu değer belirlenen
yanılma düzeyinde ve k-1 serbestlik
derecesinde ki kare tablosundan bulunan
değerle karsılaştırılır.
(Ortalama Sıraların Çiftli Karşılaştırmaları)
n
Eğer Kruskal-Wallis testindeki sıfır hipotezi reddedilirse,
bu durumda, hangilerinin farklı hangilerinin aynı
olduğunu anlamak için her popülasyon çiftini
karşılaştırmamız gerekir.
Çiftli Karşılaştırmalar:
10 kişiye 3 sanatçıyı 0-10 arasında puan vererek değerlendirmesi istenmiş.
Soru: değerlendirenlere göre sanatçıların performansı arasında fark var mıdır?
n=bütün gruptaki
veri sayılarının
toplamı
k: grup sayısı
H0 ret, 1. ve 3.
grup arasında
belirgin bir fark
vardır
H0 : Gruplar arasındaki fark önemli değildir.
H1: En az bir grup diğerlerinden farklıdır.
H0: 3 grup benzer performansa sahiptir.
H1: 3 grup benzer performansa sahip
değildir.
Friedman Testi
(Kruskal-Wallis testine benzer)
Friedman testi rastsal bölüntü planı ANOVA’nın
parametrik olmayan bir versiyonudur. Bazen plan, her
hücrede bir veri kullanılan iki-yollu ANOVA olarak da
ifade edilir çünkü bölüntüleri bir faktör ve işleyiş
düzeylerini diğer bir faktör olarak görmek mümkündür.
Test sıralamalara dayanır.
n Test hipotezi:
n H0: k sayıda popülasyonun dağılımı benzerdir
n H1: Bütün k dağılımları benzer değildir
Friedman test istatistiği:
n ki-kare dağılımı için serbestlik dereceleri (k -1) dir.
n
SSbg(R), between-groups sum of squared deviates
9.95 için p=0.01 <α=0.05 H0 ret. Sanatçıların
performansları arasında belirgin bir fark olduğu
söylene bilir
Spearman Sıra Korelasyon Katsayısı
p=0.0077 <a=0.05 H0 ret.
Ki-kare (χ2) Testi
k Oranları için
Spearman Sıra Korelasyon Katsayısı
Spearman Sıra Korelasyon Katsayısı orijinal değerlerinden sıralamalara
çevrilen değişkenlerden hesaplanan korelasyon katsayısıdır.
1. Oranların sadece eşitliklerini test eder.
n
Örnek: p1 = 0.2, p2=0.3, p3 = 0.5
2. Bir kaç seviyeli bir değişken
3. Varsayımlar
n
Multinomial Deney
l
Beklenen sayı ≥ 5
4. Bir yönlü olasılık tablosunu kullanmakta
rs>rt : hipotez değeri tablo değerinden büyükse H0 ret
Tek yönlü olasılık
tablosu
Multinomial Deneyler
1.
2.
3.
4.
5.
6.
n sayıda benzer deneme
Her bir denemede k sayıda sonuç
Sabit sonuç oranları, pk
Bağımsız denemeler
Random değişken sayıdır, nk
Örnek; 100 (n) kişiye 3(k) adaydan
hangisine oy vereceklerini sormak
1.
k sayıda bağımsız grup içindeki (sonuçlar veya değişken
seviyeleri) gözlem sayılarını gösterir
Sonuçlar (k = 3)
ADAY
Ali
Veli
35
20
Aycan
45
Toplam
100
Yanıt sayısı
χ2 Testi,k sayıda oran için
Hipotezler ve istatistik
Tek yönlü olasılık
tablosu
1. k sayıda bağımsız grup içindeki
(sonuçlar veya değişken seviyeleri)
gözlem sayılarını gösterir
1. Hipotezler
n
n
H0: p1 = p1,0, p2 = p2,0, ..., pk = pk,0
Ha: pi lar birbirine eşit değildir.
Hipotez
edilen olasılık
χ2 Testi,k sayıda oran için
Hipotezler ve istatistik
Hipotez
edilen olasılık
1. Hipotezler
n
n
H0: p1 = p1,0, p2 = p2,0, ..., pk = pk,0
Ha: pi lar birbirine eşit değildiler
2. Test istatistiği
χ =
2
∑
Gözlemlenen sayı
a f
a f
ni − E ni
E ni
2
Beklenen sayı
χ2 Testi Ana fikri
1. Null hipotezi doğru ise gözlemlenen
sayıyla beklenen sayıyı karşılaştırır.
2. Gözlemlenen sayı ne kadar beklenen
sayıya yaklaşırsa null hipotezinin doğru
olma olasılığı o kadar fazladır
n
Beklenen sayıyla arasındaki farkın karesi
ile ölçülür.
l
χ2 Testi,k sayıda oran için
Hipotezler ve istatistik
Hipotez
edilen olasılık
1. Hipotezler
n
n
H0: p1 = p1,0, p2 = p2,0, ..., pk = pk,0
Ha: pi ler birbirine eşit değildiler
2. Test istatistiği
χ =
2
∑
Gözlemlenen sayı
a f
a f
ni − E ni
E ni
2
Beklenen sayı
3. Serbestlik derecesi, df= k-1
k, veri sayısı
Büyük değerler reddedilir.
Kritik değerin bulunması
Örnek
k = 3, ve α =0,05 için kritik χ2 değeri nedir
Kritik değerin bulunması
Örnek
k = 3, ve α =0,05 için kritik χ2 değeri nedir?
Finding Critical Value
Example
k = 3, ve α =0,05 için kritik x2 değeri nedir?
Eğerni = E(ni),
Red
χ2 = 0.
α = 0.05
H0 reddedilmez
0
χ2 Tablo
df
1
2
0.995
...
0.010
χ2
Üst Kuyruk Alanı
…
0.95 …
0.05
… 0.004 … 3.841
… 0.103 … 5.991
Kritik değerin bulunması
Örnek
k = 3, ve α =0,05 için kritik x2 değeri nedir?
Eğer ni = E(ni),
χ2
Red
=0
α = 0.05
H0 reddedilmez
0
χ2 Tablo
df
1
2
0.995
...
0.010
χ2
Üst kuyruk alanı
…
0.95 …
0.05
… 0.004 … 3.841
… 0.103 … 5.991
df = k - 1 = 2
0
χ2 Tablo
df
1
2
0.995
...
0.010
5.991
χ2
Üst kuyruk alanı
…
0.95 …
0.05
… 0.004 … 3.841
… 0.103 … 5.991
χ2 Testi , k oranları için
Örnek
İnsan kaynakları müdürü olarak, 3 farklı performans
değerlendirme metodunun dürüstlük anlayışını test
etmek istemektedir.
180 tane çalışan arasından, 63 ü 1. Methodu dürüst
olarak; 45 i 2. Methodu dürüst olarak; 72 si ise 3.
Methodu dürüst olarak değerlendirmiştir. 0.05 risk
derecesinde, çalışanların metotların dürüstlük
derecesini algılamada bir farklılık var mıdır?
χ2 Testi , k oranları için
Örnek
H0:
Ha:
α=
n1 =
n2 =
n3 =
Kritik değer(ler):
Test istatistiği:
χ2 Testi , k oranları için
Çözüm
a f
E a n f = E a n f = E a n f = 180a1 3f = 60
n − E an f
χ = ∑
E an f
E ni = npi ,0
1
2
i
2
2
2
n1 − 60
n − 60
n − 60
+ 2
+ 3
60
60
60
2
2
2
63 − 60
45 − 60
72 − 60
=
+
+
= 6.3
60
60
60
=
χ2
χ2 Testi , k oranları için
Çözüm
χ2 Testi , k oranları içn
Örnek
H0: p1 = p2 = p3 = 1/3
Ha: en az biri farklıdır
α = 0.05
n1 = 63 n2 = 45 n3 = 72
Kritik değer(ler):
Test istatistiği:
Karar:
H0: p1 = p2 = p3 = 1/3
Ha: en az biri farklıdır
α = 0.05
n1 = 63 n2 = 45 n3 = 72
Kritik değer(ler):
Red
χ2
α = .05
Sonuç:
0
5.991
Test istatistiği:
χ2 = 6.3
Karar:
Null hipotezi reddedilir, α = .05
Red
α = .05
5.991
i
i
Karar:
Sonuç:
0
3
2
Red
0
2
χ2
Sonuç:
Oranların aynı olduğu
söylenemez.
χ2 Test
χ2 Testi, bağımsız
Bir örnekten müşterek iki kualitatif değişkene ait
gözlem sayısını gösterir
2. değişken derecesi
Ev lokasyonu
Şehir
Kırsal
63
49
15
33
78
82
Ev stili
Apartman
Çiftlik
Toplam
Toplam
112
48
160
1. değişken derecesi
χ2
Testi, bağımsız
1. İki kalitatif değişken arasında bir ilişkinin
mevcut olup olmadığını gösterir
n
n
Bir örnek seçilir
Sebep sonuç ilişkisi göstermez
2. Varsayımlar
n
n
χ2 Testi, bağımsız
Hipotezler & İstatistik
Multinomial deney
tüm sayılar ≥ 5
3. Çift yönlü olasılık tablosu kullanır
1. Hipotezler
n
n
H0: Değişkenler bağımsız
Ha: Değişkenler birbiriyle ilişkili (Bağımlı)
2. Test İstatistiği
χ =∑
2
Gözlenen sayı
[n
]
ˆ (n ) 2
−
E
ij
ij
Eˆ (nij )
2
ij
Beklenen
sayı
Satırlar
Serbestlik derecesi: (r - 1)(c - 1)
Sütunlar
χ2 Testi, bağımsız
beklenen sayılar
χ2 Testi, bağımsız
Örnek
Birleşik olasılık =
1. İstatistiksel olarak bağımsız demek,
birleşik olasılığın marjinal olasılıklarının
çarpımına eşit olduğu anlamına
gelmektedir.
2. Marjinal olasılıklar hesaplanır ve
birleşik olasılık hesabı için çarpılır
3. Beklenen sayı= veri sayısı x birleşik
olasılığa eşittir.
116
286
Hayır
Evet
Toplam
Marjinal
olasılık
a
Satır toplam * Sütün toplam
Veri sayısı
Toplam
116
48
122
170
132
154
286
Beklenen sayı
= 286·
116 132
286 286
=53.5
χ2 Testi, bağımsız
Örnek
Beklenen değer
hesaplaması
değer =
Diet Pepsi
Hayır
Evet
Gözl.
Gözl.
32
84
Diet Kola
132
286
Beklenen
116 132
286 286
f
Pazarlama araştırması yapan bir analistsiniz. Rasgele seçtiğiniz 286
müşteri üzerinde yapacağınız araştırmada, müşterilere diyet pepsi mi
yada diyet kola mı satın aldıklarını soruyorsunuz. α=0.05 risk
derecesinde,ikisi arasında bir ilişki olduğuna dair delil var mıdır?
Diet Kola
Hayır
Evet
Toplam
Diet Pepsi
Evet
Hayır
84
32
48
122
132
154
Toplam
116
170
286
χ2 Testi, bağımsız
Çözüm
H0: ilişki yok
Ha: ilişkili
α = 0.05
df = (2 - 1)(2 - 1) = 1
Kritik değer(ler):
χ2 Testi, bağımsız
Çözüm
χ2 =
nij − E$ nij
E$ n
∑
c h
c h
ij
n11 − E$ n11
=
E$ n
a f
a f
2
11
Red
α = .05
0
3.841
=
84 − 53.5
53.5
E(n ) ≥ 5 tüm
ühücrelerde
ij
Diet Kola
Diet Pepsi
154·132
286
Hayır
Evet
Gözl. Bekl. Gözl. Bekl. Toplam
Hayır
84
53.5
Evet
48
132
Toplam
2
+
n12 − E$ n12
+
E$ n
a f
a f
2
12
32 − 62.5
62.5
2
+L+
n22 − E$ n22
+L+
E$ n
a f
a f
2
22
122 − 91.5
91.5
2
= 54.29
χ2
χ2 Testi, bağımsız
Çözüm
χ2 Testi, bağımsız
Çözüm
116·132
286
2
170·132
286
32
62.5
116
78.5
122 91.5
170
132
154 154
286
170·154
286
H0: ilişki yok
Ha: ilişki var
α = 0.05
df = (2 - 1)(2 - 1) = 1
Kritik değer(ler):
Red
α = .05
Test istatistiği:
χ2 = 54.29
Karar:
Null hipotezi reddedilir
α =0 .05
Sonuç:
Bir ilişki olduğuna
0
3.841
χ2
dair delil var

Benzer belgeler