Slayt 1 - anadolu üniversitesi eczacılık fakültesi

Transkript

Slayt 1 - anadolu üniversitesi eczacılık fakültesi
Varyans Analizi (ANOVA)
Kruskal-Wallis H Testi
Doç. Dr. Ertuğrul ÇOLAK
Eskişehir Osmangazi Üniversitesi
Tıp Fakültesi
Biyoistatistik Anabilim Dalı
Konu Başlıkları
• Tek Yönlü Varyans Analizi
• SPSS’de Tek Yönlü Varyans Analizi
• Kruskal-Wallis H Testi
• SPSS’de Kruskal-Wallis H Testi
Varyans Analizi
Varyans analizi (ANALYSIS OF VARIANCE), normal
dağılım
gösteren
bağımlı
ya
da
bağımsız
toplumların ortalamalarına ilişkin hipotezlerin test
edilmesinde yararlanılan bir analiz yöntemidir.
Varyans Analizi
Varyans analizi (ANOVA), k gruptan (k>2) elde
edilen veri setinde incelenen değişkene ait olan
genel varyansı (genel değişimin), bu değişime
katkıda bulunan öğelerine ayırarak analiz etmeyi
sağlayan bir yöntemdir.
Varyans Analizi
Varyans analizi veri yapısına bağlı olarak çok değişik
işlevler yerine getiren bir yöntemdir.
Veri yapısına ve çalışma dizaynına göre değişik
modeller içerir.
Bu derste tek yönlü varyans analizi incelenecektir.
Tek Yönlü Varyans Analizi
Bağımsız k>2 gruplu bir çalışma dizaynında,
incelenen bir değişkene ait elde edilen verilerin
analizinde yararlanılan bir yöntemdir.
K bağımsız örneklem varyans analizi olarak
tanımlanabilmektedir.
Bağımsız
örneklerde
t
testinin ikiden fazla grup için genellenmiş bir şekli
diyebiliriz.
Tek Yönlü Varyans Analizi
Tek yönlü varyans analizine ait varsayımlar;
• İncelenen değişken (Y) her bir toplumda normal
dağılım göstermelidir.
• Toplum etkileri toplanabilir olmalı ve etkilerin
toplamı sıfır olmalıdır.
• Grup
ortalamaları
ve
standart
arasında bir doğrusallık olmamalıdır.
sapmaları
Tek Yönlü Varyans Analizi
Birbirinden bağımsız 𝜇1 , 𝜇2 , … , 𝜇𝑘 ortalamalı ve 𝜎 2
varyanslı
normal
dağılım
gösteren
k
tane
toplumdan ni hacimli (i=1,2,…,k) rastgele örnek
alınarak elde edilen veri setini analiz etmek için tek
yönlü varyans analizi kullanılır.
Tek Yönlü Varyans Analizi
Tek yönlü varyans analizinde test edilen hipotezler
aşağıdaki gibidir.
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1 : en az bir grup ortalaması diğerlerinden farklıdır.
Burada toplumlardan alınan örnekler birbirlerinden
bağımsızdır ve örnek birim sayılarının benzer
olması gerekmez.
Tek Yönlü Varyans Analizi
İncelene değişken genel olarak 𝑌𝑖𝑗 olarak gösterilir.
Burada;
i=1,2,…,k ve j=1,2,…, ni olmak üzere
k: grup sayısını
j: birim sayısını
ni: i. grupa ait örnek büyüklüğünü göstermektedir.
Tek Yönlü Varyans Analizi
Buradan yola çıkarak incelenen değişkene ait genel
ortalama,
𝑌=
𝑛𝑖
𝑗=1 𝑌𝑖𝑗
𝑘
𝑖=1
𝑁
,
𝑁=
𝑘
𝑖=1
Burada genel kareler toplamı,
𝐺𝐾𝑇 =
𝑘
𝑛𝑖
𝑖=1
𝑗=1
𝑛𝑖
(𝑌𝑖𝑗 −𝑌)2
Tek Yönlü Varyans Analizi
Genel kareler toplamı gruplar arası kareler toplamı
ve grup içi kareler toplamı olarak parçalanabilir.
GKT=GAKT+GİKT
Grup içi kareler toplamına hata kareler toplamında
denilmektedir.
Tek Yönlü Varyans Analizi
Bu durumda genel kareler toplamı,
𝐺𝐾𝑇 =
=
Burada
𝑘
𝑖=1
𝑘
𝑛𝑖
𝑖=1
𝑗=1
𝑘
𝑛𝑖
𝑖=1
𝑗=1
𝑛𝑖
𝑗=1 𝑌𝑖𝑗
2
denir DT ile gösterilir.
(𝑌𝑖𝑗 )2 −
(𝑌𝑖𝑗 −𝑌)2
𝑘
𝑖=1
𝑛𝑖
𝑗=1 𝑌𝑖𝑗
2
𝑁
𝑁 ifadesine düzeltme terimi
Tek Yönlü Varyans Analizi
Gruplar arası kareler toplamı,
𝑘
𝑖=1
𝐺𝐴𝐾𝑇 =
2
𝑛𝑖
𝑌
𝑗=1 𝑖𝑗
𝑛𝑖
− 𝐷𝑇
Grup içi kareler toplamı,
𝐺İ𝐾𝑇 =
𝑘
𝑛𝑖
𝑖=1
𝑗=1
(𝑌𝑖𝑗 )2 −
𝑘
𝑖=1
2
𝑛𝑖
𝑗=1 𝑌𝑖𝑗
𝑛𝑖
Tek Yönlü Varyans Analizi
Genel serbestlik derecesi (gsd)=N-1
Gruplar arası serbetlik derecesi(gasd)=k-1
Grup içi serbestlik derecesi (hsd)=N-k
N-1=(k-1)+(N-k)
Tek Yönlü Varyans Analizi
Kare toplamları ve bir kare toplamına ait serbestlik
dereceleri kullanılarak varyans tahminleri olan Kare
Ortalamaları hesaplanır.
Gruplar arası kareler ortalaması=GAKT/gasd
Grup içi kareler ortalaması=GİKT/hsd
Grup içi kareler ortalaması aynı zamanda hata kareler
ortalaması
tahmincisidir.
olarak
bilinir
ve
toplum
varyansının
Tek Yönlü Varyans Analizi
Gruplar arasınsaki değişimin önemliliğini test
etmek için F test istatistiği kullanılır.
𝐹=
𝐺𝐴𝐾𝑂
𝐻𝐾𝑂
F test istatistiği iki serbestlik derecesine sahip F dağılımı
gösterir. Bu dağılımın birinci serbestlik derecesi pay
serbestlik derecedir sd1=gasd’dir. İkinci serbestlik derecesi
payda serbestlik derecesidir ve sd2=hsd’dir.
Tek Yönlü Varyans Analizi
Bu durumda hesaplanan F test istatistiği F
dağılımından elde edilen F kritik değerine göre
karşılaştırılır ve
Ftest < F0.05,sd1,sd2 ise p>0.05 olarak hesaplanır. Bu
durumda H0 hipotezi kabul edilir.
Eğer Ftest > F0.05,sd1,sd2 ise p<0.05 olarak hesaplanır.
Bu durumda da H1 hipotezi kabul edilir.
Tek Yönlü Varyans Analizi
Tek yönlü varyans analizi sonuçları aşağıdaki gibi
özet bir tablo halinde sunulur.
Değişim
Kaynağı
Serbestlik
Derecesi
Kareler
Toplamı
Kareler
Ortalaması
F istatistiği
P değeri
Gruplar Arası
k-1
GAKT
GAKO
GAKO/GİKO
P
Grup İçi (Hata)
N-k
GİKT
GİKO
Toplam (Genel)
N-1
GKT
-
Tek Yönlü Varyans Analizi
Tek yönlü varyans analizi sonucuna göre F’in
olasılığı önemli olarak nitelendiriliyor ise yani p
değeri 0.05’den küçük ise grup ortalamalarından en
az bir tanesi diğerlerinden farklıdır hipotezi kabul
edilir.
Bu durumda hangi grup ya da grupların
diğerlerinden farklı olduğu nasıl belirlenir?
Tek Yönlü Varyans Analizi
Farklı
olan
grupların
belirlenmesinde
çoklu
karşılaştırma testlerinden yararlanılır. Çok sayıda
çoklu karşılaştırma testi vardır. Eşit varyans
varsayımının ya da farklı varyans varsayımının
dikkate alınmasına göre ikiye ayrılır.
Tek Yönlü Varyans Analizi
Bu sınıflardaki testler, ortalamaların farklarının
önemliliğini birbirleri işe eşanlı karşılaştırma,
gruplardan birini kontrol grubu alarak diğerleri ile
karşılaştırma,
ağırlıklı
karşılaştırma,
ortalamaları
dizerek
karşılaştırma
katsayılar
gibi
yaklaşımları içeren testlerdir.
kullanarak
büyüklük
farklı
sırasına
karşılaştırma
Tek Yönlü Varyans Analizi
Bu derste ortalamalar arasındaki farkları eşanlı
olarak karşılaştırmayı sağlayan Bonferroni (Dunn),
Tukey HSD, Tamhane T2 ve kontrol grubuna göre
diğer ortalamaları ikili karşılaştırmayı sağlayan
Dunnett çoklu karşılaştırma testleri açıklanacaktır.
Tek Yönlü Varyans Analizi
Bonferroni (Dunn) testi k grup varyanslarının
türdeş olduğu durumlarda k ortalamanın ikili
karşılaştırmalarını ya da ortalamaları gruplayarak
ağırlıklı olarak birbirleri ile karşılaştırmayı sağlayan
bir testtir.
Tek Yönlü Varyans Analizi
Bonferroni testte ikili çiftler için arasındaki
karşılaştırmalar için kullanılan test istatistiği,
𝑡=
𝑌𝑖 − 𝑌𝑙
2𝐻𝐾𝑂
𝑛
şeklindedir. Burada i ve l karşılaştırılacak iki grubu
göstermektedir. 𝑡 istatistiğinin önemliliği Dunn
olasılıklar tablosuna göre belirlenir.
Tek Yönlü Varyans Analizi
Tukey HSD testinde grup ortalamaları büyüklük
sırasına dizilir ve grup ortalamaları arasındaki
farklar (Dil) bulunur. HKO ve ortak birim sayısı n0
belirlenir.
Qα, k, hsd tablo değeri Q kritik değerler tablosundan
belirlenir.
Ortalamalar
arasında
bulunabilecek
müsaade edilebilir fark (Dmax) hesaplanır.
Tek Yönlü Varyans Analizi
1
𝑛0 =
𝑁−
𝑘−1
𝑆𝐻 =
𝑘
𝑖=1 𝑛𝑖
𝑁
𝐻𝐾𝑂
; 𝐷𝑚𝑎𝑥 = 𝑄𝛼,𝑘,ℎ𝑠𝑑 × 𝑆𝐻
𝑛0
Eğer iki grup ortalaması arasındaki fark Dmax
değerinden büyükse bu gruplar birbirlerinden
farklıdır.
Tek Yönlü Varyans Analizi
Dunnett testi, k gruptan biri kontrol grubu alınarak
diğer
deneme
sonuçlarının
kontrole
göre
farklılığının analizde kullanılır. İ normal bir grubu
k’da kontrol grubunu göstermek üzere
𝐷0.05 𝑌𝑘 − 𝑌𝑖 = 𝑄0.05
2𝐻𝐾𝑂
𝑛
Tek Yönlü Varyans Analizi
Kontrol
grubuna
göre
grup
ortalamalarının
önemliliği aşağıdaki gibi belirlenir.
𝑌𝑘 − 𝑌𝑖 < 𝐷0.05
ise p>0.05 olur önemli fark
yoktur.
𝑌𝑘 − 𝑌𝑖 > 𝐷0.05 ise p<0.05 olur önemli fark vardır.
Tek Yönlü Varyans Analizi
Tamhane
T2
testi
ise
grupların
varyansları
heterojen olduğunda kullanılan çoklu karşılaştırma
testidir. Grupların varyansları Levene testi ile
değerlendirildiğinde, varyanslar heterojen çıkarsa
yararlanılır.
Burada
verilmeyecektir.
hesaplama
formülleri
SPSS’de
Tek Yönlü Varyans Analizi
40 yaş grubu sağlıklı kadınlarda dört farklı boy
grubunda FEV1 (litre) değerleri aşağıdaki tabloda
verilmiştir.
Boy grupları arasında FEV1 (litre) değerleri
bakımından farklılık olup olmadığını tek yönlü
varyans analizi ile karşılaştıralım.
SPSS’de
Tek Yönlü Varyans Analizi
Örneğe ait hipotezler aşağıdaki gibi kurulur.
H0: µ1=µ2=µ3=µ4
H1:Ortalamalardan en az biri diğerlerinden farklıdır.
SPSS’de
Tek Yönlü Varyans Analizi
155 cm
2.57
2.49
2.56
2.55
2.35
2.42
2.57
2.48
2.49
2.72
165 cm
2.82
2.78
2.88
2.70
2.91
2.76
2.80
2.86
2.80
2.87
175 cm
3.09
3.02
3.06
3.17
3.08
3.16
3.11
3.09
3.07
3.04
185 cm
3.30
3.45
3.20
3.37
3.36
3.33
3.38
3.33
3.30
3.27
SPSS’de
Tek Yönlü Varyans Analizi
Veriler yanda görüldüğü iki sütun
halinde SPSS veri sayfasına girilir.
FEV1 değişkeni 4 grup alt alta
gelecek
şekilde
girilir.
Grup
sütununa ise FEV1 ölçümlerinin
hangi boy grubuna ait olduğunu
gösteren grup kodları girilir.
SPSS’de
Tek Yönlü Varyans Analizi
Örnekte yer alan verilerin tek yönlü varyans analizi
ile analiz edilebilmesi için öncelikle normal dağılım
göstermesi gerekmektedir.
Bunun için verilerin normal dağılıma uygun olup
olmadıkları test edilir.
SPSS’de
Tek Yönlü Varyans Analizi
Analyze -> Descriptive Statisticsc -> Explore menüsü
kullanılır.
SPSS’de
Tek Yönlü Varyans Analizi
Açılan Explore penceresinde FEV1 Dependent List alanına taşınır. Factor
List alanına ise Grup değişkeni atanır. Çünkü her dört grupta da verilerin
normal dağılıma uygun olup olmadığı test edilmelidir.
SPSS’de
Tek Yönlü Varyans Analizi
Plots düğmesi tıklanır ve açılan pencerede Normality plots with test
seçeneği seçilir. Continue ve OK tıklanır.
SPSS’de
Tek Yönlü Varyans Analizi
Kolmogorov-Smirnov ve Shapiro-Wilk test sonuçlarına göre
dört farklı boy grubunda FEV1 değerleri normal dağılım
göstermektedir. Çünkü test sonuçlarında yer alan anlamlılık
düzeyleri her grup içinde 0.05 değerinden büyüktür.
SPSS’de
Tek Yönlü Varyans Analizi
Tek yönlü varyans analizi uygulamak için Analyze ->
Compare Means -> One-Way ANOVA seçeneği tıklanır.
SPSS’de
Tek Yönlü Varyans Analizi
Açılan pencerede Dependent List alanına FEV1 ve Foctor alanına ise
boy değişkeni alınır. Options… düğmesi tıklanır.
SPSS’de
Tek Yönlü Varyans Analizi
Açılan pencerede Descriptive
seçeneği
verilere
işaretlenerek
ait
tanımlayıcı
istatistikler istenir.
Homogenity of variance test
işaretlenerek de varyansların
homojen olup olmadığı test
edilir.
SPSS’de
Tek Yönlü Varyans Analizi
Çoklu karşılaştırma için PostHoc… düğmesi tıklanır.
SPSS’de
Tek Yönlü Varyans Analizi
Açılan pencerede varyansların eşit olduğu varsayımı altında çoklu
karşılaştırmalardan Tukey testi, varyansların eşit olmadığı durumda
kullanılacak olan Tamhane T2 testi seçilir.
SPSS’de
Tek Yönlü Varyans Analizi
Yukarıda gruplara göre FEV1 ölçümlerinin tanımlayıcı istatistikleri ve
Levene testi sonuçları verilmiştir. Levene testi sonuçlarına göre
varyanslar homojendir.
SPSS’de
Tek Yönlü Varyans Analizi
Varyans analizi sonuçları aşağıdaki gibi elde edilir.
SPSS’de
Tek Yönlü Varyans Analizi
Sonuçlar incelendiğinde FEV1 değerlerinin dört
farklı boy grubunda farklılık gösterdiği saptanmıştır
(F=232.679, p<0.001).
Bu durumda H1 hipotezi
kabul edilir.
Peki hangi gruplar birbirlerinden farklıdır?
SPSS’de
Tek Yönlü Varyans Analizi
Bu sorunun cevabını bulmak için çoklu karşılaştırma sonuçları
incelenmelidir.
SPSS’de
Tek Yönlü Varyans Analizi
Çoklu karşılaştırma sonuçları incelendiğinde tüm
grupların FEV1 değişkeni bakımından farklı olduğu
saptanmıştır.
Kruskal-Wallis H testi
Kruskal-Wallis H testi (KWH) parametrik olmayan
tek yönlü varyans analizi yöntemidir. K bağımsız
örneğin benzer ortanca değerli toplumların rastgele
örnekleri olup olmadığını test eder.
KWH testi uygulanacak verilerin aralıklı ya da
oransal ölçekli olması gerekir.
Kruskal-Wallis H testi
KWH testinde aşağıdaki hipotezler test edilir.
H0: k örnek benzer medyanlı toplumlardan alınmış
örneklerdir.
H1: k örnekten an az birinin medyanı diğerlerinden
farklıdır.
Kruskal-Wallis H testi
KWH testinde gözlem değerleri yerine bu değerlere ait
sıralama puanları kullanılır. Her grubun sıralama puanları
toplamı ele alınarak H test istatistiği aşağıdaki gibi
hesaplanır.
𝐻=
12
𝑘
𝑖=1 𝑛𝑖 (𝑅𝑖
− 𝑅)2
𝑁(𝑁 + 1)
Burada 𝑅𝑖 i. gruba ait sıralama puanlarının ortalamasını, 𝑅
ise sıralama puanlarının genel ortalamasını göstermektedir.
Kruskal-Wallis H testi
H test istatistiği (k-1) serbestlik dereceli ki-kare dağılımı
gösterir ve
𝐻 < 𝜒0.05,(𝑘−1) ise p>0.05 olarak elde edilir ve grupların
medyan değerleri farklı değildir sonucuna varılarak H0
hipotezi kabul edilir.
𝐻 > 𝜒0.05,(𝑘−1) ise p<0.05 olarak elde edilir ve grupların
medyan değerleri farklıdır sonucuna varılarak H1 hipotezi
kabul edilir.
Kruskal-Wallis H testi
KWH testinde anlamlı sonuç bulunduktan sonra
hangi grupların birbirlerinden farklı olduğunu
belirlemek
için
parametrik
olmayan
çoklu
karşılaştırma testleri kullanılır. Burada parametrik
olmayan
çoklu
karşılaştırma
testlerine
ait
hesaplamalar gösterilmeyecek SPSS uygulamasında
anlatılacaktır.
SPSS’de Kruskal-Wallis H testi
Önceki örnekteki veriler aşağıdaki gibi elde edilmiş
olsun. Aynı şekilde dört farklı boy grubuna göre
FEV1 değerleri bakımından fark olup olmadığını
araştıralım.
SPSS’de Kruskal-Wallis H testi
155 cm
3.90
2.49
2.56
2.55
3.85
2.42
2.10
2.48
2.49
2.72
165 cm
3.80
2.78
2.88
2.70
2.91
2.76
2.80
2.86
2.80
2.87
175 cm
3.09
3.02
3.06
3.17
3.08
3.16
3.11
3.09
3.07
3.04
185 cm
3.30
3.45
3.20
3.37
3.36
3.33
3.38
3.33
3.30
3.27
SPSS’de Kruskal-Wallis H testi
Veriler yanda görüldüğü iki sütun
halinde SPSS veri sayfasına girilir.
FEV1 değişkeni 4 grup alt alta
gelecek
şekilde
girilir.
Grup
sütununa ise FEV1 ölçümlerinin
hangi boy grubuna ait olduğunu
gösteren grup kodları girilir.
SPSS’de Kruskal-Wallis H testi
Örnekte yer alan verilerin tek yönlü varyans analizi
ile analiz edilebilmesi için öncelikle normal dağılım
göstermesi gerekmektedir.
Bunun için verilerin normal dağılıma uygun olup
olmadıkları test edilir.
SPSS’de Kruskal-Wallis H testi
Analyze -> Descriptive Statisticsc -> Explore menüsü
kullanılır.
SPSS’de Kruskal-Wallis H testi
Açılan Explore penceresinde FEV1 Dependent List alanına taşınır. Factor
List alanına ise Grup değişkeni atanır. Çünkü her dört grupta da verilerin
normal dağılıma uygun olup olmadığı test edilmelidir.
SPSS’de Kruskal-Wallis H testi
Plots düğmesi tıklanır ve açılan pencerede Normality plots with test
seçeneği seçilir. Continue ve OK tıklanır.
SPSS’de Kruskal-Wallis H testi
Kolmogorov-Smirnov ve Shapiro-Wilk test sonuçlarına göre
155cm ve 165cm boy grubunda grubunda FEV1 değerlerinin
normal dağılım göstermemektedir. Bu durumda tek yönlü
varyans analizi kullanılamaz.
SPSS’de Kruskal-Wallis H testi
Bu şartlar altında tek yönlü varyans analizinin
parametrik olmayan alternatifi olan Kruskal-Wallis H
testi kullanılır.
SPSS’de Kruskal-Wallis H testi
Analyze -> Nonparametric Tests -> Independent samples… seçeneği
tıklanır.
SPSS’de Kruskal-Wallis H testi
Açılan pencerede
Fields
sekmesinde Test
Fields
alanına
FEV1 ve Groups
alanına ise boy
değişkeni alınır.
Sonra
Settings
sekmesi tıklanır.
SPSS’de Kruskal-Wallis H testi
Açılan
pencerede
Customize
tests
işaretlenir.
Sonra
Kruskal-Wallis
1-way
ANOVA (k samples)
işaretlenir ve Multiple
comparions’dan
All
pairwise seçilir. Run
düğmesi tıklanır.
SPSS’de Kruskal-Wallis H testi
Analiz
sonucunda
sonuçlar elde edilir.
aşağıdaki
tabloda
gösterilen
SPSS’de Kruskal-Wallis H testi
Sonuçlar incelendiğinde FEV1 değerlerinin dört farklı
boy
grubunda
farklılık
gösterdiği
saptanmıştır
(p<0.001). Bu durumda H1 hipotezi kabul edilir.
Peki hangi gruplar birbirlerinden farklıdır?
SPSS’de Kruskal-Wallis H testi
Farklı grupları belirlemek için öncelikle elde edilen
analiz sonuçlarını gösteren tablonun üzerine çift
tıklanır. Model Viewer penceresi açılır.
SPSS’de Kruskal-Wallis H testi
Model Viewer penceresi
SPSS’de Kruskal-Wallis H testi
Model Viewer penceresinde View alanında Pairwise
Comparisons seçilerek çoklu karşılaştırmalar elde
edilir.
SPSS’de Kruskal-Wallis H testi
Sonuçlar
incelendiğinde
155cm
ile
185cm ve 165cm
ile 185cm boy
gruplarında
farklılık
olduğu
gözlenmektedir.

Benzer belgeler