SPSS Analiz Menüsü - Temel İstatistik / Introduction to Statistics

Transkript

SPSS Analiz Menüsü - Temel İstatistik / Introduction to Statistics
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
SPSS
Analiz Menüsü
1- Reports:
a) OLAP Cubes: Seçilen değişkenlerin istatistiksel işlemlerini yapar.
b) Case summaries: Verilerin frekans ve çapraz tablolarının oluşturulması, belirtici
istatistiklerin hesaplanması, grafik çizimi ve raporlanmasını sağlar.
c) Report Summaries in Row: Sıralara ilişkin özet istatistikler hesaplar.
d) Report Summaries in Column: Değişkenlerle ilgili özet istatistikler hesaplar.
2- Descriptive Statistics:
a) Frequencies: Verilerin frekans tablosunu, belirtici istatistikleri, dağılım ölçülerini
hesaplar ve grafiklerini çizer.
b) Descriptives: Verilerin belirtici istatistiklerini ve asimetrik dağılım ölçüleri olan çarpıklık
(kurtosis), basıklık (skewnes) ölçülerini hesaplar.
c) Explore: Tüm birimlerin yada her bir gruptaki birimlerin belirtici istatistiklerini hesaplar
ve yayılım grafiklerini çizer. Bir değişkenin diğer değişkene göre istatistiklerini bulur.
d) Crosstabs: İki yada daha fazla değişkenin ikili çapraz tablolarını düzenler. Hazırlanan
tablolara testler yapılır ve özet istatistikler bulunur. Sayısal değişkenler kodlama ile az
sayıdaki gruba bölünerek çapraz tablolar düzenlenir.
3- Compare Means:
Gruplara göre verilerin belirtici istatistiklerini hesaplayan, bağımlı ve bağımsız
örneklerde iki yada daha fazla ortalama arasındaki farkları test eden yöntemleri içerir.
a) Means: Değişkenlerin tek başına ya da diğer bağımsız değişkenlere göre alt grupların
istatistiklerini hesaplar.
b) One Sample T test: Tek örnek T testi yapar.
c) Independent Samples T Test: Bağımsız iki örneklem T testi yapar.
d) Paired Samples T Test: Bağımlı iki örneklem T Testi yapar.
e) One Way ANOVA: Bağımsız iki örneklemin ortalamalarının önemliliğini test etmek
için tek yönlü varyans analizi uygular.
4- General Lineer Model:
Genelleştirilmiş lineer modellerle ilgili işlemleri yapar.
a) Univariate: Tek değişkenli
b) Multivariate: Çok değişkenli
c) Repeated Measures: Tekrarlı ölçümlü denemelerde kullanılır.
1
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
5- Correlate:
İki yada daha fazla değişkenin arasındaki ikili (Bivariate) ilişkinin; yönünü,
büyüklüğünü ve önemliliğini belirler. Ayrıca kısmi (partial) korelasyon analizi de yapılır. En
az bir değişkene göre birimlerin birbiriyle olan benzerlik uzaklıkları (similarity) yada
farklılıklarını gösteren uzaklıklar (dissimilarity) hesaplanır. Çeşitli uzaklık ve benzerlik
ölçülerine (öklid, karesel öklid, minkowski) göre birimlerin yada değişkenlerin
benzerlik/farklılık matrisleri bulunur.
6- Regression:
a) Linear: Verilere basit doğrusal ve çoklu doğrusal regresyon analizi uygular.
b) Curve Estimation: Verilere uygun eğri uydurulması için model denenmesi sağlar.
Model seçimi için çoklu regresyon katsayısından yararlanılır.
c) Logistic: İkili (Binary) ve çoklu (Multinominal) lojistik regresyon analizi yapılmasını
sağlar.
d) Probit: Probit regresyon analizi yapar.
e) Nonlineer: Doğrusal olmayan regresyon analizi uygulaması yapar.
f) Loglinear: Kategorik verilere genel ve aşamalı loglinear ve lojit loglinear analiz
uygular.
7- Classify:
Verilere kümeleme analizi uygular.
a) Two-Step Cluster Analysis: İki adımlı kümeleme analizi
b) K-Means Cluster: Kümelenecek birim yada değişkenlerin kaç kümeye ayrılacağı
belirlenerek guruplamalar yapılır.
c) Hierarchical Cluster: Değişkenlere aşamalı kümeleme analizi uygular.
d) Discriminant: Grupları önceden belirli birimleri rasyonel biçimde birbirinden ayırmaya
yarayan fonksiyonlar türetmeyi sağlar ve verilerin sınıflandırır.
e) Nearest Neighbor Analysis: Birbirine yakın örneklere küme analizi uygular.
8- Dimension Reduction:
Veilere faktör analizi ve uyum (Correspendance) analizi uygular.
9- Scale:
İsimsel fakat kodlanmış sıralı yada aralıklı ölçekle elde edilmiş verilere güvenilirlik
ve çok boyutlu ölçekleme analizi uygular.
2
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
10- Nonparametrics Tests:
Tek örneklem, bağımlı/bağımsız iki ve k örneklem verilerine parametrik olmayan
test yöntemlerinin uygulanmasının sağlar.
11- Forecasts:
12- Multiple Response:
Çoklu cevap yada çoklu ikili setlerin belirlenmesi ve analizi işlemlerini yapar.
13- Quality Control:
14- ROC Curve:
Test türünü belirlemede kullanabileğiniz yardımcı web sayfası.
http://www.whichtest.info/index.htm
3
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
Sık Kullanılan Test ve İstatistikler
1- Descriptive (Tanımlayıcı) İstatistik:
Araştırmada kullanılan örneklemin okuyucuya açıklanması ve elde edilen sonuçlar
hakkında basit tanımlayıcı istatistikler (aritmetik ortalama, mod, medyan, standart
sapma gibi) vermek için kullanılır.
Analyse
Descriptive Statistics
Frequencies
Statistics
2- Aşırı değerlerin (Outliers) tespiti:
Analyse
Descriptive Statistics
Explore
Statistics
Outliers
Bu işlem en düşük ve en yüksek 5 değeri göstererek aşırı değerleri saptamamızı sağlar.
3- Çapraz Tablo (Crosstabs): Değişkenler arasında basit karşılaştırmalar ve parametrik
olmayan testler yapmamızı sağlar.
Analyse
Descriptive Statistics
Crosstabs
4- Normallik Testi (Test of Normality): Parametrik testlerin yapılabilmesi için
gereklidir.
Analyse
Descriptive Statistics
Explore
Plots
Normality plots
with tests
a) Kolmogorov – Smirnov: 51 ve üzeri örnek sayısında kullanılır. sig > 0.05 değeri
dağılımın normal olduğunu gösterir
Shapiro – Wilk: 50 ve altı örnek sayısında kullanılır. sig > 0.05 dağılımın normal
olduğunu gösterir.
b) Normal Q – Q Plot: Örneklerin çizgi üzerinde veya çizgiye çok yakın olması
normal bir dağılım olduğunu gösterir.
4
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
5- Faktör Analizi:
a) Kavramların açıklandığı alt boyutları belirlemek
b) Değişken gruplarını saptayarak değişkenleri gruplandırmak böylece değişken
sayısını azaltmak için kullanılır.
Analyse
Data Reduction
Factor
Yapılması gereken seçimler:
a) Descriptive menüsünde: 1- Initial solution, 2- Anti-image, 3- KMO and
Barlett’s test of sphericity
b) Extraction menüsünde: Unrotated factor solution seçeneği kaldırılır.
c) Rotation menüsünde: Varimax yöntemi seçilir.
d) Options menüsünde: 1- Exclude cases litwise, 2- Sorted by size
Sonuçların okunması:
1- Değişkenlerin faktör analizine uygun olması için;
a) KMO değeri .50’nin üzerinde bir değer olmalıdır (.80 ve üzeri mükemmel)
b) Barlett’s Test of Spericity (sig < 0.05) olmalıdır.
2- Anti-Image Correlation matrisinde yer alan MSA değerleri en az .50 olmalıdır.
Bu değerin .50’nin altında olduğu değişkenler çıkarılarak analiz tekrarlanır.
3- Total Varience Explained tablosunda “Total” sütununun altında yer alan 1’den
büyük değerler ölçeğimizin kaç alt boyuttan (faktör) oluştuğunu gösterir.
4- Rotated Comopent Matrix’i hangi sorunun hangi alt boyutta yer aldığını
gösterir. Bu matriste;
a) Her bir alt boyut (faktör) en az iki sorudan oluşmalıdır. Tek sorudan oluşan
faktörler (faktörü oluşturan soru) analizden çıkarılarak işlem
tekrarlanmalıdır.
b) Birden fazla alt boyutta (faktör) birbirine yakın değerler alan sorular
analizden çıkarılarak analiz tekrarlanmalıdır.
c) .50 değerinin altında bir değere sahip sorular mutlaka, .70 değerinin
altında bir değere sahip sorular ise isteğe bağlı olarak analizden çıkarılarak
analiz tekrarlanmalıdır.
d) “–“ değere sahip sorular diğer sorularla ters ilişkili demektir.
Bu durumda kodlama kontrol edilmelidir. Yanlış kodlama yapılmışsa
Transform
Recode into same variables (veya Recode into different
variables) komutu ile kodlama düzeltilmelidir.
5
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
6- Güvenilirlik Analizi (Reliabilitiy Analysis): Faktör analizi ile belirlenen faktörlerin
veya önceden belirlenen faktörlerin iç güvenilirliğini ölçmek için kullanılır.
Analyse
Scale
Reliability Analysis
Yapılması gereken seçimler:

Statistics menüsünde: Scale if item deleted seçilir.
Sonuçların okunması:
a) Cronbach’s Alpha değeri .70’in üzerinde olmalıdır (.90 mükemmel)
b) “Cronbach’s Alpha if item deleted” sütunu o soru silindiğinde faktör güvenilirlik
katsayısının ne olacağını gösterir. Böylece güvenilirlik katsayısını düşüren sorular
bulunabilir. Bu sorular analizden çıkarılarak işlem tekrar edilmelidir.
A- Parametrik Olmayan (Non-Parametric) Testler:
1) Pearson Chi-square (Ki-kare): İki veya daha fazla ordinal (sıralı) veya nominal
(kategorik) ölçekle ölçülmüş değişkenler arasında bağımlılık olup olmadığını
tespit etmek için kullanılır.
Analyse
Nonparametric Tests
Legacy Dialogs
Chi-square
 sig < 0.05 değeri değişkenlerin bağımlı olduğunu
 “0 cells have expected count less than 5” ifadesi ise bu analizin
kullanılmasında her hangi bir sakınca olmadığını gösterir.
2) Mann – Whitney U Testi: Bağımsız gruplar t testinin sürekli (scale) değişkenler
için kullanılan, parametrik olmayan alternatifidir. Örneklem sayısı veya normal
dağılım ön şartını yerine getiremeyen sürekli değişkenler için t test yerine MannWhitney U testi kullanılır.
Analyse
Nonparametric Tests
Legacy Dialogs
2 Independent
Samples
 sig < 0.05 değeri iki grubun ortancalarının eşit olmadığını aralarında anlamlı
bir fark olduğunu gösterir.
3) Wilcoxon Testi: Bağımlı gruplar t testinin parametrik olmayan alternatifidir.
Analyse
Nonparametric Tests
Legacy Dialogs
2 Related
Samples
 sig < 0.05 değeri iki grubun eşit olmadığını aralarında anlamlı bir fark
olduğunu gösterir.
 “Ranks” tablosundaki a, b, c, satırları (Pozitif, negatif, eşit) farkın ne yönde
olduğunu gösterir.
6
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
4) Kruskal Wallis Testi: Tek yönlü varyans analizinin (ANOVA) sürekli (scale)
değişkenler için kullanılan parametrik olmayan alternatifidir.
Analyse
Nonparametric Tests
Legacy Dialogs
K Independent
Samples
 sig < 0.05 değeri iki grubun eşit olmadığını aralarında anlamlı bir fark
olduğunu gösterir.
5) Kendall ve Spearman Korelasyan Testleri:
- Parametrik Pearson Korelasyon testinin alternatifleridir.
- Örneklem sayısı 51 ve üzeri ise Spearman, 50 ve altınsa ise Kendall testi
kullanılmalıdır.
Analyse
Correlate
Bivariate
 Gelen pencerede “Pearson” seçeneği silinip yerine “Kendall’s tau-b” ve
“Spearman” seçenekleri işaretlenir.
 sig < 0.05 değeri iki değişken arasında anlamlı bir ilişki olduğunu gösterir.
 Kendall’s tau-b” ve “Spearman” testlerinde Pearson testinde olduğu gibi
korelasyon katsayısı -1 ile +1 aralığında yer alır.
B – Parametrik Testler
a) Fark Testleri:
1- Tek Örneklem (Grup) t-testi – One sample t-test
-
Bir evrenden seçilen örneklem ile evren ortalaması karşılaştırılmak istendiğinde
Bir örneklemin ölçülen ortalaması ile bilinen veya tahmin edilen ortalaması
karşılaştırılmak istendiğinde kullanılır.
Bu testin kullanılabilmesi için;
1- Sürekli değişken olması
2- Örneklem sayısının en az 30 (bazılarına göre 20) olması,
3- Dağılımın normal olması
4- Bir tek örneklem (grup) üzerinde analiz yapılıyor olması gereklidir.
Analyse
Compare Means
One Sample t-test
7
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
2- Bağımsız Örneklem (Gruplar) t-testi – Independent Sample t-test: İki bağımsız
grubun ortalamalarının birbirinden farklı olup olmadığını ortaya koymak için
kullanılır.
Bu testin kullanılabilmesi için;
5- Sürekli değişken olması
6- Örneklem sayısının en az 30 (bazılarına göre 20) olması,
7- Dağılımın normal olması
8- Grupların birbirinden bağımsız olması gerekir.
Analyse
Compare Means
Independent-Samples T Test
Sonuçların Okunması:



Önce “Independent Samples Test” tablosunda “Levene’s Test for Equality of
Variances” bölümüne bakılır.
- Levene testinin p değeri;
1- (sig) > 0.05 ise iki grubun varyanları eşit demektir. Bu durumda t-test
sütunun birinci satırına bakılır.
2- (sig) < 0.05 ise iki grubun varyansları eşit değil demektir. Bu durumda
t-test sütunun ikinci satırına bakılır.
Bakılan satırdaki t-testin p değeri (sig) < 0.05 ise iki grubun ortalamaları farklı
demektir.
Group Statistics tablosundaki mean sütunu grupların ortalama değerlerini ve
farklılığın yönünü gösterir.
3- Eşleştirilmiş Örneklem (Gruplar) t-testi – Paired Sample t-test: Aynı örneklem
üzerinde yapılmış iki ayrı ölçüm karşılaştırılmak istendiğinde kullanılır. Örn: Ön test
– Son test araştırma deseni
8
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
Bu testin kullanılabilmesi için;
1- Sürekli değişken olması
2- Örneklem sayısının en az 30 (bazılarına göre 20) olması,
3- Ölçümler arası fark normal dağılım olmalıdır*
4- Grupların birbirine bağımlı olması, gerekir.
Analyse
Compare Means
Paired-Samples T Tests
Sonuçların Okunması:

“Paired Samples Test” tablosunda p değerine bakılır. sig < 0.05 ise iki ölçüm
arasında anlamlı bir fark var demektir.
Dikkat: SPSS p değerini hesaplarken çift yönlü test hesabı kullanır ve bu nedenle çift
kuyruklu testinin sigma sonucunu gösterir (sig. 2- tailed). Alternatif hipotez tek yönlü (tek
kuyruklu) test gerektiriyorsa bu durumda tek kuyruk p değerini bulmak için “Sig. (2-tailed)”
sütununda verilen değer ikiye bölünmelidir.
4- Tek Yönlü Varyans Analizi (ANOVA): İkiden fazla bağımsız grubun
ortalamalarının birbirinden farklı olup olmadığını test etmek için kullanılır.
Bu testin kullanılabilmesi için;
1- Sürekli değişken olması
2- Örneklem sayısının en az 30 olması
3- Dağılımın normal olması
4- Dağılımın homojen olması.
5- Grupların birbirinden bağımsız olması
Analyse
Compare Means
One-Way ANOVA
Yapılması gereken seçimler:


Post Hoc menüsünde; Varyansların homojenliğini kontrol eden testlerden en
yaygın kullanılan ikisi olan Scheffe veya Tukey testlerinden biri seçilir.
- Scheffe: Grupların örnek sayısı birbirine eşit olmadığında tercih edilir.
- Tukey: Grup sayısı fazla olduğunda tercih edilir.
Options menüsünde; 1) Descriptive, 2) Homogenity of varience tests, 3)
Brown-Forsythe, ve 4) Welch seçenekleri işaretlenir.
Sonuçların Okunması:




İlk olarak örneklem büyüklüğüne göre uygun normallik testi uygulanır
İkinci olarak “Test of Homogeneity of Variences” tablosunda Levene testinin
p değerine bakılır. sig > 0.05 ise grupların varyansları eşit demektir.
ANOVA tablosunda p değerine bakılır. sig < 0.05 ise bağımsız değişkene
seçtiğimiz göre bağımlı değişken farklılık gösterir demektir.
“Multiple Comparisons” tablosu seçilen test veya testlere göre hangi alt
grubun diğerlerinden farklı olduğunu ve anlamlılık seviyesini gösterecektir.
9
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
b) Korelasyon (İlişki, bağıntı) Testi : Değişkenler arasında + veya – yönde bir ilişki
olup olmadığını ortaya koymak için Pearson Korelasyon Katsayısı testi kullanılır.
Bu testin uygulanabilmesi için;
a) Örneklem sayısı 30’un üzerinde olmalıdır.
b) Örnekte aşırı değerler bulunmamalıdır (Bkz. Sayfa 4, madde 2)
c) İki değişken arasında doğrusal ilişki olup olmadığı serpilme diyagramına (scatter
plot) bakılarak tespit edilmelidir.
Graphs
Legacy Dialogs
Scatter/Dot
Simple Scatter
(Yukarı yöne serpilme pozitif, aşağı yöne serpilme negatif korelasyonu gösterir)
Yukarıdaki şartlar karşılanıyorsa;
Analyse



Correlate
Bivariate yoluyla korelasyon testi gerçekleştirilir.
“Flag significant correlations” seçeneği anlamlı korelasyonları yıldız ile
işaretleyerek gösterecek ve anlamlılık seviyesini tablonun altında belirtecektir.
Korelasyon katsayısı -1 ile +1 aralığında yer alır.
Seviyeler: 0 - .3 aralığı düşük, .4 - .6 aralığı orta, .7 – 1 aralığı yüksek seviyedir.
c) Regresyon (Regression) Testi: Bağımsız değişkenlerin bağımlı değişkenleri ne
şekilde etkilediği (açıkladığını) bulmak için kullanılır.
Bu testin kullanılabilmesi için;
a) Bağımlı ve bağımsız değişkenler arasında doğrusal bir ilişki olmalıdır (Bkz.
Madde 5 c)
b) Bağımsız değişkenlerin birbiriyle ilişkili (çoklu bağıntı – Multicollinearity)
olmaması
c) Hata terimlerinin normal dağılması (Normallik – Normality)
d) Hata terimlerinin varyansının sabit olması (eşvaryanslılık – Homoscedasticity)
e) Hata terimleri arasında ilişki olmaması (Otokorelasyon – Autocorrelation)
f) Bağımlı değişkede oranlı veya aralıklı ölçek kullanılması
 Bağımsız değişkende kullanılan ölçek oranlı, aralıklı veya sınıflı olabilir.
Ancak sınıflı ise doğrudan (linear) regresyon modeli uygulanamaz.
10
Temel İstatistik
2012
Y. Doç. Dr. İbrahim Turan
GRAPHS (Grafikler) MENÜSÜ
1- Bar: Verilerin basit çubuk, kümelenmiş çubuk ve yığılımlı çubuk grafiğini çizer.
2- 3-D Bar: Üç boyutlu bar grafiği
3- Line: Verilerin basit ve çoklu çizgi grafiğini çizer.
4- Area: Verilerin basit ve yığılımlı alan grafiğini çizer.
5- Pie: Basit daire veya birleşik çubuk grafiğini çizer.
6- High Low: Verilerin ikili yada üçlü değerlerden yararlanarak yüksek ve düşük
değerleri içeren grafiklerini çizer.
7- Boxplot: Verilerin ortanca değerini, dörtte birlikler arası genişlik ve aşırı değer içeren
birimleri gösteren kutu grafiklerini çizer.
8- Error Bar: Ortalama ve güven aralığını gösteren kutu grafiği çizer.
9- Scatter: Verilere uyan basit ve üst üste gelen ilişki grafikleri, matrix grafiği yada üç
boyutlu dağılım grafiklerini çizer.
10- Histogram: Bir değişkenin dağılım hakkında bilgi veren histogram grafiklerini çizer.
11- P – P: Bir değişkenin yığılımlı ortalamalarını Normal dağılımın yığılımlı
ortalamalarına karşı gösteren grafiklerini çizer.
12- Q – Q: Bir değişkenin dağılımının dörtte birliklerini Normal dağılımın dörtte
birliklerine karşı gösteren grafiklerini çizer.
11

Benzer belgeler