Bilimsel Araştırmalarda İstatistik - İç Anadolu Ormancılık Araştırma

Transkript

Bilimsel Araştırmalarda İstatistik - İç Anadolu Ormancılık Araştırma
Müdürlük Yayın No: 243
ISSN 1300 - 3933
BĐLĐMSEL ARAŞTIRMALARDA
ĐSTATĐSTĐK
Mehmet ERCAN
ÇEŞĐTLĐ YAYINLAR SERĐSĐ NO: 6
(Genişletilmiş Đkinci Baskı)
T. C.
ORMAN BAKANLIĞI
KAVAK VE HIZLI GELĐŞEN ORMAN AĞAÇLARI
ARAŞTIRMA ENSTĐTÜSÜ MÜDÜRLÜĞÜ
ĐZMĐT, 1997
YAYIN KURULU:
Editorial Board:
Dr. Taneri ZORALĐOĞLU
Kâzım ULUER
Sacit KOÇER
Engin ERTAN
Mehmet ERCAN
YAYINLAYAN:
Kavak ve Hızlı Gelişen
Orman Ağaçları Araştırma
Enstitüsü Müdürlüğü
P.K. 93 41001 Đzmit/TÜRKĐYE
PUBLISHED BY:
Poplar and Fast Growing
Forest Trees Research Institute
P.O. Box: 93
Đzmit/TURKEY
Tel: 0262 3116964-3116965
Fax: 0262 3116972
T. C.
ORMAN BAKANLIĞI
KAVAK VE HIZLI GELĐŞEN ORMAN AĞAÇLARI
ARAŞTIRMA ENSTĐTÜSÜ MÜDÜRLÜĞÜ’nde
basılmıştır.
II
ĐÇĐNDEKĐLER
1. TANIMLAR, SAYILARIN ELDE EDĐLMESĐ VE ÖZETLENMESĐ...........1
1.1.Đstatistik .....................................................................................................1
1.2.Tarifler, Tanımlar ......................................................................................1
1.2.1.Toplu Olayların Özelliği, Tesadüfîlik, Örnekleme, Tesadüf Örneği..1
1.2.2.Populasyon ve Nümune (Örnek) ........................................................2
1.2.3.Đstatistik ve Parametre ........................................................................2
1.2.4.Deneme ..............................................................................................3
1.3.Sayıların (Verinin) Elde Edilmesi .........................................................3
1.4.Sayıların Özetlenmesi ...............................................................................4
1.4.1.Sıralı Dizi ...........................................................................................4
1.4.2.Frekans Tablosu .................................................................................4
1.4.2.1.Eklemeli (Kümülatif) Frekans Tablosu.......................................7
1.4.3. Grafikler ............................................................................................8
1.4.3.1.Daire (Pasta) Grafik ....................................................................8
1.4.3.2.Çubuklu Diyagram ......................................................................8
1.4.3.3.Histogram....................................................................................9
1.4.3.4.Frekans Poligonu ve Frekans Eğrisi..........................................10
2. MERKEZĐ EĞĐLĐM ÖLÇÜLERĐ .................................................................11
2.1.Ortalamanın Tanımı ve Özellikleri .........................................................11
2.1.1.Ortalamaların Genel Özellikleri .......................................................11
2.1.2.Ortalamaların Üstünlükleri...............................................................11
2.1.3.Ortalamaların Kusurları....................................................................12
2.1.4.Ortalamaların Kusurlarını Gidermenin Yolları ................................12
2.2.Ortalamaların Sınıflandırılması...............................................................13
2.3.Analitik Ortalamalar................................................................................13
2.3.1.Aritmetik Ortalama ..........................................................................13
2.3.1.1.Basit Serilerde Aritmetik Ortalama...........................................13
2.3.1.2.Sınıflanmış Serilerde Aritmetik Ortalama.................................14
2.3.1.3.Gruplanmış Serilerde Aritmetik Ortalama ................................14
2.3.1.4.Aritmetik Ortalamanın Özellikleri ............................................15
2.3.2.Tartılı (Ağırlıklı) Aritmetik Ortalama ..............................................16
2.3.3.Geometrik Ortalama .........................................................................17
2.3.3.1.Basit Serilerde Geometrik Ortalama .........................................17
2.3.3.2.Sınıflandırılmış Serilerde Geometrik Ortalama.........................18
2.3.3.3.Gruplandırılmış Serilerde Geometrik Ortalama ........................18
2.3.3.4.Geometrik Ortalamanın Özellikleri...........................................19
2.3.4.Ahenkli (Harmonik) Ortalama .........................................................20
2.3.4.1.Basit Serilerde Harmonik Ortalama ..........................................20
2.3.4.2.Gruplanmış Serilerde Harmonik Ortalama................................20
2.3.4.3.Gruplanmış Serilerde Harmonik Ortalama................................21
2.3.4.4.Harmonik Ortalamanın Özellikleri............................................21
2.3.5.Kareli (Kuadratik) Ortalama ............................................................22
2.3.5.1.Basit Serilerde Kareli Ortalama ................................................22
2.3.5.2.Sınıflanmış Serilerde Kareli Ortalama ......................................22
2.3.5.3.Gruplanmış Serilerde Kareli Ortalama......................................23
2.3.5.4.Kareli Ortalamanın Özellikleri..................................................23
2.3.6.Analitik Ortalamaların Büyüklük Sırası...........................................24
2.4.Analitik Olmayan Ortalamalar ................................................................24
2.4.1.Medyan (Ortanca) ............................................................................24
2.4.1.1.Basit Serilerde Medyan .............................................................24
2.4.1.2.Sınıflanmış Serilerde Medyan...................................................25
2.4.1.3.Gruplanmış Serilerde Medyan...................................................25
2.4.1.4.Medyanın Özellikleri.................................................................26
2.4.2.Mod (Tepe Değeri)...........................................................................27
2.4.2.1.Basit Serilerde Mod...................................................................27
2.4.2.2.Sınıflanmış Serilerde Mod ........................................................27
2.4.2.3.Gruplanmış Serilerde Mod ........................................................28
2.4.2.4.Modun Özellikleri, Elverişli Olduğu ve Olmadığı Haller .........29
2.5.Ortalama Seçiminde Göz Önüne Alınacak Esaslar .................................29
2.6.Ortalamalar Arası Bağıntılar ...................................................................29
3. DAĞILMA, DEĞĐŞĐM, VARYASYON ......................................................31
3.1.Giriş.........................................................................................................31
3.2.Serinin Bütün Terimlerinin Hesaba Katılmadığı Dağılım Ölçüleri ........31
3.2.1.Dağılım Sınırları ve Değişim Genişliği (Varyasyon Genişliği) .......32
3.2.2.Kartiller (Çeyrekler).........................................................................32
3.2.2.l.Basit Serilerde Kartiller..............................................................32
3.2.2.2.Sınıflandırılmış Serilerde Kartiller............................................33
3.2.2.3.Gruplandırılmış Serilerde Kartiller ...........................................33
3.3.Serinin Bütün Terimlerinin Hesaba Katıldığı Dağılım Ölçüleri .............34
3.3.1.Ortalama Sapma (Mutlak Farklar Ortalaması).................................34
3.3.1.1.Basit Serilerde Ortalama Sapma................................................34
3.3.1.2.Sınıflanmış Serilerde Ortalama Sapma .....................................35
3.3.1.3.Gruplanmış Serilerde Ortalama Sapma .....................................35
3.3.2.Varyans ve Standart Sapma..............................................................36
3.3.2.1.Serbestlik Derecesi Kavramı .....................................................36
3.3.2.2.Basit Serilerde Varyans ve Standart Sapma ..............................37
3.3.2.2.1.Varyans ve Standart Sapmanın Kolay Hesabı ..............................37
3.3.2.3.Sınıflanmış Serilerde Varyans ve Standart Sapma ....................38
3.3.2.4.Gruplanmış Serilerde Varyans ve Standart Sapma ...................38
3.4.Varyasyon Katsayısı (Nisbi Standart Ayrılış) .........................................39
3.5.Ortalamaların Dağılımı, Ortalamanın Standart Hatası ............................40
II
3.6.Ortalamanın Örnekleme Hatası (%) ........................................................41
4. POPULASYONLARIN BELĐRLENMESĐ ..................................................43
4.1.Giriş.........................................................................................................43
4.2.Normal Populasyonlar.............................................................................43
4.2.1.Normal Dağılımın Parametreleri ......................................................44
4.2.2.Normal Dağılımın Özellikleri ..........................................................44
4.2.3.Normal Eğri Formülünden Yararlanılarak Bir Dağılımın
Hesaplanması ............................................................................................45
4.2.4.Standart Normal Dağılım .................................................................46
4.2.5.Standart Normal Dağılım Uygulamaları ..........................................47
4.3.Binom Populasyonları .............................................................................50
4.3.1.Binom Dağılımında Olasılıklar ve Katsayılar ..................................50
4.3.2.Binom Populasyonunun Parametreleri.............................................52
4.3.3.Binom Dağılımının Özellikleri.........................................................53
4.3.4.Binomiyal Dağılım Uygulamaları ....................................................53
4.4.Poisson Populasyonları ...........................................................................55
4.4.1.Poisson Dağılımının Parametreleri ve Özelliği ................................56
4.5.Normal Olmayan Populasyonlar ve Sayı Dönüştürmeleri
(Transformasyonlar)......................................................................................57
4.5.1.Kare Kök Dönüştürmesi...................................................................57
4.5.2.Logaritmik Dönüştürme ...................................................................57
4.5.3.Arc-Sinüs Dönüştürmesi ..................................................................58
5. ÖRNEKLEME ..............................................................................................59
5.1.Giriş.........................................................................................................59
5.2.Örnek ve Örneklemeye Ait Genel Bilgiler..............................................59
5.3.Örnekleme Metotları ...............................................................................60
5.3.1.Bilinçli Örnekleme Metotları ...........................................................60
5.3.2.Rastgele Örnekleme Metotları..........................................................60
6. HĐPOTEZ KONTROLLARI VE GÜVEN ARALIĞI ..................................62
6.1.Giriş.........................................................................................................62
6.2.Hipotez Kontrolu.....................................................................................62
6.2.1.t Đstatistiği ve t Dağılımı...................................................................63
6.2.2.Populasyon Ortalaması Đle Đlgili Hipotez Kontrolu..........................65
6.3.Populasyon Ortalamasının Tahmini ve Güven Sınırları..........................67
7. SAYIMLA BELĐRLENEN POPULASYONLARDA HĐPOTEZ
KONTROLU.....................................................................................................68
7.1.Giriş.........................................................................................................68
7.2.Khi-kare Değeri ve Khi-kare Dağılımı....................................................68
7.2.1.Nümunenin Normal Dağılıma Uygunluğunun Kontrolu..................70
7.2.2.Binomiyal Dağılıma Uygunluğun Kontrolu.....................................71
7.3.Bağımsızlık Kontrolu (R×
×C Tabloları) ...................................................72
III
7.4.Homojenlik Kontrolu ..............................................................................75
8.ĐKĐ ĐŞLEMĐN MUKAYESESĐ ......................................................................76
8.1.Giriş.........................................................................................................76
8.2.Bağımsız (Eşleştirilmemiş) Đki Örneğin Karşılaştırılması ......................77
8.2.1.Varyansları Eşit Sayılan Đki Bağımsız Örneğin Karşılaştırılması ....77
8.2.1.1.Varyansları Eşit, Farklı Büyüklükte Đki Bağımsız Örneğin
Karşılaştırılması ....................................................................................77
8.2.1.2.Varvansları Eşit, Aynı Büyüklükte iki Tesadüf Nümunesinin
Karşılaştırılması ....................................................................................80
8.2.2.Varyansları Eşit Olmayan Đki Bağımsız Örneğin Karşılaştırılması..81
8.2.2.1. F-testi Đle Varyansların Eşitliğinin (Homojenliğinin) Kontrolu
...............................................................................................................81
8.2.2.2.Varyansları Farklı, Farklı Sayıda Đki Bağımsız Örneğin
Karşılaştırılması ....................................................................................82
8.2.2.3.Varyansların Farklı, Aynı Sayıda Đki Bağımsız Örneğin
Karşılaştırılması ....................................................................................84
8.3.Eşleştirilmiş Đki Örneğin Karşılaştırılması (Eş Yapma Deneme Tertibi)84
8.4.Đki Ortalama Arasındaki Farkın Güven Sınırları.....................................86
8.5.Örnek Büyüklüğünün Tayini...................................................................87
9. DENEME KURMANIN GENEL ESASLARI .............................................89
9.1.Giriş.........................................................................................................89
9.2.Denemenin Planlanması..........................................................................89
9.3.Denemenin Tertiplenmesi .......................................................................89
9.3.1.Deneysel Hata ve Đşlemlerin Farklılığı.............................................90
9.3.2.Deneysel Hatayı Küçültmenin Yolları .............................................91
9.3.2.1.Homojen Deney Materyali ........................................................91
9.3.2.2.Tesadüfîlik, Rastgele Dağılım...................................................91
9.3.2.3.Tekrarlama (Yineleme, Tekerrür, Replikasyon) .......................91
9.4.Denemenin Amaçları...............................................................................92
9.5.Deneme Parsellerinin Büyüklüğü, Şekli ve Yönü...................................92
9.6.Ölçülerde Hassasiyet ...............................................................................93
10. RASTLANTI (TESADÜF) PARSELLERĐ ................................................94
DENEME TERTĐBĐ..........................................................................................94
l0.1.Giriş........................................................................................................94
10.2.Rastlantı Parselleri Deneme Tertibi ve Uygulanması ...........................94
10.3.Tesadüf Parselleri Deneme Tertibinde Varyans Analizi .......................96
10.3.1.Varyans Analizinin Esasları ve Hipotezler.....................................96
10.3.2.Varyans Analizinin Uygulanması ..................................................97
10.3.2.1.Kareler Toplamlarının Hesabı .................................................98
10.3.2.2.Serbestlik Derecelerinin (SD) Hesabı .....................................99
10.3.2.3. Kareler ortalamalarının (Varyansların) Hesabı ....................100
IV
10.3.2.4.Varyans Analizi Tablosu ve Hipotezin Kontrolu ..................100
10.4.Farklı Gurupların Tesbiti (Ortalamaların Mukayesesi).......................102
10.4.1.Tukey Metodu ..............................................................................102
10.4.2.LSD Metodu.................................................................................104
10.4.3.Duncan Testi ................................................................................105
10.4.4.Student-Newman-Keuls Testi ......................................................107
10.5.Rastlantı Parselleri Deneme Tertibinde Tekrarlamaların Farklı Sayıda
Olması Hali .................................................................................................108
10.5.1.Varyans Analizi............................................................................108
10.5.2.Farklı Grupların Tesbiti................................................................110
10.6.Varyansların Homojenliğinin Kontrolu (Bartlett Testi)......................111
10.6.1.Varyant Sayısı Eşit Gruplarda Bartlett Testi................................112
10.6.2.Varyant Sayısı Farklı Gruplarda Bartlett Testi.............................113
11. RASTLANTI BLOKLARI DENEME TERTĐBĐ......................................115
11.1.Giriş.....................................................................................................115
11.2.Denemenin Uygulanması ....................................................................115
11.3.Rastlantı Bloklarında Kurulmuş Denemelerde Varyans Analizi.........117
11.4.Tesadüf Bloklarında Eksik Değerler ...................................................119
12. FAKTÖRĐYEL (ÇOK FAKTÖRLÜ) DENEMELER ..............................122
12.1.Giriş.....................................................................................................122
12.2.Rastlantı Parsellerinde Faktöriyel Deneme Tertibi .............................123
12.2.1.Denemenin Kurulması..................................................................123
12.2.2.Faktöriyel Denemelerde Etkiler ...................................................124
12.2.3.Tesadüf Parsellerinde 2×2 Denemesinin Analizi .........................125
12.2.3.1.Kareler Toplamları ve Serbestlik Dereceleri.........................126
12.2.3.2.Ortalamaların Mukayesesi.....................................................128
12.2.3.3.Faktöriyel Denemelerde Hipotezlerin Kontrollarına Ait Bazı
Açıklamalar .........................................................................................129
12.3.Tesadüf Bloklarında Faktöriyel Deneme ve Analizi ...........................130
12.3.1.Denemenin Kurulması..................................................................130
12.3.2.Faktöriyel Varyans Analizi ..........................................................132
13. BÖLÜNMÜŞ PARSELLER DENEME TERTĐBĐ ...................................137
13.1. Giriş....................................................................................................137
13.2.Bölünmüş Parseller Tertibine Göre Denemenin Kurulması................137
13.3.Bölünmüş Parsellere Uygun Deneme Tipleri ve Tertibin Özellikleri .138
13.4.Tesadüf Bloklarında Bölünmüş Parsellerde Varyans Analizi .............139
13.5.Bölünmüş Parsellerde s X 'in Hesabı....................................................142
l4. KORELASYON VE REGRESYON .........................................................144
14.1.Giriş.....................................................................................................144
14.2.Basit Korelasyon ve Regresyon ..........................................................145
14.2.1.Basit Korelasyon ..........................................................................145
V
14.2.1.1.Korelasyon Katsayısının Hesabı ...........................................145
14.2.1.2.Korelasyon Katsayısının Standart Hatası, Önemliliğinin
Kontrolu ve Güven Sınırları................................................................147
14.2.1.3.Korelasyon Katsayısının Özellikleri .....................................148
14.2.2.Basit Doğrusal Regresyon............................................................149
14.2.2.1.Y=a+bX Denkleminin Özellikleri.........................................150
14.2.2.2.Matematik Eşitlik ve Regresyon Eşitliği...............................151
14.2.2.3.Regresyon Eşitliğinin Hesabı ................................................152
14.2.2.3.1.b ve a'nın Standart Hatası, Önemliliği ve Güven Sınırları ........155
14.2.2.3.1.1. b Katsayısının Standart Hatası, Önemliliği ve Güven
Sınırları........................................................................................155
14.2.2.3.1.2. a Katsayısının Standart Hatası ve Güven Sınırları .157
14.2.2.4.Regresyonda Varyans Analizi ve Regresyonun Varyans
Analizi ile Kontrolu.............................................................................158
14.2.2.5.Regresyonun Varyansı ve Standart Sapması.........................161
14.2.2.6.Regresyonun Örnekleme Hatası ve Güven Şeridi .................163
14.2.2.6.1. X Ortalama Değerinin Örnekleme Hatası ve Regresyonun Güven
Şeridi..........................................................................................................163
14.2.2.6.2.Tek Bir X Değerinin Örnekleme Hatası ve Güven Şeridi.........164
14.3.Doğrusal Olmayan (Eğrisel) Đlişkiler ..................................................165
14.3.1.Çok Kullanılan Eğrisel Modeller ve Özellikleri...........................166
14.3.2.Eğrisel Đlişkilerde Korelasyon ve Regresyon ...............................171
14.3.2.1.Bir Logaritmik Regresyonun Hesaplanması .........................171
14.3.2.2.Bir Parabolün Hesaplanması .................................................175
14.4.Çoğul Đlişkilerde Korelasyon ve Regresyon........................................180
14.4.1. Çoğul Korelasyon ve Regresyon Katsayılarının Hesabı .............181
14.5.Regresyon Analizi ve Model Seçimi...................................................188
15. t, KHĐ-KARE VE F DEĞERLERĐNE AĐT OLASILIĞIN
HESAPLANMASI..........................................................................................191
15.1.Giriş.....................................................................................................191
15.2.t'ye Ait Olasılığın Hesabı ....................................................................191
15.3.Khi-kare’ye Ait Olasılığın Hesabı.......................................................193
15.4.F'e Ait Olasılığın Hesabı .....................................................................194
16. ARAŞTIRMALARIN ĐSTATĐSTĐK METOTLARA GÖRE
DEĞERLENDĐRĐLMESĐ VE SONUÇ RAPORUNUN YAZILMASI ......................195
16.1.Ana Kütleyi Tanıtıcı Araştırmalar ..................................................................195
16.2.Denemelere Dayalı Araştırmalar ....................................................................196
16.3.Sebep-Sonuç Đlişkisi Arayan Araştırmalar......................................................197
16.4. Son Söz ..........................................................................................................198
FĐHRĐST
EK TABLOLAR
199
205
VI
ÖNSÖZ
Bilimsel araştırmalarda istatistiğin önemi bilinmektedir. Bu bakımdan,
araştırma kuruluşlarında Araştırmacı olarak görev yapmakta olan herkesin,
istatistiğin temel prensipleri ve ana konuları hakkında genel bir bilgi sahibi
olması istenir.
Müdürlüğümüz araştırmacı personelini bu yönüyle bilgilendirmek
maksadıyla, 1993 sonbaharında bir eğitim düzenlenmiş, daha sonra eğitim
notları geliştirilerek bu kitap ortaya çıkarılmıştır. Kitapta, ancak basit metodlar
ele alınarak temel bilgiler verilmiştir. Konular teoriye boğulmadan, ormancılık
ve özellikle kavakçılığa ait misaller üzerinden açıklanmaya çalışılmıştır. Kitap
hazırlanırken, şu üç eserden ağırlıklı olarak yararlanılmıştır:
- Düzgüneş, O. 1963. Bilimsel Araştırmalarda Đstatistik Prensipleri ve
Metodları. Ege Üniversitesi Matbaası, Đzmir.
- Kalıpsız, A. 1981.Đstatistik Yöntemler. Đ. Ü. Orman Fakültesi Yayınları,
Đ. Ü. Yayın No: 2837, O. F. Yayın No: 294, Đstanbul.
- Yurtsever, N. 1984. Deneysel Đstatistik Metodlar. Tarım Orman ve
Köyişleri Bakanlığı, Köy Hizmetleri genel Müdürlüğü, Toprak ve Gübre
Araştırma Enstitüsü Müdürlüğü Yayınları, Ankara. G.Y. No: 121, T. Y. No: 56.
Đstatistik sahasındaki Türkçe yayınlara bir göz atıldığında, bunlardan
çoğunun ekonomi ağırlıklı olduğu görülür. Konumuzu teşkil eden biyometri
ağırlıklı eserler azınlıkta kalmaktadır. Bu bakımdan, kitabın istatistiğe ve
özellikle ormancılık araştırmalarına yeni başlayanlara yararlı olmasını dilerim.
Notları bilgisayarda yazan Yasemin ÖZCAN’a teşekkür ederim.
Mehmet ERCAN
Đzmit, Nisan 1995
VII
VIII
ĐKĐNCĐ BASKIYA ÖNSÖZ
Kavakçılık Araştırma Enstitüsü tarafından ilk baskısı 1995’te yapılan
Bilimsel Araştırmalarda Đstatistik isimli kitap, geçen süre içinde tükenmiştir.
Bunun üzerine kitabın yeniden basılması gündeme gelmiştir.
Kitap ikinci baskıya verilmeden önce, ilk baskısında yer almayan nonparametrik metodlar kısaca ele alınmış, ayrıca bazı yeni bölümler ilave
edilmiştir. Bu cümleden olarak, Ortalamalar ana başlığı altına ilaveler
yapılmış, Populasyonlar daha geniş olarak tanıtılmaya çalışılmış, Örnekleme
ile Araştırmaların Đstatistik Metodlara Göre Değerlendirilmesi ve Sonuç
Raporunun Yazılması isimli yeni iki ana başlık ilave edilmiştir. Son olarak,
Korelasyon ve Regresyon bölümü bazı ilavelerle daha detaylı olarak
açıklanmaya çalışılmış, değişik regresyon modelleri üzerinde örneklerle
durulmuştur.
Bu çalışmalar sırasında, yine Düzgüneş 1963 ve Kalıpsız 1981’in
yanında, non-parametrik metodların yazılmasında,
“Đstatistik Metotlar, 1994. Prof. Dr. Fahri Batu,Karadeniz Teknik
Üniversitesi, Trabzon” isimli eserden yararlanılmıştır.
Araştırmacılara ve tüm okuyuculara yararlı olmasını ve hatalarımın
bağışlanmasını dilerim.
Mehmet ERCAN
Đzmit, 1997
IX
X
1. TANIMLAR, SAYILARIN ELDE EDĐLMESĐ VE
ÖZETLENMESĐ
1.1.Đstatistik
"Đstatistik” çeşitli şekillerde tarif edilmektedir. Bunlardan bazıları
aşağıdaki gibidir:
Đstatistik, toplu (kollektif) olayları gözlemek (sayarak, ölçerek, tartarak),
özelliklerine göre ayırmak (sınıflamak, özetlemek) ve birbirleriyle mukavese
etmek suretiyle toplumu inceleyen bir bilim dalıdır. Bu tarifte istatistiğin "veri
toplama, olayları tanıma" özelliği ön plana çıkmaktadır ve iki önemli unsur söz
konusudur:
• Đstatistik toplu olaylara uygulanır.
• Đstatistik gözleme dayanır.
Đstatistik, bir olay veya olayların etkinlik derecesini uygun örnekler
üzerinde belirlemeye çalışan ve bunlara ait metodlar geliştiren bir bilim dalıdır.
Bu tarifte ise istatistik, bilimsel amaçlı deneme kurma ve değerlendirme bilimi
olarak tanımlanmaktadır.
Đstatistik, toplu olayları inceleyen ve bunlara ilişkin bağıntıları, sebep sonuç ilişkilerini ortaya çıkaran bir bilim dalıdır. Bu tarifte de istatistik, 14.
bölümde "Korelasyon, Regresyon" başlığı altında inceleneceği yönüyle ele
alınmaktadır.
Bu açıklamalara göre istatistiğin, 3 ana konu üzerinde çalıştığı
anlaşılmaktadır:
• Sayıların (verinin) elde edilmesi- özetlenmesi,
• Deneme düzenleme, sonuçların yorumu, genelleştirilmesi,
• Đki ya da daha fazla özellik arasında ilişki aranması.
Đstatistik bilimi, üzerinde çalışılan konuları değerlendirme ve ifade
etmede araştırmacının en büyük yardımcısıdır.
1.2.Tarifler, Tanımlar
1.2.1.Toplu Olayların Özelliği, Tesadüfîlik, Örnekleme,
Tesadüf Örneği
Yukarıda istatistiğin, toplu - kollektif - yığın olaylarını inceleyen bir
bilim dalı olduğu ifade edilmiştir. Sosyal olaylar, ekonomik olaylar ve canlılara
ilişkin olaylar kollektif olaylardır. Bu tür olaylara atipik olaylar denir. Atipik
olaylarda kesinlik yoktur. Bazı vasıfları müşterek olmakla beraber, bireysel
değişiklikler gösteren olaylardır. Mesela herkesin kolu vardır ama kol uzunluğu
kişiden kişiye değişir. Veya her ağacın boyu zamanla uzar, ama belli bir yaşta
hepsinin boyu farklıdır.
Atipik olayların karşıtı, tipik olaylardır. Tipik olaylara genellikle fizik,
kimya, matematikte rastlanır. Bu olaylarda bir birimin gözlemlenmesiyle tümü
hakkında bilgi sahibi olunur. Mesela dairenin yarıçapı biliniyorsa çevresi kesin
olarak bulunabilir.
Đstatistik biliminde sayıların (verinin) toplanmasında birinci prensip
tesadüfîliktir (rastgelelik). Tesadüfîlikten maksat, verinin toplanmasında
hiçbir ayrım gözetmeden, beğenip - seçmeden araştırmaya konu olacak
örneklerin alınmasıdır. Mesela bir kavaklıktan çap örneklemesi yapılırken hep
kalın ağaçların ölçülmemesi gibi.
Đstatistiğin bu yönü, örnekleme adıyla ayrı bir bilim dalı haline gelmiş
ve 5. Bölümde açıklanacağı üzere çeşitli örnekleme metodları geliştirilmiştir.
Örneklemede tesadüfîliğe uyulmalı ve bireylerden her birinin örneğe girme
şansı eşit tutulmalıdır. Bu şekildeki örneklemeye tesadüfî örnekleme, alınan
örneğe de tesadüf örneği (nümunesi) denir. Araştırma ve incelemelerden
aldatıcı sonuç alınmaması için, nümunenin mensup olduğu populasyonu en iyi
şekilde temsil etmesi gerekir. Bu da, nümunenin gerçek bir tesadüf nümunesi
olmasına bağlıdır. Zaten bu kitapta incelenecek istatistik metodIar, tesadüf
nümuneleri için geliştirilmiştir.
1.2.2.Populasyon ve Nümune (Örnek)
Đstatistik bilimi, bir toplumu (populasyonu) nitelik ve nicelikleri yönüyle;
ancak tahmin etme yoluyla tanıma bilimidir. Sonsuz sayıda bireyden meydana
gelen bir topluma populasyon denir. Populasyon, içerdiği bireylerin tümünü
ölçmek, tartmak, saymak mümkün olmadığından, kendisinden rastgele çekilen
tesadüf örnekleri üzerinden tanınmaya çalışılır. Mesela 13 yaşında Đzmit
şartlarında yetişmiş bir kavaklıkta ağaçların çapları, bu vasıfları taşıyan
populasyondan çekilen örnekler üzerinden "tahmin edilir”.
1.2.3.Đstatistik ve Parametre
Örnekler üzerinden hesaplanan değerlere istatistik denir. Mesela
ortalama, standart sapma gibi. Bu değerlerin populasyondaki karşılıklarına ise
parametre denir (Yurtsever. s. 6). Populasyonların tamamı ölçülüp
sayılamadığından, parametreler hiç bir zaman bilinemez; istatistikler üzerinden
tahmin edilir. Bu bakımdan, araştırmaların imkanlar ölçüsünde büyük
nümunelerle yapılması tavsiye edilir. Çünkü nümune büyüdükçe, istatistik
2
parametreye yaklaşır. Đstatistik biliminde istatistik olarak elde edilen değerler
Latin alfabesinde kullanılan harflerle; parametreler ise Yunan alfabesinden
alınan simgelerle gösterilir. Mesela X (aritmetik ortalama) ve s (standart
sapma) birer istatistik, bunların populasyona ait karşılıkları olan µ (mü) ve σ
(küçük sigma) birer parametreyi ifade eder.
1.2.4.Deneme
Örnekleme ile genellikle kendiliğinden veya tabii şartlarda ortaya çıkmış
ve farklı özel etkilere maruz bırakılmamış populasyonlar tanınmaya çalışılır.
Mesela bir tabii Karaçam ormanının veya sıradan bir kavak plantasyonunun
örneklenmesi gibi. Bazı hallerde ise örnekleme, araştırmacı tarafından özel
olarak oluşturulan, kontrol altında tutulan ve belli bir populasyonu temsil ettiği
varsayılan topluluklarda yapılır. Bu şekildeki uygulamalara deneme denir.
Denemelerde bir taraftan özel etkiler hazırlanırken, diğer taraftan sonucu
etkileyecek dış faktörler elden geldiğince eşit tutulmaya ve en aza indirilmeye
çalışılır.
1.3.Sayıların (Verinin) Elde Edilmesi
Nümuneyi oluşturan bireylerin araştırmaya konu olan özellikleri,
saymak, ölçmek veya tartmak suretiyle belirtilir. Mesela bir böcek öldürücü
denemesinde ölen böceklerin sayılması, ormancılıkla ilgili bir çalışmada
ağaçların çap ve boylarının ölçülmesi, bir tarımsal ürün denemesinde sahadan
elde edilen ürünün tartılması gibi. Bu şekilde elde edilen değerlere gözlem,
varyant veya değişken denir. Ancak sayma yoluyla elde edilen sayılar, ölçme
(veya tartma) yoluyla elde edilen sayılardan farklı özellikler gösterirler.
Sayımla elde edilen sayılar tam sayıdır ve kesin sınırlarla birbirinden ayrılır.
Ölçme-tartma ile elde edilenler ise kesirlidir, kesintisiz ve süreklidir. Bunlar,
birbirine çok yakındır ve devamlılık gösterirler. Mesela ağaçlar üzerindeki
böcek sayısı tam sayılarla ifade edilir ama, bu ağaçların çapları birinden
diğerine çok az farklılıklarla değişim gösterebilir. Bu nedenle sayılarak elde
edilen varyantlara tam veya kati, ölçülerek-tartılarak elde edilenlere sürekli
değişken veya devamlı değişken denir.
Đki grup arasındaki farklılık, bunların istatistik analiz ve
değerlendirmelerinin de farklı olmalarına sebep olur. Ancak bazı sayma
suretiyle elde edilen sayılar, ölçme suretiyle elde edilenlerin özelliklerine sahip
olabilirler. Bu takdirde onlar gibi işleme tabi tutulmaları gerekir. Bu hususta
verilecek karar, sayıların gösterdiği dağılışa bağlıdır; ki bu da frekans tablosu
ve grafiğinden anlaşılabilir.
Đncelenen özellik genellikle nicel (miktara bağlı, kantitatif), bazan da
nitel (vasıflandırılabilir, kalitatif) karakterlidir. Mesela ağaçların çapları
3
kantitatif, gövde formlarının iyiliği-kötülüğü, dallanma özellikleri vs ise
kalitatif özelliklerdir.
Bir örneklemeyle elde edilmiş, hiçbir işleme tabi tutıılmaınış bireysel
verilere kaba veriler denir.
1.4.Sayıların Özetlenmesi
Sayılar, özellikle çok miktarda iseler, toplandıkları sıra ve şekilde
araştırıcıya bir fikir veremezler. Bunlardan en sık rastlananların hangileri
olduğu, nasıl bir değişim gösterdikleri ve ilerki Bölümlerde açıklanan
populasyon tiplerinden hangisine dahil oldukları hususunda sınıflanmaları,
özetlenmeleri gerekir. Sayıların her hangi bir şekilde düzenlemiş, sınıflanmış
haline dağılım veya seri denir.
Sayılar, sıralı dizi, frekans tablosu ve grafik halinde özetlenebilirler.
1.4.1.Sıralı Dizi
Sıralı dizi, az sayıdaki (genellikle 10'dan az) varyantın, küçükten büyüğe
dizilerek sıralanmasıdır. Sıralı diziye basit seri de denir.
Misal 1.1: Bir örnekleme ile, 10 ağacın boyları m cinsinden aşağıdaki
gibi ölçülmüştür:
16.4, 18.8, 16.5, 17.1, 16.7, 17.3, 16.l, 15.8, 16.8, 16.4.
Bunlar sıralı dizi haline getirilecek olursa:
15.8, 16.1, 16.4, 16.5, 16.7, 16.8, 16.9, 17.1, 17.3, 18.8.
Böylece 10 ağacın boyları ve boyların gösterdiği değişim hakkında daha
kolay ve açık bilgi sahibi olunabilir. Bu bakımdan sıralı dizinin kaba verilere
nazaran avantajları şöyle özetlenebilir:
• Uç değerler (en küçük-minimum boy ve en büyük-maksimum boy)
hemen görülebilir: 15.8 m ve 18.8 m.
• Sayıların hangi değer etrafında toplanma eğiliminde olduğu
anlaşılabilir: Misalde en çok l6'lı boylar ölçülmüştür. O halde bu değer
etrafında bir toplanma vardır.
• Uç değerlerin, toplanma eğilimi gösterilen sayıdan ne miktarda uzak
olduğu anlaşılabilir.
Bu avantajlarına karşılık, gözlem sayısı arttıkça verilerin sıralı dizi
haline getirilmesi zaman alıcı, sıkıcı bir hal alır. Bu durumda diğer metodlar
tercih edilmelidir.
1.4.2.Frekans Tablosu
Frekans tablosu, varyantların sınıflandırılmasıyla yapılır. Frekans
tablosu haline getirilmiş bir seri, varyantları sayma suretiyle elde edilmişse
tasnif edilmiş seri, ölçme-tartma suretiyle elde edilmişse gruplandırılmış seri
4
adını alır. Sınıflar, alt ve üst sınır değerleri i1e belirtilir. Her sınıfın alt ve üst
değerinin ortalamasına sınıf değeri denir. Sınıf değerleri arasında eşit açıklıklar
bulunmalıdır. Bu açıklığa sınıf genişliği veya sınıf açıklığı denir. Bir frekans
tablosunun düzenlenmesinde en önemli iş, sınıf genişliğinin tesbitidir. Sınıf
genişliği fazla tutulduğunda sınıf adedi azalmış ve varyantlar sadece birkaç
sınıfa dağılmış olurlar. Bu durumda oldukça farklı varyantlar aynı sınıfa
girerek, toplum hakkında yetersiz veya yanlış bilgi verebilirler. Sınıf genişliği
az olursa, bu defa fazla miktarda sınıf oluşacağından, özetlemeden beklenen
yarar sağlanamaz.
Frekans tablolarında genellikle 10-15 sınıf bulundurulur. Sınıf sayısı
tesbit edildikten sonra, nümunedeki en büyük varyant ile en küçük varyant
arasındaki fark sınıf sayısına bölünerek, sınıf genişliği yaklaşık olarak elde
edilir. Sınıf genişliğinin kolay anlaşılır, mantıklı olmasına dikkat edilir. Mesela
ağaçlarda boy sınıflaması yapılırken 0.30 m yerine, 0.25, 0.50 veya 1 m'lik
sınıflar gibi kolay algılanır sınıf genişlikleri esas alınır.
Bazı hallerde ise mevcut tecrübelere, verinin özelliğine göre veya
frekans tablosunun anlaşılmasını kolaylaştırmak için önce sınıf genişliği
belirlenir. Bu durumda, en büyük varyant ile en küçük varyant arasındaki fark
sınıf genişliğine bölünerek sınıf adedi bulunmuş olur.
Misa1 1.2: Bir kavak fidanlığından rastgele ölçülen 2 yaşında 50 fidanın
boyları Tablo 1.1'de verilmiştir.
Tablo 1.1: 50 adet kavak fidanının boyları (m)
7.0
7.6
6.0
6.5
9.0
9.1
6.6
5.9
7.9
8.2
8.3
7.1
7.7
8.9
7.7
7.8
6.6
6.2
7.9
8.4
7.0
8.5
9.6
6.6
9.1
6.7
7.0
8.1
7.3
7.7
7.5
8.0
6.8
7.4
6.6
6.1
8.3
7.2
6.3
8.7
8.1
7.5
7.1
6.7
7.3
8.6
8.2
7.9
7.7
5.6
Tabloda en büyük sayı 9.6, en küçük sayı 5.6 olduğuna göre, 10 sınıf
yapılması halinde sınıf genişliği:
9.6 − 5.6
= 0.4 m
10
olacaktır. Ancak 0.4 m yerine, 0.5 m'lik sınıf genişliğinin daha mantıklı olacağı
açıktır. Bu durumda sınıf adedi:
9.6 − 5.6
= 8 bulunur.
0.5
5
Sınıf genişliği veya sınıf adedinden sonra ikinci olarak, en küçük sınıfın
alt sınırı tesbit edilir. Misalde en küçük varyant 0.6 olduğuna göre, bunun en
küçük sınıfa girmesi gerekir. Sınıf genişliği 0.5 m olarak tesbit edildiğine göre,
en küçük sınıfın alt sınır değeri 5.5 m olacaktır. Böylece sınıf sayısı 9 olur.
Burada yapılması gerekli bir diğer iş, sınıf üst sınırlarının tesbitidir. Bu
tesbitler, bir sınıfın üst sınırı ile bunu takip eden sınıfın alt sınırı arasında hiç
bir sayı kalmayacak, bir sayı iki sınıfta birden yer almayacak ve sınıf sınırları
varyantların ölçüldükleri küsuratta sayılarla ifade edilecek şekilde yapılır. Bu
prensiplere göre burada ilk sınıfın üst sınırı 5.9 olmaktadır.
Đlk sınıf değeri ise yukarıda açıklandığı üzere:
55
. + 5.9
= 5.7 m
2
olarak belirlenir. Diğer sınıfların alt sınırları, üst sınırları ve sınıf değerleri, bu
değerlere sınıf genişliğinin ilavesiyle bulunur.
Sınıflar böylece tesbit edildikten sonra, varyantlar sıra ile okunarak,
dahil oldukları sınıfın hizasına bir çizgi çekilir. Bu işlemin yapılmasıyla,
frekans tablosu tamamlanmış olur (Tablo 1.2).
Tablo 1.2: 50 fidanın boylarına ait frekans tablosu
Sınıflar
(m)
5.5-5.9
6.0-6.4
6.5-6.9
7.0-7.4
7.5-7.9
8.0-8.4
8.5-8.9
9.0-9.4
9.5-9.9
Sınıf
Değeri (m)
5.7
6.2
6.7
7.2
7.7
8.2
8.7
9.2
9.7
Toplam
Frekans (f)
Đşaretle
Sayı ile
2
II
4
IIII
8
IIIII III
9
IIIII IIII
11
IIIII IIIII I
8
IIIII III
4
IIII
3
III
1
I
50
Her sınıfın hizasındaki çizgi sayısı,o sınıfın frekansıdır. Artık bütün
varyantlar kendi değerleri ile değil, bulundukları sınıfın sınıf değeri ile
tanınırlar. Bu durum bazı hatalara sebep olmakla beraber, bu hatalar ihmal
edilebilecek kadar küçüktür ve varyant sayısı arttıkça daha da küçülür. Bu
şekilde hazırlanan bir frekans tablosu. bize şu bilgileri verir:
• Nümunede en faz1a bulunan boylar 7.7 m sınıf değeriyle temsil
edilen 7,5-7,9 sınıfında yer almaktadır. Demek ki 7,7 değeri etrafında
toplanma eğilimi vardır. O halde örneğin çekildiği fidanlıktaki fidanların
6
ortalama boylarının 7,7 m civarında olduğu söylenebilir.
• Bundan daha kısa veya uzun boylu fidanlar iki yana doğru tedricen
azalmaktadır.
• Bu haliyle boyların dağılımı, ileride görüleceği üzere bir normal
dağılıma benzemektedir. O halde normal dağılıma ilişkin analiz
metodları kullanılabilir.
Ayrıca verinin sınıflandırılması, ortalama ve varyans hesabında bazı
kolaylıklar sağlar.
1.4.2.1.Eklemeli (Kümülatif) Frekans Tablosu
Bazı hallerde. belli bir değerden daha küçük ve daha. büyük varyantların
mutlak ve nisbi (oransal-%) miktarları bilinmek istenebilir. Bu bilgiyi bize
eklemeli (birikimli-kümülatif) frekans tablosu verir. Böyle bir tablo, normal
bir frekans tablosunda, ilk sınıftan itibaren ard arda gelen frekansların üst üste
toplanmasıyla elde edilir. Tablo 1.2'deki frekans tablosunun, eklemeli frekans
tablosu haline getirilmiş şekli Tablo l.3'de görülmektedir.
Tablo l.3: 50 fidanın boylarına ait eklemeli frekans tablosu
Sınıflar
Sınıf
Değeri
(m)
(m)
5.7
5.5-5.9
6.2
6.0-6.4
6.7
6.5-6.9
7.2
7.0-7.4
7.7
7.5-7.9
8.2
8.0-8.4
8.7
8.5-8.9
9.2
9.0-9.4
9.7
9.5-9.9
Toplam
Frekans
Frekans
(f)
2
4
8
9
11
8
4
3
1
50
(%)
4
8
16
18
22
16
8
6
2
100
Eklemeli Frekanslar
(mutlak)
2
6
14
23
34
42
46
49
50
(%)
4
12
28
46
68
84
92
98
100
Tablodan, düzenlenme tekniği anlaşılabilir. Son sütundaki değerler,
eklemeli mutlak değerlerin varyantlar toplamına bölünüp, sonucun 100 ile
çarpılmasıyla elde edilir.
Eklemeli frekans tablosu okuyucuya, belli sınıf değerlerinden daha
küçük veya daha büyük varyantların örnekteki toplam ve oransal miktarını
verir. Görüldüğü üzere nümunede boyu 6.9 m dahil (veya 7 m'den daha küçük)
fidanların adedi 14, nisbi miktarı ise % 28'dir. 8.5 m dahil daha uzunlar ise 5042= 8 adet ve %100-%84=%16 olarak hesaplanır. Bu durum, örneğin çekildiği
fidanlığa (veya populasyona teşmil edilecek olursa, bu fidanlıktaki fidanların 7
m'den daha kısa, %16'sının ise 8.5 m ve daha uzun olduğu söylenebilir. Bu tür
tablolara 'den daha az tablosu da denmektedir.
7
1.4.3. Grafikler
Grafikler, frekans tablolarının şekiller halinde gösterilmesidir. Pek çok
grafik tipi olmakla beraber bu tablolar için uygun olanlar, daire grafik,
çubuklu diyagram, histogram ve frekans eğrileridir. Grafikler 2 veya 3
boyutlu olarak çizilebilir.
1.4.3.1.Daire (Pasta) Grafik
Daire grafik, bir bütünün parçalarını gösteren sayılara uygun grafik
şeklidir. Frekans tablosundaki frekansları ifade eden sayılar %'ye
dönüştürülerek daire grafiği halinde gösterilebilir. Tablo 1.3'deki % frekanslar,
Şekil 1.1'de 3 boyutlu daire grafiği halinde gösterilmiştir.
8.7
8%
9.2
6%
9.7 5.7
2% 4%
6.2
8%
6.7
16%
8.2
16%
7.2
18%
7.7
22%
Şekil 1.1: Tablo 1.3'deki % frekansların daire grafiği
1.4.3.2.Çubuklu Diyagram
Çubuklu diyagramlar, esasen sayımla elde edilen varyantların kesik
kesik olan dağılımlarını göstermek amacıyla kullanılır. Bunun için bir
koordinat sisteminde X ekseni boyunca sınıf değerleri, Y ekseni boyunca
frekanslar belli bir ölçek çerçevesinde yerleştirilerek, her sınıf değerine ait
frekans, büyüklüğü ölçüsünde bir çizgi ile gösterilir. Tam uygun olmamakla
beraber (çünkü bu misaldeki değerler sayımla elde edilmiş değildir) Tablo
1.1'deki varyantlar Şekil 1.2'deki gibi bir çubuklu diyagram ile gösterilebilir.
8
9.7
9.2
8.7
8.2
7.7
7.2
6.7
6.2
6
4
2
0
5.7
Frekans
12
10
8
Boylar (m)
Şekil 1.2: Tablo 1.1'deki frekans tablosunun çubuklu diyagramı
1.4.3.3.Histogram
Histogramlar, ölçme-tartma yoluyla elde edilmiş, devamlılık gösteren
varyantlara ait frekans tablolarına uygun grafik şeklidir. Histogram türü bir
grafikte, yine bir koordinat sisteminde X ekseni boyunca sınıf alt değerleri
işaretlenerek frekanslar Y ekseni boyunca dikdörtgen sütunlarla gösterilir.
Böylelikle sınıf değerleri sütunların ortasına rastlar. Her sınıftaki dikdörtgen
alanı, o sınıftaki varyantların dağılımda kapladıkları sahayı gösterir. Tablo
1.1'deki dağılıma ait histogram, Şekil 1.3'de görülmektedir:
12
Frekans poligonu
Frekans
10
Frekans eğrisi
8
6
4
2
9.7
9.2
8.7
8.2
7.7
7.2
6.7
6.2
5.7
0
Boylar (m)
Şekil 1.3 Tablo 1.1'deki frekans tablosunun histogramı
frekans poligonu ve frekans eğrisi
9
1.4.3.4.Frekans Poligonu ve Frekans Eğrisi
Bir histogramdaki dikdörtgenlerin üst kenar orta noktaları birer çizgi ile
birleştirilirse meydana gelen kırık çizgiye frekans poligonu denir.
Dikdörtgenlerin üst kenar ortaları bir eğri halinde birleştirilirse bu defa frekans
eğrisi elde edilir. Bu grafik de, histogramdaki gibi bir saha ifade eder. Eğrinin
tümünün altında kalan alan, dağılımın % 100'ü demektir. Tablo 1.3'deki verinin
frekans eğrisi ve frekans poligonu Şekil 1.3'te gösterilmiştir.
Frekans eğrileri, histogramlara nazaran dağılımı daha iyi aksettirir.
Çünkü bir histogramda dikdörtgen içindeki değerlerin tümü, o sınıfa ait sınıf
değerine sahip değildir. O sınıf içinde bile, küçükten büyüğe, yani sınıfın alt
sınırından üst sınırına doğru bir değişim görülür. Halbuki histogramda bir sınıf
içindeki değerlerin tamamı, sınıf değerine sahipmiş gibi görünmektedir.
Frekans eğrileri, nümunenin çekilmiş olduğu populasyona veya
örneklemenin doğru, örneğin yeterli olup olmamasına göre simetrik veya
çarpık olabilmektedir. Ölçme - tartma suretiyle elde edilen veriler simetrik,
sayma suretiyle elde edilen veriler ise çarpık bir eğri gösterme eğilimindedirler.
Simetrik eğri göstermesi beklenen bir dağılım çarpık şekil arzediyorsa,
nümunenin yetersizliğinden veya nümune alınmasında yapılmış hatalardan söz
edilebilir.
10
2. MERKEZĐ EĞĐLĐM ÖLÇÜLERĐ
(ORTALAMALAR)
2.1.Ortalamanın Tanımı ve Özellikleri
Gözlem sonuçları frekans tabloları halinde özetlenmekle, en küçük ve en
büyük sayı bunların toplanma eğilimi gösterdikleri nokta ve bu noktadan
uzaklaşmalar görülebilmekte, böylelikle örneğin alındığı toplum hakkında fikir
sahibi olunabilmektedir. Ancak böyle bir gruplama serilerin mukayesesine
imkan vermez. Bir seri, kendini sayısal olarak temsil edebilen tek bir sayı ile
ifade edilebilmelidir. Bu sayıya ortalama denir.
Bir populasyondan alınan örneğe ait varyantların, frekans tablolarında
görüldüğü üzere etrafında kümelendikleri noktaya merkezi eğilim noktası
denir ve yeri ortalama ile belirlenir.
2.1.1.Ortalamaların Genel Özellikleri
Ortalamanın özellikleri aşağıdaki gibi sayılabilir:
• Ortalama, gözlemlerin hangi nokta etrafında toplanmış olduğunu
gösterir. Bu bakımdan merkezi eğilim ölçüsü olarak da bilinir.
• Ortalama, serinin maksimum ve minimum değerleri arasında yer alır.
• Seri ilerki bölümlerde açıklanacak “normal dağılım”a uygunluk
gösteriyorsa, ortalama frekans eğrisinin tepe noktasında yer alır.
• Seri normal dağılıma uymuyorsa, ortalama tepe noktasından
uzaklaşır.
Bu bakımdan, bir ortalamanın sağlıklı olabilmesi için, ölçme- tartma ile
elde edilmiş bir serinin frekans eğrisinin tek tepeli olması arzu edilir. Birden
fazla tepe bulunduran bir frekans dağılımı, örneklemenin yetersiz, yanlış
yapıldığını veya araya bu topluma ait olmayan bireyler karıştığını gösterir.
2.1.2.Ortalamaların Üstünlükleri
• Ortalama bütün bir serinin bireylerini temsil eden tek bir sayı olduğu
için akılda tutulması kolaydır.
• Ortalama olayların “normal” halinin ifadesidir. Anormal durumları
göstermez. Bu bakımdan inandırıcılığı fazladır. Olaylar genellikle
ortalama değerleri ile belirtilir. Mesela bir yörede ocak ayında “ortalama
sıcaklık"tan söz edilir.
11
• Normal hallerin ifadesi olan ortalamalar, anormal durumların da bir
ölçüsüdür. Çok zayıf gelişmiş bir kavak plantasyonunda, çapların ne
derece ince olduğu, o yaştaki normal bir plantasyonun çaplarının
ortalamasıyla karşılaştırmakla anlaşılır.
• Ortalamaların en üstün yönü, olayların mukayesesine yaramasıdır. Đki
seri birbiriyle ortalamaları vasıtasıyla karşılaştırılır.
2.1.3.Ortalamaların Kusurları
• Büyük miktarlarda gözleme dayanmayan veya yanlış örnekleme
sonucu elde edilmiş ortalamalar fazla bir şey ifade etmez. Mesela bir
şehrin tek bir mahallesine gidip 3-5 aileyi örneklemekle, o şehir halkının
gelir düzeyini belirlemek yanıltıcı sonuç verebilir. Dolayısıyla
güvenilirlikten uzaktır.
• Ortalamalar bazan veriler arasındaki karakteristik farkları ortadan
kaldırabilir. Mesela Tarih dersinden 5, Matematik’ten 10 alan bir
öğrenci, ortalaması 7 olduğundan bu iki derse karşı aynı derecede
yetenekli gibi görünür. Halbuki öğrencinin Tarih'e karşı hiç hevesi
yoktur.
• Ortalamalar bazan gerçekleri yansıtmayabilir. Örneğin aylık ortalama
gelirleri 5.000.000 TL civarında olan 100 hanelik bir köye, aylık geliri
1.500.000.000 TL olan bir aile taşındığında, köyün ortalama geliri
20.000.000 TL/hane'ye yükselir. Ancak bu durum yanıltıcıdır.
2.1.4.Ortalamaların Kusurlarını Gidermenin Yolları
• Ortalamaların yukarıda sayılan kusurlarını gidermek için, şu kurallara
uymak gerekir:
• Ortalama mutlaka çok bireyli serilere dayandırılmalıdır. Az sayıda
gözleme dayalı ortalamalar gerçeği yansıtmayabilir. Bu kural bir
anlamda büyük örneklerle çalışmayı tavsiye etmektedir. Önceki
Bölüm’de “parametre”nin tarifinden anlaşılacağı üzere, örnekteki
gözlem sayısı arttıkça istatistik parametreye yaklaşmakta, toplum daha
iyi tanınmaktadır.
• Ortalama, bireyleri homojen olmayan bir seri üzerinden
hesaplanmamalıdır. Hem yerli, hem melez kavağın kullanıldığı bir
kavaklıkta, kavaklığın tümü üzerinden mesela yıllık ortalama verimi
hesaplamak yanlıştır. Bu kural da, örneklemenin homojen materyal
üzerinden yapılması anlamına gelir.
• Anormal bireyleri ihtiva eden serilerin ortalaması alınmamalı veya bu
kusuru giderecek yöntemler uygulanmalıdır. Bir seriye anormal veriler,
muhtemelen örneklemede tesadüfiliğe uyulmamasından veya ölçme
12
hatalarından girebilir.
2.2.Ortalamaların Sınıflandırılması
Ortalamalar, analitik (parametrik) ve analitik olmayan (parametrik
olmayan) ortalamalar olmak üzere iki ana gruba ayrılır. Analitik ortalamaların
hesabında, serinin bütün değerleri işleme girer. Bunlar, aritmetik, tartılı
aritmetik, geometrik, ahenkli (harmonik) ve kareli ortalamalardır. Serinin
bütün değerleri üzerinden hesaplanmayan (analitik olmayan) ortalamalar ise
medyan (ortanca) ve mod'tur. Analitik ortalamalar biyolojik olaylarda,
analitik olmayan ortalamalar ise daha çok sosyal ve ekonomik alanlarda
kullanılmaktadır.
2.3.Analitik Ortalamalar
2.3.1.Aritmetik Ortalama
Bir populasyonun belirtilmesine yarayan parametrelerin en önemlisi
aritmetik ortalamadır. Aritmetik ortalama aynı zamanda en yaygın olarak
kullanılan ortalamadır.
Đstatistikte "ortalama” denilince aritmetik ortalama anlaşılır. Serinin
türüne göre, kolaylık açısından hesaplamada değişik yollar izlenebilir.
2.3.1.1.Basit Serilerde Aritmetik Ortalama
Aritmetik ortalama, değişkenlerin (varyantların) toplamını, değişken
adedine bölmekle hesaplanır. i kadar terimden meydana gelen bir serinin
terimleri toplamı ΣX ile, terim adedi n ile gösterilirse, aritmetik ortalama
aşağıdaki formülle ifade edilir:
X=
ΣX i
n
(2.1)
Bundan sonra sıkça karşılaşılacak olan Yunan alfabesinden alınma Σ
(büyük sigma) işareti formüllerde toplam anlamında kullanılmaktadır.
Misal 2.1: Bir fidanlıkta rastgele örnekleme ile ölçülen 50 adet kavak
fidanının boy ortalamasını bulalım. Tablo 2.1'de değişkenler (büyükten küçüğe
sıralanarak) basit seri halinde verilmiştir.
13
Tablo 2.1: 50 fidanın boyları (m)
5.6
6.6
7.3
7.8
8.3
X=
5.9
6.7
7.3
7.9
8.4
6.0
6.7
7.4
7.9
8.5
X 1 + X 2 +...+ X 50
50
6.1
6.8
7.5
7.9
8.6
=
6.2
7.0
7.5
8.0
8.7
6.3
7.0
7.6
8.1
8.9
6.5
7.0
7.7
8.1
9.0
5.6 + 5.9+...+9.6 375.6
=
50
50
6.6
7.1
7.7
8.2
9.1
6.6
7.1
7.7
8.2
9.1
6.6
7.2
7.7
8.3
9.6
=7.512
2.3.1.2.Sınıflanmış Serilerde Aritmetik Ortalama
Önceki Bölüm'de açıklandığı üzere, sınıflanmış seriler, sayma yoluyla
elde edilmiş varyantlara uygulanmaktadır. Böyle bir seride aynı değere sahip
terimler bir frekans tablosunda tasnif edilir. Aritmetik ortalamayı hesaplamak
için, terimlerle frekanslar çarpılarak toplanır ve sonuç frekanslar toplamına
bölünür.
X=
ΣX i × f i
(2.2
Σf i
Misal 2.2: 50 adet öğrencinin istatistik dersinden almış olduğu notlar
Tablo 2.3'deki gibi sınıflanmış olsun. Tablonun 3. sütununda notlarla
frekansların çarpımları verilmiştir.
Tablo 2.2: 50 öğrencinin notları
Terimler
(Notlar)
Xi
1
2
3
4
5
6
7
8
9
10
Toplam
Frekanslar
Adet
fi
3
4
7
12
10
5
4
3
1
1
50
Xi×fi
3
8
21
48
50
30
28
24
9
10
231
(2.2) nolu formüle göre X =231/50=4.62 bulunur.
2.3.1.3.Gruplanmış Serilerde Aritmetik Ortalama
Gruplandırılmış serilerde terimlerin yerine sınıf değerleri geçer. Bu
14
bakımdan, önce seri frekans dağılımı haline getirilir. Daha sonra sınıf değerleri
(mi) ile frekanslar (fi) çarpılarak toplanır ve sonuç frekanslar toplamına
bölünür. Đşlemlerin formül ile ifadesi aşağıdaki gibidir:
X=
Σmi × f i
(2.3)
Σf i
Misal 2.3: Misal 1.2’deki fidanların, gruplandırılmış seriler metoduna
göre aritmetik ortalamasını hesaplayalım:
Gerekli işlemler yapılarak Tablo 2.3'de verilmiştir.
Tablo 2.3: 50 fidanın frekans dağılımı
Sınıflar
(metre)
5.5-5.9
6.0-6.4
6.5-6.9
7.0-7.4
7.5-7.9
8.0-8.4
8.5-8.9
9.0-9.4
9.5-9.9
Sınıf değerleri
(mi) metre
5.7
6.2
6.7
7.2
7.7
8.2
8.7
9.2
9.7
Toplam
fi
Adet
2
4
8
9
11
8
4
3
1
50
mi×fi
11.4
24.8
53.6
64.8
84.7
65.6
34.8
27.6
9.7
377.0
Formüle göre X =377/50=7.54 bulunur.
Burada dikkat çeken bir özellik vardır. Daha önce basit seriler metoduna
göre aritmetik ortalama 7.512 m hesaplanmışken, bu defa 7.54 m bulunmuştur.
Đkisi arasındaki 7.54 - 7512 = 0.028 m'1ik (2.8 cm’lik) fark, gruplandırmadan
meydana gelmektedir. Çünkü bu defa varyantlar hesaba kendi değerleri ilc
değil, dahil oldukları grubun sınıf değeri i1e alınmışlardır. Mesela, 9.7 sınıf
değerine sahip son gruba giren bireyin asıl değeri 9.6 m’dir. Ancak gruplara
giren birey sayısı arttıkça, grup içindeki ortalama değer sınıf değerine
yaklaşacağından, gruplandırılmış serilerde hesaplanan aritmetik ortalama, basit
serilerde hesaplanan aritmetik ortalamaya yaklaşır. Bu bakımdan. çok fazla
varyanttan meydana gelen serilerde, el ile hesaplama yapılacaksa, hesap
hatasından kaçınmak için, gruplandırma yapmakta yarar vardır.
2.3.1.4.Aritmetik Ortalamanın Özellikleri
• Aritmetik ortalama olarak hesaplanan değer, örnekteki tüm değerlerin
merkezinde yer alır ve değişkenler bu değerin iki tarafında eşit sayıda
dağılır (normal dağılımlarda).
15
• Aritmetik ortalama terimlerin sayısı ile çarpılırsa serinin toplamı elde
edilir.
• Değişkenlerin, aritmetik ortalamadan farklarının (ayrılışlarının)
cebirsel toplamı sıfırdır. Mesela aritmetik ortalaması 7 olan aşağıdaki
gibi bir seride bu durum görülebilir:
Xi
X
3
4
7
9
12
7
7
7
7
7
Xi - X
-4
-3
0
2
5
0
Toplam
(Xi - X )2
16
9
0
4
25
54
• Değişkenlerin, aritmetik ortalamadan farklarının kareleri toplamı ise
herhangi bir ortalamadan sapmaya nazaran mutlaka daha küçüktür.
• Aritmetik ortalama diğer ortalamalara nazaran hassas bir ortalamadır.
Uç (ekstrem) değerlerden çok etkilenir.
2.3.2.Tartılı (Ağırlıklı) Aritmetik Ortalama
Örneklenen populasyon bir takım farklı alt gruplardan meydana
geliyorsa, örnek de bu alt grupları bünyesinde bulundurur. Böyle hallerde
örneğin ortalamasını hesaplamak için tartılı (ağırlıklı) ortalama kullanılır.
Her gruba önemiyle orantılı belirli katsayılar (tartılar, ağırlıklar) verilir.
Mesela, kiloları ortalaması 48 olan 20 kız öğrenci ve yine kiloları ortalaması 64
olan 35 erkek öğrenciden oluşan bir sınıfın ortalamasını bulmak için, her iki
grubun ağırlık ortalamasını toplayıp ikiye bölmek yanlıştır. Çünkü sınıf kızlar
ve erkekler olarak iki alt gruptan oluşmaktadır. Böyle yapılırsa 20 kız, 35 erkek
gibi temsil edilir. (2.4) nolu formülde görüldüğü üzere doğru metod, her a1t
grubun ortalamasını kendi gözlem adediyle (ağırlık) çarpıp, çarpım sonuçlarını
toplayarak örnekteki gözlem adedine bölmektir. Bu bakımdan tartılı aritmetik
ortalamaya bazı kitaplarda ortalamaların ortalaması da denir.
X T=
ΣX i × t i
Σt i
(2.4)
Bir misal olarak, öğrencilerin not ortalamasını hesaplamada okul
idaresince derslere verilen ağırlıklar gösterilebilir:
Misal 2.4: Bir öğrencinin aldığı dersler ve bunların ağırlıkları Tablo
2.4'te verilmiştir. Bu öğrencinin tartılı not ortalaması aşağıdaki gibi hesaplanır:
16
Tablo 2.4: Bir öğrencinin notları ve notların tartıları
Dersler
Đktisat
Maliye
Đstatistik
Hukuk
Đngilizce
Toplam
Tartılar
ti
4
3
3
2
1
13
Notlar
(Xi)
9
7
7
7
5
35
Xi×ti
36
21
21
14
5
97
X T =97/13=7.46 bulunur. Serinin tartısız aritmetik ortalaması ise 7’dir.
2.3.3.Geometrik Ortalama
Genel tarifiyle geometrik ortalama, n adet pozitif sayının çarpımlarının
n'inci dereceden köküdür.
2.3.3.1.Basit Serilerde Geometrik Ortalama
Yukarıdaki tarife göre, basit serilerde geometrik ortalama şu formüle
göre hesaplanır:
1/n
X G = n X 1 × X 2 ×...× X n = (X1×X2× . . . ×Xn)
(2.5)
Bunun çözümü, istenen dereceden kök hesap edebilen hesap makineleri
ile yapılabildiği gibi, logaritmik yoldan:
 log X 1 + log X 2 +...+ log X n 
 Σ log X i 
X G =Antilog 
 =Antilog 





n
n
(2.6)
formülü ile de yapılabilir.
Görüldüğü üzere geometrik ortalama, varyantların logaritmalarının
aritmetik ortalamasının antilogaritmasıdır.
Misal 2.5: Aşağıdaki basit serinin geometrik ortalamasını hesaplayalım:
Xi
3
4
9
12
Toplam
log Xi
0.47712
0.60206
0.95424
1.07918
3.11260
Log X G =3.1126/4=0.77815 ve X G =6 hesaplanır. Varyant sayısının
böyle az olduğu durumlarda hesaplama aşağıdaki gibi yapılarak:
X G = 4 3 × 4 × 9 × 12 = 4 1296
X G =(1/4)log1296=0.77815 ve
17
X G = antilog(0.77815) = 6 bulunur.
2.3.3.2.Sınıflandırılmış Serilerde Geometrik Ortalama
Sınıflandırılmış
serilerde
geometrik
ortalama,
varyantların
logaritmalarının, frekansları ile çarpılıp, çarpımların toplamının frekansların
toplamına bölünmesi ve sonucun antilogaritmasının alınmasıyla bulunur:
 Σ log X × f 
i
i

X G =Antilog
Σf i


(2.7)
Misal 2.6: 15 işçinin saat başına almış oldukları ücretler Tablo 2.5'te
verilmiştir. Ücretlerin geometrik ortalamasını hesaplayalım:
Tablo 2.5: 15 işçinin ücretleri
Ücretler (TL)
Xi
50000
60000
100000
Toplam
fi
LogXi
fi×Log Xi
5
7
3
15
4.69897
4.77815
5.00000
23.49485
33.44705
15.00000
71.94190
LogGO=71.9419/15=4.79613 ve GO=Antilog(4.79613)=62536 TL.
2.3.3.3.Gruplandırılmış Serilerde Geometrik Ortalama
Hesaplanış tarzı sınıflandırılmış serilerdeki gibidir. Ancak burada
varyantların yerini sınıf değerleri alır.
 Σ log m × f 
i
i

X G =Antilog
Σ
f


i
(2.8)
Misal 2.7: Bir sınıfta 54 öğrencinin aldığı notlar Tablo 2.6'daki gibi
gruplandırılmıştır. Sınıfın geometrik not ortalamasını hesaplayalım:
Tablo 2.6: 54 öğrencinin notları
Not grupları
Xi
4 - 6’dan az
6 - 8’den az
8 - 10’dan az
10
Toplam
Frekans
fi
17
23
11
3
54
Sınıf değeri
mi
5
7
9
10
18
Log mi
0.69897
0.84510
0.95424
1.00000
fi×log mi
11.88249
19.43730
10.49664
3.00000
44.81643
2.3.3.4.Geometrik Ortalamanın Özellikleri
• Geometrik ortalamada varyantların ortalamaya oranlarının çarpımı 1'e
eşittir. 2.3.3.1 maddesinde geometrik ortalamanın 6 hesaplandığı misal
ele alınacak olursa,
3
6
×
4
6
×
9
6
×
12
6
=1296/1296=1 bulunur.
• Aritmetik ortalama daima geometrik
Aşağıdaki gibi iki seride görüleceği üzere:
A serisi
100
101
100.49
100.5
GO
AO
ortalamadan
büyüktür.
B serisi
100
1
10
50.5
terimler arasındaki fark büyüdükçe, ikisi arasındaki fark da GO aleyhine
büyür. Tersi halinde iki değer birbirine yaklaşır. Bıı özelliği dolayısıyla
GO bilhassa değişim oranı bir önceki değere bağlı durumlarda kullanılır.
Canlı organizmaların çoğalma hızlarının bulunması, bileşik faiz ve fiyat
endekslerinde ortalama değişim oranlarının hesaplanması gibi. Fiyatlarda
görülecek ani düşüş veya artışlar GO ile daha uygun şekilde ifade
edilebilir. Aşağıda A ve B maddesinin 1970 ve l975’deki fiyatları ve
1975 endeksleri incelenecek olursa:
Madde
1970
1975
A
B
160
400
320
200
1975 endeksi
(1970=100)
200
50
l975 yılı endeks ortalamasının AO olarak 125, GO olarak 100 olduğu
görülür. Durumu daha iyi aksettirdiğï için, bunlardan endeks için GO
kullanılır.
• Yine varyantları arasında büyük farkların bulunduğu serilerde, serinin
geometrik
ortalamasının
hesaplanması,
durumu
daha
iyi
aksettirmektedir. Mesela 4 dersten zayıf (1, l, 1, 2) ve bir dersten tam not
(10) almış bir öğrencinin not ortalaması AO olarak 3, GO olarak
1.82’dir. Öğrencinin genel durumu çok kötü olmasına rağmen, AO öyle
göstermemektedir. Bu durum, ayrıca geometrik ortalamanın, ekstrem
değerlerden etkilenmediğinin bir ifadesidir.
• Ancak seride sıfır veya eksi değer olması halinde GO hesaplanamaz.
19
2.3.4.Ahenkli (Harmonik) Ortalama
Harmonik ortalama, değişkenlerin terslerinin (1'e bölümlerinin)
aritmetik ortalamasının tersidir.
2.3.4.1.Basit Serilerde Harmonik Ortalama
Basit serilerde harmonik ortalama aşağıdaki formüle göre hesaplanır:
X
H
=
n
1
Σ
Xi
(2.9)
Mesela 3, 6, 10 ve 15 gibi dört sayının ahenkli ortalaması:
X
H
=
4
4
= =6’dır.
1 20
1 1 1
+ + +
3 6 10 15 30
2.3.4.2.Gruplanmış Serilerde Harmonik Ortalama
Sınıflanmış serilerde HO, frekansların toplamını, varyantların terslerinin
frekanslarla çarpımlarının toplamına bölmekle bulunur:
X
H
=
Σf i
fi
Σ
Xi
(2.10)
Misal 2.8: Bir daktilo yarışmasında 15 kişinin 1 dakikada yazmış
oldukları kelimeler Tablo 2.7'dedir. Dakikada yazılan ortalama kelime adedini
bu metoda göre hesaplayalım:
Seri sınıflanmış ve gerekli işlemler yapılarak tabloda verilmiştir.
Tablo 2.7: 15 kişinin dakikada yazdığı kelime adedi
Kelime sayısı
Xi
Kişi
fi
1
Xi
fi
Xi
10
15
20
Toplam
3
8
4
15
0.100
0.067
0.050
0.300
0.536
0.200
1.036
HO = 15/1.036 = 14.48. Demek ki 15 kişi dakikada ortalama 14.5 kelime
yazmıştır.
20
2.3.4.3.Gruplanmış Serilerde Harmonik Ortalama
Hesap tarzı sınıflanmış serilere benzer. Ancak varyantların yerini sınıf
değerleri alır:
X
H
=
Σf i
f
Σ i
mi
(2.11)
Misal 2.9: Yine bir daktilo yarışmasına katılmış 25 kişinin bir dakikada
yazdıkları kelime sayısı Tablo 2.8'deki gibi gruplandırılmıştır. Bu kişilerin
dakikada yazdıkları ortalama kelime sayısı HO olarak aşağıdaki gibi
hesaplanır. Gerekli işlemler tabloda verilmiştir.
HO = 25/1.011 = 24.73 bulunur.
Tablo 2.8: 25 kişinin dakikada yazdığı kelime adedi
Kelime sayısı
Xi
Kişi
fi
10-19 arası
20-29 arası
30-39 arası
40-49 arası
Toplam
5
10
8
2
25
mi
1
mi
fi
mi
15
25
35
45
0.067
0.040
0.029
0.022
0.335
0.400
0.232
0.044
1.011
2.3.4.4.Harmonik Ortalamanın Özellikleri
• Harmonik ortalama, (geometrik ortalamanın aksine) bir önceki değere
veya birbirine bağlı olmadan meydana gelen olaylarda kullanılan bir
ortalamadır. Belli bir birime, mesela yukarıdaki örneklerde olduğu gibi
zamana oranlanan olayların ortalamasını hesaplamada kullanılır. Mesela
bir yolu giderken 70, dönerken 60 km/saat ortalama hızla alan bir
otobüsün, yolun tamamına ait ortalama hızını hesaplamakta olduğu gibi.
• Harmonik ortalama, gerek aritmetik gerekse geometrik ortalamadan
küçük sonuç verir.
• Serideki varyantlardan biri 0 ise, sonuç bir sayının sonsuz'a
bölünmesi halini aldığı için harmonik ortalama 0 bulunur. Mesela 0, 2 ve
5’in harmonik ortalaması:
HO=
1
0
+
3
1
2
+
1
=
3
∞ + 0.5 + 0.2
=0
5
21
• Serinin varyantları arasında eksi değerli sayılar varsa harmonik
ortalama hesaplanabilir, ancak sonuç bir anlam taşımaz.
2.3.5.Kareli (Kuadratik) Ortalama
Kareli ortalama, varyantların kareleri toplamını, varyant sayısına
bölmek ve sonucun kare kökünü almakla hesaplanır.
2.3.5.1.Basit Serilerde Kareli Ortalama
Yukarıdaki tarife göre basit serilerde kareli ortalamanın formülü:
2
X
K =
ΣX i
n
(2.12)
Mesela 2, 3, 4 ve 7’den oluşan bir basit serinin kareleri ortalamasını
hesaplamak için, varyantların kareleri toplamı:
22+32+42+72=78 hesaplanır ve formüle göre:
KO = 78 / 4 = 4.42 bulunur.
2.3.5.2.Sınıflanmış Serilerde Kareli Ortalama
Sınıflanmış serilerde kareli ortalama, varyantların karelerinin
frekanslarla çarpımlarının toplamını, frekansların toplamına bölüp sonucun
kare kökünü almakla bulunur:
2
X
K
=
ΣX i × f i
Σf i
(2.13)
Misal 2.10: 30 öğrencinin aldığı notlar Tablo 2.9’dadır. Bunların kareli
ortalaması aşağıdaki şekilde hesaplanır:
22
Tablo 2.9: 30 öğrencinin aldığı notlar
Notlar (Xi)
2
3
4
5
6
7
8
9
Toplam
Xi2
4
9
16
25
36
49
64
81
fi
2
4
6
8
4
3
2
1
30
fi×Xi2
8
36
96
200
144
147
128
81
840
KO= 840 / 30 =5.29 bulunur.
2.3.5.3.Gruplanmış Serilerde Kareli Ortalama
Diğer gruplanmış serilerde olduğu gibi, burada da varyantların yerini
sınıf ortalamaları almaktadır:
2
X
K
=
Σmi × f i
(2.14)
Σf i
Misal 2.11: 50 öğrencinin aldığı notlar Tablo 2.10'daki gibi
gruplandırılmıştır. Bunların kareli ortalaması aşağıdaki gibi hesaplanır:
Tablo 2.10: 50 öğrencinin notları
Sınıflar
2-4’ten az
4-6’dan az
6-8’den az
8-10’dan az
10
Toplam
KO=
1925 / 50
fi
10
14
20
5
1
50
mi
3
5
7
9
10
mi 2
9
25
49
81
100
fi×mi2
90
350
980
505
100
1925
= 6.2 bulunur.
2.3.5.4.Kareli Ortalamanın Özellikleri
• Uygulama sahası sınırlıdır. Ancak arasında - değerli veya 0 olan
varyantların bulunduğu serilerde bu metod kullanılabilir.
• Diğer bütün analitik ortalamaların en büyüğüdür.
23
2.3.6.Analitik Ortalamaların Büyüklük Sırası
Buraya kadar yapılan açıklamalardan anlaşılacağı üzere, aynı seriye
uygulanmış analitik ortalamalar büyüklük sırasına göre şu şekilde
sıralanmaktadırlar:
Kareli ortalama>Aritmetik ortalama>Geometrik ortalama>Harmonik ortalama
2.4.Analitik Olmayan Ortalamalar
Madde 2.2'de ortalamaların analitik ve analitik olmayan ortalamalar
olarak 2 ana gruba ayrıldığı, analitik olmayan ortalamalarda serinin tüm
terimlerinin hesaba katılmadığı ve bu ortalamaların medyan ve mod olduğu
belirtilmişti. Medyan ve mod, aşağıdaki örneklerde de görüleceği üzere
genellikle sayma yoluyla elde edilmiş verilere uygulanmaktadır.
2.4.1.Medyan (Ortanca)
Medyan, varyantların tümü hesaba katılmadan, sadece sıralanması ve
sınıflanması ile bulunur. Medyan, bir seriyi iki eşit kısma bölen değerdir. Bu
sebepten medyana ortanca da denir. Hesaplanması serinin türüne göre değişir.
2.4.1.1.Basit Serilerde Medyan
Büyüklük sırasına konmuş bir dizide medyan, serideki varyant sayısının
(n) tek veya çift oluşuna göre farklı şekilde bulunur
n tek ise:
n+1
2
nolu terim, yani X(n+1)/2 medyandır.
Mesela bir şehirde örneklenen 7 ailenin gelirleri (milyoıı TL olarak)
aşağıdaki gibi sıralansın:
1
15.5
2
16
3
16.5
4
17
5
18
6
19
7
37
n = 7 ve tek sayı olduğuna göre, (7+1)/2 = 4 nolu terim, yani 17 milyon
TL, serinin medyanıdır.
n çift ise:
X n/ 2 + X ( n+2 )/ 2
2
nolu terim medyandır.
7 yerine aynı şehirden 8 aile örneklenmiş ve varyantlar aşağıdaki gibi
sıralanıyor olsaydı:
1
15.5
2
16
3
16.5
4
17
5
18
24
6
19
7
21
8
37
n = 8, Xn/2 = 4 ve X(n+2)/2 = 5 olduğuna göre, 4 ve 5 nolu terimlerin
ortalaması medyandır: (17+18)/2 = 17.5 milyon TL.
2.4.1.2.Sınıflanmış Serilerde Medyan
Sınıflanmış serilerde medyan, tam ortaya rastlayan terimin (n/2 sıra nolu
terim) dahil olduğu sınıfın değeridir. Ancak önce serinin eklemeli (kümülatif)
frekansları bulunmalıdır. Daha sonra, bu terimin hangi eklemeli frekans içinde
yer aldığına bakılır. Bu frekansa ait sınıf değeri serinin medyanıdır.
Misal 2.12: 50 öğrencinin aldığı notlar Tablo 2.11'deki gibi sınıflanmış
olsun:
Tablo 2.11: 50 öğrencinin notları ve eklemeli frekanslar
Notlar
Xi
1
2
3
4
5
6
7
8
9
10
Toplam
Frekanslar
fi
3
4
7
12
10
5
4
3
1
1
50
Eklemeli frekanslar
Σfi
3
7
14
26
36
41
45
48
49
50
n = 50 olduğuna göre, 50/2 = 25’inci terim tabloda görüldüğü üzere, 4.
sırada yer almaktadır. Bu sınıfın değeri 4 olduğuna göre, serinin medyanı 4'tür.
Bu sınıfa medyan sınıfı denir.
2.4.1.3.Gruplanmış Serilerde Medyan
Sınıflanmış serilere benzer şekilde, kümülatif frekansın içinde yer alan
sınıfın değeri basit olarak medyan sayılabilir.
Misal 2.13: 89 işçinin saatte aldığı ücretler Tablo 2.1'deki gibi
gruplanmıştır.
25
Tablo 2.12: 89 işçinin ücretleri ve eklemeli frekanslar
Sınıflar
(Ücret - TL)
50000-60000’den az
60000-70000’den az
70000-80000’den az
80000-90000’den az
90000-100000’den az
Toplam
Eklemeli
frekans
5
23
48
70
89
Đşçi sayısı
fi
5
18
25
22
19
89
Tabloda 89/2 = 44.5'uncu terim 70000-80000’den az sınıfında yer
almaktadır. Bu sınıfın değeri kabaca 75000 sayılırsa medyan 75000’dir.
Ancak gruplanmış serilerde medyanın tam hesabı şu formüle göre
yapılır:
 n m−1
 −
fi
2
1
Medyan= h1+Sm×
fm



∑







(2.15)
Formülde:
h1 = Medyan sınıfının alt sınırı,
Sm = sınıf genişliği,
m−1
∑f
i
= medyan sınıfından bir önceki sınıfın eklemeli frekansı,
1
fm = medyan sınıfının frekansıdır. Bu formüle göre yukarıdaki seride:
Medyan = 70000 + 10000 ×
44.5 − 23
25
= 78600 TL bulunur.
2.4.1.4.Medyanın Özellikleri
• Hesaplanması bilhassa basit serilerde kolaydır. Bütün terimler hesaba
katılmadan medyan hesaplanabilir.
• Serideki uç (aşırı) değerlerden hiç etkilenmez.
• Terimlerin medyandan ayrılışlarının (sapmalarının - inhiraflarının)
mutlak değerleri toplamı, diğer herhangi bir değerden ayrılışları
toplamından daha küçüktür. Mesela Tablo 2.13'de görülen seride
varyantların medyandan ve aritmetik ortalamadan ayrılışlarının mutlak
değerleri toplamını hesaplayalım:
26
Tablo 2.13: Medyan ve aritmetik ortalamadan ayrılışlar
Varyantlar (Xi)
Medyan
15.5
16.0
16.5
17.0
18.0
19.0
37.0
Toplam
17
17
17
17
17
17
17
Xi - Medyan
1.5
1.0
0.5
0
1.0
2.0
20.0
26.0
X
19.86
19.86
19.86
19.86
19.86
19.86
19.86
Xi - X 
4.36
3.86
3.36
2.86
1.86
0.86
17.14
34.30
Medyandan ayrılışların mutlak değerleri toplamı olan 26, aritmetik
ortalamadan ayrılışların mutlak değerleri toplamı olan 34.3'ten küçüktür.
• Sonu alınmamış, ucu açık dizilerde ortalama olarak medyan
kullanılmaktadır. Mesela ilaç imalinde öldürücü dozun (%50 ölümü
gerçekleştiren doz) tesbiti gibi.
2.4.2.Mod (Tepe Değeri)
Mod pratik olarak, bir seride en çok rastlanan, en çok tekrarlanan terim
olarak tanımlanabilir. Eğer serinin histogramı çizilirse, en yüksek sütunun
değeri serinin modudur. Bu sebepten mod'a tepe değeri de denir. Serinin tipine
göre mod aşağıdaki gibi hesaplanır.
2.4.2.1.Basit Serilerde Mod
11 işçinin saat ücretleri 1000 TL cinsinden aşağıdaki gibi olsun:
60, 70, 80, 80, 90, 90, 90, 90, 100, 110, 120
Bu dizide en çok tekrarlanan 90, 11 işçinin mod cinsinden saat başına
ortalama kazancını gösterir.
Terim sayısı çoğaldıkça, sayıların büyüklük sırasına konulup en çok
rastlananı bulmak zaman aldığından, mod genellikle sınıflanmış ve gruplanmış
serilere uygulanır.
2.4.2.2.Sınıflanmış Serilerde Mod
Sınıflanmış serilerde en yüksek frekansa sahip terimin değeri modu
verir.
Misal 2.14: Bir ayakkabıcı dükkanından bir yıl içerisinde satılan
ayakkabıların numaraları aşağıdaki gibidir:
27
Ayakkabı
numarası
35
36
37
38
39
40
41
42
43
Satılan ayakkabı
fi
325
348
214
301
416
383
925
712
304
Tabloya göre, 41 numara ayakkabılar bu serinin modudur.
2.4.2.3.Gruplanmış Serilerde Mod
Gruplanmış serilerde mod iki şekilde hesaplanabilir.
Misal 2.15: 126 işçinin ücretleri Tablo 2.14’deki gibi sınıflandırılmış
olsun. Bu misal üzerinden her iki yolu açıklayalım:
Tablo 2.14: 126 işçinin ücretlerinin frekans tablosu
Sınıflar (ücretler 1000 TL)
60-62 binden az
62-64 binden az
64-66 binden az
66-68 binden az
68-70 binden az
70-72 binden az
Đşçi sayısı (fi)
15
20
24
32
22
13
Basit Yol: Serinin en yüksek frekansı, 66-68 sınıfındaki 32'dir. Bu
sınıftaki 32 işçinin yarısının sınıfın üst, yarısının alt kısmında toplandığı
varsayılarak, serinin modu: (66+68)/2 = 67 bin kabul edilir.
Formül Metodu: Basit yoldan modun bulunması sağlıklı olmadığından,
gruplandırılmış serilerde mod aşağıdaki formüle göre hesaplanır:
Mod = L +
∆1
∆1 + ∆ 2
×I
(2.16)
Formülde:
L = Mod sınıfının alt sınır değeri,
i = sınıf genişliği,
∆1 = mod sınıfı frekansı ile bir önceki sınıfın frekansının farkı,
∆2 = mod sınıfı frekansı ile bir sonraki sınıfın frekansının farkıdır.
Formül misale uygulanacak olursa:
L=66000, ∆1=32-24=8, ∆2=32-22=10 ve i=2 olduğundan,
28
Mod=66000+
8
8 + 10
×2=66889 TL bulunur. O halde mod cinsinden
işçilerin ortalama ücreti 66889 TL'dır.
2.4.2.4.Modun Özellikleri, Elverişli Olduğu ve Olmadığı Haller
• Mod anormal hallerden etkilenmez, bu yönüyle tcmsil kabiliyeti
yüksektir.
• Frekans dağılımı çan şeklinde olan dağılımlara çok uygundur.
• Mod, iki tepeli dağılımlara uygun değildir.
• Dağılımları J ve U şeklindeki serilerde modun ortalama ölçüsü olarak
kullanılması ortalamanın tarifine göre mümkün değildir. Tarife göre
ortalama iki uç değer arasında kalmalıdır. Halbuki bu gibi serilerde en
fazla tekrarlanan terim uçlarda yer almaktadır.
• En yüksek frekans aynı sınıfta kaldığı müddetçe, diğer sınıflarda
olabilecek değişiklikler modun değerini değiştirmez.
2.5.Ortalama Seçiminde Göz Önüne Alınacak Esaslar
Bir seride kullanılacak ortalamanın seçiminde şu özellikler göz önünde
tutulmalıdır:
• Belirli ortalamaların belirli serilere uygun oldukları dikkate alınarak,
önce ortalaması hesaplanacak serinin dağılımı incelenmelidir. Örneğin
anormal değerler ihtiva eden seriler aritmetik ortalamaya, dalgalı ve iki
tepeli seriler moda, U şeklinde dağılım gösteren seriler medyana elverişli
değildir.
• Seri ortalamasının ne amaçla hesaplanacağı göz önünde
bulundurulmalıdır. Ortalama, mukayese amacıyla hesaplanacaksa,
aritmetik ortalama tercih edilmelidir. Amaç mukayese değil de serinin
temsili ise, mod veya medyan uygulanabilir. Mutlak miktarlardan çok
oranlar üzerinde duruluyorsa, geometrik ortalama ele alınmalıdır. Hız ve
birim zaman ortalamaları için işlem yapılıyorsa, harmonik ortalama
uygun olur.
• Yukarıda sayılan özel uygunluk sebepleri yoksa, hesabı kolay olan
yol tercih edilebilir.
2.6.Ortalamalar Arası Bağıntılar
Ortalamalar arasında sayısal yönden aşağıdaki bağıntılar vardır:
• Frekans dağılımları simetrik serilerde aritmetik ortalama, medyan ve
mod birbirlerine eşittir.
• Bir yana yığılmış bir dağılım gösteren serilerde, yığılmanın en fazla
29
olduğu noktada mod, daha sonra medyan, en sonra da aritmetik ortalama
yer alır. Bu durum aşağıdaki frekans dağılımında görülebilir:
Sınıflar
1-3’den az
3-5’den az
5-7’den az
7-9’dan az
9-11’den az
Frekans
3
7
10
15
5
Frekans
Bu seride aritmetik ortalama=6.6, medyan=7 ve mod=7.67’dir.
Büyüklük sıraları ise: Aritmetik ortalama<medyan<mod şeklindedir (Şekil
2.1). Yığılma sol tarafa olursa, büyüklük sırası da bunun tersi olmaktadır.
16
14
12
10
8
6
4
2
0
Medyan
AO
0
2
4
Mod
6
8
10
12
Şekil 2.1: Sağa yığılmış bir seride ortalamaların sıralanışı
30
3. DAĞILMA, DEĞĐŞĐM, VARYASYON
3.1.Giriş
Ortalamalar serileri temsil ve incelemede kullanılan bir ölçü olmalarına
rağmen, bu konuda yeterli değildirler. Aynı ortalamaya sahip iki seri
incelendiğinde, bunların bünyeleri arasında önemli farklar görülebilir. Mesela
aşağıdaki seri ele alınacak olursa, aritmetik ortalamaları ve minimum maksimum değerleri aynı olduğu halde, terimlerinin kendi içlerindeki
dağılışlarının çok farklı olduğu görülecektir:
A Serisi
10
10
2
2
B Serisi
10
6
6
2
O halde serilerin (buna bağlı olarak populasyonların) tanınmasında
bunların yalnızca ortalama değerini bilmek yeterli değildir. Varyantların,
ortalama etrafında dağılma (saçılma - ortalamadan sapma - ayrılma)
miktarını da bilmek gerekir. Dağılma (değişim - varyasyon) varyantların
ortalamaya uzaklık derecesidir. Biyolojik olaylar, sonsuz sayıda etkiler
sebebiyle, farklı sayı, büyüklük ve ölçülerde ortaya çıkma eğilimindedirler.
Tablo 1.1'deki örnekte görüldüğü gibi, fidanlar aynı ağaç türüne mensup
olduğu, aynı toprakta, aynı yetiştirme metodlarıyla yetiştirildikleri halde,
boyları arasında farklar vardır. Daha önce de belirtildiği gibi, bir frekans
tablosunda varyantlar ortalama etrafında toplanma eğilimindedirler. Dağılışları,
ortalamadan - ve + yöne doğru giderek azalır. Đşte değişim (varyasyon),
varyantların ortalama etrafında dağılma derecesini belirten bir ölçüdür.
Đstatistikte değişik dağılma ölçüleri kullanılmaktadır. Ortalamalarda
olduğu gibi, bunların da bazıları serinin tüm terimlerini hesaba katmadan,
bazıları ise tüm terimler üzerinden hesaplanır.
3.2.Serinin Bütün Terimlerinin Hesaba Katılmadığı Dağılım
Ölçüleri
Serinin tüm terimlerinin hesaba katılmadığı dağılma ölçüleri, değişim
genişliği ve kartillerdir.
31
3.2.1.Dağılım Sınırları ve Değişim Genişliği (Varyasyon
Genişliği)
Dağılım sınırları ve değişim genişliği, nümunedeki dağılım hakkında
kolay fikir veren bir ölçüdür. Serideki en küçük değer ile en büyük değer
dağılımın sınırlarını, bunlar arasındaki fark da değişim genişliğini verir.
Mesela Misal 1.2'deki fidanların boy dağılım sınırları 5.6 m ile 9.6 m; boyların
değişim genişliği ise 9.6-5.6 = 4 m'dir.
3.2.2.Kartiller (Çeyrekler)
Kartiller, büyükten küçüğe sıralanmış bir seriyi 4 eşit kısma ayıran
değerlerdir. Ortanca bir dağılımı nasıl iki eşit parçaya bölüyorsa, kartiller de 4
eşit parçaya böler. Dağılımın ilk 1/4'üncü terimine birinci kartil (Q1), ortada yer
alanına (yani ortancaya) ikinci kartil (Q2) ve 3/4'üncü terimine üçüncü kartil
(Q3) denir. Hesaplanmaları ortancaya benzer şekilde yapılır.
3.2.2.l.Basit Serilerde Kartiller
Basit serilerde Q1, Q2 ve Q3 serinin şu terimleridir:
Q1=
n+1
4
Q2=
n+1
4
×2
Q3=
n+1
4
×3
(3.1)
Misal 3.1: Aşağıdaki 12'şer varyanttan meydana gelen basit serilerin
kartillerini hesaplayalım:
Sıra No
1
2
3
4
5
6
7
8
9
10
11
12
A Serisi
2
3
4
6
7
7
8
9
10
12
14
15
B Serisi
1
3
3
4
6
7
9
9
13
14
16
17
Gerek A, gerekse B Serisinde:
Q1=(12+1)/4=3.25
Q2=(12+1)/4×2=6.5
Q3=(12+1)/4×3=9.75 nolu
terimlerdir. Ancak seride 3.25'inci terim diye bir şey olamaz. Bu terim madem
ki 3. terimden 0.25 kadar sonradır, o halde serideki 3. terim ile 4. terim
arasındaki farkın 0.25 kadarının 3. terime ilavesiyle hesaplanabilir. Bu
32
durumda:
Seride 4. terim 6, 3. terim 4 olduğuna göre, ikisinin farkının 0.25 fazlası
(6-4)×0.25 = 0.5 olur. Bu değer 3. terime ilave edilerek:
Q1=4+0.5= 4.5 bulunur. Benzer şekilde:
(8-7)×0.5 = 0.5 ve Q2=7+0.5 = 7.5,
(12-10)×0.75 =1.5 ve Q3=10+1.5 =11.5 hesaplanır.
B serisinde ise:
(4-3)×0.25 = 0.25 ve Q1 =3+0.25 = 3.25,
(9-7)×0.5 =1 ve Q2= 7+1= 8,
(14-13)×0.75 = 0.75 ve Q3=13+0.75 = 13.75 hesaplanır.
Kartiller dağılımın bir ölçüsü olduğuna göre, iki seriyi mukayese
etmekte kullanılabilir. Đki seriden 3. ve 1. kartil arası fark hangisinde fazla isc,
o serinin dağılımının fazla olduğuna karar verilir. Yukarıda:
A serisinde Q3-Qı=11.5-7.5=4,
B serisinde Q3- Qı=13.75-3.25=10.5
olduğuna göre B serisi daha dağınık, daha yayvandır.
Bir seride Q2-Q1 ile Q3-Q2’nin karşılaştırılması ile, o serinin dağılımının
simetrikliği kontrol edilebilir. Farkların eşit veya eşite yakın olması halinde
dağılım simetrik, farklı olması halinde asimetriktir. Hangi taraftaki fark
fazlaysa, dağılımın o tarafı yayvandır.
3.2.2.2.Sınıflandırılmış Serilerde Kartiller
Sınıflandırılmış serilerde kartiller, (3.1) nolu formüllere göre bulunacak
varyantların dahil olduğu sınıf değerleridir. Đncelenecek seri, Madde
2.4.1.2’deki gibi sınıflandırılıp eklemeli frekansları hesaplandıktan sonra, bu
varyantların hangi sınıflarda kaldığına bakılır.
3.2.2.3.Gruplandırılmış Serilerde Kartiller
Gruplandırılmış serilerde kartillerin hesabı, bu serilerde medyanın
hesaplanmasına benzer. Bu amaçla kullanılan formüller:
 n m−1
 −
fi
4
1
Q1=h1+Sm×
fm



∑







 3n m−1 
 −
fi 
 4

1
Q3=h3+Sm×
 (3.2)
fm






∑
Formüllerdc:
h1 = Đlk kartilin içinde bulunduğu sınıfın alt sınırı,
h3 = 3. kartilin içinde bulunduğu sınıfın alt sınırı,
33
Sm = sınıf genişliği,
m−1
∑f
i
= kartil sınıfından bir önceki sınıfın eklemeli frekansı,
1
fm = kartil sınıfının frekansıdır.
Serinin tüm terimlerinin hesaba katılmadığı dağılım ölçülerinden bir de
desiller ve persentiller vardır. Kartillere benzer şekilde, desiller bir diziyi 10'a
bölen değerler, persentiller ise 100'e bölen değerlerdir.
3.3.Serinin Bütün Terimlerinin Hesaba Katıldığı Dağılım
Ölçüleri
Serinin bütün terimleri üzerinden hesaplanan dağılım ölçüleri ortalama
sapma ile varyans ve standart sapmadır.
3.3.1.Ortalama Sapma (Mutlak Farklar Ortalaması)
Ortalama sapma, varyantların aritmetik ortalamadan mutlak değer olarak
farklarının ortalamasıdır. Ancak Madde 3.3.2’de incelenecek standart sapma
gibi cebirsel işlemlere elverişli değildir. Hesabı serinin tipine göre değişik
şekillerde yapılır.
3.3.1.1.Basit Serilerde Ortalama Sapma
Yukarıdaki tanıma göre basit serilerde ortalama sapma şu formüle göre
hesaplanır:
OS=
Σ Xi − X
n
formülde Xi- X =di ile gösterilirse, OS=
Σd i
n
(3.3)
olur.
Misa1 3.2: Tablo 3.1’de verilen serinin ortalama sapmasını hesaplayalım
(Serinin aritmetik ortalaması 6'dır.):
Tablo 3.1
Xi
X
di
3
5
10
9
7
2
6
6
6
6
6
6
Toplam
3
1
4
3
1
4
16
34
O.S.= 16/6= 2.67 bulunur. Bir seride hesaplanan ortalama sapma ne
kadar büyükse, o seride dağılmanın o kadar fazla olduğu anlaşılır.
3.3.1.2.Sınıflanmış Serilerde Ortalama Sapma
Sınıflanmış serilerde ortalama sapma, serinin terimleri ile aritmetik
ortalaması arasındaki farkların, frekanslarla çarpımlarının toplamını frekanslar
toplamına bölmekle bulunur:
OS=
Σf i × d i
(3.4)
Σf i
Misal 3.3: Rastgele seçilmiş 150 kişinin bir günde okudukları gazcte
sayısı Tablo 3.2’de verilmiştir. Serinin ortalama sapmasını bulalım:
Tablo 3.2: 150 kişinin günde okudukları gazete sayısı
Okunan gazete
sayısı (Xi)
1
2
3
4
5
6
7
Toplam
fi
Xi × fi
12
18
42
54
14
6
4
150
12
36
126
216
70
36
28
524
Xi-
X
fi ×Xi-
2.49
1.49
0.49
0.51
1.51
2.51
3.51
X
29.88
26.82
20.58
27.54
21.14
15.06
14.04
155.06
(2.2) nolu formüle göre X =524/150=3.49 ve OS=155.06/150=1.034
bulunur.
3.3.1.3.Gruplanmış Serilerde Ortalama Sapma
Hesap tarzı sınıflanmış serilerdeki gibidir. Ancak bu defa aritmetik
ortalamadan farklar, sınıf değerleri üzerinden hesaplanır.
Misal 3.4: 2.3.1.3 nolu maddede aritmetik ortalaması hesaplanan
fidanların boylarının ortalama sapmasını bulalım. Gerekli hesaplamalar Tablo
3.3’de verilmiştir.
Serinin aritmetik ortalaması hatırlanacağı üzere daha önce 7.54 m
hesaplanmıştı.
Buradan OS= 37.64/50 = 0.753 m bulunur.
35
Tablo 3.3: 50 fidanın boyları
Boylar
(metre)
5.5-5.9
6.0-6.4
6.5-6.9
7.0-7.4
7.5-7.9
8.0-8.4
8.5-8.9
9.0-9.4
9.5-9.9
Sınıf değerleri
mi (metre)
5.7
6.2
6.7
7.2
7.7
8.2
8.7
9.2
9.7
Toplam
Adet
fi
2
4
8
9
11
8
4
3
1
50
mi-
X
1.84
1.34
0.84
0.34
0.16
0.66
1.16
1.66
2.16
fi ×mi-
X
3.68
5.36
6.72
3.06
1.76
5.28
4.64
4.98
2.16
37.64
3.3.2.Varyans ve Standart Sapma
Ortalama etrafındaki dağılımın en iyi ölçüsü varyanstır. Varvans ve
standart sapma biyolojik olaylarda en çok kullanılan dağılım ölçüleridir.
Varyans, aritmetik ortalamadan farkların kareleri toplamının, terim
sayısına bölünmesiyle bulunur. Ancak uygulamada farkların kareleri toplamı,
terim sayısının 1 eksiğine bölünmektedir. Bu tanıma göre varyans:
s 2=
Σ( X i − X )
n −1
2
2
=
Σxi
n−1
(3.5)
formülüne göre hesaplanır. Bu formülün payı ortalamadan ayrılışların
kareleri toplamı'dır, Σxi2 ile gösterilir ve istatistikte kısaca kareler toplamı
(KT) olarak bilinir. Varyansın kare köküne ise standart sapma denir. Standart
sapmanın ölçü birimi varyantların ölçü birimi ile aynıdır.
3.3.2.1.Serbestlik Derecesi Kavramı
Bir seride, varyantlar ortalamadan -∞ ve +∞ yönlerde farklılık
gösterirler. Bu farkların cebirsel toplamı sıfırdır. Mesela 4, 3, 5, 8 ve 10 gibi
varyantlardan meydana gelen bir nümunenin aritmetik ortalaması 6'dır.
Varyantların ortalamadan sapmaları sıra ile -2, -3, -1, 2 ve 4'tür. Burada
varyantlardan her hangi 4 tanesi serbestçe bir değer alabilir. Ancak 5’inci
varyant sapmaların cebirsel toplamını sıfıra eşitler. O halde bu terim değer
almakta serbest değildir. Bir nümunede serbestçe değer alan n-1 varyant vardır.
Bu sebepten varyansın hesaplanmasında sapmalarn kareleri toplamı varyant
adedine değil, varyant adedinin bir eksiğine (n-1) bölünür. n-1'e kareler
toplamının serbestlik derecesi (SD) denir. O halde varyans, KT’nın kendi
serbestlik derecesine bölümüdür.
36
3.3.2.2.Basit Serilerde Varyans ve Standart Sapma
Misal 3.5: 3.3.1.1 nolu maddede verilen 6 varyantlı örneğin bu defa
varyans ve standart sapmasını hesaplayalım:
X =6'dır. Gerekli hesaplamalar Tablo 3.4’te verilmiştir. Burada aritmetik
ortalamadan farkların toplamının 0 olduğuna dikkat edilmelidir.
Tablo 3.4: Aritmetik Ortalamadan Farklar
Xi
(Xi)2
3
5
10
9
7
2
ΣX=36
9
25
100
81
49
4
ΣXi2=268
Xi- X
-3
-1
4
3
1
-4
Σxi=0
X
6
6
6
6
6
6
(Xi- X )2
9
1
16
9
1
16
Σ
 (xi)2=52
(3.5) nolu formüle göre varyans:
s2=52/5=10.4, standart sapma ise:
s= s 2 = 10.4 =3.22 bulunur.
O halde her varyant aritmetik ortalamadan ortalama olarak ±3.22
birimlik ayrılış göstermektedir. Varyansın birimi olmamasına karşılık, standart
sapma örneğe ait değerlerin birimi cinsinden ifade edilir.
3.3.2.2.1.Varyans ve Standart Sapmanın Kolay Hesabı
Kareler toplamını (3.5) nolu formüle göre hesaplamak zaman alıcı ve
sıkıcıdır. Bu sebepten uygulamada kullanılmaz. Basit serilerde varyans, (3.6)
nolu formül yardımıyla kolayca hesaplanır:
s 2=
(ΣX i ) 2
n
n −1
ΣX i2 −
(3.6)
Misal 3.6: Misal 2.1'deki fidan örneğinin varyansını bu formüle göre
hesaplayalım:
ΣXi2=5.62+5.92+ . . .+9.62=2864.44
(ΣXi)2=375.62=141075.4
37
2864.44 −
s 2=
141075.4
50
50 − 1
=0.8762 ve s=0.936 m
(3.6) nolu formüldeki
2
( ΣX i )
ifadesi, gelecek bölümlerde açıklanacak
n
olan varyans analizlerinde düzeltme faktörü (düzeltme terimi) olarak bilinir
ve C ile gösterilir.
Varyans ve standart sapmanın hesabında, kolaylığından dolayı bu yol
izlenmektedir.
3.3.2.3.Sınıflanmış Serilerde Varyans ve Standart Sapma
Sınıflanmış serilerde varyans, varyantlarla aritmetik ortalama arasındaki
farkların karelerinin frekanslarla çarpılıp, toplamlarını frekansların 1 eksiğine
bölmekle bulunur:
2
s=
Σf i × ( X i − X )
2
(3.7)
n −1
Misal 3.7: Bölüm 2.3.1.2’deki 50 öğrencinin notlarının varyansını
hesaplayalım:
Gerekli hesaplamalar Tablo 3.5’te verilmiştir. Serinin aritmetik
ortalaması X = 4.62'dir.
Tablo 3.5: 50 öğrencinin notları
Notlar
Xi
1
2
3
4
5
6
7
8
9
10
Toplam
Frekanslar
fi
3
4
7
12
10
5
4
3
1
1
50
Xi- X
-3.62
-2.62
-1.62
-0.62
0.38
1.38
2.38
3.38
4.38
5.38
(Xi- X )2
fi×(Xi- X )2
13.1044
6.8644
2.6244
0.3844
0.1444
1.9044
5.6644
11.4244
19.1844
28.9444
39.3132
27.4576
18.3708
4.6128
1.1444
9.5220
22.6576
34.2732
19.1844
28.9444
205.7800
Buradan s2=205.78/49=4.1996, s=2.05 bulunur.
3.3.2.4.Gruplanmış Serilerde Varyans ve Standart Sapma
Gruplanmış serilerde varyans, sınıflanmış serilere benzer şekilde
38
hesaplanır. Ancak burada varyantların yerini sınıf değerleri alır:
s 2=
Σf i × ( mi − X )
2
(3.8)
n −1
Misal 3.8: Misal 2.1’deki 50 kavak fidanını ele alalım:
Serinin aritmetik ortalaması X =7.54'dür. Diğer hesaplamalar Tablo
3.6'da verilmiştir.
Tablo 3.6: 50 fidanın boyları
Boylar
(metre)
5.5-5.9
6.0-6.4
6.5-6.9
7.0-7.4
7.5-7.9
8.0-8.4
8.5-8.9
9.0-9.4
9.5-9.9
Sınıf değerleri
mi (metre)
5.7
6.2
6.7
7.2
7.7
8.2
8.7
9.2
9.7
Toplam
Adet
fi
2
4
8
9
11
8
4
3
1
50
(mi-
X)
-1.84
-1.34
-0.84
-0.34
0.16
0.66
1.16
1.66
2.16
(mi-
X )2
3.3856
1.7956
0.7056
0.1156
0.0256
0.4356
1.3456
2.7556
4.6656
fi ×(mi-
X )2
6.7712
7.1824
5.6448
1.0404
0.2816
3.4848
5.3824
8.2668
4.6656
42.7200
s2= 42.72/49=0.8718 ve s = 0.934 m bulunur.
Standart sapma iyi bir dağılım ölçüsüdür. s ne kadar büyük çıkarsa,
varyantların ortalama etrafında o kadar fazla dağılış gösterdiğine hükmedilir.
Ancak s'nın büyüklüğü, yalnız dağılımın fazlalığına bağlı değildir. Bu
sebepten, dağılımın incelenmesinde standart sapma ile birlikte, aşağıdaki
konuda açıklanacağı üzere varyasyon katsayısı üzerinde de durulmalıdır.
3.4.Varyasyon Katsayısı (Nisbi Standart Ayrılış)
Bir nümunede standart sapmanın büyük olması, varyantların
ortalamadan ayrılışlarının büyük (ortalama etrafındaki dağılışlarının fazla)
oluşu anlamına gelir. Ancak büyük sayılardan meydana gelen bir nümunede
hesaplanan standart sapma, küçük sayılardan meydana gelen bir nümunede
hesaplanan standart sapmaya nazaran (bunların her ikisinin dağılım miktarı
aynı olsa bile) büyük olur. Đki örneğin karşılaştırılmasında önem taşıyan bu gibi
hallerde, standart sapma gerçek durumu yansıtmayabilir. Bu kusuru ortadan
kaldırmak için varyasyon katsayısı (değişim katsayısı) denilen, % ile ifade
edilen ve (3.9) nolu formüle göre hesaplanan oransal bir ölçü kullanılır:
39
v=
s
X
×100
(3.9)
Formülde görüldüğü üzere varyasyon katsayısı, standart sapmanın
aritmetik ortalamaya yüzde oranıdır.
Mesela aşağıdaki tabloda yer alan 6'şar varyantlı iki seriyi inceleyelim:
B
X
s
A Serisi
295
290
285
230
225
220
1545
257.50
B Serisi
50
45
35
30
25
20
205
34.17
35.88
11.58
Standart sapmalara göre, A serisinin dağılımı B serisinden daha fazla
görünmektedir. (3.9) nolu formül bu serilere uygulanacak olursa:
A serisinde varyasyon katsayısı: v=(35.88/257.5)×100=13.93
B serisinde varyasyon katsayısı: v=(11.58/34.17)×100=33.89
hesaplanır. Demek ki B serisinin dağılımı gerçekte A serisinden daha fazladır.
Varyasyon katsayısı bu şekilde iki serinin dağılımlarını karşılaştırmaya
imkan vermekle, araştırmacı veya uygulamacıya yaptığı işin başarısını kontrol
imkanı tanımaktadır. Mesela fidan boyları varyasyon katsayısının yıllardır %
12 civarında seyrettiği bir fidanlıkta, daha sonra çok farklı (büyük) bir
varyasyon katsayısı tesbit edilmişse, araya farklı fidanlar karıştığından, kültür
ve bakım tekniklerinin bozulduğundan ve bu sebepten, fidanlığın farklı
işlemlere maruz kalarak heterojen bir yapıya kavuştuğundan şüphe edilebilir.
Benzer şekilde, büyük varyasyon katsayıları veren bir denemenin de
sıhhatinden şüpheye düşmek ve bunun sonuçlarına güvenmemek gerekir.
3.5.Ortalamaların Dağılımı, Ortalamanın Standart Hatası
Bir normal populasyondan her biri n kadar varyant ihtiva eden bir çok
tesadüf örneği alınsa ve ortalamaları hesaplansa, bu ortalamalar da bir normal
dağılış gösterirler. Bunların dağılışının ortalaması populasyonun ortalamasına,
varyansı ise σ2/n'e eşittir. Demek ki örnek ortalamalarının dağılımı
populasyonun dağılımından n defa daha küçüktür. n büyüdükçe örnek
ortalamalarının dağılımı azalmakta ve sonsuz olduğu takdirde sıfıra inmektedir
(σ /∞)=0. Çünkü bu takdirde n bütün populasyonu kapsamakta ve
populasyondan sonsuz sayıda ancak bir nümune alınabilmektedir. Bunun da
ortalaması populasyonun ortalamasıdır.
40
Örnek ortalamalarına ait varyans, bu populasyondan çekilmiş n
varyantlı bir örnek üzerinden hesaplanan s2 değeri (varyans) vasıtasiyle
aşağıdaki formüle göre tahmin edilebilir:
2
sX =
s
2
n
(3.10)
(3.11) nolu formülde görüldüğü gibi bunun kare köküne ortalamanın
standart hatası denir.
sX =
s
n
(3.11)
Misal 3.9: Misal 3.6'daki fidan örneğine ait ortalamanın standart hatası
hesaplanacak olursa, s X =0.936/ 50 = 0.1324 m bulunur. Demek ki 7.512 m
olarak hesaplanan bu ortalama·±0.13 m'lik bir hata payına sahiptir.
Đstatistikte hesaplanan (tahmin edilen) bütün parametreler genellikle
standart hatalarıyla birlikte verilir. Ortalama da bir parametre olduğuna göre,
standart hatasıyla verilmeli ve mesela yukarıdaki misal için, örneğin alındığı
fidanlıkta kavak fidanlarının boyu X =7.51±0.132 m’dir denilmelidir.
Örnekteki varyantların birbirinden az fark göstermesi (yani varyansın
küçülmesi) ve varyant sayısının büyümesi standart hatayı küçültür. Bu takdirde
nümunenin ortalaması giderek populasyonun ortalamasına yaklaşır. s X = 0
olması halinde ise nümunenin ortalaması, populasyonun ortalamasına eşittir.
Bu açıklamalardan, örneklemelerde örnek büyüklüğünün ne derece önemli
olduğu anlaşılmaktadır.
Đstatistik biliminde, parametrelerin birer tahmini olan her istatistiğin birer
standart hatası vardır. Standart hatalar aynı zamanda istatistiklerin ilerki
konularda görülecek olan güven sınırlarını hesaplamakta kullanılır.
3.6.Ortalamanın Örnekleme Hatası (%)
Ortalamanın örnekleme hatası %, aşağıdaki formüle göre hesaplanır:
sX
X
×100
(3.12)
Örnekleme hatası yüzdesi, ortalamanın ne büyüklükte bir hata ile tahmin
edildiğini gösterir. Küçük olduğu ölçüde populasyonun tahminindeki tutarlılık
artar. Büyük örnekleme hataları, genellikle örnek büyüklüğünün (veri adedinin)
yetersizliğinden ileri geleceğinden, bunu küçültmek için veri adedinin
41
olabildiğince fazla tutulması gerekir (Kalıpsız 1981, s. 275).
Misal 3.10: Fidan örneğindeki ortalamanın örnekleme hatasını
hesaplayacak olursak:
(0.1324/7.512)×100=1.762 bulunur.
Ortalamanın örnekleme hatası yüzdesi, n-1 serbestlik derecesiyle istenen
güven düzeyi belirtilerek (6. Bölümde açıklanan ilgili t değeri ile çarpılarak) de
hesaplanabilir.
42
4. POPULASYONLARIN BELĐRLENMESĐ
4.1.Giriş
Üzerinde çalışılan bir nümunenin ne tip populasyona ait olduğunu
bilmek, buna uygulanacak istatistik analiz metodlarını tayin için gereklidir. Bu
bölümde, populasyonların (ana kütlenin) belirlenmesi üzerinde durulacaktır.
Đstatistiğin amaçlarından veya faaliyet sahalarından biri, bir örneğe dayanarak
ana kütle hakkında karar vermektir. Eldeki örneğe uygulanan bir takım
analizlerle, örneğin gerçekten bu ana kütleye ait olup olmadığı test edilir. Bu
testlerde belli olasılık oranları (%5, %1 ve %0.1 gibi) kullanılır. Ancak bu
analizlerin uygulanabilmesi için, öncelikle populasyonun ne tip bir populasyon
olduğunun bilinmesi gerekir. Her populasyonun karakterine göre uygulanacak
analiz metotları değişiktir. Başka tipler de olmakla beraber, genel olarak
populasyonlar, normal populasyonlar, binom ve poisson populasyonları
olarak 3 grupta incelenirler. Populasyonlar birbirlerinden aritmetik ortalamaları
ve varyansları (parametreleri) ile ayrılırlar.
4.2.Normal Populasyonlar
Birbirlerinden farklılıkları tamamen tesadüfi sebeplerden ileri gelen
varyantların oluşturduğu populasyonlara normal populasyonlar denir. Normal
populasyonlarda varyantlar ölçülerek, tartılarak elde edilir ve süreklilik
gösteren kesirli sayılardan meydana gelirler. Bu tip populasyonlarda varyantlar
ortalama etrafında sağa ve sola doğru simetrik olarak azalan bir yığın oluşturur.
Normal populasyonların gösterdiği dağılışlara da normal dağılış denir.
Canlılara ait bir çok özellik normal dağılış gösterir.
Ortalaması µ, varyansı σ2 ile gösterilen bir normal populasyonun
dağılışı:
Y=f(X)=
1
σ 2π
e
2
1 X − µ 
− 

2 σ 
formülü ile ifade edilir. Bu formülde:
f(X)= olasılık oranı (fonksiyonun ordinatı),
X = rastlantı değişkeni,
π=pi sayısı,
e = 2.718281829’dır (tabii logaritma tabanı).
43
(4.1)
4.2.1.Normal Dağılımın Parametreleri
Normal dağılımın parametreleri, aritmetik ortalama ve standart sapmadır.
Bunlar örneğe ait olmaları halinde X ve s ile, populasyona (ana kütleye) ait
olmaları halinde ise µ ve σ ile gösterilir. Ancak normal dağılım gösteren bir
toplumda n=∞ olacağı için µ ve σ'nın gerçek değerleri hesaplanamaz,
toplumdan alınan n bireyli örnekler üzerinden tahmin edilir.
12
Frekanslar
10
8
6
4
2
10.7
10.2
9.7
9.2
8.7
8.2
7.7
7.2
6.7
6.2
5.7
5.2
4.7
4.2
0
Sýnýflar (boy-m)
X ±σ
X ±2σ
X ±3σ
Şekil 4.1: Normal dağılım eğrisi
4.2.2.Normal Dağılımın Özellikleri
• (4.1) nolu formül, bir normal dağılımda frekansların Şekil 4.1'deki
gibi eğrisini çizer. Dağılım sürekli olup Xi varyantları -∞ ile +∞ arasında
bir değer alabilir. Varyantlar aritmetik ortalamaya göre simetrik dağılır.
Aritmetik ortalama tam ortada yer alır. Aritmetik ortalamadan eşit
uzaklıktaki Xi değerlerinin olasılıkları eşittir.
• Normal dağılım eğrisinin maksimum noktasının apsisi X =µ ve
ordinatı f(X)=
1
σ 2π
’dir. Standart normal dağılım için bu değer
0.3984'tür.
• Normal dağılım eğrisi çan şeklinde olup iki dönüş noktası vardır. Bu
noktaların koordinatları:
Y1=-0.242
X1=µ−σ
44
X2=µ+σ
Y2=0.242'dir.
• Eğri -∞ ile +∞‘a doğru X eksenine asimptot olarak seyreder.
• Eğrinin altında kalan alanın tamamı olasılık yönünden 1 sayılır.
• Dikkat edileceği üzere (4.1) nolu formülde, eğrinin biçimini
belirleyecek iki unsur vardır ki bunlar, ortalama (µ) ve standart sapmadır
(σ). Bu bakımdan normal dağılımlı populasyonlar ortalama ve standart
sapmalarıyla tanımlanır ve birbirlerinden ayrılırlar. Bu demektir ki, ele
alınan normal populasyonların ortalamaları farklı, standart sapmaları
farklı veya her iki parametreleri farklı olabilir. Ortalamaları aynı olan iki
normal dağılımdan, standart sapması büyük olan daha basık ve
yayvandır.
• Normal eğri, altında kalan alanı ortalamadan sağa ve sola doğru
dağılımın standart sapması üzerinden şu şekilde belirlemektedir:
Ortalamadan itibaren sağa ve sola doğru bir σ: µ ± 1σ = %68
Ortalamadan itibaren sağa ve sola doğru iki σ: µ ± 2σ = %95
Ortalamadan itibaren sağa ve sola doğru üç σ: µ ± 3σ = %99
Misal 3.6'da standart sapması hesaplanmış 50 kavak fidanı misalinde
ortalamayı populasyonun ortalaması, standart sapmayı da populasyonun
standart sapması sayacak olursak, örneğin alındığı fidanlıktaki
fidanların:
%68'inin boyunun 7.512 ± 0.936 = 6.58 m ile 8.44 m arasında,
%95'inin boyunun 7.512 ± 1.872 = 5.64 m ile 9.38 m arasında,
%99'unun boyunun 7.512 ± 2.808 = 4.70 m ile 10.32 m arasında olduğu
söylenebilir (Şekil 4.1).
4.2.3.Normal Eğri Formülünden Yararlanılarak Bir Dağılımın
Hesaplanması
(4.1) nolu formül kullanılarak, normal dağılım gösteren bir toplumdan
çekilmiş ve ortalaması ile standart sapması hesaplanmış bir örnek üzerinden bu
populasyona ait tahminlerde bulunmak mümkündür. Formülde X yerine, bir
varyantın değeri konularak, bu değerin eğri üzerindeki ordinat değeri
hesaplanabilir.
Misal 4.1: Fidan örneğini ele alarak, ortalaması 7.512 m, standart
sapması 0.936 m olan 50 bireylik bu nümunede mesela 8 m - 8.4 m arası
boylardaki fidanların teorik olarak oransal ve sayısal miktarını hesaplayalım:
Tablo 1.2'ye göre 8 - 8.4 sınıfının sınıf değeri 8.2 olduğundan, formülde
X yerine 8.2 konularak:
45
Y=f(8.2)=
1
0.936 2π
e
2
1  8.2 − 7 .512 
− 

2  0.936 
= 0.3252
hesaplanır. Bu değer 8.2 m'lik varyantın dağılımdaki ordinatıdır. 8.2 sınıfı,
boyu 0.3252, eni 0.5 olan bir dikdörtgen olarak düşünülürse, dikdörtgenin
alanı:
0.3252×0.5 = 0.1626 bulunur. O halde 8 - 8.4 sınıfında yer alan
fidanların beklenen oransal miktarı %16.26'dır. Başka bir ifadeyle, bu
fidanlıkta fidanların %16.26'sının bu sınıfta yer alması beklenmektedir.
Örnekte toplam 50 fidan olduğuna göre:
0.1626×50 = 8.13 adet fidan söz konusu sınıfta yer alacaktır.
Bu şekilde diğer sınıflar da hesaplanarak, teorik olarak tüm sınıflarda yer
alması beklenen frekanslar bulunabilir. Bu tarz hesaplamada sınıf genişlikleri
daraldıkça hesaplardaki hassasiyet artmaktadır.
4.2.4.Standart Normal Dağılım
Normal dağılımın aritmetik ortalaması sıfır, standart sapması 1 olan özel
haline standart normal dağılım denir (Şeki1 4.2).
-4
-3
-2
-1
0
1
2
3
4
z değerleri
Şekil 4.2: Standart normal dağılım eğrisi
Böyle bir dağılımda değişkenlerin %99'u -3s ile +3s arasında yer alır.
Eğrinin tamamı altındaki alan 1 sayılarak, alanın yarısı, ortalamadan itibaren
uca doğru 1'in kesirleri halinde Ek Tablo 1'de verilmiştir. Bu tablo yardımıyla,
ortalama ve standart sapması bilinen bir örneği, bir standart normal dağılıma
dönüştürmek ve çekildiği populasyona ait bir takım tahminlerde bulunmak
46
mümkündür. Bunun için eldeki bir Xi varyantını, aşağıdaki formül ile ifade
edilen ve z ile gösterilen bir standart normal varyanta dönüştürmek gerekir:
z=
Xi − µ
σ
(4.2)
Daha sonra bu z değerinin, ortalamadan itibaren dağılımda kapladığı
alan (olasılık olarak) Ek Tablo 1'dcn alınabilir (Şekil 4.2). z değerleri tabloda
0.01 kesirde verilmiştir. Mesela z=1 için tablo değeri 0.3413'tür. Bu, standart
normal dağılımda ortalamadan itibaren z=1 değerine kadar varyantların
0.3413'ü veya %34.13'ü yer alıyor anlamındadır.
4.2.5.Standart Normal Dağılım Uygulamaları
Ek Tablo 1 yardımıyla, ortalaması ve standart sapması bilinen (bilindiği
varsayılan) toplumlarda z değeri üzerinden aşağıdaki gibi tahminlerde
bulunulabilir. Bunları bazı örneklerle açıklayalım:
Misal 4.2: Ortalama ve standart sapması belli bir populasyonda, belli bir
varyanttan daha büyük bir varyantın çekilme (veya böyle varyantların
bulunma) olasılığı nedir?
Önceki fidan misalindeki populasyonun ortalamasını µ = 7.512 m ve
standart sapmasını σ = 0.936 m kabul edelim. Bu populasyonda mesela boyu 9
m'den uzun olan fidanların bulunma olasılığı nedir?
(4.2) nolu formülde X yerine 9 konursa,
z=
9 − 7.512
0.936
=1.59
hesaplanır. Ek Tablo 1’e bakılacak olursa 1.59’a karşı gelen z dcğerinin
olasılığının P = 0.4441 olduğu görülür. O halde ortalamadan bu değere kadar
dağılımın %44.41'i yer almaktadır. Bizden istenen 9 m dahil ötesi olduğuna
göre, z=1.59'dan sonraki kısım sorunun cevabıdır. O halde aranan olasılık
P(X≥9)=0.5-0.4441=0.0559 veya %5.59'dur (Şekil 4.3).
47
12
X =7.512
8
6
4
%64.59
6<X<8
2
%24.56
8<X<9
%5.6
0
10.7
10.2
9.7
9.2
8.2
7.7
7.2
6.7
6.2
5.7
5.2
4.7
4.2
9<X
8.7
Frekanslar
10
Sýnýflar (boy-m)
Şekil 4.3: Bir populasyonda olasılıklar
Örnekte 50 fidan bulunduğuna göre bunlardan 50×0.0559 = 2.8 tanesinin
boyunun 9 m'den uzun olduğu söylenebilir.
Misai 4.3: Ortalama ve standart sapması belli bir populasyondan, istenen
iki değer arasında bir varyantın çekilme olasılığı nedir?
Fidan örneğine göre, bu populasyondan boyu 8 m ile 9 m arasında bir
fidan çekme olasılığı veya bu boylarda fidanların populasyonda bulunma
olasılığı nedir?
Önceki misalde, ortalamadan boyu 9 m'ye kadar olan fidanların bulunma
olasılığı P=0.4441 olarak hesaplanmıştı. Ortalamadan, boyu 8 m'ye kadar
olanların bulunma olasılığı için,
z=
8 − 7.512
0.936
=0.52
hesaplanır. Ek Tablo 1'e göre z=0.52 için P = 0.1985'dir. Bu değer, varyantların
ortalamadan z=0.52'ye kadarki sahada bulunma olasılığıdır. O halde istenen
olasılık, bu iki değerin farkı şeklinde hesaplanmalıdır:
P(8 ≤ X ≤ 9 = 0.4441-0.1985 = 0.2456
Nümunede bu aralıkta yer alması beklenen fidan adedi ise,
50×0.2456=12.3'dür.
Ek Tablo 1 yardımıyla, benzer şekilde belli aralıklarda (mesela 0.50 m
gibi) beklenen fidan adetleri hesaplanarak, dağılımın tamamına ait teorik
değerler (yani normal dağılım eğrisine göre olması beklenen değerler) ortaya
48
çıkarılabilir.
Ancak burada istenen olasılıkların, ortalamanın farklı iki tarafında
bulunması halinde (mesela boyu 6 m ïle 8 m arasında olan fidanların bulunma
olasılığı gibi) dikkatli olunmalı ve hesaplama ona göre yapılmalıdır. Mesela 6
m'den büyüklerin bulunma olasılığı ile 8 m'den küçüklerin bulunma olasılığını
hesaplamak içìn, z tablosu değerlerinin toplamı alınmalıdır. Yani:
P(6 ≤ X ≤ 8) = P(6 ≤ X) + P(X ≤ 8)
hesaplanmalıdır. Ortalamadan 8 m’ye kadarki sahada olasılık P=0.1985'dir.
Ortalamadan 6 m'ye kadarki saha için ise:
z=
6 − 7.512
0.936
= - 1.615
bulunur. Mutlak değer itibariyle z=1.62 için P = 0.4474 olduğundan, istenen
olasılık,
P(6 ≤ X ≤ 8) = 0.1985+0.4474 = 0.6459 bulunur (Şekil 4.3).
Misal 4.4: Ortalama ve standart sapması bilinen bir toplumda, belirtilen
orandaki varyantlar hangi değerler arasında yer alır?
Bu defa soru Misal 4.3’ün tersidir. Bu durumda yapılacak işlemler de
tersinedir. Yani önce tablodan olasılıklar alınacak, sonra bu olasılıklar z
formülünde yerine konularak varyantlar hesaplanacaktır. Yine fidan örneğine
göre, mesela bu toplumda fidanların, dağılımın ortasında yer alan `%90'ının
boylarının kaçtan kaça değiştiğini bulalım:
Dağılımın ortadan %90'ı sorulduğuna göre, aritmetik ortalamadan
itibaren sağlı sollu %45'erlik alanda yer alan varyantların sınır değerleri
istenmektedir. Ek Tablo 1'de 0.45 aranacak olursa, bu değerin bulunmadığı,
buna en yakın değer olarak 0.4495 veya 0.4505'in yer aldığı görülür. O halde
ikisinden biri alınabilir. 0.4495 alınacak olursa, buna ait değerin z=1.64 olduğu
görülür. 1.64 z formülünde yerine konulursa:
1.64=
X − 7.512
0.936
=
buradan X-7.512=1.535 ve X1==7.512+1.535=9.047 m bulunur. Bu değer
dağılımın sağ tarafına ait sınır değerdir. Sol tarafın sınır değeri ise ortalamadan
1.533’i çıkarmakla bulunur: X2=7.512-1.535=5.977 m. Demek ki bu
populasyonda fidanların (boy itibariyle) dağılımın ortasındaki %90'ı 5.977 m
ile 9.047 m'ler arasında yer almaktadır.
49
4.3.Binom Populasyonları
Binom populasyonları, Binom dağılımı çerçevesinde incelenir. Binom
dağılımı, kuralları Newton tarafından ortaya atılmış bir matematik kanundur.
Bu kanun, iki olasılıklı bir olayın çok sayıda tekrarlanması halinde olasılıkların
daima sabit kalacağı hipotezine dayanır. Başka bir ifadeyle, binom
populasyonlarında bir olayın gerçekleşme ve gerçekleşmeme ihtimali sabittir.
Đşte bağımsız olarak tekrarlanabilen n sayıdaki olayda, sabit oranda meydana
gelen iki özelliğe sahip bireylerin oluşturduğu dağılıma binom dağılımı denir.
Mesela bir madeni paranın atılmasında yazı-tuğra gelme, doğumda kız-erkek
olma, pazarda satılan meyvelerin sağlam-çürük olma, bir tarımsal ilaç
uygulanması sonucu böceklerin ölme-sağ kalma, tavla zarının yek gelmegelmeme halleri gibi.
Bir metal para atıldığında, sadece yazı veya tuğra gelme olasılığı vardır.
Bunlar da %50 - %50 (yani 0.5 ve 0.5)'dir. Bu iki özellik başarı ve
başarısızlık (olumlu ve olumsuz veya istenen ve istenmeyen) olarak ele
alınabilir. Böylelikle n defa meydana gelen bir olayda başarı=a, başarısızlık=b
ile gösterilirse,
başarı olasılığı = p =
a
n
başarısızlık olasılığı = q =
b
n
dir.
Bu iki hal bir bütünün parçaları olduğuna göre, p+q=1’dir. Olayın n kez
tekrarlanması durumunda bu hallerin değişik kombinasyonları ortaya çıkarak, r
ile gösterilen 0, 1, 2, . . . n terimden biri meydana gelir. Bu kombinasyonların
bazısında istenen özellik hiç bulunmayabilir; bazısında 1 tane, bazısında 2,
bazısında 3, . . . bazısında da n tane bulunabilir. Terimlerin toplamı k=n+l’dir.
4.3.1.Binom Dağılımında Olasılıklar ve Katsayılar
p ve q gibi iki özelliğin meydana getirebileceği kombinasyonların
olasılıkları, iki terimlinin açılımı ile çözülür:
(p + q)n
(4.3)
Böyle bir dağılımda hepsi de istenen özelliğe (p'ye) sahip bireyden (n
bireyin hepsi de istenen özellikte) oluşan kombinasyon olasılığı, binomun 1.
terimi oları pn kadardır. n-1 bireyin istenen özellikte olduğu kombinasyon ise
npn-1q oranındadır (binomun 2. terimi).
Genel ifadesiyle, (p+q)n binomunun açılımında p'nin üssü n'den 0'a
doğru azalırken, q'nun üssü 0'dan n'e doğru artar. Birinci terimde p'nin üssü n,
ikinci terimde n-1, üçüncü terimde n-2, . . . sonuncu terimde (n+1'inci terim)
0'dır. Tersine q'nun üssü ise 1. terimde 0, 2. terimde 1, 3. terimde 2, . . .
50
sonuncu terimde n'dir. Böylelikle her durumda p ve q'nun üsleri toplamı n'dir.
Her hangi bir terimdeki q'nun üssü r ile gösterilirsc, bu terimdc p ve q'nun
üsleri:
(pn-rqr)
şeklindedir. Mesela (p+n)8 binomunda yukarıdaki açıklamalara göre 6. terim
p3q5 olur. Binom açılımında terimlerin katsayıları ise:
n!
( n − r )! r !
formülü ile bulunur. Bu ifadeye binom katsayısı denir. Bu açıklamalara göre
açılımın genel formülü:
P(r) =
n!
( n − r )! r !
pn-r qr
(4.4)
şeklindedir. Mesela 2 para birlikte atıldığında (veya bir para iki kere
atıldığında), n=2'dir. 2 yazı, 1 yazı 1 tuğra ve 2 tuğra olarak 3 kombinasyon
karşımıza çıkar. p'yi yazı, q'yu tuğra olarak kabul edersek, (4.4) nolu formüle
göre terimler ve olasılıklar:
1. terim: 2 yazı-0 tuğra gelme olasılığı: r=0 ïçin: P(0)=
2. terim: 1 yazı-1 tuğra gelme olasılığı: r=1 ïçin: P(1)=
3. terim: 0 yazı-2 tuğra gelme olasılığı: r=2 ïçin: P(2)=
2!
( 2 − 0)! 0!
2!
( 2 − 1)!1!
0.52-0 0.50= 0.25
0.52-1 0.51= 0.5
2!
( 2 − 2)! 2 !
0.52-2 0.52= 0.25
şeklindedir. 3 para birlikte atıldığında ise (n=3), olabilecek kombinasyon adedi
4’tür: 3 yazı (0 tuğra), 2 yazı 1 tuğra, 1 yazı 2 tuğra ve ((0 yazı) 3 tuğra. Bu
defa yazı gelme halleri: 3 yazı, 2 yazı, 1 yazı ve 0 yazı’dır. Bu hallere ait
olasılıklar da yukarıdaki gibi bulunabilir.
Binom açılımında n'e göre terimlerin katsayıları Tablo 4.1'de görülen
Pascal Üçgeni veya Tablo 4.2'de verilen n ve r'ye göre düzenlenmiş Binom
Katsayıları tablosundan alınabilir.
51
Tablo 4.1: Pascal Üçgeni
n
1
2
3
4
5
6
7
1
1
1
1
6
7
Binom Katsayısı
1
1
1
2
1
1
3
3
1
4
6
4
5
10
10
5
15
20
15
21
35
35
21
1
1
6
1
7
1
Tablo 4.2: n ve r değerlerine göre Binom katsayıları
n
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
r
0
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2
3
1
3
1
6
4
10
10
15
20
21
35
28
56
36
84
45 120
55 165
66 220
78 286
91 364
105 455
120 560
136 680
153 816
171 969
190 1140
4
5
6
1
5
1
15
6
1
35
21
7
70
56
28
126
126
84
210
252
210
330
462
462
495
792
924
715 1287 1716
1001 2002 3003
1365 3003 5005
1820 4368 8008
2380 6188 12376
3060 8568 18564
3876 11628 27132
4845 15504 38760
7
8
9
10
1
8
1
36
9
1
120
45
10
1
330
165
55
11
792
495
220
66
1716
1287
715
286
3432
3003
2002
1001
6435
6435
5005
3003
11440 12870 11440
8008
19448 24310 24310 19448
31824 43758 48620 43758
50388 75582 92378 92378
77520 125970 167960 184756
Tablo değerleri MS Excel, COMBIN(n,r) fonksiyonu ile hesaplanmıştır.
4.3.2.Binom Populasyonunun Parametreleri
(p+q)n genel formülüne göre dağılış gösteren bir populasyonda,
Ortalama = np
Varyans = npq
(4.5)
(4.6)
dur. Buna göre binomiyal dağılımlar birbirlerinden n ve p değerleri ile
ayrılırlar. Yani n ve p değerleri eşit olan dağılışlar birbirlerinin aynıdırlar;
ortalama ve varyansları eşittir.
52
4.3.3.Binom Dağılımının Özellikleri
• Binom dağılımı saymayla belirlenen niceliklerin dağılımıdır.
• Varyantların sınıflara dağılımı birbirlerine bağlıdır.
• p=q=0.5 ise dağılım simetriktir, normal dağılıma benzer. p≠q olması
halinde asimetriktir ve büyük olan özelliğe doğru yığılma gösterir.
• Dağılımda n+1 terim vardır ve 1. terim pn’dir. Diğer terimlerde p’nin
üssü 1 azalırken, q'nun üssü 1 artar. p ve q’nun üsleri toplamı daima n'e
eşittir.
• Terimlere ait olasılıkların toplamı 1'e eşittir.
• Binom dağılımının çözülebilmesi için n ve p bilinmelidir.
• Binom dağılımında ortalama ve standart sapma birbirlerine bağlıdır.
4.3.4.Binomiyal Dağılım Uygulamaları
Misal 4.5: %25'i beyaz, %75'i kırmızı bilyelerden meydana gelen bir
torbadan 4 bilye çekildiğinde, beyaz ve kırmızı bilyelerin geliş olasılıkları
nedir?
p=0.25 q=0.75 ve n=4'tür. 5 kombinasyon vardır. Bunlar: 4 beyaz (0
kırmızı), 3 beyaz 1 kırmızı, 2 beyaz 2 kırmızı, 1 beyaz 3 kırmızı ve (0 beyaz) 4
kırmızı şeklindedir. Pascal üçgeninde n=4'e bakacak olursak, bu hallerin
katsayılarının sırayla 1, 4, 6, 4 ve 1 oldukları görülür. Buna göre açılım ve
olasılıklar şöyle olur:
(p+q)4=1p4-0q0+4p4-1q1+6p4-2q2+4p4-3q3+1p4-4q4
=0.254+4(0.25)3(0.75)+6(0.25)2(0.75)2+4(0.25)(0.75)3+0.754
=0.039+0.0469+0.2109+0.4219+0.3164=1
Görüldüğü gibi, 4 beyaz gelme olasılığı %0.39, 3 beyaz gelme olasılığı
%4.69, 2 beyaz gelme olasılığı %21.09, 1 beyaz gelme olasılığı %42.19 ve hiç
beyaz gelmeme olasılığı %31.64 olmaktadır. Tüm kombinasyonlara ait
olasılıkların toplamı 1'dir.
Misal 4.6: Bir fıdanlıktan pazara verilen fidanların %10'unun standart
dışı olduğu varsayılıyor. Satılan fidanlardan rastgele 8 tane alınsa, standart dışı
- normal fidan kombinasyonları vc bunların olasılıkları nasıldır?
n=8 olduğuna göre, buradaki soru (p+q)8 binomunun açılımıdır. Aranan
özelliği standart dışı, aranmayanı normal olarak ele alacak olursak, standart dışı
fidanlar için p=0.1, normal fidanlar için q=0.9'dur. 8+1=9 kombinasyon vardır.
Açılım ve olasılıklar Tablo 4.3'te verilmiştir. Katsayılar Binom katsayıları
tablosundan alınmıştır.
53
Tablo 4.3: (0.1+0.9)8 binomunun açılımı
Terimler
r
1
2
3
4
5
6
7
8
9
0
1
2
3
4
5
6
7
8
St. dışı
fidan (p)
8
7
6
5
4
3
2
1
0
Normal
fidan (q)
0
1
2
3
4
5
6
7
8
Katsayı
pn-rqr
1
8
28
56
70
56
28
8
1
p8-0q0=0.180.90
p8-1q1=0.170.91
p8-2q2=0.160.92
p8-3q3=0.150.93
p8-4q4=0.140.94
p8-5q5=0.130.95
p8-6q6=0.120.96
p8-7q7=0.110.97
p8-8q8=0.100.98
Toplam
Sonuç
(Olasılık)
0.00000001
0.00000072
0.00002268
0.00040824
0.00459270
0.03306744
0.14880348
0.38263752
0.43046721
1.00000000
Tablonun son sütunundaki olasılıklar, binomiyal populasyonun frekens
dağılımı olarak ele alınabilir. Ancak bu frekanslar oransaldır (%). Oransal
frekans dağılımı Şekil 4.4'te grafik olarak gösterilmiştir.
0,50
Olasılık
0,40
0,30
0,20
0,10
0,00
0 1 2 3 4 5 6 7 8
Normal fidan sayısı
Şekil 4.4: (0.1+0.9)8 binomunda olasılıklar
Grafik, binomiyal dağılışlar için en uygun grafik olan çubuklu diyagram
şeklinde çizilmiştir. Burada sınıflar birbirinden kesin olarak ayrılmaktadır.
Çünkü binomiyal populasyonlar sayma yoluyla elde edilen varyantlardan
meydana gelir. Bu durum, binomiyal populasyonları normal populasyonlardan
ayıran en önemli özelliktir. Her varyant ötekinden tam sayı olarak ayrılır.
Dağılış kesiklidir.
4.3.2 maddesinde belirtildiği gibi, Binomiyal dağılımda p=q ise dağılım
simetrik şekil arzeder. Yukarıdaki misalde olduğu gibi p, q'dan farklı ise
dağılım çarpıklaşır ve olasılığı büyük olan özelliğe doğru yığılma göstcrir. Bu
misalde p<q olduğundan dağılım sağ tarafa yığılmıştır.
Misa1 4.7: Herhangi bir olayın n denemede r defa oluş ihtimali nedir?
Mesela, "% 10'u standart dışı olarak satılan fidanlardan rastgele satın alınan 8
tanesinden 2'sinin standart dışı çıkma olasılığı nedir?" sorusu ele alınabilir.
54
Tablo 4.3'e bakılacak olursa, bunun p=0.1488 yani %14.88 olduğu görülür.
Misal 4.8: Her hangi bir olayın n denemede en çok r defa oluş ihtimali
nedir?
Bu defa soru aynı fidanlığın fidanlarından rastgele satın alınan 8
tanesinden en çok 2'sinin standart dışı çıkma ihtimalinin ne olduğu şeklinde
düşünülebilir. Bunun cevabı 0, 1 ve 2 standart dışı fidan olasılıklarının
toplamıdır. Tablo 4.3'e bakılacak olursa, bu olasılık:
P=0.4305+0.3826+0.1488=0.9619 olduğuna göre, %96.19'dur.
Misal 4.9: Her hangi bir olayın n denemede r veya daha fazla oluş
ihtimali nedir?
Bu defa da mesela, aynı fidanlardan rastgele satın alınan 8 tanesinden cn
az 2 veya daha fazlasının standart dışı çıkma ihtimali sorulmaktadır. O halde
cevap, 2 ve daha fazla standart dışı fidanların olasılıkları toplamıdır. Tablo
4.3'e göre bu olasılık:
P=0.00000001+0.00000072+0.00002268+0.00040824+0.00459270+0.0
3306744+0.14880348=0.1869 bulunur. Demek ki satılan her 8 fıdandan 2 veya
daha fazlası %18.69 olasılıkla standart dışı olacaktır.
4.4.Poisson Populasyonları
Poisson populasyonları da, binom populasyonları gibi sayma yoluyla
elde edilen varyantlardan meydana gelir. Bu populasyonlar da kendine özgü bir
dağılım oluşturur. Poisson dağılımları, belli bir zaman, uzunluk, alan veya
hacım biriminde rastgele ve bağımsız olarak oluşan ender rastlanan olayların
olasılığını hesaplamakta kullanılır. Böylelikle bunlarda da dağılım kesiklidir.
Burada da aranan olayın veya özelliğin oluş ihtimali sabittir. Ancak çok
küçüktür. Poisson dağılımının ender rastlanan olaylara ait oluşu, bunu
binomdan ayıran en önemli özelliktir. Mesela toprakta 1'er m2'lik alanlardaki
larva sayısı, bazı meyvelerde olabilecek kurt sayısı, futbol maçlarında atılan gol
sayısı, fabrikalarda imal edilen malların arızalı veya kusurlu çıkması gibi.
Poisson dağılımı özellikle sonuncu örneğe çok uygundur. Çünkü esasen
fabrikalarda imalatta arızalı mal çıkma olasılığı çok düşüktür.
Poisson dağılımının olasılığa ait genel formülü:
P=
λ′
r!
e-λ
(4.7)
Formülde:
r=Aranan veya istenen olayın oluş sayısı (0 dahil tamsayıdır),
λ=Poisson populasyonunnn ortalaması,
e=Tabii logaritma tabanıdır.
Bu formül, aranan olayın r defa oluşunun oransal miktarını verir.
Formüle dikkat edilecek olursa, poisson dağılımında bilinmeyen sadece λ'dır.
55
4.4.1.Poisson Dağılımının Parametreleri ve Özelliği
Dağılımın aritmetik ortalaması:
λ=np
(4.8)
dir. Varyansı ortalamaya eşittir.
Yukarıda da işaret edildiği gibi, aritmetik ortalaması bilinen poisson
dağılımı belli demektir. Ortalamaları aynı olan poisson populasyonları da bir
birinin aynıdır. λ büyüdükçe, dağılım normal dağılıma yaklaşır.
Misal 4.10: Bir şişe fabrikasının üretiminden %1'inin hatalı olduğu
biliniyor. Şişeler 500'lük paketler halinde dağıtıldığında, bu paketlerde 0, 1, 2,
3, 4, 5 şişenin kusurlu olma olasılıkları nedir?
Soru binom dağılımı yardımıyla çözülmek istendiğinde, p=0.01, q=0.99
vc n=500 olarak düşünülüp olasılıklar (p+q)n=(0.01+0.99)500 binomunun
açılımıyla elde edilebilir. Ancak Poisson dağılımıyla şu şekilde bulunur:
n=500 olduğuna göre, (4.8) nolu formüle göre λ=np=500×0.01=5
bulunur. Demek ki her 500'lük pakette ortalama 5 şişe kusurludur. Buradan
(4.7) nolu formüle göre aranan olasılıklar:
r=0 için: P(0)=
r=1 için: P(1)=
r=2 için: P(2)=
r=3 için: P(3)=
r=4 için: P(4)=
r=5 için: P(5)=
λ′
r!
1
5
1!
2
5
2!
3
5
3!
4
5
4!
5
5
5!
e-λ =
5
0
0!
2.71828-5 = 1×0.006738=0.006738
2.71828-5 =0.033690
2.71828-5 =0.084225
2.71828-5 =0.140374
2.71828-5 =0.175468
2.71828-5 =0.175468
Demek ki 500'lük paketlerin:
%0.67'si kusursuz olmakta,
%3.37’sinde 1 tane kusurlu,
%8.42’sinde 2 tane kusurlu,
%14.04’ünde 3 tane kusurlu,
%17.55'inde 4 tane kusurlu,
%17.55'inde 5 tane kusurlu
56
şişe bulunmaktadır.
Misal 4.11: Đnsanların bir seruma karşı %0.1 alerjilerinin olduğu
biliniyor. 1000 kişiden 3'ünün alerji gösterme olasılığı nedir?
n=1000, p=0.001, q=0.999 olduğuna göre λ=np=l000×0.001= 1'dir.
3
P(3)=
1
3!
2.71828-1=0.061313 bulunur. Demek ki 1000 kişiden 3'ünde
allerji olasılığı %6.13'dür.
4.5.Normal Olmayan Populasyonlar ve Sayı Dönüştürmeleri
(Transformasyonlar)
Normal populasyonlar dışındaki populasyonlar, binomiyal, multinomiyal
ve poisson populasyonları gibi populasyonlardır. Bu tip populasyonlarda,
varyantlar sürekli bir dağılım göstermez ve çarpık bir çan eğrisine benzeyen,
bir tarafa yığılmış bir dağılım gösterirler. Bunlar genellikle sayılarak elde
edilen varyantların gösterdiği dağılımlardır. Ayrıca oransal değerler de (mesela
% değerleri) normal dağılım göstermezler.
Binomiyal populasyonlar, sabit bir oranda ortaya çıkan bir özelliğe sahip
bireylerle, bu özelliğe sahip olmayan bireylerin oluşturduğu populasyonlardır.
Bunlar iki tip varyanta sahiptir ve her tipin ortaya çıkma şansı sabittir. Poisson
populasyonlarında da bir özelliğin ortaya çıkış olasılığı sabittir. Ancak
binomiyellere göre çok küçüktür.
Normal olmayan populasyonlara, istatistiğin canlılara mahsus kolu olan
biyometriye ait analiz metotları -mesela varyans analizleri- uygulanamaz. Bu
tip populasyonlardan elde edilmiş sayıların dağılımının belli yöntemlere göre
çevrilerek (dönüştürülerek, transforme edilerek) normalleştirilmeleri
gerekir. En çok kullanılan dönüştürme metotları kare-kök, logaritma ve arcsinüs dönüştürmeleridir.
4.5.1.Kare Kök Dönüştürmesi
Sayım yoluyla elde edilen gözlemler, mesela belli bir toprak
alanlarındaki yabancı ot sayısı, bir bitkinin (mesela ağacın) üzerindeki belli bir
böcek sayısı gibi poisson dağılımı gösteren ve çok büyük olmayan sayılar
halinde elde edilen varyantlar, kare kökleri alınarak normal dağılıma
dönüştürülürler (kare kök dönüşümü). Bunların içinde sıfır veya 10'dan küçük
sayılar varsa, dönüştürme her sayıya 1 ilave edilerek (yani X + 1 ) şeklinde
yapılır.
4.5.2.Logaritmik Dönüştürme
Logaritmik
dönüştürme,
çarpık
57
dağılım
gösteren
(binomiyal)
populasyonlara uygun bir dönüştürme metodudur. Yine sayım yoluyla elde
edilen varyantlar büyük değerler ihtiva ediyorsa, bu dönüştürme şekli tavsiye
edilmcktedir. Logaritmik dönüştürme yapmak için varyantların logaritması
(logX) alınır.
4.5.3.Arc-Sinüs Dönüştürmesi
Arc-sinüs dönüştürmcsi (arc-sin X ), ondalık kesir veya % halinde
elde edilmiş (ki bu sayılar 0 ile 1 arasında değişir), binomiyal dağılım gösteren
verilere uygulanır. Bu amaçla, bazı istatistik kitaplarında bulunan özel
tablolardan yararlanılabileceği gibi, sin-1 (invers sinüs) hesabı yapan bir hesap
makinesi de kullanılabilir. Böyle bir hesap makinesi ile bir değer (mesela 0.45,
yani %45), önce kare kökü alınıp, sonra sin-1 tuşuna basılmakla arc-sinüs'e
çevrilmiş olur. Örneğin 0.45'in arc-sinüsü 42.13 bulunur.
Arc-sin'e çevrilmiş bir değerin, hesap makinesi ile geriye, asıl yüzde
haline dönüştürülmesi ise, önce bu değerin sinüsünün alınıp, çıkan sayının
karesinin alınmasıyla gerçekleştirilir.
58
5. ÖRNEKLEME
5.1.Giriş
Bu bölüme kadar çeşitli şekillerde "örnek" veya "nümune"den söz
edildi. Bilindiği gibi örnek, ana kütleyi (veya populasyonu, toplumu) tanımak
maksadıyla içinden çekilen bireyler grubuna denmektedir. Mesela Türk
insanının boyunu bulmak için, tüm insanların boyunu ölçmek yerine,
örnekleme ile bir takım kişilerin boyu ölçülerek bu kişiler üzerinden Türk
populasyonunun boyu öğrenilmeye çalışılır. Aynı şekilde ormancılıkta belli tür
ve yaşlardaki meşcerelerin hacımları, bunlardan alınan örnek ağaçların
ölçülmesiyle tahmin edilir.
Örnekteki bireylerin incelenmesiyle, ölçülmesiyle, tartılmasıyla,
ortalama ve varyans gibi istatistikler elde edilmekte ve bunlar üzerinden ana
kütleye ait parametreler tahmin edilmektedir. Böylelikle üzerinde çalışılan ana
kütle hakkında bilgi edinilmektedir Ancak bu işlemlerin sağlıklı ve güvenilir
olabilmesi iyi bir örnekleme ile mümkündür. Bu bölümde örnekleme teknikleri
hakkında kısa bilgi verilecektir.
5.2.Örnek ve Örneklemeye Ait Genel Bilgiler
Büyük ve küçük örnek: Örnekteki birey sayısı n<30 ise çekilen örnek
küçük örnek sayılmaktadır. Ancak biyometride genellikle büyük örneklerle
çalışılır.
Birey ve ölçü birimi: Örneklemeyle üzerinde çalışılacak bireyler, insan,
bitki, hayvan olabileceği gibi, bunların meydana getirebileceği aileler, gruplar
da olabilir. Mesela tek tek ağaçlar örneği teşkil edebileceği gibi, bunların yer
aldığı belli bir saha da “örnek” olabilir.
Ölçülerek - tartılarak incelenen bireylerin ölçü ve tartı birimleri kesirli
sayılardan meydana gelir. Örnekleme için ölçü vc tartılarda uygun, mantıklı bir
birim seçilmeli ve ölçü - tartı uygun küsuratta yapılmalıdır. Mesela metrelerce
boylu ağaçların boyunun cm üzerinden, mm hassasiyetle ölçülmesi
anlamsızdır. Uygun birim m, uygun kesir ise cm'dir. Buna karşılık bir kaç
gramlık bir tohumun, kg üzerinden g hassasiyetle tartılması da yanlıştır. Bu
defa g üzerinden, miligrama varan bir hassasiyet söz konusu olabilir. Bu
konuda, ölçülecek - tartılacak materyalin, pratikte kullanılan ölçü birimi ve
uygun ondalığı esas alınmalıdır.
Örneklemenin safhaları: Önce örneklemenin amacı belirlenmeli ve ana
kütlenin sınırları olabildiğince tesbit edilmelidir. Örneklerde neyin üzerinde
59
durulacağı, ölçüleceği, tartılacağı iyi bilinmelidir. Mesela ağaç hacım tablosu
için yapılan örneklemede belli aralıklarla gövde çapı ve kabuk kalınlığı, 1.30 m
çapı, ağacın tam boyu ölçülür. Örneklemede kullanılmak üzere, ölçülerin
yazılacağı uygun formlar düzenlenmeli, alet, makine ve insan gücü
sağlanmalıdır. Örnekleme metodu, örnek büyüklüğü ve yapılacak masraf tesbit
edilmelidir.
Đyi bir örnekleme için, rastgele örnekleme metotları kullanılmalı, örnek
ana kütleyi olabildiğince iyi temsil etmelidir. Bunun için örnek mümkün
olduğu kadar çok sayıda bireyi kapsamalı, örneği teşkil edecek bireyler seçilip
beğenilmeden, işin kolayına kaçılmadan alınmalı ve tesbit edildiği yerden,
tesbit edildiği şekilde ölçülmelidir. Örnekleme öncesi personel eğitilmelidir.
Mevcut imkanlara göre en ucuz ve kolay yol seçilmeli, ancak maliyeti
düşürmek için prensiplerden ödün verilmemelidir.
5.3.Örnekleme Metotları
Örnekleme bilinçli örnekleme ve rastgele örnekleme olarak iki şekilde
yapılmaktadır.
5.3.1.Bilinçli Örnekleme Metotları
Bilinçli örnekleme, yukarıda belirtilen genel prensiplerin aksine, belli
ön yargıya dayanarak yapılır. Aşağıdaki şekillerde olabilir:
Monografi: Bu metot; örnek olay incelemesi olarak da bilinir.
Toplumdan ilginç bulunan bir kaç bireyin bilinçli olarak seçilmesiyle olur.
Bunlar ayrıntılı şekilde incelenir. Genellikle sosyal bilimlerde kullanılır.
Kota yöntemi: Toplumun farklı özelliklerine göre gruplandırılması (yaş,
yaşam standardı, cinsiyet gibi) ve her gruptan belli oranda örnek alınmasıyla
yapılır. Özellikle heterojen toplumlara uygulanır.
Yoğunluk yöntemi: Yine heterojen toplumlarda, bireylerin sadece
yoğun olarak toplandığı gruplardan örnek alınmasıdır.
5.3.2.Rastgele Örnekleme Metotları
Rastgele örneklemenin esası, toplumdaki bütün bireylerin örneğe girme
şansının eşit tutulmasına dayanır. Ancak bu prensip her zaman
gerçekleştirilemez. Çünkü toplum çok büyük ve dağınık olabilir. Bu durumda
örnekleme sınırlandırılmış bir toplumdan yapılır. Bu durumda saptanan bilgiler
de bu çerçeve dahilinde genelleştirilebilir. Mesela dünyadaki tüm Karaçam
populasyonu örneklenemeyeceği gibi, Türkiye'dekilerin tamamı da
örneklenemez. Örnekler belli bölgelerden alınır. Rastgele örnekleme aşağıdaki
şekillerde yapılabilir:
Basit rastgele örnekleme: Toplumdaki her bireye örneğe girmekte eşit
60
şans tanır. Mesela yazı-tuğra atma, bireyleri numaralandırarak kura çekme,
harita veya kroki üzerine noktaları rastgele serpme gibi uygulamalarla basit
rastgele örnekleme yapılabilir. Ancak bu metodun uygulanabilmesi için,
toplumun tamamı bilinmeli ve numaralanmalıdır.
Sistematik (Dizgeli) örnekleme: Basit rastgele örnekleme için toplumun
tüm bireyleri numaralandırılmalı ve kura sonucu tek tek aranıp bulunmalıdır.
Bu işlem uygulamada, özellikle arazi çalışmalarında güçlük çıkarmaktadır.
Yine basit rastgele örneklemede, toplumun bazı yerlerinden tesadüfen hiç
örnek alınmayabilir. Bu duruın özellikle heterojen topluınlarda sakıncalı
görülmektedir. Basit rastgele örneklemenin bu güçlük ve sakıncalarından
kaçınmak için sistematik örnekleme kullanılmaktadır. Bu metot sıralı
durumdaki toplumlarda rastgele birinden başlanıp, belli aralıklarla her k’ıncı
bireyin alınması veya harita üzerinde rastgele bir noktadan başlanıp her bir kaç
yüz m’de bir örnek sahanın alınmasıyla yürütülür. Sistemetik örnekleme
özellikle ağaçlandırma sahası gibi muntazam şekilde sıralanmış bireylerin
oluşturduğu toplumlara çok uygundur. Bu metoda göre toplumun hepsinin
bilinmesine ve numaralanmasına gerek yoktur.
Katmanlı (tabakalı) örnekleme: Toplumun heterojen olması halinde,
önce homojen katmanlara ayrılarak alt toplumlara bölünmesi ve her alt
toplumdan büyüklüğü oranında birey alınması demektir. Mesela incelenen bir
ağaç türü için toprak türü, bakı, meyil, rakım veya uygulanan kültür metotlarına
göre katmanlar oluşturulabilir. Bu metot kota yöntemine benzerse de,
katmanlar içinden örneğin rastgele alınmasıyla o metottan ayrılır. Katmanlı
örnekleme sayesinde her katman için özel bilgi edinilmekte, her katmanda ayrı
ekipler çalışabilmekte, katmanlar homojen olacağı için daha küçük örneklerle
yetinilebilmektedir.
Küme örneklemesi: Çok büyük ve sınırları belli olmayan toplumların
örneklenmesinde kullanılır. Böyle toplumlarda toplum önce n sayıda kümeye
ayrılmakta, sonra her kümeden m’er adet birey alınmaktadır. Kümeler ve küme
içleri, basit rastgele, sistematik veya katmanlı olarak örneklenebilmektedir.
Burada kümelendirmeden maksat toplumu homojen gruplara ayırmak değildir.
Çok basamaklı örnekleme: Küme örneklemesinin daha ayrıntılı
şeklidir. Bu metoda göre toplum birkaç basamak halinde alt ünitelere bölünerek
örneklenmektedir. Mesela önce bölgelere ayrılmakta, sonra her bölge bloklara
ayrılmakta, her blok kesimlere ayrılmakta ve her kesimden örnek bireyler
alınmaktadır. Bu metot da, küme örneklemesinde olduğu gibi, bireylerin
yerinin ve sayısının önceden bilinmemesi ve toplumun zaman-mekan içinde
büyük dağılış göstermesi durumunda uygulanmaktadır.
61
6. HĐPOTEZ KONTROLLARI VE GÜVEN ARALIĞI
6.1.Giriş
Bu bölüme kadar, nümunenin tanınması hakkında bilgiler verilmiştir.
Bundan sonraki konularda istatistik analiz ve kontrol metotlarına girilerek,
nümuneden populasyonların tahmini çalışmaları açıklanacaktır. Đstatistikte
hipotez kontrolları ile, denemeci ve araştırmacı ortaya attığı hipotezlerin
geçerliliğini kontrol ettiği gibi, üzerinde çalıştığı populasyona ait parametreleri
de tahmin edebilir.
6.2.Hipotez Kontrolu
Araştırma ve deneme sonuçlarının değerlendirilmesi ve genelleştirilmesi,
belli bir hipotezin kabul veya reddedilmesiyle olur. Hipotez kontrolunda
sırayla şu işlemler yapılır:
• Araştırma veya denemenin amacına uygun hipotez kurulur.
• Hipotezin belirttiği bir populasyonun var olduğu düşünülür.
• Eldeki örneğin bu populasyondan çekilmiş bir tesadüf örneği olması
ihtimali hesaplanır.
• Bu ihtimalin büyüklüğüne göre, hipotez kabul veya reddedilir.
Mesela “A” isimli yeni bir kavak klonu bulunduğunda, bunun büyüme
yönünden ne derece iyi olduğunu anlamak için, halen yetiştirilmekte olan ve
verimliliği kanıtlanmış diğer bir klonla (örneğin B klonu) mukayesesi
gerekebilir. Bu durumda kurulacak hipotez “A klonu B klonundan farksızdır.”
şeklinde olur. Bu hipotez, A ve B klonlarının belli bir yaştaki çaplarının,
boylarının, hacımlarının aynı olduğunu varsayar. Hipoteze göre, A klonu
aslında B klonu populasyonuna aittir. Yapılan hesaplarla bu olasılık bulunarak
A klonunun B klonu populasyonuna mensup olup olmadığına karar verilir.
Veya başka bir araştırma ile her hangi bir meyvede bir vitamin aranabilir. Bu
defa hipotez “X meyvesinde Z vitamini miktarı 0’dır.” şeklinde olacaktır. Bu
hipotez ise, ortalaması Z vitamini bakımından 0 olan bir populasyonu ele
almaktadır. Yine yapılan çalışmalarla X meyvasının ortalaması sıfır olan bu
populasyona ait olma olasılığı hesaplanır.
Đstatistikte genellikle alınan örneklerin “birbirinden farksız olduğu” “eşit
sayıldığı” aranan özelliği “bulundurmadığı” veya etkisi aranan konunun
“etkisiz olduğu” varsayımlarını öngören sıfır hipotezleri kurulmakta ve
doğrulukları denetlenmektedir. Sıfır hipotezlerine göre populasyonlarda
kıyaslanan özellik arasındaki fark sıfır sayılır. Bu fark aslında hiç bir zaman
62
sıfıra eşit olmaz. Ancak araştırmacının esas alacağı belli olasılıklar
çerçevesinde sıfır olduğu kabul edilir. Sıfır hipotezi H0 ile gösterilir. Bunun
karşıtına ise alternatif hipotez denir ve H1 ile gösterilir.
Hipotez kontrolları belli olasılık çerçevesinde yapılır ve bu olasılığın
derecesine göre kurulan hipotez kabul veya reddedilir. Bu amaçla esas alınan
olasılıklar 0.05, 0.0l ve 0.001’dir Tarım ve ormancılıkta genellikle 0.05 ve 0.01
olasılıklar yeterli olmaktadır.
Bu bölümde t istatistiği vasıtasıyla hipotez kontrolu açıklanacaktır.
6.2.1.t Đstatistiği ve t Dağılımı
Ortalaması µ, standart sapması σ olan bir populasyondan n varyantlı
sonsuz sayıda tesadüf nümunesi çekilmiş olsun. Bunların ortalamaları da bir
normal dağılış gösterir. Bu dağılımın ortalaması populasyonun ortalamasına (µ)
eşittir. Standart sapması anlamına gelen standart hatası ise s X olarak tahmin
edilebilir (Bak: Madde 3.5). Böyle bir populasyonda örnek ortalamalarının,
populasyon ortalamasından uzaklığı ( X -µ) dağılımın standart hatası ( s X )
cinsinden:
t=
X −µ
sX
(6.1)
formülüyle ifade edilebilir. Bu şekilde bulunacak t değerleri, -∞ ile +∞ arasında
değer alırlar (Dağılımdaki varyantların %99'unun ortalamadan en çok ±3σ
uzakta olduğu düşünülürse (Bak: madde 4.2.2), t’lerin çoğunluğunun değeri –3
ile + 3 arasında değişir.). Bunların da ortalaması 0 olur ve ortalaması 0 olan bir
normal dağılış gösterirler. Böylece, n varyanslı sonsuz sayıda örneğe ait t
değerlerinin gösterdiği sıfır ortalamalı normal dağılıma Student'in t dağılımı
denmektedir. Dağılımın varyansı ise örneklerin serbestlik derecesine (n-1)
bağlı olarak değişir (Bak: Madde 3.5) (Düzgüneş, s.41). Varyans, örnekteki
varyant sayısı ile ters orantılı olduğundan, n büyüdükçe varyans küçülür (Şekil
6.1).
Belli serbestlik derecelerindeki örnek ortalamalarına ait t değerlerinin
dağılımı (oluş, ortaya çıkış ihtimali), örneklerin serbestlik derecesine göre Ek
Tablo 2'de verilmiştir. t değerinin serbestlik derecesi, örnekteki varyant
sayısının 1 eksiğidir. Tablonun ilk sütununda örneklerin serbestlik dereceleri,
diğer sütunların başlarında ise olasılıklar verilmiştir. Bu tabloya bakılarak, bir
nümune üzerinden hesaplanan t değerinin ve bundan daha büyük t değerlerinin
dağılımdaki oransal miktarı (% olarak) veya ortaya çıkma olasılığı (P) tayin
edilebilir.
63
Şekil 6.1: Çeşitli sayıda varyantı ihtiva eden tesadüf nümuneleri
ortalamalarının dağılışları
Tabloya göre, mesela 7 SD'li 2.365 ve 2.365'den daha büyük t değerleri,
dağılımda 0.05 oranında yer almaktadırlar. Ancak bu sınırlar mutlak değer
olarak dikkate alınmalıdır. Çünkü aynı durum -2.365 ve daha küçük t'ler için de
söz konusudur. Daha açık ifadeyle, 2.365 dahil büyük ve -2.365 dahil küçük t
değerleri toplam olarak dağılım %5'ini kapsamaktadır. Bu, 8 varyantlı
örneklerin %5'inde, mutlak değer itibariyle 2.365 ve daha büyük (yani -2.365
dahil küçük, +2.365'dahil büyük) t değeri hesaplanacak demektir. Yine 7 SD'li,
ancak 3.499 ve daha büyük t değerleri ise dağılımda 0.01 oranında
bulunmaktadır. Bu ise, örneklerin `%1'inin 3.499 ve daha büyük (yani 3.499'dan küçük, +3.499'dan büyük) t değerine sahip olacağı anlamını taşır. 7
SD'li, 5.408 ve daha büyük t değerleri de dağılımda 0.001 oranında yer
almaktadır. Dolayısıyla örneklerin %0.1'inde 5.408 ve daha büyük (yani 5.408'den küçük, +5.408'den büyük) t değerine rastlanmaktadır. Başka bir
ifadeyle, 7 SD'li nümunelerde, mutlak değer olarak 2.365 ve daha büyük bir t
dcğerinin ortaya çıkış ihtimali %5; 3.499 ve daha büyük bir t değerinin ortaya
çıkış ihtimali `%l; 5.408 ve daha büyük bir t değerinin ortaya çıkış ihtimali ise
%0.1'dir. t değerleri bu şekilde dağılımın iki yanını da kapsadığından, tablonun
üstünde "iki yanlı dağılım" ifadesi kullanılmıştır.
Şekil 6.2'de, dağılımda sağlı-sollu toplam %5'lik bir alan işgal eden ve
−2.365'den küçük, +2.365'den büyük t'lerin yer aldığı sahalar gösterilmiştir.
64
t=-2.365
Alan %2.5
-4
-3
-2
t=2.365
Kabul bölgesi
%95
-1
0
Alan %2.5
1
2
3
4
t deðerleri
Şekil 6.2: 7 Serbestlik dereceli t değerlerinin dağılımı
Ancak t'nin işareti söz konusu ise, yani belli bir t değerinden yalnız
büyükler soruluyorsa, tablonun altındaki olasılık değerleri ele alınmalıdır.
Mesela yine 7 SD'li nümunelerde 2.365'den yalnız büyük t değerlerinin ortaya
çıkış olasılığı %2.5'tur. Bu defa ele alınan değerler "tek yanlı dağılım" içindir.
6.2.2.Populasyon Ortalaması Đle Đlgili Hipotez Kontrolu
Populasyon ortalaması ile ilgili sıfır hipotezi “örnek ortalamasının
populasyon ortalamasından farksız olduğu” veya "örnek ortalamasının
populasyona ait olduğu" şeklindedir. Bu tip hipotez kontrolu ile, bir örneğin
belli bir populasyona ait olup olmadığı veya belli bir populasyondan çekilmiş
bir nümune olup olmadığı denetlenir. Kontrol için t istatistiğinden yararlanılır.
(6.1) nolu formüle göre, örneğin t değeri hesaplanarak, bunun ve bundan daha
büyük (mutlak değer itibariyle) t değerlerinin elde edilme olasılığı bulunur.
Olasılık %5 veya daha küçükse hipotez reddedilir. Bu olasılığın 100'den
farkına ise, güven düzeyi denir. %95, %99 güven düzeyi gibi. Tarım ve
ormancılıkta hipotezlerin kabulü için geçerli güven düzeyi olarak %95 esas
alınmaktadır.
Konuyu bir örnekle açıklayalım:
Misal 6.1: Tablo 1.1'de gösterilen örnek, (bu fidanlıkta yıllardır yapıldığı
varsayılan ölçülere göre) ortalaması 7.3 m olan bir populasyondan alınmış
sayılsın. Bu nümune, acaba gerçekten ortalaması 7.3 m olan bir populasyondan
çekilmiş bir örnek midir? Bunun kontrolu için, örnek ortalaması ile populasyon
ortalamasının eşit sayılıp sayılamayacağı denetlenir. O halde hipotez: "Eldeki
50 bireylik nümune, söz konusu populasyona mensuptur ( X =µ)." veya
“Nümune ortalaması, populasyon ortalamasından farksızdır ( X -µ=0).”
şeklindedir. Hipotezin kontrolu için:
65
t=
7.512 − 7.3
= 1.60
0.1324
hesaplanır. Ek Tablo 2'de n-1=49 serbestlik derecesi için değer verilmemiştir.
Bu sebepten kendisine en yakın serbestlik derecesine ait değere bakılır veya
enterpolasyon yapılır. %5 olasılık için 40 SD’li tablo değerinin t40,0.05=2.021
olduğu görülür. Demek ki 40 SD'li bir dağılımda mutlak değer itibariyle en az
2.021 ve daha büyük t değerlerinin elde edilme olasılığı %5 olmaktadır. Bu
değeri 49 SD’li örneğimiz için kullanacak olursak, bulduğumuz t değeri
bundan büyük olmadığına Yani %5’lik sahaya girmediğine) göre hipotez kabul
edilir ve “Nümune adı geçen populasyona aittir” denir. Hesaplanan t değeri
2.021 ve daha büyük olsaydı, sıfır hipotezini reddedecek ve “Nümune bu
populasyondan çekilmiş bir tesadüf nümunesi değildir” diyecektik.
49 SD'li örneklere ait t değerlerinin dağılımda %5 oranında yer alan
kısımları Şekil 6 3'de gösterilmiştir. Şekilde görüleceği üzere, dağılımda %5
oranında yer alan t değerlerinin, %2.5'u - uçta, %2.5'u + uçta yer almaktadır.
Bu sahalara düşen t'ler hipotezin reddini gerektirdiğinden, bu bölgeler red
bölgesi diye adlandırılır. Misale göre bu alanlar t= -2.021'den küçük ve
t=2.021'den büyük kısımlardır.
Buradaki kontrola, dağılımın iki yanını da kapsadığından iki yanlı
kontrol denir. Ancak hipotez mesela "örnek ortalaması populasyon
ortalamasından büyüktür ( X >µ)" ise t değerinin yalnızca pozitif olduğu haller
söz konusu olacaktır.
t=1.6
Red bölgesi
%2.5
-4
-3
Red
bölgesi
Kabul bölgesi
%95
-2
-1
0
1
2
3
4
t deðerleri
Şekil 6.3: 49 serbestlik dereceli örneklerde t'lerin kabul ve red bölgeleri
Bu duırumda red bölgesi sadece sağ uçta kalan kısım olacağından %5
önemlilik kontrolu için, tek taraftaki %5'lik red bölgesi dikkate alınacaktır.
Buna ait t değeri için de, Ek Tablo 2'nin altındaki tek yanlı test için belirlenen
olasılıklar esas alınacaktır. Tabloda bu değerin, t0.05=1.684 olduğu görülür. Bu
66
şekildeki hipotez kontroluna da tek yanlı hipotez kontrolu denir.
6.3.Populasyon Ortalamasının Tahmini ve Güven Sınırları
Daha önce işaret edildiği gibi, ortalama populasyona ait bir parametredir.
Ve parametreler, nümune üzerinden hesaplanan istatistikler vasıtasıyla tahmin
edilir. Đstatistikler, standart hatalarının küçüklüğü oranında parametreye
yaklaşır. Ancak hiçbir zaman parametre ile aynı olamaz. Bu sebepten, bir
parametre daima istatistik ve bunun standart hatası ile birlikte tahmin edilir.
Parametrelerin tahmini, istenen bir güven düzeyinde, içinde bulunduğu sınırlar
hesaplanarak yapılır.
Bir populasyonun ortalaması, bu populasyondan çekilmiş bir nümune
ortalaması ( X ) ve bu ortalamanın standart hatası ( s X ) ile istenen bir güven
düzeyinde t tablosu değeri ile şu formüle göre tahmin edilir:
X - (t× s X ) < µ < X + (t× s X )
Misal 6.2:
hesaplayalım:
Fidan
örneğindeki
ortalamanın
(6.2)
güven
sınırlarını
Nümunede X =7.512 m ve s X =0.1324 m hesaplanmıştır. Ek Tablo
2'den 49 SD için %95 güvenle (49 SD'sine en yakın değer olarak) t0.05=2.021
okunur. O halde % 95 güvenle fidan populasyonunun boy ortalaması (m):
7.512-(2.021×0.1324) < µ < 7.5I2+(2.021×0.1324)
7.24 m < µ <7.78 m
arasında tahmin edilir. Populasyonun boy ortalaması %5 ihtimalle de bu
sınırların dışındadır. Hesaplanan bu sınırlara güven sınırları denir.
Burada yapılan tahmin t dağılımının iki tarafını da kapsadığından, söz
konusu sınırlar iki yanlı güven sınırlarıdır. Bazı hallerde tek yanlı güven
sınırları istenebilir. Bu durumda, ortalamanın belirlenen bir güven düzeyinde
yalnız alt veya yalnız üst sınırı istenmektedir. Mesela yine fidan örneğinde t0.05
güvcnlc ortalamanın yalnız üst sınırını hesaplayabiliriz. Bu defa bizi t dağılımı
altındaki alanın iki ucu değil, yalnız bir ucu ilgilendirmektedir. O halde “%95
güvenle ortalamanın üst sınırı nedir?” veya “%5 ihtimalle üst sınırın dışında
kalan ortalamalar kaçtır?” sorusuna cevap aranmaktadır. Bu durumda tek yanlı
test için %5 olasılıkla 49 SD'1i t değeri alınacaktır. Ancak tabloda 49 SD için
değer verilmediğinden, buna en yakın 40 SD için verilmiş 1.684’lük t değeri
alınabilir. Bu durumda istenen sınır:
X = 7.512+(1.684×0.1324) = 7.73 m
bulunur. O halde bu populasyonda fidanların ortalama boylarının %95 güvenle
7.73 m'ye kadar, %5 olasılıkla 7.73 m'den büyük olduğu söylenebilir.
67
7. SAYIMLA BELĐRLENEN POPULASYONLARDA
HĐPOTEZ KONTROLU
(KHĐ-KARE METODU)
7.1.Giriş
Binomiyal populasyonlarda ve poisson populasyonlarında, olayların
sabit ve belirli oranlarda ortaya çıktığı 4: Bölümde belirtilmişti. Mesela bir
paranın havaya atılması sonucu yazı veya tuğra gelmesi olasılığı 0.5'dir. Bu
gibi populasyonlardan alınan örneklerde varyantlar sayılarak elde edilir.
Örneğin populasyona uygunluğu ise, sınıflardaki varyant adedinin,
populasyonda olması gerekene uygunluğunun kontrolu ile anlaşılır. Bu
maksatla, örneğin gerçekten bu populasyona ait olup olmadığı denetlenir. Bu
defa sıfır hipotezi “örneğin hipotezle belirtilen populasyona ait olduğu”
şeklindedir. Sayımla belirtilen populasyonlarda bu hipotezin kontrolu için Khikare metodu kullanılır. Ortalamaya dair bir hipotez kurulmadığından t
kontrolu yapılamaz.
7.2.Khi-kare Değeri ve Khi-kare Dağılımı
χ2 simgesiyle gösterilen khi-kare değeri aşağıdaki formüle göre
hesaplanır:
χ2 =
( f − f ′) 2
∑ f′
Sınıflanmış ve beklenen değerleri veya oluş ihtimalleri bilinen bir
dağılımda bu formüldeki:
f=gözlenen frekanslar,
f ′=beklenen frekanslardır.
Örnekler üzerinden formüle göre hesaplanan khi-kare değerleri bir
dağılım oluşturur. Khi-kare değerlerinin dağılımı, serbestlik derecelerine göre
Ek Tablo 3'de verilmiştir. Bu tablo yardımıyla, bir örnekte hesaplanan khi-kare
değerinin ortaya çıkış olasılığı veya başka bir anlamda populasyondan, eldeki
örneğe benzer bir örneğin çekilme olasılığı (P) tesbit edilebilir. Mesela 3 SD
için P=0.05 olasılıkla χ2 =7.815’dir. Bunun anlamı, rastgele örneklerde
hesaplanan khi-kare değerlerinin, örneklerin %5’inde 7.815 ve daha büyük
olduğudur. Bu değerden daha küçük khi-kare'ye sahip olanlar ise %95 kadardır.
68
Teorik dağılımlara uygunluk testinde khi-karenin serbestlik derecesi ana
kütlenin frekansının hesaplanma metoduna göre değişir. Genel formül
aşağıdaki gibidir:
V=k-a-1
(7.2)
Formülde k sınıf veya grup sayısı, a ise teorik dağılımın
hesaplanmasında kullanılan parametre (aritmetik ortalama, varyans, standart
sapma gibi) adedidir. Genel olarak normal dağılımlarda teorik dağılıma ait
frekanslar aritmetik ortalama ve varyans üzerinden hesaplandığından, normal
dağılıma uygunluk kontrolunda a=2 alınır. Binoma uygunluk kontrolunda ise
teorik dağılım binom açılım formülü (formül 4.4) üzerinden ve her hangi bir
parametre kullanılmadan hesaplanmışsa a=0’dır. Poisson dağılımı,
populasyonun ortalamasının (λ) kullanılmasıyla hesaplandığıdan bu
dağılımların uygunluk kontrolunda a=1 alınmaktadır.
Khi-kare, dağılımın serbestlik derecesine bağlıdır. Her SD için ayrı bir
dağılım verilir. Küçük SD’lerinde azalan bir eğri şeklindeki dağılım, SD
arttıkça çarpık bir çan eğrisi haline dönüşerek, sonunda normal dağılıma
yaklaşır. Khi-kare değeri küçüldükçe p (olasılık) 1’e yaklaşır (Şekil 7.1).
Bu durum, örneğin %100’e yaklaşan oranda çekildiği populasyona ait
olduğunu gösterir. Tersine khi-kare büyüdükçe P küçülür ve örneğin, çekildiği
populasyona ait olma olasılığı azalır. Belli bir noktadan sonra artık bu örneğin,
çekildiği populasyona ait olmadığına hükmedilir.
0,8
SD 1
SD 3
0,7
Olasılık
0,6
SD 5
0,5
SD 8
0,4
0,3
0,2
0,1
0
0
5
10
15
20
Khi-kare değeri
Şekil 7.1: 1, 3, 5 ve 8 serbestlik dereceli khi-kare dağılımları
Khi-kare testi, örnek üzerinden bulunan deneysel bir dağılımın, teorik bir
dağılıma uygunluğunun kontrolunda uygunluk testi kullanıldığı gibi, 7.3 nolu
69
maddede açıklanan iki karakter arasındaki ilginin kontrolunda bağımsızlık
kontrolu da kullanılmaktadır. Ayrıca değişik toplumlardan değişik zamanlarda
alınmış örneklerin homojenliğinin kontrolu için homojenlik testi de kullanılır.
7.2.1.Nümunenin Normal Dağılıma Uygunluğunun Kontrolu
Bu amaçla kullanılan başlıca metodlar, Khi-kare ve KolmogorovSmirnov testleridir. Burada yalnız khi-kare metodu açıklanacaktır.
Daha önce anlatıldığı üzere, normal dağılış gösteren populasyonlardan
çekilen örneklerin t değerleri üzerinden, böyle bir populasyona ait olup
olmadıkları denetlenebilir. Ancak mesela 1.4.2 nolu maddede açıklandığı
şekilde bir frekans dağılımı elde edilse ve bu dağılımın normal eğri metodlarına
göre (4.2.3 veya 4.2.5 nolu maddelcr) beklenen değerleri (teorik frekansları)
hesaplansa, gözlenen durumun beklenen duruma gerçekten uygun olup
olmadığı (veya ne oranda uygun olduğu) aşağıda açıklanacak khi-kare testi ile
anlaşılabilir.
Metodu 50 varyantlı fidan örneği üzerinden açıklayalım:
Misal 7.1: 50 fidanın boyları daha önce 0.5 m'lik sınıflara dağıtılmış ve
her sınıfa düşen frekans tesbit edilmişti (Tablo 1.2). Bölüm 4.2.5'deki
uygulamadan yararlanarak, 5.5 m'den itibaren 0.5 m arayla meydana gelen 9
sınıfa isabet eden teorik frekanslar hesaplanmış (Şekil 4.1) ve Tablo 7.1’de
verilmiştir.
Tablo 7.1: 50 adet fidanın gözlenen ve beklenen frekansları
Sınıf
1
2
3
4
5
6
7
8
9
Toplam
Alt sınır
(m)
5.5
6.0
6.5
7.0
7.5
8.0
8.5
9.0
9.5
Gözlenen
frekans (f)
2
4 6
8
9
11
8
4
3
1
50
Beklenen
frekans (f′)
1.8
6.1
4.3
7.6
10.2
10.3
7.8
4.4
1.9
0.6
48.9
f- f′
(f- f′)2
(f- f′)2/ f′
-0.1
0.01
0.0016
0.4
-1.2
0.7
0.2
0.16
1.44
0.49
0.04
0.0211
0.1412
0.0476
0.0051
1.1
1.21
0.1754
1.1
0.3920
Tablo 7.1'in 3’üncü sütunu gözlenen, 4’üncü sütunu beklenen frekansları
göstermektedir. Ancak khi-kare ile uygunluk kontrolunda bir konuya dikkat
edilmelidir. Khi-kare dağılımının özelliğine göre, hiç bir sınıfta beklenen değer
sayısı 5'ten az olmamalıdır. Eğer böyle sınıflar varsa, bunlar birleştirilmelidir.
Burada beklenen değerler 5.5-5.9 sınıfında 1.8, 6.0-6.4 sınıfında 4.3
olduğundan bu ikisi birleştirilerek 6.1 elde edilmiştir. Aynı şekilde son üç
70
sınıftaki 5'ten küçük olan 0.6, 1.9 ve 4.4 değerleri de birleştirilerek 6.9 elde
edilmiştir. Tabi bu durumda, bunlara ait gözlenen değerler de birleştirilmeli ve
khi-kare değeri birleştirilmiş değerler üzerinden hesaplanmalıdır. Bu bakımdan
ilk iki sınıftaki gözlenen frekanslar 6, son üç sınıftakiler ise 8 olarak
birleştirilmiştir. Böylelikle sınıf sayısı 9’dan 6’ya inmiştir.
Khi-kare değerinin hesaplanması için, her sınıfta gözlenen değerin, o
sınıftaki beklenen değerden farkı hesaplanmış (f-f′), sonra bunların kareleri
alınmış ve sınıfın beklenen değerine bölünerek hepsi toplanmıştır. Böylelikle
son sütunun altında görüldüğü üzere, χ2=0.392 hesaplanmıştır.
Hesaplanan khi-kare değeri, tablo değerleri ile karşılaştırılarak
nümunenin bir normal populasyona ait olma ihtimali tesbit edilir. Ancak bunun
için, khi-kare değerinin serbestlik derecesinin bilinmesi gerekir. Khi-kare
değerinin serbestlik derecesi, sınıfların (grupların sayısına bağlıdır. Burada
sınıf sayısı=k=6, Madde 7.2’de açıklandığı üzere a=2 olduğundan, serbestlik
derecesi V=6-2-1=3 bulunur. Nümune esasında 9 sınıftır. Ancak bunlardan,
teorik frekansları 5'ten küçük gerekçesiyle baştan ikisi bir grup ve sondan 3'ü
bir·grup olarak birleştirildiğinden, sınıf sayısı 6’ya inmiştir. Khi-kare tablosuna
(Ek Tablo 3) göre 3 SD’li tesadüf nümunelerinin %5’i 7.815 ve daha büyük
khi-kare değeri göstermektedir. Hesaplanan değer (0.392) bundan küçük
olduğuna göre, nümune ortalaması 7.512 m, standart sapması 0.936 m olan bir
normal populasyona dahildir. O halde hipotez kabul edilerek “Nümune normal
dağılıma uygundur” denir.
7.815 ve daha büyük khi-kare değerlerine sahip nümuneler ise bu
populasyona ait olamazlar. Hesaplanan değer 7.815 veya daha büyük olsaydı,
hipotez reddedilerek nümunenin normal dağılıma uygun olmadığı sonucuna
varılacaktı.
7.2.2.Binomiyal Dağılıma Uygunluğun Kontrolu
Bir örneğin gerek binomiyal, gerekse Poisson dağılımına uygunluğunun
kontrolu da normal dağılıma uygunluk kontroluna benzer şekilde yapılır. Sıfır
hipotezi yine, “örneğin belirtilen populasyona ait olduğu” şeklindedir.
Misal 7.2: Đmalatının %10’u hatalı olabileceği beyan edilen fabrikanın
mamullerinden piyasadan değişik yerlerden rastgele 1000 adet 8'erli gruplar
halinde mal alınıyor. Malların sağlam veya bozuk oldukları kontrol edilerek
sonuç Tablo 7.2'nin üçüncü sütunundaki gibi bulunuyor. Mesela 8'erlik
örneklerden 6’sının kusurlu olduğu 1 örnek, 5’inin kusurlu olduğu 2 örnek,
4'ünün kusurlu olduğu 8 örnek vs bulunuyor. P=0.05 olasılıkla fabrikanın
beyanı doğru mudur?
71
Tablo 7.2: (0.1+0.9)8 binomuna ait olduğu varsayılan bir toplumdan
çekilen 1000 örnekte sağlam-kusurlu mal sayıları
Hatalı mal
(Sınıflar)
8’i de
7’si
6’sı
5’i
4’ü
3’ü
2’si
1’i
Hiçbiri
Toplam
Olasılık
0.00000001
0.00000072
0.00002268
0.00040824
0.00459270
0.03306744
0.14880348
0.38263752
0.43046721
1
Beklenen
Gözlenen
(f)
(f′)
0,00001
0
0,00072
1
0,02268 5.4316
1 12
2
0,40824
8
5
39
33
139
149
400
383
410
430
1000
1000
Farklar
(f-f′)
(f-f′)2
Khi-kare
değeri
6,56835
43.14322
7.94300
5,93256
-9,80350
17,36250
-20,46720
35.19530
96.10861
301.45600
418.90630
1.06435
0.64588
0.78784
0.97314
11.41421
Sıfır hipotezi iddianın “doğru olduğu”, yani “bu mamullerin ilgili
fabrikanın beyan ettiği oranda kusurlu olduğu” şeklindedir.
Bu populasyonda kusurlu-kusursuz mal oranlarının (0.1+0.9)8 binomuna
göre dağılmaları beklenir. Tablonun ikinci sütununda, Madde 4.3.4’te
açıklandığı şekilde, sınıflarda beklenen olasılıklar verilmiştir. Sayım 1000
örnekte yapıldığına göre, teorik olasılıklar 1000 ile çarpılarak beklenen
değerler bulunabilir. Mesela 8’er maldan 2'sinin kusurlu çıkma olasılığı 0.1488
olduğuna göre, 1000 örnekte 0.1488×1000=149 tanesinin böyle olması
beklenir. Diğer sınıflara ait beklenen değerler de bu şekilde bulunarak Tablo
2’nin 4’üncü sütununa yazılmıştır. Ancak burada da 5’ten az beklenen değer
bulunduran sınıfların birleştirilmesi gerekir. Görüldüğü üzere 5’i kusurlu, 6’sı
kusurlu, 7’si kusurlu ve 8’i de kusurlu olması beklenen sınıflarda frekanslar
5’ten azdır. Bu bakımdan bu sınıfların birleştirilmeleri gerekir. Böylelikle bu 4
sınıf, 4’ü kusurlu sınıfıyla birleştirilerek 5.4316 olarak yeni bir beklenen değer
bulunmuştur. Buna paralel olarak, aynı sınıfların gözlenen frekansları da
birleştirilerek 12 elde edilmiştir. Bu durumda dağılım 5 sınıfa inmiştir.
Böylece, 7.1 nolu formüle göre, χ2=11.41421 bulunmuştur.
Teorik dağılımın hesabında herhangi bir parametre kullanılmadığından
a=0'dır ve (7.2) nolu formüle göre khi-karenin serbestlik derecesi V=k-l=5-1=4
olur. Ek Tablo 3’te 4 SD için 0.05 olasılıklı khi-kare=9.488 okunur Demek ki 4
SD'li örneklerin %5’i 9.488 ve daha büyük χ2 değeri göstermektedir.
Hesaplanan χ2 bundan büyük olduğuna göre, örneğin hipotezde belirtilen
populasyona dahil olma olasılığı %5’ten küçüktür (Ek Tablo 3’e göre %5 ile
%1 arasındadır.). O halde hipotez reddedilir. Bu mamuller fabrikanın imalatı
olan populasyona ait olamaz. Fabrika beyan ettiği oranı tutturamamaktadır.
7.3.Bağımsızlık Kontrolu (R×C Tabloları)
Khi-kare testi, iki veya daha fazla sınıflı kalitatif karakter arasında bir
72
ilgi bulunup bulunmadığının kontrolunda da kullanılmaktadır. Bunlardan
bağımsızlık kontrolu, sayım yoluyla elde edilmiş verilerden meydana gelen ve
çeşitli özellikler yönünden sınıflanabilen bir örnekte, sınıflar (gruplar) arsında
bir bağıntı veya ortaya çıkış eğiliminin var olup olmadığını tesbit amacıyla
yapılır. Mesela belli gelir düzeylerine göre sigara içenlerle içmeyenler arasında
bir bağıntı olup olmadığının, köyde ve şehirde oturma ile evlilik-bekarlık
oranları arasında bir ilgi olup olmadığının kontrolu gibi. Bu amaçla, mesela
gelir düzeylerinin satırları, sigara içme –içmeme halinin ise sütunları
oluşturduğu bir tablo düzenlenir (R×
×C tablosu). Belirlenen gelir gruplarına
mensup insanlardan sigara içenler ve içmeyenler bir örneklemeyle sayılır ve
tabloda kendi hanelerine yazılır. Bu şekilde R satırlı ve C sütunlu bir tablo
meydana gelir. Bu tablalara kontenjans tabloları da denir. Böylelikle R sayıda
hal ile C sayıda olgu arasında bir bağıntı olup olmadığı denetlenebilir.
Burada sıfır hipotezi “Đki konu (gelir düzeyi ve sigara içme gibi)
arasında bir bağıntının olmadığı” veya “iki halin birbirinden bağımsız olduğu”
şeklindedir.
Bu tablolardan hesaplanan khi-kare’nin serbestlik derecesi (R-1)×(C-1)
olarak belirlenir.
Misal 7.3: Köyde ve şehirde oturma ile gazete okuma arasında bir ilişki
olup olmadığını tesbit amacıyla bir anket yapılmış ve Tablo 7.3'deki sonuç elde
edilmiştir.
Tablo 7.3: Şehirde ve köyde gazete okuma durumu
Yöre
Şehir
Köy
Toplam
Gözlenen
407
266
673
Okuyan
Beklenen
471
202
Fark
-64
64
Gözlenen
726
220
946
Okumayan
Beklenen
662
284
Fark
64
-64
Gözlenen
Toplamı
1133
486
1619
Burada iki tür yerleşim birimi ile gazete okuma-okumama hali arasında
ilişki aranmaktadır. Tablo, 2 satır ve 2 sütundan oluşur. O halde bu bir 2×2
tablosudur. P= 0.05 olasılıkla iki durum arasında bağıntı var mıdır? Hipotez,
“Şehirde veya köyde oturmayla gazete okuma arasında bir ilişki olmadığı”
şeklindedir.
Varsayım bu olduğuna göre,
gazete okuma oranı=673/1619=0.4157 olacak,
şehirde oturan 1133 kişiden 1133×0.4157=471'inin,
köyde oturan 486 kişiden 486×0.4157=202'sinin gazete okuduğu
beklenecektir. Aynı şekilde,
gazete okumama oranı=946/1619=0.5843,
şehirli 1133 kişiden 1133×0.5843=662,
73
köylü 486 kişiden 486×0.5843=284 kişinin gazete okumadığı
beklenecektir. Buna göre hesaplanan gözlenen değer-beklenen değer farkları,
tablonun "fark" sütunlarında görülmektedir. Bu farklar üzerinden:
χ2 =
− 64 2 64 2 64 2 − 64 2
+
+
= 49.58
+
471
662 202
284
bulunur. Khi-kare'nin serbestlik derecesi=(2-1)×(2-1)=1'dir. Ek Tablo 3'e göre
1 SD'li, 0.05 olasılıklı khi-kare değeri 3.841'dir. Hesaplanan değer bundan çok
büyük olduğuna göre, hipotez reddedilerek, “gazete okuma şehirde veya köyde
oturmayla ilgilidir.” denir.
Misal 7.4: 4 ayrı böcek öldürücü bir yaprak biti üzerinde denenmiş ve
ölenler-kalanlar sayılmıştır. Acaba insektisidler arasında etki yönünden fark var
mıdır? Sıfır hipotezi “fark olmadığı” şeklindedir. Sayım sonuçları Tablo 7.4'ün
"gözlenen" sütunlarındadır.
Tablo 7.4: 4 böcek ilacının etkisi
Đşlem
A
B
C
D
Toplam
Gözlenen
88
68
73
101
330
Ölen
Beklenen
79,2
67,7
80,0
103,1
330
Fark Gözlenen
8,8
15
0,3
20
-7,0
31
-2,1
33
99
Kalan
Beklenen
23.8
20.3
24.0
30.9
99.0
Gözlenen
Fark Toplamı
-8,8
103
-0,3
88
7,0
104
2,1
134
429
4 ilaç, 2 etki durumu olduğuna göre bu bir 4×2 tablosudur. Deneme
sonucu ölenler 330, kalanlar 99 tanedir. Hipoteze göre madem ki ölmek veya
kalmak ilaçlara bağlı değildir, o halde ölen 330 böcekten;
Ölenlerin oranı=330/429,
A ilacı uygulananlardan ölmesi beklenen=103×330/429=79.2,
B ilacı uygulananlardan ölmesi beklenen=88×330/429=67.7,
C ilacı uygulananlardan ölmesi beklenen=104×330/429=80,
D ilacı uygulananlardan ölmesi beklenen=134×330/429=103.1’dir.
Kalanların oranı ise=99/429,
A ilacı uygulananlardan kalması beklenen=103×99/429=23.8,
B ilacı uygulananlardan kalması beklenen=88×99/429=20.3,
C ilacı uygulananlardan kalması beklenen=104×99/429=24,
D ilacı uygulananlardan kalması beklenen=134×99/429=30.9’dur.
Bu şekilde beklenen değerler ve gözlenen değerlerle, beklenen değerler
arasındaki farklar bulunduktan sonra khi-kare değeri hesaplanır:
74
χ2 =
8.8 2 − 8.8 2 0.3 2 − 0.3 2 − 7 2 7 2 − 2.12 2.12
+
+
+
+
+
+
+
=7.077
79.2 23.8 67.7 20.3
80 24 103.1 30.9
Khi-kare'nin serbestlik derecesi (4-1) × (2-1)=3'tür. Ek Tablo 3'den 3
SD'li tesadüf nümunelerinin %5'inde 7.81 ve daha büyük khi-kare değerine
rastlanacağı anlaşılmaktadır. Hesaplanan değer bundan küçük olduğuna göre,
denemedeki kadar khi-kare değerine rastlama olasılığı %5'ten fazladır. O halde
hipotez kabul edilir ve “Đlaçlarla böcek ölümleri arasında bir ilişki yoktur.”
veya “Đlaçların öldürme etkileri farksızdır” denir.
Hesaplanan χ2 değeri 7.81'den büyük olsaydı, böyle bir değerin ortaya
çıkma (rastlanma) olasılığı %5'ten küçük olacağından hipotez reddedilecek ve
“Đlaçların öldürme etkileri farklıdır." denilecekti.
7.4.Homojenlik Kontrolu
Aynı konu üzerinde değişik materyal, zaman veya yerlerde yapılan
denemelerin farklı sayılıp sayılamayacağını kontrol amacıyla yapılır. Bu
denemelerin her biri bir grup sayılarak, uygulanan işlemin her grupta aynı
sonucu verip vermediği denetlenir. Mesela değişik dikim şekilleriyle dikilip,
tutan ve tutmayan fidanlar sayılarak dikim şekillerinin farklı olup olmadığı
ortaya çıkarılabilir. Veya değişik ağaç türlerinden çelikler alınarak, bunların
köklenme yeteneklerinin farklı olup olmadığı bulunabilir. Metot bağımsızlık
kontroluna benzer. Genel tutma-tutmama oranı gruplara teşmil edilerek her
grubun beklenen değeri bulunur. Bunlar üzerinden khi-kare hesaplanarak,
serbestlik derecesine göre Ek Tablo 3 değeriyle karşılaştırılır.
75
8.ĐKĐ ĐŞLEMĐN MUKAYESESĐ
(t KONTROLU ĐLE
ĐKĐ ÖRNEK ORTALAMASININ KARŞILAŞTIRILMASI)
8.1.Giriş
Bilimsel araştırmalar, en basit halleriyle en az iki işlem veya konu
arasındaki farklılığı ortaya çıkarmak için düzenlenir. Bu tür çalışmalar iki
şekilde yürütülebilir.
Birinci halde, aynı veya birbirinin aynı sayılabilecek bireylerin yarısına
birinci işlem, diğer yarısına ikinci işlem uygulanarak, işlemler arası fark eşit
sayılabilen deneye materyali üzerinde ortaya çıkarılmaya çalışılır. Bunlara
eşleştirilen örnekler, bu şekildeki deneme metoduna da eş yapma deneme
düzeni denir (madde 8.3). Mesela iki ayrı işlemin yan yana benzer deneme
parsellerinde denenmesi gibi. Bu metodun bir de kendi içinde eşleştirme
denilen özel hali vardır. Bu hale göre işlemlerden biri aynı deneme
materyalinin yarısına, diğeri öbür yarısına uygulanır. Mesela iki insektisitten
birinin bir bitkinin yaprağının yarısında, diğerinin öbür yarısında denenmesi
gibi.
Đkinci tip denemelerde ise eşleştirme söz konusu değildir. Bu defa aynı
olduğu varsayılan iki populasyondan tesadüf birer nümunesi çekilerek bunlar
arasında fark olup olmadığına bakılır. Bu nümunelere bağımsız örnekler
denir. Mesela aynı bölgede dikilen A kavak klonu ile B kavak klonunun veya
kavak yetiştiriciliğinde A tipi sulama ile B tipi sulamanın karşılaştırılması gibi.
Bağımsız örneklerde karşılaştırma için, farklı işlemleri temsil eden örneklerin
eşit sayıda olmasına gerek yoktur. Araştırmacılıkta bağımsız örnekler üzerinde
yapılan karşılaştırmalar yaygın şekilde kullanılmaktadır.
Denemeler sonucu eşler arasında bulunacak farkların, gerçekten
işlemlerin etkisinden mi, yoksa doğal ve bilinmeyen sonsuz sayıda tesadüfi
sebeplerden mi ortaya çıktığı açığa çıkarılmaya çalışılır. Tabii bunun için
denemenin birden fazla ve n sayıda eş üzerinde yapılması gerekir. Varyans
analizleri ile ilgili gelecek bölümlerde sıkça geçeceği üzere, denemelerde 1’den
fazla sayıda deneme materyali tekrarlamaları (yineleme, tekerrür) oluşturur.
Đki örnek ortalamasının karşılaştırılması, t-kontrolu (t-testi) denilen
metoda göre aşağıdaki formüle göre yapılmaktadır:
t=
X1 − X 2 d
=
sd
sd
76
(8.1)
Formülde d iki ortalamanın farkı, sd ise ortalamalar arası farkın (d’nin)
standart hatasıdır. sd ’nin hesaplanması:
• Örneklerin alındığı populasyonun müşterek sayılabilecek bir varyansa
sahip olup olmamasına (her iki örneğe ait varyansın eşit sayılıp
sayılmamasına),
• Örneklerde aynı sayıda varyant bulunup bulunmamasına,
• Varyantların aynı deneme ünitelerinin eşleri olup olmamasına
(denemenin bağımsız örnekler veya eşleştirilmiş örnekler üzerinde
yapılmasına) bağlı olarak değişiklik gösterir.
8.2.Bağımsız (Eşleştirilmemiş) Đki Örneğin Karşılaştırılması
Eşleştirilmemiş iki örnek, bir populasyondan rastgele çekilen bağımsız
iki örneği ifade eder. Mesela aynı fidanlıkta aynı şartlarda yetiştirilen iki
değişik kavak klonu fidanlarından, rastgele örnekleme ile çapları (veya boyları)
ölçülen fidanlar gibi.
Đkili mukayeseler, hipotezle “aynı normal populasyona ait olduğu” iddia
edilen, yani “farksız oldukları” öngörülen tesadüf nümunelerine uygulanır.
Bunların aynı populasyondan çekildiğini varsaymak, ortalamalarının yanında
varyanslarının da eşit olduğunu kabul etmek demektir. Bazı hallerde durum
gerçekten böyledir. Ancak denemelerde uygulanan işlemler varyansları
etkileyebilir. Bu sebepten, t kontrolu sırasında varyansların eşitliği denetlenir
ve varyansların eşit olmasına veya olmamasına göre farklı hesap teknikleri
uygulanır. Ancak bu sayede sağlıklı bir sonuca varılabilir.
8.2.1.Varyansları Eşit Sayılan Đki Bağımsız Örneğin
Karşılaştırılması
t kontrolunda sd ’nin hesabı, yukarıda açıklanan olguların yanında,
örneklerdeki varyant (gözlem) adetlerinin eşit veya farklı sayılarda olmasına
göre de değişmektedir.
8.2.1.1.Varyansları Eşit, Farklı Büyüklükte Đki Bağımsız
Örneğin Karşılaştırılması
Varyansları eşit, farklı sayıda varyant ihtiva eden iki bağımsız örneğin
mukayesesine misal olarak, farklı iki işleme tabi tutulmuş iki grubun veya
farklı oldukları araştırmacı tarafından bilinip de, aralarındaki farkların önemi
kontrol edilen iki grubun (mesela farklı iki klonun) karşılaştırılması
gösterilebilir.
77
Misal 8.1: Aynı yerde dikilmiş, aynı klona mensup iki ağaçlamadan
birine A gübresi, diğerine B gübresi verilmiş ve bunlar aynı yetiştirme
teknikleri ile yetiştirilmiştir. Bu iki plantasyondan, rastgele örnekleme ile tesbit
edilen fertlere ait çaplar Tablo 8.1'de verilmiştir.
Tablo 8.1: Đki değişik gübre verilmiş kavak klonunun
idare müddeti sonundaki çapları (cm)
A Gübresi
(A nümunesi)
23
24
24
25
25
B Gübresi
(B nümunesi)
17.0
18.5
19.0
20.0
16.0
16.5
15.0
ΣXB=122.0
ΣXA=121
Burada “A ve B gübreleri, boylanmaya gerçekten farklı etki yapmakta
mıdır; yoksa aralarında bulunabilecek fark tesadüfi sebeplerden mi meydana
gelmiştir?” Tablo 8.1'deki değerler incelendiğinde her grubun kendi içinde
farklı olduğu görülür. Halbuki mesela B gübresinin verildiği aynı klona
mensup 7 ağaç, aynı yere dikilmiş, aynı gübreyi almış ve aynı bakım
teknikleriyle yetiştirilmiştir. Đstatistikte bu tür farklılıklara deneysel hata denir.
Daha önce de değinildiği gibi bu farklar, bilinmeyen sonsuz sayıda etki
sebebiyle ortaya çıkar.
Gruplar içindeki bu farklılaşma gibi, gruplar arasında da bir farklılaşma
olduğu açıktır. Gübrelerin etkileri gerçekten önemli olduğu takdirde, gruplar
arası fark, gruplar içindeki farkı (deneysel hatayı) aşacaktır. Burada yapılan
kontrol, durumun böyle olup olmadığını anlamaktır.
Bu maksatla kurulan hipotez, “A ve B gübrelerinin kavakta çap
gelişmesine etkisiz olduğu” şeklindedir. Yani “A ve B gübrelerini alan ağaçlar
aynı populasyona aittirler.”
Bu tip nümunelerin karşılaştırılmasında sd 'nin hesabı,
sd =
s 2 × (n1 + n2 )
n1 × n2
(8.2)
formülüne göre yapılır. Formüldeki n ve n , A ve B nümunelerinin varyant
adetleridir. Ancak s2 bildiğimiz varyans değildir. Buradaki s2 (örneklerin
varyansları eşit sayıldığından) her iki örneğin varyansı üzerinden hesaplanan ve
1
78
2
müşterek varyans olarak adlandırılan bir varyanstır. Populasyonun
varyansının bir tahmini olan ve birleştirilmiş (toplanmış) varyans da denen
bu istatistiğin hesabı:
s=
2
Σx12 + Σx22
(n1 − 1) + (n2 − 1)
(8.3)
formülüne göre yapılır. Görüldüğü üzere s2, örneklerin kareler toplamını
toplayıp, bunu her ikisinin serbestlik derecelerinin toplamına bölmekle
hesaplanmaktadır.
Formülleri Tablo 8.1'deki misale uygulayalım:
(3.6) nolu formülün payına göre kareler toplamları,
(ΣX A ) 2
=2931-(1212/5)=2.8
A nümunesinde: Σ x = Σ X −
n
2
1
2
A
B nümunesinde: Σ x22 = Σ X B2 −
Müşterek varyans: s2=
(ΣX B ) 2
=2145.5-(1222/7)=19.2143
n
(2.8 + 19.2143)
=2.2014
(5 − 1) + (7 − 1)
bulunur. A nümunesinin ortalaması: X A =121/5 = 24.2 cm,
B nümunesinin ortalaması: X B =122/7 =17.43 cm'dir.
(8.1) nolu formüle göre, ortalamalar arası farkın, mensup olduğu
dağılışın standart ayrılış ölçüsü üzerinden değeri:
t=
d
= (24.2-17.43)/0.8688=7.792
sd
bulunur. t'nin serbestlik derecesi ise (n1-1)+(n2-1)'dir. Misalde bu (5-1)+(71)=10 dur. t tablosuna (Ek Tablo 2) bakılacak olursa, 10 SD'li nümunelerin
%5'inin 2.228 ve daha büyük t değerine sahip olduğu anlaşılır. 7.792>2.228
olduğundan, misaldeki gibi bir değere sahip nümunelerin bulunma oranı %5'ten
azdır. O halde hipotez reddedilerek, “A ve B gübreleri çap artımına farklı etki
yapmıştır” denir. Yani A ve B gübresini almış ağaçlar, farklı populasyonlara
ait birer tesadüf nümuneleridirler. 10 SD’li nümunelerden %1’i 3.169 ve daha
büyük, %0.1’i ise 4.587 ve daha büyük birer t değerine sahiptir. Hesaplanan t
79
bunların hepsinden büyük olduğuna göre, A ve B gübrelerinin %99.9 güvenle
farklı olduğu kabul edilir.
8.2.1.2.Varvansları Eşit, Aynı Büyüklükte iki Tesadüf
Nümunesinin Karşılaştırılması
Đki nümunenin varyant sayıları eşitse, yani n =n =n ise (8.2) nolu formüle
1
2
göre,
2s 2
n
(8.4)
Σx12 + Σx22
2(n − 1)
(8.5)
sd =
olur. Müşterek varyans ise:
s 2=
olarak hesaplanır.
Misal 8.2: Misal 8.1’e göre, A gübresi verilen ağaçlardan 21 ve 22 cm
çaplarında iki ağaç daha ölçülmüş olsun. Bu defa her nümunede 7’şer varyant
bulunur
A nümunesinde KT=3856-1642/7 = 13.7143, ortalama X A =164/7=23.43,
B nümunesinde KT = 19.2143 ve ortalama X B =17.43 cm’dir.
S 2=
13.7143 + 19.2143
= 2.7441
2 × (7 − 1)
sd =
t=
2 × 2.7441
= 0.8855
7
23.43 − 17.43
= 6.776
0.8855
bulunur. t'nin SD ise (7-1)+(7-1)=12'dir. 12 SD'li t değerlerine tabloda
bakılacak olursa, %95 güven düzeyinde olanların 2.179 ve daha büyük, %99
güven düzeyinde olanların 3.055 ve daha büyük, %99.9 güven düzeyinde
olanların ise 4.318 ve daha büyük değere sahip oldukları anlaşılır. Hesaplanan
değer (6.776) bunların hepsinden de büyük olduğuna göre, yine hipotez
80
reddedilecek ve “A gübresinin %99.9 güven düzeyinde etkili olduğu”
söylenecektir.
8.2.2.Varyansları Eşit Olmayan Đki Bağımsız Örneğin
Karşılaştırılması
Deney ünitelerine uygulanan işlemler, bazı hallerde grupların
varyanslarına etkili olabilir. Böyle bir durum bekleniyorsa veya gerçekten
varsa, iki ortalamanın mukayesesi için farklı hesap tekniklerinin kullanılması
gerekir. Çünkü bu defa yukarıda anlatılan müşterek varvans hesaplanamaz. Bu
bakımdan sd 'nin hesabına geçilmeden önce varyansların eşit sayılıp
sayılamayacağı (varyansların homojenliği) kontrol edilmeli ve çıkacak sonuca
göre işlem yapılmalıdır.
Varyansların eşit olmaması halinde de, varyant sayılarının farklı veya
aynı olmasına göre sd 'nin hesabında farklı yollar izlenir.
8.2.2.1. F-testi Đle Varyansların Eşitliğinin (Homojenliğinin)
Kontrolu
Varyansların homojenliğinin kontrolu için F testi, t ve z testleri ile
Bartlett testi kullanılabilir. Örnek büyüklüğünün n>100 olması halinde t veya
z testleri uygulanabilir (Kalıpsız, 1981). Burada F testi üzerinde durulacaktır.
Đkiden fazla sayıdaki gruplarda da varyansların homojenliğinin kontroluna
imkan veren Bartlett testi, ileride 10. Bölümde (Madde 10.6) açıklanacaktır.
Varyansların homojenliğini kontrol amacıyla, nümunelere ait
varyanslardan büyüğü küçüğüne oranlanarak, F istatistiği (F oranı) denen bir
değer bulunur:
F=
Büyük varyans
Küçük varyans
(8.6)
Bu değer Ek Tablo 4'te verilen F değerleriyle karşılaştırılarak
varyansların homojen sayılıp sayılamayacağına karar verilir.
F tabloları, bölünen varyansın serbestlik derecesi sütunları, bölen
varyans serbestlik derecesi ise satırları meydana getirecek şekilde iki yönlü
düzenlenmiş tablolardır. Bu bakımdan dikkatli olunmalı, bölünen varyans için
tablonun üstündeki serbestlik dereceleri, bölen varyans için yandaki serbestlik
dereceleri esas alınmalıdır. Aksi halde yanlış F değerine bakılmış olur. Ancak
varyansların eşitliğinin kontrolunda daima büyük varyans küçük varyansa
bölündüğünden ve tek taraflı bir kontrol söz konusu olduğundan, 0.05'lik bir
kontrol için bunun yarısı olan 0.025'i, 0.01'lik bir kontrol için 0.005'i, 0.001'lik
81
kontrol için 0.0005'i esas almak gerekir. Her F tablosunda bu değerler
verilmediğinden, kaba bir karşılaştırma için her iki varyansın SD'lerine en
yakın F değerine bakılmalı veya logaritmik enterpolasyon yapılmalı (Kalıpsız,
s.280) ve yahut mevcut bazı fomüllere göre eldeki F değerinin gerçekleşme
ihtimali doğrudan hesaplanmalıdır (Bölüm 15).
F değerinin hesaplanması ve tablo değeri ile karşılaştırılması, aşağıda
misal üzerinden açıklanmıştır.
Misal 8.3: Tablo 8.1'deki misalde B gübresi verilen ağaçlardan birinin
16 yerine 23 cm ölçüldüğünü kabul edelim. A nümunesinin kareler toplamı
bilindiğine göre varyansı:
Σx 2
s =
=2.8/(5-1)=0.7
n −1
2
A
B nümunesinin kareler toplamı:
ΣxB2 = ΣX B2 −
(ΣX B )
=2418.5-(1292/7)=41.2143
n
B nümunesinin varyansı:
sB2 =41.2143/(7-1)=6.8691,
buradan (8.6) nolu formüle göre:
F=
6.8691
= 9.813
0 .7
bulunur. Büyük varyanslı B nümunesinin serbestlik derecesi 7-1=6, diğerininki
ise 5-1=4 olduğundan, F değerinin önemliliğinin kontrolu için Ek Tablo 4'te,
6'ya 4 SD'li F değerine bakmak gerekir. Bölünenin SD 6, bölenin SD 4
olduğuna göre, tabloya bakılacak olursa, 0.025 olasılıklı F değerinin 9.20
olduğu görülür. Hesaplanan F bundan büyük olduğuna, yani 9.813>9.20
olduğuna göre, “Đki varyansın farklı olduğuna (homojen olmadıklarına)” karar
verilir. Bu durumda müşterek varyans hesaplanamaz.
8.2.2.2.Varyansları Farklı, Farklı Sayıda Đki Bağımsız Örneğin
Karşılaştırılması
Varyansları farklı iki örneğin karşılaştırılması için gerekli standart hata
( sd ), aşağıdaki formüle göre hesaplanır:
82
sd =
s12 s 22
+
n1 n 2
(8.7)
Ancak buradan hesaplanacak t değeri, Ek Tablo 2'deki değerlerle değil
de, aşağıdaki formüle göre hesaplanan bir t' değeri ile karşılaştırılarak hükme
varılır. t' olarak gösterilen bu değer, A nümunesi serbestlik derecesindeki t
değeri ile, B nümunesi serbestlik derecesindeki t değerinin bir nevi ağırlıklı
ortalamasıdır:
t1 × s12 t2 × s22
+
n1
n2
t'=
2
2
s1 s2
+
n1 n2
(8.8)
Formülde:
s12 ve s22 , A ve B örneklerinin varyansları,
n ve n , A ve B örneklerinin varyant adetleri,
t , (n -1) SD için istenen güven düzeyinde t tablo değeri,
t , (n -1) SD için istenen güven düzeyinde t tablo değeridir.
%95 güven düzeyi için, konuyu Misal 8.3 üzerinden açıklayalım:
s A2 = 0.7, sB2 = 6.8691 olduğuna göre,
l
2
l
A
2
B
sd =
0.7 6.8691
+
=1.0589
5
7
Ortalamalar X A = 24.2 ve X B = 129/7 =18.43 olduğundan,
t = (24.2-18.43)/1.0589 = 5.449
bulunur. A nümunesinde 5 varyant olduğuna göre, nA-1=5-1=4 SD için %5
olasılıklı t tablo değeri 2.776, B nümunesinde 7 varyant olduğuna göre nB-1=71=6 SD için aynı olasılık düzeyinde t tablo değeri 2.447'dir. O halde yukarıda
hesaplanan t değerinin karşılaştırılacağı t' değeri (8.8) nolu formüle göre:
t'=
(2.776 × 0.7) / 5 + (2.447 × 6.8691) / 7
= 2.488
(0.7 / 5) + (6.8691 / 7)
bulunur. 5.449>2.488 olduğundan, iki ortalamanın %95 güvenle farklı
83
olduğuna hükmedilir.
Aynı kontrol %99 güven düzeyine göre yapılacak olursa, ilgili SD'leri
için bu defa t1=4.604 ve t2=3.707 olduğundan,
t'=
(4.604 × 0.7) / 5 + (3.707 × 6.8691) / 7
= 3.833
(0.7 / 5) + (6.8691 / 7)
hesaplanır. 5.449>3.833 olduğuna göre, karşılaştırılan ortalamaların %99 güven
düzeyinde de farklı oldukları söylenecektir.
8.2.2.3.Varyansların Farklı, Aynı Sayıda Đki Bağımsız Örneğin
Karşılaştırılması
Ele alınan örnekler eşit sayıda gözlemi kapsıyorsa, (8.7) nolu formül
üzerinden hesaplanan t değeri, nA-1 SD’ne göre bakılacak t tablo değeri ile
karşılaştırılır.
Misal 8.4: 7 varyantlı A örneğinde ortalama X A = 24.42, varyans
2
s1 =0.7023 ve 7 varyantlı B örneğinde ortalama X B =18.43, varyans
s22=6.8691 hesaplanmış olsun. Bunların varyanslarının homojenlikleri kontrol
edilecek olursa,
F = 6.8691/0.7023 = 9.78
hesaplanacak ve bu değer 6’ya 6 SD’li 0.025 olasılıklı F değeri 5.82’den büyük
olduğundan, homojen olmadıklarına karar verilecektir. (8.7) nolu formüle göre,
sd =
0.7023 6.8691
+
=1.04 ve t = (24.42-18.43)/1.04 = 5.76’dır.
7
7
Bu değer 7-1=6 SD’li ve 0.01 olasılıklı t tablo değeri 3.707’den büyük
olduğuna göre, A örneğinin B’den %99 güvenle farklı olduğuna karar verilir.
8.3.Eşleştirilmiş Đki Örneğin Karşılaştırılması (Eş Yapma
Deneme Tertibi)
Daha önce kısaca değinildiği gibi, bazı hallerde karşılaştırılacak örnekler
birbirinin eşi deney materyali üzerinden elde edilebilir. Bu gibi durumlarda
birbirinin tam eşi sayılabilecek iki deney ünitesinden birine bir işlem, diğerine
başka bir işlem uygulanarak, bu iki işlem iki örnek üzerinde karşılaştırılır.
Mesela yan yana parsellerde yetiştirilen iki fidan cinsini karşılaştırma, ikiye
bölünmüş şeker pancarlarından bir parçasına belli bir metot diğerine başka bir
metot uygulanarak metotların şeker kazanma yönünden farklarını arama,
84
yaprakları ikiye bölerek bunlar üzerinde iki farklı böcek ilacını karşılaştırma
gibi. Böyle hallerde birer eşleştirilmiş örneklerin mukayesesi söz konusu
olmaktadır. Bu metoda göre veriler, daha önceki metotlardaki gibi rastgele yan
yana gelmiş materyalden değil, aynı deney materyalinin birer parçasından elde
edilmişlerdir. Bu metoda göre deneme materyallerinin kendi aralarında aynı
vasıfta olmaları gerekmemektedir.
Bu metotta karşılaştırma örneklere ait değerler üzerinden değil, D ile
gösterilen ve her çiftten elde edilen varyantlar arası farklar üzerinden yapılır. t
istatistiği için gereken sd bu değerlerin ortalamasının standart hatası olarak
aşağıdaki formüle göre hesaplanır:
( ΣD ) 2
ΣD −
2
n = sD
sd =
n × (n − 1)
n
2
(8.9)
Böyle bir örnekte D değerleri, bazıları sıfırdan küçük, bazıları sıfırdan
büyük olmak üzere çeşitli değerler alırlar ve ortalaması sıfır, standart sapması
sd olan bir populasyon oluştururlar. Bu bakımdan yapılan kontrol, fark
değerlerinin gerçekten 0 ortalamalı bir populasyona ait olup olmadıkları
ihtimalini ortaya çıkarmaktır. Eğer hesaplanan ihtimal %5’ten küçükse,
bunların “ortalaması sıfır olan bir populasyona ait olduğu” hipotezi
reddedilerek, deneme materyaline uygulanan işlemlerin farklı olduğuna
hükmedilir. Bu bakımdan test için gerekli t değeri, farkların ortalamasının
sıfırdan ayrılış miktarı üzerinden hesaplanır:
t=
( X D − 0)
sd
(8.10)
Burada t'nin serbestlik derecesi eş adedinin 1 eksiğidir. Konuyu bir misal
üzerinden açıklayalım:
Misal 8.5: 10 adet şeker pancarı ikiye bölünerek, şeker kazanç
miktarlarını karşılaştırmak üzere yarısına A metodu, diğer yarısına B metodu
uygulanmıştır. Elde edilen şeker miktarları Tablo 15.2'de verilmiştir
(Yurtsever, s.100).
85
Tablo 8.2: Eş yapma deneme tertibi
Pancar
no
1
2
3
4
5
6
7
8
9
10
sd =
A
metodu
53
55
58
60
59
60
58
57
59
52
B
metodu
52
54
53
57
56
57
57
56
58
52
Toplam
Fark
D
1
1
5
3
3
3
1
1
1
0
19
D2
1
1
25
9
9
9
1
1
1
0
57
57 − (192 / 10)
= 0.4819
10 × (10 − 1)
X D = 19/10 = 1.9t = 1.9/0.4819 = 3.943
Ek Tablo 2’de 9 serbestlik dereceli t tablo değerine bakılacak olursa,
t0.05=2.262, t0.01=3.25 olduğu görülür. Hesaplanan değer bunlardan büyük
olduğuna göre, denenen iki şeker elde etme metodu arasında %99 fark olduğu
söylenecektir.
8.4.Đki Ortalama Arasındaki Farkın Güven Sınırları
Madde 8.1’de, ortalamaların mukayesesi amacıyla hesaplanan sd 'nin
ortalamalar arası farkın (d) standart hatası olduğu belirtilmişti. O halde bu
değer, ortalamalar arası farkın istenen bir güven düzeyinde güven sınırlarını
hesaplamakta kullanılabilir:
d-(t× sd )<d<d+(t× sd )
Misal 8.6: Đşlemi 8.2.1.1 maddesindeki misale %95 güven düzeyi için
uygulayalım:
D=24.2-17.43=6.77, sd =0.8688 ve 10 SD için t =2.228 olduğundan,
6.77 - (0.8688×2.228) < d < 6.77 + (0.8688×2.228)
4.83 cm <d<8.71 cm hesaplanır. %99 güven düzeyine göre ise:
6.77 - (0.8688×3.169) < d < 6.77 + (0.8688×3.169)
4.01 cm<d<9.52 cm bulunur.
Buradaki güven sınırları, daha doğrusu alt sınırın sıfırdan küçük bir
değer alıp almayışı, ortalamalar arası farkın önemli olup olmadığı veya
ortalamaların ait olduğu populasyonların aynı sayılıp sayılamayacağının diğer
86
bir göstergesidir. Eğer alt sınır sıfırdan küçük bir değer alıyorsa, “iki
ortalamanın faksız (m1=m2)” olduğuna dair hipotez kabul edilecek; başka bir
ifadeyle işlemler arasındaki farkın önemli olmadığı veya uygulanan işlemlerin
farksız olduğu sonucuna varılacaktır. Misalde sınırlar arasında sıfırın
bulunmayışı “ortalamalar arası farkın sıfır sayılma ihtimalinin hem %95 hem
de %99'dan az olduğuna” yani 8.2.1.1 maddesinin sonucuna paralel olarak, “iki
ortalamanın (iki populasyonun) her iki güven düzeyinde farklı olduklarına”
işaret eder.
8.5.Örnek Büyüklüğünün Tayini
Đstatistikte, örnekleme ile çalışılan durumlarda sık karşılaşılan sorulardan
biri “Kaç örnek alayım?” şeklindedir. Bu amaçla (8.11) nolu formül
kullanılabilir. Formülün esası, istenen güven sınırlarına ilişkin, istenen değerler
arasında nümunede bulunması gerekli gözlem sayısını tayin etmektir. Bunun
için bir ön örnekleme yapılarak bu örneğin varyansı hesaplanmalıdır. Bundan
sonra örnek büyüklüğü (n), hesaplanır:
n=
t12 × s 2
d2
(8.11)
Formülde:
t1 = istenen güven düzeyi ve ön örneğin SD'ne göre tablo t değeri,
s2= ön örneğin varyansı,
d = ön örnek üzerinden hesaplanan güven aralığına göre istenen güven
aralığının yarısıdır.
Misal 8.7: 8.2.1.1 maddesindeki B nümunesi üzerinden konuyu
açıklayalım:
B gübresi uygulanan plantasyondan 7 ağaç ölçülmüş olsun. Bunu bir ön
örnek sayarak, alınan örneğin yeterli olup olmadığını veya bu toplumdan en az
kaç birey almamız gerektiğini hesaplayalım:
B'nin KT =19.2143 olduğuna göre varyansı,
s2=19.2143/(7-1)=3.2024 hesaplanır. Ortalaması X B =122/7 = 17.43 cm,
ortalamanın standart hatası ise:
sX =
3.2024
= 0.6764 cm’dir.
7
6 SD için %1 olasılıklı tablo t değeri 3.707 olduğuna göre, %99 güvenle
ortalamanın güven sınırları:
17.43-3.707×0.6764< X <17.43+3.707×0.6764
14.92 cm < X < 19.94 cm
87
hesaplanır. O halde güven aralığı 19.94-14.92 = 5.02 cm'dir. Bu aralığın
nümunede 3 cm’den fazla olmaması istenecek olursa, güven aralığının yarısı
d=1.5 cm olur. Bu durumda gerekli örnek büyüklüğü (8.11) nolu formüle göre:
n=
3.707 2 × 3.2024
= 19.6
1 .5 2
bulunur. Demek ki eldeki 7 varyanta 20-7=13 varyant daha ilave etmek yeterli
olacaktır.
Ancak bu bulgulara fazla itibar etmemeli, en azından normal dağılıma
uygunluk gösteren olabildiğince fazla varyant ile çalışılmalıdır.
88
9. DENEME KURMANIN GENEL ESASLARI
9.1.Giriş
Hatırlanacağı üzere denemeler, özel olarak oluşturulan ve kontrol altına
tutulan populasyonların temsilcileridir. Bu küçük ve özel örnekler üzerinden
hayali populasyon tahmin edilmeye çalışılır. Böylelikle üzerinde çalışılan
konudaki bilgi eksikliği giderilerek, mesela daha fazla ürün, daha etkili ilaç,
daha kaliteli mal vs elde edilir. Ancak denemeler, istatistik biliminin
öngördüğü belli prensiplere göre tesis edilir ve yürütülürse değerlendirilebilir.
Aksi halde gözlem niteliğinden öteye gidemez.
9.2.Denemenin Planlanması
Bir deneme ile ilgili olarak, konunun belirlenmesi (hipotez veya
hipotezlerin ortaya atılması), deneme deseninin (dolayısıyla değerlendirme
metodunun) seçimi, tekrarlama (yineleme) adedinin belirlenmesi, parsel
büyüklüğünün (dolayısıyla denemede kullanılacak deney·ünitesi adedinin)
tesbiti, denemenin yürütülmesi sırasındaki uygulamaların zamanı ve şeklinin
tayini ile ilgili çalışmalara denemenin planlanması denir. Planlama
yapılmadan, yanlış veya yetersiz deneme kurma, denemelerin istatistik
prensiplere göre değerlendirilmelerini imkansız kılabilmekte, bu da harcanan
tüm zaman, para ve emeğin heba olmasına yol açmaktadır. Denemenin
planlaması safhasında önce etraflı bir literatür incelemesi yapılmalı, sonra
deneme sahası seçilmeli ve incelenmeli, deneme materyali, eleman, alet ve
ekipmanlar belirlenmeli, denemenin devamlılığına ilişkin tedbirler gözden
geçirilmelidir. Denemenin planlanması, bütün bu işlerin tesbit edilip ayrıntılı
bir proje metni halinde yazılması ile tamamlanır. Uzun yıllar sürecek
denemelerde, çalışmanın çeşitli kişilerce yürütülmesi olasılığı bulunduğundan,
proje metni özellikle önemli olmaktadır.
9.3.Denemenin Tertiplenmesi
Denemeler, amaçlarına, deneme materyaline ve mevcut maddi imkanlara
göre belli deneme desenlerine göre tertip edilir. Bilimsel araştırmalarda
kullanılan istatistik metodlara göre, istatistikçiler tarafından bir çok deneme
deseni geliştirilmiştir. Her deneme desenine farklı istatistik analiz metodu
uygulandığından, denemenin kurulduğu deneme deseninin bilinmesi önemli
olmaktadır. Bazı önemli deneme desenleri ve bunlara ait analiz metodları
gelecek konularda açıklanacaktır.
89
Deneme sahibinin deney materyali hakkında çok iyi bilgi sahibi olması
gerekir. Ayrıca denemenin tertiplenmesi safhasında mutlaka istatistikçi ile
görüş alışverişinde bulunulmalıdır. Zaten istatistikçi, değerlendirme
aşamasında deneme deseni, denemenin aplikasyonu ve yürütülüşü hakkında
ayrıntılı bilgi isteyecektir. Eğer deneme, amacına uygun ve belli prensiplere
göre düzenlenmemiş ve yürütülmemişse istatistikçinin yapabileceği fazla bir
şey yoktur.
9.3.1.Deneysel Hata ve Đşlemlerin Farklılığı
Deneme kurmaktan maksat, üzerinde durulan faktör veya faktörlerin
etkilerini tesbit etmek ve bu etkilerin ortaya çıkış ihtimallerini hesaplamaktır.
Bu tesbit ve hesaplar belli şartlara göre yapılabilir. Mesela A ve B gibi iki
kavak klonundan birer fidanı yan yana dikip bir kaç yıl sonra bunların çaplarını
ölçüp, "Çapı kalın olan (veya boyu uzun olan) klon iyidir” demek hiç bir şey
ifade etmez. Çünkü A klonundan ikinci bir fidan dikilmiş olsa bunun çapı
diğeriyle aynı olmayacak, 3. bir ağaçta da farklı bir çap ölçülecektir. Aynı
durum B klonu fertleri arasında da söz konusudur. Đşte çapların gösterdiği bu
farklılık deneysel hatadan kaynaklanır. Burada üzerinde durulan faktör,
klonların genetik özelliklerinden kaynaklanan büyüme-gelişme istidatlarıdır.
Araştırma bu istidadın hangi klonda daha üstün olduğunu bulmaya çalışır.
Benzer şekilde, bir ağacın büyümesine gübre, sulama gibi faktörlerin etkileri de
denenebilir. Đşte denemelerde aynı işleme tâbi tutulmuş deney üniteleri arasında
görülen farklılığa (çap, boy, ayrılık vs yönünden) deneysel hata denir.
Deneysel hata, deney üniteleri arasında başlangıçta var olan farklılıktan,
denemenin kurulduğu sahadaki farklılıktan, deney ünitelerine uygulanan
işlemlerin farklılığından ve sayıların elde edilmesinde yapılan hatalardan vs
kaynaklanabilir. Deneysel hata, deney üniteleri arasında bir varyasyon
oluşturur. Denemeci, bazı tedbirlerle deneysel hatayı küçültebilir; ancak
tamamen ortadan kaldıramaz.
Bir denemede aynı işleme tâbi tutulmuş deney ünitelerinin arasındaki
farklılığın yanında, bir de farklı işlemlere tâbi tutulmuş deney üniteleri
arasındaki fark söz konusudur. Bu demektir ki, mesela A klonu fertleri arasında
farklar olabileceği gibi, A klonu fertleri ile B klonu fertleri arasında da farklar
olacaktır. Esasen denemede ortaya çıkarılmaya çalışılan ikinci farklılıktır ve
tabii olarak deneysel hata denen ilk grup farklılıktan büyük olması beklenir.
Bu, eğer varsa, işlemlerin sebep olduğu farklılıktır. O halde bir denemede ayrı
işlemlere tâbi tutulan deney üniteleri arasındaki farklılaşma iki sebepten
kaynaklanır:
• Deneysel hata,
• Đşlemlerin etkisi.
Denemelerden amaç bu iki unsurun hesaplanmasını mümkün
90
kılmaktadır. Denemelerin değerlendirilmesi sırasında bunlar hesaplanarak,
denenen faktörün etkinliğine karar verilir.
Aynı işlemlere maruz kalmış deney üniteleri arasındaki farklılığın ne
kadar çoğu işlemlerden kaynaklanmışsa, işlemler o kadar etkili olmuş ve
deneme hatası küçülmüş demektir. Deneysel hatayı mümkün olduğu kadar
küçük tutmak ve hesaplayabilmek deneme düzenlemenin esasını teşkil eder.
9.3.2.Deneysel Hatayı Küçültmenin Yolları
Deneysel hatayı küçültmenin yolları homojen materyal kullanmak
tesadüfîlik prensibine bağlı kalmak ve tekrarlama (tekerrür, yineleme)
uygulamaktır. Bunlar aynı zamanda deneme kurmanın ana prensipleridir.
9.3.2.1.Homojen Deney Materyali
Deneysel hatayı küçültmenin birinci yolu olabildiğince mütecanis
(homojen) deney materyali kullanmak ve denemenin kuruluşundan sonuna
kadar yapılan bütün işlerde eşit, tarafsız davranmaktır. Bunun için mesela aynı
çapta boyda fidanlar (deney üniteleri) alınmalı, bunlar homojen ve homojen
işlenmiş bir toprakta aynı kişi veya kişilerce dikilmeli, işlemlerin etkileri
birbirlerine karıştırılmadan homojen kültür - bakım teknikleri ile yetiştirilmeli
ve aynı kişi veya kişilerce ölçülmelidir. Böylelikle deneysel hataya sebep olan
etkiler asgariye inecek ve tüm deney üniteleri için eşit tutulacaktır. Bu sayede
denemede uygulanan işlemlerin etkileri daha iyi açığa çıkacaktır.·
9.3.2.2.Tesadüfîlik, Rastgele Dağılım
Tüm uğraşlara rağmen·homojen deneme materyali bulunamayabilir. Bu
durumda, deney materyali işlemlere rastgele dağıtılarak, materyalde mevcut
farklılıklar, etkileri aranan işlemlere dengeli şekilde yayılır. Bu maksatla kura
metodu kullanılır. Mesela bir arazi denemesinde, hangi fidanların arazinin
hangi parseline dikileceği kura ile belirlenir. Her deneme metoduna göre
işlemlerin deney parsellerine dağıtımı farklı olduğundan, denemeci bu bilgileri
istatistikçiden mutlaka almalıdır.
9.3.2.3.Tekrarlama (Yineleme, Tekerrür, Replikasyon)
Tekrarlama, denemelerde bir işlemi birden fazla deney ünitesinde
tekrarlamak demektir. Tekrarlama varyasyonu oluşturur ve deneysel hatanın
hesaplanmasını sağlar. Çünkü varyasyon birden fazla birey·arasında vardır.
Daha önce de açıklandığı gibi, varyans deney ünitesi sayısının artmasıyla
küçülme eğilimindedir. Đşlemlere konu olan etkiler ne kadar çok deney ünitesi
üzerinde tekrarlanırsa, deneysel hata o kadar küçülmüş olur. Ancak
91
tekrarlamanın çok fazla arttırılması, homojen deneme materyali temininde ve
denemenin homojen şekilde yürütülmesinde güçlük çıkarabilir. Tekrarlama
ileride görüleceği üzere deneysel hatanın serbestlik derecesini belirler. Bu
bakımdan, tekrarlama adedi, deneysel hatanın serbestlik derecesini 10'dan aşağı
düşürmeyecek sayıda olmasına çalışılmalıdır. Bu maksatla 3-6 tekrarlama
yeterli olur.
9.4.Denemenin Amaçları
Denenin amaçları, etkileri denenecek faktör veya faktörlerin seçimi ve
dolayısıyla hipotezlerin kurulmasıyla belirlenmiş olur. Denemenin amaçları
açıklanır ve hipotezler kurulurken mutlak ifadeler kullanılmamalı veya o
denemenin çözmeyeceği sorunlardan söz edilmemelidir. Ayrıca, etkileri gerçek
anlamıyla ortaya çıkarmak üzere gerekli ön çalışmalar yapılmalıdır. Mesela her
herhangi bir mineralin yeteri kadar bulunduğu bir toprakta, o mineral gübreyi
“acaba etkili mi” diye denemenin bir anlamı yoktur. Đşlemleri iyi seçmeli,
anlamsız veya aşırı nitelikli işlemler uygulanmamalıdır. Mesela bir gübre doz
denemesinde, dozlar ne etkili olmayacak kadar az, ne de zehir etkisi yapacak
kadar aşırı tutulmalıdır. Ayrıca gerekmiyorsa kontrol veya şahit denilen ve
hiçbir işlemin uygulanmadığı haller denemeye katılmamalıdır. Mesela etkili
olduğu zaten bilinen gübrelerden hangisinin daha etkili olduğunun seçiminde
kontrol parseline gerek yoktur. Kontrol parselleri, işlemlerin etkili olup
olmadığının bilinmediği hallerde kullanılabilir.
9.5.Deneme Parsellerinin Büyüklüğü, Şekli ve Yönü
Deneme parsellerinin büyük tutulması, kendi aralarındaki varyasyonu
(deneysel hatayı) azaltır. Ancak bu defa çok saha, çok deneme materyali, çok
masraf vs gerekir. Bu da arzu edilmediği halde, tekrarlamanın azaltılmasına
sebep olur. Parsellerin büyüklüğü, mevcut deneme sahası, tekrarlama sayısı,
deneme materyalinin adedi, miktarı ve çeşidi ile denemenin mahiyetine göre
değişir. Bitkilerle kurulacak arazi denemelerinde, parsellerde olabildiğince
fazla bitki olması istenir. Böylelikle bitkiler arası varyasyon azalacaktır. Bu
durum m2’de yüzlerce bitki bulundurabilen tarımsal denemelerde fazla sorun
çıkarmaz. Ancak her bir deneme ünitesinin 10-40 m2 gibi araziye ihtiyaç
gösterdiği ormancılıktaki arazi denemelerinde parsel büyüklüğünün
belirlenmesi denemeciyi çeşitli yönlerden sıkıntıya sokar. Yine de parseldeki
ağaç sayısı 4-6’dan az tutulmamalıdır.
Parsel büyüklüğüne etki eden diğer önemli bir faktör de bazı
denemelerde mutlaka kullanılması gereken ve kenar tesirlerini önlemekte
kullanılan izolasyon (tecrit) zonlarıdır. Özellikle gübreleme, sulama, sıklık vs
denemelerinde, etkilerin yan parsellere karışmasını önlemek amacıyla parseller
92
etrafında belli genişlikte sahalar bırakılır. Bu sayede bir parsele uygulanan
gübre veya suyun etkisinin bitişik parsele ulaşması önlenir. Ancak bu bölgeler
boş bırakılmamalı, bitişik parseldekine benzer şekilde, denemede kullanılan
fidanlarla ağaçlandırılmalıdır.
Parsel büyüklüğüne, denemenin uygulanmasında kullanılacak bazı
makine ve ekipman da etkili olabilir. Mesela bir iş makinesinin çalışabileceği
en küçük alan parsel büyüklüğünü belirleyebilir.
Arazi denemelerinde, parsellerin şekli de önem taşır. Homojen sahada
parsel şekli önemli değildir. Ancak toprağın homojenliği azaldıkça parsel şekli
önem kazanır. Bu gibi sahalarda parsellerin dikdörtgen şeklinde yapılması
uygun olmaktadır (Yurtsever, s.122). Bu durumda, parselin uzun kenarının
arazinin hem iyi hem kötü kısmını kapsayacak şekilde yerleştirilmesi gerekir
(Şekil 9.1).
Đyi
Toprak
Kötü
toprak
Şekil 9.1: Farklı yapıda veya meyilli arazide
deneme parsellerinin yerleştirilmesi
Burada önemli diğer bir husus da arazinin meylidir. Meyilli arazilerde
genellikle toprak üst kısımlarda kötü, alt kısımlarda iyidir. Bu bakımdan
parsellerin uzun kenarı meyil yönünde uzanmalıdır (Şekil 9.1). Bu sayede, her
parsel hem verimsiz, hem verimli topraktan etkilenecektir. Parsel içinde bitki
sıralarının ise kuzey-güney doğrultusunda yerleştirilmesi tavsiye edilmektedir
(Yurtsever, s.124).
9.6.Ölçülerde Hassasiyet
Bilindiği gibi ölçülerek-tartılarak elde edilen varyantlar, birimlerine göre
belli küsuratta ölçülebilirler. Bu sebepten deneme ünitelerinin ölçülmesinde
Madde 5.2'de açıklanan hususlar dikkate alınmalıdır.
Ölçme işlemi mümkün olduğunca aynı kişilerce, aynı ölçü aletleriyle ve
aynı noktadan yapılmalıdır.
93
10. RASTLANTI (TESADÜF) PARSELLERĐ
DENEME TERTĐBĐ
l0.1.Giriş
Buraya kadar verilen bilgilerle populasyonlar, kendilerinden çekilen
tesadüf nümuneleri üzerinden ortalama, standart sapma ve güven sınırlarıyla
tanınmaya çalışılmıştır. Bu Bölümden itibaren, özel populasyonların birer
temsilcisi olan denemelere ait deneme tertipleri ve bunların analizleri
üzerinde durulacaktır. Denemeler genellikle varyans analizi metoduyla
değerlendirildiğinden, bir anlamda bu ve bundan sonraki üç Bölüm varyans
analizi tekniklerine ait olacaktır.
10.2.Rastlantı Parselleri Deneme Tertibi ve Uygulanması
Homojen (mütecanis) materyalle kurulacak denemeler için en uygun
deneme düzeni tesadüf parselleri deneme tertibi'dir. Bu deneme tertibine
göre deneme materyali, etkileri denenecek işlemlere (muamele) tamamen
tesadüfi olarak dağıtılır. Tabii ki işlem sayısı bellidir. Denemenin planlanması
safhasında tekrarlama (yineleme) sayısı da tespit edilir. k adet işlem varsa n
adet tekrarlama uygulanacaksa, deneme sahası k×n kadar eşit parçaya ayrılır.
Bu parçalara deneme parseli denir.
Misal 10.1: 5 kavak klonunu idare müddetleri sonunda göğüs çapları
yönünden karşılaştırmak üzere, tesadüf parselleri deneme tertibine göre 4
tekrarlamalı bir deneme kurulacaktır. Bu denemede etkileri denenecek işlemler,
klonların hipotezle “farksız oldukları varsayılan”, çap artımı yetenekleridir.
Denemeci tarafından uygulanacak olan özel işlemler yoktur. Ancak mesela bir
gübreleme denemesinde, gübrelerin büyümeye (ürüne vs) etkisi denendiğinden,
uygulanan işlemler denemeci tarafından bitkilere verilen gübrelerdir. Bu
deneme tertibine göre kurulacak bir arazi denemesinde, sahanın tümünün
homojen olması ve homojen şekilde işlenmiş olması lazımdır.
O halde 5 işlem, 4 tekrarlamalı böyle bir denemede saha, 5×4=20 parsele
bölünür. Sonra her parsele 1'den başlanarak sırayla numara verilir (Şekil 10.1).
Bu numaralar küçük kağıt parçalarına yazılır, kağıtlar kapatılıp karıştırılır ve
işlem sayısı kadar (misale göre 5) gruba ayrılır. Her gruptaki kağıtların
numaraları bu amaçla düzenlenen bir tabloya yazılır (Tablo 10.1). Böylelikle
parseller, işlem sayısı kadar gruba tam tesadüfî olarak ayrılır. Sonra her gruba
uygulanacak işlem, yine kura ile belirlenir. Bu maksatla kağıt parçalarına
94
işlemlerin adları yazılarak, her gruba uygulanacak işlem rastgele çekilir. Çıkan
işlemin adı tabloda (Tablo 10.l) o grubun yanına yazılır. Böylece, her parsele
hangi işlemin uygulanacağı da tesadüfîlik prensibine uygun olarak belirlenmiş
olur. Hazırlanacak birer tabelaya, parsel no ve uygulanan işlem yazılarak
araziye dikilir. Araziye aplike edilen bu durum, Şekil 10.1’deki gibi bir kroki
ile tesbit dilerek, diğer belgelerle birlikte denemenin dosyasına konur. Şekil
10.1'e denemenin deseni denir.
1
E 6
C 11
D 16
C
2
D 7
A 12
A 17
E
3
B 8
B 13
C 18
B
4
D 9
B 14
D 19
E
5
C 10
A 15
A 20
E
Şekil 10.1: Rastlantı parsellerine göre düzenlenmiş 5 işlem,
4 tekrarlamalı (20 parsel) bir denemenin deseni
Tablo 10.1: 5 işlemin 20 parsele
4 tekrarlamalı olarak dağılması
Gruplar
I
II
III
IV
V
Klonlar
E
C
B
D
A
1
5
3
2
7
Parseller
17
19
6
13
9
8
11
4
12
10
20
16
18
14
15
Böyle bir denemede üzerinde durulması gerekli diğer bir konu, bir
parsele kaç deney ünitesi (fidan) dikileceğidir. 9.5 nolu maddede değinildiği
üzere, bu miktar parsel büyüklüğünü çok arttırmakta ve çeşitli sorunlara sebep
olmaktadır. Konu bu yönleriyle incelenmiş ve bir parsele 10 fidan dikilmesine
karar verilmiş olsun. Bundan sonra denemenin tamamına, olgunluk çağına
gelinceye kadar aynı bakım ve kültür teknikleri uygulanır. Sonuçta ağaçların
çapları usulüne uygun olarak aynı kişi tarafımdan, aynı tarzda, aynı ölçü
aletiyle ölçülür ve bir ölçü karnesine kaydedilir. Her parselde ölçülen çapların
ortalaması alınarak bir tabloya (Tablo 10.2) yazılır.
95
Tablo 10.2: 5 kavak klonunun
idare müddeti sonundaki çapları (cm)
Đşlemler
(Gruplar)
A Klonu
B Klonu
C Klonu
D Klonu
E Klonu
1
29
33
25
27
23
Tekrarlamalar
2
3
4
36
25
28
39
29
29
26
21
23
31
25
22
27
28
24
Genel toplam
Genel ortalama
Đşlem
Toplamı
118
130
95
105
102
550
Đşlem
Ortalaması
29.50
32.50
23.75
26.25
25.50
27.50
Klonların farklılığını karşılaştırmak üzere yapılacak istatistik işlemlerde
bu tablo kullanılır. (Tablodaki değerler, hesaplarda kolaylık sağlamak için
cm’ye yuvarlanmıştır. Halbuki bu misalde ortalamanın mm hassasiyetle
verilmesi daha uygun olacaktır).
Görüldüğü gibi tablodaki gözlemler sadece işlemlere göre (tek yönlü)
gruplandırılmıştır. Bu bakımdan rastlantı parselleri deneme tertibine bazı
kitaplarda tek yönlü gruplandırmalar denmektedir.
Tesadüf parselleri deneme tertibinin en büyük özelliği, her yönüyle
mütecanis materyal gerektirmesidir. Eğer materyalde önceden sezilen, görülen
ve bertaraf edilemeyen her hangi bir heterojenite varsa, tesadüf blokları veya
latin kare deneme tertibi tercih edilmelidir.
10.3.Tesadüf Parselleri Deneme Tertibinde Varyans Analizi
Denenecek işlemler veya mukayese edilecek konular sadece iki taneyse,
bunlar 8. Bölümde açıklanan t kontrolu metotlarından uygun biri ile
karşılaştırılabilir. Hele materyal uygun ise, deney ünitelerinin kendi aralarında
homojen olmasını gerektirmemesi bakımından eş yapma tertibi tesadüf
parsellerinden daha verimlidir. Ancak denemedeki işlemler ikiden fazlaysa,
ikişer ikişer karşılaştırmayla bir sonuca varmak mümkünse de, bu durum işlem
satışı ile artan bir zorluk çıkarır. Bu yüzden bütün işlem gruplarını topluca
kıyaslamaya yarayacak bir metot aranmış ve Đngiliz biyometri ve genetikçisi
Sir R.A. Fisher’in 1920'ler geliştirdiği Varyans Analizi metodu kullanılmaya
başlanmıştır. Metot kısa zamanda geliştirilerek, daha komplike denemelerin
düzenlenmesine ve analizine imkan sağlamıştır.
10.3.1.Varyans Analizinin Esasları ve Hipotezler
Tablo 10.2 incelenecek olursa, her değerin 27.5 cm olarak hesaplanan
genel ortalamadan farklı olduğu görülür. Bu farklılık (varyasyon), 9.3.1. nolu
96
maddede açıklandığı gibi iki ana etkenden kaynaklanmaktadır:
• Denenen işlem veya konuların sebep olduğu farklılık. Bu farklar
işlem ortalamalarının genel ortalamadan farklılaşması olarak tezahür
eder.
• Deneysel hata olarak tanımlanan ve sonsuz sayıda dış etkiden
kaynaklanan farklılık. Deneysel hata aynı işlem grubu içindeki gözlemler
arasında bir farklılaşma yaratarak, her işlemin kendi işlem
ortalamasından farklı olmasına sebep olur.
Bu iki unsur her varyantın genel ortalamadan farkına sebep olur.
Mesela A klonunun ilk parseldeki değeri 29 cm’nin genel ortalamadan
ayrılışı olan 29-27.5=1.5 cm’lik fark, A klonu ortalamasının genel ortalamadan
farkı 29.5-27.5=2 cm ile, parsel değerinin A klonu ortalamasından farkı 2929.5=-0.5 cm’nin cebirsel toplamına eşittir. O halde bu deneme tertibine göre
genel ortalamadan ayrılışlar iki unsura bölünebilmektedir. Varyans (veya
varyasyon) kaynakları denen bu unsurlar diğer deneme tertiplerinde daha
fazla sayıda olabilmektedir. Đşte varyans analizlerinin esası, varyantların genel
ortalamadan ayrılış kareleri toplamını, bu ayrılışlara sebep olarak varyans
kaynaklarının kareler toplamına göre kısımlara bölüp analiz etmektir.
Bir varyans analizinde varyantların genel ortalamadan ayrılış kareleri
toplamına Genel Kareler Toplamı, grup (işlem) ortalamalarının genel
ortalamadan ayrılış kareleri toplamına Gruplar Arası Kareler Toplamı ve
varyantların kendi grup (işlem) ortalamasından ayrılış kareleri toplamına da
Gruplar Đçi Kareler Toplamı denir.
Bu denemede, yalnız çap artımında klonların etkisi arandığına göre,
ortaya atılan hipotez “Klonlar arasında çaplar yönünden fark yoktur”
şeklindedir. Dikkat edileceği üzere bu hipotez, işlemlerden kaynaklanması
beklenen varyasyona dayanmaktadır. Bir denemede deneysel hatadan başka
buna benzer varyasyon kaynağı varsa, ona ait bir de hipotez var demektir. Bu
bakımdan ilerideki deneme tertiplerinde görüleceği üzere, bir deneme birden
fazla hipoteze dayalı olarak (çok faktörlü denemeler) da kurulabilir.
Bu denemedeki hipotez, bir bakıma “grupların (klonların) aynı
populasyondan çekilmiş, aynı ortalamaya sahip bir tesadüf nümunesi
olduklarını” iddia etmektedir. Varyans analizi ile yapılan kontrol bunun doğru
olup olmadığıdır.
10.3.2.Varyans Analizinin Uygulanması
Tablo 10.2'de sonuçları verilmiş denemeyi ele alarak, bu deneme
tertibinin gerektirdiği varyans analizini uygulayalım:
97
10.3.2.1.Kareler Toplamlarının Hesabı
Varyans analizi tekniğine göre, önce hesaplaması gereken kısım, genel
kareler toplamıdır (GKT). 3. Bölümden hatırlanacağı üzere, kareler toplamı
(3.6) nolu formülün payına göre kolayca hesaplanabilmektedir. GKT hesabında
da aynı formül kullanılır:
(ΣX ) 2
GKT = ΣX N
2
(10.1)
Burada N, denemedeki varyant adedi, yani parsel sayısıdır. Denemede k
adet işlem, n tekrarlamalı olarak denenmişse, N=k×n olur. Yukarıdaki formülde
2. terime, düzeltme terimi dendiği ve C ile gösterildiği 3.3.2.2.1 Maddesinde
belirtilmişti.
Formülün elemanları ayrı ayrı hesaplanacak olursa:
ΣX2=292+362+252+ . . .+242=15526
ΣX=29+36+25+ . . .+24=550
(ΣX)2=5502=302500
N=5×4=20 ve
GKT = 15526-(302500/20)=401 bulunur.
Gruplar arası kareler toplamı (GAKT), aşağıda (10.2) nolu formülde
ifade edildiği gibi, her grubun (işlemin) toplamının karesini tekrarlama adedine
bölüp, toplamlarını almak ve bu toplamdan düzeltme terimini (C) çıkarmakla
hesaplanır:
GAKT=
∑
( ΣX ) 2
−C
n
(10.2)
(Tablo 10.2'de grup (işlem) toplamları verildiğine göre,
 1182 130 2 952 1052 102 2 
 - 15125 = 194.5
+
+
+
+
4
4
4
4 
 4
GAKT= 
bulunur.
Gruplar içi kareler toplamı (GAKT) ise (10.3) nolu formülden
anlaşılacağı üzere, her grubun kareler toplamın toplamıdır:
98
GĐKT=

(ΣX ) 2 
2


X
Σ
−
∑
n 

(10.3)
Her grubun kareler toplamı ayrı ayrı hesaplanacak olursa:
1. grup KT=(292+362+252+282)-
1182
= 65
4
2. grup KT=(332+392+292+292)-
1302
= 67
4
952
3. grup KT=(25 +26 +21 +23 )= 14.75
4
2
2
2
2
4. grup KT=(272+312+252+222)-
1052
= 42.75
4
5. grup KT=(232+272+282+242)-
1022
= 17 ve buradan,
4
GĐKT = 65+67+14.75+42.75+17=206.5
bulunur. Analizin esasına göre:
GKT = GAKT + GĐKT
olması gerekir. Bu durum kontrol edilirse,
GKT = 401=194.5 + 206.5
olduğu görülür. Bu eşitlikten yararlanılarak, analizlerde GKT ve GAKT
hesaplanır; GĐKT ise:
GĐKT = GKT - GAKT
olarak bulunur.
GAKT analizlerde, gruplar işlemleri temsil ettiğinden, Đşlemler AKT
veya doğrudan uygulanan işlemin adıyla (mesela bu misalde Klonlar AKT gibi)
anılır. GĐKT ise hata veya residual veya error KT gibi isimlerle ifade edilir.
10.3.2.2.Serbestlik Derecelerinin (SD) Hesabı
Varyansın hesabı, bilindiği gibi kareler toplamını serbestlik derecesine
bölmekle yapılmaktadır. Bu bakımdan yukarıda hesaplanan 3 adet kareler
99
toplamının serbestlik derecelerinin bilinmesi gerekir. Denemedeki bütün
gözlemler n×k=4×5=20 adet olduğuna göre bunlardan serbest olanlar n×k1=20-1=19 tanedir. O halde GKT'nin serbestlik derecesi 19'dur. GAKT'nin
serbestlik derecesi, yine grup sayısının 1 eksiği olarak k-1=5-1=4'tür. GĐKT'nin
serbestlik derecesi ise bir grubun serbestlik derecesinin grup sayısı kadar
katıdır. Bir grupta n gözlem olduğuna göre bunun serbestlik derecesi n-1,
GĐKT'nin serbestlik derecesi ise k×(n-1)=5× (4-1)=15 hesaplanır. Özetlenecek
olursa:
GKT’nin SD: (k×n)-1=(işlem sayısı×tekrarlama sayısı)’nın bir eksiği,
GAKT’nın SD: k-1=işlem sayısının bir eksiği,
GĐKT’nin SD: k×(n-1)= işlem sayısı×(tekrarlama sayısının bir eksiği)
olarak hesaplanır.
Kareler toplamları arasındaki,
GKT=GAKT+GĐKT
şeklindeki eşitlik, bunların serbestlik dereceleri arasında da vardır:
GKT SD=GAKT SD + GĐKT SD
(k×n)-1=(k-1)+k× (n-1)
19=4+15
10.3.2.3. Kareler ortalamalarının (Varyansların) Hesabı
Varyasyon kaynaklarının kareler toplamları ve bunlara ait serbestlik
dereceleri bulunduktan sonra, varyans analizinin kareler ortalamaları (KO) diye
bilinen varyanslar bölümüne geçilir. Varyans, kareler toplamının kendi
serbestlik derecesine bölümü olduğuna göre, kareler ortalamaları da bu şekilde
hesaplanır. Ancak genel kareler ortalaması yani genel varyans, analizinde
hiçbir önem ve anlam taşımadığından hesaplanmasına gerek yoktur. Diğer iki
kareler ortalaması:
GAKO=
GĐKO=
GAKT
=194.5/4=48.625
kendi SD
GiKT
=206.5/15=13.767
kendi SD
bulunur. Daha önce değinildiği gibi, GĐKO denemedeki deneysel hataya
tekabül etmektedir.
10.3.2.4.Varyans Analizi Tablosu ve Hipotezin Kontrolu
Denemedeki varyasyon kaynaklarına ait kareler toplamları, bunların
100
serbestlik dereceleri ve kareler ortalamaları varyans analizi tablosu denilen
bir tabloda özetlenir (Tablo 10.3).
Tablo 10.3: 5 kavak klonu çaplarının 4 tekrarlamalı
rastlantı parsellerinde varyans analizi
Varyasyon Kaynağı
Gruplar (Đşlemler) arası
Gruplar (Đşlemler) içi (Hata)
Genel
KT
194.5
206.5
401.0
SD
4
15
19
KO
48.625
13.767
F
3.53
Varyans analizi tablosunda GAKO ve GĐKO (Hata KO) incelendiğinde,
denenen konuların etkinliği hakkında bir fikir edinilebilir. GAKO, GĐKO'ndan
ne kadar büyükse, işlemler arası farklılık o kadar büyük demektir. Başka bir
ifadeyle GAKO, Hata KO’ndan ne kadar uzaklaşmışsa konulara ait ortalamalar
arasında o derece büyük farklar var demektir. Farkların fazlalığı, işlemlerin
etkisinin büyüklüğünü gösterir.
Farklılaşmanın önemi, daha önce 8.2.2.1 nolu maddede açıklandığı üzere
yine Fisher’in geliştirdiği ve kendi adının baş harfi ile anılan F oranı ile kontrol
edilir. F oranı, aynı populasyona ait olduğu varsayılan iki müstakil varyansın
birbirine oranıdır. Böylelikle yapılan işlem, grup ortalamalarına ait varyans ile
grupların kendi içinde gösterdikleri varyansın aynı olup olmadığının; bu
ikisinin aynı populasyona ait tesadüf nümuneleri olup olmadığının kontroludur.
Hesaplanan F değeri ne kadar büyükse işlemlerin (grupların) aynı populasyona
ait olma olasılığı o oranda küçülür. F değeri, Gruplar Arası SD ve Hata SD'ne
göre bakılan F tablo değerini (Ek Tablo 4) hangi güven düzeyinde geçmişse,
aralarındaki farklar o güven düzeyinde önemli demektir.
Analize ait F oranı hesaplanacak olursa:
F=
GAKO
=48.625/13.767=3.53
GiKO (Hata)
bulunur. 4 ve 15 serbestlik derecelerine göre F tablolarına bakıldığında,
3.53’ün %95 güven düzeyli değerden (3.06) büyük olduğu, `%99 güven
düzeyli değerden (4.9) ise küçük olduğu görülür. O halde denenen işlemler
(klonlar) arasındaki farklar %95 güven düzeyinde önemlidir. Bu durumda
hipotez reddedilir.
F değeri %95 güven düzeyli tablo değerini aşamayacak kadar küçük
olsaydı, hipotez kabul edilecek ve işlemler arasında fark olmadığına karar
verilecekti.
F oranının önemi, varyans analizi tablosunda yanına konulan (*) simgesi
ile belirtilir.
101
%95 güven düzeyi, tek simgeyle (*),
%99 güven düzeyi (**) ve
%99.9 güven düzeyi (***)
ile gösterilir. F oranının önemsiz bulunması halinde ise, F değerinin yanı ya boş
bırakılır veya ingilizcedeki non-significant (belirgin değil) ifadesinin baş
harfleri olan NS ile işaretlenir.
10.4.Farklı Gurupların Tesbiti (Ortalamaların Mukayesesi)
Bir denemenin sonuçlarınm değerlendirilmesinde varyans analizi birinci
adımdır. Analiz sonucu grup (işlem) ortalamalarının önemli derecede (en az
%95) farklı oldukları anlaşılırsa, yapılacak 2. iş hangi grup veya grupların
diğerlerinden farklı olduğunu bulmaktır. Bu maksatla t istatistiğinden
yararlanılabileceği gibi (Yurtsever, 1984), Fisher'in asgari önemli fark (Least
Significant Differance=LSD), Student-Newman-Keuls, Duncan, Scheffe,
Tukey ve Hartley metotlarından biri kullanılabilir. Bunlardan t testine dayalı
bir metot olan LSD metodu, uygulama kolaylığına karşılık, ancak kaba bir
karşılaştırma için yeterli bulunmaktadır. Tukey ve Duncan testinin kısmen,
Student-Newman-Keuls testinin ise daha hassas olduğu ifade edilmektedir.
Örnek büyüklüklerinin eşit olması halinde uygulama kolaylığı sebebiyle Tukey
metodu ile yetinilebileceği belirtilmekte, farklı olmaları halinde ise Duncan
testinin kullanılması önerilmektedir. Student-Newman-Keuls testi, insan
yaşamı gibi çok önemli konularda tavsiye edilmektedir. Scheffe testi ise ikili
karşılaştırmalar için duyarlı görülmemektedir (Kalıpsız 1981 ). Tukey,
Hartley’den daha kullanışlı ve emin görülmektedir (Düzgüneş 1963).
Burada bunlardan Tukey, L, SD, Duncan ve Student-Newman-Keuls
testleri açıklanacaktır.
Varyans analizine göre işlemler arasında fark yoksa farklı grupların
tesbiti yoluna hiç gidilmemeli, %95 fark varsa bu güven düzeyinde farklı
gruplar, %99 fark varsa bu güven düzeyinde farklı gruplar aranmalıdır. Aşağıda
açıklanacak metotlara göre tesbit edilecek farklı gruplar, varyans analizi ile tam
uyum sağlamayabilir. Varyans analizi, işlemleri %95 farklı bulduğu halde,
farklı grupların tesbitinde kullanılan metotlar, işlemler arasında daha önemli
farklılıklar gösterebilmektedir. Bu sebeple farklı grupların tesbiti işleminde,
varyans analizinin sonucu esas alınmalıdır.
10.4.1.Tukey Metodu
Tukey metoduna göre, büyüklüklerine göre sıralanan grup ortalamaları
arasındaki farkların,
(10.4)
D = q× s X
102
formülüne göre hesaplanan En Küçük önemli fark'tan büyük olup
olmadıklarına bakılır; D değerini aşan farka sahip gruplar ayrı populasyonlara
ait sayılır. Formülde:
q, grup sayısı ve GĐKO'nın (Hatanın) serbestlik derecesine göre Ek tablo
5’ten istenen olasılıkta (%5 veya %1) alınacak tablo değeri,
s X , grup ortalamalarının standart hatasıdır. Bu değer,
sX =
GiKO
n
(10.5)
formülüne göre hesaplanır. GĐKO varyans analizi tablosundan alınır. n ise
denemedeki tekrarlama sayısıdır.
Misaldeki varyans analizine göre gruplar arasında %95 fark
bulunduğundan, bu düzeyde farklı gruplar aşağıdaki gibi tesbit edilir:
Grup sayısı 5 ve hata serbestlik derecesi 15 olduğuna göre Ek Tablo 5'e
bakılacak olursa %95 güvenle q=4.37 olduğu görülür. Buradan,
sX =
13.767
= 1.855 hesaplanır. O halde D=4.37×1.855 = 8.106'dır.
4
Birbirleriyle mukayese edilmek üzere büyüklüklerine göre sıralanmış
grup ortalamaları Tablo 10.4'de gösterilmiştir.
Tablo 10.4: 5 kavak klonunun çap ortalamaları ve
Tukey Metoduna göre %95 farklı ortalamalar
Klon
B
A
D
E
C
Ortalama (cm)
32.50
29.50
26.25
25.50
23.75
Farklar (cm)
3.00
6.25
7.00
8.75*
3.25
4.00
5.75
0.75
2.50
1.75
Tabloda ilk sütunda klonlar, 2. sütunda klonların ortalamaları verilmiştir.
Farklar kısmında ise ortalamaların sırayla birbirlerinden farkları gösterilmiştir.
Mesela B klonunun, kendinden sonrakilerle farkı sırayla 3.00, 6.25, 7.00 ve
8.75 cm'dir. A klonunun ise kendinden sonrakilerle farkı 3.25, 4.00 ve 5.75 cm
olmuştur. Aynı şekilde D'nin E ve C'den farkları 0.75 ve 2.50 cm olarak
gerçekleşmiş; E klonu ise en sonda yer alan C'den sadece 1.75 cm'lik bir fark
sağlayabilmiştir. Şimdi yapılması gereken, ilk sütundan itibaren fark
değerlerini D=8.106 ile sırayla karşılaştırmaktır.
En büyük ortalamayı veren B klonu ele alınacak olursa. bunun A'dan
farkı olan 3 cm'nin 8.106’dan küçük olduğu görülür. O halde B, A'dan
103
farksızdır. B'nin D'den farkı 6.25 de 8.106'dan küçük olduğuna göre B, D'den
de farksızdır. 7<8.106 olduğundan B klonunun E'den de farksız olduğu
anlaşılır. Ancak 8.75>8.106 olduğuna göre, B klonunun en sonda yer alan C
klonundan farklı olduğu söylenecektir. Bu farkın kenarına * işareti konur.
A klonu ile kendinden sonra yer alan diğerleri karşılaştırılacak olursa,
aralarındaki farklardan hiç birinin 8.106’yı aşmadığı görülecek ve A’nın
bunlardan farksız olduğuna hükmedilecektir.
O halde:
• B klonunun A, D ve E’den farkasız, C’den %95 farklı olduğu,
• A, D ve E klonlarının kendilerinden sonra yer alan diğerlerinden
farksız oldukları ortaya çıkmaktadır.
Bu durumda denenen klonlardan B, ikinci olarak A tercih edilmelidir.
Tablo 10.4’te farklı ve farksız ortalamalar görülmektedir. Farklılaşmalar
daha fazla olduğu takdirde bu şekilde bir sunuş durumun anlaşılmasını
güçleştirir. Bu bakımdan farksız ortalamaları Tablo 10.5’deki gibi kenarlarına
boydan boya çekilen bir çizgi ile belirtmek, farklılaşmayı daha anlaşılır hale
getirmektedir. Birbirlerinden farksız sayılan ortalamaların oluşturduğu gruplar,
böylelikle daha belirgin hale gelir.
Tablo 10.5: Tukey metoduna göre %95 güvenle farksız ortalamalar
Klon
B
A
D
E
C
Ortalama (cm)
32.50
29.50
26.25
23.50
23.75
10.4.2.LSD Metodu
LSD metoduna göre,
sd =
2 × Hata KO
n
(10.6)
formülüne veya Tukey Metodu için hesaplanan s X üzerinden,
sd = s X × 2
(10.7)
formülüne göre hesaplanacak iki ortalama arasındaki farkın standart hatası,
k×(n-1) serbestlik derecesine (varyans analizindeki hata serbestlik derecesi)
göre istenen güven düzeyindeki t değeri (Ek Tablo 2) ile çarpılarak:
LSD=t× sd
(10.8)
formülüne göre hesaplanan En Küçük Önemli Fark, ortalamalar arası
farklarla karşılaştırılır. LSD’yi aşan büyüklükte farka sahip ortalamalar o güven
104
düzeyinde farklı sayılır.
Varyans analizinin sonucuna 0.05 olasılık için LSD metodu uygulanacak
olursa, önceki bölümde s X =1.855 hesaplandığından,
sd =1.855× 2 =2.623
bulunur 5×(4-1)=15 serbestlik derecesine göre t0.05=2.131 olduğuna göre,
LSD=2.131×2.623 =5.59
Hesaplanır. Buna göre, Tukey metoduna benzer şekilde ortalamaları büyüklük
sırasına göre dizip, LSD’yi aşan farklar işaretlenmekle, birbirinden farklı
ortalamalar tesbit edilir (Tablo 10.6).
Tablo 10.6: 5 kavak klonu çap ortalamalarının LSD metoduna göre
%5 olasılıkla mukayesesi
Klon
B
A
D
E
C
Ortalama (cm)
32.50
29.50
26.25
25.50
23.75
Farklar (cm)
3.00
6.25*
7.00*
8.75*
3.25
4.00
5.75*
0.75
2.50
1.75
Tablo 10.6 Tukey’e göre mukayeselerin yapıldığı Tablo 10.4 ile
karşılaştırılırsa, LSD’nin daha az hassas (toleranslı) olduğu anlaşılabilir.
10.4.3.Duncan Testi
Duncan’ın yeni değişim genişlikleri testi denilen bu metot, Tukey
metoduna benzer. Yine grup ortalamaları arasındaki farklar,
LSR=SSR× s X
Formülüne göre hesaplanan en küçük önemli genişlikler (Least significant
ranges) ile karşılaştırılarak, bu değeri aşanların önemli olduklarına karar
verilir.
Formülde:
SSR (Significant Studendized Ranges)= Ortalamanın sıra numarasına ve
hata serbestlik derecesine göre istenenen güven düzeyinde tablo değeri
(Ek Tablo 6),
s X =Tukey metodunda açıklanan değer’dir
Farklı klonları bu defa Duncan’a göre tesbit edelim:
SSR değerlerini bulmak için Ek Tablo 6’ya bakılacak olursa, tablonun
karşılaştırılacak ortalamanın sıra numarasına ve GĐKO (hata) SD’ne göre iki
girişli olduğu görülür. Hata SD 15 ve grup sayısı 5 olduğuna göre %95 güvenle
105
SSR değerleri:
2. ort. Đçin
3.01
3. ort için
3.16
4. ort. için
3.25
5. ort. için
3.31
şeklinde sıralanmaktadır. Daha önce s X =1.855 hesaplandığından, (10.9) nolu
formüle göre LSR değerleri:
2. ort. Đçin
5.58
3. ort için
5.86
4. ort. için
6.03
5. ort. için
6.14
olarak hesaplanır.
Farklı ortalamaların tesbiti için Tukey ve LSD metotlarına göre tek bir
değer (D ve LSD gibi) hesaplanırken, Duncan metoduna göre ortalama
adedinin bir eksiği kadar LSR değeri ele alınmaktadır. Ortalamalar arası
farklar, karşılaştırılan ortalamanın diziliş sırasındaki yerine göre ilgili LSR
değeri ile mukayese edilir.
Ortalamalar, ortalamalar arası farklar ve farkların önemi Tablo 10.7’de
verilmiştir.
Tablo 10.7: 5 kavak klonu çap ortalamalarının
Duncan metoduna göre %5 olasılıkla mukayesesi
Klon
B
A
D
E
C
Ortalama (cm)
32.50
29.50
26.25
25.50
23.75
Farklar (cm)
3.00
6.25*
7.00*
8.75*
3.25
4.00
5.75
0.75
2.50
1.75
Karşılaştırma için B klonu ele alındığında, bunun:
A’dan farkı (3.00), 2. Ortalama için verilen değerle (5.65 ile);
D’den farkı (6.25), 3. Ortalama için verilen değerle (5.86 ile);
E’den farkı (7.00), 4. Ortalama için verilen değerle (6.03 ile);
C’den farkı (8.75), 5. Ortalama için verilen değerle (6.14 ile)
karşılaştırılır ve LSR değerini geçenler önemli sayılarak kenarlarına * konur.
Bu karşılaştırmalara göre B, A’dan farksız, diğerlerinden %95 farklı
bulunmuştur.
A klonu ele alındığında ise, bunun,
D’den farkı (3.25), 2. Ortalama için verilen değerle (5.65 ile);
E’den farkı (4.00), 3. Ortalama için verilen değerle (5.86 ile);
C’den farkı (5.75), 4. Ortalama için verilen değerle (6.03 ile)
karşılaştırılır ve yine LSR değerini geçenler önemli sayılarak * ile işaretlenir.
Bu defa A ile diğerleri arasındaki farkların önemli olmadığı görülmektedir.
106
Sıralamadaki diğer ortalamaların kendilerinden sonrakilerle mukayesesi
de yine benzer şekilde yapılır.
Ortalamaların farklı olanları Tablo 10.7deki şekilde işaret edilebildiği
gibi, farksız olanları (eşit sayılan gruplar) Tablo 10.5’dekine benzer şekilde de
gösterilebilir. Tablo 10.8’de Duncan’a göre farksız ortalamalar işaretlenmiştir.
Tablo 10.8: Duncan metoduna göre %95 güvenle farksız ortalamalar
Klon
B
A
D
E
C
Ortalama (cm)
32.50
29.50
26.25
23.50
23.75
Tablo 10.7 ve 10.8’den anlaşılacağı üzere, B ve A klonları bir grup, A ve
diğerleri başka bir grup oluşturmuştur.
10.4.4.Student-Newman-Keuls Testi
Student-Newman-Keuls testi de Duncan metoduna benzer. Ancak bu
defa grup ortalamaları arasındaki farklar, Tukey metodunda kullanılan q değeri
üzerinden,
w = q× s X
(10.10)
formülüne göre hesaplanan w değeri ile karşılaştırılır. Formülde:
q= Ortalamanın sıra numarasına ve hata serbestlik derecesine göre,
istenenen güven düzeyinde Ek Tablo 5’den alınan tablo değeri,
s X =Tukey metoduna göre hesaplanan değer’dir
Bu defa da farklı klonları Student-Newman-Keuls testine göre tesbit
edelim:
Duncan metodunda açıklanana benzer şekilde q değerleri Ek Tablo 5’ten
alınacak olursa, bunların:
2. ort. için
3.01
3. ort için
3.67
4. ort. için
4.08
5. ort. için
4.37
Oldukları görülür. Buna göre w değerleri (10.10) nolu formüle göre aşağıdaki
gibi hesaplanır:
2. ort. Đçin
5.59
3. ort için
6.81
4. ort. için
7.57
107
5. ort. için
8.11
Bu hesaplamalardan sonra yine düzenlenecek bir tabloda farkların önemi
işaretlenebilir (Tablo 10.9).
Tablo 10.9: 5 kavak klonu çap ortalamalarının Student-Newman-Keuls
metoduna göre %5 olasılıkla mukayesesi
Klon
B
A
D
E
C
Ortalama (cm)
32.50
29.50
26.25
25.50
23.75
Farklar (cm)
3.00
6.25
7.00
8.75*
3.25
4.00
5.75
0.75
2.50
1.75
Sonuç Duncan testi ile karşılaştırıldığında, bu metodun daha hassas
(toleranssız) olduğu görülmektedir. Bu bakımdan Student-Newman-Keuls
metodunun diğerlerinden daha duyarlı bulunduğu ve varyans analizine paralel
sonuç verdiği belirtilmektedir (Kalıpsız, s.378).
10.5.Rastlantı Parselleri Deneme Tertibinde Tekrarlamaların
Farklı Sayıda Olması Hali
10.5.1.Varyans Analizi
Denemelerde normal olarak her işlem grubundaki gözlem sayısı eşit
tutulur. Yani her işlem eşit sayıda tekrarlanır. Ancak bazı hallerde bu mümkün
olmaz. Bu durum ya her grup için eşit sayıda deneme materyali temi
edilememesinden veya deneme sırasında bazı gruplardaki varyantların
(tekrarlamaların) elde olmayan sebeplerden dolayı ortadan kalkmasından
kaynaklanabilir. Bazan da deneme konularından bir veya bir kaçının özellikle
daha fazla sayıda tekrarlanması istenebilir. Bütün bu hallerde, gözlem sayıları
farklı gruplar ortaya çıkmaktadır. Bu durumda uygulanacak varyans analizi,
aşağıdaki misal üzerinden açıklanmıştır.
Misal 10.2: 4 değişik klona mensup kavak fidanlarını boyları yönünden
kıyaslamak maksadıyla her klondan 15’er çelik rastlantı parsellerinde denenmiş
ve 2. yıl sonunda ölçülen boylar Tablo 10.10’da verilmiştir.
Tablodan anlaşılacağı üzere, 1. gruptan 3, 3. gruptan 1 ve 4. gruptan 2
fidan denme sırasında yok olmuştur. Bu durumda her grubu mesela 12’ye
indirmek mümkündür. Ancak buna mecburiyet yoktur. Deneme bu şekilde
farklı tekrarlamalar üzerinden değerlendirilebilir. Gerekli hesaplamalar aşağıda
sırayla yapılmıştır:
108
Tablo 10.10: 4 değişik kavak klonuna ait 2 yaşlı fidanların boyları (m)
I-214
4.06
3.80
4.50
4.50
4.60
4.35
4.00
4.10
3.60
3.80
2.80
3.70
ΣX
n
X
ΣX2
KT
45/51
3.80
4.10
3.70
4.45
3.75
4.20
4.30
4.10
4.50
4.80
5.10
4.50
4.60
4.80
4.60
65.30
15
4.35
286.6550
2.3823
48.35
12
4.03
197.9225
3.1123
77/51
4.00
4.95
5.40
4.85
5.00
5.50
5.30
5.60
5.00
5.10
5.00
5.40
5.10
4.20
5/4
5.20
5.10
5.10
5.00
5.20
5.00
4.90
5.60
5.60
5.00
5.30
5.40
5.50
70.40
14
5.03
356.7050
2.6936
67.90
13
5.22
355.3300
0.6831
Genel
Toplam:
251.95
54
1196.612
5
Kareler toplamları:
2
2
2
2
GKT=4.60 +3.80 +4.50 + . . . +5.50 -
251.952
54
=21.0791
 48.352 65.32 70.4 2 67.9 2  251.952
+
+
+
=12.2078
GAKT=
54
15
14
13 
 12
GIKT=GKT-GAKT=21.0791-12.2078=8.8713
Serbestlik dereceleri:
Genel: 54-1=53
Gruplar arası: 4-1=3
Gruplar içi: 53-3=50 veya (12-1)+(15-1)+(14-1)+(13-1)=50
Kareler ortalamaları:
Gruplar (klonlar) arası: 12.078/3=4.0693
Gruplar içi (hata): 8.8713/50=0.1774
Buna göre varyans analizi Tablo 10.11’de özetlenmiştir.
109
Tablo 10.11: 4 kavak değişik kavak klonu fidanlarını
boylarına ait varyans analizi
Varyasyon Kaynağı
Gruplar (Klonlar) arası
Gruplar (Klonlar) içi (Hata)
Genel
KT
12.2078
8.8713
21.0791
SD
3
15
53
KO
4.0693
0.1774
F
22.94
F=4.0693/0.1774=22.94
hesaplanarak tabloya yazılmıştır. Buna ait serbestlik dereceleri 3 ve 50’dir.
Bölünenin serbestlik derecesi 3, böleninki 50 olduğuna göre F tablosundan 3’e
50 serbestlik dereceli değerler aranacaktır. Đlgili değerler P=0.05 için 2.79,
P=0.01 için 4.20 ve P=0.001 için 6.40’dır. Hesaplanan F bunların hepsinden
fazlasıyla büyük olduğuna göre, grup ortalamalarının aynı populasyona dahil
olma ihtimali %0.1’in çok altındadır. O halde hipotez reddedilerek “Klonlar
boyları yönünden %99.9 farklıdır” denir.
10.5.2.Farklı Grupların Tesbiti
Örnek büyüklüklerin eşit olmaması halinde farklı grupların tesbiti için t
ve LSD kontrolları (Yurtsever, s.210), veya Tukey, Duncan yöntemlerinden
biri kullanılabilir. Ancak Tukey ve Duncan metotları için (10.5) nolu formüle
göre s X ’in hesabında n yerine,
n 0=
( Σn) 2 − Σn 2
( k − 1) × Σn
(10.11)
şeklinde hesaplanan bir değer kullanılmalıdır. Formülde:
n: gruplardaki varyant adedi,
k: grup adedidir.
Misal 10.2 için (10.1) nolu formüle göre,
n 0=
54 2 − (12 2 + 152 + 14 2 + 132 )
sX =
( 4 − 1) × 54
=13.47 hesaplanır. Buradan,
0.1774
GiKO
=
=0.1148 ve (10.7) nolu formüle göre,
n0
13.47
sd =0.1148× 2 =0.1624 bulunur.
Varyans analizine göre gruplar arasında %99.9’un üzerinde önemli bir
110
farklılık bulunduğundan, Duncan testi için Ek Tablo 6’dan 50 SD’li ve %99
güvenli SSR değerleri alınır:
2. ort. için
3.79
3. ort için
3.96
4. ort. için
4.09
Tabloda 50 SD için değer verilmediğinden, 40 ve 60 serbestlik dereceleri
için verilen değerlerin ortalaması alınmıştır. Buradan (10.9) nolu formüle göre
LSR değerleri:
2. ort. için
0.44
3. ort için
1.145
4. ort. Đçin
0.47
hesaplanır. Bunlara göre ortalamalar, ortalamalar arası farklar ve farkların
önemi Tablo 10.12’de gösterilmiştir.
Tablo 10.12: 4 kavak klonu fidanının Duncan metoduna göre
%99 güvenle mukayesesi
Klon
5/4
77/51
45/51
I-214
Ortalama (cm)
5.22
5.03
4.35
4.03
Farklar (cm)
0.19
0.87**
1.19**
0.68**
1.00**
0.32
Tablo 10.12’ye göre farksız gruplar ise aşağıdaki gibi işaretlenebilir:
5/5
77/51
45/51
I-214
Bu durumda:
5/4 ile 77/51 klonlarının kendi aralarında farksız olduğu, 5/4’ün
45/51’den ve ı-214’den %99 farklı olduğu,
77/51’in 45/51 ve I-214’den %99 farklı olduğu,
45/51’in ise I-214’den farksız olduğu söylenir.
Veya başka bir ifadeyle,
5/4 ile 77/51’in bir grup, 45/51 ile 77/51’in bir grup, 45/51 ile I-214’ün
başka bir grup oluşturduğu ifade edilir.
10.6.Varyansların Homojenliğinin Kontrolu (Bartlett Testi)
Varyans analizi ile kontrol edilen hipotez, daha önce de belirtildiği gibi,
“Farklı işlemlere maruz kalan grupların aynı normal populasyona ait tesadüf
111
nümuneleri olduğu” şeklindedir. Normal populasyonlar ise birbirlerinden
aritmetik ortalamaları ve varyansları ile ayrılırlar. Varyans analizi, grupları
ortalamaları bakımından farklı olup olmadıklarını inceler. Ancak yukarıdaki
hipotezin tam olarak kabul veya reddi için, grup varyanslarının da farklı olup
olmadıklarının bilinmesi gerekir. Normal olarak bir denemede grupların farklı
varyanslara sahip olmaları beklenemez. Çünkü bunlar homojen bir
materyalden, tamamen tesadüfi prensiplere uygun olarak meydana getirilmiştir.
Ancak bazı hallerde bu prensiplerin tam uygulanamaması veya işlemlerin
etkisinin varyansa tesiri sebebiyle gruplar önemli derecede farklı varyanslara
sahip olabilir. Denemede böyle bir durumdan şüphe ediliyorsa, veya hesaplar
sonucu grupların varyansları arasında gözle görülür büyük farklar varsa,
Bartlaett Testi le bu farkların gerçekten önemli olup olmadıklarının, yani
varyansların homojenliğinin kontrolu gerekir. Kontrol sonucu varyansların
homojen olmadıkları ortaya çıkarsa, o denemenin sonuçlarına itibar
edilmemelidir. Veya arzu edilirse, homojenliği bozan grup (işlem)
değerlendirme dışı bırakılarak, varyans analizi geriye kalan gruplara uygulanır
(Düzgüneş, s.139). Grupların eşit sayıda varyanta sahip olup olmadıklarına
göre metodun uygulanması farklıdır.
10.6.1.Varyant Sayısı Eşit Gruplarda Bartlett Testi
Misal 10.3: Varyant sayısı eşit gruplarda Bartlett testinin uygulanmasını,
5 kavak klonunun 4 tekrarlamalı olarak rastlantı parselleri deneme tertibinde
çapların yönünden denendiği Misal 10.1 (Madde 10.2) üzerinden açıklayalım:
Burada her grupta 4 tekrarlama olduğuna göre, gruplardaki varyant
sayıları eşittir. Bu amaçla önce her grubun kareler toplamları, varyansları ve
varyanslarının tabii logaritmaları (Neper logaritması) hesaplanır. 10.3.2.1 nolu
maddeden grupların kareler toplamları alınabilir. Grupların serbestlik dereceleri
ise 3’tür. Buna göre hesaplanan varyanslar ve varyansların logaritmaları Tablo
10.13’de verilmiştir.
Tablo 10.13: Varyant sayısı eþit gruplarda homojenlik kontrolu
Gruplar
A
B
C
D
E
Toplam
KT
65.00
67.00
14.75
42.75
17.00
SD
3
3
3
3
3
Varyans (s2)
21.667
22.333
4.917
14.250
5.667
68.834
Logns2
3.07579
3.10607
1.59270
2.65676
1.73466
12.16598
Varyansların ortalaması:
2
s =68.834/5=13.7668 ve bu ortalamanın tabii logaritması:
112
Logn s 2=2.62226’dır.
Bu değer grup sayısı (k) ile çarpılarak, sonuçtan logaritma s2’ler toplamı
(Σlogn s2) çıkarılır.
2
k×logn s =
2
Σlogn s =
Fark
5×2.62226 =
=
13.11130
12.16598
0.94532
Varyant (tekrarlama sayısının 1 eksiği (n-1) ile çarpılan fark değer, grup
sayısının 1 eksiği (k-1) serbestlik dereceli bir khi-kare değeridir.
χ2=0.94532×(4-1)=2.836
Bu değer 0.05 olasılıklı ve 4 SD’li khi-kare tablo değeri (Ek Tablo 3’te
söz konusu değer 9.488’dir.) ile karşılaştırılacak olursa, 2.836<9.488 olduğu
anlaşılır. Bu durumda gruplara ait varyansların homojen olduğuna karar verilir.
Hesaplanan değer tablo değerinden daha büyük olursa, varyansların
homojen olmadıklarına hükmedilir.
Eğer bulunan khi-kare değeri, esas alınan tablo değerini hafif bir şekilde
geçiyorsa, formül 10.12’deki düzeltme faktörü yardımıyla, aşağıdaki gibi
düzeltilmiş khi-kare hesaplanarak, bu değerin tablo değerini geçip geçmediğine
tekrar bakılır:
Düzeltme faktörü: C=1+
k +1
3 × k × (n − 1)
(10.12)
Misalde k=5, n=4 olduğuna göre,
C=1+
5 +1
=1.133
3 × 5 × (4 − 1)
bulunur ve bu değer yukarıda hesaplanan khi-kare değerine bölünerek,
Düzeltilmiş χ2=2.836/1.1333=2.502 hesaplanır.
10.6.2.Varyant Sayısı Farklı Gruplarda Bartlett Testi
Burada da bir khi-kare değeri hesaplanarak, bu değer ilgili tablo değeri
ile karşılaştırılmakta ve varyansların homojenliğine karar verilmektedir.
Misal 10.4: Metodu 4 kavak klonu fidanlarının boyları yönünden
denendiği Misal 10.2 (Madde 10.5.1) üzerinden açıklayalım:
χ2 hesabı için gerekli işlemler Tablo 10.14’de özetlenmiştir. Gruplara ait
KT’ları Tablo 10.10’dan alınmıştır.
113
Tablo 10.14: Varyant sayısı farklı gruplarda homojenlik kontrolu
Gruplar
KT
SD
1/SD
I-214
45/51
77/51
5/4
Toplam
3.1123
2.3823
2.6936
0.6831
8.8713
11
14
13
12
50
0.09091
0.07143
0.07692
0.08333
0.32259
Varyansların ortalaması: s 2=
2
Logns
0.28294
0.17016
0.20720
0.05693
-1.26253
-1.77099
-1.57407
-2.86602
12.16598
s
2
SD×Logns
2
-13.8879
-24.7939
-20.4629
-34.3922
-93.5369
ΣKT
=8.8713/50=0.17743
ΣSD
Logn s 2= -1.7292
Logn s 2×ΣSD= -1.7292×50= -86.4601
χ2= -86.4601-(-93.5369)=7.0768
χ2’nin SD=k-1=4-1=3
Ek Tablo 3’e göre 0.05 olasılıklı ve 3 serbestlik dereceli khi-kare değeri
7.815’dir. 7.0768<7.815 olduğuna göre gruplara ait varyansların homojen
olduğu sonucuna varılır.
Burada da khi-kare değerinde bir önceki maddede açıklanan gerekçeyle
bir düzeltme yapmak gerekirse, düzeltme faktörü olarak:
C=1+
1
×
3 × (k − 1)
 1

∑  n − 1 − Σ(n − 1) 
1
(10.13)
formülü kullanılır. Yukarıdaki misale bu formül uygulanacak olursa,
C=1+
1
1 

×  0.32259 −  =1.03362
3 × (4 − 1) 
50 
Düzeltilmiş χ2=7.0768/1.03362=6.847 hesaplanır.
114
11. RASTLANTI BLOKLARI DENEME TERTĐBĐ
11.1.Giriş
Önceki bölümde açıklandığı üzere, rastlantı parselleri deneme tertibi her
yönüyle homojen deneme materyali gerektiren ve işlemlerin deneme
parsellerine dağıtılmasında tam tesadüfîlik uygulanan bir deneme metodudur.
Ancak her zaman bu şartlara uygun homojenlikte materyal bulmak mümkün
değildir. Mesela konu bir arazi denemesi ise, deneme sahasında toprak, arazi
yapısı (bakı, meyil vs) farklı olabilir. Veya deneme ünitelerinin (bitki, hayvan
vs) bizzat kendileri aynı özelliklerde değildir. Bu tür farklılıkların, denemenin
sonucunu etkileyeceği de önceden bilinmektedir. Đşte bu gibi durumlarda
homojenliği bozan unsurlar ayrılarak bunlara, denemedeki işlemler eşit şekilde
dağıtılır.
Materyalin farklılığından ileri gelen etkiler, bir denemede işlemlerin
içinde, deneysel hata içinde veya her ikisinde yer alabilir. Bu bölümde
açıklanacak deneme tertibi ile, materyalin heterojenitesinden ileri gelen
unsurlar, denemenin tertiplenmesi safhasında ayrılarak -ki bunlar varyans
analizinde Bloklar adıyla ayrı bir varyasyon kaynağı oluşturur- bunların gerek
işlemlere, gerekse deneysel hataya olabilecek etkileri giderilmiş olur.
Bu şekilde farklılık gösteren materyale uygulanacak deneme metotları
rastlantı blokları ve latin kare deneme tertipleridir. Latin kare denemelerin
tekrarlama sayısında sınırlamalar getirdiğinden, burada rastlantı blokları
deneme tertibi ele alınacaktır.
Bu tür denemelerde gözlemler, bloklar ve işlemlere göre iki yönden ele
alınır. Bu bakımdan rastlantı blokları ve latin kare deneme tertiplerine iki
yönlü gruplandırmalar da denir.
11.2.Denemenin Uygulanması
Denemenin rastlantı bloklarında uygulanmasına karar verildikten ve
tekrarlama sayısı belirlendikten sonra, deneme materyali (mesela arazi
denemelerinde deneme sahası) tekrarlama adedi kadar parçaya ayrılır. Bunları
her birine blok denir. Bloklar, arazide homojeniteyi bozan özelliklere göre
(meyil, toprak özellikleri vs) sahaya dağıtılır. Böylelikle her bloku kendi içinde
homojen olması sağlanır. Mesela saha tamamen meyilli ise, Bloklar yukarıdan
aşağı doğru yerleştirilir. Toprak yapısı farklı ise, Her farklı kısma ayrı bir blok
yerleştirilmeye çalışılır. Arazi meyil, bakı vs yönden farklılıklar gösteriyorsa,
her homojen sayılabilecek bir kısma bir blok yerleştirilir. Blokların şeklinin
aynı olması gerekmez. Bloklar arazide farklı konumda ve şekilde yer
115
alabildiklerinden, bunların kendi içinde bölünmeleri de farklı şekillerde
olabilir. Önemli olan parsel büyüklüklerinin eşit olmasıdır.
Her blok kendi içinde denenecek işlem (konu) sayısı kadar parsele
ayrılır. Daha sonra işlemler bu parsellere rastgele dağıtılır. Bu amaçla yine
kur’a metodu uygulanabilir. Đşlemlerin parsellere dağıtılması her blok için ayrı
ayrı yapılır. Bu metotta işlemler ancak blok içinde tesadüfi olarak
dağıtıldığından, rastlantı parsellerindeki tam tesadüfilik kısmen bozulmaktadır.
Arazi denemlerinde genel olarak tamamen homojen, yeter büyüklükte bir
saha bulmak mümkün değildir. Tecanüsü bozan unsurlar yönünden saha
hakkında tam bilgi mevcut değilse yapılacak iş, sahayı mümkün olduğu kadar
fazla parsele bölerek tekrarlama sayısını arttırmak ve rastlantı parselleri
metodunu uygulayarak işlemleri parsellere tam rastgele dağıtıp deneysel hatayı
küçültmeye çalışmaktır. Fakat yukarıda açıklandığı gibi tecanüsü bozan
unsurlar biliniyorsa, sahayı bu unsurlara göre bloklara bölmek gerekir.
Düzgüneş (1963)’e göre bir mahalde yeteri genişlikte saha bulunmadığı
takdirde blokların ayrı ayrı yerlerde veya tarlalarda tesisi de mümkündür.
Misal 11.1: A, B, C, D isimli 4 kavak klonu, idare müddeti sonundaki
çaplarına göre mukayese edilmek istenmiş, toprak özellikleri bakımından
gerekli büyüklükte homojen bir saha bulunamadığından denemenin rastlantı
bloklarında tesisine karar verilmiştir. Deneme ile ilgili hipotez “Klonlar
arasında çap bakımından fark yoktur” şeklindedir. Saha incelenerek 5 farklı
özellikte olduğu anlaşıldığından, denemenin 5 yinelemeli olmasına karar
verilmiştir. Buna göre saha 5 bloka ayrılmıştır (Şekil 11.1). Denenecek klon
sayısı 4 olduğuna göre her blok 4’e bölünmüştür. Bundan sonra her blok için
ayrı ayrı kur’a çekilerek, bloklar içindeki parsellere klonlar rastgele
dağıtılmıştır. Klonların bloklar içindeki yerleşimi Şekil 11.1’de görülmektedir.
Bundan sonra fidanlar homojen kültür ve bakım teknikleriyle yetiştirilmiş ve
idare müddeti sonundaki çapları ölçülmüştür. Parsellerdeki ağaç sayısına göre
her parselin ortalaması alınmış ve değerler Tablo 11.1’de verilmiştir.
D
I. Blok
B
B
A
C
D
A
C
III. Blok
D
C
B
A
V. Blok
II. Blok
D
B
A
A
B
D
C
C
IV. Blok
Şekil 11.1: 4 işlem, 5 tekrarlamalı rastlantı blokları deneme deseni
116
Tablo 11.1: 4 kavak klonunun 5 blokta idare müddeti sonundaki çapları
(cm)
Klonlar
A
B
C
D
Blok top.
Blok ort.
1
32
33
27
29
121
30.00
2
34
31
32
26
123
30.75
Bloklar
3
34
36
33
30
133
33.25
4
35
37
26
31
129
32.25
5
37
35
29
28
129
32.25
Klonlar
Top.
Ort.
34.40
172
34.40
172
29.40
147
28.80
144
635
31.75
11.3.Rastlantı Bloklarında Kurulmuş Denemelerde Varyans
Analizi
Tablo 11.1 incelendiğinde iki yönlü düzenlendiği ve elde edilen verinin
iki unsura göre sınıflandırıldığı görülür. Bu unsurlardan biri bloklar, diğeri
işlemleri oluşturan klonlardır. O halde varyans analizi bu iki unsura göre
yapılacaktır. Bu durumda, tesadüf parsellerine nazaran genel varyasyona
(işlemler ve hataya ilaveten) 3. bir varyasyon kaynağı olarak bloklar dahil
olmaktadır.
Varyans analizi için gerekli hesaplamalar aşağıda sırayla gösterilmiştir:
Kareler toplamları:
Düzeltme faktörü: C =6352/20 = 20161.25
Genel KT = 322+342+342+. . . +282 - C = 229.75
Bloklar AKT =
Klonlar AKT=
1212 + 1232 + 1332 + 129 2 + 129 2
4
172 2 + 172 2 + 147 2 + 144
5
- C=24.0
2
-C=141.35
Hata KT=Genel KT-(Bloklar AKT+Klonlar AKT)=
=229.75-(24.00+141.35) = 64.4
Serbestlik Dereceleri:
Genele ait: 20-1=19
Bloklara ait: 5-1=4
117
Klonlara ait: 4-1=3
Hataya ait: 19-(4+3)=12
Kareler Ortalamaları:
Bloklar AKO=24/4=6
Klonlar AKO=141.35/3=47.117
Hata KO= 64.4/12=5.367
Bunlara göre, varyans analizi Tablo 11.2'de özetlenmiştir.
Tablo 11.2: 4 kavak klonunun 5 bloktaki çaplarına ait varyans analizi
Varyasyon kaynağı
Bloklar
Klonlar
Hata
Genel
KT
24.00
141.35
64.40
229.75
SD
4
3
12
19
KO
6.000
47.117
5.267
F
1.12
8.78**
Klonların çap yönünden farklı olup olmadıklarını kontrol için,
F=47.117/5.367=8.78
hesaplanır. Bölünen (klonlar KO) için 3, bölen (Hata KO) için 12 serbestlik
derecesine göre F tablosuna bakılacak olursa, 0.05 olasılıklı değerin 3.26, 0.01
olasılıklı değerin ise 5.95 olduğu görülür. Hesaplanan değer (8.78) bunların her
ikisinden de büyük olduğuna göre, hipotez reddedilerek “klonların çapları
bakımından %99 güvenle farklı oldukları” sonucuna varılır.
Burada deneme, her ne kadar “Bloklar arasında fark yoktur.” şeklinde
ifade edilebilecek bir hipotezi kontrol gayesini gütmemekte ise de, bloklara ait,
F=6/5.367=1.12
değeri, 4 ve 12 serbestlik dereceli tablo değeri (0.05 olasılık için 3.26) ile
karşılaştırılmakla istenen kontrol yapılabilir. 1.12<3.26 olduğuna göre blokların
farksız etki yaptığı sonucuna varılır.
Bu durumda “deneme rastlantı parsellerinde tertiplenseydi” diye
düşünülebilir. Ancak bu şekilde bir uygulamayla, genel varyansın hara KT’nda
yer alacak belli bir miktarı (burada 24) bloklarda görünmüş, bu da hata KO’nın
o miktarda küçülmesini sağlamıştır. Ayrıca tesadüf blokları vasıtasıyla,
tekrarlama sayısında da bir miktar tasarruf sağlanmıştır. Bazı özel formüller
yardımıyla, denemenin bloklarda kurulmasıyla ne kazanç sağlandığı
hesaplanabilir.
Đşlemlerin farklılıkları böylece belirlendikten sonra, ortalamaların
karşılaştırılması için burada da 10.4 nolu maddede açıklanan metotlardan biri
118
kullanılabilir. Bunlardan LSD için gerekli sd , (10.6) nolu formüle göre,
sd =
2 × 5.367
=1.465
5
ve diğer testler için s X (10.5) nolu formüle göre,
sX =
5.367
=1.036
5
olarak hesaplanır. Buna göre tercih edilen testlerden biri uygulanarak
ortalamalar mukayese edilir. Ancak varyans analizine göre klonlar (işlemler)
%99 güvenle farklı bulunduğundan, farklı ortalamaların tesbiti için ilgili
tablolarda 0.01 seviyesi esas alınmalıdır.
11.4.Tesadüf Bloklarında Eksik Değerler
Bazı hallerde denemenin yürütülüşü sırasında bir veya bir kaç blokta, bir
veya bir kaç parseldeki deneme üniteleri zarar görebilir, hatta tamamen ortadan
kalkabilir. Zararlılar tarafından tahrip olabilir, kuruyabilir, ölebilir vs. Böyle
durumlarda denemenin hassasiyeti azaldığı gibi, bazan da değerlendirme
imkanı ortadan kalkar. Bir kaza sonucu bir blokun tamamı ortadan kalkmışsa,
deneme kalan bloklar üzerinden değerlendirilebilir. Ancak 2 bloklu bir
denemede buna imkan kalmaz.
Bloklardaki parsellerden birinin tahrip olması halinde ise, eksik değerin
bulunduğu blokun değerlendirme dışı bırakılması düşünülebilir. Ancak tek bir
parselin kaybı yüzünden bir blokun atılması, emek, para, zaman ve bilgi
kaybıdır. Böyle durumlarda Đngiliz istatistikçisi Yates’in geliştirdiği metotla
eksik parsel için yaklaşık bir değer hesaplanabilir. Denemedeki diğer gözlem
değerlerini kullanarak aşağıdaki formüle göre eksik parsel için hesaplanacak bu
değer, sadece istatistik analizi mümkün kılar:
X=
( n × b) + ( k × T ) − G
( n − 1) × ( k − 1)
(11.1)
Formülde:
n: blok (yineleme) sayısı,
B: zarar gören parselin bulunduğu bloktaki diğer parsellerin toplamı
k: işlem adedi
T: zarar gören parsele uygulanmış işlemin, diğer bloklardaki toplamı,
G: denemedeki tüm parsellerin toplamıdır.
119
Misal 11.2: Tablo 11.1’de sonuçları verilen denemede 1. blokun A
parselinin ortadan kalktığını ve bu parsele ait gözlem değerinin bulunmadığını
kabul edelim. Bu durumda yapılacak işler aşağıdaki gibidir:
n=5
B=33+27+29=89
k=4
T=34+34+35+37=140
G=635-32=603
O halde eksik parsele ait değer,
X=
(5 × 89) + ( 4 × 140) − 603
=33.5
(5 − 1) × ( 4 − 1)
cm hesaplanır. Eksik değer, yerine konularak varyans analizi madde 11.3’de
açıklandığı şekilde yapılır. Ancak varyans analizinde:
Genel ve hataya ait serbestlik dereceleri 1’er azaltılır. Mesela bu misal
için genelin serbestlik derecesi 18, hatanın serbestlik derecesi 11 olur.
Klonların ve blokların serbestlik dereceleri aynı kalır.
Hesaplanan klonlar arası kareler toplamından;
( B − ( k − 1) × X ) 2
k × ( k − 1)
(11.2)
formülüne göre hesaplanacak miktar düşülür. Yukarıdaki misale göre bu değer:
(89 − ( 4 − 1) × 33.5) 2
=11.021
4 × (4 − 1)
hesaplanır. F kontrolları buna göre yapılarak sonuca varılır.
(11.1) nolu formüle göre hesaplanan parsel değeri ile yapılacak varyans
analizinde, işlemler arası KT'ndan (11.2) nolu formüle göre düşme yapmadan
da analiz değerlendirilebilir. Bu takdirde işlemlere ait hipotezin kontrolu için F
tablosundan %5 yerine %1 seviyesi esas alınmalıdır.
Tesadüf bloklarında eksik gözlem sayısı 2 adetse ve eksik değerlerin her
ikisi de aynı blokta ise o blok iptal edilmelidir. Eksik değerler farklı bloklarda
ise önce bunlardan birine tahmini bir değer verilerek, diğeri (11.1) nolu
formüle göre hesaplanır. Hesaplanan değer yerine konularak, bu defa diğer
eksik değer hesaplanır. Bu şekilde bulunan değer, ilk önce tahmini olarak
verilen değere yakın ise işlem tamamlanır ve varyans analizi bunlar üzerinden
yapılır. Eğer çok farklı ise hesaplanan değerler yerine konularak, farklar
120
azalıncaya kadar işleme devam edilir. Varyans analizinde de her eksik değer
için genel ve hata SD'nden birer düşülür.
Đkiden fazla eksik değer olması halinde de yukarıda açıklanan yol
izlenebilir. Ancak böyle durumlarda F tablosuna nasıl bakılacağına dair açıklık
bulunmadığından, analizden sağlıklı bir sonuç almak mümkün değildir. Bu
nedenle ikiden fazla eksik parsel bulunduran denemeler en iyisi iptal
edilmelidir.
121
12. FAKTÖRĐYEL (ÇOK FAKTÖRLÜ) DENEMELER
12.1.Giriş
Buraya kadar açıklanan varyans analizi teknikleri, yalnız bir işlem
grubunun etkilerini inceleyen tek faktörlü denemelere aittir. Mesela bir
denemede “klonlar” olarak ele alınan işlem grubu, esasen büyüme olayında
sadece “klon faktörünün” etkisini incelemektedir. Buna benzer şekilde değişik
gübrelerin etkilerinin arandığı bir denemede ise konu “gübre faktörü”
olmaktadır. Bu iki faktör birbirlerinden farklı konulardır. Böylelikle bazı
hallerde araştırmacı birden fazla faktörün etkilerini aynı deneme içinde bir
arada görmek isteyebilir. Mesela 4 çeşit kavak klonu 3 değişik gübre ile
yetiştirilerek, hangi klonun hangi gübre ile daha iyi geliştiği ortaya çıkarılmaya
çalışılır. Böyle bir denemede “klonlar” ve “gübreler” olmak üzere iki faktör
vardır. Her faktörün kendi içindeki değişik hallerine o faktörün seviyeleri
denir. Klon faktörünün 4, gübre faktörünün 3 seviyesi olduğu gibi.
Faktöriyel denemeler faktörlerin esas etkilerini ortaya çıkardığı gibi, bir
faktörün hallerinin diğer faktörün halleriyle bir arada müştereken oluşturdukları
interaksiyonları (ara etkiler, etkileşimler) da inceler. Böylelikle mesela
hangi kavak klonunun hangi gübreyi tercih ettiği ortaya çıkarılabilir. Çok
faktörlü denemelerden amaç zaten ara etkileri görmektir.
Faktöriyel denemelerde esas faktörler bazı hallerde kendi başlarına
önemsiz olduğu halde, bunların interaksiyonları önemli olabilir. Veya bir faktör
diğer bir faktörü olumsuz yönde etkileyerek, tek başına etkili olan faktörü
etkisiz hale getirebilir. Đnteraksiyonların önemli olduğu durumlarda, faktörler
birbirlerinin değişik sevilerinde farklı etkiler gösterirler.
Bir denemede faktörler arasında etkileşim (interaksiyon) kesinlikle
beklenmiyorsa, bu faktörler en iyisi ayrı ayrı denemelerde ele alınmalıdır.
Ancak şüpheli durumlarda veya interaksiyonun zaten beklendiği hallerde
faktöriyel denemeler tesis edilir.
Büyük zorunluluklar olmadığı müddetçe 4 veya daha fazla faktörlü
denemeler kurulmamalıdır. Çünkü bu gibi denemelerin gerek yürütülmelerinde,
gerekse analizlerinde güçlüklerle karşılaşılabileceği gibi, ortaya çıkan
interaksiyonların açıklanması da güçleşebilir.
Faktöriyel denemelerde iki faktör arasındaki interaksiyonlara birinci
derece interaksiyon, 3 faktör arasındaki interaksiyonlara ikinci derece
interaksiyon, 4 faktör arasındaki interaksiyonlara ise üçüncü derece
interaksiyon denir.
Faktöriyel deneme tertipleri biyolojide ve özellikle tarımda çok
122
kullanılmaktadır. Çünkü biyolojik olaylar genellikle birden çok faktörün etkisi
altında gelişirler. Bu sebepten değişik faktörlerin etkilerini bir arada
incelemekte büyük yarar vardır. Mesela bir bitkinin verimine veya bir ağacın
gelişmesine; farklı toprak işleme teknikleri, farklı sulama çeşitleri, farklı
gübreler, farklı sıklıkta dikim çeşitleri tek başlarına etkili oldukları gibi, bir
kaçının birlikte daha fazla etkileri de olabilir. Böylelikle verim daha da
arttırılabilir. Bazı hallerde ise müşterek etkiler sonucu verim düşebilir. Đşte
bütün bu tür araştırmalar faktöriyel denemelerle yapılabilir.
Faktöriyel denemeler önceki konularda açıklanan esaslara uygun olarak,
rastlantı parsellerinde, rastlantı bloklarında veya latin kare tertibinde
kurulabilirler. Aşağıda, rastlantı parsellerinde ve rastlantı bloklarında 2 faktörlü
bir denemenin kuruluşu ve analizi misaller üzerinden açıklanmıştır.
12.2.Rastlantı Parsellerinde Faktöriyel Deneme Tertibi
12.2.1.Denemenin Kurulması
Misal 12.1: A ve B gibi iki tip mineral gübrenin bir bitkinin verimini
arttırmada müşterek etkisi görülmek istendiğinde, 2 faktörlü bir deneme
kurmak gerekir. Faktörlerden birinin A gübresi verilmemiş a0 ve verilmiş a1
gibi 2 seviyesi, diğerinin de B gübresi verilmemiş b0 ve verilmiş b1 gibi 2
seviyesi denenecek olursa, bu denemede:
a0b0: A gübresi yok, B gübresi yok,
a0b1: A gübresi yok, B gübresi var,
a1b0: A gübresi var, B gübresi yok,
a1b1: A gübresi var, B gübresi var,
olmak üzere 2×2=4 hal (kombinasyon) vardır.
Đki faktör böyle ikişer seviyesi ile denendiğinde bu denemeye 2×2
denemesi de denir. Faktöriyel denemelerde her faktörün seviyesi diğer faktör
veya faktörlerin seviyeleri ile birleştirildiğinden bu hallere işlem
kombinasyonları denir.
Misaldeki deneme 4 tekrarlamalı olarak kurulacaksa, mütecanis bir arazi
bulunarak deneme alanı 2×2×4=16 parsele bölünür. 4 işlem kombinasyonu
parsellere 10.2 nolu maddede açıklandığı gibi rastgele dağıtılır. Bu maksatla
hazırlanan krokiler (deneme deseni) aplikasyonda kullanılır ve denemenin
dosyasında saklanır. Öngörülen gübreler parsellere verilir, homojen kültürbakım teknikleri ile hasat mevsiminde parsellerdeki ürün hasat edilir.
Bu denemede hipotezler:
“A gübresinin denenen bitkinin verimine etkisinin olmadığı”
“B gübresinin denenen bitkinin verimine etkisinin olmadığı”
“A ve B gübrelerinin denenen bitkinin verimine müştereken etkilerinin
123
olmadığı” şeklindedir.
12.2.2.Faktöriyel Denemelerde Etkiler
Yukarıdaki gibi bir 2×2 denemesinde işlem kombinasyonlarına göre
parsellerde elde edilen ortalama verim Tablo 12.1’de verilmiştir.
Tablo 12.1: Bir 2×2 faktöriyel denemede
parsellerdeki ortalama ürün miktarları (kg)
Faktörler
B
Gübresi
b1-b0
b0
b1
A Gübresi
a0
a1
30
32
36
38
6
6
a1-a0
2
2
Böyle bir denemede A hallerine ait her b1-b0 değerine ve B hallerine ait
a1-a0 değerine basit etkiler denir. Mesela B hallerinin a0’daki basit etkisi b1-b0
=36-30=6 olduğu gibi, a1’deki basit etkisi de b1-b0=38-32=6’dır. Demek ki
B’nin etkisi A’nın her iki halinde de aynıdır. Bu durumda a1-a0=32-30=2 ve a1a0=38-36=2 eşitliklerinde görüldüğü üzere, A’nın basit etkisi de B’nin her iki
halinde aynıdır. Faktörlere ait basit etkilerin aynı olmaları veya istatistik
anlamda önemsiz sayılabilecek bir farklılık göstermeleri, interaksiyonun
bulunmadığını veya önemsiz olduğunu gösterir. Böyle bir denemenin sonuçları,
grafikle gösterilecek olursa, basit etkilerin bir birine paralel veya paralel
sayılabilecek bir seyir gösterdiği görülür (Şekil 12.1). Demek ki A ile B’nin bu
bitkinin verimine müşterek olumlu veya olumsuz bir etkisi olmamıştır.
40
35
30
b0
25
b1
20
a0
a1
Şekil 12.1: Bir 2×2 denemesinde interaksiyonlar
Basit etkilerin ortalamasına esas etki denir. Mesela yukarıdaki misalde
A faktörnün esas etkisi (2+2)/2=2, B faktörünün esas etkisi (6+6)/2=6’dır.
Tablo 12.2’de başka bir 2×2 denemesinin sonuçları verilmiştir.
124
Tablo 12.2: Başka bir 2×2 denemesinde
parsellerdeki ortalama ürün miktarları (kg)
Faktörler
B
Faktörü
b1-b0
A Faktörü
a0
a1
30
32
36
26
6
-6
b0
b1
a1-a0
2
-10
Bu defa A’nın b0’daki basit etkisi 32-30=2, b1’deki basit etkisi 26-36=10’dur. Demek ki A’nın etkisi, B’nin hallerine göre değişmektedir. b0, a1 ile
(a0’a nazaran) iyi sonuç verdiği halde; b1, a1 ile olumsuz sonuç vermektedir.
Aynı durum B faktörünün basit etkisinde de görülmektedir (b1a0=36 iken,
b1a1=26 olmuştur). Böyle bir durum interaksiyon etkisinin varlığını gösterir.
Ancak buradaki durum negatif bir interaksiyondur. Yani A halleri, B halleri ile
bir araya geldiğinde sonuç olumsuz yönde etkilenmektedir. Bu durumda Şekil
12.2’de soldaki grafikte görüldüğü gibi, birbirine zıt meyilde iki doğru ortaya
çıkmaktadır.
40
40
35
35
30
30
b0
b0
25
25
b1
20
a0
b1
20
a1
a0
a1
Şekil 12.2: 2×2 denemelerinde interaksiyonlar
Şekil 12.2’de sağdaki grafik ise pozitif bir interaksiyonun varlığına
işarettir. Yani A faktörünün halleri B faktörünün halleri ile birlikte sonucu
arttırıcı yönde bir etki oluşturmaktadır.
12.2.3.Tesadüf Parsellerinde 2×2 Denemesinin Analizi
Madde 12.2.1’de kuruluşu açıklanan denemenin sonuçları Tablo 12.3’de
verilmiştir.
Tablo incelenecek olursa:
A’nın B ile (b1’deki ) basit etkisi: a1b1-a0b1=15-10=5 kg,
A’nın B’siz (b0’daki ) basit etkisi: a1b0-a0b0=13.5-11=2.5 kg
olup bunların arasındaki 5-2.5=2.5 kg’lık fark interaksiyon etkisidir. Demek ki
A ile B müştereken 2.5 kg’lık bir verim artışı sağlamaktadır.
125
Tablo 12.3: Bir 2×2 denemesinde ürün miktarları (kg)
Konu
a0b0
a0b1
a1b0
a1b1
I
11.5
9.5
14.5
14.8
Toplam
Tekrarlama
II
III
10.8
10.5
10.1
11.0
13.7
12.8
15.2
15.3
Toplam
IV
11.2
9.4
13.0
14.7
44
40
54
60
198
Ortalama
11.0
10.0
13.5
15.0
Toplam
A
84
B
98
100
114
Aynı şekilde:
B’nin A ile (a1’deki ) basit etkisi: a1b1-a1b0=15-13.5=1.5 kg,
B’nin A’sız (a0’daki ) basit etkisi: a0b1-a0b0=10-11=-1 kg
olup bunların arasındaki 1.5-(-1)=2.5 kg’lık fark da aynı interaksiyondur.
Tabii bu interaksiyonun önemli olup olmadığına varyans analizi sonucu
karar verilecektir. Đnteraksiyonun gerçekten önemli bulunması halinde, esas
etkile bir anlam taşımaz. Zira bunlar diğer faktör (veya faktörlerin) hallerine
göre değişmektedir.
Burada esas etkiler hesaplanacak olursa:
A’ya ait esas etkinin: ((a1b0-a0b0)+( a1b1-a0b1))/2=(2.5+5)/2=3.75,
B’ye ait esas etkinin: ((a0b1-a0b0)+( a1b1-a1b0))/2=(-1+1.5)/2=0.25
olduğu görülür. Buna göre A gübresi B ile birlikte ortalama 3.75 kg’lık bir fark
yaratmaktadır.
12.2.3.1.Kareler Toplamları ve Serbestlik Dereceleri
Burada GKT, tesadüf parsellerinde olduğu gibi önce işlemler arası ve
işlemler içi (hata) olmak üzere ikiye bölünür. Denemede, her birinde 4 varyant
(tekrarlama) bulunan 4 işlem grubu (kombinasyon) vardır.
Düzeltme faktörü=C=1982/16=2450.25
GKT=11.52+10.52+10.82+ . . .+14.72-C=66.99
Đşlemler AKT=
44 2 + 402 + 54 2 + 602
4
-C=62.75
Hata KT=Genel KT-Đşlemler KT=66.99-62.75=4.24
Burada Đşlemler AKT, A halleri KT, B halleri KT ve interaksiyon
KT’ndan meydana gelir. Bunlar şöyle hesaplanır:
A halleri KT=
84 2 + 114 2
8
-C=56.25
126
B halleri KT=
982 + 1002
8
-C=0.25
A halleri KT+B halleri KT=56.25+0.25=56.5’dir. Dikkat edilirse bu
değer, işlemler işlemler AKT’ndan küçüktür. Aradaki fark, genel varyasyonda
diğer bir varyasyon kaynağı olan interaksiyon KT’dır.
Đnteraksiyon KT=Đşlemler AKT-(A halleri KT+B halleri KT)=
=62.75-(56.25+0.25)=6.25
Burada,
Hata KT=GKT-(A faktörü KT+B faktörü KT+Đnteraksiyon KT=
=66.99-(56.25+0.25+6.25)=4.24
şeklinde de hesaplanabilir.
Serbestlik dereceleri ise:
Genel SD=16-1=15
Đşlemler SD=4-1=3
A faktörü SD=2-1=1
B faktörü SD=2-1=1
Đnteraksiyon SD=Đşlemler SD-(A faktörü SD+B faktörü SD)=
=3-(1+1)=1
Đnteraksiyona ait SD, faktörlerin serbestlik derecelerinin çarpımı olarak
da hesaplanabilir: 1×1=1
Hata SD=Genel SD-Đşlemler SD=15-3=12 veya,
Hata SD=Genel SD-(A faktörü SD+B faktörü SD+interaksiyon SD)=
=15-(1+1+1)=12
Yapılan bu hesaplamaların sonuçları Tablo 12.4’te özetlenmiştir.
Tablo 12.4: Tesadüf parsellerinde 4 tekrarlamalı olarak kurulmuş
2×2 faktöriyel denemesinin varyans analizi
Varyasyon Kaynağı
A Gübresi
B Gübresi
A×B interaksiyonu
Hata
Genel
KT
56.25
0.25
6.25
4.24
66.99
SD
1
1
1
12
15
KO
56.25000
0.25000
6.25000
0.35333
F
159.20***
0.71
17.69**
Varyans analizi tablosunda, faktörlere ve interaksiyona ait F oranları da
hesaplanarak ilgili sütuna yazılmıştır. Bu maksatla kareler ortalamaları, hata
KO’na bölünmüştür. Bunlardan mesela A faktörüne ait:
F=56.25/0.35333
bulunmuştur. Burada hem A, hem B faktörünün, hem de interaksiyonun
127
serbestlik dereceleri 1’dir. Hata SD ise 12’dir. O halde bunlara ait F oranlarının
önemliliğinin kontrolu için, 1’e 12 SD’li F tablosu değerlerine (Ek Tablo 4)
bakılacaktır. Tabloya göte %5 olasılık için F=4.75, %1 olasılık için F=9.33,
%0.1 için F=18.64’tür. A’ya ait F oranı bunların üçünden de büyük olduğuna
göre, A gübresi %99.9’un çok üzerinde bir güven düzeyinde verime etkili
olmuştur. B gübresine ait F, %5’lik tablo değerinden bile küçük olduğuna göre,
B gübresi etkili değildir. Đnteraksiyona ait F ise, %1’lik tablo değerinden
büyük, %0.1’lik tablo değerinden küçük olduğundan, %99 güven düzeyinde
önemlidir. O halde bu iki gübrenin etkisi birbirine bağlıdır. Bu bitkiden en iyi
ürünü alabilmek için her iki gübre birlikte verilmelidir. Bu durumda A
faktörüne bağlı hipotez reddedilecek, B faktörüne bağlı hipotez kabul edilecek,
interaksiyona ait hipotez ise reddedilecektir.
12.2.3.2.Ortalamaların Mukayesesi
Faktöriyel denemelerde, faktörlere ve interaksiyonlara ait çeşitli
ortalamalar vardır. Bunların mukayeseleri de, sd veya s X üzerinden, Madde
10.4’te açıklananlardan istenen bir metoda göre yapılabilir. Burada gerek faktör
ortalamaları, gerekse interaksiyon ortalamaları için:
sX =
Hata KO
Ortalamaya esas gözlem adedi
(12.1)
formülü üzerinden hesaplanır.
A faktörü ortalamaları için s X ’in hesabı:
A faktörünün 2 seviyesi olduğuna göre, buna ait 2 ortalama var demektir.
Tablo 12.3’e bakılacak olursa, her bir A halinin 8 gözlemden meydana geldiği
görülür. Bunların toplamı da 84 ve 114’tür. Öyleyse A hallerine ait ortalamalar
8’er gözlem üzerinden hesaplanmaktadır. 2 faktörlü bir denemede A halleri
için,
Ortalamaya esas gözlem adedi=tekrarlama adedi×B faktörü seviyesi
dir. Hata KO ise her zaman olduğu gibi varyans analizi tablosundan alınır. Bu
durumda,
sX =
0.35333
=0.21016
8
olarak hesaplanır. Bilindiği gibi sd = s X
ortalamalar:
84/8=10.5 ve 114/8=14.25
128
2 olarak hesaplanır. A hallerine ait
olduğuna göre bunlar arasındaki farkın önemi 10.4 nolu Maddede açıklanan
metotlardan birine göre kontrol edilebilir.
Ancak, 2 ortalamanın mevcut olduğu hallerde, varyans analizindeki
sonuç zaten bu iki ortalamanın arasındaki farkın önemi ile aynı anlama
geldiğinden, ayrıca ortalamaların mukayesesine gerek yoktur. Varyans
analizine göre A işlemi %99.9 önemli olduğuna göre, 14.25 kg ortalamaya
sahip a1 hali ile 10.5 kg ortalamaya sahip a0 hali arasındaki 14.25-10.5=3.75
kg’lık fark (yani A faktörünün esas etkisi) bu seviyede önemli demektir.
B faktörü ortalamaları için s X ’in hesabı:
Đki faktörlü denemelerde B faktörü ortalamaları için,
Ortalamaya esas gözlem adedi=Tekrarlama adedi×A faktörü seviyesi
olarak hesaplanır. Burada bu değer yine 4×2=8 olduğu için B faktörü
ortalamalarına ait s X yine 0.21016 olur. Yine 2 ortalama olduğundan ayrıca
mukayeseye gerek yoktur. Ayrıca B faktörü halleri varyans analizine göre
zaten önemli olmamıştır.
Đnteraksiyon ortalamaları için s X ’in hesabı:
Đki faktörlü bir denemede,
Đnteraksiyon ortalamalarına ait gözlem adedi=Tekrarlama sayısı
olmaktadır. Tablo 12.3’te görüleceği üzere 4 interaksiyon ortalaması vardır ve
bunlar 4’er tekrarlamanın ortalaması olarak hesaplanır. O halde,
sX =
0.35333
=0.29721
4
hesaplanır. Bu değer üzerinden, istenen metodlardan biri kullanılarak 11. 10,
13.5 ve 15 olarak elde edilmiş interaksiyon ortalamaları birbirleriyle mukayese
edilebilir. Sonuca göre en etkili işlem kombinasyonu seçilir.
Faktöriyel denemelerde interaksiyonlar önemli bulunduğunda, esas
etkilerin önemli olup olmadığı bir anlam taşımaz. Bu bakımdan böyle hallerde
interaksiyon üzerinde durulmalıdır.
12.2.3.3.Faktöriyel Denemelerde Hipotezlerin Kontrollarına
Ait Bazı Açıklamalar
Faktöriyel denemelerde faktörlerin ancak sınırlı sayıda hali (seviyesi)
denenebilir. Bu haller, mümkün olan bütün haller arasından rastgele seçilmiş
olabileceği gibi, sadece belli hallerin etkilerini görmek maksadıyla özel olarak
seçilmiş de olabilir. Mesela yeni geliştirilen bir mineral gübrenin rastgele
seçilen birkaç bitkide denenmesi veya yeni bulunan bir kavak klonunun
129
rastgele seçilen birkaç yörede denenmesinde ilk durum; buna karşılık aynı
gübrenin özel olarak seçilen birkaç bitkide veya aynı klonun belli birkaç yörede
denenmesinde ise ikinci durum söz konusudur. Özel seçilme durumunda
faktörlerin seviyeleri denemeci tarafından belirlenir. Faktör hallerinin rastgele
veya özel olması durumunda hükümler de değişik olur. Halleri rastgele
seçilmiş bir faktörün tümü hakkında hüküm verilir. Mesela yeni geliştirilen
mineral gübre “Bitkilerde büyümeye etkilidir.” veya yeni bulunan klon “Ülke
çapında başarılıdır.” denir. Özel seçilmiş hallerde ise sadece denenen haller
üzerinde konuşulur. Mesela “Söz konusu gübre denenen bitkilerde etkilidir.”
veya “Söz konusu klon denenen yörelerde başarılıdır.” denir. Faktörlerin
hallerinin rastgele veya özel olmasına göre varyans analizinde F kontrolu da
farklı şekillerde yapılır:
• Faktörlerin halleri ne olursa olsun, interaksiyon kontrolunda bölen
olarak hata KO kullanılır.
• Faktörlerin halleri rastgele seçilmişse, faktörlerin esas etkilerinin
kontrolunda bölen olarak interaksiyon KO kullanılır.
• Faktörlerin halleri özel seçilmişse, esas etkilerin kontrolunda bölen
olarak hata KO kullanılır.
Faktörlerden birinin halleri rastgele, diğeri özel seçilmiş de olabilir.
Böyle karışık hallerde ise:
• A halleri özel B halleri rastgele ise, A’nın kontrolunda bölen olarak
hata KO, B’nin kontrolunda bölen olarak interaksiyon KO kullanılır.
• A halleri rastgele B halleri özel ise, A’nın kontrolunda bölen olarak
interaksiyon KO, B’nin kontrolunda bölen olarak hata KO kullanılır.
Açıklanan bu durum, 2 faktörlü denemelere mahsustur. Faktör sayısı
arttıkça daha değişik ve karışık haller ortaya çıkmakta, buna göre de F
hesabında bölenler değişebilmektedir. Ancak denemelerde faktörlerin halleri
genellikle denemeci tarafından özel olarak seçildiğinden, bütün kontrollarda
hata KO bölen olarak kullanılmaktadır.
Bazı istatistik kitaplarında özel haller, sabit model veya Model I,
tesadüfi haller ise tesadüfi model veya Model II olarak anılmaktadır.
12.3.Tesadüf Bloklarında Faktöriyel Deneme ve Analizi
Tesadüf bloklarında 2 faktörlü bir denemenin kurulması ve analizi
aşağıda bir misal üzerinden açıklanmıştır.
12.3.1.Denemenin Kurulması
Misal 12.2: 4 okaliptus türü, 3 farklı arazi hazırlığı şartlarında boy
büyümeleri yönünden karşılaştırılmak istendiğinde, araştırmacı yine 2 faktörlü
bir deneme kurmak durumundadır. Faktörlerden biri tür, diğeri arazi
130
hazırlığıdır. 1. faktörün a1, a2, a3 ve a4 olmak üzere 4 seviyesi, 2. faktörün ise
b1, b2 ve b3 olmak üzere 3 seviyesi vardır. A hallerinin her biri, B hallerinin her
biri ile:
a 1b 1, a 1b 2, a 1b 3
a 2b 1, a 2b 2, a 2b 3
a 3b 1, a 3b 2, a 3b 3
a 4b 1, a 4b 2, a 4b 3
olmak üzere 4×3=12 işlem kombinasyonu oluşturur. Demek ki bu bir 4×3
denemesidir. Mütecanis bir arazi bulunamadığından, deneme tesadüf
bloklarında tesis edileceğine göre, her blok 12 parsele bölünecek ve 12
kombinasyon blok üzerine rastgele dağıtılacaktır. Böyle bir blokun şeması
Şekil 12.3’te gösterilmiştir.
a2b1
a1b1
a3b2
a4b2
a4b3
a3b3
a3b1
a4b1
a2b3
a2b2
a1b2
a1b3
Şekil 12.3: 4×3 faktöriyel denemede işlemlerin bir blok üzerinde dağılışı
Denemenin 3 bloklu olarak kurulmasına karar verilmiştir. Bu durumda
diğer bloklara da 12’şer işlem kombinasyonu rastgele dağıtılır.
Bu denemede hipotezler:
• Denenen türler arasında boylanma bakımından fark olmadığı,
• Boylanmaya etki yönünden denenen arazi hazırlıkları arasında fark
olmadığı,
• Denenen türlerin, denenen arazi hazırlıklarına göre boylanmalarında
farklılık olmadığı
şeklindedir.
Burada gerek türler, gerekse arazi hazırlıkları denemeci tarafından özel
seçilmiştir. Böyle bir deneme homojen kültür-bakım teknikleri ile 4 sene
yürütülmüş ve 4. senenin sonunda parsellerdeki ağaçların boyları ölçülmüştür.
Bunların ortalamaları Tablo 12.5’te verilmiştir.
131
Tablo 12.5: 4 okaliptüs türünün 3 arazi hazırlığına göre
3 bloktaki boyları (m)
Arazi
Hazırlığı
b1
b2
b3
b1
b2
b3
b1
b2
b3
b1
b2
b3
Toplam
Türler
a1
a2
a3
a4
I
4.85
4.61
3.89
2.35
1.86
1.94
2.53
2.03
1.50
1.32
1.51
1.90
30.29
Bloklar
II
5.26
4.76
4.10
2.28
2.10
1.35
2.29
1.84
1.22
2.45
1.57
1.60
30.82
III
5.32
4.81
3.80
2.11
2.38
1.96
2.13
1.60
1.72
1.60
1.53
1.65
30.61
Interak.
15.43
14.18
11.79
6.74
6.34
5.25
6.95
5.47
4.44
5.37
4.61
5.15
91.72
Toplam
A
41.40
B
34.49
30.60
26.63
18.33
16.86
15.13
12.3.2.Faktöriyel Varyans Analizi
Varyans analizi için önce GKT, bloklar KT, işlemler KT ve hata KT
hesaplanacak, sonra işlemler KT, türler, arazi hazırlığı ve tür×arazi hazırlığı
interaksiyonuna parçalanacaktır. Đşlemler için gerekli toplamlar Tablo 12.5’te
verilmiştir.
Düzeltme terimi=C=91.722/36=233.6833
GKT=4.852+5.262+5.322+ . . . +1.652-C=56.6014
Bloklar AKT=
30.29 2 + 30.82 2 + 30.612
Đşlemler AKT=
12
-C=0.0119
15.432 + 14.182 + 11.79 2 + . . . + 5.152
3
-C=54.9497
Hata KT=Genel KT-(Bloklar KT+Đşlemler KT)=
=56.6014-(0.0119+54.9497)=1.6398
Türler AKT=
41.4 2 + 18.332 + 16.862 + 15.132
9
132
-C=51.1095
Arazi hazırlığı AKT=
34.49 2 + 30.62 + 26.632
12
-C=2.5742
Tür×arazi hazırlığı interaksiyonu KT=
=Đşlemler AKT-(Türler AKT+Arazi hazırlığı KT)=
=54.9497-(51.1095+2.5742)=1.2660
Serbestlik dereceleri:
Genel: 36-1=35
Bloklar: 3-1=2
Đşlemler: 12-1=11
Hata: 35-(2+11)=22
Türler: 4-1=3
Arazi hazırlığı: 3-1=2
Tür×arazi hazırlığı: 3×2=6
Analiz sonuçları, 12.6 nolu tabloda verilmiştir. F oranları ve bunlara ait
önemlilik kontrolları da aynı tabloda gösterilmiştir.
Tablo 12.6: 4×3 faktöriyel denemenin rastlantı bloklarında
varyans analizi
Varyasyon Kaynağı
Bloklar
Türler
Arazi hazırlığı
Tür×Arazi hazırlığı
Hata
Genel
KT
0.0119
51.1095
2.5742
1.2660
1.6398
56.6014
SD
2
3
2
6
22
35
KO
0.00595
10.03650
1.28710
0.21100
0.07454
F
0.08
228.56***
17.27***
2.83**
Faktöriyel varyans analizlerinde önemliliği ilk kontrol edilecek etkiler
interaksiyonlardır. Tablo 12.6’ya göre, interaksiyon vardır ve %95 güven
düzeyinde önemlidir. Bu durumda türlerin her arazi hazırlığında aynı boy
gelişmesini yapmadığı ortaya çıkmaktadır. O halde bu tür için yapılacak
tavsiyelerde, arazi hazırlığı faktörünü dikkate almak gerekir. Yani her tür için
ayrı bir arazi hazırlığı tavsiye etmek gerekebilir.
Hangi kombinasyonda en yüksek boyun elde edildiğini bulmak
maksadıyla bunların ortalamalarını mukayese etmek gerekir. Bu maksatla
hesaplanan interaksiyon ortalamaları Tablo 12.7’de verilmiştir.
133
Tablo 12.7: 4 okaliptüs türünün 3 tip arazi hazırlığındaki boyları
Türler
a1
a2
a3
a4
b1
5.14
2.25
2.32
1.79
Arazi hazırlıkları
b2
b3
4.73
3.93
2.11
1.75
1.82
1.48
1.54
1.72
Tablo 12.7’deki ortalamalar Şekil 12.4’te grafikle gösterilmiştir.
Şekilden anlaşılacağı üzere,
6
5
4
3
2
1
0
b1
b2
b3
a1
a2
a3
a4
Şekil 12.4: Misal 12.2’de açıklanan 4×3 denemesinde
interaksiyon grafiği
Şekilden anlaşılacağı üzere, b1 ile b2’nin durumu bütün türlerde yaklaşık
birbirine paralel seyretmektedir. O halde türlerle b1 ve b2 işlemleri arasında bir
etkileşim görünmemektedir. b3’ün durumu ise a1, a2 ve a3’te diğerlerine
benzemektedir. Đnteraksiyonu ortaya çıkaran yegane unsur, b3’ün a4’teki
etkisidir. Nitekim b3a3 kombinasyonu b2a3’ten düşük iken, b3a4 kombinasyonu
b2a4’ten yüksek bir boy arz etmiştir. Bu son durum olmasaydı, interaksiyon
önemsiz bulunacağından üzerinde durulmayacak, yalnız esas etkiler
incelenecekti. Yine de burada interaksiyonu ortaya çıkaran kombinasyon,
yüksek boy sağlayan, dolayısıyla tercih edilecek bir işlem değildir. Bu
bakımdan tavsiye edilenlerden biri olmayacaktır. Tavsiye edilenler, a1
klonunun b1, b2 ve b3 tipi arazi hazırlığı ile kombine olduğu haller olacaktır ki,
bunlar interaksiyon etkisinden değil, A faktörünün esas etkisinden
kaynaklanmaktadır.
Đnteraksiyon ortalamaları, mesela Duncan testi ile aşağıdaki gibi
mukayese edilebilir:
(12.1) nolu formüle göre,
sX =
0.07454
=0.15763
3
134
Hata SD=22 olduğuna göre, Ek Tablo 6’dan alınan %5 olasılıklı SSR
değerleri aşağıdaki gibidir:
2
2.93
3
3.08
4
3.17
5
3.24
6
3.29
7
3.32
8
3.35
9
3.37
10
3.39
11
3.41
12
3.42
(10.8) nolu formüle göre LSR değerleri ise aşağıdaki gibi hesaplanır:
2
0.46
3
0.49
4
0.50
5
0.51
6
0.52
7
0.52
8
0.53
9
0.53
10
0.53
11
0.54
12
0.54
Ortalamaları büyükten küçüğe sıralanışı ve Duncan’a göre %5
farklılaşmalar Tablo 12.8’de görülmektedir. 7. ortalama (a3b2=1.82) ile
kendinden sonraki diğerleri arasında önemli farklılık olmadığı için, bundan
sonraki farklar tabloya alınmamıştır.
Tablo 12.8: 12 ortalamanın Duncan’a göre mukayesesi
Đşlem
a1b1
a1b2
a1b3
a3b1
a2b1
a2b2
a3b2
a4b1
a2b3
a4b3
a4b2
a3b3
Ortalama
(m)
5.14
4.73
3.93
2.32
2.25
2.11
1.82
1.79
1.75
1.72
1.54
1.48
FARKLAR
0.41
1.21*
2.82*
2.89*
3.03*
3.32*
3.35*
3.39*
3.42*
3.60*
3.66*
0.80*
2.41*
2.48*
2.62*
2.91*
2.94*
2.98*
3.01*
3.19*
3.25*
1.61*
1.68*
1.82*
2.11*
2.14*
2.18*
2.21*
2.39*
2.45*
0.07
0.21
0.50
0.53*
0.57*
0.60*
0.78*
0.84*
0.14
0.43
0.46
0.50
0.53
0.71*
0.77*
0.29
0.32
0.36
0.39
0.57*
0.63*
0.03
0.07
0.10
0.20
0.34
Tablo 12.8’de farklılıkları * ile gösterilen ortalamalar, farksızlıklarına
(aynılıklarına veya gruplarına) göre çizgilerle Tablo 12.9’daki gibi
gösterilebilir.
Faktör ortalamalarını mukayese için ise:
Türler için s X =
0.07454
=0.09101
9
bulunur.
135
Tablo 12.9: Duncan’a göre %5 olasılıkla farksız ortalamalar
Đşlem
a1b1
a1b2
a1b3
a3b1
a2b1
a2b2
a3b2
a4b1
a2b3
a4b3
a4b2
a3b3
Ortalama (m)
5.14
4.73
3.93
2.32
2.25
2.11
1.82
1.79
1.75
1.72
1.54
1.48
Türler %99.9 güven düzeyinde farklı oldukları için, %99 güvenli SSR değerleri
ve LSR değerleri,
2
3.99
3
4.17
4
4.28
7
0.36
8
0.38
9
0.39
şeklindedir. Buna göre A faktörü ortalamaları ve farklılaşmalar aşağıdadır:
a1
a2
a3
a4
4.60
2.04
1.87
1.68
2.56**
2.73**
2.92**
0.19
Demek ki sadece 1 numaralı tür diğer türlerden faklı olmuştur. O halde
bu tür tercih edilmelidir.
Arazi hazırlıkları için ise,
sX =
0.07454
=0.07881
12
hesaplanır. Arazi hazırlıkları da türlerle aynı güven düzeyinde farklılaşma
gösterdiklerinden, yukarıdaki SSR değerleri kullanılarak LSR değerleri
hesaplanacak olursa:
2
0.31
3
0.33
bulunur. Buna göre B faktörü ortalamaları ve farklılaşmalar:
b1
b2
b3
2.87
2.55
2.22
0.32**
0.65**
0.33**
şeklindedir. Demek ki b1 işlemi b2 ve b3’ten, b2 işlemi de b3’ten %99 güven
düzeyinde farklı bulunmaktadır.
136
13. BÖLÜNMÜŞ PARSELLER DENEME TERTĐBĐ
13.1. Giriş
Faktöriyel denemeler, aşağıda açıklanan sebepler veya zorlamalar
yüzünden bazı hallerde bölünmüş parseller tarzında tertiplenirler. Bölünmüş
parseller tertipleri arazi denemelerinde yaygın olarak kullanılmaktadır.
13.2.Bölünmüş Parseller Tertibine Göre Denemenin
Kurulması
Bölünmüş parseller tertibine göre, iki faktörlü denemelerde
faktörlerden birine ait haller, tesadüf parselleri, tesadüf blokları veya latin
karesi metodlarına göre parsellere dağıtılır; sonra her parsel ikinci faktörün
halleri kadar bölünerek bu haller alt parsellere yine tam rastgele veya latin
karesi metoduna göre dağıtılır. Mesela A faktörü 4 seviyeli, B faktörü 3
seviyeli bir faktöriyel deneme bölünmüş parseller tertibinde ve rastlantı
bloklarında kurulacaksa, her blok önce A halleri kadar parsellere ayrılır.
Bunlara ana parseller denir. Ana parsellere, A faktörü halleri rastgele dağıtılır.
Sonra her ana parsel, B faktörü halleri kadar tekrar bölünür. Bunlara da alt
parseller denir. B faktörünün halleri de alt parsellere yine rastgele dağıtılır.
Böyle bir 4×3 denemesinin 3 blokta bu şekilde düzenlenmiş bir örneğine ait
deneme deseni Şekil 13.1'de gösterilmiştir. Deneme deseninin incelenmesiyle
görüleceği gibi, her ana parselde ikinci faktörün bütün seviyeleri yer
almaktadır.
Bu esasında 4×3=12 kombinasyonlu bir faktöriyel deneme olmasına
rağmen, işlemler (kombinasyonlar) blok içinde tam rastgele dağıtılmamıştır.
Böylelikle tesadüfîlikten kısmen uzaklaşılmıştır. Ayrıca, A halleri denemede 3
kere (blok sayısı kadar) tekrarlanmış iken, B halleri 4×3=12 kere tekrarlanmış
gibi bir durum vardır. Dolayısıyla A'nın tekrarı B'nin tekrarından eksiktir. A
hallerinin yer aldığı ana parseller, B hallerinin blokları gibidir.
Bölünmüş parsellerde diğer bir özellik blok etkilerinin A faktörü
seviyelerinin etkileriyle karışmış olmasıdır. Ancak sözü edilen bloklar, B
hallerinin yer aldığı ana parsellerden meydana gelen “sözde bloklar”dır.
Bölünmüş parseller 3 faktörlü de olabilir. Bu durumda B hallerinin her
biri, C halleri kadar tekrar bölünerek, C halleri alt-alt parsellere rastgele
dağıtılır. Böyle bir denemeye bölünen bölünmüş parseller deneme tertibi
denir.
137
A3
I. BLOK
B2
B1
A1
B3
B3
A1
II. BLOK
B1
B2
B2
B1
B1
B2
A4
B3
B3
A2
III. BLOK
B2
A2
B1
B3
B2
B3
B2
A2
B2
B2
A3
B3
B1
A4
B3
B2
B1
B1
A3
B1
B1
A4
B1
B3
B3
B2
A1
B3
B2
B3
B1
Şekil 13.1: 4×3 faktöriyel denemenin bölünmüş parsellerde düzenlenmesi.
13.3.Bölünmüş Parsellere Uygun Deneme Tipleri ve Tertibin
Özellikleri
Bölünmüş parseller tertipleri, aşağıda açıklanan özelliklerdeki
denemelere çok uygundur:
Denenecek faktörlerin etkilerinin karşılaştırılmasında aynı derecede
güven aranmıyorsa ve faktörlerden birinin etkileri üzerinde özellikle
duruluyorsa, bölünmüş parseller tercih edilmelidir. Mesela gübrelerin
çeşitlerinden çok, dozları üzerinde duruluyorsa, gübre çeşitleri ana parsellere,
dozlar ise alt parsellere uygulanır.
Faktörlerden biri, diğerine nazaran daha fazla deneme materyali, mesela
parsel alanı gerektiriyorsa yine bölünmüş parseller uygun olmaktadır. Mesela
arazi hazırlığı denemelerinde iş makinalarının küçük alanlarda çalışamaması
veya faktörün seviyesinin dikte ettirdiği çalışmayı yapamamaları gibi. Bazı
sulama, gübreleme, ilaçlama denemelerinde de durum aynıdır. Bunların
etkilerini küçük sahalar içinde zaptetmek zor, hatta imkansızdır. Đşlemlerin
komşu parselleri etkileme durumları söz konusudur. Böyle hallerde geniş alana
ihtiyaç duyan toprak işleme, sulama, gübreleme, ilaçlama vs gibi faktörü ana
parsellere, diğerini alt parsellere almak sorunu çözer.
Önceki tecrübelere göre faktörlerden birinin seviyeleri arasında, diğer
faktörün seviyelerine nazaran büyük farklar bekleniyorsa; yine bölünmüş
parseller tertibine başvurulabilir. Seviyeleri arasında büyük farklar beklenen
faktör ana parsellere, diğeri alt parsellere uygulanarak, ikinci faktörün
etkilerinin ortaya çıkması kolaylaştırılır. Mesela bir gübre ve ekim zamanı
denemesinde gübrenin etkisi bariz olarak biliniyorsa bu ana parsellere, ekim
zamanı alt parsellere tatbik edilir.
138
Çok
yıllık
bitkilerle
yürütülecek
denemelerde,
sonuçların
değerlendirilmesinde bölünmüş parseller tertibi çok yararlı sonuç vermektedir.
Denemede gerek aynı yılın değişik zamanlarında alınan ürün, gerekse takip
eden yıllarda alınan ürün alt parsellerde gösterilerek yapılacak analizlerle,
zamanın ürün miktarına etkileri saptanabilmektedir. Bu durumda zamanda
bölünmüş parseller söz konusu olmaktadır. Denemenin farklı yörelerde
yinelenmesi halinde ise mekanda bölünmüş parseller ortaya çıkar. Böyle
durumlarda esasen alt parsel yoktur. Deneme gerçekte tek faktörlü bir
denemedir.
Bölünmüş parseller tertibinde B ve A×B'nin etkileri, A faktörünün
etkisine nazaran daha büyük bir kesinlikle kontrol edilebilmektedir. Çünkü A
faktörü hallerinin karşılaştırılmasında kullanılan hata varyansının serbestlik
derecesi küçüktür. Ancak B ve A×B hallerinin kontrolundaki bu hassasiyet,
A'nın hassasiyetinden fedakarlık yapılmakla sağlanmaktadır. Bu yönüyle
bölünmüş parseller, alt parseller ve interaksiyondaki küçük farkları önemli
bulabildiği halde, ana parsellere uygulanan faktör halleri arasındaki büyük
farkları önemsiz sayabilir. Böyle durumlarda denemeci sonuçları rapor etmede
çekingen davranabilir.
Bu özellikler, bir bakıma bölünmüş parsellerin üstün ve zayıf yönleridir.
13.4.Tesadüf Bloklarında Bölünmüş Parsellerde Varyans
Analizi
Misal 13.1: 4 farklı sıklıkta 4 ayrı kavak klonunun çap gelişmesini
denemek maksadıyla bölünmüş parseller tertibine göre 4 bloklu (r=4) bir
deneme kurulmuştur. Bu maksatla her blok 4 ana parsele bölünmüş, bunlardan
rastgele her biri o sıklıkta dikime imkan verecek şekilde hazırlanmıştır. Her ana
parsel tekrar 4 alt parsele bölünerek bunların da rastgele her birine ayrı klon
dikilmiştir. Klonlar arası farkları daha etkili bir şekilde kontrol edebilmek için
bunlar alt parsellerde denenmiştir. Denemede gerek sıklıklar; gerekse klonlar
özel seçilmiştir. Đdare müddeti sonunda parsellerden elde edilen ortalama çaplar
Tablo 13.1'de verilmiştir.
Denemenin varyans analizi aşağıdaki şekilde yapılır:
Ana parsellerle ilgili hesaplamalar:
Düzeltme terimi = C =
2078.52
= 67502.535
64
GKT = 282+28.52+292+ . . .+28.52 - C = 1315.215
139
Ana parseller AKT=
1132 + 1082 + 1212 + . . . + 119.5 2
-C= 1075.903
4
Tablo 13.1: 4 sıklıkta 4 klonun bölünmüş parsellerdeki çap ölçüleri (cm)
Sıklık
Klon
B1
A1
B2
B3
B4
Toplam
B1
A2
B2
B3
B4
Toplam
B1
A3
B2
B3
B4
Toplam
B1
A4
B2
B3
B4
Toplam
Blok toplamı
I
28.0
28.0
31.5
25.5
113.0
33.5
38.0
35.0
36.0
142.5
37.5
37.5
34.0
38.0
147.0
36.0
30.5
32.0
30.5
129.0
531.5
Bloklar
II
III
28.5
28.0
26.0
27.0
25.0
30.0
28.5
35.0
108.0
121.0
34.0
34.0
32.0
32.5
31.5
32.0
30.0
30.5
127.5
129.0
35.0
36.0
33.0
33.0
36
33.0
32.5
33.5
135.5
136.5
40.0
40.5
35.5
38.5
32.0
38.5
38.5
38.0
146.0
155.5
517.0
542.0
IV
23.0
18.5
25.0
22.5
89.0
35.5
35.0
32.0
33.0
135.5
35.5
36.5
35.0
37.0
144.0
33.5
31.5
26.0
28.5
119.5
488.0
Toplam
108.5
99.5
111.5
111.5
431.0
137.0
137.5
130.5
129.5
534.5
144.0
140.0
138.0
141.0
563.0
150.0
136.0
128.5
135.5
550.0
2078.5
A×B interaksiyonu tablosu
Sıklıklar
A1
A2
A3
A4
Toplam
Bloklar AKT=
B1
108.5
137
144
150
539.5
Klonlar
B2
B3
111.5
99.5
130.5
137.5
140
138
136
128.5
513
508.5
B4
111.5
129.5
141
135.5
517.5
Toplam
431
534.5
563
550
2078.5
531.5 2 + 517 2 + 452 2 + 488 2
-C=103.043
16
Sıklıklar AKT =
4312 + 534.52 + 5632 + 550 2
-C=679.981
16
Hata1 KT=Ana parseller KT-(Bloklar AKT+Klonlar AKT)=
140
=1075.903-(103.043+679.981) = 292-879
Serbestlik dereceleri:
Genel SD = (A×B×r)-1=(4×4×4)-1=63
Bloklar SD = r-1==4-1= 3
Sıklıklar SD =A-1=4-1=3
Hata1 SD=Bloklar SD×Sıklıklar SD=(r-1)×(A-1)=(4-1)×(4-1)=9
Alt parsellerle ilgili hesaplamalar:
Klonlar AKT=
Sıklık×Klon KT=
539.5 2 + 5132 + 508.52 + 517.52
-C=35.449
16
108.52 + 99.52 + 111.52 + . . . + 135.52
-(Sık.KT+Klon KT+C)=
16
=68285.563-(679.981+35.449+67502.535)=67.598
Hata2 KT=Genel KT-(Ana parseller AKT+Klonlar AKT+Đnteraksiyon KT)=
=1315.215-(1075.903+35.449+67.598) =136.265
Serbestlik dereceleri:
Klonlar SD = B-1=4-1=3
Đnteraksiyon SD = Sıklıklar SD×Klonlar SD =
= (A-1)×(B-1)=(4-1)×(4-1) = 9
Hata2 SD = A×(r-1)×(B-1 ) = 4×3×3=36 veya
Hata2 SD=Genel SD-(Bloklar SD+Sıklık SD+hata1 SD+klon. SD+inter. SD)=
= 63-(3+3+9+3+9)= 36
Varyans analizi sonuçları Tablo 13.2'de özetlenmiştir.
Tablo 13.2: 4×4 bölünmüş parseller tertibindeki denemenin varyans analizi
sonuçları
Varyasyon kaynağı
Bloklar
Sıklıklar
Hata1
Klonlar
Sıklık×Klon
Hata2
Genel
KT
103.043
679.981
292.879
SD
3
3
9
KO
34.3477
226.6603
32.5421
F
1.06
6.97*
35.449
67.598
136.265
1315.215
3
9
36
63
11.8163
7.5109
3.7851
3.12*
1.98
141
Burada sıklıkların (A faktörünün) önemliliğinin kontrolunda bölen
olarak Hata1 kullanılır. Bu durumda sıklıklara ait:
F =226.6603/32.5421= 6.97
bulunur. Bu değer 3’e 9 serbestlik dereceli F tablo değerinden (F0.05=3.86)
büyük olduğuna göre sıklıkların %95 güvenle farklı olduğuna veya sıklıkların
çap artımına bu düzeyde etkili olduğuna karar verilir.
Klonların (B faktörünün) önemliliğinin kontrolunda ise bölen olarak
Hata2 kullanılır. Klonlara ait değer de:
F= 11.8163/3.7851=3.12
hesaplanır. Bunun için ise 3’e 36 serbestlik dereceli F tablo değerine
(F0.05=2.92) bakılır (Tablodan 3'e 30 SD'1i değer alınmıştır). O halde klonlar da
%95 güven düzeyinde,farklıdır.
Đnteraksiyon için ise:
F=7.5109/3.7851=1.98
hesaplanır. Bu değer 9'a 36 serbestlik dereceli F tablo değerinden (F0.05= 2.21)
küçük olduğuna göre interaksiyon önemsiz bulunmuştur. Buradan, sıklıkların
klonlara göre çap artımına farklı etki yapmadıkları sonucu çıkmaktadır.
13.5.Bölünmüş Parsellerde s X 'in Hesabı
Bölünmüş parsellerde
sX ,
ortalamaların ait olduğu işlemin F
kontrolunda kullanılan Hata KO üzerinden hesaplanır. Buna göre A faktörü
ortalamaları için,
sX =
Hata1KO
r×B
(13.1)
formülüne göre; B faktörü için,
sX =
Hata2 KO
r× A
formülüne göre ve A×B interaksiyonu ortalamaları için:
142
(13.2)
sX =
Hata2 KO
r
(13.3)
formülüne göre hesaplanır. Bunlar misale uygulanacak olursa:
A faktörü ortalamalarına ait s X =
32.5421
=1.426
4× 4
B faktörü ortalamalarına ait s X =
3.7851
=0.486
4× 4
A×B interaksiyonu ortalamalarına ait s X =
3.7851
=0.973
4
bulunur. Buna göre doğrudan s X üzerinden veya bundan hesaplanacak s d
üzerinden ortalamalar istenen bir metoda göre mukayese edilebilir.
Yukarıdaki formüller, varyans analizindeki F kontroluna paralel olarak,
A ve B'ye ait hallerin özel seçilmiş olmasına göredir.
143
l4. KORELASYON VE REGRESYON
14.1.Giriş
Bu bölümde, sayılarla ifade edilebilen iki (veya daha fazla) özellik (olay,
olgu) arasında bir ilişki (ilgi, bağıntı) olup olmadığı, varsa bunun büyüklüğü,
yönü ve aritmetik bir formülle ifadesi üzerinde durulacaktır. Ancak ikiden fazla
özellik arasındaki ilişki denilince bunların birbiri ile ilgisi değil, birkaçı ile
diğer bir tekinin bağıntısı anlaşılmalıdır. Đlişkinin büyüklüğü bağıntının
gücünü, yönü ise olayın biri (veya birkaçı) artarken diğerinin de arttığını veya
azaldığını ifade eder. Mesela bir ağacın çapı kalınlaştıkça boyu da uzar veya
yaşı arttıkça boyu uzar. Aynı şekilde yaşı arttıkça çapı da kalınlaşır. O halde
ağaçlarda çap ile boy, yaş ile boy veya yaş ile çap arasında ilişki vardır. Bu
şekilde ikili özellikler birlikte değişim gösterebileceği gibi, yalnız bir tanesi
diğerine bağlı, diğerinin sonucu olarak da ortaya çıkabilir. Mesela bir ağacın
çapı, boyuna veya boyu, çapına bağlı olarak gelişir. Böyle bir durumda her iki
olgu da bir diğerinin sebebi veya sonucu olarak ele alınabilir. Yaş ile boy (veya
yaş i1e çap) arasında ise, sadece boyun (veya çapın) yaşa göre ortaya çıktığı,
yani boyun (veya çapın) yaşa bağlı olarak geliştiği bir ilişki söz konusudur.
Yaşın, ağacın boyuna göre oluştuğu anlamsızdır.
Gerek korelasyon, gerekse regresyon bu tür ilişkilerin varlığının,
büyüklüğünün ve yönünün sayısal bir ifadesidir. Ancak korelasyon çap-boy
misalinde olduğu gibi ilişkinin, yani özelliklerin beraber değişmesinin sayısal
bir ölçüsü, regresyon ise özelliklerden birinin diğerine bağlı olarak
değişmesinin ve bu değişimin seyrinin aritmetik fonksiyon olarak ifadesidir.
Bununla birlikte gerek her iki özelliğin birbirinin sebebi veya sonucu oluşu
durumunda, gerekse yalnız birinin diğerine bağlı olarak ortaya çıktığı durumda,
hem korelasyon hem de regresyonla ilgili hesaplamalar yapılabilir.
Biyolojik olaylarda sıkça raslanan bu tür durumlarda, aralarında ilişki
aranan özelliklere değişken (varyabl) denir. Bu değişkenlerden, diğerine (veya
diğerlerine) bağlı olarak ortaya çıkana (veya çıktığı kabul edilene bağlı
değişken denir ve matematikten hatırlanacağı üzere Y ile gösterilir. Bağımsız
olarak gelişme gösteren ve X ile gösterilen ise serbest değişken (bağımsız
değişken) olarak adlandırılır.
Bu açıklamalardan anlaşılacağı üzere, korelasyon ve regresyona konu
olan olaylarda, bir bağlı değişkenle birden fazla serbest değişken arasındaki
ilişkiler de söz konusu olabilmektedir. Mesela bir ağacın hacmının; çapına ve
boyuna göre değişimi gibi. Bu gibi durumlarda çoğul korelasyon ve çoğul
144
regresyon'dan söz edilir.
Bu bölümde önce iki değişken arasındaki ilişkiye ait basit korelasyon ve
regresyon açıklanacak, daha sonra eğrisel ve çoğul regresyonlar incelenecektir.
14.2.Basit Korelasyon ve Regresyon
14.2.1.Basit Korelasyon
Yukarıda kısaca açıklanan korelasyon, korelasyon katsayısı denilen, -1
ile +1 arasında değişen ve r ile gösterilen bir sayı ile ifade edilir. Basit
korelasyon katsayısı ile iki değişken arasında belirgin (önemli, signifikant) bir
ilişki olup olmadığı, varsa büyüklüğü ve yönü anlaşılabilir.
14.2.1.1.Korelasyon Katsayısının Hesabı
X ve Y gibi iki karakter arasındaki ilişkiye ait korelasyon katsayısı:
r=
Σxy
Σx 2 × Σy 2
(14.1)
formülü ile hesaplanır. Burada Σxy çarpımlar toplamı olarak adlandırılır ve;
Σxy=ΣXY-
ΣX × ΣY
n
(14.2)
formülü ile hesaplanır. Formülden anlaşılacağı üzere çarpımlar toplamı, X ve Y
varyantlarının çarpımlarının toplamından, bunların toplamlarının çarpımının
varyant çifti sayısına (n) bölümünü çıkarmakla hesaplanmaktadır. Korelasyon
ve regresyon hesabında n, X ve Y değişken çifti sayısıdır.
(14.1) nolu formülde görülen Σx2 ve Σy2 terimleri, önceki konulardan
hatırlanacağı üzere X ve Y değişkenlerine ait kareler toplamlarıdır.
Misal 14.1: Bir ağacın çapı ile boyu arasındaki ilişkiye ait korelasyon
katsayısını hesaplayalım:
Bir meşcerede yapılan örnekleme ile ölçülen 15 adet ağacın çap ve
boyları Tablo 14.1'de verilmiştir. Misalde çaplar X, boylar Y olarak dikkate
alınmıştır. Tabloda ayrıca, çarpımlar ve kareler toplamları için gerekli hesaplar
da yapılarak ilgili sütunlarda gösterilmiştir.
145
Tablo 14.1. Bir meşcerede rastgele örneklenen 15 ağacın çap-boy ölçüleri
Sıra
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
B
Çap (X)
cm
4.5
8.1
11.1
8.8
13.1
7.5
6.7
9.2
5.4
6.2
9.5
7
10.2
4.9
11.8
124
Boy (Y)
m
7.9
11.5
14.5
12.5
15
10.5
10
13.5
9.8
10
13.5
11
13
8.4
14.3
175.4
X×Y
35.55
93.15
160.95
110
196.5
78.75
67
124.2
52.92
62
128.25
77
132.6
41.16
168.74
1528.77
X2
20.25
65.61
123.21
77.44
171.61
56.25
44.89
84.64
29.16
38.44
90.25
49
104.04
24.01
139.24
1118.04
Y2
62.41
132.25
210.25
156.25
225
110.25
100
182.25
96.04
100
182.25
121
169
70.56
204.49
2122
ΣXY=1528.77, ΣX=124, ΣY=175.4 olduğuna göre (14.2) nolu formüle
göre çarpımlar toplamı:
Σxy= 1528.77-
124 × 175.4
=78.797
15
ΣX2=1118.04, ΣX= 124 olduğuna göre X’lere ait kareler toplamı:
Σx2=1118.04-
124 2
=92.973
15
ΣY2=2122, ΣY= 175.4 olduğuna göre Y’lere ait kareler toplamı:
Σy2=2122-
175.4 2
=70.989 bulunur.
15
Buradan (14.1) nolu formüle göre korelasyon katsayısı:
r=
78.797
=0.97 hesaplanır.
92.973 × 70.989
146
14.2.1.2.Korelasyon Katsayısının Standart Hatası,
Önemliliğinin Kontrolu ve Güven Sınırları
Nümuneden hesaplanan her değer gibi, r de bir istatistiktir ve bir standart
hatası vardır. r'nin standart hatası,
sr=
1− r2
n−2
(14.3)
formülüne göre hesaplanır. Basit korelasyon katsayısının serbestlik derecesi n2'dir. r'nin hesabında X ve Y gibi iki karaktere ait ortalamalar kullanıldığından,
gözlem çifti sayısı n'den 2 düşülmektedir.
Yukarıdaki misalde bulunan r=0.97'nin standart hatası hesaplanacak
olursa:
sr=
1 − 0.97 2
=0.0674
15 − 2
bulunur. O halde örneğin korelasyon katsayısı r=0.97±0.0674 olarak
verilmelidir.
Diğer standart hatalarda olduğu gibi sr de r'nin önemliliğinin kontrolunda
kullanılır: Bu kontrol bir bakıma r'ye ait hipotezin kontroludur. Burada sıfır
hipotezi “X ve Y gibi iki karakter arasında (yani çap ile boy arasında) ilişki
olmadığı” veya “r'nin sıfır olduğu” şeklindedir. Kontrol sonunda bu hipotez
kabul veya reddedilir. Söz konusu kontrol, aşağıdaki formüllere göre
hesaplanan t istatistiği üzerinden yapılır:
t=
r
sr
veya
t=
r n−2
1− r2
(14.4)
Bu formüllere göre hesaplanan değer, n-2 serbestlik dereceli t tablosu
değerleri (Ek Tablo 2) ile karşılaştırılarak r'nin önemliliğine karar verilir.
Misal 14.1'de 0.97 olarak hesaplanan r'ye ait t değeri hesaplanacak
olursa:
t=0.97/0.0674=14.392
bulunur. 15-2=13 serbestlik dereceli tablo değerleri t0.05=2.16, t0.01=3.012 ve
t0.001=4.221'dir. Hesaplanan değer, 0.001 olasılık için verilenden bile fazlasıyla
büyük olduğuna göre, sıfır hipotezi reddedilerek X ve Y karakterleri arasında
(bu misale göre ağaçların çapları ile boyları veya boyları ile çapları arasında)
0.001 olasılığın çok üzerinde bir ilişki olduğu sonucuna varılır.
147
r'nin önemliliğinin kontrolunda, Ek Tablo 7'de verilen özel değerler de
kullanılabilir. Bu tabloda r'nin SD'ne göre, 0.05 ve 0.01 olasılık için, 4
bağımsız değişkene göre sınır değerler verilmiştir. Serbestlik derecesine göre
bu tablo değerlerini aşan r değerleri. o olasılıkta önemli sayılır. Basit
korelasyonda r bir bağımsız değişken üzerinden hesapladığı için, bu tabloya
göre, 13 serbestlik dereceli bir r değerinin 0.514'ten büyük olması halinde 0.05
olasılıkta, 0.641'den büyük olması halinde ise 0.01 olasılıkta önemli olduğu
kabul edilir. Misalde r=0.97 hesaplandığına göre, yukarıdaki sonuca paralel
olarak bu değerin 0.01'in çok üzerinde önemli olduğu ortaya çıkar.
sr üzerinden r'nin güven sınırları da hesaplanabilir. Misal 14.1'de
hesaplanan r’nin güven sınırları %99 güvenle:
r-(t×sr)<r<r+(t×sr)
0.97-(3.012×0.0674)<r<0.97+(3.012×0.0674)
0.767<r<1.173 olarak verilir.
14.2.1.3.Korelasyon Katsayısının Özellikleri
Korelasyon katsayısı birimi olmayan soyut bir sayıdır. Çünkü
hesaplanmada, ölçü birimleri farklı olabilen X ve Y gibi iki karakterin çarpımı
kullanılır.
Korelasyon katsayısının işareti - veya + olabilir. Regresyon konusunda
etraflıca açıklanacağı üzere, X ve Y değerleri bir koordinat sistemine
noktalandığında, X değerleri büyüdüğünde Y değerleri de büyüyorsa r'nin
işareti + (pozitif), küçülüyorsa - (negatif) olur. Bu bakımdan, ilk halde pozitif
korelasyon, ikinci halde ise negatif korelasyondan bahsedilir (Şekil 14.1).
Yukarıdaki misalde r’nin işareti + olduğuna göre, çap ile boy arasında pozitif
bir korelasyon vardır.
Korelasyon katsayısı daima -1 ile +1 arasında bir değer alır. X ve Y
değerleri bir koordinat sistemine aktarıldığında, ortaya çıkan noktaların tamamı
yükselen bir doğru üzerinde yer alırsa (Şekil 1.4.5) r=l, alçalan bir doğru
üzerinde yer alırsa r=-1 olur. Böyle hallerde karakterler arasında tam bir ilişki
var demektir (Matematik ilişki). Noktaların X eksenine paralel bir doğru
üzerinde yer almaları halinde ise r=0 olur (Şekil 14.1). Noktaların doğrudan
sapmaları (doğru üzerinde yer almamaları) halinde r, mutlak değer itibariyle
1'den küçük değerler alır. Sapmalar ne kadar fazlaysa, r de sıfıra o kadar
yaklaşır. Noktaların her hangi bir diziliş meydana getirmeyerek, koordinat
sisteminde bir daire oluşturacak şekilde rastgele serpilmeleri veya X eksenine
paralel bir doğru oluşturacak şekilde dizilmeleri halinde ise r sıfıra yakın bir
değer alır. Bu durumda, iki karakter arasında ilişki yok demektir. Konumuzu
teşkil eden biyolojik olaylarda, mutlak değer itibariyle r=1 olarak hesaplanan
bir ilişki bulunması imkansızdır.
148
r>0
r=0
r<0
4
3
2
1
0
0
1
2
3
4
5
6
Şekil 14.1: Korelasyon katsayısının pozitif, negatif ve sıfır olması halleri
14.2.2.Basit Doğrusal Regresyon
Đstatistikte regresyon, daha önce tanımlandığı gibi, biri diğerine (veya
diğerlerine) bağlı olarak gelişen ve sayılarla ifade edilebilen iki (veya daha
fazla) karakter (olay, özellik) arasındaki ilişkinin aritmetik fonksiyon olarak
ifadesidir. Mesela ağaçta yaş hacım ilişkisi gibi. Bir ağacın hacmı, yaşına bağlı
olarak artar ve bu artış yaşa bağlı bir fonksiyon olarak ifade edilebilir. Böyle iki
özellikten serbestçe değer alan karaktere (mesela yaş), serbest değişken veya
bağımsız değişken, buna bağlı olarak değer alan diğer değişkene (mesela
hacım) de bağlı değişken dendiğini ve serbest değişkenin adet olduğu üzere X,
bağlı değişkenin de Y ile gösterildiğini belirtmiştik. Hatırlanacağı üzere
matematikte böyle bir ilişki,
Y=a+bX
(14.5)
formülü ile gösterilebilir. Burada Y değişkeni X'in alacağı değerlere göre değer
alır. Mesela konu bir yaş-hacım ilişkisi ise bu eşitlik:
Hacım=a+b×(yaş)
anlamındadır. Formülde Y, X'in fonksiyonu olduğundan, bu eşitlikler
fonksiyon olarak da adlandırılır.
Đşte regresyon başlığı altında incelenecek konu, biyolojik olaylarda iki
veya daha fazla karakter arasındaki sebep-sonuç ilişkilerinin böyle bir eşitlik
halinde ifade edilmesi ve bu eşitliğin öneminin (geçerliliğinin) belirlenmesidir.
Regresyonlar serbest değişken sayılarına göre basit ve çoğul
regresyonlar olarak sınıflanabildiği gibi, koordinat sisteminde çizdikleri grafiğe
göre doğrusal ve eğrisel regresyonlar olarak da sınıflanabilir.
Basit doğrusal regresyon, regresyon eşitliklerinin en basiti olan ve
Y=a+bX denklemi ile ifade edilen halidir. Bu denklemin özellikleri aşağıda
açıklanmıştır.
149
14.2.2.1.Y=a+bX Denkleminin Özellikleri
Y=a+bX gibi bir eşitlikte, X değişkeninin eşit artışlarına karşılık, Y
değişkeni de eşit artışlar gösterir. Bu bakımdan bu eşitlik, bir doğru
denklemidir. Bilindiği gibi denklemler, bir koordinat sisteminde grafik olarak
gösterilebilir. Örnek olarak Y=2+2X denkleminde X'e:
0 verildiğinde Y=2+(2×0)=2,
1 verildiğinde Y=2+(2×1)=4,
2 verildiğinde Y=2+(2×2)=6,
3 verildiğinde Y=2+(2×3)=8 ... vs olmaktadır.
Demek ki X'teki 1 birimlik artış, Y'de 2 birimlik artışa sebep olmaktadır.
Bunlar Şekil 14.2'deki gibi bir koordinat sisteminde noktalanacak olursa, Y
eksenini 2 noktasında kesen ve belli bir eğimle yükselen bir doğru ortaya çıkar.
Burada doğrunun Y eksenini kestiği noktayı belirleyen a değerine (misalde
a=2’dir) konstant (sabite) denir. a değeri pozitif olduğu gibi, Y=-2X
eşitliğindeki gibi sıfır veya Y= -2+2X eşitliğindeki gibi negatif de olabilir
(Şekil.14.2).
14
12
10
8
6
4
2
0
-2
Y= -2+2X
Y=2X
Y=2+2X
0
1
2
3
4
5
6
Şekil 14.2: Regresyon doğrusunun Y eksenini farklı noktalarda kesmesi
(a'nın pozitif, sıfır ve negatif olması halleri)
Y=2+3X eşitliğinde ise X'teki 1'er birimlik artışa karşılık Y, 3'er birimlik
artış gösterir. Şekil 14.3'te görüleceği üzere, bu durumda daha dik (meyli daha
fazla) bir doğru ortaya çıkar. Y=2+X gibi bir eşitlik ise daha yatık bir doğru
belirler (Şekil 14.3). Denklemde X'in önünde yer alan, b ile gösterilen ve
doğrunun eğimini belirleyen bu katsayıya da regresyon katsayısı denir. b'nin
değeri de pozitif veya negatif olabilir. Pozitif olması halinde X'in artışına göre
yükselen bir doğru (pozitif meyil-pozitif ilişki), negatif olması halinde ise
alçalan bir doğru (negatif meyil-negatif ilişki) söz konusudur. Y=4 gibi
meylin sıfır olduğu (bu durumda b=0'dır) bir eşitlikte ise X eksenine paralel bir
doğru çizilir (Şekil 14.4).
150
a ve b katsayıları, Y değişkeni ile aynı ölçü birimine sahiptir.
Y=-2+X
Y=2+2X
Y=2+3X
20
15
Y=4-X
Y=4
Y=4+X
10
8
6
10
4
5
2
0
0
0
1
2
3
4
5
-2 0
6
1
Şekil 14.3: Regresyon
katsayısının büyüklüğüne göre
doğrunun eğimi
2
3
4
5
Şekil 14.4: Regresyon
katsayısının pozitif, negatif ve
sıfır olması hallaeri
14.2.2.2.Matematik Eşitlik ve Regresyon Eşitliği
Đki değişkene ait X ve Y değerlerinden oluşan veri çiftlerine ait noktalar
bir koordinat sistemine yerleştirildiğinde (serpilme diyagramı), noktalar düz
bir çizginin üzerinde yer alırsa, bu iki değişken arasında matematik eşitlik var
demektir. Mesela dairede çevre=π×çap şeklinde bir ilişki vardır. Tam ilişki
denilen bu tür ilişkilere ancak matematik, fizik olaylarda rastlanır. Biyolojik
olaylarda ise, genellikle noktaların bir doğru etrafında rastgele serpildiği
ilişkiler görülmektedir (Şekil 14.5).
Bunun sebebi, daha önce de açıklandığı gibi, biyolojik olayların sonsuz
sayıda faktörün etkisi altında gelişme göstermeleridir. Her ne kadar bu tür
olayların belli kanuniyetleri varsa da, çeşitli etkiler yüzünden seyirlerinde
sapmalar olmaktadır.
4
25
Matematik eşitlik
Regresyon eþitliði
20
15
3
2
10
1
5
0
0
0
1
2
3
4
5
0
2
4
6
8
Şekil 14.5: Matematik eşitlik ve regresyon eşitliğinde
noktaların doğruya uyumu
151
10
Đşte sonsuz sayıda etki altında gelişme gösteren iki tesadüf değişkeni
(değişkenlerden yalnız biri de tesadüf değişkeni olabilir) arasındaki ilginin belli
kurallara göre aritmetik bir denklem halinde hesaplanmış haline regresyon
eşitliği denir (Çap-boy örneğinde değişkenlerin her ikisi de tesadüf değişkeni,
yaş-boy örneğinde ise yalnız boy tesadüf değişkenidir). Tanımdan anlaşılacağı
gibi, regresyon eşitlikleri matematik bir tahmindir. Bu eşitliklerde, aritmetik
ilişkilerdeki %100 kesinlik yoktur.
Regresyon eşitlikleri vasıtasıyla, serbest değişken olarak ele alınan bir
(veya bir kaç) özelliğe göre, buna bağlı ortaya çıkan ikinci bir özellik belli
ihtimaller çerçevesinde sayısal olarak tahmin edilir. Regresyon eşitliğinde bir
hata payı vardır. Bu hata unsurunu, yukarıda sözü edilen sonsuz sayıda etki
oluşturur. Bunu belirtmek üzere, regresyon eşitliği aritmetik eşitlikten farklı
olarak Y=a+bX+ε veya Yˆ =a+bX şeklinde de ifade edilir.
Regresyon eşitliğinin hesabında en küçük kareler metodu
kullanılmaktadır. Bu metoda göre a ve b katsayıları hesaplanarak, gözlem
değerlerine en iyi uyan hat (doğru) bulunur. Çizilen doğrudan, X-Y
noktalarının düşey uzaklıklarının kareleri en küçük olduğu için metoda bu isim
verilmiştir (Şekil 14.7). Başka bir metoda göre bu noktalara regresyon
doğrusundan daha yakın bir doğru çizilemez.
14.2.2.3.Regresyon Eşitliğinin Hesabı
Regresyon eşitliği, regresyon katsayısının (b) ve a sabitesinin
hesaplanmasıyla bulunur. Bunlar,
b=
Σxy
Σx 2
(14.7)
a=
Σy
ΣX
-b×
n
n
(14.8)
formüllerine göre hesaplanır. Bilindiği gibi formüllerde:
Σxy=çarpımlar toplamı,
Σx2=X kareler toplamı,
ΣY/n=Y değerlerinin aritmetik ortalaması,
ΣX/n=X değerlerinin aritmetik ortalamasıdır.
b ve a'nın hesabını bir misal üzerinde açıklayalım:
Misal 14.2: Bir ağacın göğüs çapı-hacım ilişkisi belirlenmeye
çalışılmaktadır. Bu amaçla, göğüs çapları 10 cm'den kalın rastgele 17 ağacın
çapları ölçülmüş ve uygun bir yöntemle kabuklu gövde hacımları
152
hesaplanmıştır. Sonuçlar Tablo 14.3'de verilmiştir. Ayrıca hesaplamalar için
gerekli olan, varyantların çarpımları, kareleri ve bunların toplamları da tabloda
verilmiştir. Tabloda 1'den 17'ye kadar sıralı çaplar serbest değişıken (X), her
çapa ait hacımlar ise bağlı değişken (Y) olarak ele alınmıştır. Tablo
incelendiğinde hacmın çapa bağlı olarak sürekli artış gösterdiği, dolayısıyla iki
karakter arasında pozitif bir korelasyon olduğu açıkça görülmektedir. O halde
bu ilişki, bir regresyon denklemi halinde yazılabilir:
Tablo 14.3: 17 adet P. radiata ağacının göğüs çapı–hacım ölçüleri
Hacım (dm3)
Sıra Çap (X)
No
(cm)
1
10.2
2
11.7
3
12.5
4
13.1
5
14.1
6
14.8
7
15.5
8
16.2
9
16.3
10
17.8
11
18.7
12
19.7
13
20.6
14
21.1
15
22.1
16
22.6
17
23
Σ
290
Hacım (Y)
(dm3)
29
41
51
62
74
87
99
116
129
147
167
186
209
231
255
279
307
2469
X2
104.04
136.89
156.25
171.61
198.81
219.04
240.25
262.44
265.69
316.84
349.69
388.09
424.36
445.21
488.41
510.76
529
5207.38
Y2
X×Y
841
295.8
1681
479.7
2601
637.5
3844
812.2
5476 1043.4
7569 1287.6
9801 1534.5
13456 1879.2
16641 2102.7
21609 2616.6
27889 3122.9
34596 3664.2
43681 4305.4
53361 4874.1
65025 5635.5
77841 6305.4
94249 7061
480161 47657.7
350
300
250
200
150
100
50
0
9
12
15
18
Çap (cm)
21
24
Şekil 14.6: Tablo 14.3'deki verilere ait serpilme diyagramı ve
bunlardan geçen Y=a+bX doğrusu
153
Σxy= ΣXY-
Σx2=ΣX2-
ΣX × ΣY
290 × 2469
=47657.7=5539.47
n
17
(ΣX ) 2
290 2
=260.32
=5207.38n
17
b=
Σxy
=5539.47/260.32=21.28
Σx 2
a=
2469
290
-21.28×
=-217.8
17
17
hesaplanır. Demek ki bu örnekte çap-hacım ilişkisine ait regresyon denklemi:
Y=-217.8+21.28X
şeklinde hesaplanmıştır. Serpilme diyagramıyla beraber bunun bir koordinat
sisteminde çizilmiş hali Şekil 14.6'da gösterilmiştir.
Bu çizim, denklemde iki adet X'e karşılık hesaplanan Y değerlerinin bir
koordinat sistemine aktarılıp, elde edilen iki noktanın birleştirilmesiyle
kolaylıkla yapılabilir. Mesela regresyon eşitliğinde:
X yerine 10 koyulursa Y=-217.8+21.28×10= -5 dm3,
20 koyulursa Y=-217.8+21.28×20=207.8 dm3 bulunur.
Görüldüğü üzere, burada 10'dan küçük X değerleri için eksi değerler elde
edilmektedir. Teorik olarak böyle bir şeyin olamayacağı açıktır. Bu ağaçlar 10
cm'den ince ise, hacımları eksi olamaz. Bu durum hesaplanan eşitliğin
özelliğinden ileri gelmekte ve ilerki konularda değinileceği üzere çap-hacım
ilişkisini iyi temsil etmediğini göstermektedir.
b katsayısı doğrunun eğimi, yani X değerlerindeki 1 birimlik artışa
karşılık Y değerlerindeki artış olduğuna göre, doğrunun eğimi 21.28'dir. Bu
değer incelenen ağaçların her yı1 ortalama 21.28 dm3 hacım artımı yaptığı
anlamına gelir. a katsayısı ise -217.8 bulunmuştur. Demek ki regresyon
doğrusu Y eksenini -217.8 noktasında kesmektedir. Bu değer de, ağacın 0
çapındayken -217.8 dm3 hacmında olduğu anlamını taşır. Ancak yukarıda izah
edildiği üzere bu durum gerçeği yansıtmamaktadır.
Regresyon denklemi bilindikten sonra, istenen X değerine (burada çap)
karşı gelen Y değeri (burada hacım) hesaplanabilir. Mesela 23 cm çaptaki bir
ağacın hacmı:
Y=-217.8+21.28×23=271.6 dm3
bulunur. Halbuki örneklemede 23 cm çaptaki ağacın hacmı 307 dm3
ölçülmüştür. Böylelikle regresyon denklemi yoluyla hesaplanan değerlerin
birer tahmin olduğu ve bir hata payına sahip oldukları ortaya çıkmaktadır.
154
Regresyon denkleminden hesaplanan değerlere beklenen değer veya teorik
değer de denir. Bu değerler, bağlı değişkenle aynı ölçü birimine sahiptir.
Regresyon eşitliği üzerinden, gözlem değerlerinin dışına ait
ekstrapolasyon denen tahminlerde de bulunulabilir. Mesela bu ağaçların 30
cm çaptaki hacmı Y=-217.8+21.28×30=420.6 dm3 olarak tahmin edilebilir.
Ancak ekstrapolasyon işlemine fazla güvenilmemelidir. Çünkü regresyon
eşitliği, gözlemlenen X değerleri aralığı için geçerlidir. Bu sahadan
uzaklaşıldıkça ilişkinin nasıl bir seyir göstereceği bilinmemektedir. 10-23 cm
çaplar arasında burada olduğu gibi bir doğru parçası ile temsil edilebilen bir
çap-hacım ilişkisi, belki daha sonraki yıllarda eğrileşecektir. Bu durumda
ilişkinin başka bir formül (regresyon modeli) ile ifade edilmesi gerekebilir.
Esasen misalde gözlenen olayın bir doğru ile temsil edilebileceği de şüphelidir.
Eşitliğin 10 cm çapın altında eksi değerler vermesi ve grafikte noktaların
seyrinin bir doğrudan çok eğriyi andırması bu şüpheleri doğrulamaktadır. Bu
bakımdan ekstrapolasyon yapılırken örneklenen serbest değişkenlerden fazla
uzaklaşılmamalıdır.
14.2.2.3.1.b ve a'nın Standart Hatası, Önemliliği ve Güven Sınırları
Bilindiği gibi basit doğrusal regresyon, b ve a katsayılarıyla ifade
edilmektedir. b ve a birer tahmindir ve hata payına sahiptir. Bir toplumdan n
adetli çok sayıda örnek alınsa ve b ile a katsayıları hesaplansa, bunlar
ortalamaları β ve α, varyansları ise σb2 ve σa2 olan birer normal dağılım
gösterir. σb2 ve σa2 örnekten hesaplanan sb2 ve sa2 üzerinden tahmin edilir. Bu
iki varyans arasında:
sb2
sa2
=
ΣX 2
(14.9)
n
şeklinde bir ilişki vardır. Bu ilişki hesapların doğruluğunu denetlemede
kullanılabilir. Varyansların kare kökleri ise standart hatalarını verir. b ve a'nın
standart hataları ve güven sınırları aşağıdaki gibi hesaplanabilir.
14.2.2.3.1.1. b Katsayısının Standart Hatası, Önemliliği ve Güven Sınırları
Regresyon katsayısının varyansı,
Σy −
2
2
sb =
( Σxy) 2
Σx 2
n−2
Σx 2
155
=
sd2
Σx 2
(14.10)
formülüne göre hesaplanır. Bu formülün payında yer alan, Σy 2
( Σxy ) 2
terimi,
Σx 2
14.2.2.4 maddesinde izah edileceği ve Tekil 14.7'den anlaşılacağı üzere
regresyondan ayrılışların kareleri toplamıdır (Σd2) Bu terim gözlenen Y
değerlerinin, regresyon doğrusundan uzaklıklarının kareleri toplamını ifade
eder. sd2 ile gösterilen regresyondan ayrılış kareleri ortalaması, başka bir
ifadeyle regresyonun varyansı ise, ayrılış kareleri toplamını kendi serbestlik
derecesi n-2'ye bölmekle bulunur. Misal 14.2'ye göre bu terimler aşağıdaki gibi
hesaplanır:
Σy2=480161-
2469 2
17
=121575.1
Madde 1.4.2.2.3'te Σxy=5539.47 ve Σx2=260.32 olarak hesaplandığına
ve (14.10) nolu formülün payına göre
1215751
. −
s d2=
5539.47 2
260.32 =246.54
17 − 2
sb2=246.54/260.32=0.9471 ve sb=0.973 dm3 bulunur. Demek ki bu
populasyondan çekilen 17 bireylik örnekler üzerinden hesaplanan basit
doğrusal regresyona ait her b katsayısı 0.973 dm3 hata payına. sahiptir.
Regresyon katsayısının önemliliği,
t=
b
sb
(14.11)
formülüyle hesaplanan t değerini, n-2 serbestlik dereceli t tablo değeri (Ek
Tablo 2) ile karşılaştırmakla kontrol edilir. Misal 14.2 için,
t=21.28/0.973=21.87
hesaplanır. t tablosuna bakılacak olursa, 17-2=15 SD'li t0.05=2.131, t0.01=2.947
ve t0.001=4.073 okunur. Hesaplanan değer bunların hepsinden de büyük
olduğuna göre, regresyon katsayısının %99.9’un üzerinde önemli olduğuna
veya başka bir ifadeyle çap ile hacım arasında %99.9 güven düzeyinde bir
ilişki olduğuna hükmedilir. Konu sıfır hipotezi üzerinden açıklanacak olursa,
“b=0” olduğuna dair hipotez reddedilerek, “b’nin %99.9 güven düzeyinde
sıfırdan farklı olduğu” söylenir.
156
Regresyon katsayısının güven sınırları ise,
b-(t×sb)<b<b+(t×sb)
formülü yardımıyla ve %99.9 güvenle,
21.28-(4.073×0.973)<b<21.28+(4.073×0.973)
17.32 dm3<b<25.24 dm3
hesaplanır.
14.2.2.3.1.2. a Katsayısının Standart Hatası ve Güven Sınırları
a katsayısının varyansı aşağıdaki formüle göre hesaplanabilir:
 ΣX 2 
sa = sd  nΣx 2 


2
2
(14.12)
Bunun kare kökü a'nın standart hatasını verir.
Madde 14.2.2.3.1.1'de sd2=246.54, Σx2=260.32 olarak bulunduğuna göre,
Tablo 14.3’ten ΣX2=5207.38 olarak alınıp, Misal 14.2'ye göre a’nın standart
hatası:
sa2=246.54
5207.38
=290.1 ve sa=17.03 bulunur.
17 × 260.32
Bu durumda
denetlenebilir:
sb2
sa2
=
ΣX 2
n
(l4.9)
nolu
formüle
göre,
hesapların
doğruluğu
290.1 5207.38
=
=306.3
0.9471
17
a katsayısının önemliliği de,
a
(14.13)
sa
formülüne göre hesaplanan n-2 SD'li t değeri üzerinden kontrol edilir. Yine
Misal 14.2 için, a katsayısına ait,
t=-217.8/17.03=12.79 bulunur.
t değerleri mutlak değer itibariyle dikkate alındığından ve bu değer 15
SD'li t'lerin hepsinden büyük olduğundan, “a'nın %99.9 üzerinde bir güvenle
0’dan ,farklı olduğu” söylenecektir.
t=
157
a'nın güven sınırları ise,
a-(t×sa)<a<a+(t×sa)
formülü yardımıyla ve %99.9 güvenle,
-217.8-(4.073×17.03)<b<-217.8+(4.073×17.03)
-287.2 dm3<a<-148.4 dm3
hesaplanır.
14.2.2.4.Regresyonda Varyans Analizi ve Regresyonun Varyans
Analizi ile Kontrolu
Y-a+bX denklemi ile ifade edilen basit doğrusal regresyonda, regresyon
katsayısı b’nin önemliliğini kontrol etmekle regresyonun önemliliği de kontrol
edilmiş olur. b ne derecede önemli ise, regresyon da o derecede önemli
demektir. Ancak ileride ele alınacak olan ve birden fazla serbest değişken
bulunduran hallerde durum farklıdır Bu gibi hallerde her serbest degişkene ait
bir regresyon katsayısı hesaplanır. Her ne kadar bütün regresyon katsayılarının
önemliliği, kendilerine ait standart hataları üzerinden t değerleri ile kontrol
edilebilirse de, bazı hallerde bunların sonucu dikkate alınmayabilir. Çünkü
regresyonun modeli (formül tipi) önceden bellidir ve araştırmacı, aradığı
ilişkiyi bu formülle ifade etmek durumundadır. Mesela yaşa göre ağaçların boy
büyümesi:
Y=a+b1X+b2X2+b3X3
şeklinde 3. derece polinomu denilen ve S eğrisi çizen bir eşitlikle ifade
edilmektedir. Burada hesaplanan ve b1, b2, b3 ile gösterilen regresyon
katsayılarının bazıları t kontroluna göre önemsiz görünebilir. Ancak önemsiz
diye dikkate alınmamaları ve atılmaları gerekmez. Đlişki mutlaka yukarıdaki
formülle ifade edilmelidir.
Regresyon modelinin bilinmediği hallerde ise, en uygun modeli bulmak
için bir çok model denemek lüzumu hasıl olabilir. Uygulanan bir modele göre
katsayılar yeteri kadar önemli çıkabilir. Ancak muhtemelen başka bir fonksiyon
tipi olayı çok daha iyi temsil edebilir. Mesela Misal 14.2'de doğru ile temsil
edilen ilişki, belki bir eğriye (bir parabol parçasına) çok daha iyi uyum
sağlayabilir. Đşte böyle durumlarda, teker teker regresyon katsayılarının
önemliliğinin yanında, tüm regresyonun önemliliğine de bakmak gerekir. Tüm
regresyonun önemi, ancak varyans analizi ile kontrol edilebilir.
Bir regresyon varyans analizinde genel kareler toplamı:
• regresyon kareleri toplamı ve
• regresyondan ayrılış (hata) kareleri toplamından oluşur.
Şekil 14.7'de görüleceği üzere regresyonda genel kareler toplamı, her
bir Y değerinin, Y değerleri ortalamasından ( Y ’dan) farklarının (y'lerin)
158
kareleri toplamıdır.
Regresyon kareleri toplamı, her X'e karşılık regresyon eşitliğinden
hesaplanan değerlerin ( Yˆ olarak gösterilen değerlerin), Y 'dan farklarının ( ŷ
ile gösterilen değerler) kareleri toplamıdır.
X,Y
Y
d
y
Y$
y$
X ,Y
Y
X
X
Şekil 14.7: Regresyona ait varyans analizinde varyasyon kaynakları
Regresyondan ayrılış kareleri toplamı ise, Y değerlerinin kendi
ile
gösterilen
izdüşümlerindeki
regresyon
değerlerinden
( Yˆ
değerlerden)farklarının (d ile gösterilen değerler) kareleri toplamıdır. Buna,
hata kareleri toplamı da denir. Regresyondan ayrılışlar, noktaların regresyon
doğrusuna düşey, uzaklıklarıdır. Bu bakımdan adından da anlaşıldığı gibi,
noktaların doğrudan sapmalarını, uzaklaşmalarını ifade eder. Sapmalar ne
kadar fazla ise ilişki o kadar zayıf (hatta yok), ne kadar az ise o kadar
kuvvetlidir. Noktaların tamamının doğru üzerinde yer almaları halinde ise daha
önce de belirtildiği gibi ilişki tamdır. Aşağıda varyans analizinde görüleceği
gibi, regresyondan ayrılışların küçük olması halinde, regresyona ait kareler
toplamı büyür. Bu durum, regresyonun (ilişkinin) önemliliğine delalet eder.
Örneğin Misal 14.2’de 23 cm çapta hacım Y=307 dm3 ölçülmüştür. O halde
(X=23, Y=307) noktasında varyasyon aşağıdaki gibidir:
Y =2469/17=145.2 olduğuna göre genel ortalamadan ayrılış,
y=Y- Y =307-145.2=161.8 dm3.
X=23 noktasındaki regresyon değeri Yˆ =-217.8+21.28×23=271.6
olduğuna göre regresyona ait unsur,
ŷ = Yˆ - Y =271.6-145.2=126.4 dm3.
Bu noktada regresyondan ayrılış ise,
159
d=Y- Yˆ =307-271.6=35.4 dm3
bulunur. Demek ki bu noktadaki 161.8 dm3'lük genel ayrılışın 126 dm3'ü
regresyona, 35.4 dm3’ü regresyondan ayrılışa ait olmaktadır. Burada arzu
edilen, regresyondan ayrılışların mümkün olduğu kadar küçük tutulmasıdır.
Regresyonda varyans analizine ait kareler toplamları, aşağıdaki
formüllere göre hesaplanır:
Genel KT=Σy2= ΣY2-
Regresyon KT=
(ΣY ) 2
n
(14.14)
(Σxy ) 2
Σx 2
(14.15)
Regresyondan ayrılış (hata) KT=Σd2=Genel KT-Regresyon KT
(14.6)
Hatırlanacağı üzere 14.2.2.3.1.1 Maddesinde regresyondan ayrılış
kareleri toplamına ilişkin özel formül de verilmiştir.
Varyasyon kaynaklarının serbestlik dereceleri ise:
genele ait: n-1
regresyona ait: 1
hataya ait: n-2’dir.
Varyans analizini Tablo 14.3'deki misale uygulayalım:
Daha önce Σy2=121575.1, Σxy=5539.47 ve Σx2=260.32 olarak
hesaplandığından,
regresyon KT=5539.472/260.32=117876.9
hata KT=121575.1-117876.9=3698.2
bulunur. Serbestlik dereceleri de:
genele ait: 17-1=16,
regresyona ait: 1,
hataya ait: 17-2=15'dir.
Buna göre regresyon varyans analizi Tablo 14.4'te özetlenmiştir.
Tablo 14.4: Regresyon varyans analizi
Varyasyon Kaynağı
Regresyon
Hata
Genel
KT
117876.9
3698.2
121575.1
SD
1
15
16
Regresyonun önemliliğinin kontrolu,
160
KO
117876.9
246.55
F
478.11***
F=
Re gresyon KO
Hata KO
(14.17)
üzerinden yapılır. Tabloda görüldüğü üzere F=478.11 hesaplanmıştır.
Regresyonun serbestlik derecesi 1, hatanın serbestlik derecesi 15 olduğuna
göre, 1 ve 15 SD'li F tablo değerlerine (Ek Tablo 4) bakılacak olursa,
F0.05=4.54, F0.01=8.68 ve F0.001=16.57 oldukları görülür. Hesaplanan değer
bunlardan fazlasıyla büyük olduğuna göre, regresyonun (çap-hacım ilişkisinin)
0.001 olasılıkla önemli olduğuna hükmedilir. Burada önemliliği kontrol edilen
hipotez “Regresyonun önemsiz olduğu” veya "Yaş ile boylanma arasında bir
ilişki bulunmadığı” şeklindedir. O halde hipotezi reddetmek gerekecektir.
Dikkat edileceği üzere, varyans analizi i1e bulunan sonuç, regresyon
katsayısının önemliliği ile aynı paralelde çıkmıştır.
14.2.2.5.Regresyonun Varyansı ve Standart Sapması
Daha önce belirtildiği gibi, bir populasyondan rastgele çekilmiş n
birimlik bir örnek üzerinden hesaplanmış regresyon denklemi bir ortalamadır.
Ölçülen değişkenlere ait değerler bir koordinat sistemine çizilmiş regresyon
doğrusu etrafında dağılırlar (Şekil 14.6). Bu dağılım, noktaların regresyon
doğrusundan X eksenine dik yöndeki uzaklıkları ile ölçülür (Şekil 14.7’de d ile
gösterilen fark değerler) ve varyansı, belirtilen ölçülerin kareleri toplamını,
serbestlik derecesine bölmekle bulunur (Bak Madde 14.2.2.3.1.1 ve 14.2.2.4):
sd2 =
Σ(Y − Yˆ ) 2 Σd 2
=
n−k
n−k
(14.18)
Bir regresyonda kareler toplamının serbestlik derecesi, nokta sayısından
(n), regresyondaki serbest değişken adedinin 1 fazlasını (k) çıkarmakla
bulunur. Basit doğrusal regresyonda bir tek serbest değişken olduğu için
k=2'dir.
Yukarıdaki tanım ve formülden bir kere daha anlaşılacağı üzere,
regresyon eşitliğinin varyansı, regresyon varyans analizinde açıklanan hata
kareler ortalamasıdır (Tablo 14.4).
(14.18) nolu formül ile ifade edilen sd2 basit doğrusal regresyonda
aşağıdaki formüle göre de hesaplanabilir:
sd2 =
ΣY 2 − aΣY − bΣXY
n−2
161
(14.19)
Regresyon ile aynı ölçü birimine sahip sd2 'nin kare kökü de regresyonun
standart sapmasıdır. Bu kavram bazı kitaplarda regresyonun standart hatası
veya tahminin standart hatası olarak geçmektedir. Regresyon bir ortalama, sd
her bir X-Y noktasının + ve - yönde regresyon doğrusundan gösterebileceği
ortalama ayrılış olduğuna göre, regresyon denklemi:
Y=a+bX±sd
(14.20)
şeklinde yazılabilir. sd bütün X'ler için sabit olduğundan, regresyon doğrusu
boyunca sabit kalır. Böylelikle regresyon doğrusuna paralel, ±1 sd uzaklıkta iki
doğrunun oluşturduğu şerit, 4. Bölümde normal eğrinin özelliklerinde
açıklandığı üzere, örnek noktalarının %68'ini içine alır (Şekil 14.8).
Misal 14.2’de hesaplanan regresyonun varyans ve standart sapmasını
inceleyelim ve bunu grafikle gösterelim:
sd2 =246.54
hesaplandığına
göre,
Madde
14.2.2.3.1.1’de
sd= 246.54 =15.7’dir.
O halde regresyon, Y=-217.8+21.28X±15.7 şeklindedir. X yerine
değerler konularak, regresyon doğrusuna + ve – yönde 1 sd uzaklıkta yer alan
doğrular elde edilir.
Mesela X=10 için: Y=-20.7 ve Y=10.7;
X=20 için: Y=192.1 ve Y=223.5 bulunur.
Regresyon doğrusu ve ±1 sd uzaklıktaki sınırı kapsayan standart hata
şeridi Şekil 14.8'de gösterilmiştir.
350
Hacım (dm3 )
300
250
200
150
100
50
0
-50 9
12
15
18
Çap (cm)
21
24
Şekil 14.8: Doğrusal regresyon ve standart hata şeridi
162
14.2.2.6.Regresyonun Örnekleme Hatası ve Güven Şeridi
Regresyondan amacın, ölçülmesi kolay olan bir (çoğul regresyonlarda
bir kaç) rastlantı değişkeni üzerinden, ölçülmesi zor olan bir rastlantı
değişkenini tahmin etmek olduğu belirtilmişti. n birimli bir örnek üzerinden
hesaplanan b ve a katsayıları ile tahmin edilen bir regresyon değeri, b ve a'nın
her ikisinin de bir hatası olduğu için daima bir örnekleme hatası taşır.
Regresyonda örnekleme hatası, örnek dahilinde yer alan bir X
ortalama değeri için veya tek bir X değeri için söz konusu olabilir. Bu iki halde
örnekleme hataları farklı şekillerde hesaplanır. Örnekleme hataları vasıtasıyla
Yˆ değerlerinin güven sınırları, bunların birleştirilmesi ile de güven şeridi
elde edilir.
14.2.2.6.1. X Ortalama Değerinin Örnekleme Hatası ve Regresyonun
Güven Şeridi
Bazı hallerde belli bir serbest değişkene karşılık birçok bağlı değişken
örneklenebilir. Mesela ağaçların göğüs çaplarıyla, boylarının ölçüldüğü bir
örneklemede çap değerleri çap sınıflarına dağıtılmışsa, her hangi bir çap
sınıfında (her hangi bir X için), birden fazla boy değeri (Y) yer alabilir. Ölçülen
boy değerleri her bir çap sınıfında normal dağılım gösterir ve bir ortalamaya
sahiptir. Basit doğrusal regresyonda böyle bir ortalama değerin varyansı:
 1 ( X − X )2 

sY2 .X = sd2  +
Σx 2 
n
(14.21)
formülüyle tahmin edilmektedir. Bunun kare kökü ise, örnekleme hatasını
verir. Bu şekilde her hangi bir X değerine karşılık Yˆ ortalama değerinin
bulunabileceği aralık ( Yˆ değerinin güven sınırları), belli bir güven düzeyi ile:
Yˆ ±t× sY.X
(14.22)
olarak tahmin edilebilir. Değişik X sınıfları için hesaplanan örnekleme hataları
regresyon doğrusunun iki yanına taşınarak ortalama değerlerin güven şeridi
elde edilir (Şekil 14.9).
Misal 14.2'de hesapladığımız regresyonda X=20 için muhtemel Y
ortalama değerinin varyansını bulalım ve 0.05 olasılık düzeyi ile güven
sınırlarını tayin edelim:
sd2 =246.54, X =290/17=17.1, Σx2=260.32 olduğuna göre:
163
 1 (20 − 17.1) 2 
 =22.467 ve örnekleme hatası:
sY2 .X =246.54×  +
260.32 
 17
sY.X =4.74 dm3 bulunur. Demek ki X=20 sınıfı için regresyondan
Hacım (dm3)
hesaplanan Yˆ değeri ortalama ±4.74 dm3 hata payına sahiptir. X=20 için
Yˆ =207.8 hesaplandığına ve n-k=15 SD'li t0.05=2.131 olduğuna göre 0.05
olasılıklı güven sınırları:
207.8±2.131×4.74 ve 197.7 dm3< Yˆ <217.9 dm3 bulunur.
Diğer X'ler için de bu sınırlar hesaplanarak bir koordinat sisteminde
regresyon doğrusunun etrafında çizilebilir. Bu şekilde elde edilen sahaya
regresyonun güven şeridi de denir. Bu misale ait, regresyonda ortalama
değerlerin güven şeridi Şekil 14.9'da sürekli çizgilerle gösterilmiştir.
350
300
250
200
150
100
50
0
-50 9
12
15
18
Çap (cm)
21
24
Şekil 14.9: Basit doğrusal regresyonda güven şeritleri
(Sürekli çizgiler ortalamaya, kesikli çizgiler bireylere ait)
Şeklin incelenmesiyle anlaşılacağı üzere, güven şeridi ortalamaya yakın
kısımda daralmakta, uçlara doğru genişlemektedir. Bu durum regresyonun uç
değerlerinin güvensizliğini, dolayısıyla ekstrapolasyonun sakıncalarını
göstermektedir (Kalıpsız 1981, s.433).
14.2.2.6.2.Tek Bir X Değerinin Örnekleme Hatası ve Güven Şeridi
Basit doğrusal regresyonda her hangi bir X değerinin varyansı ise:
164
 1 ( X − X )2 
2

sY.X
= sd2 1 + +
2

n
Σ
x


(14.23)
formülüyle hesaplanır. Yine bunun kare kökü sY.X örnekleme hatasıdır. Bu
değer, regresyonda her hangi bir X değeri için hesaplanan Y değerinin sahip
olduğu hatayı ifade etmektedir. Regresyon değerlerinin bulunabileceği aralık
ise, belli bir güven düzeyi ile:
Yˆ ±t× sY.X
(14.24)
olarak hesaplanabilir. Çeşitli X değerleri için hesaplana sınır değerler doğrunun
iki yanına taşınarak münferit X değerlerinin güven şeridi elde edilir (Şekil
14.9).
Misal 14.2'de hesapladığımız regresyonda, bu defa X=20 için Yˆ
değerinin varyansını bulalım ve 0.05 olasılık düzeyi ile güven sınırlarını tayin
edelim:

1 ( 20 − 17.1) 2 
2
 =269.01 ve örnekleme hatası,
sY.X
=246.54 1 + +
260.32 
 17
sY.X =16.4 dm3 bulunur. Demek ki X=20 için regresyondan hesaplanan Yˆ
değeri ortalama ±16.4 dm3 hata payına sahiptir. X=20 için Yˆ =207.8
hesaplandığına ve yine 15 SD'li t0.05=2.131 olduğuna göre 0.05 olasılıklı güven
sınırları:
207.8±2.131×16.4 ve 169.9 dm3< Yˆ <245.7 dm3 bulunur.
Bu misale ait regresyonda münferit değerlerin güven şeridi Şekil 14.9'da
kesikli çizgilerle gösterilmiştir. Grafikte, münferit X değerlerinin. X ortalama
değerlerine nazaran daha güvensiz olduğu görülmektedir.
14.3.Doğrusal Olmayan (Eğrisel) Đlişkiler
Geçen bölümlerde değinildiği gibi, incelenen ilişkiyi her zaman Y=a+bX
basit doğrusal regresyonu ile temsil etmek mümkün olmayabilir. Bu durumda
doğrusal olmayan ilişkiler akla gelir. Eğrisel regresyonlarla ifade edilebilecek
bu ilişkilerin en büyük özelliği, X'lerdeki birer birimlik artışlarda Y'lerin farklı
miktarlarda artış (veya azalış) göstermesi ve koordinat sisteminde çeşitli eğriler
halinde çizilmeleridir. Eldeki örneğe ait X-Y veri çiftleri bir koordinat
sistemine noktalandığında, noktalar bir eğri üzerinde yer alacak şekilde dağılış
gösterirse, incelenen değişkenler arasında eğrisel bir ilişki olduğu ortaya çıkar.
Mesela canlıların zaman içindeki çoğalişları, ağaçlarda yaş-boy, çap-hacım,
165
çap-boy gibi ilişkiler eğrilerle temsil edilebilecek ilişkilerdir. Eğrisel bir ilişki
söz konusu olduğunda akla gelen, çeşitli eğrisel eşitlik tiplerinden
(modellerden) hangisinin seçileceğidir. Bunun için, önce örneğin serpilme
diyagramı çizilerek noktaların dağılışı görülür ve o dağılışı en iyi izleyebilecek
eğrinin seçiminde, o konuda yapılmış benzer çalışmalardan, edinilmiş
tecrübelerden yararlanılır.
Bir eğrisel fonksiyonun tamamı, genellikle incelenen ilişkiye uyum
sağlamaz. Bu bakımdan, eğrisel ilişkiler genellikle bir eğrinin uygun bir
parçasıyla temsil edilir. Örnek dışı uç kısımlar istenen uyumu
göstermediğinden, dikkate alınmaz (ekstrapolasyonun sakıncası).
Eğrisel modeller, polinomiyaller, logaritmik ve ters sayı
fonksiyonlarından veya bunların karışık hallerinden meydana gelebilir. Her
eşitlik tipi koordinat sisteminde kendine özgü bir seyir takib eder.
14.3.1.Çok Kullanılan Eğrisel Modeller ve Özellikleri
Polinomlar: Y=a+bX basit doğrusal denklemine, X2, X3, . . . Xn
değişkenlerinin ilavesiyle elde edilirler. Denklemdeki X'lerin en büyük üssü
polinomun derecesini belirler. X2 ile biten bir denklem 2. derece polinomu, X3
ile biten bir denklem 3. derece polinomu adını alır. Polinomlar simetrik eğriler
çizerler. Çizdikleri eğri, en büyük üssün bir eksiği kadar dönüş (kıvrılma)
noktası gösterir. Mesela parabol denilen Y=a+bX+cX2 denklemi, koordinat
sisteminde +Y (c>0 olması hali) veya -Y ekseni yönünden (c<0 olması hali)
gelerek kıvrılır ve geldiği yöne döner. Y=a+bX+cX2+dX3 eğrisi ise, iki dönüş
noktası gösteren S şeklinde bir eğri (S eğrisi) çizer. Polinomlar
ekstrapolasyona uygun değildirler. Bu sebepten ele alınan ilişki polinomun
tamamı ile değil, uygun bir parçası ile temsil edilir. Özellikle 2. ve 3. derece
polinomları istatistikte çok kullanılır. Mesela ağaçlarda büyüme ve artım
ilişkileri birer 3. derece polinomu ile gösterilir.
Logaritmik Fonksiyonlar: Bir tarafı veya iki tarafı logaritmik olan
çeşitli logaritmik fonksiyonlar vardır. Bunlar aslında üssel fonksiyonların
transforme edilmiş halleridir. Ekstrapolasyona nispeten uygundurlar: Çok
kullanılan logaritmik eğriler Tablo 14.5’te verilmiştir.
Ters Sayı Fonksiyonları: Koordinat sisteminde Y ve X eksenlerine
veya bunlara paralel doğrulara asimptot olan eğriler çizerler. Bu özellikleriyle
ekstrapolasyona uygundurlar. Bu tip fonksiyonlar, çok hızlı düşüş veya
yükseliş gösteren ve sonra sabit kalan ilişkilerin gösterilmesine çok uygundur.
Tablo 14.6’da sık kullanılan logaritmik eğri tipleri verilmiştir.
166
Tablo 14.5: Bazı logaritmik denklemler
Logaritmik Eşitlik
Y=a+bLogX
2
Y=a+bLogX+cLog(X )
2
3
Y=a+bLogX+cLog(X )+dLog(X )
LogY=a+bX
2
LogY=a+bX+cX
2
3
LogY=a+bX+cX +dX
LogY=a+bLogX
2
LogY=a+bLogX+cLog(X )
2
3
LogY=a+bLogX+cLog(X )+dLog(X )
10 tabanına göre
a+bX
Üssel hali
E tabanına göre
Y=10
a+bX+cX2
Y=10
a+bX+cX2+dX3
Y=10
a+bLogX
Y=10
a+bLogX+cLog(X2)
Y=10
a+bLogX+cLog(X2)+dLog(X3)
Y=10
a+bX
Y=e
a+bX+cX2
Y=e
a+bX+cX2+dX3
Y=e
a+bLogX
Y=e
a+bLogX+cLog(X2)
Y=e
a+bLogX+cLog(X2)+dLog(X3)
Y=e
Bütün bu eşitlikler ile azalan ve artan ilişkilerde çizdikleri eğri şekilleri
Şekil 14.10'da ayrıntılı olarak gösterilmiştir. Şekillerde A eğrisi bir parabol, B
eğrisi ise bir 3. derece polinomudur. Mukayese imkanı vermek amacıyla, belli
modeller belli veri çiftlerine uygulanmıştır. Bu cümleden olarak; C, E, G, I, K,
M ve O tipleri aynı örneğe; D ve N aynı örneğe; A, F, H, J, L ve P aynı örneğe
uygulanmış eğrilerdir. Her model, ayrıca hem X'li, hem X2'li ve hem de X3’lü
eşitliği kendi içinde bulundurmaktadır. Ancak bazılarında, X'li, X2'li ve X3'lü
modelin birbirleriyle çakıştığı görülmektedir. Burada dikkat edilmesi gereken,
bazı eğri tiplerinin noktalara çok iyi uyum gösterdiği, bazılarında ise sapmalar
bulunduğudur. Sapmalar uçlarda veya ortada olabilmektedir. Bunun anlamı,
bazı eğrilerin daha yumuşak, bazılarının daha sert dönüş gösterdiğidir. J ve O
tiplerinin ise daha değişik eğriler çizdiği görülmektedir.·
Eğrisel regresyonlarla uğraşan kişi, belli bir modele bağlı kalmamalı,
verisini değişik modellere oturtarak ve tekrar tekrar deneyerek dağılıma en iyi
uyum sağlayan eğri tipini bulmalıdır. Bunun en iyi yolu, hesaplanan
regresyonun parametrelerine bakmakla beraber, gerek noktaları, gerekse eğriyi
bir koordinat sistemine çizip uygunluğu gözle kontrol etmektir. Bu amaç için,
günümüzde bilgisayarlar büyük kolaylık sağlamaktadır.
167
Tablo 14.6: Bazı ters sayı fonksiyonları
Fonksiyon
Dönüştürülmüş Hali
b
Y=a+
X
b
c
Y=a+
+ 2
X X
b
c
d
+
+
Y=a+
X X2 X3
1
Y=
a + bX
1
Y=
a + bX + cX 2
1
Y=
a + bX + cX 2 + dX 3
b

Y=1/  a +

X

b
c 

Y=1/  a +
+

X X2 

b
c
d 

+ 2 + 3
Y=1/  a +
X
X
X 

X
Y=
a + bX
X
Y=
a + bX + cX 2
X
Y=
a + bX + cX 2 + dX 3
1
Y
1
Y
1
Y
1
Y
1
Y
1
Y
=a+bX
2
=a+bX+cX
2
3
=a+bX+cX +dX
b
X
b
c
=a+
+
X X2
b
c
d
=a+
+ 2 + 3
X X
X
=a+
X
=a+bX
Y
X
2
=a+bX+cX
Y
X
2
3
=a+bX+cX +dX
Y
168
Y=a+bX+cX2+dX3
Y=a+bX+cX2
A
B
Y=a+blogX
Y=a+blogX+clogX2
Y=a+blogX+clogX2+dlogX3
D
C
Y=a+blogX
Y=a+blogX+clogX2
Y=a+blogX+clogX2+dlogX3
LogY=a+bX
LogY=a+bX+cX2
LogY=a+bX
LogY=a+bX+cX2
LogY=a+bX+cX2+dX3
LogY=a+bX+cX2+dX3
E
F
Şekil 14.10: Bazı önemli fonksiyonlar ve çizdikleri eğri biçimleri
169
LogY=a+blogX
LogY=a+blogX+clogX2
LogY=a+blogX+clogX2+dlogX3
LogY=a+bX
LogY=a+bX+cX2
LogY=a+bX+cX2+dX3
G
H
1/Y=a+bX
1/Y=a+bX
1/Y=a+bX+cX2
1/Y=a+bX+cX2+dX3
1/Y=a+bX+cX2
1/Y=a+bX+cX2+dX3
I
J
X/Y=a+bX
X/Y=a+bX
X/Y=a+bX+cX2
X/Y=a+bX+cX2
X/Y=a+bX+cX2+dX3
X/Y=a+bX+cX2+dX3
K
L
Şekil 14.10: (Devam)
170
Y=a+b/X
Y=a+b/X+c/X2
Y=a+b/X+c/X2+d/X3
N
M
Y=a+b/X
Y=a+b/X+c/X2
Y=a+b/X+c/X2+d/X3
1/Y=a+b/X
1/Y=a+b/X
1/Y=a+b/X+c/X2
1/Y=a+b/X+cX2
1/Y=a+b/X+c/X2+d/X3
1/Y=a+b/X+cX2+dX3
O
P
Şekil 14.10: (Devam)
14.3.2.Eğrisel Đlişkilerde Korelasyon ve Regresyon
Eğrisel ilişkilerde korelasyon ve regresyon, biri logaritmik diğeri parabol
olmak üzere iki farklı model üzerinden aşağıda misallerle açıklanmıştır.
14.3.2.1.Bir Logaritmik Regresyonun Hesaplanması
Misal 14.3: Tablo 14.7'deki X-Y değişkenleri arasındaki ilişkiyi
LogY=a+bLogX eşitliği ile ifade edelim:
Denklemde görüldüğü üzere, hesaplamada kullanılacak değişkenler,
değişkenlerin kendileri değil, bunlardan türetilmiş olan LogX ve LogY'lerdir.
Bir regresyon hesabında bu şekilde değişkenlerin aslı yerine, karesinin (X2),
kübünün (X3), logaritmasının (LogX), tersinin (1/X), iki değişkenin çarpımının
(X1×X2) vs alınmasıyla elde edilen değişkenlere türetilmiş değişken
denilmektedir.
171
Misalde katsayıların hesabı için gerekli olan değişkenlerin çarpımları ve
kareleri, LogX×LogY, (LogX)2 ve (LogY)2 olarak tabloda verilmiş ve
toplamları alınmıştır. Logaritmalar 10 tabanına göredir.
Eşitlik bünyesinde 1 serbest değişken bulunduğuna göre, yapılacak
hesaplamalarda basit doğrusal regresyona ait formüller kullanılabilir.
Tablo 14.7: LogY=a+bLogX regresyonu için gerekli hesaplamalar
No
1
2
3
4
5
6
7
8
9
10
Σ
X
1
2
3
4
5
6
7
8
9
10
55
Y
0.3
0.6
0.7
1.0
1.6
2.5
3.1
5.0
7.4
10.0
32.2
LogX
0.0000
0.3010
0.4771
0.6021
0.6990
0.7782
0.8451
0.9031
0.9542
1.0000
6.5598
LogY
-0.5229
-0.2218
-0.1549
0.0000
0.2041
0.3979
0.4914
0.6990
0.8692
1.0000
2.7620
LogX*LogY
0.0000
-0.0668
-0.0739
0.0000
0.1427
0.3097
0.4152
0.6312
0.8295
1.0000
3.1876
(LogX)2
0.0000
0.0906
0.2276
0.3625
0.4886
0.6055
0.7142
0.8156
0.9106
1.0000
5.2152
(LogY)2
0.2734
0.0492
0.0240
0.0000
0.0417
0.1584
0.2414
0.4886
0.7556
1.0000
3.0322
Korelasyon katsayısının hesabı:
n=10 olduğundan, (14.1) nolu formüle göre:
Σxy=3.1876-
Σx =5.21522
2
r=
6.5598 × 2.762
10
6.55982
10
1.375782
0.9121 × 2.26934
=1.37578
=0.9121
=0.914
Σy =3.03222
2.762 2
10
=2.26934
r=0.956
Buradan r'ye ait t değeri, (14.4) nolu formüllerden ikincisine göre,
t=
0.956 10 − 2
1- 0.9562
=9.217 hesaplanır.
Bunun SD'si n-2=8 olduğuna ve Ek Tablo 2'de 8 SD'li t0.05=2.306,
t0.01=3.355 ve t0.001=5.041 olduğuna göre r'nin %99.9 önemli olduğu anlaşılır.
Ek Tablo 7’ye göre ise en az %99 önemli olduğu görülür (Ek Tablo 7'ye göre 8
SD'li r0.05=0.632, r0.01=0.765'dir).
172
Regresyon katsayılarının hesabı:
Σxy=1.37578, Σx2=0.9121, ΣY2.762, ΣX=6.5598 olduğundan, (14.7) ve
(14.8) nolu formüllere göre:
b=1.37578/0.9121=1.5084
a=
2.762
10
-1.5084×
6.5598
10
=-0.7133
O halde regresyon denklemi:
LogY=-0.7133+1.5084×LogX
şeklinde yazılır. Bu denklem mesela X=1 için çözülecek olursa,
LogY=-0.7133+1.5084×Log(1)=-0.7133 bulunur. Bunun anti logaritması
alınırsa Y=0.1935 olur. Veya Tablo 14.5'teki üssel hale göre aynı eşitlik,
Y=10-0.7133+1.5084×LogX
şeklinde yazılır. X=1 için bu defa Y=10-7133 ve bir hesap makinesi yardımıyla
Y=0.1935 bulunur. Bu regresyon bir koordinat sistemine çizilecek olursa, Şekil
14.10-H'daki eğri elde edilir (Đlgili grafikte, üç eşitliğe ait eğri üst üste
geçmiştir).
Regresyonun ve regresyon katsayılarının standart hataları:
ΣY2=3.0322, ΣY=2.762, ΣXY=3.1876, olduğundan, regresyonun
varyansı, (14.19) nolu formüle göre,
sd2 =
3.0322 − ( −0.7133 × 2.762 ) − 15084
.
× 31876
.
10 − 2
=0.02427
veya (14.10) nolu formüle göre,
2.26934 −
sd2 =
1.375782
0.9121 =0.02427 hesaplanır. Standart hata ise,
10 − 2
sd=0.1558 bulunur.
b’nin varyansı ise, sb2 =0.02427/0.9121=0.02661 ve standart hatası
sb=0.16312 bulunur.
Tablo 14.7'den ΣX2=5.2152 alınarak, (14.12) nolu formüle göre a'nın
varyansı ise:
173
sa2 =0.02427×
5.2152
10 × 0.9121
=0.01388 ve standart hatası sa=0.1178
bulunur. Bunlardan yararlanılarak kendilerine ait t değerleri hesaplanır ve
önemlilikleri kontrol edilebilir. Mesela (14.11) nolu formüle göre b'ye ait:
t=1.5084/0.16312=9.247 bulunur. Ek Tablo 2'ye göre bunun %99.9
önemli olduğu görülür (n-k=10-2=8 SD'li t0.05=2.306, t0.01=3.355,
t0.001=5.041'dir.).
Varyans analizi:
Tablo 14.7'den ΣY=2.762 ve ΣY2=3.0322 alınarak, (14.14) ve (14.15)
nolu formüllere göre regresyona ait:
Genel KT=3.0322-
Regresyon KT=
2.762 2
10
1.375782
0.9121
=2.26934
=2.07518 bulunur. Buradan;
Hata KT=2.26934-2.07518=0.19416 hesaplanır.
Varyasyon kaynaklarının serbestlik dereceleri burada basit doğrusal
regresyondaki gibidir (Madde 14.2.2.4). Sonuçlar ve F kontrolu Tablo 14.8'de
verilmiştir.
Tablo 14.8: Misal 14.3'e ait varyans analizi
Varyasyon Kaynağı
Regresyon
Hata
Genel
KT
2.07518
0.19416
2.26934
SD
1
8
9
KO
2.07518
0.02427
F
85.50***
1'e 8 SD'li F tablolarına bakılacak olursa, bulunan F'in %99.9 önemli
olduğu görülür. (F0.05=5.32, F0.01=11.3, F0.001=25.4'tür.)
Dikkat edilecek olursa, burada gerek r, gerek regresyon katsayısı,
gerekse regresyon ilişkinin %99.9 önemli olduğunu göstermiştir. Ancak bütün
bunlara rağmen Şekil 14.10-H'da eğrinin noktalara iyi uymadığı görülmektedir.
Buna karşılık aynı veriye uygulanmış olan Şekil 14.10-F denklemlerinden biri
(mesela LogY=a+bX modeli) noktaların hemen hemen üzerinden geçmiştir.
Nitekim veri bu modele göre analiz edildiğinde, daha büyük r, t ve F değerleri
elde edilecektir. Ancak en büyük r, t ve F değerleri, daima en uygun modeli
174
göstermez. Logaritmik modellerde yüksek test değerlerine nazaran, çok uygun
olmayan eğriler elde edilebilmektedir. Bu bakımdan, eğrisel regresyonlarda
model seçimi çok önemlidir.
Misalde kullanılana benzer modellerden LogY=a+bLogX+cLog(X2)
denkleminde 2 serbest değişken vardır. Bu eşitlik ve benzeri tüm iki serbest
değişkenli modeller Madde 14.3.2.2'de verilen Misale göre çözülebilir.
LogY=a+bLogX+cLog(X2)+dLog(X3) eŃitliñinde ise 3 serbest degişken vardır.
3 ve daha fazla serbest değişken bulunduran eşitliklerin el ile çözülmesi
zahmetli, hatta değişken sayısının artışına paralel olarak bazı hallerde
imkansızdır. Böyle modellerin çözümü bilgisayarlarla kolaylıkla yapılabilir.
14.3.2.2.Bir Parabolün Hesaplanması
Y=a+bX+cX2 şeklindeki bir eşitliğe 2. derece polinomu veya parabol
denildiği daha önce belirtilmişti. Burada bu eğriye uygun bir regresyonun
çözümü açıklanacaktır. Eşitlikte iki serbest değişken olduğu, bunlardan
birincisinin asli, ikincisinin ise onun karesinin alınmasıyla türetilmiş olduğu
görülmektedir. Bir eşitlikte kaç serbest değişken varsa, o kadar da regresyon
katsayısı vardır. Eşitliklerde bunlar b, c, d... vs ile veya b1, b2, b3.vs ile
gösterilir. Y=a+bX+cX2 denkleminde birinci regresyon katsayısı b, ikinci
regresyon katsayısı c ile gösterilmiştir.
Bu denklemde X=X1, X2=X2 b=b1 ve c=b2, ile gösterilirse, iki serbest
değişkenli bir regresyonda katsayılarını hesabı aşağıdaki formüllere göre
yapılır:
b1 Σx12+ b2 Σx1x2=Σx1y
(14.25)
b1 Σx1x2+ b2 Σx22=Σx2y
Sabit terim (a katsayısı) ise:
a= Y -b1 X 1-b2 X 2
(14.26)
formülü vasıtasıyla hesaplanır. Bu katsayıları bir misal üzerinde hesaplayalım:
Misal 14.4: Misal 14.2'de verilen 17 Pinus radiata'daki çap-hacım
ilişkisini bu defa bir parabol ile ifade edelim. Çözüm için gerekli hesaplamalar
Tablo 14.9’da verilmiştir. Misale ait hesaplar, elde hesap makinesi ile
yapılmıştır. Bilgisayar sayılarda çok fazla kesir üzerinden işlem yaptığı için,
aynı işlemler bilgisayarda yapıldığında kısmen farklı sonuçlar alınabilir.
175
Tablo 14.9: 17 P. radiata ağacında göğüs çapı-hacım ölçüleri ve
2. derece polinomu için gerekli hesaplamalar
Sıra
No
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
Σ
X1
X2
Y
Y2
Çap
(X1)2
Hacım
10.2 104.04
29
841
11.7 136.89
41
1681
12.5 156.25
51
2601
13.1 171.61
62
3844
14.1 198.81
74
5476
14.8 219.04
87
7569
15.5 240.25
99
9801
16.2 262.44
116 13456
16.3 265.69
129 16641
17.8 316.84
147 21609
18.7 349.69
167 27889
19.7 388.09
186 34596
20.6 424.36
209 43681
21.1 445.21
231 53361
22.1 488.41
255 65025
22.6 510.76
279 77841
23.0 529.00
307 94249
290.0 5207.38
2469 480161
X1Y
295.8
479.7
637.5
812.2
1043.4
1287.6
1534.5
1879.2
2102.7
2616.6
3122.9
3664.2
4305.4
4874.1
5635.5
6305.4
7061
47657.7
X1X2
(X1)3
1061.208
1601.613
1953.125
2248.091
2803.221
3241.792
3723.875
4251.528
4330.747
5639.752
6539.203
7645.373
8741.816
9393.931
10793.861
11543.176
12167.000
97679.312
X22
(X1)4
10824.3216
18738.8721
24414.0625
29449.9921
39525.4161
47978.5216
57720.0625
68874.7536
70591.1761
100387.5856
122283.0961
150613.8481
180081.4096
198211.9441
238544.3281
260875.7776
279841.0000
1898956.1674
X2Y
(X1)2Y
3017.16
5612.49
7968.75
10639.82
14711.94
19056.48
23784.75
30443.04
34274.01
46575.48
58398.23
72184.74
88691.24
102843.51
124544.55
142502.04
162403.00
947651.23
Regresyon katsayılarının hesabı:
14.2.2.3 maddesinde daha önce, Σx12=260.32, Σx1y=5539.47 olarak
hesaplanmıştı. (14.25) nolu formüller için gerekli olan diğer terimler ise:
Σx1x2=97679.312-
290 × 5207.38
=8847.54
17
Σx22=1898956.167-
Σx2y=947651.23-
5207.382
=303849.9
17
5207.38 × 2469
=191355.86
17
hesaplanır. Bunlar formüllerde yerine konulur ve taraf tarafa toplanırsa:
8847.54×(260.32b1+8847.54b2=5539.47)
260.32×(8847.54b1+303849.9b2=191355.86)
2303191.6b1+78278964.1b2=49010682.4
-2303191.6b1-79098206b2=-49813757.5
-819241.9b2=-803075.1
176
b 2=
− 803075.1
=0.9803 ve bu değer yukarıdaki eşitliklerden birinde
− 819241.9
yerine konularak,
260.32b1+8847.54×0.9803=5539.47 ve b1,
b 1=
− 3133.77
=-12.0382 bulunur.
260.32
Hacım (dm3)
Y =145.24, X 1 =17.06, X 2 =306.31 olduğuna göre, (14.26) nolu formül
yardımıyla:
a=145.24-(-12.0382×17.06)-0.9803×306.31=50.34 bulunur. O halde
regresyon:
Y=50.34-12.0382X+0.9803X2
şeklinde yazılır. Bu defa X=10 için beklenen değer:
Y=50.34-12.0382×10+0.9803×102=27.99 dm3
bulunur. Halbuki basit doğrusal regresyona göre, X=10 için -5 dm3
hesaplanmıştı. Demek ki 2. derece polinomu ilişkiyi bu noktada daha iyi temsil
etmektedir.
Hesaplanan regresyona ait eğri ve noktalara uyumu Şekil 14.11'de
gösterilmiştir.
350
300
250
200
150
100
50
0
9
12
15
18
Çap (cm)
21
24
Şekil 14.11: Çap-hacım ilişkisinin 2. derece polinomu ile temsili
Regresyonun ve regresyon katsayılarının standart hataları:
Đkinci derece polinomunda regresyonun varyansı (veya hata KO):
177
s d2=
ΣY 2 − aΣY − bΣXY − cΣX 2Y
n−3
(14.27)
formülüne göre hesaplanır. Madde 14.2.2.3.1.1 ve 14.2.2.5'te değinildiği gibi,
bu formülün payı, regresyondan ayrılış kareleri, yani hata kareleri toplamıdır.
Katsayıların varyansları ise, regresyonun varyansı üzerinden:
s b2=
s c 2=
sd2
(Σx1 x2 ) 2
Σx12 −
Σx22
(14.28)
sd2
(Σx1 x2 ) 2
Σx22 −
Σx12
(14.29)
formülleri yardımıyla bulunur.
ΣY=2469,
ΣXY=47657.7,
Tablo
14.9'dan
ΣY2=480161,
ΣX Y=947651.23 alınarak (14.27) nolu formül misale uygulanırsa:
2
s d2=
480161 − 50.34 × 2469 − (−12.0382) × 47657.7 − 0.9803 × 947651.23
=42.997
17 − 3
bulunur. Daha önce Ex12=260.32. Ex1x2=8847.54, Ex22=303849.9 hesaplanmış
olduğundan:
s b2=
42.997
=15.9472
(8847.54) 2
260.32 −
303849.9
s c 2=
42.997
=0.013663
(8847.54) 2
303849.9 −
260.32
sb=3.9934 ve,
sc=0.116887 bulunur
Buradan önemlilik kontrolları için (14.11) nolu formüle göre katsayıların
t değerleri:
178
t b=
−12.0382
=-3.015
3.9934
t c=
0.9803
=8.387
0.116887
bulunur. Đki serbest değişkenli bir regresyonda k=3 olduğundan, bunların her
ikisinin de serbestlik dereceleri n-k=I7-3=14'tür. 14 SD'li t tablo değerleri
t0.05=2.145, t0.01=2.977, t0.001=4.140’dır. O halde b katsayısı %99, c katsayısı
%99.9 güven düzeyinde önemlidir.
Regresyon varyans analizi:
Đki serbest değişkenli bir regresyonda,
Regresyon KT=b1Σx1y+- b2Σx2y (14.30)
formülüne göre hesaplanır Formüle göre,
Regresyon
KT=-12.0382×5539.47+0.9803×191355.86=120900.9
bulunur. Ancak Genel KT ve hata KT biliniyorsa,
Regresyon KT=Genel KT-hata KT
olarak da hesaplanabilir. Daha önce Genel KT=Σy2=121575.1 bulunduğundan,
hata KT=121575.1-120900.9=674.2 olur.
Birden fazla serbest değişkenli regresyonlarda serbestlik dereceleri:
Genel SD=n-1,
Regresyon SD=Serbest değişken sayısı,
Hata SD=Genel SD-Regresyon SD veya n-k
olarak hesaplanır. Daha önce belirtildiği üzere k, serbest değişken adedinin 1
fazlasıdır. Varyans analizi Tablo 14.10'daki gibidir.
Tablo 14.10: Misal 14.3'e ait varyans analizi
Varyasyon Kaynağı
Regresyon
Hata
Genel
KT
120900.9
674.2
121575.1
SD
2
14
16
KO
60450.5
48.2
F
1254.16***
(Tabloda hata KO=48.2'dir. Halbuki bu değer daha önce 42.997
hesaplanmıştır. Bu fark hesapların az sayıda ondalık üzerinden yapılmasından
ileri gelmektedir.)
2’ye 14 SD’li F değerleri, F0.05=3.739, F0.01=6.514, F0.001=11.780'dir.
Hesaplanan değer bunların hepsinden büyük olduğuna göre, 2. derece çaphacım ilişkisinin %99.9’dan büyük güven düzeyinde önemli olduğuna
hükmedilir.
Tabloda görüldüğü üzere, hesaplanan F basit doğrusal regresyonda
hesaplanan değerden (478.11, Bak madde 14.2.2.4) fazlasıyla büyüktür. Bu
179
sebepten ikinci derece polinomunun bu ilişkiyi daha iyi temsil ettiği açıktır.
Nitekim genel KT aynı olduğu halde, basit doğrusal regresyonda regresyondan
ayrılışlar 3698.2 iken, burada 674.2'ye inmiştir. Demek ki basit doğrusal
regresyon yerine bu model tercih edilmelidir.
Korelasyon katsayısının hesabı:
Birden fazla bağımsız değişkene sahip bir regresyonda korelasyon
katsayısı yerine tüm korelasyon katsayısı veya belirtme katsayısı’ndan söz
edilir Tüm korelasyon katsayısı normal korelasyon katsayısının karesine eşittir.
r2 ile gösterilir ve korelasyon katsayısı ile aynı anlamı taşıt. Ayrıca
regresyondaki serbest degişkenlerin Y karakterini % olarak belirtme derecesini
ifade eder. Bu değer aşağıdaki formüle göre hesaplanır:
r 2=
Regresyon KT
Genel KT
(14.31)
Formülü misalimize uygulayacak olursak;
r2=120973.1/121575.1=0.995 bulunur. Bu değer güçlü bir bağıntının
göstergesidir. X1 ve X2 karakterleri, Y karakterinin 0.995 veya %99.5'ini
belirtmiştir. Geriye kalan 1-0.995=0.005'lik kısım bilinmeyen başka
değişkenler tarafından belirtilmektedir.
r2'nin kontrolunda, formül (14.4) de kullanılabilir:
t=
0.9975 17 - 3
1 − 0.995
=52.783. Bu değer, n-k=17-3=14 SD’li tablo değerleri
ile karşılaştırılırsa, r’nin %99.9 önemli oluğu görülecektir.
14.4.Çoğul Đlişkilerde Korelasyon ve Regresyon
Korelasyon ve regresyona konu olan çoğul ilişkiler denilince akla,
ikiden fazla bağımsız değişkenin bir bağımlı değişkeni etkilediği veya birden
fazla bağımsız değişkenle bir bağlı değişken arasındaki ilginin incelendiği
ilişkiler gelir. Ancak bu defa bağımsız değişkenler mesela Y=a+bX+cX2
eşitliğindeki X2 gibi belli bir serbest değişkenden türetilmiş olmayıp, farklı
niteliktedirler. Mesela bir ağacın hacım artımı ile çap ve boyu arasındaki ilişki
incelendiğinde, çap ve boy gibi farklı karakterde iki bağımsız değişken ele
alınmaktadır. Böyle bir ilişki, Hacım=a+b1Çap+b2Boy şeklinde yazılabilir.
Bunlara bir de yaş katılırsa, yaş, çap ve boy olarak üç bağımsız değişkenli
Hacım=a+b1Çap+b2Boy+b3Yaş eşitliği hesaplanmaya çalışılır. Çoğul
regresyonlar çok daha fazla sayıda bağımsız değişkene de sahip olabilirler.
180
Çoğul regresyonlar farklı karakterde birden çok değişkenle birlikte,
bunlardan türetilmiş karesel, kübik, logaritmik vs değişkenleri de bünyelerinde
bulundurabilirler. Mesela Hacım=a+b1Çap+b2Çap2-b3Boy2 gibi bir çoğul
regresyon da kurulabilir.
Đki ayrı karakterde bağımsız değişkene sahip bir çoğul regresyon, ancak
3 boyutlu bir koordinat sisteminde çizilebilir. Böyle bir regresyon, artık bir
regresyon hattı değil de, üç boyutlu uzayda yükselen veya alçalan bir
regresyon düzlemi (Şekil 14.12) veya kıvrımlar yapan bir regresyon yüzeyi
(Şekil 14.14) meydana getirir. Regresyonda eğer değişkenlerin asılları ele
alınmışsa regresyon düzlemi, kareleri, küplerí, çarpımları vs ele alınmışsa
muhtemelen çukurlu tümsekli bir regresyon yüzeyi meydana gelir. Üç ve daha
fazla farklı karakterde serbest değişkene sahip çoğul regresyonlar ise grafikle
gösterilemez.
Đki farklı karakterde bağımsız değişkenli bir çoğul regresyonda beklenen
değerler, değişkenlerden birinin satırları, diğerinin sütunları oluşturduğu iki
boyutlu bir tablo halinde elde edilir. 3 serbest değişkene sahip olanlarda ise,
değişkenlerden biri sabit tutularak, diğer ikisine göre iki boyutlu bir tablo
yapılır.
14.4.1. Çoğul Korelasyon ve Regresyon Katsayılarının Hesabı
Çoğul ilişkilerde korelasyon ve regresyon aşağıda misal üzerinden
açıklanmıştır.
Misal 14.5: Bir kavak klonuna mensup 15 ağacın çapı ve boyu ölçülmüş,
gövde analizi metodu ile hacımları hesaplanmıştır. Veriler Tablo 14.11'deki
gibidir. Bu klonda çap, boy ile hacım arasındaki ilişkiyi hesaplayalım:
Misalde iki serbest değişken bulunduğundan, 14.3.2.2 nolu maddede
verilen formüller burada da kullanılabilir. Formüller için gerekli ön
hesaplamalar Tablo 14.11’de verilmiştir.
Katsayıların hesaplanması:
Σx12=7346-
320 2
=519.333
15
Σx1x2=6583-
320 × 288
=438
15
Σx22=5912-
2882
=382.4
15
Σx1y=136306-
181
320 × 5405
15
Tablo 14.11: Bir kavak klonuna ait 15 ağacın çap, boy ve hacım ölçüleri
Sıra Çap Boy Hacım
No (cm) (m) (dm3) X1×X2
X1
X2
Y
1
12
10
51
120
2
13
11
66
143
3
14
15
103
210
4
16
15
134
240
5
17
16
161
272
6
18
17
191
306
7
20
18
248
360
8
22
19
315
418
9
23
21
379
483
10
25
21
445
525
11
26
24
549
624
12
27
24
590
648
13
28
25
659
700
14
29
26
733
754
15
30
26
781
780
Σ
320 288
5405
6583
Σx2y=121542-
X1×Y
X2×Y
X12
X22
612
858
1442
2144
2737
3438
4960
6930
8717
11125
14274
15930
18452
21257
23430
136306
510
726
1545
2010
2576
3247
4464
5985
7959
9345
13176
14160
16475
19058
20306
121542
144
169
196
256
289
324
400
484
529
625
676
729
784
841
900
7346
100
121
225
225
256
289
324
361
441
441
576
576
625
676
676
5912
Y2
2601
4356
10609
17956
25921
36481
61504
99225
143641
198025
301401
348100
434281
537289
609961
2831351
288× 5405
=17766
15
(14.25) nolu formüllere göre:
382.4×(519.333b1+439b2=20999)
439×(439b1+382.4b2=17766)
198592.94b1=8030017.6
-192721b1=-7799274
b1=39.296
439×39296+382.4b2=17766
b2=1.3469
Y =5405/15=360.33,
X 1 =320/15=21.33,
X 2 =288/15=19.2
bulunur.
olduğundan, (14.26)'ya göre ise;
a=360.33-39.296×21.33-1.3469×19.2=-503.71
hesaplanır. Buna göre regresyon denklemi:
Y=-503.71+39.296b1+1.3469b2 veya
Hacım=-503.71+39.296×Çap+1.3469×Boy
şeklinde yazılabilir. Bu eşitlik, daha önce belirtildiği gibi, mesela çapın
satırları, boyun sütunları oluşturduğu iki girişli bir tablo halinde çözülebilir
(Tablo 14.12). Regresyon 3 boyutlu bir grafik halinde Şekil 14.12'de
gösterilmiştir.
182
Tablo 14.12: Y=-503.71+39.296Çap+1.3469Boy regresyonunun
beklenen değerleri
12
-16.0
62.6
141.2
219.8
298.4
377.0
455.6
534.1
612.7
691.3
14
-13.3
65.3
143.9
222.5
301.1
379.7
458.3
536.8
615.4
694.0
22
-2.5
76.1
154.7
233.2
311.8
390.4
469.0
547.6
626.2
704.8
24
0.2
78.8
157.4
235.9
314.5
393.1
471.7
550.3
628.9
707.5
800
700
600
500
26
400
22
300
200
18
100
14
0
-100
10
12 14 16 18 20 22
24 26 28 30
Çap (cm)
26
2.9
81.5
160.0
238.6
317.2
395.8
474.4
553.0
631.6
710.2
Boy (m)
10
-18.7
59.9
138.5
217.1
295.7
374.3
452.9
531.5
610.0
688.6
Hacım (dm3)
Çap
(cm)
12
14
16
18
20
22
24
26
28
30
Hacım (dm3)
Boy (m)
16
18
20
-10.6
-7.9
-5.2
68.0
70.7
73.4
146.6 149.3 152.0
225.2 227.9 230.6
303.8 306.5 309.1
382.4 385.0 387.7
460.9 463.6 466.3
539.5 542.2 544.9
618.1 620.8 623.5
696.7 699.4 702.1
Şekil 14.12: Y=-503.71+39.296Çap+1.3469Boy·regresyonunun
3 boyutlu grafik halinde gösterilişi ve regresyon düzlemi
Tablo incelendiğinde görüleceği üzere, 12 cm çapında 10 m boyunda bir
ağacın hacmı regresyona göre –18.7 dm3’tür. Teorik olarak böyle bir şey
olamayacağı gibi, deneysel verilere göre de bu çap ve boydaki ağacın hacmı 51
dm3’tür. 20 cm çapında 18 m boyunda bir ağacın hacmı ise 306.5 dm3
olmaktadır. Bu değer de deneysel değerden (248 dm3) oldukça farklıdır. Bu
durumda modelin gerçek duruma iyi uymadığı anlaşılmaktadır. Yapılacak iş,
yeni bir model kurularak yeni bir regresyon hesaplamaktır.
183
Bu misaldeki gibi 3 boyutlu bir grafikle resmedilebilen 2 girişli
tablolarda, tablonun sağ üst ve sol altında gerçek dışı ölçüler yer alabilir.
Mesela 30 cm çapında 10 m boyunda bir ağaç veya 12 cm çapında 26 m
boyunda bir ağaç tabiatta bulunmayabilir. Bu sebepten tablo verilirken, tabiatta
rastlanması mümkün olmayan bu gibi ölçülerin karşılığı olan regresyon
değerleri köşelerden çıkarılarak yerleri boş bırakılır.
Çoğul regresyonlarda regresyon katsayıları ait oldukları değişkenin ölçü
birimine, beklenen değerler ise bağlı değişkenin ölçü birimine sahiptir.
Regresyonun ve regresyon katsayılarının standart hataları:
Đki serbest değişkenli bir çoğul regresyonun varyansı:
s d2=
ΣY 2 − aΣY − b1ΣX 1Y − b2 ΣX 2Y
n−3
(14.32)
formülüne göre hesaplanır.
ΣY2=2831351, ΣY=5405, ΣX1Y=136306 ve ΣX2Y=121542 olduğuna
göre, (14.32) nolu formülü misale uygularsak:
s d2=
2831351 − (−503.71 × 5405) − 39.296 × 136306 − 1.3469 × 121542
=2826.5
n−3
bulunur. Katsayıların varyansları ise, (14.28) ve (14.29) nolu formüllere göre
hesaplanır. Daha önce Σx12=519.333, Σx1x2=439, Σx22=382.4 hesaplanmış
olduğundan:
sb12=
2826.5
=184.071
439 2
519.333 −
382.4
sb22=
2826.5
=249.985
439 2
382.4 −
519.333
sb1=13.567 m ve,
sb2=15.811 m bulunur.
Yine (14.11) nolu formüle göre, önemlilik kontrolları için bunların t
değerleri,
tb1=39.296/13.567=2.896
tb2=1.3469/15.811=0.085 bulunur.
Serbestlik dereceleri ise n-k=15-3=12'dir. 12 SD'li t tablo değerleri
t0.05=2.179, t0.01=3.055, t0.001=4.138'dir. Bu durumda b1 katsayısı %95 önemli
görünmekle beraber, b2 katsayısı önemli olamamıştır. Bu sonuç, regresyonda
184
kullanılan değişkenlerden boy ile hacım arasında bir ilişki olmadığı şeklinde
yorumlanır. Ancak biyolojik olarak böy1e bir şey söylemek mümkün değildir.
"Boy" faktörünün doğrudan kendisi burada hacım artımına etkisiz
görünmektedir; ama karesi, kübü, logaritması gibi bundan türetilmiş bir
değişken muhtemelen artımla ilişkili bulunacaktır Bu sebepten, önceki
konularda da değinildiği gibi, başka değişkenlerle, başka regresyon analizleri
yapılarak hacım artımını en iyi temsil eden model bulunmalıdır.
Regresyon varyans analizi:
Burada da varyasyon kaynaklarının hesabı, polinomiyal regresyon
misaline benzer şekilde yapılabilir.
Genel KT=Σy2=2831351-
5405 2
=883749.3,
15
regresyonun varyansı (Hata KO) yukarıda 2826.5 bulunduğuna göre,
Hata KT=2826.5×12=33918'dir.
Serbestlik dereceleri ise, regresyonun 2, hata’nın n-k=15-3=12 olduğuna
göre, varyans analizi Tablo 14.13'deki gibidir.
Tablo 14.13: Misal 14.5'e ait varyans analizi
Varyasyon Kaynağı
Regresyon
Hata
Genel
KT
849831.3
33918
883749.3
SD
2
12
14
KO
424915.65
2826.5
F
150.33***
2’ye 12 SD’li F tablo değerleri, F0.05=3.885, F0.01=6.927,
F0.001=12.972'dir. Hesaplanan değer bunların hepsinden büyük olduğuna göre,
çap, boy ile hacım arasındaki ilişkinin %99.9’dan büyük güven düzeyinde
önemli olduğuna hükmedilir.
Korelasyon katsayısının hesabı:
Tüm korelasyon katsayısı (veya belirginlik katsayısı) esasen çoğul
regresyonlarda anlam kazanmaktadır. Çünkü bu regresyonlarda birden fazla
serbest değişken, bir bağlı değişkeni belirtmektedir.
(14.31.) nolu formül misale uygulanacak olursa:
r2=849831.3/883749.3=0.962 bulunur. Demek ki çap, boy değişkenleri
ile, hacım artımının 0.962'si belirtilmiştir. Geriye kalan 1-0.962=0.038'lik kısım
bilinmeyen başka değişkenler tarafından belirtilmektedir.
r2, t vasıtasıyla kontrol edilecek olursa, (14.4) nolu formüle göre
185
bulunan,
0.9808 15 - 3
=17.429 değeri 12 SD'li t tablo değerleri ile
1 − 0.962
karşılaştırılır ve %99.9 önemli olduğu görülür.
t=
Hacım (dm3)
Misal 14:5'te hesaplanan regresyonun genel yorumu:
Misal 14.5 ile, Şeki1 14.12'de görüldüğü üzere doğrusal kökenli bir
çoğul regresyon eşitliği hesaplanmıştır. Ele alınan serbest değişkenlerden çap
ancak %95 önemli bulunmuş, boy ise önemsiz görünmüştür. Regresyonun
çözüm tablosu da, gerçek değerlere çok yakın sonuç verememiştir. Buna
karşılık varyans analizi toplu ilişkiyi %99.9 önemli saymıştır. Belirginlik
katsayısı da buna paralel sonuç vermiştir. Bu bulgular ışığında acaba kurulan
model yeterli midir?
900
800
700
600
500
400
300
200
100
0
Boy
Çap
8
12 16 20 24 28 32
Çap (cm) veya Boy (m)
Şekil 14.13: Hacmın Boy ve Çapa göre değişimi
Çapın hacıma göre ve boyun hacıma göre Şekil 14.13'te gösterilen
değişimleri incelenecek olursa, her ikisinin de doğrudan çok birer eğriye
benzediği anlaşılmaktadır. Bu durumda ilişkinin eğrisel esaslı regresyonlarla
daha iyi temsil edilebileceği söylenebilir. O halde başka bir model kurarak
ilişkinin aşağıdaki gibi yeniden analizi yerinde olacaktır.
Misal 14.6: Misal 14.5'te incelenen çap, boy ile hacım ilişkisinin eğrisel
çoğul regresyonla analizi.
Bu maksatla,
Hacım=a+b1Çap+-b2Boy·+b3Çap2+b4Boy2
şeklinde bir model kurarak regresyonu hesaplayalım. Burada gerekli olan ilave
değişkenler çap ve boy değerlerinin kareleridir. Konuyu fazla uzatmamak için
çözüm bilgisayarla yapılarak sonuçlar ve yorum aşağıda verilmiştir.
Regresyon denklemi aşağıdaki gibi hesaplanmıştır:
Y=209.5-26.222çap-8.894boy+1.2529çap2+0.6784boy2
186
Regresyonun çapa ve boya göre çözümü Tablo 14.14'te, üç boyutlu
grafiği ise Şekil 14.14'te gösterilmiştir.
Tablo 14.14: Y=209.5-26.222çap-8.894boy+1.2529çap2+0.6784boy2
regresyonunun beklenen değerleri
Çap
(cm)
12
14
16
18
20
22
24
26
28
30
10
54.2
66.9
89.6
122.4
165.2
218.0
280.8
353.6
436.5
529.4
12
66.2
79.0
101.7
134.4
177.2
230.0
292.8
365.7
448.6
541.5
14
83.7
96.4
119.2
151.9
194.7
247.5
310.3
383.2
466.1
558.9
Hacım (dm3)
Boy (m)
16
18
20
106.6 135.0 168.8
119.4 147.7 181.5
142.1 170.4 204.2
174.8 203.2 237.0
217.6 246.0 279.7
270.4 298.8 332.5
333.2 361.6 395.4
406.1 434.4 468.2
489.0 517.3 551.1
581.9 610.2 644.0
22
208.0
220.7
243.4
276.2
318.9
371.7
434.6
507.4
590.3
683.2
24
252.6
265.3
288.0
320.8
363.6
416.4
479.2
552.0
634.9
727.8
26
302.6
315.3
338.1
370.8
413.6
466.4
529.2
602.1
684.9
777.8
Tablo incelendiğinde, beklenen değerlerin gözlenen değerlere bu defa
çok daha yakın olduğu anlaşılmaktadır.
Regresyonun varyansı: sd2=130.65,
çap'ın varyansı:
sb12=4.0523,
boy'un varyansı:
sb22=4.1815,
2
2
çap ’nin varyansı:sb3 =0.10425,
sb42=0.12502 bulunmuştur.
boy2'nin varyansı
Buna göre katsayıların önemliliği için:
tb1=-26.222/4.0523=-6.471
tb2=-8.894/4.1815=-2.123
tb4=0.6784/0.12502=5.423
tb3=1.2529/0.10425=12.018
hesaplanır.
n-k=15-5=10 SD’li t tablo değerleri, t0.05=2.228, t0.01=3.169,
t0.001=4.587’dir. O halde katsayılardan b1 %99.9 önemli, b2 önemsiz, b3 ve b4
%99.9 önemli görünmektedir. Bu durumda b2 atılarak yeni bir regresyon
eşitliği hesaplanabilir veya bu haliyle eşitlik kabul edilir.
187
26
22
18
14
10
Boy (m)
Hacım (dm3)
800
700
600
500
400
300
200
100
0
12 14 16
18 20 22
24 26 28
30
Çap (cm)
Şekil 14.14: Y=209.5-26.222çap-8.894boy+1.2529çap2+0.6784boy2
regresyonunun 3 boyutlu grafik halinde gösterilişi ve regresyon yüzeyi
Varyans analizi ise Tablo 14.15'deki gibi hesaplanmıştır.
Tablo 14.15: Misal 14.6'ya ait varyans analizi
Varyasyon Kaynağı
Regresyon
Hata
Genel
KT
883488.1
130.6
883618.7
SD
2
10
14
KO
220872.0
13.06
F
16912.1***
4’e 10 SD’li F tablo değerleri, F0.05=3.478, F0.01=5.994, F0.001=11.282
olduğuna göre, regresyon %99.9’dan yüksek güven düzeyinde önemlidir. Bu
defa hesaplanan F oranı da önceki modele nazaran belirgin şekilde
yükselmiştir.
r2=0.9998 hesaplanmıştır. Bu da %99.9 önemlidir. Demek ki eldeki 4
serbest değişken ilişkinin %99.98’ini belirtmiştir.
Genel olarak bir önceki model ile karşılaştırıldığında, bu modelin ilişkiyi
çok daha iyi temsil ettiği görülmektedir.
14.5.Regresyon Analizi ve Model Seçimi
Herhangi bir regresyon eşitliğinin hesabında, ilişkinin denklemi tam
olarak bilinmiyorsa veya düşünülen bir kaç modelden en iyisinin seçimi söz
188
konusu ise yukarıdaki misallerde anlatılan işlemler yapılarak regresyona ait
istatistikler test edilir. Bütün bu işlemler regresyon analizi olarak adlandırılır.
Özellikle çoğul regresyonlarda en iyi eşitliği (modeli) bulmak için tekrar tekrar
onlarca analiz yapmak ve grafik çizmek gerekebilir. Regresyon analizleri ve
grafik çizimleri günümüzde bilgisayarla kolaylıkla yapılabilmektedir.
Regresyon analizleri ve model seçimi şu hususlann ışığında yapılır:
• Benzeri bir konuda daha önce bir regresyon eşitliğinin hesaplanıp
hesaplanmadığı tetkik edilir veya olayın kanuniyetinin bilinip
bilinmediği araştırılır.
• Đki boyutlu bir grafikle temsil edilebilecek bir regresyon söz konusu
ise, serpilme diyagramı çizilerek noktaların nasıl bir seyir takip ettiğine
bakılır. Đki boyutlu grafiklerde noktaların seyri muhtemelen Şekil
14.10'da gösterilen modellerden birine benzeyebilir. Bu muayene ile
ayrıca, hatalı ölçülmüş veya regresyonu bozabilecek sapkın değerler de
görülebilir. Mümkünse bu değerler düzeltilir veya atılır.
• Bir çoğul regresyon üzerinde duruluyorsa ve asli değişkenler yeterli
görülmüyorsa veya bir eğrisel regresyon söz konusu ise, eşitlikte yer
alması muhtemel değişkenler türetilir.
• Korelasyon (veya belirginlik) katsayısı hesaplanarak test edilir,
önemli olup olmadığına bakılır.
• Regresyon katsayıları hesaplanarak önemlilikleri kontrol edilir.
Regresyona ait varyans analizi yapılır. F'in önemliliği kontrol edilir.
Çizilebiliyorsa regresyonun grafiği çizilir, hattın noktalara uyumu gözle
kontrol edilir.
• Özelikle grafiği çizilemeyen çoğul regresyonlarda beklenen değerler
hesaplanarak, bunların gözlenen değerlere yakınlığına bakılır. Modelde
eğrilik unsuru taşıyan değişkenlerin (karesel, kübik, logaritmik veya ters
sayı veya bunların kombinasyonları) bulunması halinde özellikle uç
değerlere uyum üzerinde durulur. Bazı modeller uçlarda kıvrılma
yapabilmektedir.
• Gözlenen sınırlar dışına ait tahmin yapılmak isteniyorsa, seçilen
modelin ekstrapolasyona uygun bir model olup olmadığı üzerinde
durulur.
• Bütün bunlar tatmin edici bir sonuç vermişse model kabul edilir.
• Özellikle uç noktalar iyi uyum sağlamamışsa, yeni değişkenler
türetilerek başka bir model aramak üzere analizlere devam edilir.
• Bir ilişki bekleniyorsa ve bütün bunlara rağmen uygun bir model
seçilememişse, verinin yetersizliği akla gelir. Bu durumda yeni veriler
toplanarak örnek büyüklüğü genişletilir.
Bazı bilgisayar programları, asli ve türetilmiş onlarca serbest değişkene
ait regresyon katsayılarını kontrol edip, önemsiz olanları ata ata sonuca giderek
189
model seçmektedirler. Bu tarz regresyon analizine step-wise (adım-adım)
analiz denmektedir. Bu metot kullanılsa bile, bilgisayarın seçtiği modele
güvenilmeyip, beklenen değerler tablosu yapılarak modelin gerçeğe uygun olup
olmadığına mutlaka bakılmalıdır.
Uygun model tesbit edildikten sonra, regresyona ait;
• korelasyon (veya belirginlik) katsayısı ve önem düzeyi,
• regresyon katsayıları ve önem düzeyleri,
• regresyonun standart hatası,
• varyans analizine ait F oranı ve önem düzeyi ile
• grafik ve gerekli hallerde beklenen değerlere ait çözüm tablosu
verilir.
190
15. t, KHĐ-KARE VE F DEĞERLERĐNE AĐT
OLASILIĞIN HESAPLANMASI
15.1.Giriş
Đstatistikte önemlilik kontrollarında, hesaplanan istatistiklerin
gerçekleşme olasılıklarını (veya güven düzeylerini) tesbit etmek amacıyla,
bilindiği gibi ilgili değerler için düzenlenmiş tablolara bakılmaktadır. Mesela t
için Ek Tablo 2'ye, khi-kare için Ek Tablo 3'e ve F için Ek Tablo 4'e bakılır.
Ancak bu tablolar, belli serbestlik derecelerine ve belli olasılık derecelerine
(genellikle 0.05 ve 0.01) göre düzenlenmişlerdir. Bazı hallerde elde edilen bir
istatistiğin mevcut serbestlik dereceleri dahilinde, tam olarak ne olasılıkta
gerçekleştiği, yani ne seviyede önemli olduğu bilinmek istenebilir. Đşte bu
bölümde bu üç istatistiğin, eldeki serbestlik derecelerine göre gerçekleşme
olasılıklarını hesaplamayı sağlayan formüller ve hesap tarzları açıklanacaktır.
Metot ilgili bilgisayar programlarında kullanılmaktadır. Formüller, üs alabilen
her hangi bir hesap makinesi ile de kolaylıkla çözülebilecek niteliktedir.
Đşlemler ne kadar çok ondalık üzerinden yapılırsa, sonucun hassasiyeti o kadar
artmaktadır.
Bu bölümün hazırlanmasında “Computer Programming in Quantitative
Biology, Davies,R.G., Academic Press, London and New York, 1971” adlı
eserden yararlanılmıştır.
15.2.t'ye Ait Olasılığın Hesabı
Her hangi bir t istatistiğinin olasılığı, kendi SD'ne ve aşağıdaki
formüllere göre hesaplanabilir. Bunun için, önce aşağıdaki formüllere göre A
ve B gibi iki değer hesaplanır:
A=
B=
2
9
2
9 × t' ye ait SD
Bunlar ve F=FT=t2 olarak hesaplanan değer:
191
(15.1)
(15.2)
 (1 − B) × FT 0.3333333 − 1 + A 



0.6666667
+A
B× F


Z=Mutlak 
(15.3)
formülünde yerine konularak Z bulunur. Ancak Z mutlak değer olarak dikkate
alınmalıdır.
t'ye ait SD 4'den küçükse (4 ve daha büyük serbestlik dereceleri için bu
işlem gerekmez), bulunmuş olan Z değeri üzerinden aşağıdaki formüle göre
yeni bir Z değeri hesaplanır:

Z=Z× 1 +

0.08 × Z 4 
(t ' ye ait SD 
(15.4)
Bu işlemlerden sonra Z, aşağıdaki (15.5) nolu formülde yerine konularak
t'nin olasılığı bulunur:
P=
0.5
(1 + Z × (0.196865 + Z × (0.115194 + Z × (0.000344 + Z × 0.019527 )))) 4
(15.5)
Bir misal olarak, 8.3 nolu maddede hesaplanan 9 SD'li t=3.943’ün oluş
ihtimali aşağıdaki gibi hesaplanabilir:
A=2/9=0.2222222
B=2/(9×9)=0.0246913
2
F = FT = 3.943 = 15.54725
 (1 − 0.0246913) × 15.54725 0.3333333 − 1 + 0.2222222 
 =2.701249


0.6666667
+ 0.2222222 
0.0246913 × 15.54725

Z=Mutlak 
t'nin serbestlik derecesi 3'den büyük olduğundan (15.4) nolu formül
kullanılmadan, doğrudan (15.5)'e göre:
P=
0 .5
=
(1 + 2.7 × (0.196865 + 2.7 × (0.115194 + 2.7 × (0.000344 + 2.7 × 0.019527)))) 4
P=0.00366 bulunur. 0.01>P>0.001 olduğundan, hesaplanan t %99 önemli
sayılır.
192
15.3.Khi-kare’ye Ait Olasılığın Hesabı
Her hangi bir Khi-kare değerinin olasılığı, yine kendi SD'ne ve
yukarıdaki formüllere göre aynı yol izlenerek hesaplanır. Ancak bu defa F
değeri olarak,
χ2
(15.6)
F= 2
χ ' ye ait SD
esas alınır. (15.6) nolu formüle göre hesaplanan F, 1'den büyükse, (15.1) ve
(15.2) nolu formüller:
A=
2
9 × χ ' ye ait SD
2
B=0
şekline dönüşür ve FT=F sayılır. F değeri 1'den küçükse bu defa:
A=0
B=
2
9 × χ 2 ' ye ait SD
olur ve FT=1/F olarak dikkate alınır.
Bundan sonraki işlemler, yine (15.3), (15.4) ve (15.5) nolu formüllere
göre yapılır. Ancak (15.4) nolu formül, sadece khi-kare SD'sinin 4'den küçük
olması halinde kullanılır; aksi halde dikkate alınmaz.
Yine bir misal olarak Madde 7.3'de hesaplanmış 3 SD'li 10.375'lik khikare değerinin olasılığını hesaplayalım:
F=10.375/3=3.4583333 bulunur. Bu değer 1’den büyük olduğu için:
A=2/(9×3)=0.07407407, B=0, FT=F’dir. Bunlara göre,
 (1 − 0) × 3.458333330.3333333 − 1 + 0.07407407 
 =2.154275277


0.6666667
0 × 3.45833333
+ 0.07407407 

Z=Mutlak 
hesaplanır. χ2'nin SD=3 olduğundan, (15.4) nolu formüle göre tekrar:

Z=2.154275277× 1 +

0.08 × 2.154275277 4 
 = 2.291752962
32

hesaplanır. Buradan çıkan sonuç:
193
P=
0.5
(1 + 2.291753 × (0.196865 + 2.291753 × (0.115194 + 2.291753 × (0.000344 + 2.291753 × 0.019527)))) 4
=
P=0.010959’dur.
0.03>P>0.01 olduğuna göre, χ2 değeri %95 önemli sayılmalıdır.
15.4.F'e Ait Olasılığın Hesabı
Bilindiği gibi F istatistiği V1, ve V2 gibi iki varyansın birbirine oranı
olup, F= V1/ V2 şeklinde hesaplanmaktadır. Varvans analizinde,
Đşlemler (veya Regresyon) Kareler ortalaması = ĐKO = V1
Hata Kareler Ortalaması (residual-error KO) = HKO = V2
olarak dikkate alındığından, burada:
A=
2
9 ×V1'e ait SD
B=
2
9 ×V2 'ye ait SD
ve FT=F’dir.
Elde edilen A, B, F ve FT üzerinden hesaplara devam edilerek olasılık
(P) bulunur. Burada da (15.4) nolu formül, V2'ye ait SD'nin (yani Hata KO'na
ait SD'nin), yalnız 4'den küçük olması halinde kullanılır.
Misal olarak, 10.3.2.4 nolu maddede bulunmuş 3.53'lük F oranının
olasılığını hesaplayalım:
FT=F=3.53'dür. Đşlemlere ait SD 4 olduğundan V1SD=4; hata'ya ait SD
15 olduğundan V2SD=15’dir. O halde:
A=2/(9×4)=0.055555
B=2/(9×15)=0.007407

(1 − 0.007407) × 3.530.3333333 − 1 + 0.055555 
=2.102111

0.007407 × 3.530.6666667 + 0.055555 


Z=Mutlak
ve (15.4) nolu formül kullanýlmadan:
P=
0.5
(1 + 2.102111 × ( 0.196865 + 2.102111 × (0.115194 + 2.102111 × ( 0.000344 × 2.102111 × 0.019527)))) 4
P=0.01764 bulunur. 0.05>P>0.01 olduğundan, F %95 önemli sayılmalıdır.
Varvans analizleri sonucunda daima 1'den büyük F değerleri üzerinde
durulduğundan, burada 1’den büyük F değerinin olasılığına ait hesap metodu
verilmiştir.
194
16. ARAŞTIRMALARIN ĐSTATĐSTĐK METOTLARA
GÖRE DEĞERLENDĐRĐLMESĐ VE SONUÇ
RAPORUNUN YAZILMASI
Ormancılıkla ilgili bilimsel araştırmalar genellikle 3 ana grupta toplanır:
• Mevcut durumu örneklemeye dayalı, ana kütleyi tanıtıcı mahiyette
araştırmalar,
• Denemelere dayalı araştırmalar,
• Yine bir örnekleme ile, sebep-sonuç ilişkisi aramaya yönelik
araştırmalar.
Araştırma sonuç raporu yazılırken, araştırma çalışmalarının yürütülmesi
sırasında yapılan bütün işler ve verinin toplanmasında kullanılan bütün
malzeme, ekipman, materyal, raporun materyal ve metot bölümünde ayrıntılı
olarak açıklanır. Elde edilen sonuçlar ise bulgular bölümünde anlatılır.
16.1.Ana Kütleyi Tanıtıcı Araştırmalar
Bu tip araştırmalar, ana kütleyi layıkıyla temsil edebilecek iyi bir
örnekleme gerektirir. Her şeyden önce örnek büyüklüğü yetersiz olmamalıdır.
Örneğin nereden (veya nerelerden), ne zaman alındığı, örneği teşkil eden
nesneler ve nasıl bir örnekleme yapıldığı rapora ayrıntılı olarak yazılır. Örneğin
ne yönüyle ele alındığı, hangi özellik veya özelliklerin; nasıl ölçüldüğü,
tartıldığı, sayıldığı anlatılır. Ölçü birimleri verilir. Örneğin ölçülmesi, tartılması
veya sayılması sonucu elde edilen veri frekans tablosunda özetlenerek ve
grafiği çizilerek populasyonun tipi belirlenir. Sonra da ilgili populasyon tipine
özgü dağılımlar yoluyla populasyon tahmin edilmeye; çalışılır.
Genellikle karşılaşılacak populasyon, normal dağılım gösteren bir
populasyondur. Böyle bir populasyonu tanıtmak için şu işlemler yapılır ve
sonuçta şu istatistikler verilir:
• Örneğin (veya örneklerin) büyüklüğü, değişim sınırları, aritmetik
ortalama ve standart sapmaları verilir.
• Ortalamanın standart hatası hesaplanarak populasyonun güven
sınırları tahmin edilir.
• Belli bir güven düzeyinde % örnekleme hatası verilir.
• Dağılımın histogramı çizilir, bu histogramdan normal dağılım eğrisi
geçirilir, beklenen frekansları hesaplanır. Normal dağılıma uygunluk
testi yapılarak, örneğin böyle bir populasyondan çekilmiş olup olmadığı
denetlenir. Sonuç normal dağılıma uygun çıkmamışsa, yapılan
195
yanlışlıklar olup olmadığı gözden geçirilir ve/veya örnek büyüklüğü
artırılmaya çalışılır. Her şeye rağmen sağlıklı bir sonuç alınamıyorsa,
bunun sebebi izah edilmeye çalışılır.
• Dağılımların oransal frekansları grafikler halinde gösterilebilir.
• Örneklerin ortalama ve s2 bakımından farklı populasyonlar ait olma
olasılığı varsa, ikili karşılaştırmalarla bu olasılıklar denetlenir. Varsa
farklılığın olasılığı belirtilir.
16.2.Denemelere Dayalı Araştırmalar
Denemeler, bir veya birkaç faktörün bir olgu üzerindeki etkisini görmek
maksadıyla tesis edilirler. Değerlendirilmelerinde genellikle varyans analizleri
kullanılır. Ormancılıkta genellikle arazi denemeleri düzenlenmektedir. Bu tür
araştırmaların raporu yazılırken şu hsuslar dikkate alınır:
• Araştırma raporunda, böyle bir denemenin ne amaçla, nerede, ne
zaman, nasıl bir deneme desenine göre kurulduğu, ne şekilde
yürütüldüğü anlatılır. Yörenin iklim, toprak özellikleri tanıtılır. Tercihan
denemenin yürütüldüğü yı1 veya yıllara ilişkin iklim istatistikleri verilir.
Deneme materyali ve üzerinde durulan özellikleri belirtilir. Yine verinin
nasıl toplandığı, ölçünün, tartının nasıl yapıldığı anlatılır. Denemenin
projede öngörülen esaslara göre yürütülüp yürütülmediği, varsa deney
ünitelerindeki kayıplar ve karşılaşılan güçlükler, istenmeyen veya yerine
getirilemeyen işlemler açıklanır.
• Denemenin bitirilmesinden ve verinin elde edilmesinden sonra
analizlere geçilir. Yapılacak analizler varyans analizleri ise, bunlar
mutlaka tertibe uygun tipte varyans analizleri olmalıdır. Her şeyden önce
bu kitapta yer almayan başka deneme tertipleri olduğu unutulmamalı ve
deneme hangi deneme tertibine uygun olarak kurulduysa veriye o analiz
tekniği uygulanmalıdır.
• Çok faktörlü denemelerin değerlendirilmesinde ve yorumunda
dikkatli olunmalıdır. Özellikle değişik yörelerde ve yıllarda yürütülen
denemelerde uygun analiz metodunun belirlenmesinde hassas
davranılmalıdır.
• Varyans analizleri ile etkileri aranan işlemlerin gerçekten etkili
(signifikant) olup olmadığı, olmuşsa güven düzeyleri bulunur ve sonuç
varyans analizi tablosunda verilir.
• Đstatistik anlamda önemli bulunan işlemlerin ortalamaları birbirleriyle
mukayese edilerek farklı (veya farksız) olanlar belirlenir. Sonuçlar
tablolarda özetlenir. Đşlemlere ilişkin tavsiyelerde bulunulurken,
uygulama kolaylığı, maliyet vs göz önünde tutulur.
• Denemenin değerlendirilmesiyle mantıksız sonuçlar elde edilmişse
196
veya mutlaka etkili olması beklenen işlemler etkisiz çıkmışsa, deneme
materyalinin iyi tetkik edilmediği, denemenin elde olan veya olmayan
sebeplerden dolayı istenildiği veya projede öngörüldüğü şekilde
yürütülemediği, denemeye sahip çıkılamadığı veya ölçmelerin hatalı
yapıldığı vs akla gelmelidir. Telafisi mümkünse bu hatalar düzeltilmeye
çalışılır; değilse sonuçlara itibar edilmeyerek deneme yenilenir veya
dosyası kapatılır. Biyolojiye ve tabii bilimlere aykırı sonuçlanmış bir
denemenin sonuçları asla yayınlanmamalıdır.
16.3.Sebep-Sonuç Đlişkisi Arayan Araştırmalar
Bu tip araştırmalarda, öncelikle aranan ilişki veya ilişkilerin mantıklı,
izah edilebilir olmasına dikkat edilmelidir. Bu tip araştırmaların
değerlendirilmesinde korelasyon, regresyon analizleri kullanılır. Normal olarak
her veri grubundan her türlü regresyon modeli geçirilebilir. Bağıntı bir basit
doğrusal regresyonla ifade edilemeyecekse, regresyon analizlerinde üzerinde
durulacak en önemli iş model seçimidir. Teorik olarak iki noktadan bir doğru,
üç noktadan bir eğri geçtiği; buna karşılık az sayıda verinin güvensizliği
hatırlanarak, regresyon analizleri için yine iyi bir örnekleme ile olabildiğince
fazla veri toplanmalıdır. Bu arada, aranacak ilişkinin basit bir korelasyonregresyon mu olduğu, yoksa eğrisel bir model ile mi temsil edilebileceği veya
bir çoğul ilişki üzerinde mi durulduğu önceden bilinebilir veya bilinmeyebilir.
Korelasyon ve regresyon analizi gerektiren durumlarda veriler şu şekilde
değerlendirilir:
• Yine önce örnek, örneğin alındığı yer, zaman ve örnekleme metodu
hakkında etraflı bilgi verilir.
• Araştırma yalnız bir korelasyon analizi ile sonuçlandırılabilecek ilişki
üzerinde duruyorsa, gerekli analizler yapılarak korelasyon (veya
belirtme) katsayısı hesaplanır, güven düzeyi belirlenir ve bunlar raporda
verilir.
• Konu bir regresyon ise ve ilişkinin kanuniyeti biliniyorsa, korelasyon
katsayısı ile birlikte regresyon katsayısı (veya katsayıları) hesaplanır,
önemlilikleri belirlenir; regresyon eşitliği ile birlikte verilir. Bunun
yanında regresyonun varyans analizi yapılarak tüm regresvonun
önemliliği belirlenir. Varyans analizi, regresyonun önemi ve regresyonun
standart hatası ile birlikte verilir. Regresyon 2 veya 3 boyutlu bir grafik
halinde gösterilebiliyorsa, bu grafikler çizilir. Çoğul regresyonlarda
ayrıca beklenen değerler tablosu verilir.
• Korelasyon ve regresyona ait istatistikler, katsayıların önemli
çıkmaları halinde verilir. Yapılan analizler sonucu beklenen ilişkiler
önemli bulunmamışsa, herhangi bir katsayı, istatistik veya grafik
verilmez. Sadece aranan ilginin bulunamadığından söz edilir.
197
• Aranan ilginin var olup olmadığı veya ne tür bir regresyon eşitliği ile
temsil edilebileceği bilinmiyorsa Madde 14.5'te açıklananlarla beraber şu
işlemler yapılır:
• Veri iki boyutlu bir koordinat sisteminde gösterilebilecekse serpilme
diyagramı çizilir ve noktalardan bir doğru veya eğri geçip geçmediği
gözle kontrol edilir. Noktalar bir doğru veya eğri üzerinde toplanma
eğilimi göstermeyip bir daire oluşturacak şekilde dağılmışlarsa, bir ilişki
olmadığına hükmedilir. Bir doğru söz konusu ise basit doğrusal
regresyonla iş bitirilir. Noktalar bir eğri üzerinde toplanma eğiliminde
ise, Şekil 14.10’da gösterilen modellerden hangilerine uyabilecekleri
belirlenir. Regresyon analizi yapılıp grafiği çizilerek bir sonuca
varılmaya çalışılır. Denenen model veriye uymamışsa, başka bir model
belirlenerek ve modeldeki değişkenler türetilerek aynı işler yapılır. Her
şeye rağmen Tablo 14.10’daki modeller veriye uymamışsa bu tabloda
bulunmayan eşitlik tipleri türetilip denenebilir. Analizlere, uygun bir
model bulununcaya kadar devam edilir.
• 3 veya daha fazla serbest değişkenli bir çoğul regresyon söz konusu
ise, önce doğrudan bunların kendileri üzerinden bir analiz yapılır. Sonuç
alınamamışsa ilişkide yer alması muhtemel çeşitli değişkenler türetilerek
bir dizi regresyon analizi yapılır. Bu maksatla varsa step-wise regresyon
analizi yapabilen bir bilgisayar programı kullanılır. Analizler sonucu bir
ilişki belirlenemezse yapılacak bir şey yoktur. Uygun bir model
belirlenirse alınan sonuçlar yukarıda açıklandığı gibi rapora yazılır.
16.4. Son Söz
Đstatistikte, öncelikle yanlış veya hatalı verilerle doğru sonuca
gidilemeyeceği hatırdan çıkarılmamalıdır. Bu sebepten, toplanan verinin doğru
ve denemenin veya örneklemenin öngördüğü şekilde elde edilmiş olmasına
dikkat edilmelidir. Değerlendirmelerde, istatistiğin bir araç, yapılan işin bir
tahmin olduğu unutulmamalıdır. Özellikle denemelerden alınan sonuçlar, o yıla
ve o yöreye, hatta o araziye ait olabilir. Bu bakımdan 0.05 olasılıklı sonuçlar
ihtiyatla karşılanmalıdır.
Bu arada, ormancılıkta objenin, türüne göre ömrü onlarca yılı aşabilen
"ağaçlar" olduğu akıldan çıkarılmamalıdır. Böyle bir obje üzerinde erken
yaşlarda istatistiğin önemli dediği bir etkinin idare müddetine yansıyıp
yansımayacağı göz önünde bulundurulmalı ve bu düşünce ile denemeler
kurulmalı ve değerlendirilmelidir.
198
FĐHRĐST
2X2 denemesi
4X3 denemesi
binom populasyonları
50
birinci derece interaksiyon
122
birleştirilmiş (toplanmış) varyans 79
bloklar
117
bölünmüş parseller
137
bölünen bölünmüş parseller
137
124
132
A
a katsayısının varyansı
157
a katsayısının önemliliği
157
alt parseller
137
alt-alt parseller
137
alternatif hipotez
63
ana kütle
43
ana parseller
137
analitik (parametrik) ortalamalar 13
analitik olmayan ortalamalar
13
ara etki
122
arc-sinüs dönüştürmesi
58
aritmetik ortalama
13
asgari önemli fark
104
atipik olaylar
2
ayrılma
31
Ç
Çarpık eğri
çarpımlar toplamı
çoğul ilişkiler
çoğul korelasyon
çoğul regresyon
çoğul regresyonun varyansı
çok basamaklı örnekleme
çubuklu diyagram
D
dağılım
dağılımın sınırları
dağılma
daire grafik
değişim
değişim genişliği
değişim katsayısı
değişken
‘den daha az tablosu
deneme
deneme desenleri
deneme parseli
deneme tertipleri
denemenin planlanması
deneysel hata
desiller
devamlı değişken
doğru denklemi
dönüştürmeler
Duncan testi
B
bağımsız değişken
bağımsız örnekler
bağımsızlık kontrolu
bağlı değişken
Bartlett testi
basit etki
basit rastgele örnekleme
basit seri
başarı
başarısızlık
beklenen değer
belirtme katsayısı
bilinçli örnekleme
Binom dağılımı
binom katsayısı
10
145
180
144
144
184
61
8
144
75
72
144
111
124
60
4
50
50
155
180
60
50
51
199
4
32
31
8
31
32
39
3,144
7
3
89,95
94
94
89
78,90
34
3
150
57
105
düzeltme faktörü (terimi)
gruplar içi kareler toplamı
97
güven düzeyi
65
güven sınırları
67,163
güven şeridi
163
38,113
E
eğrisel regresyon
165
eklemeli
(birikimli-kümülatif)
frekans tablosu
7
eksik parsel
119
ekstrapolasyon
155
en küçük kareler metodu
152
en küçük önemli fark
103
en küçük önemli genişlikler
105
error kareler toplamı
99
esas etki
124
eş yapma deneme düzeni
75,84
eşleştirilen örnekler
75,85
eşleştirilmiş örneklerin mukayesesi
etkileşim
122
H
harmonik ortalama
hata
hata kareleri ortalaması
hata kareleri toplamı
hipotez kontrolu
histogram
homojen deney materyali
homojenlik testi
Đ
iki yanlı dağılım
iki yanlı güven sınırları
iki yanlı kontrol
iki yönlü gruplandırmalar
ikinci derece interaksiyon
interaksiyon
istatistik
işlem kombinasyonları
izolasyon (tecrit) zonları
F
F istatistiği
F oranı
F oranının olasılığı
F testi
faktöriyel denemeler
faktörün seviyeleri
fonksiyon
frekans
frekans eğrisi
frekans poligonu
frekans tablosu
20
99
161
99,159
62
9
91
75
81
81
194
81
122
122
149
6
10
10
4,6
64
67
66
115
122
122
1,2
123
92
K
kaba veriler
4
karekök dönüşümü
57
kareler ortalaması
100
kareler toplamı
36
kareli ortalama
22
kartiller
32
katmanlı (tabakalı) örnekleme 61
kendi içinde eşleştirme
75
khi-kare metodu
68
khi-kare olasılığının hesabı
193
konstant (sabite)
150
kontenjans tabloları
73
kontrol parseli
92
G
Gerçekleşme olasılıkları
191
genel kareler toplamı
97,158
geometrik ortalama
17
gözlem
3
gözlem sayıları farklı gruplar 108
grafik
8
gruplandırılmış seri
4,14
gruplar arası kareler toplamı
97
200
korelasyon
korelasyon katsayısı
kota yöntemi
küçük örnek
küme örneklemesi
144
145
60
59
61
ortalama
11
ortalama sapma
34
ortalamadan ayrılışların kareleri
toplamı
36
ortalamadan sapma
31
ortalamaların ortalaması
16
ortalamanın standart hatası
41
ortanca
24
L
logaritmik dönüştürme
logaritmik fonksiyonlar
LSD metodu
57
166
104
Ö
örnek
59
örnek büyüklüğü
87
örnek ortalamalarına ait varyans 41
örnekleme hatası
163,165
örnekleme
2
örnekleme hatası %
41
M
µ (mü)
44
matematik eşitlik
148,151
matematik ilişki
148
medyan
24
medyan sınıfı
25
mekanda bölünmüş parseller 139
merkezi eğilim noktası
11
merkezi eğilim ölçüsü
11
mod
27
model I
130
model II
130
monografi
60
müşterek varyans
79
P
parabol
parametre
Pascal üçgeni
persentiller
Poisson populasyonları
polinomlar
populasyon
pozitif korelasyon
pozitif meyil
N
negatif ilişki
150
negatif korelasyon
148
negatif meyil
150
nicel (miktara bağlı, kantitatif)
özellik
3
nitel (vasıflandırılabilir, kalitatif)
özellik
2
non-signifikant
102
normal dağılış
43
normal populasyonlar
43
nümune
59
166,175
2
51
34
55
166
2
148
150
R
RXC tabloları
73
rastgele örnekleme
60
rastgelelik
2
rastlantı blokları
115
red bölgesi
66
regresyon
144
regresyon analizi
188
regresyon düzlemi
181
regresyon eşitliği
152
regresyon kareleri toplamı
159
regresyon katsayısı
150,175
O
201
step-wise (adım-adım) analiz 190
Student’in t dağılımı
63
Student-Newmann-Keuls testi 107
sürekli değişken
3
regresyon
katsayısının
güven
sınırları
157
regresyon katsayısının varyansı 155
regresyon modeli
189
regresyon varyans analizi
158
regresyon yüzeyi
181
regresyonda örnekleme hatası 163
regresyondan
ayrılış
kareleri
ortalaması
156
regresyondan ayrılışların kareleri
toplamı
156
regresyonun güven şeridi
163
regresyonun standart hatası
162
regresyonun varyansı
156
residual kareler toplamı
99
r’nin güven sınırları
148
Ş
şahit parsel
92
T
t dağılımı
63
t istatistiği
63
t istatistiğinin olasılığı
191
tahmin
67
tahminin standart hatası
162
tam (kati) değişken
3
tam ilişki
151
tartılı (ağırlıklı) ortalama
16
tasnif edilmiş seri
4
tek yanlı dağılım
65
tek yanlı güven sınırları
67
tek yanlı hipotez kontrolu
67
tek yönlü gruplandırma
96
tekrarlama (tekerrür)
76,91,94
teorik değer
155
tepe değeri
27
ters sayı fonksiyonları
166
tesadüf örneği
2
tesadüf parselleri deneme düzeni 94
transformasyonlar
57
tesadüfî model
130
tesadüfî örnekleme
2
tesadüfîlik
2
tipik olaylar
2
t kontrolu (t testi)
76
Tukey metodu
102
tüm korelasyon katsayısı
180
türetilmiş değişken
171
S
σ (sigma)
44
Σ (büyük sigma)
13
S eğrisi
166
sabit model
130
serbest değişken
144
serbestlik derecesi
36,99
seri
4
serpilme diyagramı
151
sıfır hipotezi
62
simetrik eğri
10
sınıf
5
sınıflanmış seri
14
sınıf açıklığı
5
sınıf değeri
5
sınıf genişliği
5
sınıf sayısı
5
sıralı dizi
4
sistematik (dizgeli) örnekleme 61
standart hata
157,162,173,177
standart hata şeridi
162
standart normal dağılım
46
standart normal varyant
47
standart sapma
36
U
uygunluk testi
202
69
Ü
üçüncü derece interaksiyon
122
V
varyabl
144
varyans
36
varyanslar
100
varyans analizi
94,96
varyans analizi tablosu
101
varyans kaynakları
97
varyansların eşitliğinin kontrolu 81
varyansların homojenliğinin
kontrolu
111
varyant
4
varyasyon
31
varyasyon katsayısı
39
varyasyon kaynakları
159
Y
yineleme
yoğunluk yöntemi
76,91,94
60
Z
zamanda bölünmüş parseller
139
203
204
EK TABLOLAR
205
Ek Tablo 1: z Değerleri
z
0.0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1.0
1.1
1.2
1.3
1.4
1.5
1.6
1.7
1.8
1.9
2.0
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
3.0
3.1
3.2
3.3
3.4
3.5
3.6
3.7
3.8
3.9
4.0
0.00
0.0000
0.0398
0.0793
0.1179
0.1554
0.1915
0.2257
0.2580
0.2881
0.3159
0.3413
0.3643
0.3849
0.4032
0.4192
0.4332
0.4452
0.4554
0.4641
0.4713
0.4772
0.4821
0.4861
0.4893
0.4918
0.4938
0.4953
0.4965
0.4974
0.4981
0.4987
0.4990
0.4993
0.4995
0.4997
0.4998
0.4998
0.4999
0.4999
0.5000
0.5000
0.01
0.0040
0.0438
0.0832
0.1217
0.1591
0.1950
0.2291
0.2611
0.2910
0.3186
0.3438
0.3665
0.3869
0.4049
0.4207
0.4345
0.4463
0.4564
0.4649
0.4719
0.4778
0.4826
0.4864
0.4896
0.4920
0.4940
0.4955
0.4966
0.4975
0.4982
0.4987
0.4991
0.4993
0.4995
0.4997
0.4998
0.4998
0.4999
0.4999
0.5000
0.5000
0.02
0.0080
0.0478
0.0871
0.1255
0.1628
0.1985
0.2324
0.2642
0.2939
0.3212
0.3461
0.3686
0.3888
0.4066
0.4222
0.4357
0.4474
0.4573
0.4656
0.4726
0.4783
0.4830
0.4868
0.4898
0.4922
0.4941
0.4956
0.4967
0.4976
0.4982
0.4987
0.4991
0.4994
0.4995
0.4997
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
0.03
0.0120
0.0517
0.0910
0.1293
0.1664
0.2019
0.2357
0.2673
0.2967
0.3238
0.3485
0.3708
0.3907
0.4082
0.4236
0.4370
0.4484
0.4582
0.4664
0.4732
0.4788
0.4834
0.4871
0.4901
0.4925
0.4943
0.4957
0.4968
0.4977
0.4983
0.4988
0.4991
0.4994
0.4996
0.4997
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
0.04
0.0160
0.0557
0.0948
0.1331
0.1700
0.2054
0.2389
0.2704
0.2995
0.3264
0.3508
0.3729
0.3925
0.4099
0.4251
0.4382
0.4495
0.4591
0.4671
0.4738
0.4793
0.4838
0.4875
0.4904
0.4927
0.4945
0.4959
0.4969
0.4977
0.4984
0.4988
0.4992
0.4994
0.4996
0.4997
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
0.05
0.0199
0.0596
0.0987
0.1368
0.1736
0.2088
0.2422
0.2734
0.3023
0.3289
0.3531
0.3749
0.3944
0.4115
0.4265
0.4394
0.4505
0.4599
0.4678
0.4744
0.4798
0.4842
0.4878
0.4906
0.4929
0.4946
0.4960
0.4970
0.4978
0.4984
0.4989
0.4992
0.4994
0.4996
0.4997
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
0.06
0.0239
0.0636
0.1026
0.1406
0.1772
0.2123
0.2454
0.2764
0.3051
0.3315
0.3554
0.3770
0.3962
0.4131
0.4279
0.4406
0.4515
0.4608
0.4686
0.4750
0.4803
0.4846
0.4881
0.4909
0.4931
0.4948
0.4961
0.4971
0.4979
0.4985
0.4989
0.4992
0.4994
0.4996
0.4997
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
0.07
0.0279
0.0675
0.1064
0.1443
0.1808
0.2157
0.2486
0.2794
0.3078
0.3340
0.3577
0.3790
0.3980
0.4147
0.4292
0.4418
0.4525
0.4616
0.4693
0.4756
0.4808
0.4850
0.4884
0.4911
0.4932
0.4949
0.4962
0.4972
0.4979
0.4985
0.4989
0.4992
0.4995
0.4996
0.4997
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
0.08
0.0319
0.0714
0.1103
0.1480
0.1844
0.2190
0.2517
0.2823
0.3106
0.3365
0.3599
0.3810
0.3997
0.4162
0.4306
0.4429
0.4535
0.4625
0.4699
0.4761
0.4812
0.4854
0.4887
0.4913
0.4934
0.4951
0.4963
0.4973
0.4980
0.4986
0.4990
0.4993
0.4995
0.4996
0.4997
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
0.09
0.0359
0.0753
0.1141
0.1517
0.1879
0.2224
0.2549
0.2852
0.3133
0.3389
0.3621
0.3830
0.4015
0.4177
0.4319
0.4441
0.4545
0.4633
0.4706
0.4767
0.4817
0.4857
0.4890
0.4916
0.4936
0.4952
0.4964
0.4974
0.4981
0.4986
0.4990
0.4993
0.4995
0.4997
0.4998
0.4998
0.4999
0.4999
0.4999
0.5000
0.5000
Tablo değerleri MS Excel NORMDIST(z değeri)-0.5 fonksiyonu ile elde edilmiştir.
206
Ek Tablo 2: t Değerleri
Serb.
Der.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
55
60
70
80
90
100
0.999
0.0000
0.0020
0.024
0.091
0.210
0.381
0.599
0.857
1.152
1.479
1.834
2.214
2.617
3.041
3.483
3.942
4.416
4.905
5.407
5.921
6.447
6.983
7.529
8.085
8.649
9.222
9.803
10.391
10.986
11.588
14.688
17.917
21.251
24.674
28.173
31.738
39.036
46.520
54.156
61.918
0.990
0.0002
0.0201
0.115
0.297
0.554
0.872
1.239
1.647
2.088
2.558
3.053
3.571
4.107
4.660
5.229
5.812
6.408
7.015
7.633
8.260
8.897
9.542
10.196
10.856
11.524
12.198
12.878
13.565
14.256
14.953
18.509
22.164
25.901
29.707
33.571
37.485
45.442
53.540
61.754
70.065
0.975
0.0010
0.0506
0.216
0.484
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
6.908
7.564
8.231
8.907
9.591
10.283
10.982
11.689
12.401
13.120
13.844
14.573
15.308
16.047
16.791
20.569
24.433
28.366
32.357
36.398
40.482
48.758
57.153
65.647
74.222
0.950
0.0039
0.1026
0.352
0.711
1.145
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.892
6.571
7.261
7.962
8.672
9.390
10.117
10.851
11.591
12.338
13.091
13.848
14.611
15.379
16.151
16.928
17.708
18.493
22.465
26.509
30.612
34.764
38.958
43.188
51.739
60.391
69.126
77.929
O l
0.900
0.0158
0.2107
0.584
1.064
1.610
2.204
2.833
3.490
4.168
4.865
5.578
6.304
7.041
7.790
8.547
9.312
10.085
10.865
11.651
12.443
13.240
14.041
14.848
15.659
16.473
17.292
18.114
18.939
19.768
20.599
24.797
29.051
33.350
37.689
42.060
46.459
55.329
64.278
73.291
82.358
a s ı l ı k l a r
0.500
0.100
0.455
2.706
1.386
4.605
2.366
6.251
3.357
7.779
4.351
9.236
5.348 10.645
6.346 12.017
7.344 13.362
8.343 14.684
9.342 15.987
10.341 17.275
11.340 18.549
12.340 19.812
13.339 21.064
14.339 22.307
15.338 23.542
16.338 24.769
17.338 25.989
18.338 27.204
19.337 28.412
20.337 29.615
21.337 30.813
22.337 32.007
23.337 33.196
24.337 34.382
25.336 35.563
26.336 36.741
27.336 37.916
28.336 39.087
29.336 40.256
34.336 46.059
39.335 51.805
44.335 57.505
49.335 63.167
54.335 68.796
59.335 74.397
69.334 85.527
79.334 96.578
89.334 107.565
99.334 118.498
0.050
0.025
0.010
0.001
3.841
5.024
6.635
10.827
5.991
7.378
9.210
13.815
7.815
9.348
11.345 16.266
9.488
11.143 13.277 18.466
11.070 12.832 15.086 20.515
12.592 14.449 16.812 22.457
14.067 16.013 18.475 24.321
15.507 17.535 20.090 26.124
16.919 19.023 21.666 27.877
18.307 20.483 23.209 29.588
19.675 21.920 24.725 31.264
21.026 23.337 26.217 32.909
22.362 24.736 27.688 34.527
23.685 26.119 29.141 36.124
24.996 27.488 30.578 37.698
26.296 28.845 32.000 39.252
27.587 30.191 33.409 40.791
28.869 31.526 34.805 42.312
30.144 32.852 36.191 43.819
31.410 34.170 37.566 45.314
32.671 35.479 38.932 46.796
33.924 36.781 40.289 48.268
35.172 38.076 41.638 49.728
36.415 39.364 42.980 51.179
37.652 40.646 44.314 52.619
38.885 41.923 45.642 54.051
40.113 43.195 46.963 55.475
41.337 44.461 48.278 56.892
42.557 45.722 49.588 58.301
43.773 46.979 50.892 59.702
49.802 53.203 57.342 66.619
55.758 59.342 63.691 73.403
61.656 65.410 69.957 80.078
67.505 71.420 76.154 86.660
73.311 77.380 82.292 93.167
79.082 83.298 88.379 99.608
90.531 95.023 100.425 112.317
101.879 106.629 112.329 124.839
113.145 118.136 124.116 137.208
124.342 129.561 135.807 149.449
Tablo Microsoft Excel CHIINV(olasılık,serbestlik derecesi) fonksiyonu ile hazırlanmıştır.
207
Ek Tablo 3: Khi-Kare Değerleri
Serb.
Der.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
55
60
70
80
90
100
O l a s ı l ı k l a r
0.999
0.0000
0.0020
0.024
0.091
0.210
0.381
0.599
0.857
1.152
1.479
1.834
2.214
2.617
3.041
3.483
3.942
4.416
4.905
5.407
5.921
6.447
6.983
7.529
8.085
8.649
9.222
9.803
10.391
10.986
11.588
14.688
17.917
21.251
24.674
28.173
31.738
39.036
46.520
54.156
61.918
0.990
0.0002
0.0201
0.115
0.297
0.554
0.872
1.239
1.647
2.088
2.558
3.053
3.571
4.107
4.660
5.229
5.812
6.408
7.015
7.633
8.260
8.897
9.542
10.196
10.856
11.524
12.198
12.878
13.565
14.256
14.953
18.509
22.164
25.901
29.707
33.571
37.485
45.442
53.540
61.754
70.065
0.975
0.0010
0.0506
0.216
0.484
0.831
1.237
1.690
2.180
2.700
3.247
3.816
4.404
5.009
5.629
6.262
6.908
7.564
8.231
8.907
9.591
10.283
10.982
11.689
12.401
13.120
13.844
14.573
15.308
16.047
16.791
20.569
24.433
28.366
32.357
36.398
40.482
48.758
57.153
65.647
74.222
0.950
0.0039
0.1026
0.352
0.711
1.145
1.635
2.167
2.733
3.325
3.940
4.575
5.226
5.892
6.571
7.261
7.962
8.672
9.390
10.117
10.851
11.591
12.338
13.091
13.848
14.611
15.379
16.151
16.928
17.708
18.493
22.465
26.509
30.612
34.764
38.958
43.188
51.739
60.391
69.126
77.929
0.900
0.0158
0.2107
0.584
1.064
1.610
2.204
2.833
3.490
4.168
4.865
5.578
6.304
7.041
7.790
8.547
9.312
10.085
10.865
11.651
12.443
13.240
14.041
14.848
15.659
16.473
17.292
18.114
18.939
19.768
20.599
24.797
29.051
33.350
37.689
42.060
46.459
55.329
64.278
73.291
82.358
0.500
0.100
0.050
0.025
0.010
0.001
0.455
2.706
3.841
5.024
6.635
10.827
1.386
4.605
5.991
7.378
9.210
13.815
2.366
6.251
7.815
9.348
11.345 16.266
3.357
7.779
9.488
11.143 13.277 18.466
4.351
9.236
11.070 12.832 15.086 20.515
5.348 10.645 12.592 14.449 16.812 22.457
6.346 12.017 14.067 16.013 18.475 24.321
7.344 13.362 15.507 17.535 20.090 26.124
8.343 14.684 16.919 19.023 21.666 27.877
9.342 15.987 18.307 20.483 23.209 29.588
10.341 17.275 19.675 21.920 24.725 31.264
11.340 18.549 21.026 23.337 26.217 32.909
12.340 19.812 22.362 24.736 27.688 34.527
13.339 21.064 23.685 26.119 29.141 36.124
14.339 22.307 24.996 27.488 30.578 37.698
15.338 23.542 26.296 28.845 32.000 39.252
16.338 24.769 27.587 30.191 33.409 40.791
17.338 25.989 28.869 31.526 34.805 42.312
18.338 27.204 30.144 32.852 36.191 43.819
19.337 28.412 31.410 34.170 37.566 45.314
20.337 29.615 32.671 35.479 38.932 46.796
21.337 30.813 33.924 36.781 40.289 48.268
22.337 32.007 35.172 38.076 41.638 49.728
23.337 33.196 36.415 39.364 42.980 51.179
24.337 34.382 37.652 40.646 44.314 52.619
25.336 35.563 38.885 41.923 45.642 54.051
26.336 36.741 40.113 43.195 46.963 55.475
27.336 37.916 41.337 44.461 48.278 56.892
28.336 39.087 42.557 45.722 49.588 58.301
29.336 40.256 43.773 46.979 50.892 59.702
34.336 46.059 49.802 53.203 57.342 66.619
39.335 51.805 55.758 59.342 63.691 73.403
44.335 57.505 61.656 65.410 69.957 80.078
49.335 63.167 67.505 71.420 76.154 86.660
54.335 68.796 73.311 77.380 82.292 93.167
59.335 74.397 79.082 83.298 88.379 99.608
69.334 85.527 90.531 95.023 100.425 112.317
79.334 96.578 101.879 106.629 112.329 124.839
89.334 107.565 113.145 118.136 124.116 137.208
99.334 118.498 124.342 129.561 135.807 149.449
Tablo Microsoft Excel CHIINV(olasılık,serbestlik derecesi) fonksiyonu ile hazırlanmıştır.
208
Ek Tablo 4: F Değerleri
(0.05 olasılık için)
Bölenin
Bölünenin Serbestlik Derecesi
SD
1
2
3
4
5
6
7
8
9
10
12
1
161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9
2
18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41
3
10.13 9.55
9.28
9.12
9.01
8.94
8.89
8.85
8.81
8.79
8.74
4
7.71
6.94
6.59
6.39
6.26
6.16
6.09
6.04
6.00
5.96
5.91
5
6.61
5.79
5.41
5.19
5.05
4.95
4.88
4.82
4.77
4.74
4.68
6
5.99
5.14
4.76
4.53
4.39
4.28
4.21
4.15
4.10
4.06
4.00
7
5.59
4.74
4.35
4.12
3.97
3.87
3.79
3.73
3.68
3.64
3.57
8
5.32
4.46
4.07
3.84
3.69
3.58
3.50
3.44
3.39
3.35
3.28
9
5.12
4.26
3.86
3.63
3.48
3.37
3.29
3.23
3.18
3.14
3.07
10
4.96
4.10
3.71
3.48
3.33
3.22
3.14
3.07
3.02
2.98
2.91
11
4.84
3.98
3.59
3.36
3.20
3.09
3.01
2.95
2.90
2.85
2.79
12
4.75
3.89
3.49
3.26
3.11
3.00
2.91
2.85
2.80
2.75
2.69
13
4.67
3.81
3.41
3.18
3.03
2.92
2.83
2.77
2.71
2.67
2.60
14
4.60
3.74
3.34
3.11
2.96
2.85
2.76
2.70
2.65
2.60
2.53
15
4.54
3.68
3.29
3.06
2.90
2.79
2.71
2.64
2.59
2.54
2.48
16
4.49
3.63
3.24
3.01
2.85
2.74
2.66
2.59
2.54
2.49
2.42
17
4.45
3.59
3.20
2.96
2.81
2.70
2.61
2.55
2.49
2.45
2.38
18
4.41
3.55
3.16
2.93
2.77
2.66
2.58
2.51
2.46
2.41
2.34
19
4.38
3.52
3.13
2.90
2.74
2.63
2.54
2.48
2.42
2.38
2.31
20
4.35
3.49
3.10
2.87
2.71
2.60
2.51
2.45
2.39
2.35
2.28
22
4.30
3.44
3.05
2.82
2.66
2.55
2.46
2.40
2.34
2.30
2.23
24
4.26
3.40
3.01
2.78
2.62
2.51
2.42
2.36
2.30
2.25
2.18
26
4.23
3.37
2.98
2.74
2.59
2.47
2.39
2.32
2.27
2.22
2.15
28
4.20
3.34
2.95
2.71
2.56
2.45
2.36
2.29
2.24
2.19
2.12
30
4.17
3.32
2.92
2.69
2.53
2.42
2.33
2.27
2.21
2.16
2.09
40
4.08
3.23
2.84
2.61
2.45
2.34
2.25
2.18
2.12
2.08
2.00
60
4.00
3.15
2.76
2.53
2.37
2.25
2.17
2.10
2.04
1.99
1.92
80
3.96
3.11
2.72
2.49
2.33
2.21
2.13
2.06
2.00
1.95
1.88
100
3.94
3.09
2.70
2.46
2.31
2.19
2.10
2.03
1.97
1.93
1.85
140
3.91
3.06
2.67
2.44
2.28
2.16
2.08
2.01
1.95
1.90
1.82
10000 3.84
3.00
2.61
2.37
2.21
2.10
2.01
1.94
1.88
1.83
1.75
F tabloları MS Excel FINV(olasılık,sebestlik_derecesi1,serbestlik_derecesi2) fonksiyonu ile
hazırlanmıştır.
209
Ek Tablo 4: F Değerleri (Devam)
(0.05 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
14
16
20
Bölünenin Serbestlik Derecesi
23
26
30
40
60
80
120
1000
245.4 246.5 248.0 248.8 249.5 250.1 251.1 252.2 252.7 253.3 254.2
19.42 19.43 19.45 19.45 19.46 19.46 19.47 19.48 19.48 19.49 19.49
8.71
8.69
8.66
8.64
8.63
8.62
8.59
8.57
8.56
8.55
8.53
5.87
5.84
5.80
5.78
5.76
5.75
5.72
5.69
5.67
5.66
5.63
4.64
4.60
4.56
4.53
4.52
4.50
4.46
4.43
4.41
4.40
4.37
3.96
3.92
3.87
3.85
3.83
3.81
3.77
3.74
3.72
3.70
3.67
3.53
3.49
3.44
3.42
3.40
3.38
3.34
3.30
3.29
3.27
3.23
3.24
3.20
3.15
3.12
3.10
3.08
3.04
3.01
2.99
2.97
2.93
3.03
2.99
2.94
2.91
2.89
2.86
2.83
2.79
2.77
2.75
2.71
2.86
2.83
2.77
2.75
2.72
2.70
2.66
2.62
2.60
2.58
2.54
2.74
2.70
2.65
2.62
2.59
2.57
2.53
2.49
2.47
2.45
2.41
2.64
2.60
2.54
2.51
2.49
2.47
2.43
2.38
2.36
2.34
2.30
2.55
2.51
2.46
2.43
2.41
2.38
2.34
2.30
2.27
2.25
2.21
2.48
2.44
2.39
2.36
2.33
2.31
2.27
2.22
2.20
2.18
2.14
2.42
2.38
2.33
2.30
2.27
2.25
2.20
2.16
2.14
2.11
2.07
2.37
2.33
2.28
2.24
2.22
2.19
2.15
2.11
2.08
2.06
2.02
2.33
2.29
2.23
2.20
2.17
2.15
2.10
2.06
2.03
2.01
1.97
2.29
2.25
2.19
2.16
2.13
2.11
2.06
2.02
1.99
1.97
1.92
2.26
2.21
2.16
2.12
2.10
2.07
2.03
1.98
1.96
1.93
1.88
2.22
2.18
2.12
2.09
2.07
2.04
1.99
1.95
1.92
1.90
1.85
2.17
2.13
2.07
2.04
2.01
1.98
1.94
1.89
1.86
1.84
1.79
2.13
2.09
2.03
1.99
1.97
1.94
1.89
1.84
1.82
1.79
1.74
2.09
2.05
1.99
1.96
1.93
1.90
1.85
1.80
1.78
1.75
1.70
2.06
2.02
1.96
1.92
1.90
1.87
1.82
1.77
1.74
1.71
1.66
2.04
1.99
1.93
1.90
1.87
1.84
1.79
1.74
1.71
1.68
1.63
1.95
1.90
1.84
1.80
1.77
1.74
1.69
1.64
1.61
1.58
1.52
1.86
1.82
1.75
1.71
1.68
1.65
1.59
1.53
1.50
1.47
1.40
1.82
1.77
1.70
1.67
1.63
1.60
1.54
1.48
1.45
1.41
1.34
1.79
1.75
1.68
1.64
1.61
1.57
1.52
1.45
1.41
1.38
1.30
1.76
1.72
1.65
1.61
1.57
1.54
1.48
1.41
1.38
1.33
1.25
1.69
1.64
1.57
1.53
1.50
1.46
1.40
1.32
1.28
1.22
1.08
210
Ek Tablo 4: F Değerleri
(0.025 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
1
2
3
Bölünenin Serbestlik Derecesi
4
5
6
7
8
9
10
12
647.8 799.5 864.2 899.6 921.8 937.1 948.2 956.7 963.3 968.6 976.7
38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41
17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.34
12.22 10.65 9.98
9.60
9.36
9.20
9.07
8.98
8.90
8.84
8.75
10.01 8.43
7.76
7.39
7.15
6.98
6.85
6.76
6.68
6.62
6.52
8.81
7.26
6.60
6.23
5.99
5.82
5.70
5.60
5.52
5.46
5.37
8.07
6.54
5.89
5.52
5.29
5.12
4.99
4.90
4.82
4.76
4.67
7.57
6.06
5.42
5.05
4.82
4.65
4.53
4.43
4.36
4.30
4.20
7.21
5.71
5.08
4.72
4.48
4.32
4.20
4.10
4.03
3.96
3.87
6.94
5.46
4.83
4.47
4.24
4.07
3.95
3.85
3.78
3.72
3.62
6.72
5.26
4.63
4.28
4.04
3.88
3.76
3.66
3.59
3.53
3.43
6.55
5.10
4.47
4.12
3.89
3.73
3.61
3.51
3.44
3.37
3.28
6.41
4.97
4.35
4.00
3.77
3.60
3.48
3.39
3.31
3.25
3.15
6.30
4.86
4.24
3.89
3.66
3.50
3.38
3.29
3.21
3.15
3.05
6.20
4.77
4.15
3.80
3.58
3.41
3.29
3.20
3.12
3.06
2.96
6.12
4.69
4.08
3.73
3.50
3.34
3.22
3.12
3.05
2.99
2.89
6.04
4.62
4.01
3.66
3.44
3.28
3.16
3.06
2.98
2.92
2.82
5.98
4.56
3.95
3.61
3.38
3.22
3.10
3.01
2.93
2.87
2.77
5.92
4.51
3.90
3.56
3.33
3.17
3.05
2.96
2.88
2.82
2.72
5.87
4.46
3.86
3.51
3.29
3.13
3.01
2.91
2.84
2.77
2.68
5.79
4.38
3.78
3.44
3.22
3.05
2.93
2.84
2.76
2.70
2.60
5.72
4.32
3.72
3.38
3.15
2.99
2.87
2.78
2.70
2.64
2.54
5.66
4.27
3.67
3.33
3.10
2.94
2.82
2.73
2.65
2.59
2.49
5.61
4.22
3.63
3.29
3.06
2.90
2.78
2.69
2.61
2.55
2.45
5.57
4.18
3.59
3.25
3.03
2.87
2.75
2.65
2.57
2.51
2.41
5.42
4.05
3.46
3.13
2.90
2.74
2.62
2.53
2.45
2.39
2.29
5.29
3.93
3.34
3.01
2.79
2.63
2.51
2.41
2.33
2.27
2.17
5.22
3.86
3.28
2.95
2.73
2.57
2.45
2.35
2.28
2.21
2.11
5.18
3.83
3.25
2.92
2.70
2.54
2.42
2.32
2.24
2.18
2.08
5.13
3.79
3.21
2.88
2.66
2.50
2.38
2.28
2.21
2.14
2.04
5.03
3.69
3.12
2.79
2.57
2.41
2.29
2.19
2.11
2.05
1.95
211
Ek Tablo 4: F Değerleri (Devam)
(0.025 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
14
16
20
Bölünenin Serbestlik Derecesi
23
26
30
40
60
80
120
1000
982.5 986.9 993.1 996.3 998.8 1001.4 1005.6 1009.8 1011.9 1014.0 1017.7
39.43 39.44 39.45 39.45 39.46 39.46
39.47
39.48
39.49
39.49
39.50
14.28 14.23 14.17 14.13 14.11 14.08
14.04
13.99
13.97
13.95
13.91
8.68
8.63
8.56
8.52
8.49
8.46
8.41
8.36
8.33
8.31
8.26
6.46
6.40
6.33
6.29
6.26
6.23
6.18
6.12
6.10
6.07
6.02
5.30
5.24
5.17
5.13
5.10
5.07
5.01
4.96
4.93
4.90
4.86
4.60
4.54
4.47
4.43
4.39
4.36
4.31
4.25
4.23
4.20
4.15
4.13
4.08
4.00
3.96
3.93
3.89
3.84
3.78
3.76
3.73
3.68
3.80
3.74
3.67
3.63
3.59
3.56
3.51
3.45
3.42
3.39
3.34
3.55
3.50
3.42
3.38
3.34
3.31
3.26
3.20
3.17
3.14
3.09
3.36
3.30
3.23
3.18
3.15
3.12
3.06
3.00
2.97
2.94
2.89
3.21
3.15
3.07
3.03
3.00
2.96
2.91
2.85
2.82
2.79
2.73
3.08
3.03
2.95
2.91
2.87
2.84
2.78
2.72
2.69
2.66
2.60
2.98
2.92
2.84
2.80
2.77
2.73
2.67
2.61
2.58
2.55
2.50
2.89
2.84
2.76
2.71
2.68
2.64
2.59
2.52
2.49
2.46
2.40
2.82
2.76
2.68
2.64
2.60
2.57
2.51
2.45
2.42
2.38
2.32
2.75
2.70
2.62
2.57
2.54
2.50
2.44
2.38
2.35
2.32
2.26
2.70
2.64
2.56
2.52
2.48
2.44
2.38
2.32
2.29
2.26
2.20
2.65
2.59
2.51
2.46
2.43
2.39
2.33
2.27
2.24
2.20
2.14
2.60
2.55
2.46
2.42
2.39
2.35
2.29
2.22
2.19
2.16
2.09
2.53
2.47
2.39
2.34
2.31
2.27
2.21
2.14
2.11
2.08
2.01
2.47
2.41
2.33
2.28
2.25
2.21
2.15
2.08
2.05
2.01
1.94
2.42
2.36
2.28
2.23
2.19
2.16
2.09
2.03
1.99
1.95
1.89
2.37
2.32
2.23
2.19
2.15
2.11
2.05
1.98
1.94
1.91
1.84
2.34
2.28
2.20
2.15
2.11
2.07
2.01
1.94
1.90
1.87
1.80
2.21
2.15
2.07
2.02
1.98
1.94
1.88
1.80
1.76
1.72
1.65
2.09
2.03
1.94
1.90
1.86
1.82
1.74
1.67
1.63
1.58
1.49
2.03
1.97
1.88
1.83
1.79
1.75
1.68
1.60
1.55
1.51
1.41
2.00
1.94
1.85
1.80
1.76
1.71
1.64
1.56
1.51
1.46
1.36
1.96
1.90
1.81
1.76
1.72
1.67
1.60
1.51
1.46
1.41
1.30
1.87
1.80
1.71
1.66
1.61
1.57
1.49
1.39
1.33
1.27
1.09
212
Ek Tablo 4: F Değerleri
(0.01 olasılık için)
(0.02
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
1
2
3
Bölünenin Serbestlik Derecesi
4
5
6
7
8
9
10
12
4052.2 4999.5 5403.4 5624.6 5763.6 5859.0 5928.4 5981.1 6022.5 6055.8 6106.3
98.50
99.00
99.17
99.25
99.30
99.33
99.36
99.37
99.39
99.40
99.42
34.12
30.82
29.46
28.71
28.24
27.91
27.67
27.49
27.35
27.23
27.05
21.20
18.00
16.69
15.98
15.52
15.21
14.98
14.80
14.66
14.55
14.37
16.26
13.27
12.06
11.39
10.97
10.67
10.46
10.29
10.16
10.05
9.89
13.75
10.92
9.78
9.15
8.75
8.47
8.26
8.10
7.98
7.87
7.72
12.25
9.55
8.45
7.85
7.46
7.19
6.99
6.84
6.72
6.62
6.47
11.26
8.65
7.59
7.01
6.63
6.37
6.18
6.03
5.91
5.81
5.67
10.56
8.02
6.99
6.42
6.06
5.80
5.61
5.47
5.35
5.26
5.11
10.04
7.56
6.55
5.99
5.64
5.39
5.20
5.06
4.94
4.85
4.71
9.65
7.21
6.22
5.67
5.32
5.07
4.89
4.74
4.63
4.54
4.40
9.33
6.93
5.95
5.41
5.06
4.82
4.64
4.50
4.39
4.30
4.16
9.07
6.70
5.74
5.21
4.86
4.62
4.44
4.30
4.19
4.10
3.96
8.86
6.51
5.56
5.04
4.69
4.46
4.28
4.14
4.03
3.94
3.80
8.68
6.36
5.42
4.89
4.56
4.32
4.14
4.00
3.89
3.80
3.67
8.53
6.23
5.29
4.77
4.44
4.20
4.03
3.89
3.78
3.69
3.55
8.40
6.11
5.18
4.67
4.34
4.10
3.93
3.79
3.68
3.59
3.46
8.29
6.01
5.09
4.58
4.25
4.01
3.84
3.71
3.60
3.51
3.37
8.18
5.93
5.01
4.50
4.17
3.94
3.77
3.63
3.52
3.43
3.30
8.10
5.85
4.94
4.43
4.10
3.87
3.70
3.56
3.46
3.37
3.23
7.95
5.72
4.82
4.31
3.99
3.76
3.59
3.45
3.35
3.26
3.12
7.82
5.61
4.72
4.22
3.90
3.67
3.50
3.36
3.26
3.17
3.03
7.72
5.53
4.64
4.14
3.82
3.59
3.42
3.29
3.18
3.09
2.96
7.64
5.45
4.57
4.07
3.75
3.53
3.36
3.23
3.12
3.03
2.90
7.56
5.39
4.51
4.02
3.70
3.47
3.30
3.17
3.07
2.98
2.84
7.31
5.18
4.31
3.83
3.51
3.29
3.12
2.99
2.89
2.80
2.66
7.08
4.98
4.13
3.65
3.34
3.12
2.95
2.82
2.72
2.63
2.50
6.96
4.88
4.04
3.56
3.26
3.04
2.87
2.74
2.64
2.55
2.42
6.90
4.82
3.98
3.51
3.21
2.99
2.82
2.69
2.59
2.50
2.37
6.82
4.76
3.92
3.46
3.15
2.93
2.77
2.64
2.54
2.45
2.31
6.64
4.61
3.78
3.32
3.02
2.80
2.64
2.51
2.41
2.32
2.19
213
Ek Tablo 4: F Değerleri (Devam)
(0.01 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
14
16
20
Bölünenin Serbestlik Derecesi
23
26
30
40
60
80
120
1000
6142.7 6170.1 6208.7 6229.0 6244.6 6260.6 6286.8 6313.0 6326.2 6339.4 6362.7
99.43
99.44
99.45
99.46
99.46
99.47
99.47
99.48
99.49
99.49
99.50
26.92
26.83
26.69
26.62
26.56
26.50
26.41
26.32
26.27
26.22
26.14
14.25
14.15
14.02
13.95
13.89
13.84
13.75
13.65
13.61
13.56
13.47
9.77
9.68
9.55
9.49
9.43
9.38
9.29
9.20
9.16
9.11
9.03
7.60
7.52
7.40
7.33
7.28
7.23
7.14
7.06
7.01
6.97
6.89
6.36
6.28
6.16
6.09
6.04
5.99
5.91
5.82
5.78
5.74
5.66
5.56
5.48
5.36
5.30
5.25
5.20
5.12
5.03
4.99
4.95
4.87
5.01
4.92
4.81
4.75
4.70
4.65
4.57
4.48
4.44
4.40
4.32
4.60
4.52
4.41
4.34
4.30
4.25
4.17
4.08
4.04
4.00
3.92
4.29
4.21
4.10
4.04
3.99
3.94
3.86
3.78
3.73
3.69
3.61
4.05
3.97
3.86
3.80
3.75
3.70
3.62
3.54
3.49
3.45
3.37
3.86
3.78
3.66
3.60
3.56
3.51
3.43
3.34
3.30
3.25
3.18
3.70
3.62
3.51
3.44
3.40
3.35
3.27
3.18
3.14
3.09
3.02
3.56
3.49
3.37
3.31
3.26
3.21
3.13
3.05
3.00
2.96
2.88
3.45
3.37
3.26
3.20
3.15
3.10
3.02
2.93
2.89
2.84
2.76
3.35
3.27
3.16
3.10
3.05
3.00
2.92
2.83
2.79
2.75
2.66
3.27
3.19
3.08
3.02
2.97
2.92
2.84
2.75
2.70
2.66
2.58
3.19
3.12
3.00
2.94
2.89
2.84
2.76
2.67
2.63
2.58
2.50
3.13
3.05
2.94
2.88
2.83
2.78
2.69
2.61
2.56
2.52
2.43
3.02
2.94
2.83
2.77
2.72
2.67
2.58
2.50
2.45
2.40
2.32
2.93
2.85
2.74
2.68
2.63
2.58
2.49
2.40
2.36
2.31
2.22
2.86
2.78
2.66
2.60
2.55
2.50
2.42
2.33
2.28
2.23
2.14
2.79
2.72
2.60
2.54
2.49
2.44
2.35
2.26
2.22
2.17
2.08
2.74
2.66
2.55
2.49
2.44
2.39
2.30
2.21
2.16
2.11
2.02
2.56
2.48
2.37
2.31
2.26
2.20
2.11
2.02
1.97
1.92
1.82
2.39
2.31
2.20
2.13
2.08
2.03
1.94
1.84
1.78
1.73
1.62
2.31
2.23
2.12
2.05
2.00
1.94
1.85
1.75
1.69
1.63
1.51
2.27
2.19
2.07
2.00
1.95
1.89
1.80
1.69
1.63
1.57
1.45
2.21
2.13
2.01
1.95
1.89
1.84
1.74
1.63
1.57
1.50
1.37
2.08
2.00
1.88
1.81
1.76
1.70
1.59
1.48
1.41
1.33
1.11
214
Ek Tablo 4: F Değerleri
(0.005 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
1
2
3
16211
19999
21615
Bölünenin Serbestlik Derecesi
4
5
6
7
8
22500
23056
23437
23715
23925
9
10
12
24091
24224
24426
198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39 199.40 199.42
55.55
49.80
47.47
46.19
45.39
44.84
44.43
44.13
43.88
43.69
43.39
31.33
26.28
24.26
23.15
22.46
21.97
21.62
21.35
21.14
20.97
20.70
22.78
18.31
16.53
15.56
14.94
14.51
14.20
13.96
13.77
13.62
13.38
18.63
14.54
12.92
12.03
11.46
11.07
10.79
10.57
10.39
10.25
10.03
16.24
12.40
10.88
10.05
9.52
9.16
8.89
8.68
8.51
8.38
8.18
14.69
11.04
9.60
8.81
8.30
7.95
7.69
7.50
7.34
7.21
7.01
13.61
10.11
8.72
7.96
7.47
7.13
6.88
6.69
6.54
6.42
6.23
12.83
9.43
8.08
7.34
6.87
6.54
6.30
6.12
5.97
5.85
5.66
12.23
8.91
7.60
6.88
6.42
6.10
5.86
5.68
5.54
5.42
5.24
11.75
8.51
7.23
6.52
6.07
5.76
5.52
5.35
5.20
5.09
4.91
11.37
8.19
6.93
6.23
5.79
5.48
5.25
5.08
4.94
4.82
4.64
11.06
7.92
6.68
6.00
5.56
5.26
5.03
4.86
4.72
4.60
4.43
10.80
7.70
6.48
5.80
5.37
5.07
4.85
4.67
4.54
4.42
4.25
10.58
7.51
6.30
5.64
5.21
4.91
4.69
4.52
4.38
4.27
4.10
10.38
7.35
6.16
5.50
5.07
4.78
4.56
4.39
4.25
4.14
3.97
10.22
7.21
6.03
5.37
4.96
4.66
4.44
4.28
4.14
4.03
3.86
10.07
7.09
5.92
5.27
4.85
4.56
4.34
4.18
4.04
3.93
3.76
9.94
6.99
5.82
5.17
4.76
4.47
4.26
4.09
3.96
3.85
3.68
9.73
6.81
5.65
5.02
4.61
4.32
4.11
3.94
3.81
3.70
3.54
9.55
6.66
5.52
4.89
4.49
4.20
3.99
3.83
3.69
3.59
3.42
9.41
6.54
5.41
4.79
4.38
4.10
3.89
3.73
3.60
3.49
3.33
9.28
6.44
5.32
4.70
4.30
4.02
3.81
3.65
3.52
3.41
3.25
9.18
6.35
5.24
4.62
4.23
3.95
3.74
3.58
3.45
3.34
3.18
8.83
6.07
4.98
4.37
3.99
3.71
3.51
3.35
3.22
3.12
2.95
8.49
5.79
4.73
4.14
3.76
3.49
3.29
3.13
3.01
2.90
2.74
8.33
5.67
4.61
4.03
3.65
3.39
3.19
3.03
2.91
2.80
2.64
8.24
5.59
4.54
3.96
3.59
3.33
3.13
2.97
2.85
2.74
2.58
8.14
5.50
4.47
3.89
3.52
3.26
3.06
2.91
2.78
2.68
2.52
7.88
5.30
4.28
3.72
3.35
3.09
2.90
2.75
2.62
2.52
2.36
215
Ek Tablo 4: F Değerleri (Devam)
(0.005 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
14
16
20
24572
24681
24836
Bölünenin Serbestlik Derecesi
23
26
30
40
60
24917
24980
25044
25148
25253
80
120
1000
25306
25359
25452
199.43 199.44 199.45 199.46 199.46 199.47 199.47 199.48 199.49 199.49 199.50
43.17
43.01
42.78
42.66
42.56
42.47
42.31
42.15
42.07
41.99
41.85
20.51
20.37
20.17
20.06
19.98
19.89
19.75
19.61
19.54
19.47
19.34
13.21
13.09
12.90
12.81
12.73
12.66
12.53
12.40
12.34
12.27
12.16
9.88
9.76
9.59
9.50
9.43
9.36
9.24
9.12
9.06
9.00
8.89
8.03
7.91
7.75
7.67
7.60
7.53
7.42
7.31
7.25
7.19
7.09
6.87
6.76
6.61
6.53
6.46
6.40
6.29
6.18
6.12
6.06
5.96
6.09
5.98
5.83
5.75
5.69
5.62
5.52
5.41
5.36
5.30
5.20
5.53
5.42
5.27
5.20
5.13
5.07
4.97
4.86
4.80
4.75
4.65
5.10
5.00
4.86
4.78
4.72
4.65
4.55
4.45
4.39
4.34
4.24
4.77
4.67
4.53
4.45
4.39
4.33
4.23
4.12
4.07
4.01
3.92
4.51
4.41
4.27
4.19
4.13
4.07
3.97
3.87
3.81
3.76
3.66
4.30
4.20
4.06
3.98
3.92
3.86
3.76
3.66
3.60
3.55
3.45
4.12
4.02
3.88
3.81
3.75
3.69
3.58
3.48
3.43
3.37
3.27
3.97
3.87
3.73
3.66
3.60
3.54
3.44
3.33
3.28
3.22
3.13
3.84
3.75
3.61
3.53
3.47
3.41
3.31
3.21
3.15
3.10
3.00
3.73
3.64
3.50
3.42
3.36
3.30
3.20
3.10
3.04
2.99
2.89
3.64
3.54
3.40
3.33
3.27
3.21
3.11
3.00
2.95
2.89
2.79
3.55
3.46
3.32
3.24
3.18
3.12
3.02
2.92
2.86
2.81
2.70
3.41
3.31
3.18
3.10
3.04
2.98
2.88
2.77
2.72
2.66
2.56
3.30
3.20
3.06
2.99
2.93
2.87
2.77
2.66
2.60
2.55
2.44
3.20
3.11
2.97
2.89
2.84
2.77
2.67
2.56
2.51
2.45
2.34
3.12
3.03
2.89
2.82
2.76
2.69
2.59
2.48
2.43
2.37
2.26
3.06
2.96
2.82
2.75
2.69
2.63
2.52
2.42
2.36
2.30
2.19
2.83
2.74
2.60
2.52
2.46
2.40
2.30
2.18
2.12
2.06
1.95
2.62
2.53
2.39
2.31
2.25
2.19
2.08
1.96
1.90
1.83
1.71
2.52
2.43
2.29
2.21
2.15
2.08
1.97
1.85
1.79
1.72
1.58
2.46
2.37
2.23
2.15
2.09
2.02
1.91
1.79
1.72
1.65
1.51
2.40
2.30
2.16
2.08
2.02
1.96
1.84
1.72
1.65
1.57
1.42
2.24
2.14
2.00
1.92
1.86
1.79
1.67
1.54
1.46
1.37
1.13
216
Ek Tablo 4: F Değerleri
(0.001 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
1
2
3
Bölünenin Serbestlik Derecesi
4
5
6
7
8
9
10
12
405284 499999 540379 562500 576405 585937 592873 598144 602284 605621 610668
998.50
999.00
999.17
999.25
999.30
999.33
999.36
999.37
999.39
999.40
999.42
167.03
148.50
141.11
137.10
134.58
132.85
131.58
130.62
129.86
129.25
128.32
74.14
61.25
56.18
53.44
51.71
50.53
49.66
49.00
48.47
48.05
47.41
47.18
37.12
33.20
31.09
29.75
28.83
28.16
27.65
27.24
26.92
26.42
35.51
27.00
23.70
21.92
20.80
20.03
19.46
19.03
18.69
18.41
17.99
29.25
21.69
18.77
17.20
16.21
15.52
15.02
14.63
14.33
14.08
13.71
25.41
18.49
15.83
14.39
13.48
12.86
12.40
12.05
11.77
11.54
11.19
22.86
16.39
13.90
12.56
11.71
11.13
10.70
10.37
10.11
9.89
9.57
21.04
14.91
12.55
11.28
10.48
9.93
9.52
9.20
8.96
8.75
8.45
19.69
13.81
11.56
10.35
9.58
9.05
8.66
8.35
8.12
7.92
7.63
18.64
12.97
10.80
9.63
8.89
8.38
8.00
7.71
7.48
7.29
7.00
17.82
12.31
10.21
9.07
8.35
7.86
7.49
7.21
6.98
6.80
6.52
17.14
11.78
9.73
8.62
7.92
7.44
7.08
6.80
6.58
6.40
6.13
16.59
11.34
9.34
8.25
7.57
7.09
6.74
6.47
6.26
6.08
5.81
16.12
10.97
9.01
7.94
7.27
6.80
6.46
6.19
5.98
5.81
5.55
15.72
10.66
8.73
7.68
7.02
6.56
6.22
5.96
5.75
5.58
5.32
15.38
10.39
8.49
7.46
6.81
6.35
6.02
5.76
5.56
5.39
5.13
15.08
10.16
8.28
7.27
6.62
6.18
5.85
5.59
5.39
5.22
4.97
14.82
9.95
8.10
7.10
6.46
6.02
5.69
5.44
5.24
5.08
4.82
14.38
9.61
7.80
6.81
6.19
5.76
5.44
5.19
4.99
4.83
4.58
14.03
9.34
7.55
6.59
5.98
5.55
5.23
4.99
4.80
4.64
4.39
13.74
9.12
7.36
6.41
5.80
5.38
5.07
4.83
4.64
4.48
4.24
13.50
8.93
7.19
6.25
5.66
5.24
4.93
4.69
4.50
4.35
4.11
13.29
8.77
7.05
6.12
5.53
5.12
4.82
4.58
4.39
4.24
4.00
12.61
8.25
6.59
5.70
5.13
4.73
4.44
4.21
4.02
3.87
3.64
11.97
7.77
6.17
5.31
4.76
4.37
4.09
3.86
3.69
3.54
3.32
11.67
7.54
5.97
5.12
4.58
4.20
3.92
3.70
3.53
3.39
3.16
11.50
7.41
5.86
5.02
4.48
4.11
3.83
3.61
3.44
3.30
3.07
11.30
7.26
5.73
4.90
4.37
4.00
3.72
3.51
3.34
3.20
2.98
10.83
6.91
5.43
4.62
4.11
3.75
3.48
3.27
3.10
2.96
2.75
217
Ek Tablo 4: F Değerleri (Devam)
(0.001 olasılık için)
Bölenin
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
22
24
26
28
30
40
60
80
100
140
10000
14
16
20
Bölünenin Serbestlik Derecesi
23
26
30
40
60
80
120
1000
614303 617045 620908 622933 624497 626099 628712 631337 632653 633972 636301
999.43
999.44
999.45
999.46
999.46
999.47
999.47
999.48
999.49
999.49
999.50
127.64
127.14
126.42
126.04
125.75
125.45
124.96
124.47
124.22
123.97
123.53
46.95
46.60
46.10
45.84
45.64
45.43
45.09
44.75
44.57
44.40
44.09
26.06
25.78
25.39
25.19
25.03
24.87
24.60
24.33
24.20
24.06
23.82
17.68
17.45
17.12
16.95
16.81
16.67
16.44
16.21
16.10
15.98
15.77
13.43
13.23
12.93
12.78
12.65
12.53
12.33
12.12
12.01
11.91
11.72
10.94
10.75
10.48
10.34
10.22
10.11
9.92
9.73
9.63
9.53
9.36
9.33
9.15
8.90
8.76
8.66
8.55
8.37
8.19
8.09
8.00
7.84
8.22
8.05
7.80
7.67
7.57
7.47
7.30
7.12
7.03
6.94
6.78
7.41
7.24
7.01
6.88
6.78
6.68
6.52
6.35
6.26
6.18
6.02
6.79
6.63
6.40
6.28
6.19
6.09
5.93
5.76
5.68
5.59
5.44
6.31
6.16
5.93
5.81
5.72
5.63
5.47
5.30
5.22
5.14
4.99
5.93
5.78
5.56
5.44
5.35
5.25
5.10
4.94
4.86
4.77
4.62
5.62
5.46
5.25
5.13
5.04
4.95
4.80
4.64
4.56
4.47
4.33
5.35
5.20
4.99
4.88
4.79
4.70
4.54
4.39
4.31
4.23
4.08
5.13
4.99
4.78
4.66
4.57
4.48
4.33
4.18
4.10
4.02
3.87
4.94
4.80
4.59
4.48
4.39
4.30
4.15
4.00
3.92
3.84
3.69
4.78
4.64
4.43
4.32
4.23
4.14
3.99
3.84
3.76
3.68
3.53
4.64
4.49
4.29
4.18
4.09
4.00
3.86
3.70
3.62
3.54
3.40
4.40
4.26
4.06
3.95
3.86
3.78
3.63
3.48
3.40
3.32
3.17
4.21
4.07
3.87
3.77
3.68
3.59
3.45
3.29
3.22
3.14
2.99
4.06
3.92
3.72
3.62
3.53
3.44
3.30
3.15
3.07
2.99
2.84
3.93
3.80
3.60
3.49
3.41
3.32
3.18
3.02
2.94
2.86
2.72
3.82
3.69
3.49
3.39
3.30
3.22
3.07
2.92
2.84
2.76
2.61
3.47
3.34
3.14
3.04
2.96
2.87
2.73
2.57
2.49
2.41
2.25
3.15
3.02
2.83
2.72
2.64
2.55
2.41
2.25
2.17
2.08
1.92
3.00
2.87
2.68
2.57
2.49
2.41
2.26
2.10
2.01
1.92
1.75
2.91
2.78
2.59
2.49
2.41
2.32
2.17
2.01
1.92
1.83
1.64
2.81
2.68
2.49
2.39
2.31
2.22
2.07
1.91
1.82
1.72
1.52
2.58
2.46
2.27
2.17
2.08
1.99
1.84
1.66
1.56
1.45
1.15
218
2
4.50
3.93
3.64
3.46
3.34
3.26
3.20
3.15
3.11
3.08
3.06
3.03
3.01
3.00
2.98
2.97
2.96
2.95
2.92
2.89
2.86
2.83
2.80
2.77
3
5.91
5.04
4.60
4.34
4.16
4.04
3.95
3.88
3.82
3.77
3.73
3.70
3.67
3.65
3.63
3.61
3.59
3.58
3.53
3.49
3.44
3.40
3.36
3.31
(Kalıpsız, 1981. s. 537)
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120
50000
Hata
SD
4
6.82
5.76
5.22
4.90
4.68
4.53
4.42
4.33
4.26
4.20
4.15
4.11
4.08
4.05
4.02
4.00
3.98
3.96
3.90
3.84
3.79
3.74
3.69
3.63
5
7.50
6.29
5.67
5.31
5.06
4.89
4.76
4.65
4.57
4.51
4.45
4.41
4.37
4.33
4.30
4.28
4.25
4.23
4.17
4.10
4.04
3.98
3.92
3.86
6
8.04
6.71
6.03
5.63
5.36
5.17
5.02
4.91
4.82
4.75
4.69
4.64
4.60
4.56
4.52
4.49
4.47
4.45
4.37
4.30
4.23
4.16
4.10
4.03
7
8.48
7.05
6.33
5.89
5.61
5.40
5.24
5.12
5.03
4.95
4.88
4.83
4.78
4.74
4.71
4.67
4.65
4.62
4.54
4.46
4.39
4.31
4.24
4.17
8
8.85
7.35
6.58
6.12
5.82
5.60
5.43
5.30
5.20
5.12
5.05
4.99
4.94
4.90
4.86
4.82
4.79
4.77
4.68
4.60
4.52
4.44
4.36
4.29
219
9
9.18
7.60
6.80
6.32
6.00
5.77
5.60
5.46
5.35
5.27
5.19
5.13
5.08
5.03
4.99
4.96
4.92
4.90
4.81
4.72
4.63
4.55
4.48
4.39
10
9.46
7.83
6.99
6.49
6.16
5.92
5.74
5.60
5.49
5.40
5.32
5.25
5.20
5.15
5.11
5.07
5.04
5.01
4.92
4.83
4.74
4.65
4.56
4.47
Grup Sayısı
11
9.72
8.03
7.17
6.65
6.30
6.05
5.87
5.72
5.61
5.51
5.43
5.36
5.31
5.26
5.21
5.17
5.14
5.11
5.01
4.92
4.82
4.75
4.64
4.55
Ek Tablo 5: q Değerleri
(0.05 olasılık için)
12
9.95
8.21
7.32
6.79
6.43
6.18
5.97
5.83
5.71
5.62
5.53
5.46
5.40
5.35
5.31
5.27
5.23
5.20
5.10
5.00
4.91
4.81
4.72
4.62
14
10.35
8.52
7.63
7.03
6.66
6.39
6.19
6.03
5.90
5.80
5.71
5.64
5.58
5.52
5.47
5.43
5.39
5.36
5.25
5.15
5.05
4.94
4.84
4.74
16
10.69
8.79
7.83
7.24
6.85
6.57
6.36
6.20
6.06
5.95
5.86
5.79
5.72
5.66
5.61
5.57
5.53
5.49
5.38
5.27
5.16
5.06
4.95
4.85
18
10.98
9.03
8.03
7.43
7.02
6.73
6.51
6.34
6.20
6.09
6.00
5.92
5.85
5.79
5.74
5.69
5.65
5.61
5.50
5.38
5.27
5.16
5.05
4.93
20
11.24
9.23
8.21
7.59
7.17
6.87
6.64
6.47
6.33
6.21
6.11
6.03
5.96
5.90
5.84
5.79
5.75
5.71
5.59
5.48
5.36
5.24
5.13
5.01
Hata
SD
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
24
30
40
60
120
50000
2
8.26
6.51
5.70
5.24
4.95
4.74
4.60
4.48
4.39
4.32
4.26
4.21
4.17
4.13
4.10
4.07
4.05
4.02
3.96
3.89
3.82
3.76
3.70
3.64
3
10.6
8.12
6.97
6.33
5.92
5.63
5.43
5.27
5.14
5.04
4.96
4.89
4.83
4.78
4.74
4.70
4.67
4.64
4.54
4.45
4.37
4.28
4.20
4.12
4
12.2
9.17
7.80
7.03
6.54
6.20
5.96
5.77
5.62
5.50
5.40
5.32
5.25
5.19
5.14
5.09
5.05
5.02
4.91
4.80
4.70
4.60
4.50
4.40
5
13.3
9.96
8.42
7.56
7.01
6.63
6.35
6.14
5.97
5.84
5.73
5.63
5.56
5.49
5.43
5.38
5.33
5.29
5.17
5.05
4.93
4.82
4.71
4.60
6
14.2
10.6
8.91
7.97
7.37
6.96
6.66
6.43
6.25
6.10
5.98
5.88
5.80
5.72
5.66
5.60
5.55
5.51
5.37
5.24
5.11
4.99
4.87
4.76
7
15.0
11.1
9.32
8.32
7.68
7.24
6.91
6.67
6.48
6.32
6.19
6.08
5.99
5.92
5.85
5.79
5.73
5.69
5.54
5.40
5.27
5.13
5.01
4.88
8
15.6
11.5
9.67
8.61
7.94
7.47
7.13
6.87
6.67
6.51
6.37
6.26
6.16
6.08
6.01
5.94
5.89
5.84
5.69
5.54
5.39
5.25
5.12
4.99
220
Grup Sayısı
9
10
11
16.2
16.7
17.1
11.9
12.3
12.6
9.97 10.24 10.48
8.87
9.10
9.30
8.17
8.37
8.55
7.68
7.87
8.03
7.32
7.49
7.65
7.05
7.21
7.36
6.84
6.99
7.13
6.67
6.81
6.94
6.53
6.67
6.79
6.41
6.54
6.66
6.31
6.44
6.55
6.22
6.35
6.46
6.15
6.27
6.38
6.08
6.20
6.31
6.02
6.14
6.25
5.97
6.09
6.19
5.81
5.92
6.02
5.65
5.76
5.85
5.50
5.60
5.69
5.36
5.45
5.53
5.21
5.30
5.38
5.08
5.16
5.23
Ek Tablo 5: q Değerleri (Devam)
(0.01 olasılık için)
12
17.5
12.8
10.70
9.49
8.71
8.18
7.78
7.48
7.25
7.06
6.90
6.77
6.66
6.56
6.48
6.41
6.34
6.29
6.11
5.93
5.77
5.60
5.44
5.29
14
18.2
13.3
11.08
9.81
9.00
8.44
8.03
7.71
7.46
7.26
7.10
6.96
6.84
6.74
6.66
6.58
6.51
6.45
6.26
6.08
5.90
5.73
5.56
5.40
16
18.8
13.7
11.40
10.08
9.24
8.66
8.23
7.91
7.65
7.44
7.27
7.12
7.00
6.90
6.80
6.72
6.65
6.59
6.39
6.20
6.02
5.84
5.66
5.49
18
19.3
14.1
11.68
10.32
9.46
8.85
8.41
8.07
7.81
7.59
7.42
7.27
7.14
7.03
6.94
6.85
6.78
6.71
6.51
6.31
6.12
5.93
5.75
5.57
20
19.8
14.4
11.95
10.54
9.65
9.03
8.57.
8.22
7.95
7.73
7.55
7.39
7.26
7.15
7.05
6.96
6.89
6.82
6.61
6.41
6.21
6.02
5.83
5.65
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
Olasılık
2
18.0
90.0
6.09
14.0
4.50
8.26
3.93
6.51
3.64
5.70
3.46
5.24
3.35
4.95
3.26
4.74
3.20
4.60
3.15
4.48
3.11
4.39
3.08
4.32
3.06
4.26
3.03
4.21
3.05
4.17
(Yurtsever, 1984. s. 612)
15
14
13
12
11
10
9
8
7
6
5
4
3
2
Hata
SD
1
3
18.0
90.0
6.09
14.0
4.50
8.50
4.01
6.80
3.74
5.96
3.58
5.51
3.47
5.22
3.39
5.00
3.34
4.86
3.30
4.73
3.27
4.63
3.23
4.55
3.21
4.48
3.18
4.42
3.16
4.37
4
18.0
90.0
6.09
14.0
4.50
8.60
4.02
6.90
3.79
6.11
3.64
5.65
3.54
5.37
3.47
5.14
3.41
4.99
3.37
4.88
3.35
4.77
3.33
4.68
3.30
4.62
3.27
4.55
3.25
4.50
221
Kontrol edilmekte olan iki ortalama arasındaki ortalama sayısı
5
6
7
8
9
10
12
14
18.0
18.0
18.0
18.0
18.0
18.0
18.0
18.0
90.0
90.0
90.0
90.0
90.0
90.0
90.0
90.0
3.09
6.09
6.09
6.09
6.09
6.09
6.09
6.09
14.0
14.0
14.0
14.0
14.0
14.0
14.0
14.0
4.50
4.50
4.50
4.50
4.50
4.50
4.50
4.50
8.70
8.80
8.90
8.90
9.00
9.00
9.00
9.10
4.02
4.02
4.02
4.02
4.02
4.03
4.02
4.02
7.00
7.10
7.10
7.20
7.20
7.30
7.30
7.40
3.83
3.83
3.83
3.83
3.83
3.83
3.83
3.83
6.18
6.26
6.33
6.40
6.44
6.50
6.60
6.60
3.68
3.68
3.68
3.68
3.68
3.68
3.68
3.68
5.73
5.81
5.88
5.95
6.00
6.00
6.10
6.20
3.58
3.60
3.61
3.61
3.61
3.61
3.61
3.61
5.45
5.53
5.61
5.69
5.73
5.80
5.80
5.90
3.52
3.55
3.56
3.56
3.56
3.56
3.56
3.56
5.23
5.32
5.40
5.47
5.51
5.50
5.60
5.70
3.50
3.47
3.50
3.52
3.52
3.52
3.52
3.52
5.08
5.17
5.25
5.32
5.36
5.40
5.50
5.50
3.43
3.46
3.47
3.47
3.47
3.47
3.47
3.47
4.96
5.06
5.13
5.20
5.24
5.28
5.36
5.42
3.39
3.43
3.44
3.45
3.46
4.46
3.46
3.46
4.86
4.94
5.01
5.06
5.12
5.15
5.24
5.28
3.36
3.40
3.42
4.44
3.44
3.46
3.46
3.46
4.76
4.84
4.92
4.96
5.02
5.07
5.13
5.17
3.35
3.38
3.41
3.42
3.44
3.45
3.45
3.46
4.69
4.74
4.84
4.88
4.94
4.98
5.04
5.08
3.33
3.37
3.39
3.41
3.42
3.44
3.45
3.46
4.63
4.70
4.78
4.83
4.87
4.91
4.96
5.00
3.31
3.36
3.38
3.40
3.42
3.43
3.44
3.45
4.58
4.64
4.72
4.77
4.81
4.84
4.90
4.94
Ek Tablo 6: SSR Değerleri (0.05 ve 0.01 olasılık için)
16
18.0
90.0
6.09
14.0
4.50
9.20
4.02
7.40
3.83
6.70
3.68
6.20
3.61
5.90
3.56
5.70
3.52
5.60
3.47
5.48
3.46
5.34
3.46
5.22
3.46
5.13
3.46
5.04
3.46
4.97
18
18.0
90.0
6.09
14.0
4.50
9.30
4.02
7.50
3.83
6.70
3.68
6.30
3.61
6.00
3.56
5.80
3.52
5.70
3.47
5.54
3.47
5.38
3.47
5.24
3.47
5.14
3.47
5.06
3.47
4.99
20
18.0
90.0
6.09
14.0
4.50
9.30
4.02
7.50
3.83
6.80
3.68
6.30
3.61
6.00
3.56
5.80
3.52
5.70
3.48
5.55
3.48
5.39
3.48
5.26
3.47
5.15
3.47
5.07
3.47
5.00
10000
100
60
40
30
28
26
24
22
20
19
18
17
Hata
SD
16
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
Olasılık
2
3.00
4.13
2.98
4.10
2.97
4.07
2.96
4.05
2.95
4.02
2.93
3.99
2.92
3.96
2.91
3.93
2.90
3.91
2.89
3.89
2.80
3.82
2.83
3.76
2.80
3.71
2.77
2.64
3
3.15
4.34
3.13
4.03
3.12
4.27
3.11
4.24
3.10
4.22
3.08
4.17
3.07
4.14
3.06
4.11
3.04
4.08
3.04
4.06
3.01
3.99
2.98
3.92
2.95
3.86
2.92
3.80
4
3.23
4.45
3.22
4.41
3.21
4.38
3.19
4.35
3.18
4.33
3.17
4.28
3.15
4.24
3.14
4.21
3.13
4.18
3.12
4.16
3.10
4.10
3.08
4.08
3.05
3.98
3.02
3.90
222
Kontrol edilmekte olan iki ortalama arasındaki ortalama sayısı
5
6
7
8
9
10
12
14
3.30
3.34
3.37
3.39
3.41
3.43
3.44
3.45
4.54
4.60
4.67
4.72
4.76
4.79
4.84
4.88
3.28
3.33
3.36
3.38
3.40
3.42
3.44
3.45
4.50
4.56
4.63
4.68
4.70
4.75
4.80
4.83
3.27
3.32
3.35
3.37
3.39
3.41
3.43
3.45
4.46
4.53
4.59
4.64
4.68
4.71
4.76
4.79
3.26
3.31
3.35
3.37
3.39
3.41
3.43
3.44
4.43
4.50
4.56
4.61
4.64
4.67
4.72
4.75
3.25
3.30
3.34
3.36
3.38
3.40
3.43
3.44
4.40
4.47
4.53
4.58
4.61
4.65
4.69
4.73
3.24
3.29
3.32
3.35
3.37
3.39
3.42
3.44
4.36
4.42
4.48
4.53
4.57
4.60
4.65
4.68
3.22
3.28
3.31
3.34
3.37
3.38
3.41
3.44
4.33
4.39
4.44
4.49
4.53
4.57
4.62
4.64
3.21
3.27
3.30
3.34
3.36
3.38
3.41
3.43
4.30
4.36
4.41
4.46
4.50
4.53
4.58
4.62
3.20
3.26
3.30
3.33
3.35
3.37
3.40
3.43
4.28
4.34
4.39
4.43
4.47
4.51
4.56
4.60
3.20
3.25
3.29
3.32
3.35
3.37
3.40
3.43
4.22
4.32
4.36
4.41
4.45
4.48
4.54
4.58
3.17
3.22
3.27
3.30
3.33
3.35
3.39
3.42
4.17
4.24
4.30
4.34
4.37
4.41
4.46
4.51
3.14
3.20
3.24
3.28
3.31
3.33
3.37
3.40
4.12
4.17
4.23
4.27
4.31
4.34
4.39
4.44
3.12
3.18
3.22
3.26
3.29
3.32
3.36
3.40
4.06
4.11
4.17
4.21
4.25
4.29
4.35
4.38
3.09
3.15
3.19
3.23
3.26
3.29
3.34
3.38
3.98
4.04
4.09
4.14
4.17
4.20
4.26
4.31
Ek Tablo 6: SSR Değerleri
(0.05 ve 0.01 olasılık için)
16
3.46
4.91
3.46
4.86
3.46
4.82
3.46
4.79
3.46
4.76
3.45
4.71
3.45
4.67
3.45
4.65
3.45
4.62
3.44
4.61
3.44
4.54
3.43
4.47
3.42
4.42
3.41
4.34
18
3.47
4.93
3.47
4.88
3.47
4.84
3.47
4.81
3.46
4.78
3.46
4.74
3.46
4.70
3.46
4.67
3.46
4.65
3.46
4.63
3.46
4.57
3.45
4.50
3.45
4.45
3.44
4.38
20
3.47
4.94
3.47
4.89
3.47
4.85
3.47
4.82
3.47
4.79
3.47
4.75
3.47
4.72
3.47
4.69
3.47
4.67
3.47
4.65
3.47
4.59
3.47
4.53
3.47
4.48
3.47
4.41
Ek Tablo 7: r Değerleri (0.05 ve 0.01 olasılıklar için)
r
SD
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
Olasılık
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
Bağımsız değişken adedi
1
2
3
4
0.05
0.997 0.999 0.999
0.01
1.000 1.000 1.000
0.05
0.950 0.975 0.983
0.01
0.990 0.995 0.997
0.05
0.878 0.930 0.950
0.01
0.959 0.976 0.983
0.05
0.811 0.881 0.912
0.01
0.917 0.949 0.962
0.05
0.754 0.836 0.874
0.01
0.874 0.917 0.937
0.05
0.707 0.795 0.839
0.01
0.834 0.886 0.911
0.05
0.666 0.758 0.807
0.01
0.798 0.855 0.885
0.05
0.632 0.726 0.777
0.01
0.765 0.827 0.860
0.05
0.602 0.687 0.750
0.01
0.735 0.800 0.836
0.05
0.576 0.671 0.726
0.01
0.708 0.776 0.814
0.05
0.553 0.648 0.703
0.01
0.684 0.753 0.793
0.05
0.532 0.627 0.683
0.01
0.661 0.732 0.773
0.05
0.514 0.608 0.664
0.01
0.641 0.712 0.755
0.05
0.497 0.590 0.646
0.01
0.623 0.694 0.737
0.05
0.482 0.574 0.630
0.01
0.606 0.677 0.721
0.05
0.468 0.559 0.615
0.01
0.590 0.662 0.708
0.05
0.456 0.545 0.801
0.01
0.575 0.647 0.691
0.05
0.444 0.532 0.587
0.01
0.561 0.633 0.678
0.05
0.433 0.520 0.575
0.01
0.549 0.620 0.665
0.05
0.423 0.509 0.563
0.01
0.537 0.608 0.652
0.05
0.413 0.498 0.522
0.01
0.526 0.596 0.641
0.05
0.404 0.488 0.542
0.01
0.515 0.585 0.630
0.05
0.396 0.479 0.532
0.01
0.505 0.574 0.619
r
SD
24
25
26
27
28
29
30
35
40
45
50
60
70
80
90
100
125
150
200
300
400
500
1000
223
Olasılık
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
0.05
0.01
Bağımsız değişken adedi
1
2
3
4
0.388 0.470 0.523 0.562
0.496 0.565 0.609 0.642
0.381 0.462 0.514 0.553
0.487 0.555 0.600 0.633
0.374 0.454 0.606 0.545
0.478 0.546 0.590 0.624
0.367 0.446 0.498 0.536
0.470 0.538 0.582 0.615
0.361 0.439 0.490 0.529
0.463 0.530 0.573 0.606
0.355 0.432 0.482 0.521
0.456 0.522 0.565 0.598
0.349 0.426 0.476 0.514
0.449 0.514 0.558 0.591
0.325 0.397 0.445 0.482
0.418 0.481 0.523 0.556
0.304 0.373 0.419 0.455
0.393 0.454 0.494 0.526
0.288 0.353 0.397 0.432
0.372 0.430 0.470 0.501
0.273 0.336 0.379 0.412
0.354 0.410 0.449 0.479
0.250 0.308 0.348 0.380
0.325 0.377 0.414 0.442
0.232 0.286 0.324 0.354
0.302 0.351 0.386 0.413
0.217 0.269 0.304 0.332
0.283 0.330 0.362 0.389
0.205 0.254 0.288 0.315
0.267 0.312 0.343 0.368
0.195 0.241 0.274 0.300
0.254 0.297 0.327 0.351
0.174 0.216 0.246 0.269
0.228 0.266 0.294 0.316
0.159 0.198 0.225 0.247
0.208 0.244 0.270 0.290
0.138 0.172 0.196 0215
0.181 0.212 0.234 0.253
0.113 0.141 0.160 0.176
0.148 0.174 0.192 0.208
0.098 0.122 0.139 0.153
0.128 0.151 0.167 0.180
0.088 0.109 0.124 0.137
0.115 0.135 0.150 0.162
0.062 0.077 0.088 0.097
0.081 0.096 0.106 0.116

Benzer belgeler