Bilimsel Araştırmalarda İstatistik - İç Anadolu Ormancılık Araştırma
Transkript
Bilimsel Araştırmalarda İstatistik - İç Anadolu Ormancılık Araştırma
Müdürlük Yayın No: 243 ISSN 1300 - 3933 BĐLĐMSEL ARAŞTIRMALARDA ĐSTATĐSTĐK Mehmet ERCAN ÇEŞĐTLĐ YAYINLAR SERĐSĐ NO: 6 (Genişletilmiş Đkinci Baskı) T. C. ORMAN BAKANLIĞI KAVAK VE HIZLI GELĐŞEN ORMAN AĞAÇLARI ARAŞTIRMA ENSTĐTÜSÜ MÜDÜRLÜĞÜ ĐZMĐT, 1997 YAYIN KURULU: Editorial Board: Dr. Taneri ZORALĐOĞLU Kâzım ULUER Sacit KOÇER Engin ERTAN Mehmet ERCAN YAYINLAYAN: Kavak ve Hızlı Gelişen Orman Ağaçları Araştırma Enstitüsü Müdürlüğü P.K. 93 41001 Đzmit/TÜRKĐYE PUBLISHED BY: Poplar and Fast Growing Forest Trees Research Institute P.O. Box: 93 Đzmit/TURKEY Tel: 0262 3116964-3116965 Fax: 0262 3116972 T. C. ORMAN BAKANLIĞI KAVAK VE HIZLI GELĐŞEN ORMAN AĞAÇLARI ARAŞTIRMA ENSTĐTÜSÜ MÜDÜRLÜĞÜ’nde basılmıştır. II ĐÇĐNDEKĐLER 1. TANIMLAR, SAYILARIN ELDE EDĐLMESĐ VE ÖZETLENMESĐ...........1 1.1.Đstatistik .....................................................................................................1 1.2.Tarifler, Tanımlar ......................................................................................1 1.2.1.Toplu Olayların Özelliği, Tesadüfîlik, Örnekleme, Tesadüf Örneği..1 1.2.2.Populasyon ve Nümune (Örnek) ........................................................2 1.2.3.Đstatistik ve Parametre ........................................................................2 1.2.4.Deneme ..............................................................................................3 1.3.Sayıların (Verinin) Elde Edilmesi .........................................................3 1.4.Sayıların Özetlenmesi ...............................................................................4 1.4.1.Sıralı Dizi ...........................................................................................4 1.4.2.Frekans Tablosu .................................................................................4 1.4.2.1.Eklemeli (Kümülatif) Frekans Tablosu.......................................7 1.4.3. Grafikler ............................................................................................8 1.4.3.1.Daire (Pasta) Grafik ....................................................................8 1.4.3.2.Çubuklu Diyagram ......................................................................8 1.4.3.3.Histogram....................................................................................9 1.4.3.4.Frekans Poligonu ve Frekans Eğrisi..........................................10 2. MERKEZĐ EĞĐLĐM ÖLÇÜLERĐ .................................................................11 2.1.Ortalamanın Tanımı ve Özellikleri .........................................................11 2.1.1.Ortalamaların Genel Özellikleri .......................................................11 2.1.2.Ortalamaların Üstünlükleri...............................................................11 2.1.3.Ortalamaların Kusurları....................................................................12 2.1.4.Ortalamaların Kusurlarını Gidermenin Yolları ................................12 2.2.Ortalamaların Sınıflandırılması...............................................................13 2.3.Analitik Ortalamalar................................................................................13 2.3.1.Aritmetik Ortalama ..........................................................................13 2.3.1.1.Basit Serilerde Aritmetik Ortalama...........................................13 2.3.1.2.Sınıflanmış Serilerde Aritmetik Ortalama.................................14 2.3.1.3.Gruplanmış Serilerde Aritmetik Ortalama ................................14 2.3.1.4.Aritmetik Ortalamanın Özellikleri ............................................15 2.3.2.Tartılı (Ağırlıklı) Aritmetik Ortalama ..............................................16 2.3.3.Geometrik Ortalama .........................................................................17 2.3.3.1.Basit Serilerde Geometrik Ortalama .........................................17 2.3.3.2.Sınıflandırılmış Serilerde Geometrik Ortalama.........................18 2.3.3.3.Gruplandırılmış Serilerde Geometrik Ortalama ........................18 2.3.3.4.Geometrik Ortalamanın Özellikleri...........................................19 2.3.4.Ahenkli (Harmonik) Ortalama .........................................................20 2.3.4.1.Basit Serilerde Harmonik Ortalama ..........................................20 2.3.4.2.Gruplanmış Serilerde Harmonik Ortalama................................20 2.3.4.3.Gruplanmış Serilerde Harmonik Ortalama................................21 2.3.4.4.Harmonik Ortalamanın Özellikleri............................................21 2.3.5.Kareli (Kuadratik) Ortalama ............................................................22 2.3.5.1.Basit Serilerde Kareli Ortalama ................................................22 2.3.5.2.Sınıflanmış Serilerde Kareli Ortalama ......................................22 2.3.5.3.Gruplanmış Serilerde Kareli Ortalama......................................23 2.3.5.4.Kareli Ortalamanın Özellikleri..................................................23 2.3.6.Analitik Ortalamaların Büyüklük Sırası...........................................24 2.4.Analitik Olmayan Ortalamalar ................................................................24 2.4.1.Medyan (Ortanca) ............................................................................24 2.4.1.1.Basit Serilerde Medyan .............................................................24 2.4.1.2.Sınıflanmış Serilerde Medyan...................................................25 2.4.1.3.Gruplanmış Serilerde Medyan...................................................25 2.4.1.4.Medyanın Özellikleri.................................................................26 2.4.2.Mod (Tepe Değeri)...........................................................................27 2.4.2.1.Basit Serilerde Mod...................................................................27 2.4.2.2.Sınıflanmış Serilerde Mod ........................................................27 2.4.2.3.Gruplanmış Serilerde Mod ........................................................28 2.4.2.4.Modun Özellikleri, Elverişli Olduğu ve Olmadığı Haller .........29 2.5.Ortalama Seçiminde Göz Önüne Alınacak Esaslar .................................29 2.6.Ortalamalar Arası Bağıntılar ...................................................................29 3. DAĞILMA, DEĞĐŞĐM, VARYASYON ......................................................31 3.1.Giriş.........................................................................................................31 3.2.Serinin Bütün Terimlerinin Hesaba Katılmadığı Dağılım Ölçüleri ........31 3.2.1.Dağılım Sınırları ve Değişim Genişliği (Varyasyon Genişliği) .......32 3.2.2.Kartiller (Çeyrekler).........................................................................32 3.2.2.l.Basit Serilerde Kartiller..............................................................32 3.2.2.2.Sınıflandırılmış Serilerde Kartiller............................................33 3.2.2.3.Gruplandırılmış Serilerde Kartiller ...........................................33 3.3.Serinin Bütün Terimlerinin Hesaba Katıldığı Dağılım Ölçüleri .............34 3.3.1.Ortalama Sapma (Mutlak Farklar Ortalaması).................................34 3.3.1.1.Basit Serilerde Ortalama Sapma................................................34 3.3.1.2.Sınıflanmış Serilerde Ortalama Sapma .....................................35 3.3.1.3.Gruplanmış Serilerde Ortalama Sapma .....................................35 3.3.2.Varyans ve Standart Sapma..............................................................36 3.3.2.1.Serbestlik Derecesi Kavramı .....................................................36 3.3.2.2.Basit Serilerde Varyans ve Standart Sapma ..............................37 3.3.2.2.1.Varyans ve Standart Sapmanın Kolay Hesabı ..............................37 3.3.2.3.Sınıflanmış Serilerde Varyans ve Standart Sapma ....................38 3.3.2.4.Gruplanmış Serilerde Varyans ve Standart Sapma ...................38 3.4.Varyasyon Katsayısı (Nisbi Standart Ayrılış) .........................................39 3.5.Ortalamaların Dağılımı, Ortalamanın Standart Hatası ............................40 II 3.6.Ortalamanın Örnekleme Hatası (%) ........................................................41 4. POPULASYONLARIN BELĐRLENMESĐ ..................................................43 4.1.Giriş.........................................................................................................43 4.2.Normal Populasyonlar.............................................................................43 4.2.1.Normal Dağılımın Parametreleri ......................................................44 4.2.2.Normal Dağılımın Özellikleri ..........................................................44 4.2.3.Normal Eğri Formülünden Yararlanılarak Bir Dağılımın Hesaplanması ............................................................................................45 4.2.4.Standart Normal Dağılım .................................................................46 4.2.5.Standart Normal Dağılım Uygulamaları ..........................................47 4.3.Binom Populasyonları .............................................................................50 4.3.1.Binom Dağılımında Olasılıklar ve Katsayılar ..................................50 4.3.2.Binom Populasyonunun Parametreleri.............................................52 4.3.3.Binom Dağılımının Özellikleri.........................................................53 4.3.4.Binomiyal Dağılım Uygulamaları ....................................................53 4.4.Poisson Populasyonları ...........................................................................55 4.4.1.Poisson Dağılımının Parametreleri ve Özelliği ................................56 4.5.Normal Olmayan Populasyonlar ve Sayı Dönüştürmeleri (Transformasyonlar)......................................................................................57 4.5.1.Kare Kök Dönüştürmesi...................................................................57 4.5.2.Logaritmik Dönüştürme ...................................................................57 4.5.3.Arc-Sinüs Dönüştürmesi ..................................................................58 5. ÖRNEKLEME ..............................................................................................59 5.1.Giriş.........................................................................................................59 5.2.Örnek ve Örneklemeye Ait Genel Bilgiler..............................................59 5.3.Örnekleme Metotları ...............................................................................60 5.3.1.Bilinçli Örnekleme Metotları ...........................................................60 5.3.2.Rastgele Örnekleme Metotları..........................................................60 6. HĐPOTEZ KONTROLLARI VE GÜVEN ARALIĞI ..................................62 6.1.Giriş.........................................................................................................62 6.2.Hipotez Kontrolu.....................................................................................62 6.2.1.t Đstatistiği ve t Dağılımı...................................................................63 6.2.2.Populasyon Ortalaması Đle Đlgili Hipotez Kontrolu..........................65 6.3.Populasyon Ortalamasının Tahmini ve Güven Sınırları..........................67 7. SAYIMLA BELĐRLENEN POPULASYONLARDA HĐPOTEZ KONTROLU.....................................................................................................68 7.1.Giriş.........................................................................................................68 7.2.Khi-kare Değeri ve Khi-kare Dağılımı....................................................68 7.2.1.Nümunenin Normal Dağılıma Uygunluğunun Kontrolu..................70 7.2.2.Binomiyal Dağılıma Uygunluğun Kontrolu.....................................71 7.3.Bağımsızlık Kontrolu (R× ×C Tabloları) ...................................................72 III 7.4.Homojenlik Kontrolu ..............................................................................75 8.ĐKĐ ĐŞLEMĐN MUKAYESESĐ ......................................................................76 8.1.Giriş.........................................................................................................76 8.2.Bağımsız (Eşleştirilmemiş) Đki Örneğin Karşılaştırılması ......................77 8.2.1.Varyansları Eşit Sayılan Đki Bağımsız Örneğin Karşılaştırılması ....77 8.2.1.1.Varyansları Eşit, Farklı Büyüklükte Đki Bağımsız Örneğin Karşılaştırılması ....................................................................................77 8.2.1.2.Varvansları Eşit, Aynı Büyüklükte iki Tesadüf Nümunesinin Karşılaştırılması ....................................................................................80 8.2.2.Varyansları Eşit Olmayan Đki Bağımsız Örneğin Karşılaştırılması..81 8.2.2.1. F-testi Đle Varyansların Eşitliğinin (Homojenliğinin) Kontrolu ...............................................................................................................81 8.2.2.2.Varyansları Farklı, Farklı Sayıda Đki Bağımsız Örneğin Karşılaştırılması ....................................................................................82 8.2.2.3.Varyansların Farklı, Aynı Sayıda Đki Bağımsız Örneğin Karşılaştırılması ....................................................................................84 8.3.Eşleştirilmiş Đki Örneğin Karşılaştırılması (Eş Yapma Deneme Tertibi)84 8.4.Đki Ortalama Arasındaki Farkın Güven Sınırları.....................................86 8.5.Örnek Büyüklüğünün Tayini...................................................................87 9. DENEME KURMANIN GENEL ESASLARI .............................................89 9.1.Giriş.........................................................................................................89 9.2.Denemenin Planlanması..........................................................................89 9.3.Denemenin Tertiplenmesi .......................................................................89 9.3.1.Deneysel Hata ve Đşlemlerin Farklılığı.............................................90 9.3.2.Deneysel Hatayı Küçültmenin Yolları .............................................91 9.3.2.1.Homojen Deney Materyali ........................................................91 9.3.2.2.Tesadüfîlik, Rastgele Dağılım...................................................91 9.3.2.3.Tekrarlama (Yineleme, Tekerrür, Replikasyon) .......................91 9.4.Denemenin Amaçları...............................................................................92 9.5.Deneme Parsellerinin Büyüklüğü, Şekli ve Yönü...................................92 9.6.Ölçülerde Hassasiyet ...............................................................................93 10. RASTLANTI (TESADÜF) PARSELLERĐ ................................................94 DENEME TERTĐBĐ..........................................................................................94 l0.1.Giriş........................................................................................................94 10.2.Rastlantı Parselleri Deneme Tertibi ve Uygulanması ...........................94 10.3.Tesadüf Parselleri Deneme Tertibinde Varyans Analizi .......................96 10.3.1.Varyans Analizinin Esasları ve Hipotezler.....................................96 10.3.2.Varyans Analizinin Uygulanması ..................................................97 10.3.2.1.Kareler Toplamlarının Hesabı .................................................98 10.3.2.2.Serbestlik Derecelerinin (SD) Hesabı .....................................99 10.3.2.3. Kareler ortalamalarının (Varyansların) Hesabı ....................100 IV 10.3.2.4.Varyans Analizi Tablosu ve Hipotezin Kontrolu ..................100 10.4.Farklı Gurupların Tesbiti (Ortalamaların Mukayesesi).......................102 10.4.1.Tukey Metodu ..............................................................................102 10.4.2.LSD Metodu.................................................................................104 10.4.3.Duncan Testi ................................................................................105 10.4.4.Student-Newman-Keuls Testi ......................................................107 10.5.Rastlantı Parselleri Deneme Tertibinde Tekrarlamaların Farklı Sayıda Olması Hali .................................................................................................108 10.5.1.Varyans Analizi............................................................................108 10.5.2.Farklı Grupların Tesbiti................................................................110 10.6.Varyansların Homojenliğinin Kontrolu (Bartlett Testi)......................111 10.6.1.Varyant Sayısı Eşit Gruplarda Bartlett Testi................................112 10.6.2.Varyant Sayısı Farklı Gruplarda Bartlett Testi.............................113 11. RASTLANTI BLOKLARI DENEME TERTĐBĐ......................................115 11.1.Giriş.....................................................................................................115 11.2.Denemenin Uygulanması ....................................................................115 11.3.Rastlantı Bloklarında Kurulmuş Denemelerde Varyans Analizi.........117 11.4.Tesadüf Bloklarında Eksik Değerler ...................................................119 12. FAKTÖRĐYEL (ÇOK FAKTÖRLÜ) DENEMELER ..............................122 12.1.Giriş.....................................................................................................122 12.2.Rastlantı Parsellerinde Faktöriyel Deneme Tertibi .............................123 12.2.1.Denemenin Kurulması..................................................................123 12.2.2.Faktöriyel Denemelerde Etkiler ...................................................124 12.2.3.Tesadüf Parsellerinde 2×2 Denemesinin Analizi .........................125 12.2.3.1.Kareler Toplamları ve Serbestlik Dereceleri.........................126 12.2.3.2.Ortalamaların Mukayesesi.....................................................128 12.2.3.3.Faktöriyel Denemelerde Hipotezlerin Kontrollarına Ait Bazı Açıklamalar .........................................................................................129 12.3.Tesadüf Bloklarında Faktöriyel Deneme ve Analizi ...........................130 12.3.1.Denemenin Kurulması..................................................................130 12.3.2.Faktöriyel Varyans Analizi ..........................................................132 13. BÖLÜNMÜŞ PARSELLER DENEME TERTĐBĐ ...................................137 13.1. Giriş....................................................................................................137 13.2.Bölünmüş Parseller Tertibine Göre Denemenin Kurulması................137 13.3.Bölünmüş Parsellere Uygun Deneme Tipleri ve Tertibin Özellikleri .138 13.4.Tesadüf Bloklarında Bölünmüş Parsellerde Varyans Analizi .............139 13.5.Bölünmüş Parsellerde s X 'in Hesabı....................................................142 l4. KORELASYON VE REGRESYON .........................................................144 14.1.Giriş.....................................................................................................144 14.2.Basit Korelasyon ve Regresyon ..........................................................145 14.2.1.Basit Korelasyon ..........................................................................145 V 14.2.1.1.Korelasyon Katsayısının Hesabı ...........................................145 14.2.1.2.Korelasyon Katsayısının Standart Hatası, Önemliliğinin Kontrolu ve Güven Sınırları................................................................147 14.2.1.3.Korelasyon Katsayısının Özellikleri .....................................148 14.2.2.Basit Doğrusal Regresyon............................................................149 14.2.2.1.Y=a+bX Denkleminin Özellikleri.........................................150 14.2.2.2.Matematik Eşitlik ve Regresyon Eşitliği...............................151 14.2.2.3.Regresyon Eşitliğinin Hesabı ................................................152 14.2.2.3.1.b ve a'nın Standart Hatası, Önemliliği ve Güven Sınırları ........155 14.2.2.3.1.1. b Katsayısının Standart Hatası, Önemliliği ve Güven Sınırları........................................................................................155 14.2.2.3.1.2. a Katsayısının Standart Hatası ve Güven Sınırları .157 14.2.2.4.Regresyonda Varyans Analizi ve Regresyonun Varyans Analizi ile Kontrolu.............................................................................158 14.2.2.5.Regresyonun Varyansı ve Standart Sapması.........................161 14.2.2.6.Regresyonun Örnekleme Hatası ve Güven Şeridi .................163 14.2.2.6.1. X Ortalama Değerinin Örnekleme Hatası ve Regresyonun Güven Şeridi..........................................................................................................163 14.2.2.6.2.Tek Bir X Değerinin Örnekleme Hatası ve Güven Şeridi.........164 14.3.Doğrusal Olmayan (Eğrisel) Đlişkiler ..................................................165 14.3.1.Çok Kullanılan Eğrisel Modeller ve Özellikleri...........................166 14.3.2.Eğrisel Đlişkilerde Korelasyon ve Regresyon ...............................171 14.3.2.1.Bir Logaritmik Regresyonun Hesaplanması .........................171 14.3.2.2.Bir Parabolün Hesaplanması .................................................175 14.4.Çoğul Đlişkilerde Korelasyon ve Regresyon........................................180 14.4.1. Çoğul Korelasyon ve Regresyon Katsayılarının Hesabı .............181 14.5.Regresyon Analizi ve Model Seçimi...................................................188 15. t, KHĐ-KARE VE F DEĞERLERĐNE AĐT OLASILIĞIN HESAPLANMASI..........................................................................................191 15.1.Giriş.....................................................................................................191 15.2.t'ye Ait Olasılığın Hesabı ....................................................................191 15.3.Khi-kare’ye Ait Olasılığın Hesabı.......................................................193 15.4.F'e Ait Olasılığın Hesabı .....................................................................194 16. ARAŞTIRMALARIN ĐSTATĐSTĐK METOTLARA GÖRE DEĞERLENDĐRĐLMESĐ VE SONUÇ RAPORUNUN YAZILMASI ......................195 16.1.Ana Kütleyi Tanıtıcı Araştırmalar ..................................................................195 16.2.Denemelere Dayalı Araştırmalar ....................................................................196 16.3.Sebep-Sonuç Đlişkisi Arayan Araştırmalar......................................................197 16.4. Son Söz ..........................................................................................................198 FĐHRĐST EK TABLOLAR 199 205 VI ÖNSÖZ Bilimsel araştırmalarda istatistiğin önemi bilinmektedir. Bu bakımdan, araştırma kuruluşlarında Araştırmacı olarak görev yapmakta olan herkesin, istatistiğin temel prensipleri ve ana konuları hakkında genel bir bilgi sahibi olması istenir. Müdürlüğümüz araştırmacı personelini bu yönüyle bilgilendirmek maksadıyla, 1993 sonbaharında bir eğitim düzenlenmiş, daha sonra eğitim notları geliştirilerek bu kitap ortaya çıkarılmıştır. Kitapta, ancak basit metodlar ele alınarak temel bilgiler verilmiştir. Konular teoriye boğulmadan, ormancılık ve özellikle kavakçılığa ait misaller üzerinden açıklanmaya çalışılmıştır. Kitap hazırlanırken, şu üç eserden ağırlıklı olarak yararlanılmıştır: - Düzgüneş, O. 1963. Bilimsel Araştırmalarda Đstatistik Prensipleri ve Metodları. Ege Üniversitesi Matbaası, Đzmir. - Kalıpsız, A. 1981.Đstatistik Yöntemler. Đ. Ü. Orman Fakültesi Yayınları, Đ. Ü. Yayın No: 2837, O. F. Yayın No: 294, Đstanbul. - Yurtsever, N. 1984. Deneysel Đstatistik Metodlar. Tarım Orman ve Köyişleri Bakanlığı, Köy Hizmetleri genel Müdürlüğü, Toprak ve Gübre Araştırma Enstitüsü Müdürlüğü Yayınları, Ankara. G.Y. No: 121, T. Y. No: 56. Đstatistik sahasındaki Türkçe yayınlara bir göz atıldığında, bunlardan çoğunun ekonomi ağırlıklı olduğu görülür. Konumuzu teşkil eden biyometri ağırlıklı eserler azınlıkta kalmaktadır. Bu bakımdan, kitabın istatistiğe ve özellikle ormancılık araştırmalarına yeni başlayanlara yararlı olmasını dilerim. Notları bilgisayarda yazan Yasemin ÖZCAN’a teşekkür ederim. Mehmet ERCAN Đzmit, Nisan 1995 VII VIII ĐKĐNCĐ BASKIYA ÖNSÖZ Kavakçılık Araştırma Enstitüsü tarafından ilk baskısı 1995’te yapılan Bilimsel Araştırmalarda Đstatistik isimli kitap, geçen süre içinde tükenmiştir. Bunun üzerine kitabın yeniden basılması gündeme gelmiştir. Kitap ikinci baskıya verilmeden önce, ilk baskısında yer almayan nonparametrik metodlar kısaca ele alınmış, ayrıca bazı yeni bölümler ilave edilmiştir. Bu cümleden olarak, Ortalamalar ana başlığı altına ilaveler yapılmış, Populasyonlar daha geniş olarak tanıtılmaya çalışılmış, Örnekleme ile Araştırmaların Đstatistik Metodlara Göre Değerlendirilmesi ve Sonuç Raporunun Yazılması isimli yeni iki ana başlık ilave edilmiştir. Son olarak, Korelasyon ve Regresyon bölümü bazı ilavelerle daha detaylı olarak açıklanmaya çalışılmış, değişik regresyon modelleri üzerinde örneklerle durulmuştur. Bu çalışmalar sırasında, yine Düzgüneş 1963 ve Kalıpsız 1981’in yanında, non-parametrik metodların yazılmasında, “Đstatistik Metotlar, 1994. Prof. Dr. Fahri Batu,Karadeniz Teknik Üniversitesi, Trabzon” isimli eserden yararlanılmıştır. Araştırmacılara ve tüm okuyuculara yararlı olmasını ve hatalarımın bağışlanmasını dilerim. Mehmet ERCAN Đzmit, 1997 IX X 1. TANIMLAR, SAYILARIN ELDE EDĐLMESĐ VE ÖZETLENMESĐ 1.1.Đstatistik "Đstatistik” çeşitli şekillerde tarif edilmektedir. Bunlardan bazıları aşağıdaki gibidir: Đstatistik, toplu (kollektif) olayları gözlemek (sayarak, ölçerek, tartarak), özelliklerine göre ayırmak (sınıflamak, özetlemek) ve birbirleriyle mukavese etmek suretiyle toplumu inceleyen bir bilim dalıdır. Bu tarifte istatistiğin "veri toplama, olayları tanıma" özelliği ön plana çıkmaktadır ve iki önemli unsur söz konusudur: • Đstatistik toplu olaylara uygulanır. • Đstatistik gözleme dayanır. Đstatistik, bir olay veya olayların etkinlik derecesini uygun örnekler üzerinde belirlemeye çalışan ve bunlara ait metodlar geliştiren bir bilim dalıdır. Bu tarifte ise istatistik, bilimsel amaçlı deneme kurma ve değerlendirme bilimi olarak tanımlanmaktadır. Đstatistik, toplu olayları inceleyen ve bunlara ilişkin bağıntıları, sebep sonuç ilişkilerini ortaya çıkaran bir bilim dalıdır. Bu tarifte de istatistik, 14. bölümde "Korelasyon, Regresyon" başlığı altında inceleneceği yönüyle ele alınmaktadır. Bu açıklamalara göre istatistiğin, 3 ana konu üzerinde çalıştığı anlaşılmaktadır: • Sayıların (verinin) elde edilmesi- özetlenmesi, • Deneme düzenleme, sonuçların yorumu, genelleştirilmesi, • Đki ya da daha fazla özellik arasında ilişki aranması. Đstatistik bilimi, üzerinde çalışılan konuları değerlendirme ve ifade etmede araştırmacının en büyük yardımcısıdır. 1.2.Tarifler, Tanımlar 1.2.1.Toplu Olayların Özelliği, Tesadüfîlik, Örnekleme, Tesadüf Örneği Yukarıda istatistiğin, toplu - kollektif - yığın olaylarını inceleyen bir bilim dalı olduğu ifade edilmiştir. Sosyal olaylar, ekonomik olaylar ve canlılara ilişkin olaylar kollektif olaylardır. Bu tür olaylara atipik olaylar denir. Atipik olaylarda kesinlik yoktur. Bazı vasıfları müşterek olmakla beraber, bireysel değişiklikler gösteren olaylardır. Mesela herkesin kolu vardır ama kol uzunluğu kişiden kişiye değişir. Veya her ağacın boyu zamanla uzar, ama belli bir yaşta hepsinin boyu farklıdır. Atipik olayların karşıtı, tipik olaylardır. Tipik olaylara genellikle fizik, kimya, matematikte rastlanır. Bu olaylarda bir birimin gözlemlenmesiyle tümü hakkında bilgi sahibi olunur. Mesela dairenin yarıçapı biliniyorsa çevresi kesin olarak bulunabilir. Đstatistik biliminde sayıların (verinin) toplanmasında birinci prensip tesadüfîliktir (rastgelelik). Tesadüfîlikten maksat, verinin toplanmasında hiçbir ayrım gözetmeden, beğenip - seçmeden araştırmaya konu olacak örneklerin alınmasıdır. Mesela bir kavaklıktan çap örneklemesi yapılırken hep kalın ağaçların ölçülmemesi gibi. Đstatistiğin bu yönü, örnekleme adıyla ayrı bir bilim dalı haline gelmiş ve 5. Bölümde açıklanacağı üzere çeşitli örnekleme metodları geliştirilmiştir. Örneklemede tesadüfîliğe uyulmalı ve bireylerden her birinin örneğe girme şansı eşit tutulmalıdır. Bu şekildeki örneklemeye tesadüfî örnekleme, alınan örneğe de tesadüf örneği (nümunesi) denir. Araştırma ve incelemelerden aldatıcı sonuç alınmaması için, nümunenin mensup olduğu populasyonu en iyi şekilde temsil etmesi gerekir. Bu da, nümunenin gerçek bir tesadüf nümunesi olmasına bağlıdır. Zaten bu kitapta incelenecek istatistik metodIar, tesadüf nümuneleri için geliştirilmiştir. 1.2.2.Populasyon ve Nümune (Örnek) Đstatistik bilimi, bir toplumu (populasyonu) nitelik ve nicelikleri yönüyle; ancak tahmin etme yoluyla tanıma bilimidir. Sonsuz sayıda bireyden meydana gelen bir topluma populasyon denir. Populasyon, içerdiği bireylerin tümünü ölçmek, tartmak, saymak mümkün olmadığından, kendisinden rastgele çekilen tesadüf örnekleri üzerinden tanınmaya çalışılır. Mesela 13 yaşında Đzmit şartlarında yetişmiş bir kavaklıkta ağaçların çapları, bu vasıfları taşıyan populasyondan çekilen örnekler üzerinden "tahmin edilir”. 1.2.3.Đstatistik ve Parametre Örnekler üzerinden hesaplanan değerlere istatistik denir. Mesela ortalama, standart sapma gibi. Bu değerlerin populasyondaki karşılıklarına ise parametre denir (Yurtsever. s. 6). Populasyonların tamamı ölçülüp sayılamadığından, parametreler hiç bir zaman bilinemez; istatistikler üzerinden tahmin edilir. Bu bakımdan, araştırmaların imkanlar ölçüsünde büyük nümunelerle yapılması tavsiye edilir. Çünkü nümune büyüdükçe, istatistik 2 parametreye yaklaşır. Đstatistik biliminde istatistik olarak elde edilen değerler Latin alfabesinde kullanılan harflerle; parametreler ise Yunan alfabesinden alınan simgelerle gösterilir. Mesela X (aritmetik ortalama) ve s (standart sapma) birer istatistik, bunların populasyona ait karşılıkları olan µ (mü) ve σ (küçük sigma) birer parametreyi ifade eder. 1.2.4.Deneme Örnekleme ile genellikle kendiliğinden veya tabii şartlarda ortaya çıkmış ve farklı özel etkilere maruz bırakılmamış populasyonlar tanınmaya çalışılır. Mesela bir tabii Karaçam ormanının veya sıradan bir kavak plantasyonunun örneklenmesi gibi. Bazı hallerde ise örnekleme, araştırmacı tarafından özel olarak oluşturulan, kontrol altında tutulan ve belli bir populasyonu temsil ettiği varsayılan topluluklarda yapılır. Bu şekildeki uygulamalara deneme denir. Denemelerde bir taraftan özel etkiler hazırlanırken, diğer taraftan sonucu etkileyecek dış faktörler elden geldiğince eşit tutulmaya ve en aza indirilmeye çalışılır. 1.3.Sayıların (Verinin) Elde Edilmesi Nümuneyi oluşturan bireylerin araştırmaya konu olan özellikleri, saymak, ölçmek veya tartmak suretiyle belirtilir. Mesela bir böcek öldürücü denemesinde ölen böceklerin sayılması, ormancılıkla ilgili bir çalışmada ağaçların çap ve boylarının ölçülmesi, bir tarımsal ürün denemesinde sahadan elde edilen ürünün tartılması gibi. Bu şekilde elde edilen değerlere gözlem, varyant veya değişken denir. Ancak sayma yoluyla elde edilen sayılar, ölçme (veya tartma) yoluyla elde edilen sayılardan farklı özellikler gösterirler. Sayımla elde edilen sayılar tam sayıdır ve kesin sınırlarla birbirinden ayrılır. Ölçme-tartma ile elde edilenler ise kesirlidir, kesintisiz ve süreklidir. Bunlar, birbirine çok yakındır ve devamlılık gösterirler. Mesela ağaçlar üzerindeki böcek sayısı tam sayılarla ifade edilir ama, bu ağaçların çapları birinden diğerine çok az farklılıklarla değişim gösterebilir. Bu nedenle sayılarak elde edilen varyantlara tam veya kati, ölçülerek-tartılarak elde edilenlere sürekli değişken veya devamlı değişken denir. Đki grup arasındaki farklılık, bunların istatistik analiz ve değerlendirmelerinin de farklı olmalarına sebep olur. Ancak bazı sayma suretiyle elde edilen sayılar, ölçme suretiyle elde edilenlerin özelliklerine sahip olabilirler. Bu takdirde onlar gibi işleme tabi tutulmaları gerekir. Bu hususta verilecek karar, sayıların gösterdiği dağılışa bağlıdır; ki bu da frekans tablosu ve grafiğinden anlaşılabilir. Đncelenen özellik genellikle nicel (miktara bağlı, kantitatif), bazan da nitel (vasıflandırılabilir, kalitatif) karakterlidir. Mesela ağaçların çapları 3 kantitatif, gövde formlarının iyiliği-kötülüğü, dallanma özellikleri vs ise kalitatif özelliklerdir. Bir örneklemeyle elde edilmiş, hiçbir işleme tabi tutıılmaınış bireysel verilere kaba veriler denir. 1.4.Sayıların Özetlenmesi Sayılar, özellikle çok miktarda iseler, toplandıkları sıra ve şekilde araştırıcıya bir fikir veremezler. Bunlardan en sık rastlananların hangileri olduğu, nasıl bir değişim gösterdikleri ve ilerki Bölümlerde açıklanan populasyon tiplerinden hangisine dahil oldukları hususunda sınıflanmaları, özetlenmeleri gerekir. Sayıların her hangi bir şekilde düzenlemiş, sınıflanmış haline dağılım veya seri denir. Sayılar, sıralı dizi, frekans tablosu ve grafik halinde özetlenebilirler. 1.4.1.Sıralı Dizi Sıralı dizi, az sayıdaki (genellikle 10'dan az) varyantın, küçükten büyüğe dizilerek sıralanmasıdır. Sıralı diziye basit seri de denir. Misal 1.1: Bir örnekleme ile, 10 ağacın boyları m cinsinden aşağıdaki gibi ölçülmüştür: 16.4, 18.8, 16.5, 17.1, 16.7, 17.3, 16.l, 15.8, 16.8, 16.4. Bunlar sıralı dizi haline getirilecek olursa: 15.8, 16.1, 16.4, 16.5, 16.7, 16.8, 16.9, 17.1, 17.3, 18.8. Böylece 10 ağacın boyları ve boyların gösterdiği değişim hakkında daha kolay ve açık bilgi sahibi olunabilir. Bu bakımdan sıralı dizinin kaba verilere nazaran avantajları şöyle özetlenebilir: • Uç değerler (en küçük-minimum boy ve en büyük-maksimum boy) hemen görülebilir: 15.8 m ve 18.8 m. • Sayıların hangi değer etrafında toplanma eğiliminde olduğu anlaşılabilir: Misalde en çok l6'lı boylar ölçülmüştür. O halde bu değer etrafında bir toplanma vardır. • Uç değerlerin, toplanma eğilimi gösterilen sayıdan ne miktarda uzak olduğu anlaşılabilir. Bu avantajlarına karşılık, gözlem sayısı arttıkça verilerin sıralı dizi haline getirilmesi zaman alıcı, sıkıcı bir hal alır. Bu durumda diğer metodlar tercih edilmelidir. 1.4.2.Frekans Tablosu Frekans tablosu, varyantların sınıflandırılmasıyla yapılır. Frekans tablosu haline getirilmiş bir seri, varyantları sayma suretiyle elde edilmişse tasnif edilmiş seri, ölçme-tartma suretiyle elde edilmişse gruplandırılmış seri 4 adını alır. Sınıflar, alt ve üst sınır değerleri i1e belirtilir. Her sınıfın alt ve üst değerinin ortalamasına sınıf değeri denir. Sınıf değerleri arasında eşit açıklıklar bulunmalıdır. Bu açıklığa sınıf genişliği veya sınıf açıklığı denir. Bir frekans tablosunun düzenlenmesinde en önemli iş, sınıf genişliğinin tesbitidir. Sınıf genişliği fazla tutulduğunda sınıf adedi azalmış ve varyantlar sadece birkaç sınıfa dağılmış olurlar. Bu durumda oldukça farklı varyantlar aynı sınıfa girerek, toplum hakkında yetersiz veya yanlış bilgi verebilirler. Sınıf genişliği az olursa, bu defa fazla miktarda sınıf oluşacağından, özetlemeden beklenen yarar sağlanamaz. Frekans tablolarında genellikle 10-15 sınıf bulundurulur. Sınıf sayısı tesbit edildikten sonra, nümunedeki en büyük varyant ile en küçük varyant arasındaki fark sınıf sayısına bölünerek, sınıf genişliği yaklaşık olarak elde edilir. Sınıf genişliğinin kolay anlaşılır, mantıklı olmasına dikkat edilir. Mesela ağaçlarda boy sınıflaması yapılırken 0.30 m yerine, 0.25, 0.50 veya 1 m'lik sınıflar gibi kolay algılanır sınıf genişlikleri esas alınır. Bazı hallerde ise mevcut tecrübelere, verinin özelliğine göre veya frekans tablosunun anlaşılmasını kolaylaştırmak için önce sınıf genişliği belirlenir. Bu durumda, en büyük varyant ile en küçük varyant arasındaki fark sınıf genişliğine bölünerek sınıf adedi bulunmuş olur. Misa1 1.2: Bir kavak fidanlığından rastgele ölçülen 2 yaşında 50 fidanın boyları Tablo 1.1'de verilmiştir. Tablo 1.1: 50 adet kavak fidanının boyları (m) 7.0 7.6 6.0 6.5 9.0 9.1 6.6 5.9 7.9 8.2 8.3 7.1 7.7 8.9 7.7 7.8 6.6 6.2 7.9 8.4 7.0 8.5 9.6 6.6 9.1 6.7 7.0 8.1 7.3 7.7 7.5 8.0 6.8 7.4 6.6 6.1 8.3 7.2 6.3 8.7 8.1 7.5 7.1 6.7 7.3 8.6 8.2 7.9 7.7 5.6 Tabloda en büyük sayı 9.6, en küçük sayı 5.6 olduğuna göre, 10 sınıf yapılması halinde sınıf genişliği: 9.6 − 5.6 = 0.4 m 10 olacaktır. Ancak 0.4 m yerine, 0.5 m'lik sınıf genişliğinin daha mantıklı olacağı açıktır. Bu durumda sınıf adedi: 9.6 − 5.6 = 8 bulunur. 0.5 5 Sınıf genişliği veya sınıf adedinden sonra ikinci olarak, en küçük sınıfın alt sınırı tesbit edilir. Misalde en küçük varyant 0.6 olduğuna göre, bunun en küçük sınıfa girmesi gerekir. Sınıf genişliği 0.5 m olarak tesbit edildiğine göre, en küçük sınıfın alt sınır değeri 5.5 m olacaktır. Böylece sınıf sayısı 9 olur. Burada yapılması gerekli bir diğer iş, sınıf üst sınırlarının tesbitidir. Bu tesbitler, bir sınıfın üst sınırı ile bunu takip eden sınıfın alt sınırı arasında hiç bir sayı kalmayacak, bir sayı iki sınıfta birden yer almayacak ve sınıf sınırları varyantların ölçüldükleri küsuratta sayılarla ifade edilecek şekilde yapılır. Bu prensiplere göre burada ilk sınıfın üst sınırı 5.9 olmaktadır. Đlk sınıf değeri ise yukarıda açıklandığı üzere: 55 . + 5.9 = 5.7 m 2 olarak belirlenir. Diğer sınıfların alt sınırları, üst sınırları ve sınıf değerleri, bu değerlere sınıf genişliğinin ilavesiyle bulunur. Sınıflar böylece tesbit edildikten sonra, varyantlar sıra ile okunarak, dahil oldukları sınıfın hizasına bir çizgi çekilir. Bu işlemin yapılmasıyla, frekans tablosu tamamlanmış olur (Tablo 1.2). Tablo 1.2: 50 fidanın boylarına ait frekans tablosu Sınıflar (m) 5.5-5.9 6.0-6.4 6.5-6.9 7.0-7.4 7.5-7.9 8.0-8.4 8.5-8.9 9.0-9.4 9.5-9.9 Sınıf Değeri (m) 5.7 6.2 6.7 7.2 7.7 8.2 8.7 9.2 9.7 Toplam Frekans (f) Đşaretle Sayı ile 2 II 4 IIII 8 IIIII III 9 IIIII IIII 11 IIIII IIIII I 8 IIIII III 4 IIII 3 III 1 I 50 Her sınıfın hizasındaki çizgi sayısı,o sınıfın frekansıdır. Artık bütün varyantlar kendi değerleri ile değil, bulundukları sınıfın sınıf değeri ile tanınırlar. Bu durum bazı hatalara sebep olmakla beraber, bu hatalar ihmal edilebilecek kadar küçüktür ve varyant sayısı arttıkça daha da küçülür. Bu şekilde hazırlanan bir frekans tablosu. bize şu bilgileri verir: • Nümunede en faz1a bulunan boylar 7.7 m sınıf değeriyle temsil edilen 7,5-7,9 sınıfında yer almaktadır. Demek ki 7,7 değeri etrafında toplanma eğilimi vardır. O halde örneğin çekildiği fidanlıktaki fidanların 6 ortalama boylarının 7,7 m civarında olduğu söylenebilir. • Bundan daha kısa veya uzun boylu fidanlar iki yana doğru tedricen azalmaktadır. • Bu haliyle boyların dağılımı, ileride görüleceği üzere bir normal dağılıma benzemektedir. O halde normal dağılıma ilişkin analiz metodları kullanılabilir. Ayrıca verinin sınıflandırılması, ortalama ve varyans hesabında bazı kolaylıklar sağlar. 1.4.2.1.Eklemeli (Kümülatif) Frekans Tablosu Bazı hallerde. belli bir değerden daha küçük ve daha. büyük varyantların mutlak ve nisbi (oransal-%) miktarları bilinmek istenebilir. Bu bilgiyi bize eklemeli (birikimli-kümülatif) frekans tablosu verir. Böyle bir tablo, normal bir frekans tablosunda, ilk sınıftan itibaren ard arda gelen frekansların üst üste toplanmasıyla elde edilir. Tablo 1.2'deki frekans tablosunun, eklemeli frekans tablosu haline getirilmiş şekli Tablo l.3'de görülmektedir. Tablo l.3: 50 fidanın boylarına ait eklemeli frekans tablosu Sınıflar Sınıf Değeri (m) (m) 5.7 5.5-5.9 6.2 6.0-6.4 6.7 6.5-6.9 7.2 7.0-7.4 7.7 7.5-7.9 8.2 8.0-8.4 8.7 8.5-8.9 9.2 9.0-9.4 9.7 9.5-9.9 Toplam Frekans Frekans (f) 2 4 8 9 11 8 4 3 1 50 (%) 4 8 16 18 22 16 8 6 2 100 Eklemeli Frekanslar (mutlak) 2 6 14 23 34 42 46 49 50 (%) 4 12 28 46 68 84 92 98 100 Tablodan, düzenlenme tekniği anlaşılabilir. Son sütundaki değerler, eklemeli mutlak değerlerin varyantlar toplamına bölünüp, sonucun 100 ile çarpılmasıyla elde edilir. Eklemeli frekans tablosu okuyucuya, belli sınıf değerlerinden daha küçük veya daha büyük varyantların örnekteki toplam ve oransal miktarını verir. Görüldüğü üzere nümunede boyu 6.9 m dahil (veya 7 m'den daha küçük) fidanların adedi 14, nisbi miktarı ise % 28'dir. 8.5 m dahil daha uzunlar ise 5042= 8 adet ve %100-%84=%16 olarak hesaplanır. Bu durum, örneğin çekildiği fidanlığa (veya populasyona teşmil edilecek olursa, bu fidanlıktaki fidanların 7 m'den daha kısa, %16'sının ise 8.5 m ve daha uzun olduğu söylenebilir. Bu tür tablolara 'den daha az tablosu da denmektedir. 7 1.4.3. Grafikler Grafikler, frekans tablolarının şekiller halinde gösterilmesidir. Pek çok grafik tipi olmakla beraber bu tablolar için uygun olanlar, daire grafik, çubuklu diyagram, histogram ve frekans eğrileridir. Grafikler 2 veya 3 boyutlu olarak çizilebilir. 1.4.3.1.Daire (Pasta) Grafik Daire grafik, bir bütünün parçalarını gösteren sayılara uygun grafik şeklidir. Frekans tablosundaki frekansları ifade eden sayılar %'ye dönüştürülerek daire grafiği halinde gösterilebilir. Tablo 1.3'deki % frekanslar, Şekil 1.1'de 3 boyutlu daire grafiği halinde gösterilmiştir. 8.7 8% 9.2 6% 9.7 5.7 2% 4% 6.2 8% 6.7 16% 8.2 16% 7.2 18% 7.7 22% Şekil 1.1: Tablo 1.3'deki % frekansların daire grafiği 1.4.3.2.Çubuklu Diyagram Çubuklu diyagramlar, esasen sayımla elde edilen varyantların kesik kesik olan dağılımlarını göstermek amacıyla kullanılır. Bunun için bir koordinat sisteminde X ekseni boyunca sınıf değerleri, Y ekseni boyunca frekanslar belli bir ölçek çerçevesinde yerleştirilerek, her sınıf değerine ait frekans, büyüklüğü ölçüsünde bir çizgi ile gösterilir. Tam uygun olmamakla beraber (çünkü bu misaldeki değerler sayımla elde edilmiş değildir) Tablo 1.1'deki varyantlar Şekil 1.2'deki gibi bir çubuklu diyagram ile gösterilebilir. 8 9.7 9.2 8.7 8.2 7.7 7.2 6.7 6.2 6 4 2 0 5.7 Frekans 12 10 8 Boylar (m) Şekil 1.2: Tablo 1.1'deki frekans tablosunun çubuklu diyagramı 1.4.3.3.Histogram Histogramlar, ölçme-tartma yoluyla elde edilmiş, devamlılık gösteren varyantlara ait frekans tablolarına uygun grafik şeklidir. Histogram türü bir grafikte, yine bir koordinat sisteminde X ekseni boyunca sınıf alt değerleri işaretlenerek frekanslar Y ekseni boyunca dikdörtgen sütunlarla gösterilir. Böylelikle sınıf değerleri sütunların ortasına rastlar. Her sınıftaki dikdörtgen alanı, o sınıftaki varyantların dağılımda kapladıkları sahayı gösterir. Tablo 1.1'deki dağılıma ait histogram, Şekil 1.3'de görülmektedir: 12 Frekans poligonu Frekans 10 Frekans eğrisi 8 6 4 2 9.7 9.2 8.7 8.2 7.7 7.2 6.7 6.2 5.7 0 Boylar (m) Şekil 1.3 Tablo 1.1'deki frekans tablosunun histogramı frekans poligonu ve frekans eğrisi 9 1.4.3.4.Frekans Poligonu ve Frekans Eğrisi Bir histogramdaki dikdörtgenlerin üst kenar orta noktaları birer çizgi ile birleştirilirse meydana gelen kırık çizgiye frekans poligonu denir. Dikdörtgenlerin üst kenar ortaları bir eğri halinde birleştirilirse bu defa frekans eğrisi elde edilir. Bu grafik de, histogramdaki gibi bir saha ifade eder. Eğrinin tümünün altında kalan alan, dağılımın % 100'ü demektir. Tablo 1.3'deki verinin frekans eğrisi ve frekans poligonu Şekil 1.3'te gösterilmiştir. Frekans eğrileri, histogramlara nazaran dağılımı daha iyi aksettirir. Çünkü bir histogramda dikdörtgen içindeki değerlerin tümü, o sınıfa ait sınıf değerine sahip değildir. O sınıf içinde bile, küçükten büyüğe, yani sınıfın alt sınırından üst sınırına doğru bir değişim görülür. Halbuki histogramda bir sınıf içindeki değerlerin tamamı, sınıf değerine sahipmiş gibi görünmektedir. Frekans eğrileri, nümunenin çekilmiş olduğu populasyona veya örneklemenin doğru, örneğin yeterli olup olmamasına göre simetrik veya çarpık olabilmektedir. Ölçme - tartma suretiyle elde edilen veriler simetrik, sayma suretiyle elde edilen veriler ise çarpık bir eğri gösterme eğilimindedirler. Simetrik eğri göstermesi beklenen bir dağılım çarpık şekil arzediyorsa, nümunenin yetersizliğinden veya nümune alınmasında yapılmış hatalardan söz edilebilir. 10 2. MERKEZĐ EĞĐLĐM ÖLÇÜLERĐ (ORTALAMALAR) 2.1.Ortalamanın Tanımı ve Özellikleri Gözlem sonuçları frekans tabloları halinde özetlenmekle, en küçük ve en büyük sayı bunların toplanma eğilimi gösterdikleri nokta ve bu noktadan uzaklaşmalar görülebilmekte, böylelikle örneğin alındığı toplum hakkında fikir sahibi olunabilmektedir. Ancak böyle bir gruplama serilerin mukayesesine imkan vermez. Bir seri, kendini sayısal olarak temsil edebilen tek bir sayı ile ifade edilebilmelidir. Bu sayıya ortalama denir. Bir populasyondan alınan örneğe ait varyantların, frekans tablolarında görüldüğü üzere etrafında kümelendikleri noktaya merkezi eğilim noktası denir ve yeri ortalama ile belirlenir. 2.1.1.Ortalamaların Genel Özellikleri Ortalamanın özellikleri aşağıdaki gibi sayılabilir: • Ortalama, gözlemlerin hangi nokta etrafında toplanmış olduğunu gösterir. Bu bakımdan merkezi eğilim ölçüsü olarak da bilinir. • Ortalama, serinin maksimum ve minimum değerleri arasında yer alır. • Seri ilerki bölümlerde açıklanacak “normal dağılım”a uygunluk gösteriyorsa, ortalama frekans eğrisinin tepe noktasında yer alır. • Seri normal dağılıma uymuyorsa, ortalama tepe noktasından uzaklaşır. Bu bakımdan, bir ortalamanın sağlıklı olabilmesi için, ölçme- tartma ile elde edilmiş bir serinin frekans eğrisinin tek tepeli olması arzu edilir. Birden fazla tepe bulunduran bir frekans dağılımı, örneklemenin yetersiz, yanlış yapıldığını veya araya bu topluma ait olmayan bireyler karıştığını gösterir. 2.1.2.Ortalamaların Üstünlükleri • Ortalama bütün bir serinin bireylerini temsil eden tek bir sayı olduğu için akılda tutulması kolaydır. • Ortalama olayların “normal” halinin ifadesidir. Anormal durumları göstermez. Bu bakımdan inandırıcılığı fazladır. Olaylar genellikle ortalama değerleri ile belirtilir. Mesela bir yörede ocak ayında “ortalama sıcaklık"tan söz edilir. 11 • Normal hallerin ifadesi olan ortalamalar, anormal durumların da bir ölçüsüdür. Çok zayıf gelişmiş bir kavak plantasyonunda, çapların ne derece ince olduğu, o yaştaki normal bir plantasyonun çaplarının ortalamasıyla karşılaştırmakla anlaşılır. • Ortalamaların en üstün yönü, olayların mukayesesine yaramasıdır. Đki seri birbiriyle ortalamaları vasıtasıyla karşılaştırılır. 2.1.3.Ortalamaların Kusurları • Büyük miktarlarda gözleme dayanmayan veya yanlış örnekleme sonucu elde edilmiş ortalamalar fazla bir şey ifade etmez. Mesela bir şehrin tek bir mahallesine gidip 3-5 aileyi örneklemekle, o şehir halkının gelir düzeyini belirlemek yanıltıcı sonuç verebilir. Dolayısıyla güvenilirlikten uzaktır. • Ortalamalar bazan veriler arasındaki karakteristik farkları ortadan kaldırabilir. Mesela Tarih dersinden 5, Matematik’ten 10 alan bir öğrenci, ortalaması 7 olduğundan bu iki derse karşı aynı derecede yetenekli gibi görünür. Halbuki öğrencinin Tarih'e karşı hiç hevesi yoktur. • Ortalamalar bazan gerçekleri yansıtmayabilir. Örneğin aylık ortalama gelirleri 5.000.000 TL civarında olan 100 hanelik bir köye, aylık geliri 1.500.000.000 TL olan bir aile taşındığında, köyün ortalama geliri 20.000.000 TL/hane'ye yükselir. Ancak bu durum yanıltıcıdır. 2.1.4.Ortalamaların Kusurlarını Gidermenin Yolları • Ortalamaların yukarıda sayılan kusurlarını gidermek için, şu kurallara uymak gerekir: • Ortalama mutlaka çok bireyli serilere dayandırılmalıdır. Az sayıda gözleme dayalı ortalamalar gerçeği yansıtmayabilir. Bu kural bir anlamda büyük örneklerle çalışmayı tavsiye etmektedir. Önceki Bölüm’de “parametre”nin tarifinden anlaşılacağı üzere, örnekteki gözlem sayısı arttıkça istatistik parametreye yaklaşmakta, toplum daha iyi tanınmaktadır. • Ortalama, bireyleri homojen olmayan bir seri üzerinden hesaplanmamalıdır. Hem yerli, hem melez kavağın kullanıldığı bir kavaklıkta, kavaklığın tümü üzerinden mesela yıllık ortalama verimi hesaplamak yanlıştır. Bu kural da, örneklemenin homojen materyal üzerinden yapılması anlamına gelir. • Anormal bireyleri ihtiva eden serilerin ortalaması alınmamalı veya bu kusuru giderecek yöntemler uygulanmalıdır. Bir seriye anormal veriler, muhtemelen örneklemede tesadüfiliğe uyulmamasından veya ölçme 12 hatalarından girebilir. 2.2.Ortalamaların Sınıflandırılması Ortalamalar, analitik (parametrik) ve analitik olmayan (parametrik olmayan) ortalamalar olmak üzere iki ana gruba ayrılır. Analitik ortalamaların hesabında, serinin bütün değerleri işleme girer. Bunlar, aritmetik, tartılı aritmetik, geometrik, ahenkli (harmonik) ve kareli ortalamalardır. Serinin bütün değerleri üzerinden hesaplanmayan (analitik olmayan) ortalamalar ise medyan (ortanca) ve mod'tur. Analitik ortalamalar biyolojik olaylarda, analitik olmayan ortalamalar ise daha çok sosyal ve ekonomik alanlarda kullanılmaktadır. 2.3.Analitik Ortalamalar 2.3.1.Aritmetik Ortalama Bir populasyonun belirtilmesine yarayan parametrelerin en önemlisi aritmetik ortalamadır. Aritmetik ortalama aynı zamanda en yaygın olarak kullanılan ortalamadır. Đstatistikte "ortalama” denilince aritmetik ortalama anlaşılır. Serinin türüne göre, kolaylık açısından hesaplamada değişik yollar izlenebilir. 2.3.1.1.Basit Serilerde Aritmetik Ortalama Aritmetik ortalama, değişkenlerin (varyantların) toplamını, değişken adedine bölmekle hesaplanır. i kadar terimden meydana gelen bir serinin terimleri toplamı ΣX ile, terim adedi n ile gösterilirse, aritmetik ortalama aşağıdaki formülle ifade edilir: X= ΣX i n (2.1) Bundan sonra sıkça karşılaşılacak olan Yunan alfabesinden alınma Σ (büyük sigma) işareti formüllerde toplam anlamında kullanılmaktadır. Misal 2.1: Bir fidanlıkta rastgele örnekleme ile ölçülen 50 adet kavak fidanının boy ortalamasını bulalım. Tablo 2.1'de değişkenler (büyükten küçüğe sıralanarak) basit seri halinde verilmiştir. 13 Tablo 2.1: 50 fidanın boyları (m) 5.6 6.6 7.3 7.8 8.3 X= 5.9 6.7 7.3 7.9 8.4 6.0 6.7 7.4 7.9 8.5 X 1 + X 2 +...+ X 50 50 6.1 6.8 7.5 7.9 8.6 = 6.2 7.0 7.5 8.0 8.7 6.3 7.0 7.6 8.1 8.9 6.5 7.0 7.7 8.1 9.0 5.6 + 5.9+...+9.6 375.6 = 50 50 6.6 7.1 7.7 8.2 9.1 6.6 7.1 7.7 8.2 9.1 6.6 7.2 7.7 8.3 9.6 =7.512 2.3.1.2.Sınıflanmış Serilerde Aritmetik Ortalama Önceki Bölüm'de açıklandığı üzere, sınıflanmış seriler, sayma yoluyla elde edilmiş varyantlara uygulanmaktadır. Böyle bir seride aynı değere sahip terimler bir frekans tablosunda tasnif edilir. Aritmetik ortalamayı hesaplamak için, terimlerle frekanslar çarpılarak toplanır ve sonuç frekanslar toplamına bölünür. X= ΣX i × f i (2.2 Σf i Misal 2.2: 50 adet öğrencinin istatistik dersinden almış olduğu notlar Tablo 2.3'deki gibi sınıflanmış olsun. Tablonun 3. sütununda notlarla frekansların çarpımları verilmiştir. Tablo 2.2: 50 öğrencinin notları Terimler (Notlar) Xi 1 2 3 4 5 6 7 8 9 10 Toplam Frekanslar Adet fi 3 4 7 12 10 5 4 3 1 1 50 Xi×fi 3 8 21 48 50 30 28 24 9 10 231 (2.2) nolu formüle göre X =231/50=4.62 bulunur. 2.3.1.3.Gruplanmış Serilerde Aritmetik Ortalama Gruplandırılmış serilerde terimlerin yerine sınıf değerleri geçer. Bu 14 bakımdan, önce seri frekans dağılımı haline getirilir. Daha sonra sınıf değerleri (mi) ile frekanslar (fi) çarpılarak toplanır ve sonuç frekanslar toplamına bölünür. Đşlemlerin formül ile ifadesi aşağıdaki gibidir: X= Σmi × f i (2.3) Σf i Misal 2.3: Misal 1.2’deki fidanların, gruplandırılmış seriler metoduna göre aritmetik ortalamasını hesaplayalım: Gerekli işlemler yapılarak Tablo 2.3'de verilmiştir. Tablo 2.3: 50 fidanın frekans dağılımı Sınıflar (metre) 5.5-5.9 6.0-6.4 6.5-6.9 7.0-7.4 7.5-7.9 8.0-8.4 8.5-8.9 9.0-9.4 9.5-9.9 Sınıf değerleri (mi) metre 5.7 6.2 6.7 7.2 7.7 8.2 8.7 9.2 9.7 Toplam fi Adet 2 4 8 9 11 8 4 3 1 50 mi×fi 11.4 24.8 53.6 64.8 84.7 65.6 34.8 27.6 9.7 377.0 Formüle göre X =377/50=7.54 bulunur. Burada dikkat çeken bir özellik vardır. Daha önce basit seriler metoduna göre aritmetik ortalama 7.512 m hesaplanmışken, bu defa 7.54 m bulunmuştur. Đkisi arasındaki 7.54 - 7512 = 0.028 m'1ik (2.8 cm’lik) fark, gruplandırmadan meydana gelmektedir. Çünkü bu defa varyantlar hesaba kendi değerleri ilc değil, dahil oldukları grubun sınıf değeri i1e alınmışlardır. Mesela, 9.7 sınıf değerine sahip son gruba giren bireyin asıl değeri 9.6 m’dir. Ancak gruplara giren birey sayısı arttıkça, grup içindeki ortalama değer sınıf değerine yaklaşacağından, gruplandırılmış serilerde hesaplanan aritmetik ortalama, basit serilerde hesaplanan aritmetik ortalamaya yaklaşır. Bu bakımdan. çok fazla varyanttan meydana gelen serilerde, el ile hesaplama yapılacaksa, hesap hatasından kaçınmak için, gruplandırma yapmakta yarar vardır. 2.3.1.4.Aritmetik Ortalamanın Özellikleri • Aritmetik ortalama olarak hesaplanan değer, örnekteki tüm değerlerin merkezinde yer alır ve değişkenler bu değerin iki tarafında eşit sayıda dağılır (normal dağılımlarda). 15 • Aritmetik ortalama terimlerin sayısı ile çarpılırsa serinin toplamı elde edilir. • Değişkenlerin, aritmetik ortalamadan farklarının (ayrılışlarının) cebirsel toplamı sıfırdır. Mesela aritmetik ortalaması 7 olan aşağıdaki gibi bir seride bu durum görülebilir: Xi X 3 4 7 9 12 7 7 7 7 7 Xi - X -4 -3 0 2 5 0 Toplam (Xi - X )2 16 9 0 4 25 54 • Değişkenlerin, aritmetik ortalamadan farklarının kareleri toplamı ise herhangi bir ortalamadan sapmaya nazaran mutlaka daha küçüktür. • Aritmetik ortalama diğer ortalamalara nazaran hassas bir ortalamadır. Uç (ekstrem) değerlerden çok etkilenir. 2.3.2.Tartılı (Ağırlıklı) Aritmetik Ortalama Örneklenen populasyon bir takım farklı alt gruplardan meydana geliyorsa, örnek de bu alt grupları bünyesinde bulundurur. Böyle hallerde örneğin ortalamasını hesaplamak için tartılı (ağırlıklı) ortalama kullanılır. Her gruba önemiyle orantılı belirli katsayılar (tartılar, ağırlıklar) verilir. Mesela, kiloları ortalaması 48 olan 20 kız öğrenci ve yine kiloları ortalaması 64 olan 35 erkek öğrenciden oluşan bir sınıfın ortalamasını bulmak için, her iki grubun ağırlık ortalamasını toplayıp ikiye bölmek yanlıştır. Çünkü sınıf kızlar ve erkekler olarak iki alt gruptan oluşmaktadır. Böyle yapılırsa 20 kız, 35 erkek gibi temsil edilir. (2.4) nolu formülde görüldüğü üzere doğru metod, her a1t grubun ortalamasını kendi gözlem adediyle (ağırlık) çarpıp, çarpım sonuçlarını toplayarak örnekteki gözlem adedine bölmektir. Bu bakımdan tartılı aritmetik ortalamaya bazı kitaplarda ortalamaların ortalaması da denir. X T= ΣX i × t i Σt i (2.4) Bir misal olarak, öğrencilerin not ortalamasını hesaplamada okul idaresince derslere verilen ağırlıklar gösterilebilir: Misal 2.4: Bir öğrencinin aldığı dersler ve bunların ağırlıkları Tablo 2.4'te verilmiştir. Bu öğrencinin tartılı not ortalaması aşağıdaki gibi hesaplanır: 16 Tablo 2.4: Bir öğrencinin notları ve notların tartıları Dersler Đktisat Maliye Đstatistik Hukuk Đngilizce Toplam Tartılar ti 4 3 3 2 1 13 Notlar (Xi) 9 7 7 7 5 35 Xi×ti 36 21 21 14 5 97 X T =97/13=7.46 bulunur. Serinin tartısız aritmetik ortalaması ise 7’dir. 2.3.3.Geometrik Ortalama Genel tarifiyle geometrik ortalama, n adet pozitif sayının çarpımlarının n'inci dereceden köküdür. 2.3.3.1.Basit Serilerde Geometrik Ortalama Yukarıdaki tarife göre, basit serilerde geometrik ortalama şu formüle göre hesaplanır: 1/n X G = n X 1 × X 2 ×...× X n = (X1×X2× . . . ×Xn) (2.5) Bunun çözümü, istenen dereceden kök hesap edebilen hesap makineleri ile yapılabildiği gibi, logaritmik yoldan: log X 1 + log X 2 +...+ log X n Σ log X i X G =Antilog =Antilog n n (2.6) formülü ile de yapılabilir. Görüldüğü üzere geometrik ortalama, varyantların logaritmalarının aritmetik ortalamasının antilogaritmasıdır. Misal 2.5: Aşağıdaki basit serinin geometrik ortalamasını hesaplayalım: Xi 3 4 9 12 Toplam log Xi 0.47712 0.60206 0.95424 1.07918 3.11260 Log X G =3.1126/4=0.77815 ve X G =6 hesaplanır. Varyant sayısının böyle az olduğu durumlarda hesaplama aşağıdaki gibi yapılarak: X G = 4 3 × 4 × 9 × 12 = 4 1296 X G =(1/4)log1296=0.77815 ve 17 X G = antilog(0.77815) = 6 bulunur. 2.3.3.2.Sınıflandırılmış Serilerde Geometrik Ortalama Sınıflandırılmış serilerde geometrik ortalama, varyantların logaritmalarının, frekansları ile çarpılıp, çarpımların toplamının frekansların toplamına bölünmesi ve sonucun antilogaritmasının alınmasıyla bulunur: Σ log X × f i i X G =Antilog Σf i (2.7) Misal 2.6: 15 işçinin saat başına almış oldukları ücretler Tablo 2.5'te verilmiştir. Ücretlerin geometrik ortalamasını hesaplayalım: Tablo 2.5: 15 işçinin ücretleri Ücretler (TL) Xi 50000 60000 100000 Toplam fi LogXi fi×Log Xi 5 7 3 15 4.69897 4.77815 5.00000 23.49485 33.44705 15.00000 71.94190 LogGO=71.9419/15=4.79613 ve GO=Antilog(4.79613)=62536 TL. 2.3.3.3.Gruplandırılmış Serilerde Geometrik Ortalama Hesaplanış tarzı sınıflandırılmış serilerdeki gibidir. Ancak burada varyantların yerini sınıf değerleri alır. Σ log m × f i i X G =Antilog Σ f i (2.8) Misal 2.7: Bir sınıfta 54 öğrencinin aldığı notlar Tablo 2.6'daki gibi gruplandırılmıştır. Sınıfın geometrik not ortalamasını hesaplayalım: Tablo 2.6: 54 öğrencinin notları Not grupları Xi 4 - 6’dan az 6 - 8’den az 8 - 10’dan az 10 Toplam Frekans fi 17 23 11 3 54 Sınıf değeri mi 5 7 9 10 18 Log mi 0.69897 0.84510 0.95424 1.00000 fi×log mi 11.88249 19.43730 10.49664 3.00000 44.81643 2.3.3.4.Geometrik Ortalamanın Özellikleri • Geometrik ortalamada varyantların ortalamaya oranlarının çarpımı 1'e eşittir. 2.3.3.1 maddesinde geometrik ortalamanın 6 hesaplandığı misal ele alınacak olursa, 3 6 × 4 6 × 9 6 × 12 6 =1296/1296=1 bulunur. • Aritmetik ortalama daima geometrik Aşağıdaki gibi iki seride görüleceği üzere: A serisi 100 101 100.49 100.5 GO AO ortalamadan büyüktür. B serisi 100 1 10 50.5 terimler arasındaki fark büyüdükçe, ikisi arasındaki fark da GO aleyhine büyür. Tersi halinde iki değer birbirine yaklaşır. Bıı özelliği dolayısıyla GO bilhassa değişim oranı bir önceki değere bağlı durumlarda kullanılır. Canlı organizmaların çoğalma hızlarının bulunması, bileşik faiz ve fiyat endekslerinde ortalama değişim oranlarının hesaplanması gibi. Fiyatlarda görülecek ani düşüş veya artışlar GO ile daha uygun şekilde ifade edilebilir. Aşağıda A ve B maddesinin 1970 ve l975’deki fiyatları ve 1975 endeksleri incelenecek olursa: Madde 1970 1975 A B 160 400 320 200 1975 endeksi (1970=100) 200 50 l975 yılı endeks ortalamasının AO olarak 125, GO olarak 100 olduğu görülür. Durumu daha iyi aksettirdiğï için, bunlardan endeks için GO kullanılır. • Yine varyantları arasında büyük farkların bulunduğu serilerde, serinin geometrik ortalamasının hesaplanması, durumu daha iyi aksettirmektedir. Mesela 4 dersten zayıf (1, l, 1, 2) ve bir dersten tam not (10) almış bir öğrencinin not ortalaması AO olarak 3, GO olarak 1.82’dir. Öğrencinin genel durumu çok kötü olmasına rağmen, AO öyle göstermemektedir. Bu durum, ayrıca geometrik ortalamanın, ekstrem değerlerden etkilenmediğinin bir ifadesidir. • Ancak seride sıfır veya eksi değer olması halinde GO hesaplanamaz. 19 2.3.4.Ahenkli (Harmonik) Ortalama Harmonik ortalama, değişkenlerin terslerinin (1'e bölümlerinin) aritmetik ortalamasının tersidir. 2.3.4.1.Basit Serilerde Harmonik Ortalama Basit serilerde harmonik ortalama aşağıdaki formüle göre hesaplanır: X H = n 1 Σ Xi (2.9) Mesela 3, 6, 10 ve 15 gibi dört sayının ahenkli ortalaması: X H = 4 4 = =6’dır. 1 20 1 1 1 + + + 3 6 10 15 30 2.3.4.2.Gruplanmış Serilerde Harmonik Ortalama Sınıflanmış serilerde HO, frekansların toplamını, varyantların terslerinin frekanslarla çarpımlarının toplamına bölmekle bulunur: X H = Σf i fi Σ Xi (2.10) Misal 2.8: Bir daktilo yarışmasında 15 kişinin 1 dakikada yazmış oldukları kelimeler Tablo 2.7'dedir. Dakikada yazılan ortalama kelime adedini bu metoda göre hesaplayalım: Seri sınıflanmış ve gerekli işlemler yapılarak tabloda verilmiştir. Tablo 2.7: 15 kişinin dakikada yazdığı kelime adedi Kelime sayısı Xi Kişi fi 1 Xi fi Xi 10 15 20 Toplam 3 8 4 15 0.100 0.067 0.050 0.300 0.536 0.200 1.036 HO = 15/1.036 = 14.48. Demek ki 15 kişi dakikada ortalama 14.5 kelime yazmıştır. 20 2.3.4.3.Gruplanmış Serilerde Harmonik Ortalama Hesap tarzı sınıflanmış serilere benzer. Ancak varyantların yerini sınıf değerleri alır: X H = Σf i f Σ i mi (2.11) Misal 2.9: Yine bir daktilo yarışmasına katılmış 25 kişinin bir dakikada yazdıkları kelime sayısı Tablo 2.8'deki gibi gruplandırılmıştır. Bu kişilerin dakikada yazdıkları ortalama kelime sayısı HO olarak aşağıdaki gibi hesaplanır. Gerekli işlemler tabloda verilmiştir. HO = 25/1.011 = 24.73 bulunur. Tablo 2.8: 25 kişinin dakikada yazdığı kelime adedi Kelime sayısı Xi Kişi fi 10-19 arası 20-29 arası 30-39 arası 40-49 arası Toplam 5 10 8 2 25 mi 1 mi fi mi 15 25 35 45 0.067 0.040 0.029 0.022 0.335 0.400 0.232 0.044 1.011 2.3.4.4.Harmonik Ortalamanın Özellikleri • Harmonik ortalama, (geometrik ortalamanın aksine) bir önceki değere veya birbirine bağlı olmadan meydana gelen olaylarda kullanılan bir ortalamadır. Belli bir birime, mesela yukarıdaki örneklerde olduğu gibi zamana oranlanan olayların ortalamasını hesaplamada kullanılır. Mesela bir yolu giderken 70, dönerken 60 km/saat ortalama hızla alan bir otobüsün, yolun tamamına ait ortalama hızını hesaplamakta olduğu gibi. • Harmonik ortalama, gerek aritmetik gerekse geometrik ortalamadan küçük sonuç verir. • Serideki varyantlardan biri 0 ise, sonuç bir sayının sonsuz'a bölünmesi halini aldığı için harmonik ortalama 0 bulunur. Mesela 0, 2 ve 5’in harmonik ortalaması: HO= 1 0 + 3 1 2 + 1 = 3 ∞ + 0.5 + 0.2 =0 5 21 • Serinin varyantları arasında eksi değerli sayılar varsa harmonik ortalama hesaplanabilir, ancak sonuç bir anlam taşımaz. 2.3.5.Kareli (Kuadratik) Ortalama Kareli ortalama, varyantların kareleri toplamını, varyant sayısına bölmek ve sonucun kare kökünü almakla hesaplanır. 2.3.5.1.Basit Serilerde Kareli Ortalama Yukarıdaki tarife göre basit serilerde kareli ortalamanın formülü: 2 X K = ΣX i n (2.12) Mesela 2, 3, 4 ve 7’den oluşan bir basit serinin kareleri ortalamasını hesaplamak için, varyantların kareleri toplamı: 22+32+42+72=78 hesaplanır ve formüle göre: KO = 78 / 4 = 4.42 bulunur. 2.3.5.2.Sınıflanmış Serilerde Kareli Ortalama Sınıflanmış serilerde kareli ortalama, varyantların karelerinin frekanslarla çarpımlarının toplamını, frekansların toplamına bölüp sonucun kare kökünü almakla bulunur: 2 X K = ΣX i × f i Σf i (2.13) Misal 2.10: 30 öğrencinin aldığı notlar Tablo 2.9’dadır. Bunların kareli ortalaması aşağıdaki şekilde hesaplanır: 22 Tablo 2.9: 30 öğrencinin aldığı notlar Notlar (Xi) 2 3 4 5 6 7 8 9 Toplam Xi2 4 9 16 25 36 49 64 81 fi 2 4 6 8 4 3 2 1 30 fi×Xi2 8 36 96 200 144 147 128 81 840 KO= 840 / 30 =5.29 bulunur. 2.3.5.3.Gruplanmış Serilerde Kareli Ortalama Diğer gruplanmış serilerde olduğu gibi, burada da varyantların yerini sınıf ortalamaları almaktadır: 2 X K = Σmi × f i (2.14) Σf i Misal 2.11: 50 öğrencinin aldığı notlar Tablo 2.10'daki gibi gruplandırılmıştır. Bunların kareli ortalaması aşağıdaki gibi hesaplanır: Tablo 2.10: 50 öğrencinin notları Sınıflar 2-4’ten az 4-6’dan az 6-8’den az 8-10’dan az 10 Toplam KO= 1925 / 50 fi 10 14 20 5 1 50 mi 3 5 7 9 10 mi 2 9 25 49 81 100 fi×mi2 90 350 980 505 100 1925 = 6.2 bulunur. 2.3.5.4.Kareli Ortalamanın Özellikleri • Uygulama sahası sınırlıdır. Ancak arasında - değerli veya 0 olan varyantların bulunduğu serilerde bu metod kullanılabilir. • Diğer bütün analitik ortalamaların en büyüğüdür. 23 2.3.6.Analitik Ortalamaların Büyüklük Sırası Buraya kadar yapılan açıklamalardan anlaşılacağı üzere, aynı seriye uygulanmış analitik ortalamalar büyüklük sırasına göre şu şekilde sıralanmaktadırlar: Kareli ortalama>Aritmetik ortalama>Geometrik ortalama>Harmonik ortalama 2.4.Analitik Olmayan Ortalamalar Madde 2.2'de ortalamaların analitik ve analitik olmayan ortalamalar olarak 2 ana gruba ayrıldığı, analitik olmayan ortalamalarda serinin tüm terimlerinin hesaba katılmadığı ve bu ortalamaların medyan ve mod olduğu belirtilmişti. Medyan ve mod, aşağıdaki örneklerde de görüleceği üzere genellikle sayma yoluyla elde edilmiş verilere uygulanmaktadır. 2.4.1.Medyan (Ortanca) Medyan, varyantların tümü hesaba katılmadan, sadece sıralanması ve sınıflanması ile bulunur. Medyan, bir seriyi iki eşit kısma bölen değerdir. Bu sebepten medyana ortanca da denir. Hesaplanması serinin türüne göre değişir. 2.4.1.1.Basit Serilerde Medyan Büyüklük sırasına konmuş bir dizide medyan, serideki varyant sayısının (n) tek veya çift oluşuna göre farklı şekilde bulunur n tek ise: n+1 2 nolu terim, yani X(n+1)/2 medyandır. Mesela bir şehirde örneklenen 7 ailenin gelirleri (milyoıı TL olarak) aşağıdaki gibi sıralansın: 1 15.5 2 16 3 16.5 4 17 5 18 6 19 7 37 n = 7 ve tek sayı olduğuna göre, (7+1)/2 = 4 nolu terim, yani 17 milyon TL, serinin medyanıdır. n çift ise: X n/ 2 + X ( n+2 )/ 2 2 nolu terim medyandır. 7 yerine aynı şehirden 8 aile örneklenmiş ve varyantlar aşağıdaki gibi sıralanıyor olsaydı: 1 15.5 2 16 3 16.5 4 17 5 18 24 6 19 7 21 8 37 n = 8, Xn/2 = 4 ve X(n+2)/2 = 5 olduğuna göre, 4 ve 5 nolu terimlerin ortalaması medyandır: (17+18)/2 = 17.5 milyon TL. 2.4.1.2.Sınıflanmış Serilerde Medyan Sınıflanmış serilerde medyan, tam ortaya rastlayan terimin (n/2 sıra nolu terim) dahil olduğu sınıfın değeridir. Ancak önce serinin eklemeli (kümülatif) frekansları bulunmalıdır. Daha sonra, bu terimin hangi eklemeli frekans içinde yer aldığına bakılır. Bu frekansa ait sınıf değeri serinin medyanıdır. Misal 2.12: 50 öğrencinin aldığı notlar Tablo 2.11'deki gibi sınıflanmış olsun: Tablo 2.11: 50 öğrencinin notları ve eklemeli frekanslar Notlar Xi 1 2 3 4 5 6 7 8 9 10 Toplam Frekanslar fi 3 4 7 12 10 5 4 3 1 1 50 Eklemeli frekanslar Σfi 3 7 14 26 36 41 45 48 49 50 n = 50 olduğuna göre, 50/2 = 25’inci terim tabloda görüldüğü üzere, 4. sırada yer almaktadır. Bu sınıfın değeri 4 olduğuna göre, serinin medyanı 4'tür. Bu sınıfa medyan sınıfı denir. 2.4.1.3.Gruplanmış Serilerde Medyan Sınıflanmış serilere benzer şekilde, kümülatif frekansın içinde yer alan sınıfın değeri basit olarak medyan sayılabilir. Misal 2.13: 89 işçinin saatte aldığı ücretler Tablo 2.1'deki gibi gruplanmıştır. 25 Tablo 2.12: 89 işçinin ücretleri ve eklemeli frekanslar Sınıflar (Ücret - TL) 50000-60000’den az 60000-70000’den az 70000-80000’den az 80000-90000’den az 90000-100000’den az Toplam Eklemeli frekans 5 23 48 70 89 Đşçi sayısı fi 5 18 25 22 19 89 Tabloda 89/2 = 44.5'uncu terim 70000-80000’den az sınıfında yer almaktadır. Bu sınıfın değeri kabaca 75000 sayılırsa medyan 75000’dir. Ancak gruplanmış serilerde medyanın tam hesabı şu formüle göre yapılır: n m−1 − fi 2 1 Medyan= h1+Sm× fm ∑ (2.15) Formülde: h1 = Medyan sınıfının alt sınırı, Sm = sınıf genişliği, m−1 ∑f i = medyan sınıfından bir önceki sınıfın eklemeli frekansı, 1 fm = medyan sınıfının frekansıdır. Bu formüle göre yukarıdaki seride: Medyan = 70000 + 10000 × 44.5 − 23 25 = 78600 TL bulunur. 2.4.1.4.Medyanın Özellikleri • Hesaplanması bilhassa basit serilerde kolaydır. Bütün terimler hesaba katılmadan medyan hesaplanabilir. • Serideki uç (aşırı) değerlerden hiç etkilenmez. • Terimlerin medyandan ayrılışlarının (sapmalarının - inhiraflarının) mutlak değerleri toplamı, diğer herhangi bir değerden ayrılışları toplamından daha küçüktür. Mesela Tablo 2.13'de görülen seride varyantların medyandan ve aritmetik ortalamadan ayrılışlarının mutlak değerleri toplamını hesaplayalım: 26 Tablo 2.13: Medyan ve aritmetik ortalamadan ayrılışlar Varyantlar (Xi) Medyan 15.5 16.0 16.5 17.0 18.0 19.0 37.0 Toplam 17 17 17 17 17 17 17 Xi - Medyan 1.5 1.0 0.5 0 1.0 2.0 20.0 26.0 X 19.86 19.86 19.86 19.86 19.86 19.86 19.86 Xi - X 4.36 3.86 3.36 2.86 1.86 0.86 17.14 34.30 Medyandan ayrılışların mutlak değerleri toplamı olan 26, aritmetik ortalamadan ayrılışların mutlak değerleri toplamı olan 34.3'ten küçüktür. • Sonu alınmamış, ucu açık dizilerde ortalama olarak medyan kullanılmaktadır. Mesela ilaç imalinde öldürücü dozun (%50 ölümü gerçekleştiren doz) tesbiti gibi. 2.4.2.Mod (Tepe Değeri) Mod pratik olarak, bir seride en çok rastlanan, en çok tekrarlanan terim olarak tanımlanabilir. Eğer serinin histogramı çizilirse, en yüksek sütunun değeri serinin modudur. Bu sebepten mod'a tepe değeri de denir. Serinin tipine göre mod aşağıdaki gibi hesaplanır. 2.4.2.1.Basit Serilerde Mod 11 işçinin saat ücretleri 1000 TL cinsinden aşağıdaki gibi olsun: 60, 70, 80, 80, 90, 90, 90, 90, 100, 110, 120 Bu dizide en çok tekrarlanan 90, 11 işçinin mod cinsinden saat başına ortalama kazancını gösterir. Terim sayısı çoğaldıkça, sayıların büyüklük sırasına konulup en çok rastlananı bulmak zaman aldığından, mod genellikle sınıflanmış ve gruplanmış serilere uygulanır. 2.4.2.2.Sınıflanmış Serilerde Mod Sınıflanmış serilerde en yüksek frekansa sahip terimin değeri modu verir. Misal 2.14: Bir ayakkabıcı dükkanından bir yıl içerisinde satılan ayakkabıların numaraları aşağıdaki gibidir: 27 Ayakkabı numarası 35 36 37 38 39 40 41 42 43 Satılan ayakkabı fi 325 348 214 301 416 383 925 712 304 Tabloya göre, 41 numara ayakkabılar bu serinin modudur. 2.4.2.3.Gruplanmış Serilerde Mod Gruplanmış serilerde mod iki şekilde hesaplanabilir. Misal 2.15: 126 işçinin ücretleri Tablo 2.14’deki gibi sınıflandırılmış olsun. Bu misal üzerinden her iki yolu açıklayalım: Tablo 2.14: 126 işçinin ücretlerinin frekans tablosu Sınıflar (ücretler 1000 TL) 60-62 binden az 62-64 binden az 64-66 binden az 66-68 binden az 68-70 binden az 70-72 binden az Đşçi sayısı (fi) 15 20 24 32 22 13 Basit Yol: Serinin en yüksek frekansı, 66-68 sınıfındaki 32'dir. Bu sınıftaki 32 işçinin yarısının sınıfın üst, yarısının alt kısmında toplandığı varsayılarak, serinin modu: (66+68)/2 = 67 bin kabul edilir. Formül Metodu: Basit yoldan modun bulunması sağlıklı olmadığından, gruplandırılmış serilerde mod aşağıdaki formüle göre hesaplanır: Mod = L + ∆1 ∆1 + ∆ 2 ×I (2.16) Formülde: L = Mod sınıfının alt sınır değeri, i = sınıf genişliği, ∆1 = mod sınıfı frekansı ile bir önceki sınıfın frekansının farkı, ∆2 = mod sınıfı frekansı ile bir sonraki sınıfın frekansının farkıdır. Formül misale uygulanacak olursa: L=66000, ∆1=32-24=8, ∆2=32-22=10 ve i=2 olduğundan, 28 Mod=66000+ 8 8 + 10 ×2=66889 TL bulunur. O halde mod cinsinden işçilerin ortalama ücreti 66889 TL'dır. 2.4.2.4.Modun Özellikleri, Elverişli Olduğu ve Olmadığı Haller • Mod anormal hallerden etkilenmez, bu yönüyle tcmsil kabiliyeti yüksektir. • Frekans dağılımı çan şeklinde olan dağılımlara çok uygundur. • Mod, iki tepeli dağılımlara uygun değildir. • Dağılımları J ve U şeklindeki serilerde modun ortalama ölçüsü olarak kullanılması ortalamanın tarifine göre mümkün değildir. Tarife göre ortalama iki uç değer arasında kalmalıdır. Halbuki bu gibi serilerde en fazla tekrarlanan terim uçlarda yer almaktadır. • En yüksek frekans aynı sınıfta kaldığı müddetçe, diğer sınıflarda olabilecek değişiklikler modun değerini değiştirmez. 2.5.Ortalama Seçiminde Göz Önüne Alınacak Esaslar Bir seride kullanılacak ortalamanın seçiminde şu özellikler göz önünde tutulmalıdır: • Belirli ortalamaların belirli serilere uygun oldukları dikkate alınarak, önce ortalaması hesaplanacak serinin dağılımı incelenmelidir. Örneğin anormal değerler ihtiva eden seriler aritmetik ortalamaya, dalgalı ve iki tepeli seriler moda, U şeklinde dağılım gösteren seriler medyana elverişli değildir. • Seri ortalamasının ne amaçla hesaplanacağı göz önünde bulundurulmalıdır. Ortalama, mukayese amacıyla hesaplanacaksa, aritmetik ortalama tercih edilmelidir. Amaç mukayese değil de serinin temsili ise, mod veya medyan uygulanabilir. Mutlak miktarlardan çok oranlar üzerinde duruluyorsa, geometrik ortalama ele alınmalıdır. Hız ve birim zaman ortalamaları için işlem yapılıyorsa, harmonik ortalama uygun olur. • Yukarıda sayılan özel uygunluk sebepleri yoksa, hesabı kolay olan yol tercih edilebilir. 2.6.Ortalamalar Arası Bağıntılar Ortalamalar arasında sayısal yönden aşağıdaki bağıntılar vardır: • Frekans dağılımları simetrik serilerde aritmetik ortalama, medyan ve mod birbirlerine eşittir. • Bir yana yığılmış bir dağılım gösteren serilerde, yığılmanın en fazla 29 olduğu noktada mod, daha sonra medyan, en sonra da aritmetik ortalama yer alır. Bu durum aşağıdaki frekans dağılımında görülebilir: Sınıflar 1-3’den az 3-5’den az 5-7’den az 7-9’dan az 9-11’den az Frekans 3 7 10 15 5 Frekans Bu seride aritmetik ortalama=6.6, medyan=7 ve mod=7.67’dir. Büyüklük sıraları ise: Aritmetik ortalama<medyan<mod şeklindedir (Şekil 2.1). Yığılma sol tarafa olursa, büyüklük sırası da bunun tersi olmaktadır. 16 14 12 10 8 6 4 2 0 Medyan AO 0 2 4 Mod 6 8 10 12 Şekil 2.1: Sağa yığılmış bir seride ortalamaların sıralanışı 30 3. DAĞILMA, DEĞĐŞĐM, VARYASYON 3.1.Giriş Ortalamalar serileri temsil ve incelemede kullanılan bir ölçü olmalarına rağmen, bu konuda yeterli değildirler. Aynı ortalamaya sahip iki seri incelendiğinde, bunların bünyeleri arasında önemli farklar görülebilir. Mesela aşağıdaki seri ele alınacak olursa, aritmetik ortalamaları ve minimum maksimum değerleri aynı olduğu halde, terimlerinin kendi içlerindeki dağılışlarının çok farklı olduğu görülecektir: A Serisi 10 10 2 2 B Serisi 10 6 6 2 O halde serilerin (buna bağlı olarak populasyonların) tanınmasında bunların yalnızca ortalama değerini bilmek yeterli değildir. Varyantların, ortalama etrafında dağılma (saçılma - ortalamadan sapma - ayrılma) miktarını da bilmek gerekir. Dağılma (değişim - varyasyon) varyantların ortalamaya uzaklık derecesidir. Biyolojik olaylar, sonsuz sayıda etkiler sebebiyle, farklı sayı, büyüklük ve ölçülerde ortaya çıkma eğilimindedirler. Tablo 1.1'deki örnekte görüldüğü gibi, fidanlar aynı ağaç türüne mensup olduğu, aynı toprakta, aynı yetiştirme metodlarıyla yetiştirildikleri halde, boyları arasında farklar vardır. Daha önce de belirtildiği gibi, bir frekans tablosunda varyantlar ortalama etrafında toplanma eğilimindedirler. Dağılışları, ortalamadan - ve + yöne doğru giderek azalır. Đşte değişim (varyasyon), varyantların ortalama etrafında dağılma derecesini belirten bir ölçüdür. Đstatistikte değişik dağılma ölçüleri kullanılmaktadır. Ortalamalarda olduğu gibi, bunların da bazıları serinin tüm terimlerini hesaba katmadan, bazıları ise tüm terimler üzerinden hesaplanır. 3.2.Serinin Bütün Terimlerinin Hesaba Katılmadığı Dağılım Ölçüleri Serinin tüm terimlerinin hesaba katılmadığı dağılma ölçüleri, değişim genişliği ve kartillerdir. 31 3.2.1.Dağılım Sınırları ve Değişim Genişliği (Varyasyon Genişliği) Dağılım sınırları ve değişim genişliği, nümunedeki dağılım hakkında kolay fikir veren bir ölçüdür. Serideki en küçük değer ile en büyük değer dağılımın sınırlarını, bunlar arasındaki fark da değişim genişliğini verir. Mesela Misal 1.2'deki fidanların boy dağılım sınırları 5.6 m ile 9.6 m; boyların değişim genişliği ise 9.6-5.6 = 4 m'dir. 3.2.2.Kartiller (Çeyrekler) Kartiller, büyükten küçüğe sıralanmış bir seriyi 4 eşit kısma ayıran değerlerdir. Ortanca bir dağılımı nasıl iki eşit parçaya bölüyorsa, kartiller de 4 eşit parçaya böler. Dağılımın ilk 1/4'üncü terimine birinci kartil (Q1), ortada yer alanına (yani ortancaya) ikinci kartil (Q2) ve 3/4'üncü terimine üçüncü kartil (Q3) denir. Hesaplanmaları ortancaya benzer şekilde yapılır. 3.2.2.l.Basit Serilerde Kartiller Basit serilerde Q1, Q2 ve Q3 serinin şu terimleridir: Q1= n+1 4 Q2= n+1 4 ×2 Q3= n+1 4 ×3 (3.1) Misal 3.1: Aşağıdaki 12'şer varyanttan meydana gelen basit serilerin kartillerini hesaplayalım: Sıra No 1 2 3 4 5 6 7 8 9 10 11 12 A Serisi 2 3 4 6 7 7 8 9 10 12 14 15 B Serisi 1 3 3 4 6 7 9 9 13 14 16 17 Gerek A, gerekse B Serisinde: Q1=(12+1)/4=3.25 Q2=(12+1)/4×2=6.5 Q3=(12+1)/4×3=9.75 nolu terimlerdir. Ancak seride 3.25'inci terim diye bir şey olamaz. Bu terim madem ki 3. terimden 0.25 kadar sonradır, o halde serideki 3. terim ile 4. terim arasındaki farkın 0.25 kadarının 3. terime ilavesiyle hesaplanabilir. Bu 32 durumda: Seride 4. terim 6, 3. terim 4 olduğuna göre, ikisinin farkının 0.25 fazlası (6-4)×0.25 = 0.5 olur. Bu değer 3. terime ilave edilerek: Q1=4+0.5= 4.5 bulunur. Benzer şekilde: (8-7)×0.5 = 0.5 ve Q2=7+0.5 = 7.5, (12-10)×0.75 =1.5 ve Q3=10+1.5 =11.5 hesaplanır. B serisinde ise: (4-3)×0.25 = 0.25 ve Q1 =3+0.25 = 3.25, (9-7)×0.5 =1 ve Q2= 7+1= 8, (14-13)×0.75 = 0.75 ve Q3=13+0.75 = 13.75 hesaplanır. Kartiller dağılımın bir ölçüsü olduğuna göre, iki seriyi mukayese etmekte kullanılabilir. Đki seriden 3. ve 1. kartil arası fark hangisinde fazla isc, o serinin dağılımının fazla olduğuna karar verilir. Yukarıda: A serisinde Q3-Qı=11.5-7.5=4, B serisinde Q3- Qı=13.75-3.25=10.5 olduğuna göre B serisi daha dağınık, daha yayvandır. Bir seride Q2-Q1 ile Q3-Q2’nin karşılaştırılması ile, o serinin dağılımının simetrikliği kontrol edilebilir. Farkların eşit veya eşite yakın olması halinde dağılım simetrik, farklı olması halinde asimetriktir. Hangi taraftaki fark fazlaysa, dağılımın o tarafı yayvandır. 3.2.2.2.Sınıflandırılmış Serilerde Kartiller Sınıflandırılmış serilerde kartiller, (3.1) nolu formüllere göre bulunacak varyantların dahil olduğu sınıf değerleridir. Đncelenecek seri, Madde 2.4.1.2’deki gibi sınıflandırılıp eklemeli frekansları hesaplandıktan sonra, bu varyantların hangi sınıflarda kaldığına bakılır. 3.2.2.3.Gruplandırılmış Serilerde Kartiller Gruplandırılmış serilerde kartillerin hesabı, bu serilerde medyanın hesaplanmasına benzer. Bu amaçla kullanılan formüller: n m−1 − fi 4 1 Q1=h1+Sm× fm ∑ 3n m−1 − fi 4 1 Q3=h3+Sm× (3.2) fm ∑ Formüllerdc: h1 = Đlk kartilin içinde bulunduğu sınıfın alt sınırı, h3 = 3. kartilin içinde bulunduğu sınıfın alt sınırı, 33 Sm = sınıf genişliği, m−1 ∑f i = kartil sınıfından bir önceki sınıfın eklemeli frekansı, 1 fm = kartil sınıfının frekansıdır. Serinin tüm terimlerinin hesaba katılmadığı dağılım ölçülerinden bir de desiller ve persentiller vardır. Kartillere benzer şekilde, desiller bir diziyi 10'a bölen değerler, persentiller ise 100'e bölen değerlerdir. 3.3.Serinin Bütün Terimlerinin Hesaba Katıldığı Dağılım Ölçüleri Serinin bütün terimleri üzerinden hesaplanan dağılım ölçüleri ortalama sapma ile varyans ve standart sapmadır. 3.3.1.Ortalama Sapma (Mutlak Farklar Ortalaması) Ortalama sapma, varyantların aritmetik ortalamadan mutlak değer olarak farklarının ortalamasıdır. Ancak Madde 3.3.2’de incelenecek standart sapma gibi cebirsel işlemlere elverişli değildir. Hesabı serinin tipine göre değişik şekillerde yapılır. 3.3.1.1.Basit Serilerde Ortalama Sapma Yukarıdaki tanıma göre basit serilerde ortalama sapma şu formüle göre hesaplanır: OS= Σ Xi − X n formülde Xi- X =di ile gösterilirse, OS= Σd i n (3.3) olur. Misa1 3.2: Tablo 3.1’de verilen serinin ortalama sapmasını hesaplayalım (Serinin aritmetik ortalaması 6'dır.): Tablo 3.1 Xi X di 3 5 10 9 7 2 6 6 6 6 6 6 Toplam 3 1 4 3 1 4 16 34 O.S.= 16/6= 2.67 bulunur. Bir seride hesaplanan ortalama sapma ne kadar büyükse, o seride dağılmanın o kadar fazla olduğu anlaşılır. 3.3.1.2.Sınıflanmış Serilerde Ortalama Sapma Sınıflanmış serilerde ortalama sapma, serinin terimleri ile aritmetik ortalaması arasındaki farkların, frekanslarla çarpımlarının toplamını frekanslar toplamına bölmekle bulunur: OS= Σf i × d i (3.4) Σf i Misal 3.3: Rastgele seçilmiş 150 kişinin bir günde okudukları gazcte sayısı Tablo 3.2’de verilmiştir. Serinin ortalama sapmasını bulalım: Tablo 3.2: 150 kişinin günde okudukları gazete sayısı Okunan gazete sayısı (Xi) 1 2 3 4 5 6 7 Toplam fi Xi × fi 12 18 42 54 14 6 4 150 12 36 126 216 70 36 28 524 Xi- X fi ×Xi- 2.49 1.49 0.49 0.51 1.51 2.51 3.51 X 29.88 26.82 20.58 27.54 21.14 15.06 14.04 155.06 (2.2) nolu formüle göre X =524/150=3.49 ve OS=155.06/150=1.034 bulunur. 3.3.1.3.Gruplanmış Serilerde Ortalama Sapma Hesap tarzı sınıflanmış serilerdeki gibidir. Ancak bu defa aritmetik ortalamadan farklar, sınıf değerleri üzerinden hesaplanır. Misal 3.4: 2.3.1.3 nolu maddede aritmetik ortalaması hesaplanan fidanların boylarının ortalama sapmasını bulalım. Gerekli hesaplamalar Tablo 3.3’de verilmiştir. Serinin aritmetik ortalaması hatırlanacağı üzere daha önce 7.54 m hesaplanmıştı. Buradan OS= 37.64/50 = 0.753 m bulunur. 35 Tablo 3.3: 50 fidanın boyları Boylar (metre) 5.5-5.9 6.0-6.4 6.5-6.9 7.0-7.4 7.5-7.9 8.0-8.4 8.5-8.9 9.0-9.4 9.5-9.9 Sınıf değerleri mi (metre) 5.7 6.2 6.7 7.2 7.7 8.2 8.7 9.2 9.7 Toplam Adet fi 2 4 8 9 11 8 4 3 1 50 mi- X 1.84 1.34 0.84 0.34 0.16 0.66 1.16 1.66 2.16 fi ×mi- X 3.68 5.36 6.72 3.06 1.76 5.28 4.64 4.98 2.16 37.64 3.3.2.Varyans ve Standart Sapma Ortalama etrafındaki dağılımın en iyi ölçüsü varyanstır. Varvans ve standart sapma biyolojik olaylarda en çok kullanılan dağılım ölçüleridir. Varyans, aritmetik ortalamadan farkların kareleri toplamının, terim sayısına bölünmesiyle bulunur. Ancak uygulamada farkların kareleri toplamı, terim sayısının 1 eksiğine bölünmektedir. Bu tanıma göre varyans: s 2= Σ( X i − X ) n −1 2 2 = Σxi n−1 (3.5) formülüne göre hesaplanır. Bu formülün payı ortalamadan ayrılışların kareleri toplamı'dır, Σxi2 ile gösterilir ve istatistikte kısaca kareler toplamı (KT) olarak bilinir. Varyansın kare köküne ise standart sapma denir. Standart sapmanın ölçü birimi varyantların ölçü birimi ile aynıdır. 3.3.2.1.Serbestlik Derecesi Kavramı Bir seride, varyantlar ortalamadan -∞ ve +∞ yönlerde farklılık gösterirler. Bu farkların cebirsel toplamı sıfırdır. Mesela 4, 3, 5, 8 ve 10 gibi varyantlardan meydana gelen bir nümunenin aritmetik ortalaması 6'dır. Varyantların ortalamadan sapmaları sıra ile -2, -3, -1, 2 ve 4'tür. Burada varyantlardan her hangi 4 tanesi serbestçe bir değer alabilir. Ancak 5’inci varyant sapmaların cebirsel toplamını sıfıra eşitler. O halde bu terim değer almakta serbest değildir. Bir nümunede serbestçe değer alan n-1 varyant vardır. Bu sebepten varyansın hesaplanmasında sapmalarn kareleri toplamı varyant adedine değil, varyant adedinin bir eksiğine (n-1) bölünür. n-1'e kareler toplamının serbestlik derecesi (SD) denir. O halde varyans, KT’nın kendi serbestlik derecesine bölümüdür. 36 3.3.2.2.Basit Serilerde Varyans ve Standart Sapma Misal 3.5: 3.3.1.1 nolu maddede verilen 6 varyantlı örneğin bu defa varyans ve standart sapmasını hesaplayalım: X =6'dır. Gerekli hesaplamalar Tablo 3.4’te verilmiştir. Burada aritmetik ortalamadan farkların toplamının 0 olduğuna dikkat edilmelidir. Tablo 3.4: Aritmetik Ortalamadan Farklar Xi (Xi)2 3 5 10 9 7 2 ΣX=36 9 25 100 81 49 4 ΣXi2=268 Xi- X -3 -1 4 3 1 -4 Σxi=0 X 6 6 6 6 6 6 (Xi- X )2 9 1 16 9 1 16 Σ (xi)2=52 (3.5) nolu formüle göre varyans: s2=52/5=10.4, standart sapma ise: s= s 2 = 10.4 =3.22 bulunur. O halde her varyant aritmetik ortalamadan ortalama olarak ±3.22 birimlik ayrılış göstermektedir. Varyansın birimi olmamasına karşılık, standart sapma örneğe ait değerlerin birimi cinsinden ifade edilir. 3.3.2.2.1.Varyans ve Standart Sapmanın Kolay Hesabı Kareler toplamını (3.5) nolu formüle göre hesaplamak zaman alıcı ve sıkıcıdır. Bu sebepten uygulamada kullanılmaz. Basit serilerde varyans, (3.6) nolu formül yardımıyla kolayca hesaplanır: s 2= (ΣX i ) 2 n n −1 ΣX i2 − (3.6) Misal 3.6: Misal 2.1'deki fidan örneğinin varyansını bu formüle göre hesaplayalım: ΣXi2=5.62+5.92+ . . .+9.62=2864.44 (ΣXi)2=375.62=141075.4 37 2864.44 − s 2= 141075.4 50 50 − 1 =0.8762 ve s=0.936 m (3.6) nolu formüldeki 2 ( ΣX i ) ifadesi, gelecek bölümlerde açıklanacak n olan varyans analizlerinde düzeltme faktörü (düzeltme terimi) olarak bilinir ve C ile gösterilir. Varyans ve standart sapmanın hesabında, kolaylığından dolayı bu yol izlenmektedir. 3.3.2.3.Sınıflanmış Serilerde Varyans ve Standart Sapma Sınıflanmış serilerde varyans, varyantlarla aritmetik ortalama arasındaki farkların karelerinin frekanslarla çarpılıp, toplamlarını frekansların 1 eksiğine bölmekle bulunur: 2 s= Σf i × ( X i − X ) 2 (3.7) n −1 Misal 3.7: Bölüm 2.3.1.2’deki 50 öğrencinin notlarının varyansını hesaplayalım: Gerekli hesaplamalar Tablo 3.5’te verilmiştir. Serinin aritmetik ortalaması X = 4.62'dir. Tablo 3.5: 50 öğrencinin notları Notlar Xi 1 2 3 4 5 6 7 8 9 10 Toplam Frekanslar fi 3 4 7 12 10 5 4 3 1 1 50 Xi- X -3.62 -2.62 -1.62 -0.62 0.38 1.38 2.38 3.38 4.38 5.38 (Xi- X )2 fi×(Xi- X )2 13.1044 6.8644 2.6244 0.3844 0.1444 1.9044 5.6644 11.4244 19.1844 28.9444 39.3132 27.4576 18.3708 4.6128 1.1444 9.5220 22.6576 34.2732 19.1844 28.9444 205.7800 Buradan s2=205.78/49=4.1996, s=2.05 bulunur. 3.3.2.4.Gruplanmış Serilerde Varyans ve Standart Sapma Gruplanmış serilerde varyans, sınıflanmış serilere benzer şekilde 38 hesaplanır. Ancak burada varyantların yerini sınıf değerleri alır: s 2= Σf i × ( mi − X ) 2 (3.8) n −1 Misal 3.8: Misal 2.1’deki 50 kavak fidanını ele alalım: Serinin aritmetik ortalaması X =7.54'dür. Diğer hesaplamalar Tablo 3.6'da verilmiştir. Tablo 3.6: 50 fidanın boyları Boylar (metre) 5.5-5.9 6.0-6.4 6.5-6.9 7.0-7.4 7.5-7.9 8.0-8.4 8.5-8.9 9.0-9.4 9.5-9.9 Sınıf değerleri mi (metre) 5.7 6.2 6.7 7.2 7.7 8.2 8.7 9.2 9.7 Toplam Adet fi 2 4 8 9 11 8 4 3 1 50 (mi- X) -1.84 -1.34 -0.84 -0.34 0.16 0.66 1.16 1.66 2.16 (mi- X )2 3.3856 1.7956 0.7056 0.1156 0.0256 0.4356 1.3456 2.7556 4.6656 fi ×(mi- X )2 6.7712 7.1824 5.6448 1.0404 0.2816 3.4848 5.3824 8.2668 4.6656 42.7200 s2= 42.72/49=0.8718 ve s = 0.934 m bulunur. Standart sapma iyi bir dağılım ölçüsüdür. s ne kadar büyük çıkarsa, varyantların ortalama etrafında o kadar fazla dağılış gösterdiğine hükmedilir. Ancak s'nın büyüklüğü, yalnız dağılımın fazlalığına bağlı değildir. Bu sebepten, dağılımın incelenmesinde standart sapma ile birlikte, aşağıdaki konuda açıklanacağı üzere varyasyon katsayısı üzerinde de durulmalıdır. 3.4.Varyasyon Katsayısı (Nisbi Standart Ayrılış) Bir nümunede standart sapmanın büyük olması, varyantların ortalamadan ayrılışlarının büyük (ortalama etrafındaki dağılışlarının fazla) oluşu anlamına gelir. Ancak büyük sayılardan meydana gelen bir nümunede hesaplanan standart sapma, küçük sayılardan meydana gelen bir nümunede hesaplanan standart sapmaya nazaran (bunların her ikisinin dağılım miktarı aynı olsa bile) büyük olur. Đki örneğin karşılaştırılmasında önem taşıyan bu gibi hallerde, standart sapma gerçek durumu yansıtmayabilir. Bu kusuru ortadan kaldırmak için varyasyon katsayısı (değişim katsayısı) denilen, % ile ifade edilen ve (3.9) nolu formüle göre hesaplanan oransal bir ölçü kullanılır: 39 v= s X ×100 (3.9) Formülde görüldüğü üzere varyasyon katsayısı, standart sapmanın aritmetik ortalamaya yüzde oranıdır. Mesela aşağıdaki tabloda yer alan 6'şar varyantlı iki seriyi inceleyelim: B X s A Serisi 295 290 285 230 225 220 1545 257.50 B Serisi 50 45 35 30 25 20 205 34.17 35.88 11.58 Standart sapmalara göre, A serisinin dağılımı B serisinden daha fazla görünmektedir. (3.9) nolu formül bu serilere uygulanacak olursa: A serisinde varyasyon katsayısı: v=(35.88/257.5)×100=13.93 B serisinde varyasyon katsayısı: v=(11.58/34.17)×100=33.89 hesaplanır. Demek ki B serisinin dağılımı gerçekte A serisinden daha fazladır. Varyasyon katsayısı bu şekilde iki serinin dağılımlarını karşılaştırmaya imkan vermekle, araştırmacı veya uygulamacıya yaptığı işin başarısını kontrol imkanı tanımaktadır. Mesela fidan boyları varyasyon katsayısının yıllardır % 12 civarında seyrettiği bir fidanlıkta, daha sonra çok farklı (büyük) bir varyasyon katsayısı tesbit edilmişse, araya farklı fidanlar karıştığından, kültür ve bakım tekniklerinin bozulduğundan ve bu sebepten, fidanlığın farklı işlemlere maruz kalarak heterojen bir yapıya kavuştuğundan şüphe edilebilir. Benzer şekilde, büyük varyasyon katsayıları veren bir denemenin de sıhhatinden şüpheye düşmek ve bunun sonuçlarına güvenmemek gerekir. 3.5.Ortalamaların Dağılımı, Ortalamanın Standart Hatası Bir normal populasyondan her biri n kadar varyant ihtiva eden bir çok tesadüf örneği alınsa ve ortalamaları hesaplansa, bu ortalamalar da bir normal dağılış gösterirler. Bunların dağılışının ortalaması populasyonun ortalamasına, varyansı ise σ2/n'e eşittir. Demek ki örnek ortalamalarının dağılımı populasyonun dağılımından n defa daha küçüktür. n büyüdükçe örnek ortalamalarının dağılımı azalmakta ve sonsuz olduğu takdirde sıfıra inmektedir (σ /∞)=0. Çünkü bu takdirde n bütün populasyonu kapsamakta ve populasyondan sonsuz sayıda ancak bir nümune alınabilmektedir. Bunun da ortalaması populasyonun ortalamasıdır. 40 Örnek ortalamalarına ait varyans, bu populasyondan çekilmiş n varyantlı bir örnek üzerinden hesaplanan s2 değeri (varyans) vasıtasiyle aşağıdaki formüle göre tahmin edilebilir: 2 sX = s 2 n (3.10) (3.11) nolu formülde görüldüğü gibi bunun kare köküne ortalamanın standart hatası denir. sX = s n (3.11) Misal 3.9: Misal 3.6'daki fidan örneğine ait ortalamanın standart hatası hesaplanacak olursa, s X =0.936/ 50 = 0.1324 m bulunur. Demek ki 7.512 m olarak hesaplanan bu ortalama·±0.13 m'lik bir hata payına sahiptir. Đstatistikte hesaplanan (tahmin edilen) bütün parametreler genellikle standart hatalarıyla birlikte verilir. Ortalama da bir parametre olduğuna göre, standart hatasıyla verilmeli ve mesela yukarıdaki misal için, örneğin alındığı fidanlıkta kavak fidanlarının boyu X =7.51±0.132 m’dir denilmelidir. Örnekteki varyantların birbirinden az fark göstermesi (yani varyansın küçülmesi) ve varyant sayısının büyümesi standart hatayı küçültür. Bu takdirde nümunenin ortalaması giderek populasyonun ortalamasına yaklaşır. s X = 0 olması halinde ise nümunenin ortalaması, populasyonun ortalamasına eşittir. Bu açıklamalardan, örneklemelerde örnek büyüklüğünün ne derece önemli olduğu anlaşılmaktadır. Đstatistik biliminde, parametrelerin birer tahmini olan her istatistiğin birer standart hatası vardır. Standart hatalar aynı zamanda istatistiklerin ilerki konularda görülecek olan güven sınırlarını hesaplamakta kullanılır. 3.6.Ortalamanın Örnekleme Hatası (%) Ortalamanın örnekleme hatası %, aşağıdaki formüle göre hesaplanır: sX X ×100 (3.12) Örnekleme hatası yüzdesi, ortalamanın ne büyüklükte bir hata ile tahmin edildiğini gösterir. Küçük olduğu ölçüde populasyonun tahminindeki tutarlılık artar. Büyük örnekleme hataları, genellikle örnek büyüklüğünün (veri adedinin) yetersizliğinden ileri geleceğinden, bunu küçültmek için veri adedinin 41 olabildiğince fazla tutulması gerekir (Kalıpsız 1981, s. 275). Misal 3.10: Fidan örneğindeki ortalamanın örnekleme hatasını hesaplayacak olursak: (0.1324/7.512)×100=1.762 bulunur. Ortalamanın örnekleme hatası yüzdesi, n-1 serbestlik derecesiyle istenen güven düzeyi belirtilerek (6. Bölümde açıklanan ilgili t değeri ile çarpılarak) de hesaplanabilir. 42 4. POPULASYONLARIN BELĐRLENMESĐ 4.1.Giriş Üzerinde çalışılan bir nümunenin ne tip populasyona ait olduğunu bilmek, buna uygulanacak istatistik analiz metodlarını tayin için gereklidir. Bu bölümde, populasyonların (ana kütlenin) belirlenmesi üzerinde durulacaktır. Đstatistiğin amaçlarından veya faaliyet sahalarından biri, bir örneğe dayanarak ana kütle hakkında karar vermektir. Eldeki örneğe uygulanan bir takım analizlerle, örneğin gerçekten bu ana kütleye ait olup olmadığı test edilir. Bu testlerde belli olasılık oranları (%5, %1 ve %0.1 gibi) kullanılır. Ancak bu analizlerin uygulanabilmesi için, öncelikle populasyonun ne tip bir populasyon olduğunun bilinmesi gerekir. Her populasyonun karakterine göre uygulanacak analiz metotları değişiktir. Başka tipler de olmakla beraber, genel olarak populasyonlar, normal populasyonlar, binom ve poisson populasyonları olarak 3 grupta incelenirler. Populasyonlar birbirlerinden aritmetik ortalamaları ve varyansları (parametreleri) ile ayrılırlar. 4.2.Normal Populasyonlar Birbirlerinden farklılıkları tamamen tesadüfi sebeplerden ileri gelen varyantların oluşturduğu populasyonlara normal populasyonlar denir. Normal populasyonlarda varyantlar ölçülerek, tartılarak elde edilir ve süreklilik gösteren kesirli sayılardan meydana gelirler. Bu tip populasyonlarda varyantlar ortalama etrafında sağa ve sola doğru simetrik olarak azalan bir yığın oluşturur. Normal populasyonların gösterdiği dağılışlara da normal dağılış denir. Canlılara ait bir çok özellik normal dağılış gösterir. Ortalaması µ, varyansı σ2 ile gösterilen bir normal populasyonun dağılışı: Y=f(X)= 1 σ 2π e 2 1 X − µ − 2 σ formülü ile ifade edilir. Bu formülde: f(X)= olasılık oranı (fonksiyonun ordinatı), X = rastlantı değişkeni, π=pi sayısı, e = 2.718281829’dır (tabii logaritma tabanı). 43 (4.1) 4.2.1.Normal Dağılımın Parametreleri Normal dağılımın parametreleri, aritmetik ortalama ve standart sapmadır. Bunlar örneğe ait olmaları halinde X ve s ile, populasyona (ana kütleye) ait olmaları halinde ise µ ve σ ile gösterilir. Ancak normal dağılım gösteren bir toplumda n=∞ olacağı için µ ve σ'nın gerçek değerleri hesaplanamaz, toplumdan alınan n bireyli örnekler üzerinden tahmin edilir. 12 Frekanslar 10 8 6 4 2 10.7 10.2 9.7 9.2 8.7 8.2 7.7 7.2 6.7 6.2 5.7 5.2 4.7 4.2 0 Sýnýflar (boy-m) X ±σ X ±2σ X ±3σ Şekil 4.1: Normal dağılım eğrisi 4.2.2.Normal Dağılımın Özellikleri • (4.1) nolu formül, bir normal dağılımda frekansların Şekil 4.1'deki gibi eğrisini çizer. Dağılım sürekli olup Xi varyantları -∞ ile +∞ arasında bir değer alabilir. Varyantlar aritmetik ortalamaya göre simetrik dağılır. Aritmetik ortalama tam ortada yer alır. Aritmetik ortalamadan eşit uzaklıktaki Xi değerlerinin olasılıkları eşittir. • Normal dağılım eğrisinin maksimum noktasının apsisi X =µ ve ordinatı f(X)= 1 σ 2π ’dir. Standart normal dağılım için bu değer 0.3984'tür. • Normal dağılım eğrisi çan şeklinde olup iki dönüş noktası vardır. Bu noktaların koordinatları: Y1=-0.242 X1=µ−σ 44 X2=µ+σ Y2=0.242'dir. • Eğri -∞ ile +∞‘a doğru X eksenine asimptot olarak seyreder. • Eğrinin altında kalan alanın tamamı olasılık yönünden 1 sayılır. • Dikkat edileceği üzere (4.1) nolu formülde, eğrinin biçimini belirleyecek iki unsur vardır ki bunlar, ortalama (µ) ve standart sapmadır (σ). Bu bakımdan normal dağılımlı populasyonlar ortalama ve standart sapmalarıyla tanımlanır ve birbirlerinden ayrılırlar. Bu demektir ki, ele alınan normal populasyonların ortalamaları farklı, standart sapmaları farklı veya her iki parametreleri farklı olabilir. Ortalamaları aynı olan iki normal dağılımdan, standart sapması büyük olan daha basık ve yayvandır. • Normal eğri, altında kalan alanı ortalamadan sağa ve sola doğru dağılımın standart sapması üzerinden şu şekilde belirlemektedir: Ortalamadan itibaren sağa ve sola doğru bir σ: µ ± 1σ = %68 Ortalamadan itibaren sağa ve sola doğru iki σ: µ ± 2σ = %95 Ortalamadan itibaren sağa ve sola doğru üç σ: µ ± 3σ = %99 Misal 3.6'da standart sapması hesaplanmış 50 kavak fidanı misalinde ortalamayı populasyonun ortalaması, standart sapmayı da populasyonun standart sapması sayacak olursak, örneğin alındığı fidanlıktaki fidanların: %68'inin boyunun 7.512 ± 0.936 = 6.58 m ile 8.44 m arasında, %95'inin boyunun 7.512 ± 1.872 = 5.64 m ile 9.38 m arasında, %99'unun boyunun 7.512 ± 2.808 = 4.70 m ile 10.32 m arasında olduğu söylenebilir (Şekil 4.1). 4.2.3.Normal Eğri Formülünden Yararlanılarak Bir Dağılımın Hesaplanması (4.1) nolu formül kullanılarak, normal dağılım gösteren bir toplumdan çekilmiş ve ortalaması ile standart sapması hesaplanmış bir örnek üzerinden bu populasyona ait tahminlerde bulunmak mümkündür. Formülde X yerine, bir varyantın değeri konularak, bu değerin eğri üzerindeki ordinat değeri hesaplanabilir. Misal 4.1: Fidan örneğini ele alarak, ortalaması 7.512 m, standart sapması 0.936 m olan 50 bireylik bu nümunede mesela 8 m - 8.4 m arası boylardaki fidanların teorik olarak oransal ve sayısal miktarını hesaplayalım: Tablo 1.2'ye göre 8 - 8.4 sınıfının sınıf değeri 8.2 olduğundan, formülde X yerine 8.2 konularak: 45 Y=f(8.2)= 1 0.936 2π e 2 1 8.2 − 7 .512 − 2 0.936 = 0.3252 hesaplanır. Bu değer 8.2 m'lik varyantın dağılımdaki ordinatıdır. 8.2 sınıfı, boyu 0.3252, eni 0.5 olan bir dikdörtgen olarak düşünülürse, dikdörtgenin alanı: 0.3252×0.5 = 0.1626 bulunur. O halde 8 - 8.4 sınıfında yer alan fidanların beklenen oransal miktarı %16.26'dır. Başka bir ifadeyle, bu fidanlıkta fidanların %16.26'sının bu sınıfta yer alması beklenmektedir. Örnekte toplam 50 fidan olduğuna göre: 0.1626×50 = 8.13 adet fidan söz konusu sınıfta yer alacaktır. Bu şekilde diğer sınıflar da hesaplanarak, teorik olarak tüm sınıflarda yer alması beklenen frekanslar bulunabilir. Bu tarz hesaplamada sınıf genişlikleri daraldıkça hesaplardaki hassasiyet artmaktadır. 4.2.4.Standart Normal Dağılım Normal dağılımın aritmetik ortalaması sıfır, standart sapması 1 olan özel haline standart normal dağılım denir (Şeki1 4.2). -4 -3 -2 -1 0 1 2 3 4 z değerleri Şekil 4.2: Standart normal dağılım eğrisi Böyle bir dağılımda değişkenlerin %99'u -3s ile +3s arasında yer alır. Eğrinin tamamı altındaki alan 1 sayılarak, alanın yarısı, ortalamadan itibaren uca doğru 1'in kesirleri halinde Ek Tablo 1'de verilmiştir. Bu tablo yardımıyla, ortalama ve standart sapması bilinen bir örneği, bir standart normal dağılıma dönüştürmek ve çekildiği populasyona ait bir takım tahminlerde bulunmak 46 mümkündür. Bunun için eldeki bir Xi varyantını, aşağıdaki formül ile ifade edilen ve z ile gösterilen bir standart normal varyanta dönüştürmek gerekir: z= Xi − µ σ (4.2) Daha sonra bu z değerinin, ortalamadan itibaren dağılımda kapladığı alan (olasılık olarak) Ek Tablo 1'dcn alınabilir (Şekil 4.2). z değerleri tabloda 0.01 kesirde verilmiştir. Mesela z=1 için tablo değeri 0.3413'tür. Bu, standart normal dağılımda ortalamadan itibaren z=1 değerine kadar varyantların 0.3413'ü veya %34.13'ü yer alıyor anlamındadır. 4.2.5.Standart Normal Dağılım Uygulamaları Ek Tablo 1 yardımıyla, ortalaması ve standart sapması bilinen (bilindiği varsayılan) toplumlarda z değeri üzerinden aşağıdaki gibi tahminlerde bulunulabilir. Bunları bazı örneklerle açıklayalım: Misal 4.2: Ortalama ve standart sapması belli bir populasyonda, belli bir varyanttan daha büyük bir varyantın çekilme (veya böyle varyantların bulunma) olasılığı nedir? Önceki fidan misalindeki populasyonun ortalamasını µ = 7.512 m ve standart sapmasını σ = 0.936 m kabul edelim. Bu populasyonda mesela boyu 9 m'den uzun olan fidanların bulunma olasılığı nedir? (4.2) nolu formülde X yerine 9 konursa, z= 9 − 7.512 0.936 =1.59 hesaplanır. Ek Tablo 1’e bakılacak olursa 1.59’a karşı gelen z dcğerinin olasılığının P = 0.4441 olduğu görülür. O halde ortalamadan bu değere kadar dağılımın %44.41'i yer almaktadır. Bizden istenen 9 m dahil ötesi olduğuna göre, z=1.59'dan sonraki kısım sorunun cevabıdır. O halde aranan olasılık P(X≥9)=0.5-0.4441=0.0559 veya %5.59'dur (Şekil 4.3). 47 12 X =7.512 8 6 4 %64.59 6<X<8 2 %24.56 8<X<9 %5.6 0 10.7 10.2 9.7 9.2 8.2 7.7 7.2 6.7 6.2 5.7 5.2 4.7 4.2 9<X 8.7 Frekanslar 10 Sýnýflar (boy-m) Şekil 4.3: Bir populasyonda olasılıklar Örnekte 50 fidan bulunduğuna göre bunlardan 50×0.0559 = 2.8 tanesinin boyunun 9 m'den uzun olduğu söylenebilir. Misai 4.3: Ortalama ve standart sapması belli bir populasyondan, istenen iki değer arasında bir varyantın çekilme olasılığı nedir? Fidan örneğine göre, bu populasyondan boyu 8 m ile 9 m arasında bir fidan çekme olasılığı veya bu boylarda fidanların populasyonda bulunma olasılığı nedir? Önceki misalde, ortalamadan boyu 9 m'ye kadar olan fidanların bulunma olasılığı P=0.4441 olarak hesaplanmıştı. Ortalamadan, boyu 8 m'ye kadar olanların bulunma olasılığı için, z= 8 − 7.512 0.936 =0.52 hesaplanır. Ek Tablo 1'e göre z=0.52 için P = 0.1985'dir. Bu değer, varyantların ortalamadan z=0.52'ye kadarki sahada bulunma olasılığıdır. O halde istenen olasılık, bu iki değerin farkı şeklinde hesaplanmalıdır: P(8 ≤ X ≤ 9 = 0.4441-0.1985 = 0.2456 Nümunede bu aralıkta yer alması beklenen fidan adedi ise, 50×0.2456=12.3'dür. Ek Tablo 1 yardımıyla, benzer şekilde belli aralıklarda (mesela 0.50 m gibi) beklenen fidan adetleri hesaplanarak, dağılımın tamamına ait teorik değerler (yani normal dağılım eğrisine göre olması beklenen değerler) ortaya 48 çıkarılabilir. Ancak burada istenen olasılıkların, ortalamanın farklı iki tarafında bulunması halinde (mesela boyu 6 m ïle 8 m arasında olan fidanların bulunma olasılığı gibi) dikkatli olunmalı ve hesaplama ona göre yapılmalıdır. Mesela 6 m'den büyüklerin bulunma olasılığı ile 8 m'den küçüklerin bulunma olasılığını hesaplamak içìn, z tablosu değerlerinin toplamı alınmalıdır. Yani: P(6 ≤ X ≤ 8) = P(6 ≤ X) + P(X ≤ 8) hesaplanmalıdır. Ortalamadan 8 m’ye kadarki sahada olasılık P=0.1985'dir. Ortalamadan 6 m'ye kadarki saha için ise: z= 6 − 7.512 0.936 = - 1.615 bulunur. Mutlak değer itibariyle z=1.62 için P = 0.4474 olduğundan, istenen olasılık, P(6 ≤ X ≤ 8) = 0.1985+0.4474 = 0.6459 bulunur (Şekil 4.3). Misal 4.4: Ortalama ve standart sapması bilinen bir toplumda, belirtilen orandaki varyantlar hangi değerler arasında yer alır? Bu defa soru Misal 4.3’ün tersidir. Bu durumda yapılacak işlemler de tersinedir. Yani önce tablodan olasılıklar alınacak, sonra bu olasılıklar z formülünde yerine konularak varyantlar hesaplanacaktır. Yine fidan örneğine göre, mesela bu toplumda fidanların, dağılımın ortasında yer alan `%90'ının boylarının kaçtan kaça değiştiğini bulalım: Dağılımın ortadan %90'ı sorulduğuna göre, aritmetik ortalamadan itibaren sağlı sollu %45'erlik alanda yer alan varyantların sınır değerleri istenmektedir. Ek Tablo 1'de 0.45 aranacak olursa, bu değerin bulunmadığı, buna en yakın değer olarak 0.4495 veya 0.4505'in yer aldığı görülür. O halde ikisinden biri alınabilir. 0.4495 alınacak olursa, buna ait değerin z=1.64 olduğu görülür. 1.64 z formülünde yerine konulursa: 1.64= X − 7.512 0.936 = buradan X-7.512=1.535 ve X1==7.512+1.535=9.047 m bulunur. Bu değer dağılımın sağ tarafına ait sınır değerdir. Sol tarafın sınır değeri ise ortalamadan 1.533’i çıkarmakla bulunur: X2=7.512-1.535=5.977 m. Demek ki bu populasyonda fidanların (boy itibariyle) dağılımın ortasındaki %90'ı 5.977 m ile 9.047 m'ler arasında yer almaktadır. 49 4.3.Binom Populasyonları Binom populasyonları, Binom dağılımı çerçevesinde incelenir. Binom dağılımı, kuralları Newton tarafından ortaya atılmış bir matematik kanundur. Bu kanun, iki olasılıklı bir olayın çok sayıda tekrarlanması halinde olasılıkların daima sabit kalacağı hipotezine dayanır. Başka bir ifadeyle, binom populasyonlarında bir olayın gerçekleşme ve gerçekleşmeme ihtimali sabittir. Đşte bağımsız olarak tekrarlanabilen n sayıdaki olayda, sabit oranda meydana gelen iki özelliğe sahip bireylerin oluşturduğu dağılıma binom dağılımı denir. Mesela bir madeni paranın atılmasında yazı-tuğra gelme, doğumda kız-erkek olma, pazarda satılan meyvelerin sağlam-çürük olma, bir tarımsal ilaç uygulanması sonucu böceklerin ölme-sağ kalma, tavla zarının yek gelmegelmeme halleri gibi. Bir metal para atıldığında, sadece yazı veya tuğra gelme olasılığı vardır. Bunlar da %50 - %50 (yani 0.5 ve 0.5)'dir. Bu iki özellik başarı ve başarısızlık (olumlu ve olumsuz veya istenen ve istenmeyen) olarak ele alınabilir. Böylelikle n defa meydana gelen bir olayda başarı=a, başarısızlık=b ile gösterilirse, başarı olasılığı = p = a n başarısızlık olasılığı = q = b n dir. Bu iki hal bir bütünün parçaları olduğuna göre, p+q=1’dir. Olayın n kez tekrarlanması durumunda bu hallerin değişik kombinasyonları ortaya çıkarak, r ile gösterilen 0, 1, 2, . . . n terimden biri meydana gelir. Bu kombinasyonların bazısında istenen özellik hiç bulunmayabilir; bazısında 1 tane, bazısında 2, bazısında 3, . . . bazısında da n tane bulunabilir. Terimlerin toplamı k=n+l’dir. 4.3.1.Binom Dağılımında Olasılıklar ve Katsayılar p ve q gibi iki özelliğin meydana getirebileceği kombinasyonların olasılıkları, iki terimlinin açılımı ile çözülür: (p + q)n (4.3) Böyle bir dağılımda hepsi de istenen özelliğe (p'ye) sahip bireyden (n bireyin hepsi de istenen özellikte) oluşan kombinasyon olasılığı, binomun 1. terimi oları pn kadardır. n-1 bireyin istenen özellikte olduğu kombinasyon ise npn-1q oranındadır (binomun 2. terimi). Genel ifadesiyle, (p+q)n binomunun açılımında p'nin üssü n'den 0'a doğru azalırken, q'nun üssü 0'dan n'e doğru artar. Birinci terimde p'nin üssü n, ikinci terimde n-1, üçüncü terimde n-2, . . . sonuncu terimde (n+1'inci terim) 0'dır. Tersine q'nun üssü ise 1. terimde 0, 2. terimde 1, 3. terimde 2, . . . 50 sonuncu terimde n'dir. Böylelikle her durumda p ve q'nun üsleri toplamı n'dir. Her hangi bir terimdeki q'nun üssü r ile gösterilirsc, bu terimdc p ve q'nun üsleri: (pn-rqr) şeklindedir. Mesela (p+n)8 binomunda yukarıdaki açıklamalara göre 6. terim p3q5 olur. Binom açılımında terimlerin katsayıları ise: n! ( n − r )! r ! formülü ile bulunur. Bu ifadeye binom katsayısı denir. Bu açıklamalara göre açılımın genel formülü: P(r) = n! ( n − r )! r ! pn-r qr (4.4) şeklindedir. Mesela 2 para birlikte atıldığında (veya bir para iki kere atıldığında), n=2'dir. 2 yazı, 1 yazı 1 tuğra ve 2 tuğra olarak 3 kombinasyon karşımıza çıkar. p'yi yazı, q'yu tuğra olarak kabul edersek, (4.4) nolu formüle göre terimler ve olasılıklar: 1. terim: 2 yazı-0 tuğra gelme olasılığı: r=0 ïçin: P(0)= 2. terim: 1 yazı-1 tuğra gelme olasılığı: r=1 ïçin: P(1)= 3. terim: 0 yazı-2 tuğra gelme olasılığı: r=2 ïçin: P(2)= 2! ( 2 − 0)! 0! 2! ( 2 − 1)!1! 0.52-0 0.50= 0.25 0.52-1 0.51= 0.5 2! ( 2 − 2)! 2 ! 0.52-2 0.52= 0.25 şeklindedir. 3 para birlikte atıldığında ise (n=3), olabilecek kombinasyon adedi 4’tür: 3 yazı (0 tuğra), 2 yazı 1 tuğra, 1 yazı 2 tuğra ve ((0 yazı) 3 tuğra. Bu defa yazı gelme halleri: 3 yazı, 2 yazı, 1 yazı ve 0 yazı’dır. Bu hallere ait olasılıklar da yukarıdaki gibi bulunabilir. Binom açılımında n'e göre terimlerin katsayıları Tablo 4.1'de görülen Pascal Üçgeni veya Tablo 4.2'de verilen n ve r'ye göre düzenlenmiş Binom Katsayıları tablosundan alınabilir. 51 Tablo 4.1: Pascal Üçgeni n 1 2 3 4 5 6 7 1 1 1 1 6 7 Binom Katsayısı 1 1 1 2 1 1 3 3 1 4 6 4 5 10 10 5 15 20 15 21 35 35 21 1 1 6 1 7 1 Tablo 4.2: n ve r değerlerine göre Binom katsayıları n 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 r 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 2 3 1 3 1 6 4 10 10 15 20 21 35 28 56 36 84 45 120 55 165 66 220 78 286 91 364 105 455 120 560 136 680 153 816 171 969 190 1140 4 5 6 1 5 1 15 6 1 35 21 7 70 56 28 126 126 84 210 252 210 330 462 462 495 792 924 715 1287 1716 1001 2002 3003 1365 3003 5005 1820 4368 8008 2380 6188 12376 3060 8568 18564 3876 11628 27132 4845 15504 38760 7 8 9 10 1 8 1 36 9 1 120 45 10 1 330 165 55 11 792 495 220 66 1716 1287 715 286 3432 3003 2002 1001 6435 6435 5005 3003 11440 12870 11440 8008 19448 24310 24310 19448 31824 43758 48620 43758 50388 75582 92378 92378 77520 125970 167960 184756 Tablo değerleri MS Excel, COMBIN(n,r) fonksiyonu ile hesaplanmıştır. 4.3.2.Binom Populasyonunun Parametreleri (p+q)n genel formülüne göre dağılış gösteren bir populasyonda, Ortalama = np Varyans = npq (4.5) (4.6) dur. Buna göre binomiyal dağılımlar birbirlerinden n ve p değerleri ile ayrılırlar. Yani n ve p değerleri eşit olan dağılışlar birbirlerinin aynıdırlar; ortalama ve varyansları eşittir. 52 4.3.3.Binom Dağılımının Özellikleri • Binom dağılımı saymayla belirlenen niceliklerin dağılımıdır. • Varyantların sınıflara dağılımı birbirlerine bağlıdır. • p=q=0.5 ise dağılım simetriktir, normal dağılıma benzer. p≠q olması halinde asimetriktir ve büyük olan özelliğe doğru yığılma gösterir. • Dağılımda n+1 terim vardır ve 1. terim pn’dir. Diğer terimlerde p’nin üssü 1 azalırken, q'nun üssü 1 artar. p ve q’nun üsleri toplamı daima n'e eşittir. • Terimlere ait olasılıkların toplamı 1'e eşittir. • Binom dağılımının çözülebilmesi için n ve p bilinmelidir. • Binom dağılımında ortalama ve standart sapma birbirlerine bağlıdır. 4.3.4.Binomiyal Dağılım Uygulamaları Misal 4.5: %25'i beyaz, %75'i kırmızı bilyelerden meydana gelen bir torbadan 4 bilye çekildiğinde, beyaz ve kırmızı bilyelerin geliş olasılıkları nedir? p=0.25 q=0.75 ve n=4'tür. 5 kombinasyon vardır. Bunlar: 4 beyaz (0 kırmızı), 3 beyaz 1 kırmızı, 2 beyaz 2 kırmızı, 1 beyaz 3 kırmızı ve (0 beyaz) 4 kırmızı şeklindedir. Pascal üçgeninde n=4'e bakacak olursak, bu hallerin katsayılarının sırayla 1, 4, 6, 4 ve 1 oldukları görülür. Buna göre açılım ve olasılıklar şöyle olur: (p+q)4=1p4-0q0+4p4-1q1+6p4-2q2+4p4-3q3+1p4-4q4 =0.254+4(0.25)3(0.75)+6(0.25)2(0.75)2+4(0.25)(0.75)3+0.754 =0.039+0.0469+0.2109+0.4219+0.3164=1 Görüldüğü gibi, 4 beyaz gelme olasılığı %0.39, 3 beyaz gelme olasılığı %4.69, 2 beyaz gelme olasılığı %21.09, 1 beyaz gelme olasılığı %42.19 ve hiç beyaz gelmeme olasılığı %31.64 olmaktadır. Tüm kombinasyonlara ait olasılıkların toplamı 1'dir. Misal 4.6: Bir fıdanlıktan pazara verilen fidanların %10'unun standart dışı olduğu varsayılıyor. Satılan fidanlardan rastgele 8 tane alınsa, standart dışı - normal fidan kombinasyonları vc bunların olasılıkları nasıldır? n=8 olduğuna göre, buradaki soru (p+q)8 binomunun açılımıdır. Aranan özelliği standart dışı, aranmayanı normal olarak ele alacak olursak, standart dışı fidanlar için p=0.1, normal fidanlar için q=0.9'dur. 8+1=9 kombinasyon vardır. Açılım ve olasılıklar Tablo 4.3'te verilmiştir. Katsayılar Binom katsayıları tablosundan alınmıştır. 53 Tablo 4.3: (0.1+0.9)8 binomunun açılımı Terimler r 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 St. dışı fidan (p) 8 7 6 5 4 3 2 1 0 Normal fidan (q) 0 1 2 3 4 5 6 7 8 Katsayı pn-rqr 1 8 28 56 70 56 28 8 1 p8-0q0=0.180.90 p8-1q1=0.170.91 p8-2q2=0.160.92 p8-3q3=0.150.93 p8-4q4=0.140.94 p8-5q5=0.130.95 p8-6q6=0.120.96 p8-7q7=0.110.97 p8-8q8=0.100.98 Toplam Sonuç (Olasılık) 0.00000001 0.00000072 0.00002268 0.00040824 0.00459270 0.03306744 0.14880348 0.38263752 0.43046721 1.00000000 Tablonun son sütunundaki olasılıklar, binomiyal populasyonun frekens dağılımı olarak ele alınabilir. Ancak bu frekanslar oransaldır (%). Oransal frekans dağılımı Şekil 4.4'te grafik olarak gösterilmiştir. 0,50 Olasılık 0,40 0,30 0,20 0,10 0,00 0 1 2 3 4 5 6 7 8 Normal fidan sayısı Şekil 4.4: (0.1+0.9)8 binomunda olasılıklar Grafik, binomiyal dağılışlar için en uygun grafik olan çubuklu diyagram şeklinde çizilmiştir. Burada sınıflar birbirinden kesin olarak ayrılmaktadır. Çünkü binomiyal populasyonlar sayma yoluyla elde edilen varyantlardan meydana gelir. Bu durum, binomiyal populasyonları normal populasyonlardan ayıran en önemli özelliktir. Her varyant ötekinden tam sayı olarak ayrılır. Dağılış kesiklidir. 4.3.2 maddesinde belirtildiği gibi, Binomiyal dağılımda p=q ise dağılım simetrik şekil arzeder. Yukarıdaki misalde olduğu gibi p, q'dan farklı ise dağılım çarpıklaşır ve olasılığı büyük olan özelliğe doğru yığılma göstcrir. Bu misalde p<q olduğundan dağılım sağ tarafa yığılmıştır. Misa1 4.7: Herhangi bir olayın n denemede r defa oluş ihtimali nedir? Mesela, "% 10'u standart dışı olarak satılan fidanlardan rastgele satın alınan 8 tanesinden 2'sinin standart dışı çıkma olasılığı nedir?" sorusu ele alınabilir. 54 Tablo 4.3'e bakılacak olursa, bunun p=0.1488 yani %14.88 olduğu görülür. Misal 4.8: Her hangi bir olayın n denemede en çok r defa oluş ihtimali nedir? Bu defa soru aynı fidanlığın fidanlarından rastgele satın alınan 8 tanesinden en çok 2'sinin standart dışı çıkma ihtimalinin ne olduğu şeklinde düşünülebilir. Bunun cevabı 0, 1 ve 2 standart dışı fidan olasılıklarının toplamıdır. Tablo 4.3'e bakılacak olursa, bu olasılık: P=0.4305+0.3826+0.1488=0.9619 olduğuna göre, %96.19'dur. Misal 4.9: Her hangi bir olayın n denemede r veya daha fazla oluş ihtimali nedir? Bu defa da mesela, aynı fidanlardan rastgele satın alınan 8 tanesinden cn az 2 veya daha fazlasının standart dışı çıkma ihtimali sorulmaktadır. O halde cevap, 2 ve daha fazla standart dışı fidanların olasılıkları toplamıdır. Tablo 4.3'e göre bu olasılık: P=0.00000001+0.00000072+0.00002268+0.00040824+0.00459270+0.0 3306744+0.14880348=0.1869 bulunur. Demek ki satılan her 8 fıdandan 2 veya daha fazlası %18.69 olasılıkla standart dışı olacaktır. 4.4.Poisson Populasyonları Poisson populasyonları da, binom populasyonları gibi sayma yoluyla elde edilen varyantlardan meydana gelir. Bu populasyonlar da kendine özgü bir dağılım oluşturur. Poisson dağılımları, belli bir zaman, uzunluk, alan veya hacım biriminde rastgele ve bağımsız olarak oluşan ender rastlanan olayların olasılığını hesaplamakta kullanılır. Böylelikle bunlarda da dağılım kesiklidir. Burada da aranan olayın veya özelliğin oluş ihtimali sabittir. Ancak çok küçüktür. Poisson dağılımının ender rastlanan olaylara ait oluşu, bunu binomdan ayıran en önemli özelliktir. Mesela toprakta 1'er m2'lik alanlardaki larva sayısı, bazı meyvelerde olabilecek kurt sayısı, futbol maçlarında atılan gol sayısı, fabrikalarda imal edilen malların arızalı veya kusurlu çıkması gibi. Poisson dağılımı özellikle sonuncu örneğe çok uygundur. Çünkü esasen fabrikalarda imalatta arızalı mal çıkma olasılığı çok düşüktür. Poisson dağılımının olasılığa ait genel formülü: P= λ′ r! e-λ (4.7) Formülde: r=Aranan veya istenen olayın oluş sayısı (0 dahil tamsayıdır), λ=Poisson populasyonunnn ortalaması, e=Tabii logaritma tabanıdır. Bu formül, aranan olayın r defa oluşunun oransal miktarını verir. Formüle dikkat edilecek olursa, poisson dağılımında bilinmeyen sadece λ'dır. 55 4.4.1.Poisson Dağılımının Parametreleri ve Özelliği Dağılımın aritmetik ortalaması: λ=np (4.8) dir. Varyansı ortalamaya eşittir. Yukarıda da işaret edildiği gibi, aritmetik ortalaması bilinen poisson dağılımı belli demektir. Ortalamaları aynı olan poisson populasyonları da bir birinin aynıdır. λ büyüdükçe, dağılım normal dağılıma yaklaşır. Misal 4.10: Bir şişe fabrikasının üretiminden %1'inin hatalı olduğu biliniyor. Şişeler 500'lük paketler halinde dağıtıldığında, bu paketlerde 0, 1, 2, 3, 4, 5 şişenin kusurlu olma olasılıkları nedir? Soru binom dağılımı yardımıyla çözülmek istendiğinde, p=0.01, q=0.99 vc n=500 olarak düşünülüp olasılıklar (p+q)n=(0.01+0.99)500 binomunun açılımıyla elde edilebilir. Ancak Poisson dağılımıyla şu şekilde bulunur: n=500 olduğuna göre, (4.8) nolu formüle göre λ=np=500×0.01=5 bulunur. Demek ki her 500'lük pakette ortalama 5 şişe kusurludur. Buradan (4.7) nolu formüle göre aranan olasılıklar: r=0 için: P(0)= r=1 için: P(1)= r=2 için: P(2)= r=3 için: P(3)= r=4 için: P(4)= r=5 için: P(5)= λ′ r! 1 5 1! 2 5 2! 3 5 3! 4 5 4! 5 5 5! e-λ = 5 0 0! 2.71828-5 = 1×0.006738=0.006738 2.71828-5 =0.033690 2.71828-5 =0.084225 2.71828-5 =0.140374 2.71828-5 =0.175468 2.71828-5 =0.175468 Demek ki 500'lük paketlerin: %0.67'si kusursuz olmakta, %3.37’sinde 1 tane kusurlu, %8.42’sinde 2 tane kusurlu, %14.04’ünde 3 tane kusurlu, %17.55'inde 4 tane kusurlu, %17.55'inde 5 tane kusurlu 56 şişe bulunmaktadır. Misal 4.11: Đnsanların bir seruma karşı %0.1 alerjilerinin olduğu biliniyor. 1000 kişiden 3'ünün alerji gösterme olasılığı nedir? n=1000, p=0.001, q=0.999 olduğuna göre λ=np=l000×0.001= 1'dir. 3 P(3)= 1 3! 2.71828-1=0.061313 bulunur. Demek ki 1000 kişiden 3'ünde allerji olasılığı %6.13'dür. 4.5.Normal Olmayan Populasyonlar ve Sayı Dönüştürmeleri (Transformasyonlar) Normal populasyonlar dışındaki populasyonlar, binomiyal, multinomiyal ve poisson populasyonları gibi populasyonlardır. Bu tip populasyonlarda, varyantlar sürekli bir dağılım göstermez ve çarpık bir çan eğrisine benzeyen, bir tarafa yığılmış bir dağılım gösterirler. Bunlar genellikle sayılarak elde edilen varyantların gösterdiği dağılımlardır. Ayrıca oransal değerler de (mesela % değerleri) normal dağılım göstermezler. Binomiyal populasyonlar, sabit bir oranda ortaya çıkan bir özelliğe sahip bireylerle, bu özelliğe sahip olmayan bireylerin oluşturduğu populasyonlardır. Bunlar iki tip varyanta sahiptir ve her tipin ortaya çıkma şansı sabittir. Poisson populasyonlarında da bir özelliğin ortaya çıkış olasılığı sabittir. Ancak binomiyellere göre çok küçüktür. Normal olmayan populasyonlara, istatistiğin canlılara mahsus kolu olan biyometriye ait analiz metotları -mesela varyans analizleri- uygulanamaz. Bu tip populasyonlardan elde edilmiş sayıların dağılımının belli yöntemlere göre çevrilerek (dönüştürülerek, transforme edilerek) normalleştirilmeleri gerekir. En çok kullanılan dönüştürme metotları kare-kök, logaritma ve arcsinüs dönüştürmeleridir. 4.5.1.Kare Kök Dönüştürmesi Sayım yoluyla elde edilen gözlemler, mesela belli bir toprak alanlarındaki yabancı ot sayısı, bir bitkinin (mesela ağacın) üzerindeki belli bir böcek sayısı gibi poisson dağılımı gösteren ve çok büyük olmayan sayılar halinde elde edilen varyantlar, kare kökleri alınarak normal dağılıma dönüştürülürler (kare kök dönüşümü). Bunların içinde sıfır veya 10'dan küçük sayılar varsa, dönüştürme her sayıya 1 ilave edilerek (yani X + 1 ) şeklinde yapılır. 4.5.2.Logaritmik Dönüştürme Logaritmik dönüştürme, çarpık 57 dağılım gösteren (binomiyal) populasyonlara uygun bir dönüştürme metodudur. Yine sayım yoluyla elde edilen varyantlar büyük değerler ihtiva ediyorsa, bu dönüştürme şekli tavsiye edilmcktedir. Logaritmik dönüştürme yapmak için varyantların logaritması (logX) alınır. 4.5.3.Arc-Sinüs Dönüştürmesi Arc-sinüs dönüştürmcsi (arc-sin X ), ondalık kesir veya % halinde elde edilmiş (ki bu sayılar 0 ile 1 arasında değişir), binomiyal dağılım gösteren verilere uygulanır. Bu amaçla, bazı istatistik kitaplarında bulunan özel tablolardan yararlanılabileceği gibi, sin-1 (invers sinüs) hesabı yapan bir hesap makinesi de kullanılabilir. Böyle bir hesap makinesi ile bir değer (mesela 0.45, yani %45), önce kare kökü alınıp, sonra sin-1 tuşuna basılmakla arc-sinüs'e çevrilmiş olur. Örneğin 0.45'in arc-sinüsü 42.13 bulunur. Arc-sin'e çevrilmiş bir değerin, hesap makinesi ile geriye, asıl yüzde haline dönüştürülmesi ise, önce bu değerin sinüsünün alınıp, çıkan sayının karesinin alınmasıyla gerçekleştirilir. 58 5. ÖRNEKLEME 5.1.Giriş Bu bölüme kadar çeşitli şekillerde "örnek" veya "nümune"den söz edildi. Bilindiği gibi örnek, ana kütleyi (veya populasyonu, toplumu) tanımak maksadıyla içinden çekilen bireyler grubuna denmektedir. Mesela Türk insanının boyunu bulmak için, tüm insanların boyunu ölçmek yerine, örnekleme ile bir takım kişilerin boyu ölçülerek bu kişiler üzerinden Türk populasyonunun boyu öğrenilmeye çalışılır. Aynı şekilde ormancılıkta belli tür ve yaşlardaki meşcerelerin hacımları, bunlardan alınan örnek ağaçların ölçülmesiyle tahmin edilir. Örnekteki bireylerin incelenmesiyle, ölçülmesiyle, tartılmasıyla, ortalama ve varyans gibi istatistikler elde edilmekte ve bunlar üzerinden ana kütleye ait parametreler tahmin edilmektedir. Böylelikle üzerinde çalışılan ana kütle hakkında bilgi edinilmektedir Ancak bu işlemlerin sağlıklı ve güvenilir olabilmesi iyi bir örnekleme ile mümkündür. Bu bölümde örnekleme teknikleri hakkında kısa bilgi verilecektir. 5.2.Örnek ve Örneklemeye Ait Genel Bilgiler Büyük ve küçük örnek: Örnekteki birey sayısı n<30 ise çekilen örnek küçük örnek sayılmaktadır. Ancak biyometride genellikle büyük örneklerle çalışılır. Birey ve ölçü birimi: Örneklemeyle üzerinde çalışılacak bireyler, insan, bitki, hayvan olabileceği gibi, bunların meydana getirebileceği aileler, gruplar da olabilir. Mesela tek tek ağaçlar örneği teşkil edebileceği gibi, bunların yer aldığı belli bir saha da “örnek” olabilir. Ölçülerek - tartılarak incelenen bireylerin ölçü ve tartı birimleri kesirli sayılardan meydana gelir. Örnekleme için ölçü vc tartılarda uygun, mantıklı bir birim seçilmeli ve ölçü - tartı uygun küsuratta yapılmalıdır. Mesela metrelerce boylu ağaçların boyunun cm üzerinden, mm hassasiyetle ölçülmesi anlamsızdır. Uygun birim m, uygun kesir ise cm'dir. Buna karşılık bir kaç gramlık bir tohumun, kg üzerinden g hassasiyetle tartılması da yanlıştır. Bu defa g üzerinden, miligrama varan bir hassasiyet söz konusu olabilir. Bu konuda, ölçülecek - tartılacak materyalin, pratikte kullanılan ölçü birimi ve uygun ondalığı esas alınmalıdır. Örneklemenin safhaları: Önce örneklemenin amacı belirlenmeli ve ana kütlenin sınırları olabildiğince tesbit edilmelidir. Örneklerde neyin üzerinde 59 durulacağı, ölçüleceği, tartılacağı iyi bilinmelidir. Mesela ağaç hacım tablosu için yapılan örneklemede belli aralıklarla gövde çapı ve kabuk kalınlığı, 1.30 m çapı, ağacın tam boyu ölçülür. Örneklemede kullanılmak üzere, ölçülerin yazılacağı uygun formlar düzenlenmeli, alet, makine ve insan gücü sağlanmalıdır. Örnekleme metodu, örnek büyüklüğü ve yapılacak masraf tesbit edilmelidir. Đyi bir örnekleme için, rastgele örnekleme metotları kullanılmalı, örnek ana kütleyi olabildiğince iyi temsil etmelidir. Bunun için örnek mümkün olduğu kadar çok sayıda bireyi kapsamalı, örneği teşkil edecek bireyler seçilip beğenilmeden, işin kolayına kaçılmadan alınmalı ve tesbit edildiği yerden, tesbit edildiği şekilde ölçülmelidir. Örnekleme öncesi personel eğitilmelidir. Mevcut imkanlara göre en ucuz ve kolay yol seçilmeli, ancak maliyeti düşürmek için prensiplerden ödün verilmemelidir. 5.3.Örnekleme Metotları Örnekleme bilinçli örnekleme ve rastgele örnekleme olarak iki şekilde yapılmaktadır. 5.3.1.Bilinçli Örnekleme Metotları Bilinçli örnekleme, yukarıda belirtilen genel prensiplerin aksine, belli ön yargıya dayanarak yapılır. Aşağıdaki şekillerde olabilir: Monografi: Bu metot; örnek olay incelemesi olarak da bilinir. Toplumdan ilginç bulunan bir kaç bireyin bilinçli olarak seçilmesiyle olur. Bunlar ayrıntılı şekilde incelenir. Genellikle sosyal bilimlerde kullanılır. Kota yöntemi: Toplumun farklı özelliklerine göre gruplandırılması (yaş, yaşam standardı, cinsiyet gibi) ve her gruptan belli oranda örnek alınmasıyla yapılır. Özellikle heterojen toplumlara uygulanır. Yoğunluk yöntemi: Yine heterojen toplumlarda, bireylerin sadece yoğun olarak toplandığı gruplardan örnek alınmasıdır. 5.3.2.Rastgele Örnekleme Metotları Rastgele örneklemenin esası, toplumdaki bütün bireylerin örneğe girme şansının eşit tutulmasına dayanır. Ancak bu prensip her zaman gerçekleştirilemez. Çünkü toplum çok büyük ve dağınık olabilir. Bu durumda örnekleme sınırlandırılmış bir toplumdan yapılır. Bu durumda saptanan bilgiler de bu çerçeve dahilinde genelleştirilebilir. Mesela dünyadaki tüm Karaçam populasyonu örneklenemeyeceği gibi, Türkiye'dekilerin tamamı da örneklenemez. Örnekler belli bölgelerden alınır. Rastgele örnekleme aşağıdaki şekillerde yapılabilir: Basit rastgele örnekleme: Toplumdaki her bireye örneğe girmekte eşit 60 şans tanır. Mesela yazı-tuğra atma, bireyleri numaralandırarak kura çekme, harita veya kroki üzerine noktaları rastgele serpme gibi uygulamalarla basit rastgele örnekleme yapılabilir. Ancak bu metodun uygulanabilmesi için, toplumun tamamı bilinmeli ve numaralanmalıdır. Sistematik (Dizgeli) örnekleme: Basit rastgele örnekleme için toplumun tüm bireyleri numaralandırılmalı ve kura sonucu tek tek aranıp bulunmalıdır. Bu işlem uygulamada, özellikle arazi çalışmalarında güçlük çıkarmaktadır. Yine basit rastgele örneklemede, toplumun bazı yerlerinden tesadüfen hiç örnek alınmayabilir. Bu duruın özellikle heterojen topluınlarda sakıncalı görülmektedir. Basit rastgele örneklemenin bu güçlük ve sakıncalarından kaçınmak için sistematik örnekleme kullanılmaktadır. Bu metot sıralı durumdaki toplumlarda rastgele birinden başlanıp, belli aralıklarla her k’ıncı bireyin alınması veya harita üzerinde rastgele bir noktadan başlanıp her bir kaç yüz m’de bir örnek sahanın alınmasıyla yürütülür. Sistemetik örnekleme özellikle ağaçlandırma sahası gibi muntazam şekilde sıralanmış bireylerin oluşturduğu toplumlara çok uygundur. Bu metoda göre toplumun hepsinin bilinmesine ve numaralanmasına gerek yoktur. Katmanlı (tabakalı) örnekleme: Toplumun heterojen olması halinde, önce homojen katmanlara ayrılarak alt toplumlara bölünmesi ve her alt toplumdan büyüklüğü oranında birey alınması demektir. Mesela incelenen bir ağaç türü için toprak türü, bakı, meyil, rakım veya uygulanan kültür metotlarına göre katmanlar oluşturulabilir. Bu metot kota yöntemine benzerse de, katmanlar içinden örneğin rastgele alınmasıyla o metottan ayrılır. Katmanlı örnekleme sayesinde her katman için özel bilgi edinilmekte, her katmanda ayrı ekipler çalışabilmekte, katmanlar homojen olacağı için daha küçük örneklerle yetinilebilmektedir. Küme örneklemesi: Çok büyük ve sınırları belli olmayan toplumların örneklenmesinde kullanılır. Böyle toplumlarda toplum önce n sayıda kümeye ayrılmakta, sonra her kümeden m’er adet birey alınmaktadır. Kümeler ve küme içleri, basit rastgele, sistematik veya katmanlı olarak örneklenebilmektedir. Burada kümelendirmeden maksat toplumu homojen gruplara ayırmak değildir. Çok basamaklı örnekleme: Küme örneklemesinin daha ayrıntılı şeklidir. Bu metoda göre toplum birkaç basamak halinde alt ünitelere bölünerek örneklenmektedir. Mesela önce bölgelere ayrılmakta, sonra her bölge bloklara ayrılmakta, her blok kesimlere ayrılmakta ve her kesimden örnek bireyler alınmaktadır. Bu metot da, küme örneklemesinde olduğu gibi, bireylerin yerinin ve sayısının önceden bilinmemesi ve toplumun zaman-mekan içinde büyük dağılış göstermesi durumunda uygulanmaktadır. 61 6. HĐPOTEZ KONTROLLARI VE GÜVEN ARALIĞI 6.1.Giriş Bu bölüme kadar, nümunenin tanınması hakkında bilgiler verilmiştir. Bundan sonraki konularda istatistik analiz ve kontrol metotlarına girilerek, nümuneden populasyonların tahmini çalışmaları açıklanacaktır. Đstatistikte hipotez kontrolları ile, denemeci ve araştırmacı ortaya attığı hipotezlerin geçerliliğini kontrol ettiği gibi, üzerinde çalıştığı populasyona ait parametreleri de tahmin edebilir. 6.2.Hipotez Kontrolu Araştırma ve deneme sonuçlarının değerlendirilmesi ve genelleştirilmesi, belli bir hipotezin kabul veya reddedilmesiyle olur. Hipotez kontrolunda sırayla şu işlemler yapılır: • Araştırma veya denemenin amacına uygun hipotez kurulur. • Hipotezin belirttiği bir populasyonun var olduğu düşünülür. • Eldeki örneğin bu populasyondan çekilmiş bir tesadüf örneği olması ihtimali hesaplanır. • Bu ihtimalin büyüklüğüne göre, hipotez kabul veya reddedilir. Mesela “A” isimli yeni bir kavak klonu bulunduğunda, bunun büyüme yönünden ne derece iyi olduğunu anlamak için, halen yetiştirilmekte olan ve verimliliği kanıtlanmış diğer bir klonla (örneğin B klonu) mukayesesi gerekebilir. Bu durumda kurulacak hipotez “A klonu B klonundan farksızdır.” şeklinde olur. Bu hipotez, A ve B klonlarının belli bir yaştaki çaplarının, boylarının, hacımlarının aynı olduğunu varsayar. Hipoteze göre, A klonu aslında B klonu populasyonuna aittir. Yapılan hesaplarla bu olasılık bulunarak A klonunun B klonu populasyonuna mensup olup olmadığına karar verilir. Veya başka bir araştırma ile her hangi bir meyvede bir vitamin aranabilir. Bu defa hipotez “X meyvesinde Z vitamini miktarı 0’dır.” şeklinde olacaktır. Bu hipotez ise, ortalaması Z vitamini bakımından 0 olan bir populasyonu ele almaktadır. Yine yapılan çalışmalarla X meyvasının ortalaması sıfır olan bu populasyona ait olma olasılığı hesaplanır. Đstatistikte genellikle alınan örneklerin “birbirinden farksız olduğu” “eşit sayıldığı” aranan özelliği “bulundurmadığı” veya etkisi aranan konunun “etkisiz olduğu” varsayımlarını öngören sıfır hipotezleri kurulmakta ve doğrulukları denetlenmektedir. Sıfır hipotezlerine göre populasyonlarda kıyaslanan özellik arasındaki fark sıfır sayılır. Bu fark aslında hiç bir zaman 62 sıfıra eşit olmaz. Ancak araştırmacının esas alacağı belli olasılıklar çerçevesinde sıfır olduğu kabul edilir. Sıfır hipotezi H0 ile gösterilir. Bunun karşıtına ise alternatif hipotez denir ve H1 ile gösterilir. Hipotez kontrolları belli olasılık çerçevesinde yapılır ve bu olasılığın derecesine göre kurulan hipotez kabul veya reddedilir. Bu amaçla esas alınan olasılıklar 0.05, 0.0l ve 0.001’dir Tarım ve ormancılıkta genellikle 0.05 ve 0.01 olasılıklar yeterli olmaktadır. Bu bölümde t istatistiği vasıtasıyla hipotez kontrolu açıklanacaktır. 6.2.1.t Đstatistiği ve t Dağılımı Ortalaması µ, standart sapması σ olan bir populasyondan n varyantlı sonsuz sayıda tesadüf nümunesi çekilmiş olsun. Bunların ortalamaları da bir normal dağılış gösterir. Bu dağılımın ortalaması populasyonun ortalamasına (µ) eşittir. Standart sapması anlamına gelen standart hatası ise s X olarak tahmin edilebilir (Bak: Madde 3.5). Böyle bir populasyonda örnek ortalamalarının, populasyon ortalamasından uzaklığı ( X -µ) dağılımın standart hatası ( s X ) cinsinden: t= X −µ sX (6.1) formülüyle ifade edilebilir. Bu şekilde bulunacak t değerleri, -∞ ile +∞ arasında değer alırlar (Dağılımdaki varyantların %99'unun ortalamadan en çok ±3σ uzakta olduğu düşünülürse (Bak: madde 4.2.2), t’lerin çoğunluğunun değeri –3 ile + 3 arasında değişir.). Bunların da ortalaması 0 olur ve ortalaması 0 olan bir normal dağılış gösterirler. Böylece, n varyanslı sonsuz sayıda örneğe ait t değerlerinin gösterdiği sıfır ortalamalı normal dağılıma Student'in t dağılımı denmektedir. Dağılımın varyansı ise örneklerin serbestlik derecesine (n-1) bağlı olarak değişir (Bak: Madde 3.5) (Düzgüneş, s.41). Varyans, örnekteki varyant sayısı ile ters orantılı olduğundan, n büyüdükçe varyans küçülür (Şekil 6.1). Belli serbestlik derecelerindeki örnek ortalamalarına ait t değerlerinin dağılımı (oluş, ortaya çıkış ihtimali), örneklerin serbestlik derecesine göre Ek Tablo 2'de verilmiştir. t değerinin serbestlik derecesi, örnekteki varyant sayısının 1 eksiğidir. Tablonun ilk sütununda örneklerin serbestlik dereceleri, diğer sütunların başlarında ise olasılıklar verilmiştir. Bu tabloya bakılarak, bir nümune üzerinden hesaplanan t değerinin ve bundan daha büyük t değerlerinin dağılımdaki oransal miktarı (% olarak) veya ortaya çıkma olasılığı (P) tayin edilebilir. 63 Şekil 6.1: Çeşitli sayıda varyantı ihtiva eden tesadüf nümuneleri ortalamalarının dağılışları Tabloya göre, mesela 7 SD'li 2.365 ve 2.365'den daha büyük t değerleri, dağılımda 0.05 oranında yer almaktadırlar. Ancak bu sınırlar mutlak değer olarak dikkate alınmalıdır. Çünkü aynı durum -2.365 ve daha küçük t'ler için de söz konusudur. Daha açık ifadeyle, 2.365 dahil büyük ve -2.365 dahil küçük t değerleri toplam olarak dağılım %5'ini kapsamaktadır. Bu, 8 varyantlı örneklerin %5'inde, mutlak değer itibariyle 2.365 ve daha büyük (yani -2.365 dahil küçük, +2.365'dahil büyük) t değeri hesaplanacak demektir. Yine 7 SD'li, ancak 3.499 ve daha büyük t değerleri ise dağılımda 0.01 oranında bulunmaktadır. Bu ise, örneklerin `%1'inin 3.499 ve daha büyük (yani 3.499'dan küçük, +3.499'dan büyük) t değerine sahip olacağı anlamını taşır. 7 SD'li, 5.408 ve daha büyük t değerleri de dağılımda 0.001 oranında yer almaktadır. Dolayısıyla örneklerin %0.1'inde 5.408 ve daha büyük (yani 5.408'den küçük, +5.408'den büyük) t değerine rastlanmaktadır. Başka bir ifadeyle, 7 SD'li nümunelerde, mutlak değer olarak 2.365 ve daha büyük bir t dcğerinin ortaya çıkış ihtimali %5; 3.499 ve daha büyük bir t değerinin ortaya çıkış ihtimali `%l; 5.408 ve daha büyük bir t değerinin ortaya çıkış ihtimali ise %0.1'dir. t değerleri bu şekilde dağılımın iki yanını da kapsadığından, tablonun üstünde "iki yanlı dağılım" ifadesi kullanılmıştır. Şekil 6.2'de, dağılımda sağlı-sollu toplam %5'lik bir alan işgal eden ve −2.365'den küçük, +2.365'den büyük t'lerin yer aldığı sahalar gösterilmiştir. 64 t=-2.365 Alan %2.5 -4 -3 -2 t=2.365 Kabul bölgesi %95 -1 0 Alan %2.5 1 2 3 4 t deðerleri Şekil 6.2: 7 Serbestlik dereceli t değerlerinin dağılımı Ancak t'nin işareti söz konusu ise, yani belli bir t değerinden yalnız büyükler soruluyorsa, tablonun altındaki olasılık değerleri ele alınmalıdır. Mesela yine 7 SD'li nümunelerde 2.365'den yalnız büyük t değerlerinin ortaya çıkış olasılığı %2.5'tur. Bu defa ele alınan değerler "tek yanlı dağılım" içindir. 6.2.2.Populasyon Ortalaması Đle Đlgili Hipotez Kontrolu Populasyon ortalaması ile ilgili sıfır hipotezi “örnek ortalamasının populasyon ortalamasından farksız olduğu” veya "örnek ortalamasının populasyona ait olduğu" şeklindedir. Bu tip hipotez kontrolu ile, bir örneğin belli bir populasyona ait olup olmadığı veya belli bir populasyondan çekilmiş bir nümune olup olmadığı denetlenir. Kontrol için t istatistiğinden yararlanılır. (6.1) nolu formüle göre, örneğin t değeri hesaplanarak, bunun ve bundan daha büyük (mutlak değer itibariyle) t değerlerinin elde edilme olasılığı bulunur. Olasılık %5 veya daha küçükse hipotez reddedilir. Bu olasılığın 100'den farkına ise, güven düzeyi denir. %95, %99 güven düzeyi gibi. Tarım ve ormancılıkta hipotezlerin kabulü için geçerli güven düzeyi olarak %95 esas alınmaktadır. Konuyu bir örnekle açıklayalım: Misal 6.1: Tablo 1.1'de gösterilen örnek, (bu fidanlıkta yıllardır yapıldığı varsayılan ölçülere göre) ortalaması 7.3 m olan bir populasyondan alınmış sayılsın. Bu nümune, acaba gerçekten ortalaması 7.3 m olan bir populasyondan çekilmiş bir örnek midir? Bunun kontrolu için, örnek ortalaması ile populasyon ortalamasının eşit sayılıp sayılamayacağı denetlenir. O halde hipotez: "Eldeki 50 bireylik nümune, söz konusu populasyona mensuptur ( X =µ)." veya “Nümune ortalaması, populasyon ortalamasından farksızdır ( X -µ=0).” şeklindedir. Hipotezin kontrolu için: 65 t= 7.512 − 7.3 = 1.60 0.1324 hesaplanır. Ek Tablo 2'de n-1=49 serbestlik derecesi için değer verilmemiştir. Bu sebepten kendisine en yakın serbestlik derecesine ait değere bakılır veya enterpolasyon yapılır. %5 olasılık için 40 SD’li tablo değerinin t40,0.05=2.021 olduğu görülür. Demek ki 40 SD'li bir dağılımda mutlak değer itibariyle en az 2.021 ve daha büyük t değerlerinin elde edilme olasılığı %5 olmaktadır. Bu değeri 49 SD’li örneğimiz için kullanacak olursak, bulduğumuz t değeri bundan büyük olmadığına Yani %5’lik sahaya girmediğine) göre hipotez kabul edilir ve “Nümune adı geçen populasyona aittir” denir. Hesaplanan t değeri 2.021 ve daha büyük olsaydı, sıfır hipotezini reddedecek ve “Nümune bu populasyondan çekilmiş bir tesadüf nümunesi değildir” diyecektik. 49 SD'li örneklere ait t değerlerinin dağılımda %5 oranında yer alan kısımları Şekil 6 3'de gösterilmiştir. Şekilde görüleceği üzere, dağılımda %5 oranında yer alan t değerlerinin, %2.5'u - uçta, %2.5'u + uçta yer almaktadır. Bu sahalara düşen t'ler hipotezin reddini gerektirdiğinden, bu bölgeler red bölgesi diye adlandırılır. Misale göre bu alanlar t= -2.021'den küçük ve t=2.021'den büyük kısımlardır. Buradaki kontrola, dağılımın iki yanını da kapsadığından iki yanlı kontrol denir. Ancak hipotez mesela "örnek ortalaması populasyon ortalamasından büyüktür ( X >µ)" ise t değerinin yalnızca pozitif olduğu haller söz konusu olacaktır. t=1.6 Red bölgesi %2.5 -4 -3 Red bölgesi Kabul bölgesi %95 -2 -1 0 1 2 3 4 t deðerleri Şekil 6.3: 49 serbestlik dereceli örneklerde t'lerin kabul ve red bölgeleri Bu duırumda red bölgesi sadece sağ uçta kalan kısım olacağından %5 önemlilik kontrolu için, tek taraftaki %5'lik red bölgesi dikkate alınacaktır. Buna ait t değeri için de, Ek Tablo 2'nin altındaki tek yanlı test için belirlenen olasılıklar esas alınacaktır. Tabloda bu değerin, t0.05=1.684 olduğu görülür. Bu 66 şekildeki hipotez kontroluna da tek yanlı hipotez kontrolu denir. 6.3.Populasyon Ortalamasının Tahmini ve Güven Sınırları Daha önce işaret edildiği gibi, ortalama populasyona ait bir parametredir. Ve parametreler, nümune üzerinden hesaplanan istatistikler vasıtasıyla tahmin edilir. Đstatistikler, standart hatalarının küçüklüğü oranında parametreye yaklaşır. Ancak hiçbir zaman parametre ile aynı olamaz. Bu sebepten, bir parametre daima istatistik ve bunun standart hatası ile birlikte tahmin edilir. Parametrelerin tahmini, istenen bir güven düzeyinde, içinde bulunduğu sınırlar hesaplanarak yapılır. Bir populasyonun ortalaması, bu populasyondan çekilmiş bir nümune ortalaması ( X ) ve bu ortalamanın standart hatası ( s X ) ile istenen bir güven düzeyinde t tablosu değeri ile şu formüle göre tahmin edilir: X - (t× s X ) < µ < X + (t× s X ) Misal 6.2: hesaplayalım: Fidan örneğindeki ortalamanın (6.2) güven sınırlarını Nümunede X =7.512 m ve s X =0.1324 m hesaplanmıştır. Ek Tablo 2'den 49 SD için %95 güvenle (49 SD'sine en yakın değer olarak) t0.05=2.021 okunur. O halde % 95 güvenle fidan populasyonunun boy ortalaması (m): 7.512-(2.021×0.1324) < µ < 7.5I2+(2.021×0.1324) 7.24 m < µ <7.78 m arasında tahmin edilir. Populasyonun boy ortalaması %5 ihtimalle de bu sınırların dışındadır. Hesaplanan bu sınırlara güven sınırları denir. Burada yapılan tahmin t dağılımının iki tarafını da kapsadığından, söz konusu sınırlar iki yanlı güven sınırlarıdır. Bazı hallerde tek yanlı güven sınırları istenebilir. Bu durumda, ortalamanın belirlenen bir güven düzeyinde yalnız alt veya yalnız üst sınırı istenmektedir. Mesela yine fidan örneğinde t0.05 güvcnlc ortalamanın yalnız üst sınırını hesaplayabiliriz. Bu defa bizi t dağılımı altındaki alanın iki ucu değil, yalnız bir ucu ilgilendirmektedir. O halde “%95 güvenle ortalamanın üst sınırı nedir?” veya “%5 ihtimalle üst sınırın dışında kalan ortalamalar kaçtır?” sorusuna cevap aranmaktadır. Bu durumda tek yanlı test için %5 olasılıkla 49 SD'1i t değeri alınacaktır. Ancak tabloda 49 SD için değer verilmediğinden, buna en yakın 40 SD için verilmiş 1.684’lük t değeri alınabilir. Bu durumda istenen sınır: X = 7.512+(1.684×0.1324) = 7.73 m bulunur. O halde bu populasyonda fidanların ortalama boylarının %95 güvenle 7.73 m'ye kadar, %5 olasılıkla 7.73 m'den büyük olduğu söylenebilir. 67 7. SAYIMLA BELĐRLENEN POPULASYONLARDA HĐPOTEZ KONTROLU (KHĐ-KARE METODU) 7.1.Giriş Binomiyal populasyonlarda ve poisson populasyonlarında, olayların sabit ve belirli oranlarda ortaya çıktığı 4: Bölümde belirtilmişti. Mesela bir paranın havaya atılması sonucu yazı veya tuğra gelmesi olasılığı 0.5'dir. Bu gibi populasyonlardan alınan örneklerde varyantlar sayılarak elde edilir. Örneğin populasyona uygunluğu ise, sınıflardaki varyant adedinin, populasyonda olması gerekene uygunluğunun kontrolu ile anlaşılır. Bu maksatla, örneğin gerçekten bu populasyona ait olup olmadığı denetlenir. Bu defa sıfır hipotezi “örneğin hipotezle belirtilen populasyona ait olduğu” şeklindedir. Sayımla belirtilen populasyonlarda bu hipotezin kontrolu için Khikare metodu kullanılır. Ortalamaya dair bir hipotez kurulmadığından t kontrolu yapılamaz. 7.2.Khi-kare Değeri ve Khi-kare Dağılımı χ2 simgesiyle gösterilen khi-kare değeri aşağıdaki formüle göre hesaplanır: χ2 = ( f − f ′) 2 ∑ f′ Sınıflanmış ve beklenen değerleri veya oluş ihtimalleri bilinen bir dağılımda bu formüldeki: f=gözlenen frekanslar, f ′=beklenen frekanslardır. Örnekler üzerinden formüle göre hesaplanan khi-kare değerleri bir dağılım oluşturur. Khi-kare değerlerinin dağılımı, serbestlik derecelerine göre Ek Tablo 3'de verilmiştir. Bu tablo yardımıyla, bir örnekte hesaplanan khi-kare değerinin ortaya çıkış olasılığı veya başka bir anlamda populasyondan, eldeki örneğe benzer bir örneğin çekilme olasılığı (P) tesbit edilebilir. Mesela 3 SD için P=0.05 olasılıkla χ2 =7.815’dir. Bunun anlamı, rastgele örneklerde hesaplanan khi-kare değerlerinin, örneklerin %5’inde 7.815 ve daha büyük olduğudur. Bu değerden daha küçük khi-kare'ye sahip olanlar ise %95 kadardır. 68 Teorik dağılımlara uygunluk testinde khi-karenin serbestlik derecesi ana kütlenin frekansının hesaplanma metoduna göre değişir. Genel formül aşağıdaki gibidir: V=k-a-1 (7.2) Formülde k sınıf veya grup sayısı, a ise teorik dağılımın hesaplanmasında kullanılan parametre (aritmetik ortalama, varyans, standart sapma gibi) adedidir. Genel olarak normal dağılımlarda teorik dağılıma ait frekanslar aritmetik ortalama ve varyans üzerinden hesaplandığından, normal dağılıma uygunluk kontrolunda a=2 alınır. Binoma uygunluk kontrolunda ise teorik dağılım binom açılım formülü (formül 4.4) üzerinden ve her hangi bir parametre kullanılmadan hesaplanmışsa a=0’dır. Poisson dağılımı, populasyonun ortalamasının (λ) kullanılmasıyla hesaplandığıdan bu dağılımların uygunluk kontrolunda a=1 alınmaktadır. Khi-kare, dağılımın serbestlik derecesine bağlıdır. Her SD için ayrı bir dağılım verilir. Küçük SD’lerinde azalan bir eğri şeklindeki dağılım, SD arttıkça çarpık bir çan eğrisi haline dönüşerek, sonunda normal dağılıma yaklaşır. Khi-kare değeri küçüldükçe p (olasılık) 1’e yaklaşır (Şekil 7.1). Bu durum, örneğin %100’e yaklaşan oranda çekildiği populasyona ait olduğunu gösterir. Tersine khi-kare büyüdükçe P küçülür ve örneğin, çekildiği populasyona ait olma olasılığı azalır. Belli bir noktadan sonra artık bu örneğin, çekildiği populasyona ait olmadığına hükmedilir. 0,8 SD 1 SD 3 0,7 Olasılık 0,6 SD 5 0,5 SD 8 0,4 0,3 0,2 0,1 0 0 5 10 15 20 Khi-kare değeri Şekil 7.1: 1, 3, 5 ve 8 serbestlik dereceli khi-kare dağılımları Khi-kare testi, örnek üzerinden bulunan deneysel bir dağılımın, teorik bir dağılıma uygunluğunun kontrolunda uygunluk testi kullanıldığı gibi, 7.3 nolu 69 maddede açıklanan iki karakter arasındaki ilginin kontrolunda bağımsızlık kontrolu da kullanılmaktadır. Ayrıca değişik toplumlardan değişik zamanlarda alınmış örneklerin homojenliğinin kontrolu için homojenlik testi de kullanılır. 7.2.1.Nümunenin Normal Dağılıma Uygunluğunun Kontrolu Bu amaçla kullanılan başlıca metodlar, Khi-kare ve KolmogorovSmirnov testleridir. Burada yalnız khi-kare metodu açıklanacaktır. Daha önce anlatıldığı üzere, normal dağılış gösteren populasyonlardan çekilen örneklerin t değerleri üzerinden, böyle bir populasyona ait olup olmadıkları denetlenebilir. Ancak mesela 1.4.2 nolu maddede açıklandığı şekilde bir frekans dağılımı elde edilse ve bu dağılımın normal eğri metodlarına göre (4.2.3 veya 4.2.5 nolu maddelcr) beklenen değerleri (teorik frekansları) hesaplansa, gözlenen durumun beklenen duruma gerçekten uygun olup olmadığı (veya ne oranda uygun olduğu) aşağıda açıklanacak khi-kare testi ile anlaşılabilir. Metodu 50 varyantlı fidan örneği üzerinden açıklayalım: Misal 7.1: 50 fidanın boyları daha önce 0.5 m'lik sınıflara dağıtılmış ve her sınıfa düşen frekans tesbit edilmişti (Tablo 1.2). Bölüm 4.2.5'deki uygulamadan yararlanarak, 5.5 m'den itibaren 0.5 m arayla meydana gelen 9 sınıfa isabet eden teorik frekanslar hesaplanmış (Şekil 4.1) ve Tablo 7.1’de verilmiştir. Tablo 7.1: 50 adet fidanın gözlenen ve beklenen frekansları Sınıf 1 2 3 4 5 6 7 8 9 Toplam Alt sınır (m) 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5 Gözlenen frekans (f) 2 4 6 8 9 11 8 4 3 1 50 Beklenen frekans (f′) 1.8 6.1 4.3 7.6 10.2 10.3 7.8 4.4 1.9 0.6 48.9 f- f′ (f- f′)2 (f- f′)2/ f′ -0.1 0.01 0.0016 0.4 -1.2 0.7 0.2 0.16 1.44 0.49 0.04 0.0211 0.1412 0.0476 0.0051 1.1 1.21 0.1754 1.1 0.3920 Tablo 7.1'in 3’üncü sütunu gözlenen, 4’üncü sütunu beklenen frekansları göstermektedir. Ancak khi-kare ile uygunluk kontrolunda bir konuya dikkat edilmelidir. Khi-kare dağılımının özelliğine göre, hiç bir sınıfta beklenen değer sayısı 5'ten az olmamalıdır. Eğer böyle sınıflar varsa, bunlar birleştirilmelidir. Burada beklenen değerler 5.5-5.9 sınıfında 1.8, 6.0-6.4 sınıfında 4.3 olduğundan bu ikisi birleştirilerek 6.1 elde edilmiştir. Aynı şekilde son üç 70 sınıftaki 5'ten küçük olan 0.6, 1.9 ve 4.4 değerleri de birleştirilerek 6.9 elde edilmiştir. Tabi bu durumda, bunlara ait gözlenen değerler de birleştirilmeli ve khi-kare değeri birleştirilmiş değerler üzerinden hesaplanmalıdır. Bu bakımdan ilk iki sınıftaki gözlenen frekanslar 6, son üç sınıftakiler ise 8 olarak birleştirilmiştir. Böylelikle sınıf sayısı 9’dan 6’ya inmiştir. Khi-kare değerinin hesaplanması için, her sınıfta gözlenen değerin, o sınıftaki beklenen değerden farkı hesaplanmış (f-f′), sonra bunların kareleri alınmış ve sınıfın beklenen değerine bölünerek hepsi toplanmıştır. Böylelikle son sütunun altında görüldüğü üzere, χ2=0.392 hesaplanmıştır. Hesaplanan khi-kare değeri, tablo değerleri ile karşılaştırılarak nümunenin bir normal populasyona ait olma ihtimali tesbit edilir. Ancak bunun için, khi-kare değerinin serbestlik derecesinin bilinmesi gerekir. Khi-kare değerinin serbestlik derecesi, sınıfların (grupların sayısına bağlıdır. Burada sınıf sayısı=k=6, Madde 7.2’de açıklandığı üzere a=2 olduğundan, serbestlik derecesi V=6-2-1=3 bulunur. Nümune esasında 9 sınıftır. Ancak bunlardan, teorik frekansları 5'ten küçük gerekçesiyle baştan ikisi bir grup ve sondan 3'ü bir·grup olarak birleştirildiğinden, sınıf sayısı 6’ya inmiştir. Khi-kare tablosuna (Ek Tablo 3) göre 3 SD’li tesadüf nümunelerinin %5’i 7.815 ve daha büyük khi-kare değeri göstermektedir. Hesaplanan değer (0.392) bundan küçük olduğuna göre, nümune ortalaması 7.512 m, standart sapması 0.936 m olan bir normal populasyona dahildir. O halde hipotez kabul edilerek “Nümune normal dağılıma uygundur” denir. 7.815 ve daha büyük khi-kare değerlerine sahip nümuneler ise bu populasyona ait olamazlar. Hesaplanan değer 7.815 veya daha büyük olsaydı, hipotez reddedilerek nümunenin normal dağılıma uygun olmadığı sonucuna varılacaktı. 7.2.2.Binomiyal Dağılıma Uygunluğun Kontrolu Bir örneğin gerek binomiyal, gerekse Poisson dağılımına uygunluğunun kontrolu da normal dağılıma uygunluk kontroluna benzer şekilde yapılır. Sıfır hipotezi yine, “örneğin belirtilen populasyona ait olduğu” şeklindedir. Misal 7.2: Đmalatının %10’u hatalı olabileceği beyan edilen fabrikanın mamullerinden piyasadan değişik yerlerden rastgele 1000 adet 8'erli gruplar halinde mal alınıyor. Malların sağlam veya bozuk oldukları kontrol edilerek sonuç Tablo 7.2'nin üçüncü sütunundaki gibi bulunuyor. Mesela 8'erlik örneklerden 6’sının kusurlu olduğu 1 örnek, 5’inin kusurlu olduğu 2 örnek, 4'ünün kusurlu olduğu 8 örnek vs bulunuyor. P=0.05 olasılıkla fabrikanın beyanı doğru mudur? 71 Tablo 7.2: (0.1+0.9)8 binomuna ait olduğu varsayılan bir toplumdan çekilen 1000 örnekte sağlam-kusurlu mal sayıları Hatalı mal (Sınıflar) 8’i de 7’si 6’sı 5’i 4’ü 3’ü 2’si 1’i Hiçbiri Toplam Olasılık 0.00000001 0.00000072 0.00002268 0.00040824 0.00459270 0.03306744 0.14880348 0.38263752 0.43046721 1 Beklenen Gözlenen (f) (f′) 0,00001 0 0,00072 1 0,02268 5.4316 1 12 2 0,40824 8 5 39 33 139 149 400 383 410 430 1000 1000 Farklar (f-f′) (f-f′)2 Khi-kare değeri 6,56835 43.14322 7.94300 5,93256 -9,80350 17,36250 -20,46720 35.19530 96.10861 301.45600 418.90630 1.06435 0.64588 0.78784 0.97314 11.41421 Sıfır hipotezi iddianın “doğru olduğu”, yani “bu mamullerin ilgili fabrikanın beyan ettiği oranda kusurlu olduğu” şeklindedir. Bu populasyonda kusurlu-kusursuz mal oranlarının (0.1+0.9)8 binomuna göre dağılmaları beklenir. Tablonun ikinci sütununda, Madde 4.3.4’te açıklandığı şekilde, sınıflarda beklenen olasılıklar verilmiştir. Sayım 1000 örnekte yapıldığına göre, teorik olasılıklar 1000 ile çarpılarak beklenen değerler bulunabilir. Mesela 8’er maldan 2'sinin kusurlu çıkma olasılığı 0.1488 olduğuna göre, 1000 örnekte 0.1488×1000=149 tanesinin böyle olması beklenir. Diğer sınıflara ait beklenen değerler de bu şekilde bulunarak Tablo 2’nin 4’üncü sütununa yazılmıştır. Ancak burada da 5’ten az beklenen değer bulunduran sınıfların birleştirilmesi gerekir. Görüldüğü üzere 5’i kusurlu, 6’sı kusurlu, 7’si kusurlu ve 8’i de kusurlu olması beklenen sınıflarda frekanslar 5’ten azdır. Bu bakımdan bu sınıfların birleştirilmeleri gerekir. Böylelikle bu 4 sınıf, 4’ü kusurlu sınıfıyla birleştirilerek 5.4316 olarak yeni bir beklenen değer bulunmuştur. Buna paralel olarak, aynı sınıfların gözlenen frekansları da birleştirilerek 12 elde edilmiştir. Bu durumda dağılım 5 sınıfa inmiştir. Böylece, 7.1 nolu formüle göre, χ2=11.41421 bulunmuştur. Teorik dağılımın hesabında herhangi bir parametre kullanılmadığından a=0'dır ve (7.2) nolu formüle göre khi-karenin serbestlik derecesi V=k-l=5-1=4 olur. Ek Tablo 3’te 4 SD için 0.05 olasılıklı khi-kare=9.488 okunur Demek ki 4 SD'li örneklerin %5’i 9.488 ve daha büyük χ2 değeri göstermektedir. Hesaplanan χ2 bundan büyük olduğuna göre, örneğin hipotezde belirtilen populasyona dahil olma olasılığı %5’ten küçüktür (Ek Tablo 3’e göre %5 ile %1 arasındadır.). O halde hipotez reddedilir. Bu mamuller fabrikanın imalatı olan populasyona ait olamaz. Fabrika beyan ettiği oranı tutturamamaktadır. 7.3.Bağımsızlık Kontrolu (R×C Tabloları) Khi-kare testi, iki veya daha fazla sınıflı kalitatif karakter arasında bir 72 ilgi bulunup bulunmadığının kontrolunda da kullanılmaktadır. Bunlardan bağımsızlık kontrolu, sayım yoluyla elde edilmiş verilerden meydana gelen ve çeşitli özellikler yönünden sınıflanabilen bir örnekte, sınıflar (gruplar) arsında bir bağıntı veya ortaya çıkış eğiliminin var olup olmadığını tesbit amacıyla yapılır. Mesela belli gelir düzeylerine göre sigara içenlerle içmeyenler arasında bir bağıntı olup olmadığının, köyde ve şehirde oturma ile evlilik-bekarlık oranları arasında bir ilgi olup olmadığının kontrolu gibi. Bu amaçla, mesela gelir düzeylerinin satırları, sigara içme –içmeme halinin ise sütunları oluşturduğu bir tablo düzenlenir (R× ×C tablosu). Belirlenen gelir gruplarına mensup insanlardan sigara içenler ve içmeyenler bir örneklemeyle sayılır ve tabloda kendi hanelerine yazılır. Bu şekilde R satırlı ve C sütunlu bir tablo meydana gelir. Bu tablalara kontenjans tabloları da denir. Böylelikle R sayıda hal ile C sayıda olgu arasında bir bağıntı olup olmadığı denetlenebilir. Burada sıfır hipotezi “Đki konu (gelir düzeyi ve sigara içme gibi) arasında bir bağıntının olmadığı” veya “iki halin birbirinden bağımsız olduğu” şeklindedir. Bu tablolardan hesaplanan khi-kare’nin serbestlik derecesi (R-1)×(C-1) olarak belirlenir. Misal 7.3: Köyde ve şehirde oturma ile gazete okuma arasında bir ilişki olup olmadığını tesbit amacıyla bir anket yapılmış ve Tablo 7.3'deki sonuç elde edilmiştir. Tablo 7.3: Şehirde ve köyde gazete okuma durumu Yöre Şehir Köy Toplam Gözlenen 407 266 673 Okuyan Beklenen 471 202 Fark -64 64 Gözlenen 726 220 946 Okumayan Beklenen 662 284 Fark 64 -64 Gözlenen Toplamı 1133 486 1619 Burada iki tür yerleşim birimi ile gazete okuma-okumama hali arasında ilişki aranmaktadır. Tablo, 2 satır ve 2 sütundan oluşur. O halde bu bir 2×2 tablosudur. P= 0.05 olasılıkla iki durum arasında bağıntı var mıdır? Hipotez, “Şehirde veya köyde oturmayla gazete okuma arasında bir ilişki olmadığı” şeklindedir. Varsayım bu olduğuna göre, gazete okuma oranı=673/1619=0.4157 olacak, şehirde oturan 1133 kişiden 1133×0.4157=471'inin, köyde oturan 486 kişiden 486×0.4157=202'sinin gazete okuduğu beklenecektir. Aynı şekilde, gazete okumama oranı=946/1619=0.5843, şehirli 1133 kişiden 1133×0.5843=662, 73 köylü 486 kişiden 486×0.5843=284 kişinin gazete okumadığı beklenecektir. Buna göre hesaplanan gözlenen değer-beklenen değer farkları, tablonun "fark" sütunlarında görülmektedir. Bu farklar üzerinden: χ2 = − 64 2 64 2 64 2 − 64 2 + + = 49.58 + 471 662 202 284 bulunur. Khi-kare'nin serbestlik derecesi=(2-1)×(2-1)=1'dir. Ek Tablo 3'e göre 1 SD'li, 0.05 olasılıklı khi-kare değeri 3.841'dir. Hesaplanan değer bundan çok büyük olduğuna göre, hipotez reddedilerek, “gazete okuma şehirde veya köyde oturmayla ilgilidir.” denir. Misal 7.4: 4 ayrı böcek öldürücü bir yaprak biti üzerinde denenmiş ve ölenler-kalanlar sayılmıştır. Acaba insektisidler arasında etki yönünden fark var mıdır? Sıfır hipotezi “fark olmadığı” şeklindedir. Sayım sonuçları Tablo 7.4'ün "gözlenen" sütunlarındadır. Tablo 7.4: 4 böcek ilacının etkisi Đşlem A B C D Toplam Gözlenen 88 68 73 101 330 Ölen Beklenen 79,2 67,7 80,0 103,1 330 Fark Gözlenen 8,8 15 0,3 20 -7,0 31 -2,1 33 99 Kalan Beklenen 23.8 20.3 24.0 30.9 99.0 Gözlenen Fark Toplamı -8,8 103 -0,3 88 7,0 104 2,1 134 429 4 ilaç, 2 etki durumu olduğuna göre bu bir 4×2 tablosudur. Deneme sonucu ölenler 330, kalanlar 99 tanedir. Hipoteze göre madem ki ölmek veya kalmak ilaçlara bağlı değildir, o halde ölen 330 böcekten; Ölenlerin oranı=330/429, A ilacı uygulananlardan ölmesi beklenen=103×330/429=79.2, B ilacı uygulananlardan ölmesi beklenen=88×330/429=67.7, C ilacı uygulananlardan ölmesi beklenen=104×330/429=80, D ilacı uygulananlardan ölmesi beklenen=134×330/429=103.1’dir. Kalanların oranı ise=99/429, A ilacı uygulananlardan kalması beklenen=103×99/429=23.8, B ilacı uygulananlardan kalması beklenen=88×99/429=20.3, C ilacı uygulananlardan kalması beklenen=104×99/429=24, D ilacı uygulananlardan kalması beklenen=134×99/429=30.9’dur. Bu şekilde beklenen değerler ve gözlenen değerlerle, beklenen değerler arasındaki farklar bulunduktan sonra khi-kare değeri hesaplanır: 74 χ2 = 8.8 2 − 8.8 2 0.3 2 − 0.3 2 − 7 2 7 2 − 2.12 2.12 + + + + + + + =7.077 79.2 23.8 67.7 20.3 80 24 103.1 30.9 Khi-kare'nin serbestlik derecesi (4-1) × (2-1)=3'tür. Ek Tablo 3'den 3 SD'li tesadüf nümunelerinin %5'inde 7.81 ve daha büyük khi-kare değerine rastlanacağı anlaşılmaktadır. Hesaplanan değer bundan küçük olduğuna göre, denemedeki kadar khi-kare değerine rastlama olasılığı %5'ten fazladır. O halde hipotez kabul edilir ve “Đlaçlarla böcek ölümleri arasında bir ilişki yoktur.” veya “Đlaçların öldürme etkileri farksızdır” denir. Hesaplanan χ2 değeri 7.81'den büyük olsaydı, böyle bir değerin ortaya çıkma (rastlanma) olasılığı %5'ten küçük olacağından hipotez reddedilecek ve “Đlaçların öldürme etkileri farklıdır." denilecekti. 7.4.Homojenlik Kontrolu Aynı konu üzerinde değişik materyal, zaman veya yerlerde yapılan denemelerin farklı sayılıp sayılamayacağını kontrol amacıyla yapılır. Bu denemelerin her biri bir grup sayılarak, uygulanan işlemin her grupta aynı sonucu verip vermediği denetlenir. Mesela değişik dikim şekilleriyle dikilip, tutan ve tutmayan fidanlar sayılarak dikim şekillerinin farklı olup olmadığı ortaya çıkarılabilir. Veya değişik ağaç türlerinden çelikler alınarak, bunların köklenme yeteneklerinin farklı olup olmadığı bulunabilir. Metot bağımsızlık kontroluna benzer. Genel tutma-tutmama oranı gruplara teşmil edilerek her grubun beklenen değeri bulunur. Bunlar üzerinden khi-kare hesaplanarak, serbestlik derecesine göre Ek Tablo 3 değeriyle karşılaştırılır. 75 8.ĐKĐ ĐŞLEMĐN MUKAYESESĐ (t KONTROLU ĐLE ĐKĐ ÖRNEK ORTALAMASININ KARŞILAŞTIRILMASI) 8.1.Giriş Bilimsel araştırmalar, en basit halleriyle en az iki işlem veya konu arasındaki farklılığı ortaya çıkarmak için düzenlenir. Bu tür çalışmalar iki şekilde yürütülebilir. Birinci halde, aynı veya birbirinin aynı sayılabilecek bireylerin yarısına birinci işlem, diğer yarısına ikinci işlem uygulanarak, işlemler arası fark eşit sayılabilen deneye materyali üzerinde ortaya çıkarılmaya çalışılır. Bunlara eşleştirilen örnekler, bu şekildeki deneme metoduna da eş yapma deneme düzeni denir (madde 8.3). Mesela iki ayrı işlemin yan yana benzer deneme parsellerinde denenmesi gibi. Bu metodun bir de kendi içinde eşleştirme denilen özel hali vardır. Bu hale göre işlemlerden biri aynı deneme materyalinin yarısına, diğeri öbür yarısına uygulanır. Mesela iki insektisitten birinin bir bitkinin yaprağının yarısında, diğerinin öbür yarısında denenmesi gibi. Đkinci tip denemelerde ise eşleştirme söz konusu değildir. Bu defa aynı olduğu varsayılan iki populasyondan tesadüf birer nümunesi çekilerek bunlar arasında fark olup olmadığına bakılır. Bu nümunelere bağımsız örnekler denir. Mesela aynı bölgede dikilen A kavak klonu ile B kavak klonunun veya kavak yetiştiriciliğinde A tipi sulama ile B tipi sulamanın karşılaştırılması gibi. Bağımsız örneklerde karşılaştırma için, farklı işlemleri temsil eden örneklerin eşit sayıda olmasına gerek yoktur. Araştırmacılıkta bağımsız örnekler üzerinde yapılan karşılaştırmalar yaygın şekilde kullanılmaktadır. Denemeler sonucu eşler arasında bulunacak farkların, gerçekten işlemlerin etkisinden mi, yoksa doğal ve bilinmeyen sonsuz sayıda tesadüfi sebeplerden mi ortaya çıktığı açığa çıkarılmaya çalışılır. Tabii bunun için denemenin birden fazla ve n sayıda eş üzerinde yapılması gerekir. Varyans analizleri ile ilgili gelecek bölümlerde sıkça geçeceği üzere, denemelerde 1’den fazla sayıda deneme materyali tekrarlamaları (yineleme, tekerrür) oluşturur. Đki örnek ortalamasının karşılaştırılması, t-kontrolu (t-testi) denilen metoda göre aşağıdaki formüle göre yapılmaktadır: t= X1 − X 2 d = sd sd 76 (8.1) Formülde d iki ortalamanın farkı, sd ise ortalamalar arası farkın (d’nin) standart hatasıdır. sd ’nin hesaplanması: • Örneklerin alındığı populasyonun müşterek sayılabilecek bir varyansa sahip olup olmamasına (her iki örneğe ait varyansın eşit sayılıp sayılmamasına), • Örneklerde aynı sayıda varyant bulunup bulunmamasına, • Varyantların aynı deneme ünitelerinin eşleri olup olmamasına (denemenin bağımsız örnekler veya eşleştirilmiş örnekler üzerinde yapılmasına) bağlı olarak değişiklik gösterir. 8.2.Bağımsız (Eşleştirilmemiş) Đki Örneğin Karşılaştırılması Eşleştirilmemiş iki örnek, bir populasyondan rastgele çekilen bağımsız iki örneği ifade eder. Mesela aynı fidanlıkta aynı şartlarda yetiştirilen iki değişik kavak klonu fidanlarından, rastgele örnekleme ile çapları (veya boyları) ölçülen fidanlar gibi. Đkili mukayeseler, hipotezle “aynı normal populasyona ait olduğu” iddia edilen, yani “farksız oldukları” öngörülen tesadüf nümunelerine uygulanır. Bunların aynı populasyondan çekildiğini varsaymak, ortalamalarının yanında varyanslarının da eşit olduğunu kabul etmek demektir. Bazı hallerde durum gerçekten böyledir. Ancak denemelerde uygulanan işlemler varyansları etkileyebilir. Bu sebepten, t kontrolu sırasında varyansların eşitliği denetlenir ve varyansların eşit olmasına veya olmamasına göre farklı hesap teknikleri uygulanır. Ancak bu sayede sağlıklı bir sonuca varılabilir. 8.2.1.Varyansları Eşit Sayılan Đki Bağımsız Örneğin Karşılaştırılması t kontrolunda sd ’nin hesabı, yukarıda açıklanan olguların yanında, örneklerdeki varyant (gözlem) adetlerinin eşit veya farklı sayılarda olmasına göre de değişmektedir. 8.2.1.1.Varyansları Eşit, Farklı Büyüklükte Đki Bağımsız Örneğin Karşılaştırılması Varyansları eşit, farklı sayıda varyant ihtiva eden iki bağımsız örneğin mukayesesine misal olarak, farklı iki işleme tabi tutulmuş iki grubun veya farklı oldukları araştırmacı tarafından bilinip de, aralarındaki farkların önemi kontrol edilen iki grubun (mesela farklı iki klonun) karşılaştırılması gösterilebilir. 77 Misal 8.1: Aynı yerde dikilmiş, aynı klona mensup iki ağaçlamadan birine A gübresi, diğerine B gübresi verilmiş ve bunlar aynı yetiştirme teknikleri ile yetiştirilmiştir. Bu iki plantasyondan, rastgele örnekleme ile tesbit edilen fertlere ait çaplar Tablo 8.1'de verilmiştir. Tablo 8.1: Đki değişik gübre verilmiş kavak klonunun idare müddeti sonundaki çapları (cm) A Gübresi (A nümunesi) 23 24 24 25 25 B Gübresi (B nümunesi) 17.0 18.5 19.0 20.0 16.0 16.5 15.0 ΣXB=122.0 ΣXA=121 Burada “A ve B gübreleri, boylanmaya gerçekten farklı etki yapmakta mıdır; yoksa aralarında bulunabilecek fark tesadüfi sebeplerden mi meydana gelmiştir?” Tablo 8.1'deki değerler incelendiğinde her grubun kendi içinde farklı olduğu görülür. Halbuki mesela B gübresinin verildiği aynı klona mensup 7 ağaç, aynı yere dikilmiş, aynı gübreyi almış ve aynı bakım teknikleriyle yetiştirilmiştir. Đstatistikte bu tür farklılıklara deneysel hata denir. Daha önce de değinildiği gibi bu farklar, bilinmeyen sonsuz sayıda etki sebebiyle ortaya çıkar. Gruplar içindeki bu farklılaşma gibi, gruplar arasında da bir farklılaşma olduğu açıktır. Gübrelerin etkileri gerçekten önemli olduğu takdirde, gruplar arası fark, gruplar içindeki farkı (deneysel hatayı) aşacaktır. Burada yapılan kontrol, durumun böyle olup olmadığını anlamaktır. Bu maksatla kurulan hipotez, “A ve B gübrelerinin kavakta çap gelişmesine etkisiz olduğu” şeklindedir. Yani “A ve B gübrelerini alan ağaçlar aynı populasyona aittirler.” Bu tip nümunelerin karşılaştırılmasında sd 'nin hesabı, sd = s 2 × (n1 + n2 ) n1 × n2 (8.2) formülüne göre yapılır. Formüldeki n ve n , A ve B nümunelerinin varyant adetleridir. Ancak s2 bildiğimiz varyans değildir. Buradaki s2 (örneklerin varyansları eşit sayıldığından) her iki örneğin varyansı üzerinden hesaplanan ve 1 78 2 müşterek varyans olarak adlandırılan bir varyanstır. Populasyonun varyansının bir tahmini olan ve birleştirilmiş (toplanmış) varyans da denen bu istatistiğin hesabı: s= 2 Σx12 + Σx22 (n1 − 1) + (n2 − 1) (8.3) formülüne göre yapılır. Görüldüğü üzere s2, örneklerin kareler toplamını toplayıp, bunu her ikisinin serbestlik derecelerinin toplamına bölmekle hesaplanmaktadır. Formülleri Tablo 8.1'deki misale uygulayalım: (3.6) nolu formülün payına göre kareler toplamları, (ΣX A ) 2 =2931-(1212/5)=2.8 A nümunesinde: Σ x = Σ X − n 2 1 2 A B nümunesinde: Σ x22 = Σ X B2 − Müşterek varyans: s2= (ΣX B ) 2 =2145.5-(1222/7)=19.2143 n (2.8 + 19.2143) =2.2014 (5 − 1) + (7 − 1) bulunur. A nümunesinin ortalaması: X A =121/5 = 24.2 cm, B nümunesinin ortalaması: X B =122/7 =17.43 cm'dir. (8.1) nolu formüle göre, ortalamalar arası farkın, mensup olduğu dağılışın standart ayrılış ölçüsü üzerinden değeri: t= d = (24.2-17.43)/0.8688=7.792 sd bulunur. t'nin serbestlik derecesi ise (n1-1)+(n2-1)'dir. Misalde bu (5-1)+(71)=10 dur. t tablosuna (Ek Tablo 2) bakılacak olursa, 10 SD'li nümunelerin %5'inin 2.228 ve daha büyük t değerine sahip olduğu anlaşılır. 7.792>2.228 olduğundan, misaldeki gibi bir değere sahip nümunelerin bulunma oranı %5'ten azdır. O halde hipotez reddedilerek, “A ve B gübreleri çap artımına farklı etki yapmıştır” denir. Yani A ve B gübresini almış ağaçlar, farklı populasyonlara ait birer tesadüf nümuneleridirler. 10 SD’li nümunelerden %1’i 3.169 ve daha büyük, %0.1’i ise 4.587 ve daha büyük birer t değerine sahiptir. Hesaplanan t 79 bunların hepsinden büyük olduğuna göre, A ve B gübrelerinin %99.9 güvenle farklı olduğu kabul edilir. 8.2.1.2.Varvansları Eşit, Aynı Büyüklükte iki Tesadüf Nümunesinin Karşılaştırılması Đki nümunenin varyant sayıları eşitse, yani n =n =n ise (8.2) nolu formüle 1 2 göre, 2s 2 n (8.4) Σx12 + Σx22 2(n − 1) (8.5) sd = olur. Müşterek varyans ise: s 2= olarak hesaplanır. Misal 8.2: Misal 8.1’e göre, A gübresi verilen ağaçlardan 21 ve 22 cm çaplarında iki ağaç daha ölçülmüş olsun. Bu defa her nümunede 7’şer varyant bulunur A nümunesinde KT=3856-1642/7 = 13.7143, ortalama X A =164/7=23.43, B nümunesinde KT = 19.2143 ve ortalama X B =17.43 cm’dir. S 2= 13.7143 + 19.2143 = 2.7441 2 × (7 − 1) sd = t= 2 × 2.7441 = 0.8855 7 23.43 − 17.43 = 6.776 0.8855 bulunur. t'nin SD ise (7-1)+(7-1)=12'dir. 12 SD'li t değerlerine tabloda bakılacak olursa, %95 güven düzeyinde olanların 2.179 ve daha büyük, %99 güven düzeyinde olanların 3.055 ve daha büyük, %99.9 güven düzeyinde olanların ise 4.318 ve daha büyük değere sahip oldukları anlaşılır. Hesaplanan değer (6.776) bunların hepsinden de büyük olduğuna göre, yine hipotez 80 reddedilecek ve “A gübresinin %99.9 güven düzeyinde etkili olduğu” söylenecektir. 8.2.2.Varyansları Eşit Olmayan Đki Bağımsız Örneğin Karşılaştırılması Deney ünitelerine uygulanan işlemler, bazı hallerde grupların varyanslarına etkili olabilir. Böyle bir durum bekleniyorsa veya gerçekten varsa, iki ortalamanın mukayesesi için farklı hesap tekniklerinin kullanılması gerekir. Çünkü bu defa yukarıda anlatılan müşterek varvans hesaplanamaz. Bu bakımdan sd 'nin hesabına geçilmeden önce varyansların eşit sayılıp sayılamayacağı (varyansların homojenliği) kontrol edilmeli ve çıkacak sonuca göre işlem yapılmalıdır. Varyansların eşit olmaması halinde de, varyant sayılarının farklı veya aynı olmasına göre sd 'nin hesabında farklı yollar izlenir. 8.2.2.1. F-testi Đle Varyansların Eşitliğinin (Homojenliğinin) Kontrolu Varyansların homojenliğinin kontrolu için F testi, t ve z testleri ile Bartlett testi kullanılabilir. Örnek büyüklüğünün n>100 olması halinde t veya z testleri uygulanabilir (Kalıpsız, 1981). Burada F testi üzerinde durulacaktır. Đkiden fazla sayıdaki gruplarda da varyansların homojenliğinin kontroluna imkan veren Bartlett testi, ileride 10. Bölümde (Madde 10.6) açıklanacaktır. Varyansların homojenliğini kontrol amacıyla, nümunelere ait varyanslardan büyüğü küçüğüne oranlanarak, F istatistiği (F oranı) denen bir değer bulunur: F= Büyük varyans Küçük varyans (8.6) Bu değer Ek Tablo 4'te verilen F değerleriyle karşılaştırılarak varyansların homojen sayılıp sayılamayacağına karar verilir. F tabloları, bölünen varyansın serbestlik derecesi sütunları, bölen varyans serbestlik derecesi ise satırları meydana getirecek şekilde iki yönlü düzenlenmiş tablolardır. Bu bakımdan dikkatli olunmalı, bölünen varyans için tablonun üstündeki serbestlik dereceleri, bölen varyans için yandaki serbestlik dereceleri esas alınmalıdır. Aksi halde yanlış F değerine bakılmış olur. Ancak varyansların eşitliğinin kontrolunda daima büyük varyans küçük varyansa bölündüğünden ve tek taraflı bir kontrol söz konusu olduğundan, 0.05'lik bir kontrol için bunun yarısı olan 0.025'i, 0.01'lik bir kontrol için 0.005'i, 0.001'lik 81 kontrol için 0.0005'i esas almak gerekir. Her F tablosunda bu değerler verilmediğinden, kaba bir karşılaştırma için her iki varyansın SD'lerine en yakın F değerine bakılmalı veya logaritmik enterpolasyon yapılmalı (Kalıpsız, s.280) ve yahut mevcut bazı fomüllere göre eldeki F değerinin gerçekleşme ihtimali doğrudan hesaplanmalıdır (Bölüm 15). F değerinin hesaplanması ve tablo değeri ile karşılaştırılması, aşağıda misal üzerinden açıklanmıştır. Misal 8.3: Tablo 8.1'deki misalde B gübresi verilen ağaçlardan birinin 16 yerine 23 cm ölçüldüğünü kabul edelim. A nümunesinin kareler toplamı bilindiğine göre varyansı: Σx 2 s = =2.8/(5-1)=0.7 n −1 2 A B nümunesinin kareler toplamı: ΣxB2 = ΣX B2 − (ΣX B ) =2418.5-(1292/7)=41.2143 n B nümunesinin varyansı: sB2 =41.2143/(7-1)=6.8691, buradan (8.6) nolu formüle göre: F= 6.8691 = 9.813 0 .7 bulunur. Büyük varyanslı B nümunesinin serbestlik derecesi 7-1=6, diğerininki ise 5-1=4 olduğundan, F değerinin önemliliğinin kontrolu için Ek Tablo 4'te, 6'ya 4 SD'li F değerine bakmak gerekir. Bölünenin SD 6, bölenin SD 4 olduğuna göre, tabloya bakılacak olursa, 0.025 olasılıklı F değerinin 9.20 olduğu görülür. Hesaplanan F bundan büyük olduğuna, yani 9.813>9.20 olduğuna göre, “Đki varyansın farklı olduğuna (homojen olmadıklarına)” karar verilir. Bu durumda müşterek varyans hesaplanamaz. 8.2.2.2.Varyansları Farklı, Farklı Sayıda Đki Bağımsız Örneğin Karşılaştırılması Varyansları farklı iki örneğin karşılaştırılması için gerekli standart hata ( sd ), aşağıdaki formüle göre hesaplanır: 82 sd = s12 s 22 + n1 n 2 (8.7) Ancak buradan hesaplanacak t değeri, Ek Tablo 2'deki değerlerle değil de, aşağıdaki formüle göre hesaplanan bir t' değeri ile karşılaştırılarak hükme varılır. t' olarak gösterilen bu değer, A nümunesi serbestlik derecesindeki t değeri ile, B nümunesi serbestlik derecesindeki t değerinin bir nevi ağırlıklı ortalamasıdır: t1 × s12 t2 × s22 + n1 n2 t'= 2 2 s1 s2 + n1 n2 (8.8) Formülde: s12 ve s22 , A ve B örneklerinin varyansları, n ve n , A ve B örneklerinin varyant adetleri, t , (n -1) SD için istenen güven düzeyinde t tablo değeri, t , (n -1) SD için istenen güven düzeyinde t tablo değeridir. %95 güven düzeyi için, konuyu Misal 8.3 üzerinden açıklayalım: s A2 = 0.7, sB2 = 6.8691 olduğuna göre, l 2 l A 2 B sd = 0.7 6.8691 + =1.0589 5 7 Ortalamalar X A = 24.2 ve X B = 129/7 =18.43 olduğundan, t = (24.2-18.43)/1.0589 = 5.449 bulunur. A nümunesinde 5 varyant olduğuna göre, nA-1=5-1=4 SD için %5 olasılıklı t tablo değeri 2.776, B nümunesinde 7 varyant olduğuna göre nB-1=71=6 SD için aynı olasılık düzeyinde t tablo değeri 2.447'dir. O halde yukarıda hesaplanan t değerinin karşılaştırılacağı t' değeri (8.8) nolu formüle göre: t'= (2.776 × 0.7) / 5 + (2.447 × 6.8691) / 7 = 2.488 (0.7 / 5) + (6.8691 / 7) bulunur. 5.449>2.488 olduğundan, iki ortalamanın %95 güvenle farklı 83 olduğuna hükmedilir. Aynı kontrol %99 güven düzeyine göre yapılacak olursa, ilgili SD'leri için bu defa t1=4.604 ve t2=3.707 olduğundan, t'= (4.604 × 0.7) / 5 + (3.707 × 6.8691) / 7 = 3.833 (0.7 / 5) + (6.8691 / 7) hesaplanır. 5.449>3.833 olduğuna göre, karşılaştırılan ortalamaların %99 güven düzeyinde de farklı oldukları söylenecektir. 8.2.2.3.Varyansların Farklı, Aynı Sayıda Đki Bağımsız Örneğin Karşılaştırılması Ele alınan örnekler eşit sayıda gözlemi kapsıyorsa, (8.7) nolu formül üzerinden hesaplanan t değeri, nA-1 SD’ne göre bakılacak t tablo değeri ile karşılaştırılır. Misal 8.4: 7 varyantlı A örneğinde ortalama X A = 24.42, varyans 2 s1 =0.7023 ve 7 varyantlı B örneğinde ortalama X B =18.43, varyans s22=6.8691 hesaplanmış olsun. Bunların varyanslarının homojenlikleri kontrol edilecek olursa, F = 6.8691/0.7023 = 9.78 hesaplanacak ve bu değer 6’ya 6 SD’li 0.025 olasılıklı F değeri 5.82’den büyük olduğundan, homojen olmadıklarına karar verilecektir. (8.7) nolu formüle göre, sd = 0.7023 6.8691 + =1.04 ve t = (24.42-18.43)/1.04 = 5.76’dır. 7 7 Bu değer 7-1=6 SD’li ve 0.01 olasılıklı t tablo değeri 3.707’den büyük olduğuna göre, A örneğinin B’den %99 güvenle farklı olduğuna karar verilir. 8.3.Eşleştirilmiş Đki Örneğin Karşılaştırılması (Eş Yapma Deneme Tertibi) Daha önce kısaca değinildiği gibi, bazı hallerde karşılaştırılacak örnekler birbirinin eşi deney materyali üzerinden elde edilebilir. Bu gibi durumlarda birbirinin tam eşi sayılabilecek iki deney ünitesinden birine bir işlem, diğerine başka bir işlem uygulanarak, bu iki işlem iki örnek üzerinde karşılaştırılır. Mesela yan yana parsellerde yetiştirilen iki fidan cinsini karşılaştırma, ikiye bölünmüş şeker pancarlarından bir parçasına belli bir metot diğerine başka bir metot uygulanarak metotların şeker kazanma yönünden farklarını arama, 84 yaprakları ikiye bölerek bunlar üzerinde iki farklı böcek ilacını karşılaştırma gibi. Böyle hallerde birer eşleştirilmiş örneklerin mukayesesi söz konusu olmaktadır. Bu metoda göre veriler, daha önceki metotlardaki gibi rastgele yan yana gelmiş materyalden değil, aynı deney materyalinin birer parçasından elde edilmişlerdir. Bu metoda göre deneme materyallerinin kendi aralarında aynı vasıfta olmaları gerekmemektedir. Bu metotta karşılaştırma örneklere ait değerler üzerinden değil, D ile gösterilen ve her çiftten elde edilen varyantlar arası farklar üzerinden yapılır. t istatistiği için gereken sd bu değerlerin ortalamasının standart hatası olarak aşağıdaki formüle göre hesaplanır: ( ΣD ) 2 ΣD − 2 n = sD sd = n × (n − 1) n 2 (8.9) Böyle bir örnekte D değerleri, bazıları sıfırdan küçük, bazıları sıfırdan büyük olmak üzere çeşitli değerler alırlar ve ortalaması sıfır, standart sapması sd olan bir populasyon oluştururlar. Bu bakımdan yapılan kontrol, fark değerlerinin gerçekten 0 ortalamalı bir populasyona ait olup olmadıkları ihtimalini ortaya çıkarmaktır. Eğer hesaplanan ihtimal %5’ten küçükse, bunların “ortalaması sıfır olan bir populasyona ait olduğu” hipotezi reddedilerek, deneme materyaline uygulanan işlemlerin farklı olduğuna hükmedilir. Bu bakımdan test için gerekli t değeri, farkların ortalamasının sıfırdan ayrılış miktarı üzerinden hesaplanır: t= ( X D − 0) sd (8.10) Burada t'nin serbestlik derecesi eş adedinin 1 eksiğidir. Konuyu bir misal üzerinden açıklayalım: Misal 8.5: 10 adet şeker pancarı ikiye bölünerek, şeker kazanç miktarlarını karşılaştırmak üzere yarısına A metodu, diğer yarısına B metodu uygulanmıştır. Elde edilen şeker miktarları Tablo 15.2'de verilmiştir (Yurtsever, s.100). 85 Tablo 8.2: Eş yapma deneme tertibi Pancar no 1 2 3 4 5 6 7 8 9 10 sd = A metodu 53 55 58 60 59 60 58 57 59 52 B metodu 52 54 53 57 56 57 57 56 58 52 Toplam Fark D 1 1 5 3 3 3 1 1 1 0 19 D2 1 1 25 9 9 9 1 1 1 0 57 57 − (192 / 10) = 0.4819 10 × (10 − 1) X D = 19/10 = 1.9t = 1.9/0.4819 = 3.943 Ek Tablo 2’de 9 serbestlik dereceli t tablo değerine bakılacak olursa, t0.05=2.262, t0.01=3.25 olduğu görülür. Hesaplanan değer bunlardan büyük olduğuna göre, denenen iki şeker elde etme metodu arasında %99 fark olduğu söylenecektir. 8.4.Đki Ortalama Arasındaki Farkın Güven Sınırları Madde 8.1’de, ortalamaların mukayesesi amacıyla hesaplanan sd 'nin ortalamalar arası farkın (d) standart hatası olduğu belirtilmişti. O halde bu değer, ortalamalar arası farkın istenen bir güven düzeyinde güven sınırlarını hesaplamakta kullanılabilir: d-(t× sd )<d<d+(t× sd ) Misal 8.6: Đşlemi 8.2.1.1 maddesindeki misale %95 güven düzeyi için uygulayalım: D=24.2-17.43=6.77, sd =0.8688 ve 10 SD için t =2.228 olduğundan, 6.77 - (0.8688×2.228) < d < 6.77 + (0.8688×2.228) 4.83 cm <d<8.71 cm hesaplanır. %99 güven düzeyine göre ise: 6.77 - (0.8688×3.169) < d < 6.77 + (0.8688×3.169) 4.01 cm<d<9.52 cm bulunur. Buradaki güven sınırları, daha doğrusu alt sınırın sıfırdan küçük bir değer alıp almayışı, ortalamalar arası farkın önemli olup olmadığı veya ortalamaların ait olduğu populasyonların aynı sayılıp sayılamayacağının diğer 86 bir göstergesidir. Eğer alt sınır sıfırdan küçük bir değer alıyorsa, “iki ortalamanın faksız (m1=m2)” olduğuna dair hipotez kabul edilecek; başka bir ifadeyle işlemler arasındaki farkın önemli olmadığı veya uygulanan işlemlerin farksız olduğu sonucuna varılacaktır. Misalde sınırlar arasında sıfırın bulunmayışı “ortalamalar arası farkın sıfır sayılma ihtimalinin hem %95 hem de %99'dan az olduğuna” yani 8.2.1.1 maddesinin sonucuna paralel olarak, “iki ortalamanın (iki populasyonun) her iki güven düzeyinde farklı olduklarına” işaret eder. 8.5.Örnek Büyüklüğünün Tayini Đstatistikte, örnekleme ile çalışılan durumlarda sık karşılaşılan sorulardan biri “Kaç örnek alayım?” şeklindedir. Bu amaçla (8.11) nolu formül kullanılabilir. Formülün esası, istenen güven sınırlarına ilişkin, istenen değerler arasında nümunede bulunması gerekli gözlem sayısını tayin etmektir. Bunun için bir ön örnekleme yapılarak bu örneğin varyansı hesaplanmalıdır. Bundan sonra örnek büyüklüğü (n), hesaplanır: n= t12 × s 2 d2 (8.11) Formülde: t1 = istenen güven düzeyi ve ön örneğin SD'ne göre tablo t değeri, s2= ön örneğin varyansı, d = ön örnek üzerinden hesaplanan güven aralığına göre istenen güven aralığının yarısıdır. Misal 8.7: 8.2.1.1 maddesindeki B nümunesi üzerinden konuyu açıklayalım: B gübresi uygulanan plantasyondan 7 ağaç ölçülmüş olsun. Bunu bir ön örnek sayarak, alınan örneğin yeterli olup olmadığını veya bu toplumdan en az kaç birey almamız gerektiğini hesaplayalım: B'nin KT =19.2143 olduğuna göre varyansı, s2=19.2143/(7-1)=3.2024 hesaplanır. Ortalaması X B =122/7 = 17.43 cm, ortalamanın standart hatası ise: sX = 3.2024 = 0.6764 cm’dir. 7 6 SD için %1 olasılıklı tablo t değeri 3.707 olduğuna göre, %99 güvenle ortalamanın güven sınırları: 17.43-3.707×0.6764< X <17.43+3.707×0.6764 14.92 cm < X < 19.94 cm 87 hesaplanır. O halde güven aralığı 19.94-14.92 = 5.02 cm'dir. Bu aralığın nümunede 3 cm’den fazla olmaması istenecek olursa, güven aralığının yarısı d=1.5 cm olur. Bu durumda gerekli örnek büyüklüğü (8.11) nolu formüle göre: n= 3.707 2 × 3.2024 = 19.6 1 .5 2 bulunur. Demek ki eldeki 7 varyanta 20-7=13 varyant daha ilave etmek yeterli olacaktır. Ancak bu bulgulara fazla itibar etmemeli, en azından normal dağılıma uygunluk gösteren olabildiğince fazla varyant ile çalışılmalıdır. 88 9. DENEME KURMANIN GENEL ESASLARI 9.1.Giriş Hatırlanacağı üzere denemeler, özel olarak oluşturulan ve kontrol altına tutulan populasyonların temsilcileridir. Bu küçük ve özel örnekler üzerinden hayali populasyon tahmin edilmeye çalışılır. Böylelikle üzerinde çalışılan konudaki bilgi eksikliği giderilerek, mesela daha fazla ürün, daha etkili ilaç, daha kaliteli mal vs elde edilir. Ancak denemeler, istatistik biliminin öngördüğü belli prensiplere göre tesis edilir ve yürütülürse değerlendirilebilir. Aksi halde gözlem niteliğinden öteye gidemez. 9.2.Denemenin Planlanması Bir deneme ile ilgili olarak, konunun belirlenmesi (hipotez veya hipotezlerin ortaya atılması), deneme deseninin (dolayısıyla değerlendirme metodunun) seçimi, tekrarlama (yineleme) adedinin belirlenmesi, parsel büyüklüğünün (dolayısıyla denemede kullanılacak deney·ünitesi adedinin) tesbiti, denemenin yürütülmesi sırasındaki uygulamaların zamanı ve şeklinin tayini ile ilgili çalışmalara denemenin planlanması denir. Planlama yapılmadan, yanlış veya yetersiz deneme kurma, denemelerin istatistik prensiplere göre değerlendirilmelerini imkansız kılabilmekte, bu da harcanan tüm zaman, para ve emeğin heba olmasına yol açmaktadır. Denemenin planlaması safhasında önce etraflı bir literatür incelemesi yapılmalı, sonra deneme sahası seçilmeli ve incelenmeli, deneme materyali, eleman, alet ve ekipmanlar belirlenmeli, denemenin devamlılığına ilişkin tedbirler gözden geçirilmelidir. Denemenin planlanması, bütün bu işlerin tesbit edilip ayrıntılı bir proje metni halinde yazılması ile tamamlanır. Uzun yıllar sürecek denemelerde, çalışmanın çeşitli kişilerce yürütülmesi olasılığı bulunduğundan, proje metni özellikle önemli olmaktadır. 9.3.Denemenin Tertiplenmesi Denemeler, amaçlarına, deneme materyaline ve mevcut maddi imkanlara göre belli deneme desenlerine göre tertip edilir. Bilimsel araştırmalarda kullanılan istatistik metodlara göre, istatistikçiler tarafından bir çok deneme deseni geliştirilmiştir. Her deneme desenine farklı istatistik analiz metodu uygulandığından, denemenin kurulduğu deneme deseninin bilinmesi önemli olmaktadır. Bazı önemli deneme desenleri ve bunlara ait analiz metodları gelecek konularda açıklanacaktır. 89 Deneme sahibinin deney materyali hakkında çok iyi bilgi sahibi olması gerekir. Ayrıca denemenin tertiplenmesi safhasında mutlaka istatistikçi ile görüş alışverişinde bulunulmalıdır. Zaten istatistikçi, değerlendirme aşamasında deneme deseni, denemenin aplikasyonu ve yürütülüşü hakkında ayrıntılı bilgi isteyecektir. Eğer deneme, amacına uygun ve belli prensiplere göre düzenlenmemiş ve yürütülmemişse istatistikçinin yapabileceği fazla bir şey yoktur. 9.3.1.Deneysel Hata ve Đşlemlerin Farklılığı Deneme kurmaktan maksat, üzerinde durulan faktör veya faktörlerin etkilerini tesbit etmek ve bu etkilerin ortaya çıkış ihtimallerini hesaplamaktır. Bu tesbit ve hesaplar belli şartlara göre yapılabilir. Mesela A ve B gibi iki kavak klonundan birer fidanı yan yana dikip bir kaç yıl sonra bunların çaplarını ölçüp, "Çapı kalın olan (veya boyu uzun olan) klon iyidir” demek hiç bir şey ifade etmez. Çünkü A klonundan ikinci bir fidan dikilmiş olsa bunun çapı diğeriyle aynı olmayacak, 3. bir ağaçta da farklı bir çap ölçülecektir. Aynı durum B klonu fertleri arasında da söz konusudur. Đşte çapların gösterdiği bu farklılık deneysel hatadan kaynaklanır. Burada üzerinde durulan faktör, klonların genetik özelliklerinden kaynaklanan büyüme-gelişme istidatlarıdır. Araştırma bu istidadın hangi klonda daha üstün olduğunu bulmaya çalışır. Benzer şekilde, bir ağacın büyümesine gübre, sulama gibi faktörlerin etkileri de denenebilir. Đşte denemelerde aynı işleme tâbi tutulmuş deney üniteleri arasında görülen farklılığa (çap, boy, ayrılık vs yönünden) deneysel hata denir. Deneysel hata, deney üniteleri arasında başlangıçta var olan farklılıktan, denemenin kurulduğu sahadaki farklılıktan, deney ünitelerine uygulanan işlemlerin farklılığından ve sayıların elde edilmesinde yapılan hatalardan vs kaynaklanabilir. Deneysel hata, deney üniteleri arasında bir varyasyon oluşturur. Denemeci, bazı tedbirlerle deneysel hatayı küçültebilir; ancak tamamen ortadan kaldıramaz. Bir denemede aynı işleme tâbi tutulmuş deney ünitelerinin arasındaki farklılığın yanında, bir de farklı işlemlere tâbi tutulmuş deney üniteleri arasındaki fark söz konusudur. Bu demektir ki, mesela A klonu fertleri arasında farklar olabileceği gibi, A klonu fertleri ile B klonu fertleri arasında da farklar olacaktır. Esasen denemede ortaya çıkarılmaya çalışılan ikinci farklılıktır ve tabii olarak deneysel hata denen ilk grup farklılıktan büyük olması beklenir. Bu, eğer varsa, işlemlerin sebep olduğu farklılıktır. O halde bir denemede ayrı işlemlere tâbi tutulan deney üniteleri arasındaki farklılaşma iki sebepten kaynaklanır: • Deneysel hata, • Đşlemlerin etkisi. Denemelerden amaç bu iki unsurun hesaplanmasını mümkün 90 kılmaktadır. Denemelerin değerlendirilmesi sırasında bunlar hesaplanarak, denenen faktörün etkinliğine karar verilir. Aynı işlemlere maruz kalmış deney üniteleri arasındaki farklılığın ne kadar çoğu işlemlerden kaynaklanmışsa, işlemler o kadar etkili olmuş ve deneme hatası küçülmüş demektir. Deneysel hatayı mümkün olduğu kadar küçük tutmak ve hesaplayabilmek deneme düzenlemenin esasını teşkil eder. 9.3.2.Deneysel Hatayı Küçültmenin Yolları Deneysel hatayı küçültmenin yolları homojen materyal kullanmak tesadüfîlik prensibine bağlı kalmak ve tekrarlama (tekerrür, yineleme) uygulamaktır. Bunlar aynı zamanda deneme kurmanın ana prensipleridir. 9.3.2.1.Homojen Deney Materyali Deneysel hatayı küçültmenin birinci yolu olabildiğince mütecanis (homojen) deney materyali kullanmak ve denemenin kuruluşundan sonuna kadar yapılan bütün işlerde eşit, tarafsız davranmaktır. Bunun için mesela aynı çapta boyda fidanlar (deney üniteleri) alınmalı, bunlar homojen ve homojen işlenmiş bir toprakta aynı kişi veya kişilerce dikilmeli, işlemlerin etkileri birbirlerine karıştırılmadan homojen kültür - bakım teknikleri ile yetiştirilmeli ve aynı kişi veya kişilerce ölçülmelidir. Böylelikle deneysel hataya sebep olan etkiler asgariye inecek ve tüm deney üniteleri için eşit tutulacaktır. Bu sayede denemede uygulanan işlemlerin etkileri daha iyi açığa çıkacaktır.· 9.3.2.2.Tesadüfîlik, Rastgele Dağılım Tüm uğraşlara rağmen·homojen deneme materyali bulunamayabilir. Bu durumda, deney materyali işlemlere rastgele dağıtılarak, materyalde mevcut farklılıklar, etkileri aranan işlemlere dengeli şekilde yayılır. Bu maksatla kura metodu kullanılır. Mesela bir arazi denemesinde, hangi fidanların arazinin hangi parseline dikileceği kura ile belirlenir. Her deneme metoduna göre işlemlerin deney parsellerine dağıtımı farklı olduğundan, denemeci bu bilgileri istatistikçiden mutlaka almalıdır. 9.3.2.3.Tekrarlama (Yineleme, Tekerrür, Replikasyon) Tekrarlama, denemelerde bir işlemi birden fazla deney ünitesinde tekrarlamak demektir. Tekrarlama varyasyonu oluşturur ve deneysel hatanın hesaplanmasını sağlar. Çünkü varyasyon birden fazla birey·arasında vardır. Daha önce de açıklandığı gibi, varyans deney ünitesi sayısının artmasıyla küçülme eğilimindedir. Đşlemlere konu olan etkiler ne kadar çok deney ünitesi üzerinde tekrarlanırsa, deneysel hata o kadar küçülmüş olur. Ancak 91 tekrarlamanın çok fazla arttırılması, homojen deneme materyali temininde ve denemenin homojen şekilde yürütülmesinde güçlük çıkarabilir. Tekrarlama ileride görüleceği üzere deneysel hatanın serbestlik derecesini belirler. Bu bakımdan, tekrarlama adedi, deneysel hatanın serbestlik derecesini 10'dan aşağı düşürmeyecek sayıda olmasına çalışılmalıdır. Bu maksatla 3-6 tekrarlama yeterli olur. 9.4.Denemenin Amaçları Denenin amaçları, etkileri denenecek faktör veya faktörlerin seçimi ve dolayısıyla hipotezlerin kurulmasıyla belirlenmiş olur. Denemenin amaçları açıklanır ve hipotezler kurulurken mutlak ifadeler kullanılmamalı veya o denemenin çözmeyeceği sorunlardan söz edilmemelidir. Ayrıca, etkileri gerçek anlamıyla ortaya çıkarmak üzere gerekli ön çalışmalar yapılmalıdır. Mesela her herhangi bir mineralin yeteri kadar bulunduğu bir toprakta, o mineral gübreyi “acaba etkili mi” diye denemenin bir anlamı yoktur. Đşlemleri iyi seçmeli, anlamsız veya aşırı nitelikli işlemler uygulanmamalıdır. Mesela bir gübre doz denemesinde, dozlar ne etkili olmayacak kadar az, ne de zehir etkisi yapacak kadar aşırı tutulmalıdır. Ayrıca gerekmiyorsa kontrol veya şahit denilen ve hiçbir işlemin uygulanmadığı haller denemeye katılmamalıdır. Mesela etkili olduğu zaten bilinen gübrelerden hangisinin daha etkili olduğunun seçiminde kontrol parseline gerek yoktur. Kontrol parselleri, işlemlerin etkili olup olmadığının bilinmediği hallerde kullanılabilir. 9.5.Deneme Parsellerinin Büyüklüğü, Şekli ve Yönü Deneme parsellerinin büyük tutulması, kendi aralarındaki varyasyonu (deneysel hatayı) azaltır. Ancak bu defa çok saha, çok deneme materyali, çok masraf vs gerekir. Bu da arzu edilmediği halde, tekrarlamanın azaltılmasına sebep olur. Parsellerin büyüklüğü, mevcut deneme sahası, tekrarlama sayısı, deneme materyalinin adedi, miktarı ve çeşidi ile denemenin mahiyetine göre değişir. Bitkilerle kurulacak arazi denemelerinde, parsellerde olabildiğince fazla bitki olması istenir. Böylelikle bitkiler arası varyasyon azalacaktır. Bu durum m2’de yüzlerce bitki bulundurabilen tarımsal denemelerde fazla sorun çıkarmaz. Ancak her bir deneme ünitesinin 10-40 m2 gibi araziye ihtiyaç gösterdiği ormancılıktaki arazi denemelerinde parsel büyüklüğünün belirlenmesi denemeciyi çeşitli yönlerden sıkıntıya sokar. Yine de parseldeki ağaç sayısı 4-6’dan az tutulmamalıdır. Parsel büyüklüğüne etki eden diğer önemli bir faktör de bazı denemelerde mutlaka kullanılması gereken ve kenar tesirlerini önlemekte kullanılan izolasyon (tecrit) zonlarıdır. Özellikle gübreleme, sulama, sıklık vs denemelerinde, etkilerin yan parsellere karışmasını önlemek amacıyla parseller 92 etrafında belli genişlikte sahalar bırakılır. Bu sayede bir parsele uygulanan gübre veya suyun etkisinin bitişik parsele ulaşması önlenir. Ancak bu bölgeler boş bırakılmamalı, bitişik parseldekine benzer şekilde, denemede kullanılan fidanlarla ağaçlandırılmalıdır. Parsel büyüklüğüne, denemenin uygulanmasında kullanılacak bazı makine ve ekipman da etkili olabilir. Mesela bir iş makinesinin çalışabileceği en küçük alan parsel büyüklüğünü belirleyebilir. Arazi denemelerinde, parsellerin şekli de önem taşır. Homojen sahada parsel şekli önemli değildir. Ancak toprağın homojenliği azaldıkça parsel şekli önem kazanır. Bu gibi sahalarda parsellerin dikdörtgen şeklinde yapılması uygun olmaktadır (Yurtsever, s.122). Bu durumda, parselin uzun kenarının arazinin hem iyi hem kötü kısmını kapsayacak şekilde yerleştirilmesi gerekir (Şekil 9.1). Đyi Toprak Kötü toprak Şekil 9.1: Farklı yapıda veya meyilli arazide deneme parsellerinin yerleştirilmesi Burada önemli diğer bir husus da arazinin meylidir. Meyilli arazilerde genellikle toprak üst kısımlarda kötü, alt kısımlarda iyidir. Bu bakımdan parsellerin uzun kenarı meyil yönünde uzanmalıdır (Şekil 9.1). Bu sayede, her parsel hem verimsiz, hem verimli topraktan etkilenecektir. Parsel içinde bitki sıralarının ise kuzey-güney doğrultusunda yerleştirilmesi tavsiye edilmektedir (Yurtsever, s.124). 9.6.Ölçülerde Hassasiyet Bilindiği gibi ölçülerek-tartılarak elde edilen varyantlar, birimlerine göre belli küsuratta ölçülebilirler. Bu sebepten deneme ünitelerinin ölçülmesinde Madde 5.2'de açıklanan hususlar dikkate alınmalıdır. Ölçme işlemi mümkün olduğunca aynı kişilerce, aynı ölçü aletleriyle ve aynı noktadan yapılmalıdır. 93 10. RASTLANTI (TESADÜF) PARSELLERĐ DENEME TERTĐBĐ l0.1.Giriş Buraya kadar verilen bilgilerle populasyonlar, kendilerinden çekilen tesadüf nümuneleri üzerinden ortalama, standart sapma ve güven sınırlarıyla tanınmaya çalışılmıştır. Bu Bölümden itibaren, özel populasyonların birer temsilcisi olan denemelere ait deneme tertipleri ve bunların analizleri üzerinde durulacaktır. Denemeler genellikle varyans analizi metoduyla değerlendirildiğinden, bir anlamda bu ve bundan sonraki üç Bölüm varyans analizi tekniklerine ait olacaktır. 10.2.Rastlantı Parselleri Deneme Tertibi ve Uygulanması Homojen (mütecanis) materyalle kurulacak denemeler için en uygun deneme düzeni tesadüf parselleri deneme tertibi'dir. Bu deneme tertibine göre deneme materyali, etkileri denenecek işlemlere (muamele) tamamen tesadüfi olarak dağıtılır. Tabii ki işlem sayısı bellidir. Denemenin planlanması safhasında tekrarlama (yineleme) sayısı da tespit edilir. k adet işlem varsa n adet tekrarlama uygulanacaksa, deneme sahası k×n kadar eşit parçaya ayrılır. Bu parçalara deneme parseli denir. Misal 10.1: 5 kavak klonunu idare müddetleri sonunda göğüs çapları yönünden karşılaştırmak üzere, tesadüf parselleri deneme tertibine göre 4 tekrarlamalı bir deneme kurulacaktır. Bu denemede etkileri denenecek işlemler, klonların hipotezle “farksız oldukları varsayılan”, çap artımı yetenekleridir. Denemeci tarafından uygulanacak olan özel işlemler yoktur. Ancak mesela bir gübreleme denemesinde, gübrelerin büyümeye (ürüne vs) etkisi denendiğinden, uygulanan işlemler denemeci tarafından bitkilere verilen gübrelerdir. Bu deneme tertibine göre kurulacak bir arazi denemesinde, sahanın tümünün homojen olması ve homojen şekilde işlenmiş olması lazımdır. O halde 5 işlem, 4 tekrarlamalı böyle bir denemede saha, 5×4=20 parsele bölünür. Sonra her parsele 1'den başlanarak sırayla numara verilir (Şekil 10.1). Bu numaralar küçük kağıt parçalarına yazılır, kağıtlar kapatılıp karıştırılır ve işlem sayısı kadar (misale göre 5) gruba ayrılır. Her gruptaki kağıtların numaraları bu amaçla düzenlenen bir tabloya yazılır (Tablo 10.1). Böylelikle parseller, işlem sayısı kadar gruba tam tesadüfî olarak ayrılır. Sonra her gruba uygulanacak işlem, yine kura ile belirlenir. Bu maksatla kağıt parçalarına 94 işlemlerin adları yazılarak, her gruba uygulanacak işlem rastgele çekilir. Çıkan işlemin adı tabloda (Tablo 10.l) o grubun yanına yazılır. Böylece, her parsele hangi işlemin uygulanacağı da tesadüfîlik prensibine uygun olarak belirlenmiş olur. Hazırlanacak birer tabelaya, parsel no ve uygulanan işlem yazılarak araziye dikilir. Araziye aplike edilen bu durum, Şekil 10.1’deki gibi bir kroki ile tesbit dilerek, diğer belgelerle birlikte denemenin dosyasına konur. Şekil 10.1'e denemenin deseni denir. 1 E 6 C 11 D 16 C 2 D 7 A 12 A 17 E 3 B 8 B 13 C 18 B 4 D 9 B 14 D 19 E 5 C 10 A 15 A 20 E Şekil 10.1: Rastlantı parsellerine göre düzenlenmiş 5 işlem, 4 tekrarlamalı (20 parsel) bir denemenin deseni Tablo 10.1: 5 işlemin 20 parsele 4 tekrarlamalı olarak dağılması Gruplar I II III IV V Klonlar E C B D A 1 5 3 2 7 Parseller 17 19 6 13 9 8 11 4 12 10 20 16 18 14 15 Böyle bir denemede üzerinde durulması gerekli diğer bir konu, bir parsele kaç deney ünitesi (fidan) dikileceğidir. 9.5 nolu maddede değinildiği üzere, bu miktar parsel büyüklüğünü çok arttırmakta ve çeşitli sorunlara sebep olmaktadır. Konu bu yönleriyle incelenmiş ve bir parsele 10 fidan dikilmesine karar verilmiş olsun. Bundan sonra denemenin tamamına, olgunluk çağına gelinceye kadar aynı bakım ve kültür teknikleri uygulanır. Sonuçta ağaçların çapları usulüne uygun olarak aynı kişi tarafımdan, aynı tarzda, aynı ölçü aletiyle ölçülür ve bir ölçü karnesine kaydedilir. Her parselde ölçülen çapların ortalaması alınarak bir tabloya (Tablo 10.2) yazılır. 95 Tablo 10.2: 5 kavak klonunun idare müddeti sonundaki çapları (cm) Đşlemler (Gruplar) A Klonu B Klonu C Klonu D Klonu E Klonu 1 29 33 25 27 23 Tekrarlamalar 2 3 4 36 25 28 39 29 29 26 21 23 31 25 22 27 28 24 Genel toplam Genel ortalama Đşlem Toplamı 118 130 95 105 102 550 Đşlem Ortalaması 29.50 32.50 23.75 26.25 25.50 27.50 Klonların farklılığını karşılaştırmak üzere yapılacak istatistik işlemlerde bu tablo kullanılır. (Tablodaki değerler, hesaplarda kolaylık sağlamak için cm’ye yuvarlanmıştır. Halbuki bu misalde ortalamanın mm hassasiyetle verilmesi daha uygun olacaktır). Görüldüğü gibi tablodaki gözlemler sadece işlemlere göre (tek yönlü) gruplandırılmıştır. Bu bakımdan rastlantı parselleri deneme tertibine bazı kitaplarda tek yönlü gruplandırmalar denmektedir. Tesadüf parselleri deneme tertibinin en büyük özelliği, her yönüyle mütecanis materyal gerektirmesidir. Eğer materyalde önceden sezilen, görülen ve bertaraf edilemeyen her hangi bir heterojenite varsa, tesadüf blokları veya latin kare deneme tertibi tercih edilmelidir. 10.3.Tesadüf Parselleri Deneme Tertibinde Varyans Analizi Denenecek işlemler veya mukayese edilecek konular sadece iki taneyse, bunlar 8. Bölümde açıklanan t kontrolu metotlarından uygun biri ile karşılaştırılabilir. Hele materyal uygun ise, deney ünitelerinin kendi aralarında homojen olmasını gerektirmemesi bakımından eş yapma tertibi tesadüf parsellerinden daha verimlidir. Ancak denemedeki işlemler ikiden fazlaysa, ikişer ikişer karşılaştırmayla bir sonuca varmak mümkünse de, bu durum işlem satışı ile artan bir zorluk çıkarır. Bu yüzden bütün işlem gruplarını topluca kıyaslamaya yarayacak bir metot aranmış ve Đngiliz biyometri ve genetikçisi Sir R.A. Fisher’in 1920'ler geliştirdiği Varyans Analizi metodu kullanılmaya başlanmıştır. Metot kısa zamanda geliştirilerek, daha komplike denemelerin düzenlenmesine ve analizine imkan sağlamıştır. 10.3.1.Varyans Analizinin Esasları ve Hipotezler Tablo 10.2 incelenecek olursa, her değerin 27.5 cm olarak hesaplanan genel ortalamadan farklı olduğu görülür. Bu farklılık (varyasyon), 9.3.1. nolu 96 maddede açıklandığı gibi iki ana etkenden kaynaklanmaktadır: • Denenen işlem veya konuların sebep olduğu farklılık. Bu farklar işlem ortalamalarının genel ortalamadan farklılaşması olarak tezahür eder. • Deneysel hata olarak tanımlanan ve sonsuz sayıda dış etkiden kaynaklanan farklılık. Deneysel hata aynı işlem grubu içindeki gözlemler arasında bir farklılaşma yaratarak, her işlemin kendi işlem ortalamasından farklı olmasına sebep olur. Bu iki unsur her varyantın genel ortalamadan farkına sebep olur. Mesela A klonunun ilk parseldeki değeri 29 cm’nin genel ortalamadan ayrılışı olan 29-27.5=1.5 cm’lik fark, A klonu ortalamasının genel ortalamadan farkı 29.5-27.5=2 cm ile, parsel değerinin A klonu ortalamasından farkı 2929.5=-0.5 cm’nin cebirsel toplamına eşittir. O halde bu deneme tertibine göre genel ortalamadan ayrılışlar iki unsura bölünebilmektedir. Varyans (veya varyasyon) kaynakları denen bu unsurlar diğer deneme tertiplerinde daha fazla sayıda olabilmektedir. Đşte varyans analizlerinin esası, varyantların genel ortalamadan ayrılış kareleri toplamını, bu ayrılışlara sebep olarak varyans kaynaklarının kareler toplamına göre kısımlara bölüp analiz etmektir. Bir varyans analizinde varyantların genel ortalamadan ayrılış kareleri toplamına Genel Kareler Toplamı, grup (işlem) ortalamalarının genel ortalamadan ayrılış kareleri toplamına Gruplar Arası Kareler Toplamı ve varyantların kendi grup (işlem) ortalamasından ayrılış kareleri toplamına da Gruplar Đçi Kareler Toplamı denir. Bu denemede, yalnız çap artımında klonların etkisi arandığına göre, ortaya atılan hipotez “Klonlar arasında çaplar yönünden fark yoktur” şeklindedir. Dikkat edileceği üzere bu hipotez, işlemlerden kaynaklanması beklenen varyasyona dayanmaktadır. Bir denemede deneysel hatadan başka buna benzer varyasyon kaynağı varsa, ona ait bir de hipotez var demektir. Bu bakımdan ilerideki deneme tertiplerinde görüleceği üzere, bir deneme birden fazla hipoteze dayalı olarak (çok faktörlü denemeler) da kurulabilir. Bu denemedeki hipotez, bir bakıma “grupların (klonların) aynı populasyondan çekilmiş, aynı ortalamaya sahip bir tesadüf nümunesi olduklarını” iddia etmektedir. Varyans analizi ile yapılan kontrol bunun doğru olup olmadığıdır. 10.3.2.Varyans Analizinin Uygulanması Tablo 10.2'de sonuçları verilmiş denemeyi ele alarak, bu deneme tertibinin gerektirdiği varyans analizini uygulayalım: 97 10.3.2.1.Kareler Toplamlarının Hesabı Varyans analizi tekniğine göre, önce hesaplaması gereken kısım, genel kareler toplamıdır (GKT). 3. Bölümden hatırlanacağı üzere, kareler toplamı (3.6) nolu formülün payına göre kolayca hesaplanabilmektedir. GKT hesabında da aynı formül kullanılır: (ΣX ) 2 GKT = ΣX N 2 (10.1) Burada N, denemedeki varyant adedi, yani parsel sayısıdır. Denemede k adet işlem, n tekrarlamalı olarak denenmişse, N=k×n olur. Yukarıdaki formülde 2. terime, düzeltme terimi dendiği ve C ile gösterildiği 3.3.2.2.1 Maddesinde belirtilmişti. Formülün elemanları ayrı ayrı hesaplanacak olursa: ΣX2=292+362+252+ . . .+242=15526 ΣX=29+36+25+ . . .+24=550 (ΣX)2=5502=302500 N=5×4=20 ve GKT = 15526-(302500/20)=401 bulunur. Gruplar arası kareler toplamı (GAKT), aşağıda (10.2) nolu formülde ifade edildiği gibi, her grubun (işlemin) toplamının karesini tekrarlama adedine bölüp, toplamlarını almak ve bu toplamdan düzeltme terimini (C) çıkarmakla hesaplanır: GAKT= ∑ ( ΣX ) 2 −C n (10.2) (Tablo 10.2'de grup (işlem) toplamları verildiğine göre, 1182 130 2 952 1052 102 2 - 15125 = 194.5 + + + + 4 4 4 4 4 GAKT= bulunur. Gruplar içi kareler toplamı (GAKT) ise (10.3) nolu formülden anlaşılacağı üzere, her grubun kareler toplamın toplamıdır: 98 GĐKT= (ΣX ) 2 2 X Σ − ∑ n (10.3) Her grubun kareler toplamı ayrı ayrı hesaplanacak olursa: 1. grup KT=(292+362+252+282)- 1182 = 65 4 2. grup KT=(332+392+292+292)- 1302 = 67 4 952 3. grup KT=(25 +26 +21 +23 )= 14.75 4 2 2 2 2 4. grup KT=(272+312+252+222)- 1052 = 42.75 4 5. grup KT=(232+272+282+242)- 1022 = 17 ve buradan, 4 GĐKT = 65+67+14.75+42.75+17=206.5 bulunur. Analizin esasına göre: GKT = GAKT + GĐKT olması gerekir. Bu durum kontrol edilirse, GKT = 401=194.5 + 206.5 olduğu görülür. Bu eşitlikten yararlanılarak, analizlerde GKT ve GAKT hesaplanır; GĐKT ise: GĐKT = GKT - GAKT olarak bulunur. GAKT analizlerde, gruplar işlemleri temsil ettiğinden, Đşlemler AKT veya doğrudan uygulanan işlemin adıyla (mesela bu misalde Klonlar AKT gibi) anılır. GĐKT ise hata veya residual veya error KT gibi isimlerle ifade edilir. 10.3.2.2.Serbestlik Derecelerinin (SD) Hesabı Varyansın hesabı, bilindiği gibi kareler toplamını serbestlik derecesine bölmekle yapılmaktadır. Bu bakımdan yukarıda hesaplanan 3 adet kareler 99 toplamının serbestlik derecelerinin bilinmesi gerekir. Denemedeki bütün gözlemler n×k=4×5=20 adet olduğuna göre bunlardan serbest olanlar n×k1=20-1=19 tanedir. O halde GKT'nin serbestlik derecesi 19'dur. GAKT'nin serbestlik derecesi, yine grup sayısının 1 eksiği olarak k-1=5-1=4'tür. GĐKT'nin serbestlik derecesi ise bir grubun serbestlik derecesinin grup sayısı kadar katıdır. Bir grupta n gözlem olduğuna göre bunun serbestlik derecesi n-1, GĐKT'nin serbestlik derecesi ise k×(n-1)=5× (4-1)=15 hesaplanır. Özetlenecek olursa: GKT’nin SD: (k×n)-1=(işlem sayısı×tekrarlama sayısı)’nın bir eksiği, GAKT’nın SD: k-1=işlem sayısının bir eksiği, GĐKT’nin SD: k×(n-1)= işlem sayısı×(tekrarlama sayısının bir eksiği) olarak hesaplanır. Kareler toplamları arasındaki, GKT=GAKT+GĐKT şeklindeki eşitlik, bunların serbestlik dereceleri arasında da vardır: GKT SD=GAKT SD + GĐKT SD (k×n)-1=(k-1)+k× (n-1) 19=4+15 10.3.2.3. Kareler ortalamalarının (Varyansların) Hesabı Varyasyon kaynaklarının kareler toplamları ve bunlara ait serbestlik dereceleri bulunduktan sonra, varyans analizinin kareler ortalamaları (KO) diye bilinen varyanslar bölümüne geçilir. Varyans, kareler toplamının kendi serbestlik derecesine bölümü olduğuna göre, kareler ortalamaları da bu şekilde hesaplanır. Ancak genel kareler ortalaması yani genel varyans, analizinde hiçbir önem ve anlam taşımadığından hesaplanmasına gerek yoktur. Diğer iki kareler ortalaması: GAKO= GĐKO= GAKT =194.5/4=48.625 kendi SD GiKT =206.5/15=13.767 kendi SD bulunur. Daha önce değinildiği gibi, GĐKO denemedeki deneysel hataya tekabül etmektedir. 10.3.2.4.Varyans Analizi Tablosu ve Hipotezin Kontrolu Denemedeki varyasyon kaynaklarına ait kareler toplamları, bunların 100 serbestlik dereceleri ve kareler ortalamaları varyans analizi tablosu denilen bir tabloda özetlenir (Tablo 10.3). Tablo 10.3: 5 kavak klonu çaplarının 4 tekrarlamalı rastlantı parsellerinde varyans analizi Varyasyon Kaynağı Gruplar (Đşlemler) arası Gruplar (Đşlemler) içi (Hata) Genel KT 194.5 206.5 401.0 SD 4 15 19 KO 48.625 13.767 F 3.53 Varyans analizi tablosunda GAKO ve GĐKO (Hata KO) incelendiğinde, denenen konuların etkinliği hakkında bir fikir edinilebilir. GAKO, GĐKO'ndan ne kadar büyükse, işlemler arası farklılık o kadar büyük demektir. Başka bir ifadeyle GAKO, Hata KO’ndan ne kadar uzaklaşmışsa konulara ait ortalamalar arasında o derece büyük farklar var demektir. Farkların fazlalığı, işlemlerin etkisinin büyüklüğünü gösterir. Farklılaşmanın önemi, daha önce 8.2.2.1 nolu maddede açıklandığı üzere yine Fisher’in geliştirdiği ve kendi adının baş harfi ile anılan F oranı ile kontrol edilir. F oranı, aynı populasyona ait olduğu varsayılan iki müstakil varyansın birbirine oranıdır. Böylelikle yapılan işlem, grup ortalamalarına ait varyans ile grupların kendi içinde gösterdikleri varyansın aynı olup olmadığının; bu ikisinin aynı populasyona ait tesadüf nümuneleri olup olmadığının kontroludur. Hesaplanan F değeri ne kadar büyükse işlemlerin (grupların) aynı populasyona ait olma olasılığı o oranda küçülür. F değeri, Gruplar Arası SD ve Hata SD'ne göre bakılan F tablo değerini (Ek Tablo 4) hangi güven düzeyinde geçmişse, aralarındaki farklar o güven düzeyinde önemli demektir. Analize ait F oranı hesaplanacak olursa: F= GAKO =48.625/13.767=3.53 GiKO (Hata) bulunur. 4 ve 15 serbestlik derecelerine göre F tablolarına bakıldığında, 3.53’ün %95 güven düzeyli değerden (3.06) büyük olduğu, `%99 güven düzeyli değerden (4.9) ise küçük olduğu görülür. O halde denenen işlemler (klonlar) arasındaki farklar %95 güven düzeyinde önemlidir. Bu durumda hipotez reddedilir. F değeri %95 güven düzeyli tablo değerini aşamayacak kadar küçük olsaydı, hipotez kabul edilecek ve işlemler arasında fark olmadığına karar verilecekti. F oranının önemi, varyans analizi tablosunda yanına konulan (*) simgesi ile belirtilir. 101 %95 güven düzeyi, tek simgeyle (*), %99 güven düzeyi (**) ve %99.9 güven düzeyi (***) ile gösterilir. F oranının önemsiz bulunması halinde ise, F değerinin yanı ya boş bırakılır veya ingilizcedeki non-significant (belirgin değil) ifadesinin baş harfleri olan NS ile işaretlenir. 10.4.Farklı Gurupların Tesbiti (Ortalamaların Mukayesesi) Bir denemenin sonuçlarınm değerlendirilmesinde varyans analizi birinci adımdır. Analiz sonucu grup (işlem) ortalamalarının önemli derecede (en az %95) farklı oldukları anlaşılırsa, yapılacak 2. iş hangi grup veya grupların diğerlerinden farklı olduğunu bulmaktır. Bu maksatla t istatistiğinden yararlanılabileceği gibi (Yurtsever, 1984), Fisher'in asgari önemli fark (Least Significant Differance=LSD), Student-Newman-Keuls, Duncan, Scheffe, Tukey ve Hartley metotlarından biri kullanılabilir. Bunlardan t testine dayalı bir metot olan LSD metodu, uygulama kolaylığına karşılık, ancak kaba bir karşılaştırma için yeterli bulunmaktadır. Tukey ve Duncan testinin kısmen, Student-Newman-Keuls testinin ise daha hassas olduğu ifade edilmektedir. Örnek büyüklüklerinin eşit olması halinde uygulama kolaylığı sebebiyle Tukey metodu ile yetinilebileceği belirtilmekte, farklı olmaları halinde ise Duncan testinin kullanılması önerilmektedir. Student-Newman-Keuls testi, insan yaşamı gibi çok önemli konularda tavsiye edilmektedir. Scheffe testi ise ikili karşılaştırmalar için duyarlı görülmemektedir (Kalıpsız 1981 ). Tukey, Hartley’den daha kullanışlı ve emin görülmektedir (Düzgüneş 1963). Burada bunlardan Tukey, L, SD, Duncan ve Student-Newman-Keuls testleri açıklanacaktır. Varyans analizine göre işlemler arasında fark yoksa farklı grupların tesbiti yoluna hiç gidilmemeli, %95 fark varsa bu güven düzeyinde farklı gruplar, %99 fark varsa bu güven düzeyinde farklı gruplar aranmalıdır. Aşağıda açıklanacak metotlara göre tesbit edilecek farklı gruplar, varyans analizi ile tam uyum sağlamayabilir. Varyans analizi, işlemleri %95 farklı bulduğu halde, farklı grupların tesbitinde kullanılan metotlar, işlemler arasında daha önemli farklılıklar gösterebilmektedir. Bu sebeple farklı grupların tesbiti işleminde, varyans analizinin sonucu esas alınmalıdır. 10.4.1.Tukey Metodu Tukey metoduna göre, büyüklüklerine göre sıralanan grup ortalamaları arasındaki farkların, (10.4) D = q× s X 102 formülüne göre hesaplanan En Küçük önemli fark'tan büyük olup olmadıklarına bakılır; D değerini aşan farka sahip gruplar ayrı populasyonlara ait sayılır. Formülde: q, grup sayısı ve GĐKO'nın (Hatanın) serbestlik derecesine göre Ek tablo 5’ten istenen olasılıkta (%5 veya %1) alınacak tablo değeri, s X , grup ortalamalarının standart hatasıdır. Bu değer, sX = GiKO n (10.5) formülüne göre hesaplanır. GĐKO varyans analizi tablosundan alınır. n ise denemedeki tekrarlama sayısıdır. Misaldeki varyans analizine göre gruplar arasında %95 fark bulunduğundan, bu düzeyde farklı gruplar aşağıdaki gibi tesbit edilir: Grup sayısı 5 ve hata serbestlik derecesi 15 olduğuna göre Ek Tablo 5'e bakılacak olursa %95 güvenle q=4.37 olduğu görülür. Buradan, sX = 13.767 = 1.855 hesaplanır. O halde D=4.37×1.855 = 8.106'dır. 4 Birbirleriyle mukayese edilmek üzere büyüklüklerine göre sıralanmış grup ortalamaları Tablo 10.4'de gösterilmiştir. Tablo 10.4: 5 kavak klonunun çap ortalamaları ve Tukey Metoduna göre %95 farklı ortalamalar Klon B A D E C Ortalama (cm) 32.50 29.50 26.25 25.50 23.75 Farklar (cm) 3.00 6.25 7.00 8.75* 3.25 4.00 5.75 0.75 2.50 1.75 Tabloda ilk sütunda klonlar, 2. sütunda klonların ortalamaları verilmiştir. Farklar kısmında ise ortalamaların sırayla birbirlerinden farkları gösterilmiştir. Mesela B klonunun, kendinden sonrakilerle farkı sırayla 3.00, 6.25, 7.00 ve 8.75 cm'dir. A klonunun ise kendinden sonrakilerle farkı 3.25, 4.00 ve 5.75 cm olmuştur. Aynı şekilde D'nin E ve C'den farkları 0.75 ve 2.50 cm olarak gerçekleşmiş; E klonu ise en sonda yer alan C'den sadece 1.75 cm'lik bir fark sağlayabilmiştir. Şimdi yapılması gereken, ilk sütundan itibaren fark değerlerini D=8.106 ile sırayla karşılaştırmaktır. En büyük ortalamayı veren B klonu ele alınacak olursa. bunun A'dan farkı olan 3 cm'nin 8.106’dan küçük olduğu görülür. O halde B, A'dan 103 farksızdır. B'nin D'den farkı 6.25 de 8.106'dan küçük olduğuna göre B, D'den de farksızdır. 7<8.106 olduğundan B klonunun E'den de farksız olduğu anlaşılır. Ancak 8.75>8.106 olduğuna göre, B klonunun en sonda yer alan C klonundan farklı olduğu söylenecektir. Bu farkın kenarına * işareti konur. A klonu ile kendinden sonra yer alan diğerleri karşılaştırılacak olursa, aralarındaki farklardan hiç birinin 8.106’yı aşmadığı görülecek ve A’nın bunlardan farksız olduğuna hükmedilecektir. O halde: • B klonunun A, D ve E’den farkasız, C’den %95 farklı olduğu, • A, D ve E klonlarının kendilerinden sonra yer alan diğerlerinden farksız oldukları ortaya çıkmaktadır. Bu durumda denenen klonlardan B, ikinci olarak A tercih edilmelidir. Tablo 10.4’te farklı ve farksız ortalamalar görülmektedir. Farklılaşmalar daha fazla olduğu takdirde bu şekilde bir sunuş durumun anlaşılmasını güçleştirir. Bu bakımdan farksız ortalamaları Tablo 10.5’deki gibi kenarlarına boydan boya çekilen bir çizgi ile belirtmek, farklılaşmayı daha anlaşılır hale getirmektedir. Birbirlerinden farksız sayılan ortalamaların oluşturduğu gruplar, böylelikle daha belirgin hale gelir. Tablo 10.5: Tukey metoduna göre %95 güvenle farksız ortalamalar Klon B A D E C Ortalama (cm) 32.50 29.50 26.25 23.50 23.75 10.4.2.LSD Metodu LSD metoduna göre, sd = 2 × Hata KO n (10.6) formülüne veya Tukey Metodu için hesaplanan s X üzerinden, sd = s X × 2 (10.7) formülüne göre hesaplanacak iki ortalama arasındaki farkın standart hatası, k×(n-1) serbestlik derecesine (varyans analizindeki hata serbestlik derecesi) göre istenen güven düzeyindeki t değeri (Ek Tablo 2) ile çarpılarak: LSD=t× sd (10.8) formülüne göre hesaplanan En Küçük Önemli Fark, ortalamalar arası farklarla karşılaştırılır. LSD’yi aşan büyüklükte farka sahip ortalamalar o güven 104 düzeyinde farklı sayılır. Varyans analizinin sonucuna 0.05 olasılık için LSD metodu uygulanacak olursa, önceki bölümde s X =1.855 hesaplandığından, sd =1.855× 2 =2.623 bulunur 5×(4-1)=15 serbestlik derecesine göre t0.05=2.131 olduğuna göre, LSD=2.131×2.623 =5.59 Hesaplanır. Buna göre, Tukey metoduna benzer şekilde ortalamaları büyüklük sırasına göre dizip, LSD’yi aşan farklar işaretlenmekle, birbirinden farklı ortalamalar tesbit edilir (Tablo 10.6). Tablo 10.6: 5 kavak klonu çap ortalamalarının LSD metoduna göre %5 olasılıkla mukayesesi Klon B A D E C Ortalama (cm) 32.50 29.50 26.25 25.50 23.75 Farklar (cm) 3.00 6.25* 7.00* 8.75* 3.25 4.00 5.75* 0.75 2.50 1.75 Tablo 10.6 Tukey’e göre mukayeselerin yapıldığı Tablo 10.4 ile karşılaştırılırsa, LSD’nin daha az hassas (toleranslı) olduğu anlaşılabilir. 10.4.3.Duncan Testi Duncan’ın yeni değişim genişlikleri testi denilen bu metot, Tukey metoduna benzer. Yine grup ortalamaları arasındaki farklar, LSR=SSR× s X Formülüne göre hesaplanan en küçük önemli genişlikler (Least significant ranges) ile karşılaştırılarak, bu değeri aşanların önemli olduklarına karar verilir. Formülde: SSR (Significant Studendized Ranges)= Ortalamanın sıra numarasına ve hata serbestlik derecesine göre istenenen güven düzeyinde tablo değeri (Ek Tablo 6), s X =Tukey metodunda açıklanan değer’dir Farklı klonları bu defa Duncan’a göre tesbit edelim: SSR değerlerini bulmak için Ek Tablo 6’ya bakılacak olursa, tablonun karşılaştırılacak ortalamanın sıra numarasına ve GĐKO (hata) SD’ne göre iki girişli olduğu görülür. Hata SD 15 ve grup sayısı 5 olduğuna göre %95 güvenle 105 SSR değerleri: 2. ort. Đçin 3.01 3. ort için 3.16 4. ort. için 3.25 5. ort. için 3.31 şeklinde sıralanmaktadır. Daha önce s X =1.855 hesaplandığından, (10.9) nolu formüle göre LSR değerleri: 2. ort. Đçin 5.58 3. ort için 5.86 4. ort. için 6.03 5. ort. için 6.14 olarak hesaplanır. Farklı ortalamaların tesbiti için Tukey ve LSD metotlarına göre tek bir değer (D ve LSD gibi) hesaplanırken, Duncan metoduna göre ortalama adedinin bir eksiği kadar LSR değeri ele alınmaktadır. Ortalamalar arası farklar, karşılaştırılan ortalamanın diziliş sırasındaki yerine göre ilgili LSR değeri ile mukayese edilir. Ortalamalar, ortalamalar arası farklar ve farkların önemi Tablo 10.7’de verilmiştir. Tablo 10.7: 5 kavak klonu çap ortalamalarının Duncan metoduna göre %5 olasılıkla mukayesesi Klon B A D E C Ortalama (cm) 32.50 29.50 26.25 25.50 23.75 Farklar (cm) 3.00 6.25* 7.00* 8.75* 3.25 4.00 5.75 0.75 2.50 1.75 Karşılaştırma için B klonu ele alındığında, bunun: A’dan farkı (3.00), 2. Ortalama için verilen değerle (5.65 ile); D’den farkı (6.25), 3. Ortalama için verilen değerle (5.86 ile); E’den farkı (7.00), 4. Ortalama için verilen değerle (6.03 ile); C’den farkı (8.75), 5. Ortalama için verilen değerle (6.14 ile) karşılaştırılır ve LSR değerini geçenler önemli sayılarak kenarlarına * konur. Bu karşılaştırmalara göre B, A’dan farksız, diğerlerinden %95 farklı bulunmuştur. A klonu ele alındığında ise, bunun, D’den farkı (3.25), 2. Ortalama için verilen değerle (5.65 ile); E’den farkı (4.00), 3. Ortalama için verilen değerle (5.86 ile); C’den farkı (5.75), 4. Ortalama için verilen değerle (6.03 ile) karşılaştırılır ve yine LSR değerini geçenler önemli sayılarak * ile işaretlenir. Bu defa A ile diğerleri arasındaki farkların önemli olmadığı görülmektedir. 106 Sıralamadaki diğer ortalamaların kendilerinden sonrakilerle mukayesesi de yine benzer şekilde yapılır. Ortalamaların farklı olanları Tablo 10.7deki şekilde işaret edilebildiği gibi, farksız olanları (eşit sayılan gruplar) Tablo 10.5’dekine benzer şekilde de gösterilebilir. Tablo 10.8’de Duncan’a göre farksız ortalamalar işaretlenmiştir. Tablo 10.8: Duncan metoduna göre %95 güvenle farksız ortalamalar Klon B A D E C Ortalama (cm) 32.50 29.50 26.25 23.50 23.75 Tablo 10.7 ve 10.8’den anlaşılacağı üzere, B ve A klonları bir grup, A ve diğerleri başka bir grup oluşturmuştur. 10.4.4.Student-Newman-Keuls Testi Student-Newman-Keuls testi de Duncan metoduna benzer. Ancak bu defa grup ortalamaları arasındaki farklar, Tukey metodunda kullanılan q değeri üzerinden, w = q× s X (10.10) formülüne göre hesaplanan w değeri ile karşılaştırılır. Formülde: q= Ortalamanın sıra numarasına ve hata serbestlik derecesine göre, istenenen güven düzeyinde Ek Tablo 5’den alınan tablo değeri, s X =Tukey metoduna göre hesaplanan değer’dir Bu defa da farklı klonları Student-Newman-Keuls testine göre tesbit edelim: Duncan metodunda açıklanana benzer şekilde q değerleri Ek Tablo 5’ten alınacak olursa, bunların: 2. ort. için 3.01 3. ort için 3.67 4. ort. için 4.08 5. ort. için 4.37 Oldukları görülür. Buna göre w değerleri (10.10) nolu formüle göre aşağıdaki gibi hesaplanır: 2. ort. Đçin 5.59 3. ort için 6.81 4. ort. için 7.57 107 5. ort. için 8.11 Bu hesaplamalardan sonra yine düzenlenecek bir tabloda farkların önemi işaretlenebilir (Tablo 10.9). Tablo 10.9: 5 kavak klonu çap ortalamalarının Student-Newman-Keuls metoduna göre %5 olasılıkla mukayesesi Klon B A D E C Ortalama (cm) 32.50 29.50 26.25 25.50 23.75 Farklar (cm) 3.00 6.25 7.00 8.75* 3.25 4.00 5.75 0.75 2.50 1.75 Sonuç Duncan testi ile karşılaştırıldığında, bu metodun daha hassas (toleranssız) olduğu görülmektedir. Bu bakımdan Student-Newman-Keuls metodunun diğerlerinden daha duyarlı bulunduğu ve varyans analizine paralel sonuç verdiği belirtilmektedir (Kalıpsız, s.378). 10.5.Rastlantı Parselleri Deneme Tertibinde Tekrarlamaların Farklı Sayıda Olması Hali 10.5.1.Varyans Analizi Denemelerde normal olarak her işlem grubundaki gözlem sayısı eşit tutulur. Yani her işlem eşit sayıda tekrarlanır. Ancak bazı hallerde bu mümkün olmaz. Bu durum ya her grup için eşit sayıda deneme materyali temi edilememesinden veya deneme sırasında bazı gruplardaki varyantların (tekrarlamaların) elde olmayan sebeplerden dolayı ortadan kalkmasından kaynaklanabilir. Bazan da deneme konularından bir veya bir kaçının özellikle daha fazla sayıda tekrarlanması istenebilir. Bütün bu hallerde, gözlem sayıları farklı gruplar ortaya çıkmaktadır. Bu durumda uygulanacak varyans analizi, aşağıdaki misal üzerinden açıklanmıştır. Misal 10.2: 4 değişik klona mensup kavak fidanlarını boyları yönünden kıyaslamak maksadıyla her klondan 15’er çelik rastlantı parsellerinde denenmiş ve 2. yıl sonunda ölçülen boylar Tablo 10.10’da verilmiştir. Tablodan anlaşılacağı üzere, 1. gruptan 3, 3. gruptan 1 ve 4. gruptan 2 fidan denme sırasında yok olmuştur. Bu durumda her grubu mesela 12’ye indirmek mümkündür. Ancak buna mecburiyet yoktur. Deneme bu şekilde farklı tekrarlamalar üzerinden değerlendirilebilir. Gerekli hesaplamalar aşağıda sırayla yapılmıştır: 108 Tablo 10.10: 4 değişik kavak klonuna ait 2 yaşlı fidanların boyları (m) I-214 4.06 3.80 4.50 4.50 4.60 4.35 4.00 4.10 3.60 3.80 2.80 3.70 ΣX n X ΣX2 KT 45/51 3.80 4.10 3.70 4.45 3.75 4.20 4.30 4.10 4.50 4.80 5.10 4.50 4.60 4.80 4.60 65.30 15 4.35 286.6550 2.3823 48.35 12 4.03 197.9225 3.1123 77/51 4.00 4.95 5.40 4.85 5.00 5.50 5.30 5.60 5.00 5.10 5.00 5.40 5.10 4.20 5/4 5.20 5.10 5.10 5.00 5.20 5.00 4.90 5.60 5.60 5.00 5.30 5.40 5.50 70.40 14 5.03 356.7050 2.6936 67.90 13 5.22 355.3300 0.6831 Genel Toplam: 251.95 54 1196.612 5 Kareler toplamları: 2 2 2 2 GKT=4.60 +3.80 +4.50 + . . . +5.50 - 251.952 54 =21.0791 48.352 65.32 70.4 2 67.9 2 251.952 + + + =12.2078 GAKT= 54 15 14 13 12 GIKT=GKT-GAKT=21.0791-12.2078=8.8713 Serbestlik dereceleri: Genel: 54-1=53 Gruplar arası: 4-1=3 Gruplar içi: 53-3=50 veya (12-1)+(15-1)+(14-1)+(13-1)=50 Kareler ortalamaları: Gruplar (klonlar) arası: 12.078/3=4.0693 Gruplar içi (hata): 8.8713/50=0.1774 Buna göre varyans analizi Tablo 10.11’de özetlenmiştir. 109 Tablo 10.11: 4 kavak değişik kavak klonu fidanlarını boylarına ait varyans analizi Varyasyon Kaynağı Gruplar (Klonlar) arası Gruplar (Klonlar) içi (Hata) Genel KT 12.2078 8.8713 21.0791 SD 3 15 53 KO 4.0693 0.1774 F 22.94 F=4.0693/0.1774=22.94 hesaplanarak tabloya yazılmıştır. Buna ait serbestlik dereceleri 3 ve 50’dir. Bölünenin serbestlik derecesi 3, böleninki 50 olduğuna göre F tablosundan 3’e 50 serbestlik dereceli değerler aranacaktır. Đlgili değerler P=0.05 için 2.79, P=0.01 için 4.20 ve P=0.001 için 6.40’dır. Hesaplanan F bunların hepsinden fazlasıyla büyük olduğuna göre, grup ortalamalarının aynı populasyona dahil olma ihtimali %0.1’in çok altındadır. O halde hipotez reddedilerek “Klonlar boyları yönünden %99.9 farklıdır” denir. 10.5.2.Farklı Grupların Tesbiti Örnek büyüklüklerin eşit olmaması halinde farklı grupların tesbiti için t ve LSD kontrolları (Yurtsever, s.210), veya Tukey, Duncan yöntemlerinden biri kullanılabilir. Ancak Tukey ve Duncan metotları için (10.5) nolu formüle göre s X ’in hesabında n yerine, n 0= ( Σn) 2 − Σn 2 ( k − 1) × Σn (10.11) şeklinde hesaplanan bir değer kullanılmalıdır. Formülde: n: gruplardaki varyant adedi, k: grup adedidir. Misal 10.2 için (10.1) nolu formüle göre, n 0= 54 2 − (12 2 + 152 + 14 2 + 132 ) sX = ( 4 − 1) × 54 =13.47 hesaplanır. Buradan, 0.1774 GiKO = =0.1148 ve (10.7) nolu formüle göre, n0 13.47 sd =0.1148× 2 =0.1624 bulunur. Varyans analizine göre gruplar arasında %99.9’un üzerinde önemli bir 110 farklılık bulunduğundan, Duncan testi için Ek Tablo 6’dan 50 SD’li ve %99 güvenli SSR değerleri alınır: 2. ort. için 3.79 3. ort için 3.96 4. ort. için 4.09 Tabloda 50 SD için değer verilmediğinden, 40 ve 60 serbestlik dereceleri için verilen değerlerin ortalaması alınmıştır. Buradan (10.9) nolu formüle göre LSR değerleri: 2. ort. için 0.44 3. ort için 1.145 4. ort. Đçin 0.47 hesaplanır. Bunlara göre ortalamalar, ortalamalar arası farklar ve farkların önemi Tablo 10.12’de gösterilmiştir. Tablo 10.12: 4 kavak klonu fidanının Duncan metoduna göre %99 güvenle mukayesesi Klon 5/4 77/51 45/51 I-214 Ortalama (cm) 5.22 5.03 4.35 4.03 Farklar (cm) 0.19 0.87** 1.19** 0.68** 1.00** 0.32 Tablo 10.12’ye göre farksız gruplar ise aşağıdaki gibi işaretlenebilir: 5/5 77/51 45/51 I-214 Bu durumda: 5/4 ile 77/51 klonlarının kendi aralarında farksız olduğu, 5/4’ün 45/51’den ve ı-214’den %99 farklı olduğu, 77/51’in 45/51 ve I-214’den %99 farklı olduğu, 45/51’in ise I-214’den farksız olduğu söylenir. Veya başka bir ifadeyle, 5/4 ile 77/51’in bir grup, 45/51 ile 77/51’in bir grup, 45/51 ile I-214’ün başka bir grup oluşturduğu ifade edilir. 10.6.Varyansların Homojenliğinin Kontrolu (Bartlett Testi) Varyans analizi ile kontrol edilen hipotez, daha önce de belirtildiği gibi, “Farklı işlemlere maruz kalan grupların aynı normal populasyona ait tesadüf 111 nümuneleri olduğu” şeklindedir. Normal populasyonlar ise birbirlerinden aritmetik ortalamaları ve varyansları ile ayrılırlar. Varyans analizi, grupları ortalamaları bakımından farklı olup olmadıklarını inceler. Ancak yukarıdaki hipotezin tam olarak kabul veya reddi için, grup varyanslarının da farklı olup olmadıklarının bilinmesi gerekir. Normal olarak bir denemede grupların farklı varyanslara sahip olmaları beklenemez. Çünkü bunlar homojen bir materyalden, tamamen tesadüfi prensiplere uygun olarak meydana getirilmiştir. Ancak bazı hallerde bu prensiplerin tam uygulanamaması veya işlemlerin etkisinin varyansa tesiri sebebiyle gruplar önemli derecede farklı varyanslara sahip olabilir. Denemede böyle bir durumdan şüphe ediliyorsa, veya hesaplar sonucu grupların varyansları arasında gözle görülür büyük farklar varsa, Bartlaett Testi le bu farkların gerçekten önemli olup olmadıklarının, yani varyansların homojenliğinin kontrolu gerekir. Kontrol sonucu varyansların homojen olmadıkları ortaya çıkarsa, o denemenin sonuçlarına itibar edilmemelidir. Veya arzu edilirse, homojenliği bozan grup (işlem) değerlendirme dışı bırakılarak, varyans analizi geriye kalan gruplara uygulanır (Düzgüneş, s.139). Grupların eşit sayıda varyanta sahip olup olmadıklarına göre metodun uygulanması farklıdır. 10.6.1.Varyant Sayısı Eşit Gruplarda Bartlett Testi Misal 10.3: Varyant sayısı eşit gruplarda Bartlett testinin uygulanmasını, 5 kavak klonunun 4 tekrarlamalı olarak rastlantı parselleri deneme tertibinde çapların yönünden denendiği Misal 10.1 (Madde 10.2) üzerinden açıklayalım: Burada her grupta 4 tekrarlama olduğuna göre, gruplardaki varyant sayıları eşittir. Bu amaçla önce her grubun kareler toplamları, varyansları ve varyanslarının tabii logaritmaları (Neper logaritması) hesaplanır. 10.3.2.1 nolu maddeden grupların kareler toplamları alınabilir. Grupların serbestlik dereceleri ise 3’tür. Buna göre hesaplanan varyanslar ve varyansların logaritmaları Tablo 10.13’de verilmiştir. Tablo 10.13: Varyant sayısı eþit gruplarda homojenlik kontrolu Gruplar A B C D E Toplam KT 65.00 67.00 14.75 42.75 17.00 SD 3 3 3 3 3 Varyans (s2) 21.667 22.333 4.917 14.250 5.667 68.834 Logns2 3.07579 3.10607 1.59270 2.65676 1.73466 12.16598 Varyansların ortalaması: 2 s =68.834/5=13.7668 ve bu ortalamanın tabii logaritması: 112 Logn s 2=2.62226’dır. Bu değer grup sayısı (k) ile çarpılarak, sonuçtan logaritma s2’ler toplamı (Σlogn s2) çıkarılır. 2 k×logn s = 2 Σlogn s = Fark 5×2.62226 = = 13.11130 12.16598 0.94532 Varyant (tekrarlama sayısının 1 eksiği (n-1) ile çarpılan fark değer, grup sayısının 1 eksiği (k-1) serbestlik dereceli bir khi-kare değeridir. χ2=0.94532×(4-1)=2.836 Bu değer 0.05 olasılıklı ve 4 SD’li khi-kare tablo değeri (Ek Tablo 3’te söz konusu değer 9.488’dir.) ile karşılaştırılacak olursa, 2.836<9.488 olduğu anlaşılır. Bu durumda gruplara ait varyansların homojen olduğuna karar verilir. Hesaplanan değer tablo değerinden daha büyük olursa, varyansların homojen olmadıklarına hükmedilir. Eğer bulunan khi-kare değeri, esas alınan tablo değerini hafif bir şekilde geçiyorsa, formül 10.12’deki düzeltme faktörü yardımıyla, aşağıdaki gibi düzeltilmiş khi-kare hesaplanarak, bu değerin tablo değerini geçip geçmediğine tekrar bakılır: Düzeltme faktörü: C=1+ k +1 3 × k × (n − 1) (10.12) Misalde k=5, n=4 olduğuna göre, C=1+ 5 +1 =1.133 3 × 5 × (4 − 1) bulunur ve bu değer yukarıda hesaplanan khi-kare değerine bölünerek, Düzeltilmiş χ2=2.836/1.1333=2.502 hesaplanır. 10.6.2.Varyant Sayısı Farklı Gruplarda Bartlett Testi Burada da bir khi-kare değeri hesaplanarak, bu değer ilgili tablo değeri ile karşılaştırılmakta ve varyansların homojenliğine karar verilmektedir. Misal 10.4: Metodu 4 kavak klonu fidanlarının boyları yönünden denendiği Misal 10.2 (Madde 10.5.1) üzerinden açıklayalım: χ2 hesabı için gerekli işlemler Tablo 10.14’de özetlenmiştir. Gruplara ait KT’ları Tablo 10.10’dan alınmıştır. 113 Tablo 10.14: Varyant sayısı farklı gruplarda homojenlik kontrolu Gruplar KT SD 1/SD I-214 45/51 77/51 5/4 Toplam 3.1123 2.3823 2.6936 0.6831 8.8713 11 14 13 12 50 0.09091 0.07143 0.07692 0.08333 0.32259 Varyansların ortalaması: s 2= 2 Logns 0.28294 0.17016 0.20720 0.05693 -1.26253 -1.77099 -1.57407 -2.86602 12.16598 s 2 SD×Logns 2 -13.8879 -24.7939 -20.4629 -34.3922 -93.5369 ΣKT =8.8713/50=0.17743 ΣSD Logn s 2= -1.7292 Logn s 2×ΣSD= -1.7292×50= -86.4601 χ2= -86.4601-(-93.5369)=7.0768 χ2’nin SD=k-1=4-1=3 Ek Tablo 3’e göre 0.05 olasılıklı ve 3 serbestlik dereceli khi-kare değeri 7.815’dir. 7.0768<7.815 olduğuna göre gruplara ait varyansların homojen olduğu sonucuna varılır. Burada da khi-kare değerinde bir önceki maddede açıklanan gerekçeyle bir düzeltme yapmak gerekirse, düzeltme faktörü olarak: C=1+ 1 × 3 × (k − 1) 1 ∑ n − 1 − Σ(n − 1) 1 (10.13) formülü kullanılır. Yukarıdaki misale bu formül uygulanacak olursa, C=1+ 1 1 × 0.32259 − =1.03362 3 × (4 − 1) 50 Düzeltilmiş χ2=7.0768/1.03362=6.847 hesaplanır. 114 11. RASTLANTI BLOKLARI DENEME TERTĐBĐ 11.1.Giriş Önceki bölümde açıklandığı üzere, rastlantı parselleri deneme tertibi her yönüyle homojen deneme materyali gerektiren ve işlemlerin deneme parsellerine dağıtılmasında tam tesadüfîlik uygulanan bir deneme metodudur. Ancak her zaman bu şartlara uygun homojenlikte materyal bulmak mümkün değildir. Mesela konu bir arazi denemesi ise, deneme sahasında toprak, arazi yapısı (bakı, meyil vs) farklı olabilir. Veya deneme ünitelerinin (bitki, hayvan vs) bizzat kendileri aynı özelliklerde değildir. Bu tür farklılıkların, denemenin sonucunu etkileyeceği de önceden bilinmektedir. Đşte bu gibi durumlarda homojenliği bozan unsurlar ayrılarak bunlara, denemedeki işlemler eşit şekilde dağıtılır. Materyalin farklılığından ileri gelen etkiler, bir denemede işlemlerin içinde, deneysel hata içinde veya her ikisinde yer alabilir. Bu bölümde açıklanacak deneme tertibi ile, materyalin heterojenitesinden ileri gelen unsurlar, denemenin tertiplenmesi safhasında ayrılarak -ki bunlar varyans analizinde Bloklar adıyla ayrı bir varyasyon kaynağı oluşturur- bunların gerek işlemlere, gerekse deneysel hataya olabilecek etkileri giderilmiş olur. Bu şekilde farklılık gösteren materyale uygulanacak deneme metotları rastlantı blokları ve latin kare deneme tertipleridir. Latin kare denemelerin tekrarlama sayısında sınırlamalar getirdiğinden, burada rastlantı blokları deneme tertibi ele alınacaktır. Bu tür denemelerde gözlemler, bloklar ve işlemlere göre iki yönden ele alınır. Bu bakımdan rastlantı blokları ve latin kare deneme tertiplerine iki yönlü gruplandırmalar da denir. 11.2.Denemenin Uygulanması Denemenin rastlantı bloklarında uygulanmasına karar verildikten ve tekrarlama sayısı belirlendikten sonra, deneme materyali (mesela arazi denemelerinde deneme sahası) tekrarlama adedi kadar parçaya ayrılır. Bunları her birine blok denir. Bloklar, arazide homojeniteyi bozan özelliklere göre (meyil, toprak özellikleri vs) sahaya dağıtılır. Böylelikle her bloku kendi içinde homojen olması sağlanır. Mesela saha tamamen meyilli ise, Bloklar yukarıdan aşağı doğru yerleştirilir. Toprak yapısı farklı ise, Her farklı kısma ayrı bir blok yerleştirilmeye çalışılır. Arazi meyil, bakı vs yönden farklılıklar gösteriyorsa, her homojen sayılabilecek bir kısma bir blok yerleştirilir. Blokların şeklinin aynı olması gerekmez. Bloklar arazide farklı konumda ve şekilde yer 115 alabildiklerinden, bunların kendi içinde bölünmeleri de farklı şekillerde olabilir. Önemli olan parsel büyüklüklerinin eşit olmasıdır. Her blok kendi içinde denenecek işlem (konu) sayısı kadar parsele ayrılır. Daha sonra işlemler bu parsellere rastgele dağıtılır. Bu amaçla yine kur’a metodu uygulanabilir. Đşlemlerin parsellere dağıtılması her blok için ayrı ayrı yapılır. Bu metotta işlemler ancak blok içinde tesadüfi olarak dağıtıldığından, rastlantı parsellerindeki tam tesadüfilik kısmen bozulmaktadır. Arazi denemlerinde genel olarak tamamen homojen, yeter büyüklükte bir saha bulmak mümkün değildir. Tecanüsü bozan unsurlar yönünden saha hakkında tam bilgi mevcut değilse yapılacak iş, sahayı mümkün olduğu kadar fazla parsele bölerek tekrarlama sayısını arttırmak ve rastlantı parselleri metodunu uygulayarak işlemleri parsellere tam rastgele dağıtıp deneysel hatayı küçültmeye çalışmaktır. Fakat yukarıda açıklandığı gibi tecanüsü bozan unsurlar biliniyorsa, sahayı bu unsurlara göre bloklara bölmek gerekir. Düzgüneş (1963)’e göre bir mahalde yeteri genişlikte saha bulunmadığı takdirde blokların ayrı ayrı yerlerde veya tarlalarda tesisi de mümkündür. Misal 11.1: A, B, C, D isimli 4 kavak klonu, idare müddeti sonundaki çaplarına göre mukayese edilmek istenmiş, toprak özellikleri bakımından gerekli büyüklükte homojen bir saha bulunamadığından denemenin rastlantı bloklarında tesisine karar verilmiştir. Deneme ile ilgili hipotez “Klonlar arasında çap bakımından fark yoktur” şeklindedir. Saha incelenerek 5 farklı özellikte olduğu anlaşıldığından, denemenin 5 yinelemeli olmasına karar verilmiştir. Buna göre saha 5 bloka ayrılmıştır (Şekil 11.1). Denenecek klon sayısı 4 olduğuna göre her blok 4’e bölünmüştür. Bundan sonra her blok için ayrı ayrı kur’a çekilerek, bloklar içindeki parsellere klonlar rastgele dağıtılmıştır. Klonların bloklar içindeki yerleşimi Şekil 11.1’de görülmektedir. Bundan sonra fidanlar homojen kültür ve bakım teknikleriyle yetiştirilmiş ve idare müddeti sonundaki çapları ölçülmüştür. Parsellerdeki ağaç sayısına göre her parselin ortalaması alınmış ve değerler Tablo 11.1’de verilmiştir. D I. Blok B B A C D A C III. Blok D C B A V. Blok II. Blok D B A A B D C C IV. Blok Şekil 11.1: 4 işlem, 5 tekrarlamalı rastlantı blokları deneme deseni 116 Tablo 11.1: 4 kavak klonunun 5 blokta idare müddeti sonundaki çapları (cm) Klonlar A B C D Blok top. Blok ort. 1 32 33 27 29 121 30.00 2 34 31 32 26 123 30.75 Bloklar 3 34 36 33 30 133 33.25 4 35 37 26 31 129 32.25 5 37 35 29 28 129 32.25 Klonlar Top. Ort. 34.40 172 34.40 172 29.40 147 28.80 144 635 31.75 11.3.Rastlantı Bloklarında Kurulmuş Denemelerde Varyans Analizi Tablo 11.1 incelendiğinde iki yönlü düzenlendiği ve elde edilen verinin iki unsura göre sınıflandırıldığı görülür. Bu unsurlardan biri bloklar, diğeri işlemleri oluşturan klonlardır. O halde varyans analizi bu iki unsura göre yapılacaktır. Bu durumda, tesadüf parsellerine nazaran genel varyasyona (işlemler ve hataya ilaveten) 3. bir varyasyon kaynağı olarak bloklar dahil olmaktadır. Varyans analizi için gerekli hesaplamalar aşağıda sırayla gösterilmiştir: Kareler toplamları: Düzeltme faktörü: C =6352/20 = 20161.25 Genel KT = 322+342+342+. . . +282 - C = 229.75 Bloklar AKT = Klonlar AKT= 1212 + 1232 + 1332 + 129 2 + 129 2 4 172 2 + 172 2 + 147 2 + 144 5 - C=24.0 2 -C=141.35 Hata KT=Genel KT-(Bloklar AKT+Klonlar AKT)= =229.75-(24.00+141.35) = 64.4 Serbestlik Dereceleri: Genele ait: 20-1=19 Bloklara ait: 5-1=4 117 Klonlara ait: 4-1=3 Hataya ait: 19-(4+3)=12 Kareler Ortalamaları: Bloklar AKO=24/4=6 Klonlar AKO=141.35/3=47.117 Hata KO= 64.4/12=5.367 Bunlara göre, varyans analizi Tablo 11.2'de özetlenmiştir. Tablo 11.2: 4 kavak klonunun 5 bloktaki çaplarına ait varyans analizi Varyasyon kaynağı Bloklar Klonlar Hata Genel KT 24.00 141.35 64.40 229.75 SD 4 3 12 19 KO 6.000 47.117 5.267 F 1.12 8.78** Klonların çap yönünden farklı olup olmadıklarını kontrol için, F=47.117/5.367=8.78 hesaplanır. Bölünen (klonlar KO) için 3, bölen (Hata KO) için 12 serbestlik derecesine göre F tablosuna bakılacak olursa, 0.05 olasılıklı değerin 3.26, 0.01 olasılıklı değerin ise 5.95 olduğu görülür. Hesaplanan değer (8.78) bunların her ikisinden de büyük olduğuna göre, hipotez reddedilerek “klonların çapları bakımından %99 güvenle farklı oldukları” sonucuna varılır. Burada deneme, her ne kadar “Bloklar arasında fark yoktur.” şeklinde ifade edilebilecek bir hipotezi kontrol gayesini gütmemekte ise de, bloklara ait, F=6/5.367=1.12 değeri, 4 ve 12 serbestlik dereceli tablo değeri (0.05 olasılık için 3.26) ile karşılaştırılmakla istenen kontrol yapılabilir. 1.12<3.26 olduğuna göre blokların farksız etki yaptığı sonucuna varılır. Bu durumda “deneme rastlantı parsellerinde tertiplenseydi” diye düşünülebilir. Ancak bu şekilde bir uygulamayla, genel varyansın hara KT’nda yer alacak belli bir miktarı (burada 24) bloklarda görünmüş, bu da hata KO’nın o miktarda küçülmesini sağlamıştır. Ayrıca tesadüf blokları vasıtasıyla, tekrarlama sayısında da bir miktar tasarruf sağlanmıştır. Bazı özel formüller yardımıyla, denemenin bloklarda kurulmasıyla ne kazanç sağlandığı hesaplanabilir. Đşlemlerin farklılıkları böylece belirlendikten sonra, ortalamaların karşılaştırılması için burada da 10.4 nolu maddede açıklanan metotlardan biri 118 kullanılabilir. Bunlardan LSD için gerekli sd , (10.6) nolu formüle göre, sd = 2 × 5.367 =1.465 5 ve diğer testler için s X (10.5) nolu formüle göre, sX = 5.367 =1.036 5 olarak hesaplanır. Buna göre tercih edilen testlerden biri uygulanarak ortalamalar mukayese edilir. Ancak varyans analizine göre klonlar (işlemler) %99 güvenle farklı bulunduğundan, farklı ortalamaların tesbiti için ilgili tablolarda 0.01 seviyesi esas alınmalıdır. 11.4.Tesadüf Bloklarında Eksik Değerler Bazı hallerde denemenin yürütülüşü sırasında bir veya bir kaç blokta, bir veya bir kaç parseldeki deneme üniteleri zarar görebilir, hatta tamamen ortadan kalkabilir. Zararlılar tarafından tahrip olabilir, kuruyabilir, ölebilir vs. Böyle durumlarda denemenin hassasiyeti azaldığı gibi, bazan da değerlendirme imkanı ortadan kalkar. Bir kaza sonucu bir blokun tamamı ortadan kalkmışsa, deneme kalan bloklar üzerinden değerlendirilebilir. Ancak 2 bloklu bir denemede buna imkan kalmaz. Bloklardaki parsellerden birinin tahrip olması halinde ise, eksik değerin bulunduğu blokun değerlendirme dışı bırakılması düşünülebilir. Ancak tek bir parselin kaybı yüzünden bir blokun atılması, emek, para, zaman ve bilgi kaybıdır. Böyle durumlarda Đngiliz istatistikçisi Yates’in geliştirdiği metotla eksik parsel için yaklaşık bir değer hesaplanabilir. Denemedeki diğer gözlem değerlerini kullanarak aşağıdaki formüle göre eksik parsel için hesaplanacak bu değer, sadece istatistik analizi mümkün kılar: X= ( n × b) + ( k × T ) − G ( n − 1) × ( k − 1) (11.1) Formülde: n: blok (yineleme) sayısı, B: zarar gören parselin bulunduğu bloktaki diğer parsellerin toplamı k: işlem adedi T: zarar gören parsele uygulanmış işlemin, diğer bloklardaki toplamı, G: denemedeki tüm parsellerin toplamıdır. 119 Misal 11.2: Tablo 11.1’de sonuçları verilen denemede 1. blokun A parselinin ortadan kalktığını ve bu parsele ait gözlem değerinin bulunmadığını kabul edelim. Bu durumda yapılacak işler aşağıdaki gibidir: n=5 B=33+27+29=89 k=4 T=34+34+35+37=140 G=635-32=603 O halde eksik parsele ait değer, X= (5 × 89) + ( 4 × 140) − 603 =33.5 (5 − 1) × ( 4 − 1) cm hesaplanır. Eksik değer, yerine konularak varyans analizi madde 11.3’de açıklandığı şekilde yapılır. Ancak varyans analizinde: Genel ve hataya ait serbestlik dereceleri 1’er azaltılır. Mesela bu misal için genelin serbestlik derecesi 18, hatanın serbestlik derecesi 11 olur. Klonların ve blokların serbestlik dereceleri aynı kalır. Hesaplanan klonlar arası kareler toplamından; ( B − ( k − 1) × X ) 2 k × ( k − 1) (11.2) formülüne göre hesaplanacak miktar düşülür. Yukarıdaki misale göre bu değer: (89 − ( 4 − 1) × 33.5) 2 =11.021 4 × (4 − 1) hesaplanır. F kontrolları buna göre yapılarak sonuca varılır. (11.1) nolu formüle göre hesaplanan parsel değeri ile yapılacak varyans analizinde, işlemler arası KT'ndan (11.2) nolu formüle göre düşme yapmadan da analiz değerlendirilebilir. Bu takdirde işlemlere ait hipotezin kontrolu için F tablosundan %5 yerine %1 seviyesi esas alınmalıdır. Tesadüf bloklarında eksik gözlem sayısı 2 adetse ve eksik değerlerin her ikisi de aynı blokta ise o blok iptal edilmelidir. Eksik değerler farklı bloklarda ise önce bunlardan birine tahmini bir değer verilerek, diğeri (11.1) nolu formüle göre hesaplanır. Hesaplanan değer yerine konularak, bu defa diğer eksik değer hesaplanır. Bu şekilde bulunan değer, ilk önce tahmini olarak verilen değere yakın ise işlem tamamlanır ve varyans analizi bunlar üzerinden yapılır. Eğer çok farklı ise hesaplanan değerler yerine konularak, farklar 120 azalıncaya kadar işleme devam edilir. Varyans analizinde de her eksik değer için genel ve hata SD'nden birer düşülür. Đkiden fazla eksik değer olması halinde de yukarıda açıklanan yol izlenebilir. Ancak böyle durumlarda F tablosuna nasıl bakılacağına dair açıklık bulunmadığından, analizden sağlıklı bir sonuç almak mümkün değildir. Bu nedenle ikiden fazla eksik parsel bulunduran denemeler en iyisi iptal edilmelidir. 121 12. FAKTÖRĐYEL (ÇOK FAKTÖRLÜ) DENEMELER 12.1.Giriş Buraya kadar açıklanan varyans analizi teknikleri, yalnız bir işlem grubunun etkilerini inceleyen tek faktörlü denemelere aittir. Mesela bir denemede “klonlar” olarak ele alınan işlem grubu, esasen büyüme olayında sadece “klon faktörünün” etkisini incelemektedir. Buna benzer şekilde değişik gübrelerin etkilerinin arandığı bir denemede ise konu “gübre faktörü” olmaktadır. Bu iki faktör birbirlerinden farklı konulardır. Böylelikle bazı hallerde araştırmacı birden fazla faktörün etkilerini aynı deneme içinde bir arada görmek isteyebilir. Mesela 4 çeşit kavak klonu 3 değişik gübre ile yetiştirilerek, hangi klonun hangi gübre ile daha iyi geliştiği ortaya çıkarılmaya çalışılır. Böyle bir denemede “klonlar” ve “gübreler” olmak üzere iki faktör vardır. Her faktörün kendi içindeki değişik hallerine o faktörün seviyeleri denir. Klon faktörünün 4, gübre faktörünün 3 seviyesi olduğu gibi. Faktöriyel denemeler faktörlerin esas etkilerini ortaya çıkardığı gibi, bir faktörün hallerinin diğer faktörün halleriyle bir arada müştereken oluşturdukları interaksiyonları (ara etkiler, etkileşimler) da inceler. Böylelikle mesela hangi kavak klonunun hangi gübreyi tercih ettiği ortaya çıkarılabilir. Çok faktörlü denemelerden amaç zaten ara etkileri görmektir. Faktöriyel denemelerde esas faktörler bazı hallerde kendi başlarına önemsiz olduğu halde, bunların interaksiyonları önemli olabilir. Veya bir faktör diğer bir faktörü olumsuz yönde etkileyerek, tek başına etkili olan faktörü etkisiz hale getirebilir. Đnteraksiyonların önemli olduğu durumlarda, faktörler birbirlerinin değişik sevilerinde farklı etkiler gösterirler. Bir denemede faktörler arasında etkileşim (interaksiyon) kesinlikle beklenmiyorsa, bu faktörler en iyisi ayrı ayrı denemelerde ele alınmalıdır. Ancak şüpheli durumlarda veya interaksiyonun zaten beklendiği hallerde faktöriyel denemeler tesis edilir. Büyük zorunluluklar olmadığı müddetçe 4 veya daha fazla faktörlü denemeler kurulmamalıdır. Çünkü bu gibi denemelerin gerek yürütülmelerinde, gerekse analizlerinde güçlüklerle karşılaşılabileceği gibi, ortaya çıkan interaksiyonların açıklanması da güçleşebilir. Faktöriyel denemelerde iki faktör arasındaki interaksiyonlara birinci derece interaksiyon, 3 faktör arasındaki interaksiyonlara ikinci derece interaksiyon, 4 faktör arasındaki interaksiyonlara ise üçüncü derece interaksiyon denir. Faktöriyel deneme tertipleri biyolojide ve özellikle tarımda çok 122 kullanılmaktadır. Çünkü biyolojik olaylar genellikle birden çok faktörün etkisi altında gelişirler. Bu sebepten değişik faktörlerin etkilerini bir arada incelemekte büyük yarar vardır. Mesela bir bitkinin verimine veya bir ağacın gelişmesine; farklı toprak işleme teknikleri, farklı sulama çeşitleri, farklı gübreler, farklı sıklıkta dikim çeşitleri tek başlarına etkili oldukları gibi, bir kaçının birlikte daha fazla etkileri de olabilir. Böylelikle verim daha da arttırılabilir. Bazı hallerde ise müşterek etkiler sonucu verim düşebilir. Đşte bütün bu tür araştırmalar faktöriyel denemelerle yapılabilir. Faktöriyel denemeler önceki konularda açıklanan esaslara uygun olarak, rastlantı parsellerinde, rastlantı bloklarında veya latin kare tertibinde kurulabilirler. Aşağıda, rastlantı parsellerinde ve rastlantı bloklarında 2 faktörlü bir denemenin kuruluşu ve analizi misaller üzerinden açıklanmıştır. 12.2.Rastlantı Parsellerinde Faktöriyel Deneme Tertibi 12.2.1.Denemenin Kurulması Misal 12.1: A ve B gibi iki tip mineral gübrenin bir bitkinin verimini arttırmada müşterek etkisi görülmek istendiğinde, 2 faktörlü bir deneme kurmak gerekir. Faktörlerden birinin A gübresi verilmemiş a0 ve verilmiş a1 gibi 2 seviyesi, diğerinin de B gübresi verilmemiş b0 ve verilmiş b1 gibi 2 seviyesi denenecek olursa, bu denemede: a0b0: A gübresi yok, B gübresi yok, a0b1: A gübresi yok, B gübresi var, a1b0: A gübresi var, B gübresi yok, a1b1: A gübresi var, B gübresi var, olmak üzere 2×2=4 hal (kombinasyon) vardır. Đki faktör böyle ikişer seviyesi ile denendiğinde bu denemeye 2×2 denemesi de denir. Faktöriyel denemelerde her faktörün seviyesi diğer faktör veya faktörlerin seviyeleri ile birleştirildiğinden bu hallere işlem kombinasyonları denir. Misaldeki deneme 4 tekrarlamalı olarak kurulacaksa, mütecanis bir arazi bulunarak deneme alanı 2×2×4=16 parsele bölünür. 4 işlem kombinasyonu parsellere 10.2 nolu maddede açıklandığı gibi rastgele dağıtılır. Bu maksatla hazırlanan krokiler (deneme deseni) aplikasyonda kullanılır ve denemenin dosyasında saklanır. Öngörülen gübreler parsellere verilir, homojen kültürbakım teknikleri ile hasat mevsiminde parsellerdeki ürün hasat edilir. Bu denemede hipotezler: “A gübresinin denenen bitkinin verimine etkisinin olmadığı” “B gübresinin denenen bitkinin verimine etkisinin olmadığı” “A ve B gübrelerinin denenen bitkinin verimine müştereken etkilerinin 123 olmadığı” şeklindedir. 12.2.2.Faktöriyel Denemelerde Etkiler Yukarıdaki gibi bir 2×2 denemesinde işlem kombinasyonlarına göre parsellerde elde edilen ortalama verim Tablo 12.1’de verilmiştir. Tablo 12.1: Bir 2×2 faktöriyel denemede parsellerdeki ortalama ürün miktarları (kg) Faktörler B Gübresi b1-b0 b0 b1 A Gübresi a0 a1 30 32 36 38 6 6 a1-a0 2 2 Böyle bir denemede A hallerine ait her b1-b0 değerine ve B hallerine ait a1-a0 değerine basit etkiler denir. Mesela B hallerinin a0’daki basit etkisi b1-b0 =36-30=6 olduğu gibi, a1’deki basit etkisi de b1-b0=38-32=6’dır. Demek ki B’nin etkisi A’nın her iki halinde de aynıdır. Bu durumda a1-a0=32-30=2 ve a1a0=38-36=2 eşitliklerinde görüldüğü üzere, A’nın basit etkisi de B’nin her iki halinde aynıdır. Faktörlere ait basit etkilerin aynı olmaları veya istatistik anlamda önemsiz sayılabilecek bir farklılık göstermeleri, interaksiyonun bulunmadığını veya önemsiz olduğunu gösterir. Böyle bir denemenin sonuçları, grafikle gösterilecek olursa, basit etkilerin bir birine paralel veya paralel sayılabilecek bir seyir gösterdiği görülür (Şekil 12.1). Demek ki A ile B’nin bu bitkinin verimine müşterek olumlu veya olumsuz bir etkisi olmamıştır. 40 35 30 b0 25 b1 20 a0 a1 Şekil 12.1: Bir 2×2 denemesinde interaksiyonlar Basit etkilerin ortalamasına esas etki denir. Mesela yukarıdaki misalde A faktörnün esas etkisi (2+2)/2=2, B faktörünün esas etkisi (6+6)/2=6’dır. Tablo 12.2’de başka bir 2×2 denemesinin sonuçları verilmiştir. 124 Tablo 12.2: Başka bir 2×2 denemesinde parsellerdeki ortalama ürün miktarları (kg) Faktörler B Faktörü b1-b0 A Faktörü a0 a1 30 32 36 26 6 -6 b0 b1 a1-a0 2 -10 Bu defa A’nın b0’daki basit etkisi 32-30=2, b1’deki basit etkisi 26-36=10’dur. Demek ki A’nın etkisi, B’nin hallerine göre değişmektedir. b0, a1 ile (a0’a nazaran) iyi sonuç verdiği halde; b1, a1 ile olumsuz sonuç vermektedir. Aynı durum B faktörünün basit etkisinde de görülmektedir (b1a0=36 iken, b1a1=26 olmuştur). Böyle bir durum interaksiyon etkisinin varlığını gösterir. Ancak buradaki durum negatif bir interaksiyondur. Yani A halleri, B halleri ile bir araya geldiğinde sonuç olumsuz yönde etkilenmektedir. Bu durumda Şekil 12.2’de soldaki grafikte görüldüğü gibi, birbirine zıt meyilde iki doğru ortaya çıkmaktadır. 40 40 35 35 30 30 b0 b0 25 25 b1 20 a0 b1 20 a1 a0 a1 Şekil 12.2: 2×2 denemelerinde interaksiyonlar Şekil 12.2’de sağdaki grafik ise pozitif bir interaksiyonun varlığına işarettir. Yani A faktörünün halleri B faktörünün halleri ile birlikte sonucu arttırıcı yönde bir etki oluşturmaktadır. 12.2.3.Tesadüf Parsellerinde 2×2 Denemesinin Analizi Madde 12.2.1’de kuruluşu açıklanan denemenin sonuçları Tablo 12.3’de verilmiştir. Tablo incelenecek olursa: A’nın B ile (b1’deki ) basit etkisi: a1b1-a0b1=15-10=5 kg, A’nın B’siz (b0’daki ) basit etkisi: a1b0-a0b0=13.5-11=2.5 kg olup bunların arasındaki 5-2.5=2.5 kg’lık fark interaksiyon etkisidir. Demek ki A ile B müştereken 2.5 kg’lık bir verim artışı sağlamaktadır. 125 Tablo 12.3: Bir 2×2 denemesinde ürün miktarları (kg) Konu a0b0 a0b1 a1b0 a1b1 I 11.5 9.5 14.5 14.8 Toplam Tekrarlama II III 10.8 10.5 10.1 11.0 13.7 12.8 15.2 15.3 Toplam IV 11.2 9.4 13.0 14.7 44 40 54 60 198 Ortalama 11.0 10.0 13.5 15.0 Toplam A 84 B 98 100 114 Aynı şekilde: B’nin A ile (a1’deki ) basit etkisi: a1b1-a1b0=15-13.5=1.5 kg, B’nin A’sız (a0’daki ) basit etkisi: a0b1-a0b0=10-11=-1 kg olup bunların arasındaki 1.5-(-1)=2.5 kg’lık fark da aynı interaksiyondur. Tabii bu interaksiyonun önemli olup olmadığına varyans analizi sonucu karar verilecektir. Đnteraksiyonun gerçekten önemli bulunması halinde, esas etkile bir anlam taşımaz. Zira bunlar diğer faktör (veya faktörlerin) hallerine göre değişmektedir. Burada esas etkiler hesaplanacak olursa: A’ya ait esas etkinin: ((a1b0-a0b0)+( a1b1-a0b1))/2=(2.5+5)/2=3.75, B’ye ait esas etkinin: ((a0b1-a0b0)+( a1b1-a1b0))/2=(-1+1.5)/2=0.25 olduğu görülür. Buna göre A gübresi B ile birlikte ortalama 3.75 kg’lık bir fark yaratmaktadır. 12.2.3.1.Kareler Toplamları ve Serbestlik Dereceleri Burada GKT, tesadüf parsellerinde olduğu gibi önce işlemler arası ve işlemler içi (hata) olmak üzere ikiye bölünür. Denemede, her birinde 4 varyant (tekrarlama) bulunan 4 işlem grubu (kombinasyon) vardır. Düzeltme faktörü=C=1982/16=2450.25 GKT=11.52+10.52+10.82+ . . .+14.72-C=66.99 Đşlemler AKT= 44 2 + 402 + 54 2 + 602 4 -C=62.75 Hata KT=Genel KT-Đşlemler KT=66.99-62.75=4.24 Burada Đşlemler AKT, A halleri KT, B halleri KT ve interaksiyon KT’ndan meydana gelir. Bunlar şöyle hesaplanır: A halleri KT= 84 2 + 114 2 8 -C=56.25 126 B halleri KT= 982 + 1002 8 -C=0.25 A halleri KT+B halleri KT=56.25+0.25=56.5’dir. Dikkat edilirse bu değer, işlemler işlemler AKT’ndan küçüktür. Aradaki fark, genel varyasyonda diğer bir varyasyon kaynağı olan interaksiyon KT’dır. Đnteraksiyon KT=Đşlemler AKT-(A halleri KT+B halleri KT)= =62.75-(56.25+0.25)=6.25 Burada, Hata KT=GKT-(A faktörü KT+B faktörü KT+Đnteraksiyon KT= =66.99-(56.25+0.25+6.25)=4.24 şeklinde de hesaplanabilir. Serbestlik dereceleri ise: Genel SD=16-1=15 Đşlemler SD=4-1=3 A faktörü SD=2-1=1 B faktörü SD=2-1=1 Đnteraksiyon SD=Đşlemler SD-(A faktörü SD+B faktörü SD)= =3-(1+1)=1 Đnteraksiyona ait SD, faktörlerin serbestlik derecelerinin çarpımı olarak da hesaplanabilir: 1×1=1 Hata SD=Genel SD-Đşlemler SD=15-3=12 veya, Hata SD=Genel SD-(A faktörü SD+B faktörü SD+interaksiyon SD)= =15-(1+1+1)=12 Yapılan bu hesaplamaların sonuçları Tablo 12.4’te özetlenmiştir. Tablo 12.4: Tesadüf parsellerinde 4 tekrarlamalı olarak kurulmuş 2×2 faktöriyel denemesinin varyans analizi Varyasyon Kaynağı A Gübresi B Gübresi A×B interaksiyonu Hata Genel KT 56.25 0.25 6.25 4.24 66.99 SD 1 1 1 12 15 KO 56.25000 0.25000 6.25000 0.35333 F 159.20*** 0.71 17.69** Varyans analizi tablosunda, faktörlere ve interaksiyona ait F oranları da hesaplanarak ilgili sütuna yazılmıştır. Bu maksatla kareler ortalamaları, hata KO’na bölünmüştür. Bunlardan mesela A faktörüne ait: F=56.25/0.35333 bulunmuştur. Burada hem A, hem B faktörünün, hem de interaksiyonun 127 serbestlik dereceleri 1’dir. Hata SD ise 12’dir. O halde bunlara ait F oranlarının önemliliğinin kontrolu için, 1’e 12 SD’li F tablosu değerlerine (Ek Tablo 4) bakılacaktır. Tabloya göte %5 olasılık için F=4.75, %1 olasılık için F=9.33, %0.1 için F=18.64’tür. A’ya ait F oranı bunların üçünden de büyük olduğuna göre, A gübresi %99.9’un çok üzerinde bir güven düzeyinde verime etkili olmuştur. B gübresine ait F, %5’lik tablo değerinden bile küçük olduğuna göre, B gübresi etkili değildir. Đnteraksiyona ait F ise, %1’lik tablo değerinden büyük, %0.1’lik tablo değerinden küçük olduğundan, %99 güven düzeyinde önemlidir. O halde bu iki gübrenin etkisi birbirine bağlıdır. Bu bitkiden en iyi ürünü alabilmek için her iki gübre birlikte verilmelidir. Bu durumda A faktörüne bağlı hipotez reddedilecek, B faktörüne bağlı hipotez kabul edilecek, interaksiyona ait hipotez ise reddedilecektir. 12.2.3.2.Ortalamaların Mukayesesi Faktöriyel denemelerde, faktörlere ve interaksiyonlara ait çeşitli ortalamalar vardır. Bunların mukayeseleri de, sd veya s X üzerinden, Madde 10.4’te açıklananlardan istenen bir metoda göre yapılabilir. Burada gerek faktör ortalamaları, gerekse interaksiyon ortalamaları için: sX = Hata KO Ortalamaya esas gözlem adedi (12.1) formülü üzerinden hesaplanır. A faktörü ortalamaları için s X ’in hesabı: A faktörünün 2 seviyesi olduğuna göre, buna ait 2 ortalama var demektir. Tablo 12.3’e bakılacak olursa, her bir A halinin 8 gözlemden meydana geldiği görülür. Bunların toplamı da 84 ve 114’tür. Öyleyse A hallerine ait ortalamalar 8’er gözlem üzerinden hesaplanmaktadır. 2 faktörlü bir denemede A halleri için, Ortalamaya esas gözlem adedi=tekrarlama adedi×B faktörü seviyesi dir. Hata KO ise her zaman olduğu gibi varyans analizi tablosundan alınır. Bu durumda, sX = 0.35333 =0.21016 8 olarak hesaplanır. Bilindiği gibi sd = s X ortalamalar: 84/8=10.5 ve 114/8=14.25 128 2 olarak hesaplanır. A hallerine ait olduğuna göre bunlar arasındaki farkın önemi 10.4 nolu Maddede açıklanan metotlardan birine göre kontrol edilebilir. Ancak, 2 ortalamanın mevcut olduğu hallerde, varyans analizindeki sonuç zaten bu iki ortalamanın arasındaki farkın önemi ile aynı anlama geldiğinden, ayrıca ortalamaların mukayesesine gerek yoktur. Varyans analizine göre A işlemi %99.9 önemli olduğuna göre, 14.25 kg ortalamaya sahip a1 hali ile 10.5 kg ortalamaya sahip a0 hali arasındaki 14.25-10.5=3.75 kg’lık fark (yani A faktörünün esas etkisi) bu seviyede önemli demektir. B faktörü ortalamaları için s X ’in hesabı: Đki faktörlü denemelerde B faktörü ortalamaları için, Ortalamaya esas gözlem adedi=Tekrarlama adedi×A faktörü seviyesi olarak hesaplanır. Burada bu değer yine 4×2=8 olduğu için B faktörü ortalamalarına ait s X yine 0.21016 olur. Yine 2 ortalama olduğundan ayrıca mukayeseye gerek yoktur. Ayrıca B faktörü halleri varyans analizine göre zaten önemli olmamıştır. Đnteraksiyon ortalamaları için s X ’in hesabı: Đki faktörlü bir denemede, Đnteraksiyon ortalamalarına ait gözlem adedi=Tekrarlama sayısı olmaktadır. Tablo 12.3’te görüleceği üzere 4 interaksiyon ortalaması vardır ve bunlar 4’er tekrarlamanın ortalaması olarak hesaplanır. O halde, sX = 0.35333 =0.29721 4 hesaplanır. Bu değer üzerinden, istenen metodlardan biri kullanılarak 11. 10, 13.5 ve 15 olarak elde edilmiş interaksiyon ortalamaları birbirleriyle mukayese edilebilir. Sonuca göre en etkili işlem kombinasyonu seçilir. Faktöriyel denemelerde interaksiyonlar önemli bulunduğunda, esas etkilerin önemli olup olmadığı bir anlam taşımaz. Bu bakımdan böyle hallerde interaksiyon üzerinde durulmalıdır. 12.2.3.3.Faktöriyel Denemelerde Hipotezlerin Kontrollarına Ait Bazı Açıklamalar Faktöriyel denemelerde faktörlerin ancak sınırlı sayıda hali (seviyesi) denenebilir. Bu haller, mümkün olan bütün haller arasından rastgele seçilmiş olabileceği gibi, sadece belli hallerin etkilerini görmek maksadıyla özel olarak seçilmiş de olabilir. Mesela yeni geliştirilen bir mineral gübrenin rastgele seçilen birkaç bitkide denenmesi veya yeni bulunan bir kavak klonunun 129 rastgele seçilen birkaç yörede denenmesinde ilk durum; buna karşılık aynı gübrenin özel olarak seçilen birkaç bitkide veya aynı klonun belli birkaç yörede denenmesinde ise ikinci durum söz konusudur. Özel seçilme durumunda faktörlerin seviyeleri denemeci tarafından belirlenir. Faktör hallerinin rastgele veya özel olması durumunda hükümler de değişik olur. Halleri rastgele seçilmiş bir faktörün tümü hakkında hüküm verilir. Mesela yeni geliştirilen mineral gübre “Bitkilerde büyümeye etkilidir.” veya yeni bulunan klon “Ülke çapında başarılıdır.” denir. Özel seçilmiş hallerde ise sadece denenen haller üzerinde konuşulur. Mesela “Söz konusu gübre denenen bitkilerde etkilidir.” veya “Söz konusu klon denenen yörelerde başarılıdır.” denir. Faktörlerin hallerinin rastgele veya özel olmasına göre varyans analizinde F kontrolu da farklı şekillerde yapılır: • Faktörlerin halleri ne olursa olsun, interaksiyon kontrolunda bölen olarak hata KO kullanılır. • Faktörlerin halleri rastgele seçilmişse, faktörlerin esas etkilerinin kontrolunda bölen olarak interaksiyon KO kullanılır. • Faktörlerin halleri özel seçilmişse, esas etkilerin kontrolunda bölen olarak hata KO kullanılır. Faktörlerden birinin halleri rastgele, diğeri özel seçilmiş de olabilir. Böyle karışık hallerde ise: • A halleri özel B halleri rastgele ise, A’nın kontrolunda bölen olarak hata KO, B’nin kontrolunda bölen olarak interaksiyon KO kullanılır. • A halleri rastgele B halleri özel ise, A’nın kontrolunda bölen olarak interaksiyon KO, B’nin kontrolunda bölen olarak hata KO kullanılır. Açıklanan bu durum, 2 faktörlü denemelere mahsustur. Faktör sayısı arttıkça daha değişik ve karışık haller ortaya çıkmakta, buna göre de F hesabında bölenler değişebilmektedir. Ancak denemelerde faktörlerin halleri genellikle denemeci tarafından özel olarak seçildiğinden, bütün kontrollarda hata KO bölen olarak kullanılmaktadır. Bazı istatistik kitaplarında özel haller, sabit model veya Model I, tesadüfi haller ise tesadüfi model veya Model II olarak anılmaktadır. 12.3.Tesadüf Bloklarında Faktöriyel Deneme ve Analizi Tesadüf bloklarında 2 faktörlü bir denemenin kurulması ve analizi aşağıda bir misal üzerinden açıklanmıştır. 12.3.1.Denemenin Kurulması Misal 12.2: 4 okaliptus türü, 3 farklı arazi hazırlığı şartlarında boy büyümeleri yönünden karşılaştırılmak istendiğinde, araştırmacı yine 2 faktörlü bir deneme kurmak durumundadır. Faktörlerden biri tür, diğeri arazi 130 hazırlığıdır. 1. faktörün a1, a2, a3 ve a4 olmak üzere 4 seviyesi, 2. faktörün ise b1, b2 ve b3 olmak üzere 3 seviyesi vardır. A hallerinin her biri, B hallerinin her biri ile: a 1b 1, a 1b 2, a 1b 3 a 2b 1, a 2b 2, a 2b 3 a 3b 1, a 3b 2, a 3b 3 a 4b 1, a 4b 2, a 4b 3 olmak üzere 4×3=12 işlem kombinasyonu oluşturur. Demek ki bu bir 4×3 denemesidir. Mütecanis bir arazi bulunamadığından, deneme tesadüf bloklarında tesis edileceğine göre, her blok 12 parsele bölünecek ve 12 kombinasyon blok üzerine rastgele dağıtılacaktır. Böyle bir blokun şeması Şekil 12.3’te gösterilmiştir. a2b1 a1b1 a3b2 a4b2 a4b3 a3b3 a3b1 a4b1 a2b3 a2b2 a1b2 a1b3 Şekil 12.3: 4×3 faktöriyel denemede işlemlerin bir blok üzerinde dağılışı Denemenin 3 bloklu olarak kurulmasına karar verilmiştir. Bu durumda diğer bloklara da 12’şer işlem kombinasyonu rastgele dağıtılır. Bu denemede hipotezler: • Denenen türler arasında boylanma bakımından fark olmadığı, • Boylanmaya etki yönünden denenen arazi hazırlıkları arasında fark olmadığı, • Denenen türlerin, denenen arazi hazırlıklarına göre boylanmalarında farklılık olmadığı şeklindedir. Burada gerek türler, gerekse arazi hazırlıkları denemeci tarafından özel seçilmiştir. Böyle bir deneme homojen kültür-bakım teknikleri ile 4 sene yürütülmüş ve 4. senenin sonunda parsellerdeki ağaçların boyları ölçülmüştür. Bunların ortalamaları Tablo 12.5’te verilmiştir. 131 Tablo 12.5: 4 okaliptüs türünün 3 arazi hazırlığına göre 3 bloktaki boyları (m) Arazi Hazırlığı b1 b2 b3 b1 b2 b3 b1 b2 b3 b1 b2 b3 Toplam Türler a1 a2 a3 a4 I 4.85 4.61 3.89 2.35 1.86 1.94 2.53 2.03 1.50 1.32 1.51 1.90 30.29 Bloklar II 5.26 4.76 4.10 2.28 2.10 1.35 2.29 1.84 1.22 2.45 1.57 1.60 30.82 III 5.32 4.81 3.80 2.11 2.38 1.96 2.13 1.60 1.72 1.60 1.53 1.65 30.61 Interak. 15.43 14.18 11.79 6.74 6.34 5.25 6.95 5.47 4.44 5.37 4.61 5.15 91.72 Toplam A 41.40 B 34.49 30.60 26.63 18.33 16.86 15.13 12.3.2.Faktöriyel Varyans Analizi Varyans analizi için önce GKT, bloklar KT, işlemler KT ve hata KT hesaplanacak, sonra işlemler KT, türler, arazi hazırlığı ve tür×arazi hazırlığı interaksiyonuna parçalanacaktır. Đşlemler için gerekli toplamlar Tablo 12.5’te verilmiştir. Düzeltme terimi=C=91.722/36=233.6833 GKT=4.852+5.262+5.322+ . . . +1.652-C=56.6014 Bloklar AKT= 30.29 2 + 30.82 2 + 30.612 Đşlemler AKT= 12 -C=0.0119 15.432 + 14.182 + 11.79 2 + . . . + 5.152 3 -C=54.9497 Hata KT=Genel KT-(Bloklar KT+Đşlemler KT)= =56.6014-(0.0119+54.9497)=1.6398 Türler AKT= 41.4 2 + 18.332 + 16.862 + 15.132 9 132 -C=51.1095 Arazi hazırlığı AKT= 34.49 2 + 30.62 + 26.632 12 -C=2.5742 Tür×arazi hazırlığı interaksiyonu KT= =Đşlemler AKT-(Türler AKT+Arazi hazırlığı KT)= =54.9497-(51.1095+2.5742)=1.2660 Serbestlik dereceleri: Genel: 36-1=35 Bloklar: 3-1=2 Đşlemler: 12-1=11 Hata: 35-(2+11)=22 Türler: 4-1=3 Arazi hazırlığı: 3-1=2 Tür×arazi hazırlığı: 3×2=6 Analiz sonuçları, 12.6 nolu tabloda verilmiştir. F oranları ve bunlara ait önemlilik kontrolları da aynı tabloda gösterilmiştir. Tablo 12.6: 4×3 faktöriyel denemenin rastlantı bloklarında varyans analizi Varyasyon Kaynağı Bloklar Türler Arazi hazırlığı Tür×Arazi hazırlığı Hata Genel KT 0.0119 51.1095 2.5742 1.2660 1.6398 56.6014 SD 2 3 2 6 22 35 KO 0.00595 10.03650 1.28710 0.21100 0.07454 F 0.08 228.56*** 17.27*** 2.83** Faktöriyel varyans analizlerinde önemliliği ilk kontrol edilecek etkiler interaksiyonlardır. Tablo 12.6’ya göre, interaksiyon vardır ve %95 güven düzeyinde önemlidir. Bu durumda türlerin her arazi hazırlığında aynı boy gelişmesini yapmadığı ortaya çıkmaktadır. O halde bu tür için yapılacak tavsiyelerde, arazi hazırlığı faktörünü dikkate almak gerekir. Yani her tür için ayrı bir arazi hazırlığı tavsiye etmek gerekebilir. Hangi kombinasyonda en yüksek boyun elde edildiğini bulmak maksadıyla bunların ortalamalarını mukayese etmek gerekir. Bu maksatla hesaplanan interaksiyon ortalamaları Tablo 12.7’de verilmiştir. 133 Tablo 12.7: 4 okaliptüs türünün 3 tip arazi hazırlığındaki boyları Türler a1 a2 a3 a4 b1 5.14 2.25 2.32 1.79 Arazi hazırlıkları b2 b3 4.73 3.93 2.11 1.75 1.82 1.48 1.54 1.72 Tablo 12.7’deki ortalamalar Şekil 12.4’te grafikle gösterilmiştir. Şekilden anlaşılacağı üzere, 6 5 4 3 2 1 0 b1 b2 b3 a1 a2 a3 a4 Şekil 12.4: Misal 12.2’de açıklanan 4×3 denemesinde interaksiyon grafiği Şekilden anlaşılacağı üzere, b1 ile b2’nin durumu bütün türlerde yaklaşık birbirine paralel seyretmektedir. O halde türlerle b1 ve b2 işlemleri arasında bir etkileşim görünmemektedir. b3’ün durumu ise a1, a2 ve a3’te diğerlerine benzemektedir. Đnteraksiyonu ortaya çıkaran yegane unsur, b3’ün a4’teki etkisidir. Nitekim b3a3 kombinasyonu b2a3’ten düşük iken, b3a4 kombinasyonu b2a4’ten yüksek bir boy arz etmiştir. Bu son durum olmasaydı, interaksiyon önemsiz bulunacağından üzerinde durulmayacak, yalnız esas etkiler incelenecekti. Yine de burada interaksiyonu ortaya çıkaran kombinasyon, yüksek boy sağlayan, dolayısıyla tercih edilecek bir işlem değildir. Bu bakımdan tavsiye edilenlerden biri olmayacaktır. Tavsiye edilenler, a1 klonunun b1, b2 ve b3 tipi arazi hazırlığı ile kombine olduğu haller olacaktır ki, bunlar interaksiyon etkisinden değil, A faktörünün esas etkisinden kaynaklanmaktadır. Đnteraksiyon ortalamaları, mesela Duncan testi ile aşağıdaki gibi mukayese edilebilir: (12.1) nolu formüle göre, sX = 0.07454 =0.15763 3 134 Hata SD=22 olduğuna göre, Ek Tablo 6’dan alınan %5 olasılıklı SSR değerleri aşağıdaki gibidir: 2 2.93 3 3.08 4 3.17 5 3.24 6 3.29 7 3.32 8 3.35 9 3.37 10 3.39 11 3.41 12 3.42 (10.8) nolu formüle göre LSR değerleri ise aşağıdaki gibi hesaplanır: 2 0.46 3 0.49 4 0.50 5 0.51 6 0.52 7 0.52 8 0.53 9 0.53 10 0.53 11 0.54 12 0.54 Ortalamaları büyükten küçüğe sıralanışı ve Duncan’a göre %5 farklılaşmalar Tablo 12.8’de görülmektedir. 7. ortalama (a3b2=1.82) ile kendinden sonraki diğerleri arasında önemli farklılık olmadığı için, bundan sonraki farklar tabloya alınmamıştır. Tablo 12.8: 12 ortalamanın Duncan’a göre mukayesesi Đşlem a1b1 a1b2 a1b3 a3b1 a2b1 a2b2 a3b2 a4b1 a2b3 a4b3 a4b2 a3b3 Ortalama (m) 5.14 4.73 3.93 2.32 2.25 2.11 1.82 1.79 1.75 1.72 1.54 1.48 FARKLAR 0.41 1.21* 2.82* 2.89* 3.03* 3.32* 3.35* 3.39* 3.42* 3.60* 3.66* 0.80* 2.41* 2.48* 2.62* 2.91* 2.94* 2.98* 3.01* 3.19* 3.25* 1.61* 1.68* 1.82* 2.11* 2.14* 2.18* 2.21* 2.39* 2.45* 0.07 0.21 0.50 0.53* 0.57* 0.60* 0.78* 0.84* 0.14 0.43 0.46 0.50 0.53 0.71* 0.77* 0.29 0.32 0.36 0.39 0.57* 0.63* 0.03 0.07 0.10 0.20 0.34 Tablo 12.8’de farklılıkları * ile gösterilen ortalamalar, farksızlıklarına (aynılıklarına veya gruplarına) göre çizgilerle Tablo 12.9’daki gibi gösterilebilir. Faktör ortalamalarını mukayese için ise: Türler için s X = 0.07454 =0.09101 9 bulunur. 135 Tablo 12.9: Duncan’a göre %5 olasılıkla farksız ortalamalar Đşlem a1b1 a1b2 a1b3 a3b1 a2b1 a2b2 a3b2 a4b1 a2b3 a4b3 a4b2 a3b3 Ortalama (m) 5.14 4.73 3.93 2.32 2.25 2.11 1.82 1.79 1.75 1.72 1.54 1.48 Türler %99.9 güven düzeyinde farklı oldukları için, %99 güvenli SSR değerleri ve LSR değerleri, 2 3.99 3 4.17 4 4.28 7 0.36 8 0.38 9 0.39 şeklindedir. Buna göre A faktörü ortalamaları ve farklılaşmalar aşağıdadır: a1 a2 a3 a4 4.60 2.04 1.87 1.68 2.56** 2.73** 2.92** 0.19 Demek ki sadece 1 numaralı tür diğer türlerden faklı olmuştur. O halde bu tür tercih edilmelidir. Arazi hazırlıkları için ise, sX = 0.07454 =0.07881 12 hesaplanır. Arazi hazırlıkları da türlerle aynı güven düzeyinde farklılaşma gösterdiklerinden, yukarıdaki SSR değerleri kullanılarak LSR değerleri hesaplanacak olursa: 2 0.31 3 0.33 bulunur. Buna göre B faktörü ortalamaları ve farklılaşmalar: b1 b2 b3 2.87 2.55 2.22 0.32** 0.65** 0.33** şeklindedir. Demek ki b1 işlemi b2 ve b3’ten, b2 işlemi de b3’ten %99 güven düzeyinde farklı bulunmaktadır. 136 13. BÖLÜNMÜŞ PARSELLER DENEME TERTĐBĐ 13.1. Giriş Faktöriyel denemeler, aşağıda açıklanan sebepler veya zorlamalar yüzünden bazı hallerde bölünmüş parseller tarzında tertiplenirler. Bölünmüş parseller tertipleri arazi denemelerinde yaygın olarak kullanılmaktadır. 13.2.Bölünmüş Parseller Tertibine Göre Denemenin Kurulması Bölünmüş parseller tertibine göre, iki faktörlü denemelerde faktörlerden birine ait haller, tesadüf parselleri, tesadüf blokları veya latin karesi metodlarına göre parsellere dağıtılır; sonra her parsel ikinci faktörün halleri kadar bölünerek bu haller alt parsellere yine tam rastgele veya latin karesi metoduna göre dağıtılır. Mesela A faktörü 4 seviyeli, B faktörü 3 seviyeli bir faktöriyel deneme bölünmüş parseller tertibinde ve rastlantı bloklarında kurulacaksa, her blok önce A halleri kadar parsellere ayrılır. Bunlara ana parseller denir. Ana parsellere, A faktörü halleri rastgele dağıtılır. Sonra her ana parsel, B faktörü halleri kadar tekrar bölünür. Bunlara da alt parseller denir. B faktörünün halleri de alt parsellere yine rastgele dağıtılır. Böyle bir 4×3 denemesinin 3 blokta bu şekilde düzenlenmiş bir örneğine ait deneme deseni Şekil 13.1'de gösterilmiştir. Deneme deseninin incelenmesiyle görüleceği gibi, her ana parselde ikinci faktörün bütün seviyeleri yer almaktadır. Bu esasında 4×3=12 kombinasyonlu bir faktöriyel deneme olmasına rağmen, işlemler (kombinasyonlar) blok içinde tam rastgele dağıtılmamıştır. Böylelikle tesadüfîlikten kısmen uzaklaşılmıştır. Ayrıca, A halleri denemede 3 kere (blok sayısı kadar) tekrarlanmış iken, B halleri 4×3=12 kere tekrarlanmış gibi bir durum vardır. Dolayısıyla A'nın tekrarı B'nin tekrarından eksiktir. A hallerinin yer aldığı ana parseller, B hallerinin blokları gibidir. Bölünmüş parsellerde diğer bir özellik blok etkilerinin A faktörü seviyelerinin etkileriyle karışmış olmasıdır. Ancak sözü edilen bloklar, B hallerinin yer aldığı ana parsellerden meydana gelen “sözde bloklar”dır. Bölünmüş parseller 3 faktörlü de olabilir. Bu durumda B hallerinin her biri, C halleri kadar tekrar bölünerek, C halleri alt-alt parsellere rastgele dağıtılır. Böyle bir denemeye bölünen bölünmüş parseller deneme tertibi denir. 137 A3 I. BLOK B2 B1 A1 B3 B3 A1 II. BLOK B1 B2 B2 B1 B1 B2 A4 B3 B3 A2 III. BLOK B2 A2 B1 B3 B2 B3 B2 A2 B2 B2 A3 B3 B1 A4 B3 B2 B1 B1 A3 B1 B1 A4 B1 B3 B3 B2 A1 B3 B2 B3 B1 Şekil 13.1: 4×3 faktöriyel denemenin bölünmüş parsellerde düzenlenmesi. 13.3.Bölünmüş Parsellere Uygun Deneme Tipleri ve Tertibin Özellikleri Bölünmüş parseller tertipleri, aşağıda açıklanan özelliklerdeki denemelere çok uygundur: Denenecek faktörlerin etkilerinin karşılaştırılmasında aynı derecede güven aranmıyorsa ve faktörlerden birinin etkileri üzerinde özellikle duruluyorsa, bölünmüş parseller tercih edilmelidir. Mesela gübrelerin çeşitlerinden çok, dozları üzerinde duruluyorsa, gübre çeşitleri ana parsellere, dozlar ise alt parsellere uygulanır. Faktörlerden biri, diğerine nazaran daha fazla deneme materyali, mesela parsel alanı gerektiriyorsa yine bölünmüş parseller uygun olmaktadır. Mesela arazi hazırlığı denemelerinde iş makinalarının küçük alanlarda çalışamaması veya faktörün seviyesinin dikte ettirdiği çalışmayı yapamamaları gibi. Bazı sulama, gübreleme, ilaçlama denemelerinde de durum aynıdır. Bunların etkilerini küçük sahalar içinde zaptetmek zor, hatta imkansızdır. Đşlemlerin komşu parselleri etkileme durumları söz konusudur. Böyle hallerde geniş alana ihtiyaç duyan toprak işleme, sulama, gübreleme, ilaçlama vs gibi faktörü ana parsellere, diğerini alt parsellere almak sorunu çözer. Önceki tecrübelere göre faktörlerden birinin seviyeleri arasında, diğer faktörün seviyelerine nazaran büyük farklar bekleniyorsa; yine bölünmüş parseller tertibine başvurulabilir. Seviyeleri arasında büyük farklar beklenen faktör ana parsellere, diğeri alt parsellere uygulanarak, ikinci faktörün etkilerinin ortaya çıkması kolaylaştırılır. Mesela bir gübre ve ekim zamanı denemesinde gübrenin etkisi bariz olarak biliniyorsa bu ana parsellere, ekim zamanı alt parsellere tatbik edilir. 138 Çok yıllık bitkilerle yürütülecek denemelerde, sonuçların değerlendirilmesinde bölünmüş parseller tertibi çok yararlı sonuç vermektedir. Denemede gerek aynı yılın değişik zamanlarında alınan ürün, gerekse takip eden yıllarda alınan ürün alt parsellerde gösterilerek yapılacak analizlerle, zamanın ürün miktarına etkileri saptanabilmektedir. Bu durumda zamanda bölünmüş parseller söz konusu olmaktadır. Denemenin farklı yörelerde yinelenmesi halinde ise mekanda bölünmüş parseller ortaya çıkar. Böyle durumlarda esasen alt parsel yoktur. Deneme gerçekte tek faktörlü bir denemedir. Bölünmüş parseller tertibinde B ve A×B'nin etkileri, A faktörünün etkisine nazaran daha büyük bir kesinlikle kontrol edilebilmektedir. Çünkü A faktörü hallerinin karşılaştırılmasında kullanılan hata varyansının serbestlik derecesi küçüktür. Ancak B ve A×B hallerinin kontrolundaki bu hassasiyet, A'nın hassasiyetinden fedakarlık yapılmakla sağlanmaktadır. Bu yönüyle bölünmüş parseller, alt parseller ve interaksiyondaki küçük farkları önemli bulabildiği halde, ana parsellere uygulanan faktör halleri arasındaki büyük farkları önemsiz sayabilir. Böyle durumlarda denemeci sonuçları rapor etmede çekingen davranabilir. Bu özellikler, bir bakıma bölünmüş parsellerin üstün ve zayıf yönleridir. 13.4.Tesadüf Bloklarında Bölünmüş Parsellerde Varyans Analizi Misal 13.1: 4 farklı sıklıkta 4 ayrı kavak klonunun çap gelişmesini denemek maksadıyla bölünmüş parseller tertibine göre 4 bloklu (r=4) bir deneme kurulmuştur. Bu maksatla her blok 4 ana parsele bölünmüş, bunlardan rastgele her biri o sıklıkta dikime imkan verecek şekilde hazırlanmıştır. Her ana parsel tekrar 4 alt parsele bölünerek bunların da rastgele her birine ayrı klon dikilmiştir. Klonlar arası farkları daha etkili bir şekilde kontrol edebilmek için bunlar alt parsellerde denenmiştir. Denemede gerek sıklıklar; gerekse klonlar özel seçilmiştir. Đdare müddeti sonunda parsellerden elde edilen ortalama çaplar Tablo 13.1'de verilmiştir. Denemenin varyans analizi aşağıdaki şekilde yapılır: Ana parsellerle ilgili hesaplamalar: Düzeltme terimi = C = 2078.52 = 67502.535 64 GKT = 282+28.52+292+ . . .+28.52 - C = 1315.215 139 Ana parseller AKT= 1132 + 1082 + 1212 + . . . + 119.5 2 -C= 1075.903 4 Tablo 13.1: 4 sıklıkta 4 klonun bölünmüş parsellerdeki çap ölçüleri (cm) Sıklık Klon B1 A1 B2 B3 B4 Toplam B1 A2 B2 B3 B4 Toplam B1 A3 B2 B3 B4 Toplam B1 A4 B2 B3 B4 Toplam Blok toplamı I 28.0 28.0 31.5 25.5 113.0 33.5 38.0 35.0 36.0 142.5 37.5 37.5 34.0 38.0 147.0 36.0 30.5 32.0 30.5 129.0 531.5 Bloklar II III 28.5 28.0 26.0 27.0 25.0 30.0 28.5 35.0 108.0 121.0 34.0 34.0 32.0 32.5 31.5 32.0 30.0 30.5 127.5 129.0 35.0 36.0 33.0 33.0 36 33.0 32.5 33.5 135.5 136.5 40.0 40.5 35.5 38.5 32.0 38.5 38.5 38.0 146.0 155.5 517.0 542.0 IV 23.0 18.5 25.0 22.5 89.0 35.5 35.0 32.0 33.0 135.5 35.5 36.5 35.0 37.0 144.0 33.5 31.5 26.0 28.5 119.5 488.0 Toplam 108.5 99.5 111.5 111.5 431.0 137.0 137.5 130.5 129.5 534.5 144.0 140.0 138.0 141.0 563.0 150.0 136.0 128.5 135.5 550.0 2078.5 A×B interaksiyonu tablosu Sıklıklar A1 A2 A3 A4 Toplam Bloklar AKT= B1 108.5 137 144 150 539.5 Klonlar B2 B3 111.5 99.5 130.5 137.5 140 138 136 128.5 513 508.5 B4 111.5 129.5 141 135.5 517.5 Toplam 431 534.5 563 550 2078.5 531.5 2 + 517 2 + 452 2 + 488 2 -C=103.043 16 Sıklıklar AKT = 4312 + 534.52 + 5632 + 550 2 -C=679.981 16 Hata1 KT=Ana parseller KT-(Bloklar AKT+Klonlar AKT)= 140 =1075.903-(103.043+679.981) = 292-879 Serbestlik dereceleri: Genel SD = (A×B×r)-1=(4×4×4)-1=63 Bloklar SD = r-1==4-1= 3 Sıklıklar SD =A-1=4-1=3 Hata1 SD=Bloklar SD×Sıklıklar SD=(r-1)×(A-1)=(4-1)×(4-1)=9 Alt parsellerle ilgili hesaplamalar: Klonlar AKT= Sıklık×Klon KT= 539.5 2 + 5132 + 508.52 + 517.52 -C=35.449 16 108.52 + 99.52 + 111.52 + . . . + 135.52 -(Sık.KT+Klon KT+C)= 16 =68285.563-(679.981+35.449+67502.535)=67.598 Hata2 KT=Genel KT-(Ana parseller AKT+Klonlar AKT+Đnteraksiyon KT)= =1315.215-(1075.903+35.449+67.598) =136.265 Serbestlik dereceleri: Klonlar SD = B-1=4-1=3 Đnteraksiyon SD = Sıklıklar SD×Klonlar SD = = (A-1)×(B-1)=(4-1)×(4-1) = 9 Hata2 SD = A×(r-1)×(B-1 ) = 4×3×3=36 veya Hata2 SD=Genel SD-(Bloklar SD+Sıklık SD+hata1 SD+klon. SD+inter. SD)= = 63-(3+3+9+3+9)= 36 Varyans analizi sonuçları Tablo 13.2'de özetlenmiştir. Tablo 13.2: 4×4 bölünmüş parseller tertibindeki denemenin varyans analizi sonuçları Varyasyon kaynağı Bloklar Sıklıklar Hata1 Klonlar Sıklık×Klon Hata2 Genel KT 103.043 679.981 292.879 SD 3 3 9 KO 34.3477 226.6603 32.5421 F 1.06 6.97* 35.449 67.598 136.265 1315.215 3 9 36 63 11.8163 7.5109 3.7851 3.12* 1.98 141 Burada sıklıkların (A faktörünün) önemliliğinin kontrolunda bölen olarak Hata1 kullanılır. Bu durumda sıklıklara ait: F =226.6603/32.5421= 6.97 bulunur. Bu değer 3’e 9 serbestlik dereceli F tablo değerinden (F0.05=3.86) büyük olduğuna göre sıklıkların %95 güvenle farklı olduğuna veya sıklıkların çap artımına bu düzeyde etkili olduğuna karar verilir. Klonların (B faktörünün) önemliliğinin kontrolunda ise bölen olarak Hata2 kullanılır. Klonlara ait değer de: F= 11.8163/3.7851=3.12 hesaplanır. Bunun için ise 3’e 36 serbestlik dereceli F tablo değerine (F0.05=2.92) bakılır (Tablodan 3'e 30 SD'1i değer alınmıştır). O halde klonlar da %95 güven düzeyinde,farklıdır. Đnteraksiyon için ise: F=7.5109/3.7851=1.98 hesaplanır. Bu değer 9'a 36 serbestlik dereceli F tablo değerinden (F0.05= 2.21) küçük olduğuna göre interaksiyon önemsiz bulunmuştur. Buradan, sıklıkların klonlara göre çap artımına farklı etki yapmadıkları sonucu çıkmaktadır. 13.5.Bölünmüş Parsellerde s X 'in Hesabı Bölünmüş parsellerde sX , ortalamaların ait olduğu işlemin F kontrolunda kullanılan Hata KO üzerinden hesaplanır. Buna göre A faktörü ortalamaları için, sX = Hata1KO r×B (13.1) formülüne göre; B faktörü için, sX = Hata2 KO r× A formülüne göre ve A×B interaksiyonu ortalamaları için: 142 (13.2) sX = Hata2 KO r (13.3) formülüne göre hesaplanır. Bunlar misale uygulanacak olursa: A faktörü ortalamalarına ait s X = 32.5421 =1.426 4× 4 B faktörü ortalamalarına ait s X = 3.7851 =0.486 4× 4 A×B interaksiyonu ortalamalarına ait s X = 3.7851 =0.973 4 bulunur. Buna göre doğrudan s X üzerinden veya bundan hesaplanacak s d üzerinden ortalamalar istenen bir metoda göre mukayese edilebilir. Yukarıdaki formüller, varyans analizindeki F kontroluna paralel olarak, A ve B'ye ait hallerin özel seçilmiş olmasına göredir. 143 l4. KORELASYON VE REGRESYON 14.1.Giriş Bu bölümde, sayılarla ifade edilebilen iki (veya daha fazla) özellik (olay, olgu) arasında bir ilişki (ilgi, bağıntı) olup olmadığı, varsa bunun büyüklüğü, yönü ve aritmetik bir formülle ifadesi üzerinde durulacaktır. Ancak ikiden fazla özellik arasındaki ilişki denilince bunların birbiri ile ilgisi değil, birkaçı ile diğer bir tekinin bağıntısı anlaşılmalıdır. Đlişkinin büyüklüğü bağıntının gücünü, yönü ise olayın biri (veya birkaçı) artarken diğerinin de arttığını veya azaldığını ifade eder. Mesela bir ağacın çapı kalınlaştıkça boyu da uzar veya yaşı arttıkça boyu uzar. Aynı şekilde yaşı arttıkça çapı da kalınlaşır. O halde ağaçlarda çap ile boy, yaş ile boy veya yaş ile çap arasında ilişki vardır. Bu şekilde ikili özellikler birlikte değişim gösterebileceği gibi, yalnız bir tanesi diğerine bağlı, diğerinin sonucu olarak da ortaya çıkabilir. Mesela bir ağacın çapı, boyuna veya boyu, çapına bağlı olarak gelişir. Böyle bir durumda her iki olgu da bir diğerinin sebebi veya sonucu olarak ele alınabilir. Yaş ile boy (veya yaş i1e çap) arasında ise, sadece boyun (veya çapın) yaşa göre ortaya çıktığı, yani boyun (veya çapın) yaşa bağlı olarak geliştiği bir ilişki söz konusudur. Yaşın, ağacın boyuna göre oluştuğu anlamsızdır. Gerek korelasyon, gerekse regresyon bu tür ilişkilerin varlığının, büyüklüğünün ve yönünün sayısal bir ifadesidir. Ancak korelasyon çap-boy misalinde olduğu gibi ilişkinin, yani özelliklerin beraber değişmesinin sayısal bir ölçüsü, regresyon ise özelliklerden birinin diğerine bağlı olarak değişmesinin ve bu değişimin seyrinin aritmetik fonksiyon olarak ifadesidir. Bununla birlikte gerek her iki özelliğin birbirinin sebebi veya sonucu oluşu durumunda, gerekse yalnız birinin diğerine bağlı olarak ortaya çıktığı durumda, hem korelasyon hem de regresyonla ilgili hesaplamalar yapılabilir. Biyolojik olaylarda sıkça raslanan bu tür durumlarda, aralarında ilişki aranan özelliklere değişken (varyabl) denir. Bu değişkenlerden, diğerine (veya diğerlerine) bağlı olarak ortaya çıkana (veya çıktığı kabul edilene bağlı değişken denir ve matematikten hatırlanacağı üzere Y ile gösterilir. Bağımsız olarak gelişme gösteren ve X ile gösterilen ise serbest değişken (bağımsız değişken) olarak adlandırılır. Bu açıklamalardan anlaşılacağı üzere, korelasyon ve regresyona konu olan olaylarda, bir bağlı değişkenle birden fazla serbest değişken arasındaki ilişkiler de söz konusu olabilmektedir. Mesela bir ağacın hacmının; çapına ve boyuna göre değişimi gibi. Bu gibi durumlarda çoğul korelasyon ve çoğul 144 regresyon'dan söz edilir. Bu bölümde önce iki değişken arasındaki ilişkiye ait basit korelasyon ve regresyon açıklanacak, daha sonra eğrisel ve çoğul regresyonlar incelenecektir. 14.2.Basit Korelasyon ve Regresyon 14.2.1.Basit Korelasyon Yukarıda kısaca açıklanan korelasyon, korelasyon katsayısı denilen, -1 ile +1 arasında değişen ve r ile gösterilen bir sayı ile ifade edilir. Basit korelasyon katsayısı ile iki değişken arasında belirgin (önemli, signifikant) bir ilişki olup olmadığı, varsa büyüklüğü ve yönü anlaşılabilir. 14.2.1.1.Korelasyon Katsayısının Hesabı X ve Y gibi iki karakter arasındaki ilişkiye ait korelasyon katsayısı: r= Σxy Σx 2 × Σy 2 (14.1) formülü ile hesaplanır. Burada Σxy çarpımlar toplamı olarak adlandırılır ve; Σxy=ΣXY- ΣX × ΣY n (14.2) formülü ile hesaplanır. Formülden anlaşılacağı üzere çarpımlar toplamı, X ve Y varyantlarının çarpımlarının toplamından, bunların toplamlarının çarpımının varyant çifti sayısına (n) bölümünü çıkarmakla hesaplanmaktadır. Korelasyon ve regresyon hesabında n, X ve Y değişken çifti sayısıdır. (14.1) nolu formülde görülen Σx2 ve Σy2 terimleri, önceki konulardan hatırlanacağı üzere X ve Y değişkenlerine ait kareler toplamlarıdır. Misal 14.1: Bir ağacın çapı ile boyu arasındaki ilişkiye ait korelasyon katsayısını hesaplayalım: Bir meşcerede yapılan örnekleme ile ölçülen 15 adet ağacın çap ve boyları Tablo 14.1'de verilmiştir. Misalde çaplar X, boylar Y olarak dikkate alınmıştır. Tabloda ayrıca, çarpımlar ve kareler toplamları için gerekli hesaplar da yapılarak ilgili sütunlarda gösterilmiştir. 145 Tablo 14.1. Bir meşcerede rastgele örneklenen 15 ağacın çap-boy ölçüleri Sıra No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 B Çap (X) cm 4.5 8.1 11.1 8.8 13.1 7.5 6.7 9.2 5.4 6.2 9.5 7 10.2 4.9 11.8 124 Boy (Y) m 7.9 11.5 14.5 12.5 15 10.5 10 13.5 9.8 10 13.5 11 13 8.4 14.3 175.4 X×Y 35.55 93.15 160.95 110 196.5 78.75 67 124.2 52.92 62 128.25 77 132.6 41.16 168.74 1528.77 X2 20.25 65.61 123.21 77.44 171.61 56.25 44.89 84.64 29.16 38.44 90.25 49 104.04 24.01 139.24 1118.04 Y2 62.41 132.25 210.25 156.25 225 110.25 100 182.25 96.04 100 182.25 121 169 70.56 204.49 2122 ΣXY=1528.77, ΣX=124, ΣY=175.4 olduğuna göre (14.2) nolu formüle göre çarpımlar toplamı: Σxy= 1528.77- 124 × 175.4 =78.797 15 ΣX2=1118.04, ΣX= 124 olduğuna göre X’lere ait kareler toplamı: Σx2=1118.04- 124 2 =92.973 15 ΣY2=2122, ΣY= 175.4 olduğuna göre Y’lere ait kareler toplamı: Σy2=2122- 175.4 2 =70.989 bulunur. 15 Buradan (14.1) nolu formüle göre korelasyon katsayısı: r= 78.797 =0.97 hesaplanır. 92.973 × 70.989 146 14.2.1.2.Korelasyon Katsayısının Standart Hatası, Önemliliğinin Kontrolu ve Güven Sınırları Nümuneden hesaplanan her değer gibi, r de bir istatistiktir ve bir standart hatası vardır. r'nin standart hatası, sr= 1− r2 n−2 (14.3) formülüne göre hesaplanır. Basit korelasyon katsayısının serbestlik derecesi n2'dir. r'nin hesabında X ve Y gibi iki karaktere ait ortalamalar kullanıldığından, gözlem çifti sayısı n'den 2 düşülmektedir. Yukarıdaki misalde bulunan r=0.97'nin standart hatası hesaplanacak olursa: sr= 1 − 0.97 2 =0.0674 15 − 2 bulunur. O halde örneğin korelasyon katsayısı r=0.97±0.0674 olarak verilmelidir. Diğer standart hatalarda olduğu gibi sr de r'nin önemliliğinin kontrolunda kullanılır: Bu kontrol bir bakıma r'ye ait hipotezin kontroludur. Burada sıfır hipotezi “X ve Y gibi iki karakter arasında (yani çap ile boy arasında) ilişki olmadığı” veya “r'nin sıfır olduğu” şeklindedir. Kontrol sonunda bu hipotez kabul veya reddedilir. Söz konusu kontrol, aşağıdaki formüllere göre hesaplanan t istatistiği üzerinden yapılır: t= r sr veya t= r n−2 1− r2 (14.4) Bu formüllere göre hesaplanan değer, n-2 serbestlik dereceli t tablosu değerleri (Ek Tablo 2) ile karşılaştırılarak r'nin önemliliğine karar verilir. Misal 14.1'de 0.97 olarak hesaplanan r'ye ait t değeri hesaplanacak olursa: t=0.97/0.0674=14.392 bulunur. 15-2=13 serbestlik dereceli tablo değerleri t0.05=2.16, t0.01=3.012 ve t0.001=4.221'dir. Hesaplanan değer, 0.001 olasılık için verilenden bile fazlasıyla büyük olduğuna göre, sıfır hipotezi reddedilerek X ve Y karakterleri arasında (bu misale göre ağaçların çapları ile boyları veya boyları ile çapları arasında) 0.001 olasılığın çok üzerinde bir ilişki olduğu sonucuna varılır. 147 r'nin önemliliğinin kontrolunda, Ek Tablo 7'de verilen özel değerler de kullanılabilir. Bu tabloda r'nin SD'ne göre, 0.05 ve 0.01 olasılık için, 4 bağımsız değişkene göre sınır değerler verilmiştir. Serbestlik derecesine göre bu tablo değerlerini aşan r değerleri. o olasılıkta önemli sayılır. Basit korelasyonda r bir bağımsız değişken üzerinden hesapladığı için, bu tabloya göre, 13 serbestlik dereceli bir r değerinin 0.514'ten büyük olması halinde 0.05 olasılıkta, 0.641'den büyük olması halinde ise 0.01 olasılıkta önemli olduğu kabul edilir. Misalde r=0.97 hesaplandığına göre, yukarıdaki sonuca paralel olarak bu değerin 0.01'in çok üzerinde önemli olduğu ortaya çıkar. sr üzerinden r'nin güven sınırları da hesaplanabilir. Misal 14.1'de hesaplanan r’nin güven sınırları %99 güvenle: r-(t×sr)<r<r+(t×sr) 0.97-(3.012×0.0674)<r<0.97+(3.012×0.0674) 0.767<r<1.173 olarak verilir. 14.2.1.3.Korelasyon Katsayısının Özellikleri Korelasyon katsayısı birimi olmayan soyut bir sayıdır. Çünkü hesaplanmada, ölçü birimleri farklı olabilen X ve Y gibi iki karakterin çarpımı kullanılır. Korelasyon katsayısının işareti - veya + olabilir. Regresyon konusunda etraflıca açıklanacağı üzere, X ve Y değerleri bir koordinat sistemine noktalandığında, X değerleri büyüdüğünde Y değerleri de büyüyorsa r'nin işareti + (pozitif), küçülüyorsa - (negatif) olur. Bu bakımdan, ilk halde pozitif korelasyon, ikinci halde ise negatif korelasyondan bahsedilir (Şekil 14.1). Yukarıdaki misalde r’nin işareti + olduğuna göre, çap ile boy arasında pozitif bir korelasyon vardır. Korelasyon katsayısı daima -1 ile +1 arasında bir değer alır. X ve Y değerleri bir koordinat sistemine aktarıldığında, ortaya çıkan noktaların tamamı yükselen bir doğru üzerinde yer alırsa (Şekil 1.4.5) r=l, alçalan bir doğru üzerinde yer alırsa r=-1 olur. Böyle hallerde karakterler arasında tam bir ilişki var demektir (Matematik ilişki). Noktaların X eksenine paralel bir doğru üzerinde yer almaları halinde ise r=0 olur (Şekil 14.1). Noktaların doğrudan sapmaları (doğru üzerinde yer almamaları) halinde r, mutlak değer itibariyle 1'den küçük değerler alır. Sapmalar ne kadar fazlaysa, r de sıfıra o kadar yaklaşır. Noktaların her hangi bir diziliş meydana getirmeyerek, koordinat sisteminde bir daire oluşturacak şekilde rastgele serpilmeleri veya X eksenine paralel bir doğru oluşturacak şekilde dizilmeleri halinde ise r sıfıra yakın bir değer alır. Bu durumda, iki karakter arasında ilişki yok demektir. Konumuzu teşkil eden biyolojik olaylarda, mutlak değer itibariyle r=1 olarak hesaplanan bir ilişki bulunması imkansızdır. 148 r>0 r=0 r<0 4 3 2 1 0 0 1 2 3 4 5 6 Şekil 14.1: Korelasyon katsayısının pozitif, negatif ve sıfır olması halleri 14.2.2.Basit Doğrusal Regresyon Đstatistikte regresyon, daha önce tanımlandığı gibi, biri diğerine (veya diğerlerine) bağlı olarak gelişen ve sayılarla ifade edilebilen iki (veya daha fazla) karakter (olay, özellik) arasındaki ilişkinin aritmetik fonksiyon olarak ifadesidir. Mesela ağaçta yaş hacım ilişkisi gibi. Bir ağacın hacmı, yaşına bağlı olarak artar ve bu artış yaşa bağlı bir fonksiyon olarak ifade edilebilir. Böyle iki özellikten serbestçe değer alan karaktere (mesela yaş), serbest değişken veya bağımsız değişken, buna bağlı olarak değer alan diğer değişkene (mesela hacım) de bağlı değişken dendiğini ve serbest değişkenin adet olduğu üzere X, bağlı değişkenin de Y ile gösterildiğini belirtmiştik. Hatırlanacağı üzere matematikte böyle bir ilişki, Y=a+bX (14.5) formülü ile gösterilebilir. Burada Y değişkeni X'in alacağı değerlere göre değer alır. Mesela konu bir yaş-hacım ilişkisi ise bu eşitlik: Hacım=a+b×(yaş) anlamındadır. Formülde Y, X'in fonksiyonu olduğundan, bu eşitlikler fonksiyon olarak da adlandırılır. Đşte regresyon başlığı altında incelenecek konu, biyolojik olaylarda iki veya daha fazla karakter arasındaki sebep-sonuç ilişkilerinin böyle bir eşitlik halinde ifade edilmesi ve bu eşitliğin öneminin (geçerliliğinin) belirlenmesidir. Regresyonlar serbest değişken sayılarına göre basit ve çoğul regresyonlar olarak sınıflanabildiği gibi, koordinat sisteminde çizdikleri grafiğe göre doğrusal ve eğrisel regresyonlar olarak da sınıflanabilir. Basit doğrusal regresyon, regresyon eşitliklerinin en basiti olan ve Y=a+bX denklemi ile ifade edilen halidir. Bu denklemin özellikleri aşağıda açıklanmıştır. 149 14.2.2.1.Y=a+bX Denkleminin Özellikleri Y=a+bX gibi bir eşitlikte, X değişkeninin eşit artışlarına karşılık, Y değişkeni de eşit artışlar gösterir. Bu bakımdan bu eşitlik, bir doğru denklemidir. Bilindiği gibi denklemler, bir koordinat sisteminde grafik olarak gösterilebilir. Örnek olarak Y=2+2X denkleminde X'e: 0 verildiğinde Y=2+(2×0)=2, 1 verildiğinde Y=2+(2×1)=4, 2 verildiğinde Y=2+(2×2)=6, 3 verildiğinde Y=2+(2×3)=8 ... vs olmaktadır. Demek ki X'teki 1 birimlik artış, Y'de 2 birimlik artışa sebep olmaktadır. Bunlar Şekil 14.2'deki gibi bir koordinat sisteminde noktalanacak olursa, Y eksenini 2 noktasında kesen ve belli bir eğimle yükselen bir doğru ortaya çıkar. Burada doğrunun Y eksenini kestiği noktayı belirleyen a değerine (misalde a=2’dir) konstant (sabite) denir. a değeri pozitif olduğu gibi, Y=-2X eşitliğindeki gibi sıfır veya Y= -2+2X eşitliğindeki gibi negatif de olabilir (Şekil.14.2). 14 12 10 8 6 4 2 0 -2 Y= -2+2X Y=2X Y=2+2X 0 1 2 3 4 5 6 Şekil 14.2: Regresyon doğrusunun Y eksenini farklı noktalarda kesmesi (a'nın pozitif, sıfır ve negatif olması halleri) Y=2+3X eşitliğinde ise X'teki 1'er birimlik artışa karşılık Y, 3'er birimlik artış gösterir. Şekil 14.3'te görüleceği üzere, bu durumda daha dik (meyli daha fazla) bir doğru ortaya çıkar. Y=2+X gibi bir eşitlik ise daha yatık bir doğru belirler (Şekil 14.3). Denklemde X'in önünde yer alan, b ile gösterilen ve doğrunun eğimini belirleyen bu katsayıya da regresyon katsayısı denir. b'nin değeri de pozitif veya negatif olabilir. Pozitif olması halinde X'in artışına göre yükselen bir doğru (pozitif meyil-pozitif ilişki), negatif olması halinde ise alçalan bir doğru (negatif meyil-negatif ilişki) söz konusudur. Y=4 gibi meylin sıfır olduğu (bu durumda b=0'dır) bir eşitlikte ise X eksenine paralel bir doğru çizilir (Şekil 14.4). 150 a ve b katsayıları, Y değişkeni ile aynı ölçü birimine sahiptir. Y=-2+X Y=2+2X Y=2+3X 20 15 Y=4-X Y=4 Y=4+X 10 8 6 10 4 5 2 0 0 0 1 2 3 4 5 -2 0 6 1 Şekil 14.3: Regresyon katsayısının büyüklüğüne göre doğrunun eğimi 2 3 4 5 Şekil 14.4: Regresyon katsayısının pozitif, negatif ve sıfır olması hallaeri 14.2.2.2.Matematik Eşitlik ve Regresyon Eşitliği Đki değişkene ait X ve Y değerlerinden oluşan veri çiftlerine ait noktalar bir koordinat sistemine yerleştirildiğinde (serpilme diyagramı), noktalar düz bir çizginin üzerinde yer alırsa, bu iki değişken arasında matematik eşitlik var demektir. Mesela dairede çevre=π×çap şeklinde bir ilişki vardır. Tam ilişki denilen bu tür ilişkilere ancak matematik, fizik olaylarda rastlanır. Biyolojik olaylarda ise, genellikle noktaların bir doğru etrafında rastgele serpildiği ilişkiler görülmektedir (Şekil 14.5). Bunun sebebi, daha önce de açıklandığı gibi, biyolojik olayların sonsuz sayıda faktörün etkisi altında gelişme göstermeleridir. Her ne kadar bu tür olayların belli kanuniyetleri varsa da, çeşitli etkiler yüzünden seyirlerinde sapmalar olmaktadır. 4 25 Matematik eşitlik Regresyon eþitliði 20 15 3 2 10 1 5 0 0 0 1 2 3 4 5 0 2 4 6 8 Şekil 14.5: Matematik eşitlik ve regresyon eşitliğinde noktaların doğruya uyumu 151 10 Đşte sonsuz sayıda etki altında gelişme gösteren iki tesadüf değişkeni (değişkenlerden yalnız biri de tesadüf değişkeni olabilir) arasındaki ilginin belli kurallara göre aritmetik bir denklem halinde hesaplanmış haline regresyon eşitliği denir (Çap-boy örneğinde değişkenlerin her ikisi de tesadüf değişkeni, yaş-boy örneğinde ise yalnız boy tesadüf değişkenidir). Tanımdan anlaşılacağı gibi, regresyon eşitlikleri matematik bir tahmindir. Bu eşitliklerde, aritmetik ilişkilerdeki %100 kesinlik yoktur. Regresyon eşitlikleri vasıtasıyla, serbest değişken olarak ele alınan bir (veya bir kaç) özelliğe göre, buna bağlı ortaya çıkan ikinci bir özellik belli ihtimaller çerçevesinde sayısal olarak tahmin edilir. Regresyon eşitliğinde bir hata payı vardır. Bu hata unsurunu, yukarıda sözü edilen sonsuz sayıda etki oluşturur. Bunu belirtmek üzere, regresyon eşitliği aritmetik eşitlikten farklı olarak Y=a+bX+ε veya Yˆ =a+bX şeklinde de ifade edilir. Regresyon eşitliğinin hesabında en küçük kareler metodu kullanılmaktadır. Bu metoda göre a ve b katsayıları hesaplanarak, gözlem değerlerine en iyi uyan hat (doğru) bulunur. Çizilen doğrudan, X-Y noktalarının düşey uzaklıklarının kareleri en küçük olduğu için metoda bu isim verilmiştir (Şekil 14.7). Başka bir metoda göre bu noktalara regresyon doğrusundan daha yakın bir doğru çizilemez. 14.2.2.3.Regresyon Eşitliğinin Hesabı Regresyon eşitliği, regresyon katsayısının (b) ve a sabitesinin hesaplanmasıyla bulunur. Bunlar, b= Σxy Σx 2 (14.7) a= Σy ΣX -b× n n (14.8) formüllerine göre hesaplanır. Bilindiği gibi formüllerde: Σxy=çarpımlar toplamı, Σx2=X kareler toplamı, ΣY/n=Y değerlerinin aritmetik ortalaması, ΣX/n=X değerlerinin aritmetik ortalamasıdır. b ve a'nın hesabını bir misal üzerinde açıklayalım: Misal 14.2: Bir ağacın göğüs çapı-hacım ilişkisi belirlenmeye çalışılmaktadır. Bu amaçla, göğüs çapları 10 cm'den kalın rastgele 17 ağacın çapları ölçülmüş ve uygun bir yöntemle kabuklu gövde hacımları 152 hesaplanmıştır. Sonuçlar Tablo 14.3'de verilmiştir. Ayrıca hesaplamalar için gerekli olan, varyantların çarpımları, kareleri ve bunların toplamları da tabloda verilmiştir. Tabloda 1'den 17'ye kadar sıralı çaplar serbest değişıken (X), her çapa ait hacımlar ise bağlı değişken (Y) olarak ele alınmıştır. Tablo incelendiğinde hacmın çapa bağlı olarak sürekli artış gösterdiği, dolayısıyla iki karakter arasında pozitif bir korelasyon olduğu açıkça görülmektedir. O halde bu ilişki, bir regresyon denklemi halinde yazılabilir: Tablo 14.3: 17 adet P. radiata ağacının göğüs çapı–hacım ölçüleri Hacım (dm3) Sıra Çap (X) No (cm) 1 10.2 2 11.7 3 12.5 4 13.1 5 14.1 6 14.8 7 15.5 8 16.2 9 16.3 10 17.8 11 18.7 12 19.7 13 20.6 14 21.1 15 22.1 16 22.6 17 23 Σ 290 Hacım (Y) (dm3) 29 41 51 62 74 87 99 116 129 147 167 186 209 231 255 279 307 2469 X2 104.04 136.89 156.25 171.61 198.81 219.04 240.25 262.44 265.69 316.84 349.69 388.09 424.36 445.21 488.41 510.76 529 5207.38 Y2 X×Y 841 295.8 1681 479.7 2601 637.5 3844 812.2 5476 1043.4 7569 1287.6 9801 1534.5 13456 1879.2 16641 2102.7 21609 2616.6 27889 3122.9 34596 3664.2 43681 4305.4 53361 4874.1 65025 5635.5 77841 6305.4 94249 7061 480161 47657.7 350 300 250 200 150 100 50 0 9 12 15 18 Çap (cm) 21 24 Şekil 14.6: Tablo 14.3'deki verilere ait serpilme diyagramı ve bunlardan geçen Y=a+bX doğrusu 153 Σxy= ΣXY- Σx2=ΣX2- ΣX × ΣY 290 × 2469 =47657.7=5539.47 n 17 (ΣX ) 2 290 2 =260.32 =5207.38n 17 b= Σxy =5539.47/260.32=21.28 Σx 2 a= 2469 290 -21.28× =-217.8 17 17 hesaplanır. Demek ki bu örnekte çap-hacım ilişkisine ait regresyon denklemi: Y=-217.8+21.28X şeklinde hesaplanmıştır. Serpilme diyagramıyla beraber bunun bir koordinat sisteminde çizilmiş hali Şekil 14.6'da gösterilmiştir. Bu çizim, denklemde iki adet X'e karşılık hesaplanan Y değerlerinin bir koordinat sistemine aktarılıp, elde edilen iki noktanın birleştirilmesiyle kolaylıkla yapılabilir. Mesela regresyon eşitliğinde: X yerine 10 koyulursa Y=-217.8+21.28×10= -5 dm3, 20 koyulursa Y=-217.8+21.28×20=207.8 dm3 bulunur. Görüldüğü üzere, burada 10'dan küçük X değerleri için eksi değerler elde edilmektedir. Teorik olarak böyle bir şeyin olamayacağı açıktır. Bu ağaçlar 10 cm'den ince ise, hacımları eksi olamaz. Bu durum hesaplanan eşitliğin özelliğinden ileri gelmekte ve ilerki konularda değinileceği üzere çap-hacım ilişkisini iyi temsil etmediğini göstermektedir. b katsayısı doğrunun eğimi, yani X değerlerindeki 1 birimlik artışa karşılık Y değerlerindeki artış olduğuna göre, doğrunun eğimi 21.28'dir. Bu değer incelenen ağaçların her yı1 ortalama 21.28 dm3 hacım artımı yaptığı anlamına gelir. a katsayısı ise -217.8 bulunmuştur. Demek ki regresyon doğrusu Y eksenini -217.8 noktasında kesmektedir. Bu değer de, ağacın 0 çapındayken -217.8 dm3 hacmında olduğu anlamını taşır. Ancak yukarıda izah edildiği üzere bu durum gerçeği yansıtmamaktadır. Regresyon denklemi bilindikten sonra, istenen X değerine (burada çap) karşı gelen Y değeri (burada hacım) hesaplanabilir. Mesela 23 cm çaptaki bir ağacın hacmı: Y=-217.8+21.28×23=271.6 dm3 bulunur. Halbuki örneklemede 23 cm çaptaki ağacın hacmı 307 dm3 ölçülmüştür. Böylelikle regresyon denklemi yoluyla hesaplanan değerlerin birer tahmin olduğu ve bir hata payına sahip oldukları ortaya çıkmaktadır. 154 Regresyon denkleminden hesaplanan değerlere beklenen değer veya teorik değer de denir. Bu değerler, bağlı değişkenle aynı ölçü birimine sahiptir. Regresyon eşitliği üzerinden, gözlem değerlerinin dışına ait ekstrapolasyon denen tahminlerde de bulunulabilir. Mesela bu ağaçların 30 cm çaptaki hacmı Y=-217.8+21.28×30=420.6 dm3 olarak tahmin edilebilir. Ancak ekstrapolasyon işlemine fazla güvenilmemelidir. Çünkü regresyon eşitliği, gözlemlenen X değerleri aralığı için geçerlidir. Bu sahadan uzaklaşıldıkça ilişkinin nasıl bir seyir göstereceği bilinmemektedir. 10-23 cm çaplar arasında burada olduğu gibi bir doğru parçası ile temsil edilebilen bir çap-hacım ilişkisi, belki daha sonraki yıllarda eğrileşecektir. Bu durumda ilişkinin başka bir formül (regresyon modeli) ile ifade edilmesi gerekebilir. Esasen misalde gözlenen olayın bir doğru ile temsil edilebileceği de şüphelidir. Eşitliğin 10 cm çapın altında eksi değerler vermesi ve grafikte noktaların seyrinin bir doğrudan çok eğriyi andırması bu şüpheleri doğrulamaktadır. Bu bakımdan ekstrapolasyon yapılırken örneklenen serbest değişkenlerden fazla uzaklaşılmamalıdır. 14.2.2.3.1.b ve a'nın Standart Hatası, Önemliliği ve Güven Sınırları Bilindiği gibi basit doğrusal regresyon, b ve a katsayılarıyla ifade edilmektedir. b ve a birer tahmindir ve hata payına sahiptir. Bir toplumdan n adetli çok sayıda örnek alınsa ve b ile a katsayıları hesaplansa, bunlar ortalamaları β ve α, varyansları ise σb2 ve σa2 olan birer normal dağılım gösterir. σb2 ve σa2 örnekten hesaplanan sb2 ve sa2 üzerinden tahmin edilir. Bu iki varyans arasında: sb2 sa2 = ΣX 2 (14.9) n şeklinde bir ilişki vardır. Bu ilişki hesapların doğruluğunu denetlemede kullanılabilir. Varyansların kare kökleri ise standart hatalarını verir. b ve a'nın standart hataları ve güven sınırları aşağıdaki gibi hesaplanabilir. 14.2.2.3.1.1. b Katsayısının Standart Hatası, Önemliliği ve Güven Sınırları Regresyon katsayısının varyansı, Σy − 2 2 sb = ( Σxy) 2 Σx 2 n−2 Σx 2 155 = sd2 Σx 2 (14.10) formülüne göre hesaplanır. Bu formülün payında yer alan, Σy 2 ( Σxy ) 2 terimi, Σx 2 14.2.2.4 maddesinde izah edileceği ve Tekil 14.7'den anlaşılacağı üzere regresyondan ayrılışların kareleri toplamıdır (Σd2) Bu terim gözlenen Y değerlerinin, regresyon doğrusundan uzaklıklarının kareleri toplamını ifade eder. sd2 ile gösterilen regresyondan ayrılış kareleri ortalaması, başka bir ifadeyle regresyonun varyansı ise, ayrılış kareleri toplamını kendi serbestlik derecesi n-2'ye bölmekle bulunur. Misal 14.2'ye göre bu terimler aşağıdaki gibi hesaplanır: Σy2=480161- 2469 2 17 =121575.1 Madde 1.4.2.2.3'te Σxy=5539.47 ve Σx2=260.32 olarak hesaplandığına ve (14.10) nolu formülün payına göre 1215751 . − s d2= 5539.47 2 260.32 =246.54 17 − 2 sb2=246.54/260.32=0.9471 ve sb=0.973 dm3 bulunur. Demek ki bu populasyondan çekilen 17 bireylik örnekler üzerinden hesaplanan basit doğrusal regresyona ait her b katsayısı 0.973 dm3 hata payına. sahiptir. Regresyon katsayısının önemliliği, t= b sb (14.11) formülüyle hesaplanan t değerini, n-2 serbestlik dereceli t tablo değeri (Ek Tablo 2) ile karşılaştırmakla kontrol edilir. Misal 14.2 için, t=21.28/0.973=21.87 hesaplanır. t tablosuna bakılacak olursa, 17-2=15 SD'li t0.05=2.131, t0.01=2.947 ve t0.001=4.073 okunur. Hesaplanan değer bunların hepsinden de büyük olduğuna göre, regresyon katsayısının %99.9’un üzerinde önemli olduğuna veya başka bir ifadeyle çap ile hacım arasında %99.9 güven düzeyinde bir ilişki olduğuna hükmedilir. Konu sıfır hipotezi üzerinden açıklanacak olursa, “b=0” olduğuna dair hipotez reddedilerek, “b’nin %99.9 güven düzeyinde sıfırdan farklı olduğu” söylenir. 156 Regresyon katsayısının güven sınırları ise, b-(t×sb)<b<b+(t×sb) formülü yardımıyla ve %99.9 güvenle, 21.28-(4.073×0.973)<b<21.28+(4.073×0.973) 17.32 dm3<b<25.24 dm3 hesaplanır. 14.2.2.3.1.2. a Katsayısının Standart Hatası ve Güven Sınırları a katsayısının varyansı aşağıdaki formüle göre hesaplanabilir: ΣX 2 sa = sd nΣx 2 2 2 (14.12) Bunun kare kökü a'nın standart hatasını verir. Madde 14.2.2.3.1.1'de sd2=246.54, Σx2=260.32 olarak bulunduğuna göre, Tablo 14.3’ten ΣX2=5207.38 olarak alınıp, Misal 14.2'ye göre a’nın standart hatası: sa2=246.54 5207.38 =290.1 ve sa=17.03 bulunur. 17 × 260.32 Bu durumda denetlenebilir: sb2 sa2 = ΣX 2 n (l4.9) nolu formüle göre, hesapların doğruluğu 290.1 5207.38 = =306.3 0.9471 17 a katsayısının önemliliği de, a (14.13) sa formülüne göre hesaplanan n-2 SD'li t değeri üzerinden kontrol edilir. Yine Misal 14.2 için, a katsayısına ait, t=-217.8/17.03=12.79 bulunur. t değerleri mutlak değer itibariyle dikkate alındığından ve bu değer 15 SD'li t'lerin hepsinden büyük olduğundan, “a'nın %99.9 üzerinde bir güvenle 0’dan ,farklı olduğu” söylenecektir. t= 157 a'nın güven sınırları ise, a-(t×sa)<a<a+(t×sa) formülü yardımıyla ve %99.9 güvenle, -217.8-(4.073×17.03)<b<-217.8+(4.073×17.03) -287.2 dm3<a<-148.4 dm3 hesaplanır. 14.2.2.4.Regresyonda Varyans Analizi ve Regresyonun Varyans Analizi ile Kontrolu Y-a+bX denklemi ile ifade edilen basit doğrusal regresyonda, regresyon katsayısı b’nin önemliliğini kontrol etmekle regresyonun önemliliği de kontrol edilmiş olur. b ne derecede önemli ise, regresyon da o derecede önemli demektir. Ancak ileride ele alınacak olan ve birden fazla serbest değişken bulunduran hallerde durum farklıdır Bu gibi hallerde her serbest degişkene ait bir regresyon katsayısı hesaplanır. Her ne kadar bütün regresyon katsayılarının önemliliği, kendilerine ait standart hataları üzerinden t değerleri ile kontrol edilebilirse de, bazı hallerde bunların sonucu dikkate alınmayabilir. Çünkü regresyonun modeli (formül tipi) önceden bellidir ve araştırmacı, aradığı ilişkiyi bu formülle ifade etmek durumundadır. Mesela yaşa göre ağaçların boy büyümesi: Y=a+b1X+b2X2+b3X3 şeklinde 3. derece polinomu denilen ve S eğrisi çizen bir eşitlikle ifade edilmektedir. Burada hesaplanan ve b1, b2, b3 ile gösterilen regresyon katsayılarının bazıları t kontroluna göre önemsiz görünebilir. Ancak önemsiz diye dikkate alınmamaları ve atılmaları gerekmez. Đlişki mutlaka yukarıdaki formülle ifade edilmelidir. Regresyon modelinin bilinmediği hallerde ise, en uygun modeli bulmak için bir çok model denemek lüzumu hasıl olabilir. Uygulanan bir modele göre katsayılar yeteri kadar önemli çıkabilir. Ancak muhtemelen başka bir fonksiyon tipi olayı çok daha iyi temsil edebilir. Mesela Misal 14.2'de doğru ile temsil edilen ilişki, belki bir eğriye (bir parabol parçasına) çok daha iyi uyum sağlayabilir. Đşte böyle durumlarda, teker teker regresyon katsayılarının önemliliğinin yanında, tüm regresyonun önemliliğine de bakmak gerekir. Tüm regresyonun önemi, ancak varyans analizi ile kontrol edilebilir. Bir regresyon varyans analizinde genel kareler toplamı: • regresyon kareleri toplamı ve • regresyondan ayrılış (hata) kareleri toplamından oluşur. Şekil 14.7'de görüleceği üzere regresyonda genel kareler toplamı, her bir Y değerinin, Y değerleri ortalamasından ( Y ’dan) farklarının (y'lerin) 158 kareleri toplamıdır. Regresyon kareleri toplamı, her X'e karşılık regresyon eşitliğinden hesaplanan değerlerin ( Yˆ olarak gösterilen değerlerin), Y 'dan farklarının ( ŷ ile gösterilen değerler) kareleri toplamıdır. X,Y Y d y Y$ y$ X ,Y Y X X Şekil 14.7: Regresyona ait varyans analizinde varyasyon kaynakları Regresyondan ayrılış kareleri toplamı ise, Y değerlerinin kendi ile gösterilen izdüşümlerindeki regresyon değerlerinden ( Yˆ değerlerden)farklarının (d ile gösterilen değerler) kareleri toplamıdır. Buna, hata kareleri toplamı da denir. Regresyondan ayrılışlar, noktaların regresyon doğrusuna düşey, uzaklıklarıdır. Bu bakımdan adından da anlaşıldığı gibi, noktaların doğrudan sapmalarını, uzaklaşmalarını ifade eder. Sapmalar ne kadar fazla ise ilişki o kadar zayıf (hatta yok), ne kadar az ise o kadar kuvvetlidir. Noktaların tamamının doğru üzerinde yer almaları halinde ise daha önce de belirtildiği gibi ilişki tamdır. Aşağıda varyans analizinde görüleceği gibi, regresyondan ayrılışların küçük olması halinde, regresyona ait kareler toplamı büyür. Bu durum, regresyonun (ilişkinin) önemliliğine delalet eder. Örneğin Misal 14.2’de 23 cm çapta hacım Y=307 dm3 ölçülmüştür. O halde (X=23, Y=307) noktasında varyasyon aşağıdaki gibidir: Y =2469/17=145.2 olduğuna göre genel ortalamadan ayrılış, y=Y- Y =307-145.2=161.8 dm3. X=23 noktasındaki regresyon değeri Yˆ =-217.8+21.28×23=271.6 olduğuna göre regresyona ait unsur, ŷ = Yˆ - Y =271.6-145.2=126.4 dm3. Bu noktada regresyondan ayrılış ise, 159 d=Y- Yˆ =307-271.6=35.4 dm3 bulunur. Demek ki bu noktadaki 161.8 dm3'lük genel ayrılışın 126 dm3'ü regresyona, 35.4 dm3’ü regresyondan ayrılışa ait olmaktadır. Burada arzu edilen, regresyondan ayrılışların mümkün olduğu kadar küçük tutulmasıdır. Regresyonda varyans analizine ait kareler toplamları, aşağıdaki formüllere göre hesaplanır: Genel KT=Σy2= ΣY2- Regresyon KT= (ΣY ) 2 n (14.14) (Σxy ) 2 Σx 2 (14.15) Regresyondan ayrılış (hata) KT=Σd2=Genel KT-Regresyon KT (14.6) Hatırlanacağı üzere 14.2.2.3.1.1 Maddesinde regresyondan ayrılış kareleri toplamına ilişkin özel formül de verilmiştir. Varyasyon kaynaklarının serbestlik dereceleri ise: genele ait: n-1 regresyona ait: 1 hataya ait: n-2’dir. Varyans analizini Tablo 14.3'deki misale uygulayalım: Daha önce Σy2=121575.1, Σxy=5539.47 ve Σx2=260.32 olarak hesaplandığından, regresyon KT=5539.472/260.32=117876.9 hata KT=121575.1-117876.9=3698.2 bulunur. Serbestlik dereceleri de: genele ait: 17-1=16, regresyona ait: 1, hataya ait: 17-2=15'dir. Buna göre regresyon varyans analizi Tablo 14.4'te özetlenmiştir. Tablo 14.4: Regresyon varyans analizi Varyasyon Kaynağı Regresyon Hata Genel KT 117876.9 3698.2 121575.1 SD 1 15 16 Regresyonun önemliliğinin kontrolu, 160 KO 117876.9 246.55 F 478.11*** F= Re gresyon KO Hata KO (14.17) üzerinden yapılır. Tabloda görüldüğü üzere F=478.11 hesaplanmıştır. Regresyonun serbestlik derecesi 1, hatanın serbestlik derecesi 15 olduğuna göre, 1 ve 15 SD'li F tablo değerlerine (Ek Tablo 4) bakılacak olursa, F0.05=4.54, F0.01=8.68 ve F0.001=16.57 oldukları görülür. Hesaplanan değer bunlardan fazlasıyla büyük olduğuna göre, regresyonun (çap-hacım ilişkisinin) 0.001 olasılıkla önemli olduğuna hükmedilir. Burada önemliliği kontrol edilen hipotez “Regresyonun önemsiz olduğu” veya "Yaş ile boylanma arasında bir ilişki bulunmadığı” şeklindedir. O halde hipotezi reddetmek gerekecektir. Dikkat edileceği üzere, varyans analizi i1e bulunan sonuç, regresyon katsayısının önemliliği ile aynı paralelde çıkmıştır. 14.2.2.5.Regresyonun Varyansı ve Standart Sapması Daha önce belirtildiği gibi, bir populasyondan rastgele çekilmiş n birimlik bir örnek üzerinden hesaplanmış regresyon denklemi bir ortalamadır. Ölçülen değişkenlere ait değerler bir koordinat sistemine çizilmiş regresyon doğrusu etrafında dağılırlar (Şekil 14.6). Bu dağılım, noktaların regresyon doğrusundan X eksenine dik yöndeki uzaklıkları ile ölçülür (Şekil 14.7’de d ile gösterilen fark değerler) ve varyansı, belirtilen ölçülerin kareleri toplamını, serbestlik derecesine bölmekle bulunur (Bak Madde 14.2.2.3.1.1 ve 14.2.2.4): sd2 = Σ(Y − Yˆ ) 2 Σd 2 = n−k n−k (14.18) Bir regresyonda kareler toplamının serbestlik derecesi, nokta sayısından (n), regresyondaki serbest değişken adedinin 1 fazlasını (k) çıkarmakla bulunur. Basit doğrusal regresyonda bir tek serbest değişken olduğu için k=2'dir. Yukarıdaki tanım ve formülden bir kere daha anlaşılacağı üzere, regresyon eşitliğinin varyansı, regresyon varyans analizinde açıklanan hata kareler ortalamasıdır (Tablo 14.4). (14.18) nolu formül ile ifade edilen sd2 basit doğrusal regresyonda aşağıdaki formüle göre de hesaplanabilir: sd2 = ΣY 2 − aΣY − bΣXY n−2 161 (14.19) Regresyon ile aynı ölçü birimine sahip sd2 'nin kare kökü de regresyonun standart sapmasıdır. Bu kavram bazı kitaplarda regresyonun standart hatası veya tahminin standart hatası olarak geçmektedir. Regresyon bir ortalama, sd her bir X-Y noktasının + ve - yönde regresyon doğrusundan gösterebileceği ortalama ayrılış olduğuna göre, regresyon denklemi: Y=a+bX±sd (14.20) şeklinde yazılabilir. sd bütün X'ler için sabit olduğundan, regresyon doğrusu boyunca sabit kalır. Böylelikle regresyon doğrusuna paralel, ±1 sd uzaklıkta iki doğrunun oluşturduğu şerit, 4. Bölümde normal eğrinin özelliklerinde açıklandığı üzere, örnek noktalarının %68'ini içine alır (Şekil 14.8). Misal 14.2’de hesaplanan regresyonun varyans ve standart sapmasını inceleyelim ve bunu grafikle gösterelim: sd2 =246.54 hesaplandığına göre, Madde 14.2.2.3.1.1’de sd= 246.54 =15.7’dir. O halde regresyon, Y=-217.8+21.28X±15.7 şeklindedir. X yerine değerler konularak, regresyon doğrusuna + ve – yönde 1 sd uzaklıkta yer alan doğrular elde edilir. Mesela X=10 için: Y=-20.7 ve Y=10.7; X=20 için: Y=192.1 ve Y=223.5 bulunur. Regresyon doğrusu ve ±1 sd uzaklıktaki sınırı kapsayan standart hata şeridi Şekil 14.8'de gösterilmiştir. 350 Hacım (dm3 ) 300 250 200 150 100 50 0 -50 9 12 15 18 Çap (cm) 21 24 Şekil 14.8: Doğrusal regresyon ve standart hata şeridi 162 14.2.2.6.Regresyonun Örnekleme Hatası ve Güven Şeridi Regresyondan amacın, ölçülmesi kolay olan bir (çoğul regresyonlarda bir kaç) rastlantı değişkeni üzerinden, ölçülmesi zor olan bir rastlantı değişkenini tahmin etmek olduğu belirtilmişti. n birimli bir örnek üzerinden hesaplanan b ve a katsayıları ile tahmin edilen bir regresyon değeri, b ve a'nın her ikisinin de bir hatası olduğu için daima bir örnekleme hatası taşır. Regresyonda örnekleme hatası, örnek dahilinde yer alan bir X ortalama değeri için veya tek bir X değeri için söz konusu olabilir. Bu iki halde örnekleme hataları farklı şekillerde hesaplanır. Örnekleme hataları vasıtasıyla Yˆ değerlerinin güven sınırları, bunların birleştirilmesi ile de güven şeridi elde edilir. 14.2.2.6.1. X Ortalama Değerinin Örnekleme Hatası ve Regresyonun Güven Şeridi Bazı hallerde belli bir serbest değişkene karşılık birçok bağlı değişken örneklenebilir. Mesela ağaçların göğüs çaplarıyla, boylarının ölçüldüğü bir örneklemede çap değerleri çap sınıflarına dağıtılmışsa, her hangi bir çap sınıfında (her hangi bir X için), birden fazla boy değeri (Y) yer alabilir. Ölçülen boy değerleri her bir çap sınıfında normal dağılım gösterir ve bir ortalamaya sahiptir. Basit doğrusal regresyonda böyle bir ortalama değerin varyansı: 1 ( X − X )2 sY2 .X = sd2 + Σx 2 n (14.21) formülüyle tahmin edilmektedir. Bunun kare kökü ise, örnekleme hatasını verir. Bu şekilde her hangi bir X değerine karşılık Yˆ ortalama değerinin bulunabileceği aralık ( Yˆ değerinin güven sınırları), belli bir güven düzeyi ile: Yˆ ±t× sY.X (14.22) olarak tahmin edilebilir. Değişik X sınıfları için hesaplanan örnekleme hataları regresyon doğrusunun iki yanına taşınarak ortalama değerlerin güven şeridi elde edilir (Şekil 14.9). Misal 14.2'de hesapladığımız regresyonda X=20 için muhtemel Y ortalama değerinin varyansını bulalım ve 0.05 olasılık düzeyi ile güven sınırlarını tayin edelim: sd2 =246.54, X =290/17=17.1, Σx2=260.32 olduğuna göre: 163 1 (20 − 17.1) 2 =22.467 ve örnekleme hatası: sY2 .X =246.54× + 260.32 17 sY.X =4.74 dm3 bulunur. Demek ki X=20 sınıfı için regresyondan Hacım (dm3) hesaplanan Yˆ değeri ortalama ±4.74 dm3 hata payına sahiptir. X=20 için Yˆ =207.8 hesaplandığına ve n-k=15 SD'li t0.05=2.131 olduğuna göre 0.05 olasılıklı güven sınırları: 207.8±2.131×4.74 ve 197.7 dm3< Yˆ <217.9 dm3 bulunur. Diğer X'ler için de bu sınırlar hesaplanarak bir koordinat sisteminde regresyon doğrusunun etrafında çizilebilir. Bu şekilde elde edilen sahaya regresyonun güven şeridi de denir. Bu misale ait, regresyonda ortalama değerlerin güven şeridi Şekil 14.9'da sürekli çizgilerle gösterilmiştir. 350 300 250 200 150 100 50 0 -50 9 12 15 18 Çap (cm) 21 24 Şekil 14.9: Basit doğrusal regresyonda güven şeritleri (Sürekli çizgiler ortalamaya, kesikli çizgiler bireylere ait) Şeklin incelenmesiyle anlaşılacağı üzere, güven şeridi ortalamaya yakın kısımda daralmakta, uçlara doğru genişlemektedir. Bu durum regresyonun uç değerlerinin güvensizliğini, dolayısıyla ekstrapolasyonun sakıncalarını göstermektedir (Kalıpsız 1981, s.433). 14.2.2.6.2.Tek Bir X Değerinin Örnekleme Hatası ve Güven Şeridi Basit doğrusal regresyonda her hangi bir X değerinin varyansı ise: 164 1 ( X − X )2 2 sY.X = sd2 1 + + 2 n Σ x (14.23) formülüyle hesaplanır. Yine bunun kare kökü sY.X örnekleme hatasıdır. Bu değer, regresyonda her hangi bir X değeri için hesaplanan Y değerinin sahip olduğu hatayı ifade etmektedir. Regresyon değerlerinin bulunabileceği aralık ise, belli bir güven düzeyi ile: Yˆ ±t× sY.X (14.24) olarak hesaplanabilir. Çeşitli X değerleri için hesaplana sınır değerler doğrunun iki yanına taşınarak münferit X değerlerinin güven şeridi elde edilir (Şekil 14.9). Misal 14.2'de hesapladığımız regresyonda, bu defa X=20 için Yˆ değerinin varyansını bulalım ve 0.05 olasılık düzeyi ile güven sınırlarını tayin edelim: 1 ( 20 − 17.1) 2 2 =269.01 ve örnekleme hatası, sY.X =246.54 1 + + 260.32 17 sY.X =16.4 dm3 bulunur. Demek ki X=20 için regresyondan hesaplanan Yˆ değeri ortalama ±16.4 dm3 hata payına sahiptir. X=20 için Yˆ =207.8 hesaplandığına ve yine 15 SD'li t0.05=2.131 olduğuna göre 0.05 olasılıklı güven sınırları: 207.8±2.131×16.4 ve 169.9 dm3< Yˆ <245.7 dm3 bulunur. Bu misale ait regresyonda münferit değerlerin güven şeridi Şekil 14.9'da kesikli çizgilerle gösterilmiştir. Grafikte, münferit X değerlerinin. X ortalama değerlerine nazaran daha güvensiz olduğu görülmektedir. 14.3.Doğrusal Olmayan (Eğrisel) Đlişkiler Geçen bölümlerde değinildiği gibi, incelenen ilişkiyi her zaman Y=a+bX basit doğrusal regresyonu ile temsil etmek mümkün olmayabilir. Bu durumda doğrusal olmayan ilişkiler akla gelir. Eğrisel regresyonlarla ifade edilebilecek bu ilişkilerin en büyük özelliği, X'lerdeki birer birimlik artışlarda Y'lerin farklı miktarlarda artış (veya azalış) göstermesi ve koordinat sisteminde çeşitli eğriler halinde çizilmeleridir. Eldeki örneğe ait X-Y veri çiftleri bir koordinat sistemine noktalandığında, noktalar bir eğri üzerinde yer alacak şekilde dağılış gösterirse, incelenen değişkenler arasında eğrisel bir ilişki olduğu ortaya çıkar. Mesela canlıların zaman içindeki çoğalişları, ağaçlarda yaş-boy, çap-hacım, 165 çap-boy gibi ilişkiler eğrilerle temsil edilebilecek ilişkilerdir. Eğrisel bir ilişki söz konusu olduğunda akla gelen, çeşitli eğrisel eşitlik tiplerinden (modellerden) hangisinin seçileceğidir. Bunun için, önce örneğin serpilme diyagramı çizilerek noktaların dağılışı görülür ve o dağılışı en iyi izleyebilecek eğrinin seçiminde, o konuda yapılmış benzer çalışmalardan, edinilmiş tecrübelerden yararlanılır. Bir eğrisel fonksiyonun tamamı, genellikle incelenen ilişkiye uyum sağlamaz. Bu bakımdan, eğrisel ilişkiler genellikle bir eğrinin uygun bir parçasıyla temsil edilir. Örnek dışı uç kısımlar istenen uyumu göstermediğinden, dikkate alınmaz (ekstrapolasyonun sakıncası). Eğrisel modeller, polinomiyaller, logaritmik ve ters sayı fonksiyonlarından veya bunların karışık hallerinden meydana gelebilir. Her eşitlik tipi koordinat sisteminde kendine özgü bir seyir takib eder. 14.3.1.Çok Kullanılan Eğrisel Modeller ve Özellikleri Polinomlar: Y=a+bX basit doğrusal denklemine, X2, X3, . . . Xn değişkenlerinin ilavesiyle elde edilirler. Denklemdeki X'lerin en büyük üssü polinomun derecesini belirler. X2 ile biten bir denklem 2. derece polinomu, X3 ile biten bir denklem 3. derece polinomu adını alır. Polinomlar simetrik eğriler çizerler. Çizdikleri eğri, en büyük üssün bir eksiği kadar dönüş (kıvrılma) noktası gösterir. Mesela parabol denilen Y=a+bX+cX2 denklemi, koordinat sisteminde +Y (c>0 olması hali) veya -Y ekseni yönünden (c<0 olması hali) gelerek kıvrılır ve geldiği yöne döner. Y=a+bX+cX2+dX3 eğrisi ise, iki dönüş noktası gösteren S şeklinde bir eğri (S eğrisi) çizer. Polinomlar ekstrapolasyona uygun değildirler. Bu sebepten ele alınan ilişki polinomun tamamı ile değil, uygun bir parçası ile temsil edilir. Özellikle 2. ve 3. derece polinomları istatistikte çok kullanılır. Mesela ağaçlarda büyüme ve artım ilişkileri birer 3. derece polinomu ile gösterilir. Logaritmik Fonksiyonlar: Bir tarafı veya iki tarafı logaritmik olan çeşitli logaritmik fonksiyonlar vardır. Bunlar aslında üssel fonksiyonların transforme edilmiş halleridir. Ekstrapolasyona nispeten uygundurlar: Çok kullanılan logaritmik eğriler Tablo 14.5’te verilmiştir. Ters Sayı Fonksiyonları: Koordinat sisteminde Y ve X eksenlerine veya bunlara paralel doğrulara asimptot olan eğriler çizerler. Bu özellikleriyle ekstrapolasyona uygundurlar. Bu tip fonksiyonlar, çok hızlı düşüş veya yükseliş gösteren ve sonra sabit kalan ilişkilerin gösterilmesine çok uygundur. Tablo 14.6’da sık kullanılan logaritmik eğri tipleri verilmiştir. 166 Tablo 14.5: Bazı logaritmik denklemler Logaritmik Eşitlik Y=a+bLogX 2 Y=a+bLogX+cLog(X ) 2 3 Y=a+bLogX+cLog(X )+dLog(X ) LogY=a+bX 2 LogY=a+bX+cX 2 3 LogY=a+bX+cX +dX LogY=a+bLogX 2 LogY=a+bLogX+cLog(X ) 2 3 LogY=a+bLogX+cLog(X )+dLog(X ) 10 tabanına göre a+bX Üssel hali E tabanına göre Y=10 a+bX+cX2 Y=10 a+bX+cX2+dX3 Y=10 a+bLogX Y=10 a+bLogX+cLog(X2) Y=10 a+bLogX+cLog(X2)+dLog(X3) Y=10 a+bX Y=e a+bX+cX2 Y=e a+bX+cX2+dX3 Y=e a+bLogX Y=e a+bLogX+cLog(X2) Y=e a+bLogX+cLog(X2)+dLog(X3) Y=e Bütün bu eşitlikler ile azalan ve artan ilişkilerde çizdikleri eğri şekilleri Şekil 14.10'da ayrıntılı olarak gösterilmiştir. Şekillerde A eğrisi bir parabol, B eğrisi ise bir 3. derece polinomudur. Mukayese imkanı vermek amacıyla, belli modeller belli veri çiftlerine uygulanmıştır. Bu cümleden olarak; C, E, G, I, K, M ve O tipleri aynı örneğe; D ve N aynı örneğe; A, F, H, J, L ve P aynı örneğe uygulanmış eğrilerdir. Her model, ayrıca hem X'li, hem X2'li ve hem de X3’lü eşitliği kendi içinde bulundurmaktadır. Ancak bazılarında, X'li, X2'li ve X3'lü modelin birbirleriyle çakıştığı görülmektedir. Burada dikkat edilmesi gereken, bazı eğri tiplerinin noktalara çok iyi uyum gösterdiği, bazılarında ise sapmalar bulunduğudur. Sapmalar uçlarda veya ortada olabilmektedir. Bunun anlamı, bazı eğrilerin daha yumuşak, bazılarının daha sert dönüş gösterdiğidir. J ve O tiplerinin ise daha değişik eğriler çizdiği görülmektedir.· Eğrisel regresyonlarla uğraşan kişi, belli bir modele bağlı kalmamalı, verisini değişik modellere oturtarak ve tekrar tekrar deneyerek dağılıma en iyi uyum sağlayan eğri tipini bulmalıdır. Bunun en iyi yolu, hesaplanan regresyonun parametrelerine bakmakla beraber, gerek noktaları, gerekse eğriyi bir koordinat sistemine çizip uygunluğu gözle kontrol etmektir. Bu amaç için, günümüzde bilgisayarlar büyük kolaylık sağlamaktadır. 167 Tablo 14.6: Bazı ters sayı fonksiyonları Fonksiyon Dönüştürülmüş Hali b Y=a+ X b c Y=a+ + 2 X X b c d + + Y=a+ X X2 X3 1 Y= a + bX 1 Y= a + bX + cX 2 1 Y= a + bX + cX 2 + dX 3 b Y=1/ a + X b c Y=1/ a + + X X2 b c d + 2 + 3 Y=1/ a + X X X X Y= a + bX X Y= a + bX + cX 2 X Y= a + bX + cX 2 + dX 3 1 Y 1 Y 1 Y 1 Y 1 Y 1 Y =a+bX 2 =a+bX+cX 2 3 =a+bX+cX +dX b X b c =a+ + X X2 b c d =a+ + 2 + 3 X X X =a+ X =a+bX Y X 2 =a+bX+cX Y X 2 3 =a+bX+cX +dX Y 168 Y=a+bX+cX2+dX3 Y=a+bX+cX2 A B Y=a+blogX Y=a+blogX+clogX2 Y=a+blogX+clogX2+dlogX3 D C Y=a+blogX Y=a+blogX+clogX2 Y=a+blogX+clogX2+dlogX3 LogY=a+bX LogY=a+bX+cX2 LogY=a+bX LogY=a+bX+cX2 LogY=a+bX+cX2+dX3 LogY=a+bX+cX2+dX3 E F Şekil 14.10: Bazı önemli fonksiyonlar ve çizdikleri eğri biçimleri 169 LogY=a+blogX LogY=a+blogX+clogX2 LogY=a+blogX+clogX2+dlogX3 LogY=a+bX LogY=a+bX+cX2 LogY=a+bX+cX2+dX3 G H 1/Y=a+bX 1/Y=a+bX 1/Y=a+bX+cX2 1/Y=a+bX+cX2+dX3 1/Y=a+bX+cX2 1/Y=a+bX+cX2+dX3 I J X/Y=a+bX X/Y=a+bX X/Y=a+bX+cX2 X/Y=a+bX+cX2 X/Y=a+bX+cX2+dX3 X/Y=a+bX+cX2+dX3 K L Şekil 14.10: (Devam) 170 Y=a+b/X Y=a+b/X+c/X2 Y=a+b/X+c/X2+d/X3 N M Y=a+b/X Y=a+b/X+c/X2 Y=a+b/X+c/X2+d/X3 1/Y=a+b/X 1/Y=a+b/X 1/Y=a+b/X+c/X2 1/Y=a+b/X+cX2 1/Y=a+b/X+c/X2+d/X3 1/Y=a+b/X+cX2+dX3 O P Şekil 14.10: (Devam) 14.3.2.Eğrisel Đlişkilerde Korelasyon ve Regresyon Eğrisel ilişkilerde korelasyon ve regresyon, biri logaritmik diğeri parabol olmak üzere iki farklı model üzerinden aşağıda misallerle açıklanmıştır. 14.3.2.1.Bir Logaritmik Regresyonun Hesaplanması Misal 14.3: Tablo 14.7'deki X-Y değişkenleri arasındaki ilişkiyi LogY=a+bLogX eşitliği ile ifade edelim: Denklemde görüldüğü üzere, hesaplamada kullanılacak değişkenler, değişkenlerin kendileri değil, bunlardan türetilmiş olan LogX ve LogY'lerdir. Bir regresyon hesabında bu şekilde değişkenlerin aslı yerine, karesinin (X2), kübünün (X3), logaritmasının (LogX), tersinin (1/X), iki değişkenin çarpımının (X1×X2) vs alınmasıyla elde edilen değişkenlere türetilmiş değişken denilmektedir. 171 Misalde katsayıların hesabı için gerekli olan değişkenlerin çarpımları ve kareleri, LogX×LogY, (LogX)2 ve (LogY)2 olarak tabloda verilmiş ve toplamları alınmıştır. Logaritmalar 10 tabanına göredir. Eşitlik bünyesinde 1 serbest değişken bulunduğuna göre, yapılacak hesaplamalarda basit doğrusal regresyona ait formüller kullanılabilir. Tablo 14.7: LogY=a+bLogX regresyonu için gerekli hesaplamalar No 1 2 3 4 5 6 7 8 9 10 Σ X 1 2 3 4 5 6 7 8 9 10 55 Y 0.3 0.6 0.7 1.0 1.6 2.5 3.1 5.0 7.4 10.0 32.2 LogX 0.0000 0.3010 0.4771 0.6021 0.6990 0.7782 0.8451 0.9031 0.9542 1.0000 6.5598 LogY -0.5229 -0.2218 -0.1549 0.0000 0.2041 0.3979 0.4914 0.6990 0.8692 1.0000 2.7620 LogX*LogY 0.0000 -0.0668 -0.0739 0.0000 0.1427 0.3097 0.4152 0.6312 0.8295 1.0000 3.1876 (LogX)2 0.0000 0.0906 0.2276 0.3625 0.4886 0.6055 0.7142 0.8156 0.9106 1.0000 5.2152 (LogY)2 0.2734 0.0492 0.0240 0.0000 0.0417 0.1584 0.2414 0.4886 0.7556 1.0000 3.0322 Korelasyon katsayısının hesabı: n=10 olduğundan, (14.1) nolu formüle göre: Σxy=3.1876- Σx =5.21522 2 r= 6.5598 × 2.762 10 6.55982 10 1.375782 0.9121 × 2.26934 =1.37578 =0.9121 =0.914 Σy =3.03222 2.762 2 10 =2.26934 r=0.956 Buradan r'ye ait t değeri, (14.4) nolu formüllerden ikincisine göre, t= 0.956 10 − 2 1- 0.9562 =9.217 hesaplanır. Bunun SD'si n-2=8 olduğuna ve Ek Tablo 2'de 8 SD'li t0.05=2.306, t0.01=3.355 ve t0.001=5.041 olduğuna göre r'nin %99.9 önemli olduğu anlaşılır. Ek Tablo 7’ye göre ise en az %99 önemli olduğu görülür (Ek Tablo 7'ye göre 8 SD'li r0.05=0.632, r0.01=0.765'dir). 172 Regresyon katsayılarının hesabı: Σxy=1.37578, Σx2=0.9121, ΣY2.762, ΣX=6.5598 olduğundan, (14.7) ve (14.8) nolu formüllere göre: b=1.37578/0.9121=1.5084 a= 2.762 10 -1.5084× 6.5598 10 =-0.7133 O halde regresyon denklemi: LogY=-0.7133+1.5084×LogX şeklinde yazılır. Bu denklem mesela X=1 için çözülecek olursa, LogY=-0.7133+1.5084×Log(1)=-0.7133 bulunur. Bunun anti logaritması alınırsa Y=0.1935 olur. Veya Tablo 14.5'teki üssel hale göre aynı eşitlik, Y=10-0.7133+1.5084×LogX şeklinde yazılır. X=1 için bu defa Y=10-7133 ve bir hesap makinesi yardımıyla Y=0.1935 bulunur. Bu regresyon bir koordinat sistemine çizilecek olursa, Şekil 14.10-H'daki eğri elde edilir (Đlgili grafikte, üç eşitliğe ait eğri üst üste geçmiştir). Regresyonun ve regresyon katsayılarının standart hataları: ΣY2=3.0322, ΣY=2.762, ΣXY=3.1876, olduğundan, regresyonun varyansı, (14.19) nolu formüle göre, sd2 = 3.0322 − ( −0.7133 × 2.762 ) − 15084 . × 31876 . 10 − 2 =0.02427 veya (14.10) nolu formüle göre, 2.26934 − sd2 = 1.375782 0.9121 =0.02427 hesaplanır. Standart hata ise, 10 − 2 sd=0.1558 bulunur. b’nin varyansı ise, sb2 =0.02427/0.9121=0.02661 ve standart hatası sb=0.16312 bulunur. Tablo 14.7'den ΣX2=5.2152 alınarak, (14.12) nolu formüle göre a'nın varyansı ise: 173 sa2 =0.02427× 5.2152 10 × 0.9121 =0.01388 ve standart hatası sa=0.1178 bulunur. Bunlardan yararlanılarak kendilerine ait t değerleri hesaplanır ve önemlilikleri kontrol edilebilir. Mesela (14.11) nolu formüle göre b'ye ait: t=1.5084/0.16312=9.247 bulunur. Ek Tablo 2'ye göre bunun %99.9 önemli olduğu görülür (n-k=10-2=8 SD'li t0.05=2.306, t0.01=3.355, t0.001=5.041'dir.). Varyans analizi: Tablo 14.7'den ΣY=2.762 ve ΣY2=3.0322 alınarak, (14.14) ve (14.15) nolu formüllere göre regresyona ait: Genel KT=3.0322- Regresyon KT= 2.762 2 10 1.375782 0.9121 =2.26934 =2.07518 bulunur. Buradan; Hata KT=2.26934-2.07518=0.19416 hesaplanır. Varyasyon kaynaklarının serbestlik dereceleri burada basit doğrusal regresyondaki gibidir (Madde 14.2.2.4). Sonuçlar ve F kontrolu Tablo 14.8'de verilmiştir. Tablo 14.8: Misal 14.3'e ait varyans analizi Varyasyon Kaynağı Regresyon Hata Genel KT 2.07518 0.19416 2.26934 SD 1 8 9 KO 2.07518 0.02427 F 85.50*** 1'e 8 SD'li F tablolarına bakılacak olursa, bulunan F'in %99.9 önemli olduğu görülür. (F0.05=5.32, F0.01=11.3, F0.001=25.4'tür.) Dikkat edilecek olursa, burada gerek r, gerek regresyon katsayısı, gerekse regresyon ilişkinin %99.9 önemli olduğunu göstermiştir. Ancak bütün bunlara rağmen Şekil 14.10-H'da eğrinin noktalara iyi uymadığı görülmektedir. Buna karşılık aynı veriye uygulanmış olan Şekil 14.10-F denklemlerinden biri (mesela LogY=a+bX modeli) noktaların hemen hemen üzerinden geçmiştir. Nitekim veri bu modele göre analiz edildiğinde, daha büyük r, t ve F değerleri elde edilecektir. Ancak en büyük r, t ve F değerleri, daima en uygun modeli 174 göstermez. Logaritmik modellerde yüksek test değerlerine nazaran, çok uygun olmayan eğriler elde edilebilmektedir. Bu bakımdan, eğrisel regresyonlarda model seçimi çok önemlidir. Misalde kullanılana benzer modellerden LogY=a+bLogX+cLog(X2) denkleminde 2 serbest değişken vardır. Bu eşitlik ve benzeri tüm iki serbest değişkenli modeller Madde 14.3.2.2'de verilen Misale göre çözülebilir. LogY=a+bLogX+cLog(X2)+dLog(X3) eŃitliñinde ise 3 serbest degişken vardır. 3 ve daha fazla serbest değişken bulunduran eşitliklerin el ile çözülmesi zahmetli, hatta değişken sayısının artışına paralel olarak bazı hallerde imkansızdır. Böyle modellerin çözümü bilgisayarlarla kolaylıkla yapılabilir. 14.3.2.2.Bir Parabolün Hesaplanması Y=a+bX+cX2 şeklindeki bir eşitliğe 2. derece polinomu veya parabol denildiği daha önce belirtilmişti. Burada bu eğriye uygun bir regresyonun çözümü açıklanacaktır. Eşitlikte iki serbest değişken olduğu, bunlardan birincisinin asli, ikincisinin ise onun karesinin alınmasıyla türetilmiş olduğu görülmektedir. Bir eşitlikte kaç serbest değişken varsa, o kadar da regresyon katsayısı vardır. Eşitliklerde bunlar b, c, d... vs ile veya b1, b2, b3.vs ile gösterilir. Y=a+bX+cX2 denkleminde birinci regresyon katsayısı b, ikinci regresyon katsayısı c ile gösterilmiştir. Bu denklemde X=X1, X2=X2 b=b1 ve c=b2, ile gösterilirse, iki serbest değişkenli bir regresyonda katsayılarını hesabı aşağıdaki formüllere göre yapılır: b1 Σx12+ b2 Σx1x2=Σx1y (14.25) b1 Σx1x2+ b2 Σx22=Σx2y Sabit terim (a katsayısı) ise: a= Y -b1 X 1-b2 X 2 (14.26) formülü vasıtasıyla hesaplanır. Bu katsayıları bir misal üzerinde hesaplayalım: Misal 14.4: Misal 14.2'de verilen 17 Pinus radiata'daki çap-hacım ilişkisini bu defa bir parabol ile ifade edelim. Çözüm için gerekli hesaplamalar Tablo 14.9’da verilmiştir. Misale ait hesaplar, elde hesap makinesi ile yapılmıştır. Bilgisayar sayılarda çok fazla kesir üzerinden işlem yaptığı için, aynı işlemler bilgisayarda yapıldığında kısmen farklı sonuçlar alınabilir. 175 Tablo 14.9: 17 P. radiata ağacında göğüs çapı-hacım ölçüleri ve 2. derece polinomu için gerekli hesaplamalar Sıra No 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 Σ X1 X2 Y Y2 Çap (X1)2 Hacım 10.2 104.04 29 841 11.7 136.89 41 1681 12.5 156.25 51 2601 13.1 171.61 62 3844 14.1 198.81 74 5476 14.8 219.04 87 7569 15.5 240.25 99 9801 16.2 262.44 116 13456 16.3 265.69 129 16641 17.8 316.84 147 21609 18.7 349.69 167 27889 19.7 388.09 186 34596 20.6 424.36 209 43681 21.1 445.21 231 53361 22.1 488.41 255 65025 22.6 510.76 279 77841 23.0 529.00 307 94249 290.0 5207.38 2469 480161 X1Y 295.8 479.7 637.5 812.2 1043.4 1287.6 1534.5 1879.2 2102.7 2616.6 3122.9 3664.2 4305.4 4874.1 5635.5 6305.4 7061 47657.7 X1X2 (X1)3 1061.208 1601.613 1953.125 2248.091 2803.221 3241.792 3723.875 4251.528 4330.747 5639.752 6539.203 7645.373 8741.816 9393.931 10793.861 11543.176 12167.000 97679.312 X22 (X1)4 10824.3216 18738.8721 24414.0625 29449.9921 39525.4161 47978.5216 57720.0625 68874.7536 70591.1761 100387.5856 122283.0961 150613.8481 180081.4096 198211.9441 238544.3281 260875.7776 279841.0000 1898956.1674 X2Y (X1)2Y 3017.16 5612.49 7968.75 10639.82 14711.94 19056.48 23784.75 30443.04 34274.01 46575.48 58398.23 72184.74 88691.24 102843.51 124544.55 142502.04 162403.00 947651.23 Regresyon katsayılarının hesabı: 14.2.2.3 maddesinde daha önce, Σx12=260.32, Σx1y=5539.47 olarak hesaplanmıştı. (14.25) nolu formüller için gerekli olan diğer terimler ise: Σx1x2=97679.312- 290 × 5207.38 =8847.54 17 Σx22=1898956.167- Σx2y=947651.23- 5207.382 =303849.9 17 5207.38 × 2469 =191355.86 17 hesaplanır. Bunlar formüllerde yerine konulur ve taraf tarafa toplanırsa: 8847.54×(260.32b1+8847.54b2=5539.47) 260.32×(8847.54b1+303849.9b2=191355.86) 2303191.6b1+78278964.1b2=49010682.4 -2303191.6b1-79098206b2=-49813757.5 -819241.9b2=-803075.1 176 b 2= − 803075.1 =0.9803 ve bu değer yukarıdaki eşitliklerden birinde − 819241.9 yerine konularak, 260.32b1+8847.54×0.9803=5539.47 ve b1, b 1= − 3133.77 =-12.0382 bulunur. 260.32 Hacım (dm3) Y =145.24, X 1 =17.06, X 2 =306.31 olduğuna göre, (14.26) nolu formül yardımıyla: a=145.24-(-12.0382×17.06)-0.9803×306.31=50.34 bulunur. O halde regresyon: Y=50.34-12.0382X+0.9803X2 şeklinde yazılır. Bu defa X=10 için beklenen değer: Y=50.34-12.0382×10+0.9803×102=27.99 dm3 bulunur. Halbuki basit doğrusal regresyona göre, X=10 için -5 dm3 hesaplanmıştı. Demek ki 2. derece polinomu ilişkiyi bu noktada daha iyi temsil etmektedir. Hesaplanan regresyona ait eğri ve noktalara uyumu Şekil 14.11'de gösterilmiştir. 350 300 250 200 150 100 50 0 9 12 15 18 Çap (cm) 21 24 Şekil 14.11: Çap-hacım ilişkisinin 2. derece polinomu ile temsili Regresyonun ve regresyon katsayılarının standart hataları: Đkinci derece polinomunda regresyonun varyansı (veya hata KO): 177 s d2= ΣY 2 − aΣY − bΣXY − cΣX 2Y n−3 (14.27) formülüne göre hesaplanır. Madde 14.2.2.3.1.1 ve 14.2.2.5'te değinildiği gibi, bu formülün payı, regresyondan ayrılış kareleri, yani hata kareleri toplamıdır. Katsayıların varyansları ise, regresyonun varyansı üzerinden: s b2= s c 2= sd2 (Σx1 x2 ) 2 Σx12 − Σx22 (14.28) sd2 (Σx1 x2 ) 2 Σx22 − Σx12 (14.29) formülleri yardımıyla bulunur. ΣY=2469, ΣXY=47657.7, Tablo 14.9'dan ΣY2=480161, ΣX Y=947651.23 alınarak (14.27) nolu formül misale uygulanırsa: 2 s d2= 480161 − 50.34 × 2469 − (−12.0382) × 47657.7 − 0.9803 × 947651.23 =42.997 17 − 3 bulunur. Daha önce Ex12=260.32. Ex1x2=8847.54, Ex22=303849.9 hesaplanmış olduğundan: s b2= 42.997 =15.9472 (8847.54) 2 260.32 − 303849.9 s c 2= 42.997 =0.013663 (8847.54) 2 303849.9 − 260.32 sb=3.9934 ve, sc=0.116887 bulunur Buradan önemlilik kontrolları için (14.11) nolu formüle göre katsayıların t değerleri: 178 t b= −12.0382 =-3.015 3.9934 t c= 0.9803 =8.387 0.116887 bulunur. Đki serbest değişkenli bir regresyonda k=3 olduğundan, bunların her ikisinin de serbestlik dereceleri n-k=I7-3=14'tür. 14 SD'li t tablo değerleri t0.05=2.145, t0.01=2.977, t0.001=4.140’dır. O halde b katsayısı %99, c katsayısı %99.9 güven düzeyinde önemlidir. Regresyon varyans analizi: Đki serbest değişkenli bir regresyonda, Regresyon KT=b1Σx1y+- b2Σx2y (14.30) formülüne göre hesaplanır Formüle göre, Regresyon KT=-12.0382×5539.47+0.9803×191355.86=120900.9 bulunur. Ancak Genel KT ve hata KT biliniyorsa, Regresyon KT=Genel KT-hata KT olarak da hesaplanabilir. Daha önce Genel KT=Σy2=121575.1 bulunduğundan, hata KT=121575.1-120900.9=674.2 olur. Birden fazla serbest değişkenli regresyonlarda serbestlik dereceleri: Genel SD=n-1, Regresyon SD=Serbest değişken sayısı, Hata SD=Genel SD-Regresyon SD veya n-k olarak hesaplanır. Daha önce belirtildiği üzere k, serbest değişken adedinin 1 fazlasıdır. Varyans analizi Tablo 14.10'daki gibidir. Tablo 14.10: Misal 14.3'e ait varyans analizi Varyasyon Kaynağı Regresyon Hata Genel KT 120900.9 674.2 121575.1 SD 2 14 16 KO 60450.5 48.2 F 1254.16*** (Tabloda hata KO=48.2'dir. Halbuki bu değer daha önce 42.997 hesaplanmıştır. Bu fark hesapların az sayıda ondalık üzerinden yapılmasından ileri gelmektedir.) 2’ye 14 SD’li F değerleri, F0.05=3.739, F0.01=6.514, F0.001=11.780'dir. Hesaplanan değer bunların hepsinden büyük olduğuna göre, 2. derece çaphacım ilişkisinin %99.9’dan büyük güven düzeyinde önemli olduğuna hükmedilir. Tabloda görüldüğü üzere, hesaplanan F basit doğrusal regresyonda hesaplanan değerden (478.11, Bak madde 14.2.2.4) fazlasıyla büyüktür. Bu 179 sebepten ikinci derece polinomunun bu ilişkiyi daha iyi temsil ettiği açıktır. Nitekim genel KT aynı olduğu halde, basit doğrusal regresyonda regresyondan ayrılışlar 3698.2 iken, burada 674.2'ye inmiştir. Demek ki basit doğrusal regresyon yerine bu model tercih edilmelidir. Korelasyon katsayısının hesabı: Birden fazla bağımsız değişkene sahip bir regresyonda korelasyon katsayısı yerine tüm korelasyon katsayısı veya belirtme katsayısı’ndan söz edilir Tüm korelasyon katsayısı normal korelasyon katsayısının karesine eşittir. r2 ile gösterilir ve korelasyon katsayısı ile aynı anlamı taşıt. Ayrıca regresyondaki serbest degişkenlerin Y karakterini % olarak belirtme derecesini ifade eder. Bu değer aşağıdaki formüle göre hesaplanır: r 2= Regresyon KT Genel KT (14.31) Formülü misalimize uygulayacak olursak; r2=120973.1/121575.1=0.995 bulunur. Bu değer güçlü bir bağıntının göstergesidir. X1 ve X2 karakterleri, Y karakterinin 0.995 veya %99.5'ini belirtmiştir. Geriye kalan 1-0.995=0.005'lik kısım bilinmeyen başka değişkenler tarafından belirtilmektedir. r2'nin kontrolunda, formül (14.4) de kullanılabilir: t= 0.9975 17 - 3 1 − 0.995 =52.783. Bu değer, n-k=17-3=14 SD’li tablo değerleri ile karşılaştırılırsa, r’nin %99.9 önemli oluğu görülecektir. 14.4.Çoğul Đlişkilerde Korelasyon ve Regresyon Korelasyon ve regresyona konu olan çoğul ilişkiler denilince akla, ikiden fazla bağımsız değişkenin bir bağımlı değişkeni etkilediği veya birden fazla bağımsız değişkenle bir bağlı değişken arasındaki ilginin incelendiği ilişkiler gelir. Ancak bu defa bağımsız değişkenler mesela Y=a+bX+cX2 eşitliğindeki X2 gibi belli bir serbest değişkenden türetilmiş olmayıp, farklı niteliktedirler. Mesela bir ağacın hacım artımı ile çap ve boyu arasındaki ilişki incelendiğinde, çap ve boy gibi farklı karakterde iki bağımsız değişken ele alınmaktadır. Böyle bir ilişki, Hacım=a+b1Çap+b2Boy şeklinde yazılabilir. Bunlara bir de yaş katılırsa, yaş, çap ve boy olarak üç bağımsız değişkenli Hacım=a+b1Çap+b2Boy+b3Yaş eşitliği hesaplanmaya çalışılır. Çoğul regresyonlar çok daha fazla sayıda bağımsız değişkene de sahip olabilirler. 180 Çoğul regresyonlar farklı karakterde birden çok değişkenle birlikte, bunlardan türetilmiş karesel, kübik, logaritmik vs değişkenleri de bünyelerinde bulundurabilirler. Mesela Hacım=a+b1Çap+b2Çap2-b3Boy2 gibi bir çoğul regresyon da kurulabilir. Đki ayrı karakterde bağımsız değişkene sahip bir çoğul regresyon, ancak 3 boyutlu bir koordinat sisteminde çizilebilir. Böyle bir regresyon, artık bir regresyon hattı değil de, üç boyutlu uzayda yükselen veya alçalan bir regresyon düzlemi (Şekil 14.12) veya kıvrımlar yapan bir regresyon yüzeyi (Şekil 14.14) meydana getirir. Regresyonda eğer değişkenlerin asılları ele alınmışsa regresyon düzlemi, kareleri, küplerí, çarpımları vs ele alınmışsa muhtemelen çukurlu tümsekli bir regresyon yüzeyi meydana gelir. Üç ve daha fazla farklı karakterde serbest değişkene sahip çoğul regresyonlar ise grafikle gösterilemez. Đki farklı karakterde bağımsız değişkenli bir çoğul regresyonda beklenen değerler, değişkenlerden birinin satırları, diğerinin sütunları oluşturduğu iki boyutlu bir tablo halinde elde edilir. 3 serbest değişkene sahip olanlarda ise, değişkenlerden biri sabit tutularak, diğer ikisine göre iki boyutlu bir tablo yapılır. 14.4.1. Çoğul Korelasyon ve Regresyon Katsayılarının Hesabı Çoğul ilişkilerde korelasyon ve regresyon aşağıda misal üzerinden açıklanmıştır. Misal 14.5: Bir kavak klonuna mensup 15 ağacın çapı ve boyu ölçülmüş, gövde analizi metodu ile hacımları hesaplanmıştır. Veriler Tablo 14.11'deki gibidir. Bu klonda çap, boy ile hacım arasındaki ilişkiyi hesaplayalım: Misalde iki serbest değişken bulunduğundan, 14.3.2.2 nolu maddede verilen formüller burada da kullanılabilir. Formüller için gerekli ön hesaplamalar Tablo 14.11’de verilmiştir. Katsayıların hesaplanması: Σx12=7346- 320 2 =519.333 15 Σx1x2=6583- 320 × 288 =438 15 Σx22=5912- 2882 =382.4 15 Σx1y=136306- 181 320 × 5405 15 Tablo 14.11: Bir kavak klonuna ait 15 ağacın çap, boy ve hacım ölçüleri Sıra Çap Boy Hacım No (cm) (m) (dm3) X1×X2 X1 X2 Y 1 12 10 51 120 2 13 11 66 143 3 14 15 103 210 4 16 15 134 240 5 17 16 161 272 6 18 17 191 306 7 20 18 248 360 8 22 19 315 418 9 23 21 379 483 10 25 21 445 525 11 26 24 549 624 12 27 24 590 648 13 28 25 659 700 14 29 26 733 754 15 30 26 781 780 Σ 320 288 5405 6583 Σx2y=121542- X1×Y X2×Y X12 X22 612 858 1442 2144 2737 3438 4960 6930 8717 11125 14274 15930 18452 21257 23430 136306 510 726 1545 2010 2576 3247 4464 5985 7959 9345 13176 14160 16475 19058 20306 121542 144 169 196 256 289 324 400 484 529 625 676 729 784 841 900 7346 100 121 225 225 256 289 324 361 441 441 576 576 625 676 676 5912 Y2 2601 4356 10609 17956 25921 36481 61504 99225 143641 198025 301401 348100 434281 537289 609961 2831351 288× 5405 =17766 15 (14.25) nolu formüllere göre: 382.4×(519.333b1+439b2=20999) 439×(439b1+382.4b2=17766) 198592.94b1=8030017.6 -192721b1=-7799274 b1=39.296 439×39296+382.4b2=17766 b2=1.3469 Y =5405/15=360.33, X 1 =320/15=21.33, X 2 =288/15=19.2 bulunur. olduğundan, (14.26)'ya göre ise; a=360.33-39.296×21.33-1.3469×19.2=-503.71 hesaplanır. Buna göre regresyon denklemi: Y=-503.71+39.296b1+1.3469b2 veya Hacım=-503.71+39.296×Çap+1.3469×Boy şeklinde yazılabilir. Bu eşitlik, daha önce belirtildiği gibi, mesela çapın satırları, boyun sütunları oluşturduğu iki girişli bir tablo halinde çözülebilir (Tablo 14.12). Regresyon 3 boyutlu bir grafik halinde Şekil 14.12'de gösterilmiştir. 182 Tablo 14.12: Y=-503.71+39.296Çap+1.3469Boy regresyonunun beklenen değerleri 12 -16.0 62.6 141.2 219.8 298.4 377.0 455.6 534.1 612.7 691.3 14 -13.3 65.3 143.9 222.5 301.1 379.7 458.3 536.8 615.4 694.0 22 -2.5 76.1 154.7 233.2 311.8 390.4 469.0 547.6 626.2 704.8 24 0.2 78.8 157.4 235.9 314.5 393.1 471.7 550.3 628.9 707.5 800 700 600 500 26 400 22 300 200 18 100 14 0 -100 10 12 14 16 18 20 22 24 26 28 30 Çap (cm) 26 2.9 81.5 160.0 238.6 317.2 395.8 474.4 553.0 631.6 710.2 Boy (m) 10 -18.7 59.9 138.5 217.1 295.7 374.3 452.9 531.5 610.0 688.6 Hacım (dm3) Çap (cm) 12 14 16 18 20 22 24 26 28 30 Hacım (dm3) Boy (m) 16 18 20 -10.6 -7.9 -5.2 68.0 70.7 73.4 146.6 149.3 152.0 225.2 227.9 230.6 303.8 306.5 309.1 382.4 385.0 387.7 460.9 463.6 466.3 539.5 542.2 544.9 618.1 620.8 623.5 696.7 699.4 702.1 Şekil 14.12: Y=-503.71+39.296Çap+1.3469Boy·regresyonunun 3 boyutlu grafik halinde gösterilişi ve regresyon düzlemi Tablo incelendiğinde görüleceği üzere, 12 cm çapında 10 m boyunda bir ağacın hacmı regresyona göre –18.7 dm3’tür. Teorik olarak böyle bir şey olamayacağı gibi, deneysel verilere göre de bu çap ve boydaki ağacın hacmı 51 dm3’tür. 20 cm çapında 18 m boyunda bir ağacın hacmı ise 306.5 dm3 olmaktadır. Bu değer de deneysel değerden (248 dm3) oldukça farklıdır. Bu durumda modelin gerçek duruma iyi uymadığı anlaşılmaktadır. Yapılacak iş, yeni bir model kurularak yeni bir regresyon hesaplamaktır. 183 Bu misaldeki gibi 3 boyutlu bir grafikle resmedilebilen 2 girişli tablolarda, tablonun sağ üst ve sol altında gerçek dışı ölçüler yer alabilir. Mesela 30 cm çapında 10 m boyunda bir ağaç veya 12 cm çapında 26 m boyunda bir ağaç tabiatta bulunmayabilir. Bu sebepten tablo verilirken, tabiatta rastlanması mümkün olmayan bu gibi ölçülerin karşılığı olan regresyon değerleri köşelerden çıkarılarak yerleri boş bırakılır. Çoğul regresyonlarda regresyon katsayıları ait oldukları değişkenin ölçü birimine, beklenen değerler ise bağlı değişkenin ölçü birimine sahiptir. Regresyonun ve regresyon katsayılarının standart hataları: Đki serbest değişkenli bir çoğul regresyonun varyansı: s d2= ΣY 2 − aΣY − b1ΣX 1Y − b2 ΣX 2Y n−3 (14.32) formülüne göre hesaplanır. ΣY2=2831351, ΣY=5405, ΣX1Y=136306 ve ΣX2Y=121542 olduğuna göre, (14.32) nolu formülü misale uygularsak: s d2= 2831351 − (−503.71 × 5405) − 39.296 × 136306 − 1.3469 × 121542 =2826.5 n−3 bulunur. Katsayıların varyansları ise, (14.28) ve (14.29) nolu formüllere göre hesaplanır. Daha önce Σx12=519.333, Σx1x2=439, Σx22=382.4 hesaplanmış olduğundan: sb12= 2826.5 =184.071 439 2 519.333 − 382.4 sb22= 2826.5 =249.985 439 2 382.4 − 519.333 sb1=13.567 m ve, sb2=15.811 m bulunur. Yine (14.11) nolu formüle göre, önemlilik kontrolları için bunların t değerleri, tb1=39.296/13.567=2.896 tb2=1.3469/15.811=0.085 bulunur. Serbestlik dereceleri ise n-k=15-3=12'dir. 12 SD'li t tablo değerleri t0.05=2.179, t0.01=3.055, t0.001=4.138'dir. Bu durumda b1 katsayısı %95 önemli görünmekle beraber, b2 katsayısı önemli olamamıştır. Bu sonuç, regresyonda 184 kullanılan değişkenlerden boy ile hacım arasında bir ilişki olmadığı şeklinde yorumlanır. Ancak biyolojik olarak böy1e bir şey söylemek mümkün değildir. "Boy" faktörünün doğrudan kendisi burada hacım artımına etkisiz görünmektedir; ama karesi, kübü, logaritması gibi bundan türetilmiş bir değişken muhtemelen artımla ilişkili bulunacaktır Bu sebepten, önceki konularda da değinildiği gibi, başka değişkenlerle, başka regresyon analizleri yapılarak hacım artımını en iyi temsil eden model bulunmalıdır. Regresyon varyans analizi: Burada da varyasyon kaynaklarının hesabı, polinomiyal regresyon misaline benzer şekilde yapılabilir. Genel KT=Σy2=2831351- 5405 2 =883749.3, 15 regresyonun varyansı (Hata KO) yukarıda 2826.5 bulunduğuna göre, Hata KT=2826.5×12=33918'dir. Serbestlik dereceleri ise, regresyonun 2, hata’nın n-k=15-3=12 olduğuna göre, varyans analizi Tablo 14.13'deki gibidir. Tablo 14.13: Misal 14.5'e ait varyans analizi Varyasyon Kaynağı Regresyon Hata Genel KT 849831.3 33918 883749.3 SD 2 12 14 KO 424915.65 2826.5 F 150.33*** 2’ye 12 SD’li F tablo değerleri, F0.05=3.885, F0.01=6.927, F0.001=12.972'dir. Hesaplanan değer bunların hepsinden büyük olduğuna göre, çap, boy ile hacım arasındaki ilişkinin %99.9’dan büyük güven düzeyinde önemli olduğuna hükmedilir. Korelasyon katsayısının hesabı: Tüm korelasyon katsayısı (veya belirginlik katsayısı) esasen çoğul regresyonlarda anlam kazanmaktadır. Çünkü bu regresyonlarda birden fazla serbest değişken, bir bağlı değişkeni belirtmektedir. (14.31.) nolu formül misale uygulanacak olursa: r2=849831.3/883749.3=0.962 bulunur. Demek ki çap, boy değişkenleri ile, hacım artımının 0.962'si belirtilmiştir. Geriye kalan 1-0.962=0.038'lik kısım bilinmeyen başka değişkenler tarafından belirtilmektedir. r2, t vasıtasıyla kontrol edilecek olursa, (14.4) nolu formüle göre 185 bulunan, 0.9808 15 - 3 =17.429 değeri 12 SD'li t tablo değerleri ile 1 − 0.962 karşılaştırılır ve %99.9 önemli olduğu görülür. t= Hacım (dm3) Misal 14:5'te hesaplanan regresyonun genel yorumu: Misal 14.5 ile, Şeki1 14.12'de görüldüğü üzere doğrusal kökenli bir çoğul regresyon eşitliği hesaplanmıştır. Ele alınan serbest değişkenlerden çap ancak %95 önemli bulunmuş, boy ise önemsiz görünmüştür. Regresyonun çözüm tablosu da, gerçek değerlere çok yakın sonuç verememiştir. Buna karşılık varyans analizi toplu ilişkiyi %99.9 önemli saymıştır. Belirginlik katsayısı da buna paralel sonuç vermiştir. Bu bulgular ışığında acaba kurulan model yeterli midir? 900 800 700 600 500 400 300 200 100 0 Boy Çap 8 12 16 20 24 28 32 Çap (cm) veya Boy (m) Şekil 14.13: Hacmın Boy ve Çapa göre değişimi Çapın hacıma göre ve boyun hacıma göre Şekil 14.13'te gösterilen değişimleri incelenecek olursa, her ikisinin de doğrudan çok birer eğriye benzediği anlaşılmaktadır. Bu durumda ilişkinin eğrisel esaslı regresyonlarla daha iyi temsil edilebileceği söylenebilir. O halde başka bir model kurarak ilişkinin aşağıdaki gibi yeniden analizi yerinde olacaktır. Misal 14.6: Misal 14.5'te incelenen çap, boy ile hacım ilişkisinin eğrisel çoğul regresyonla analizi. Bu maksatla, Hacım=a+b1Çap+-b2Boy·+b3Çap2+b4Boy2 şeklinde bir model kurarak regresyonu hesaplayalım. Burada gerekli olan ilave değişkenler çap ve boy değerlerinin kareleridir. Konuyu fazla uzatmamak için çözüm bilgisayarla yapılarak sonuçlar ve yorum aşağıda verilmiştir. Regresyon denklemi aşağıdaki gibi hesaplanmıştır: Y=209.5-26.222çap-8.894boy+1.2529çap2+0.6784boy2 186 Regresyonun çapa ve boya göre çözümü Tablo 14.14'te, üç boyutlu grafiği ise Şekil 14.14'te gösterilmiştir. Tablo 14.14: Y=209.5-26.222çap-8.894boy+1.2529çap2+0.6784boy2 regresyonunun beklenen değerleri Çap (cm) 12 14 16 18 20 22 24 26 28 30 10 54.2 66.9 89.6 122.4 165.2 218.0 280.8 353.6 436.5 529.4 12 66.2 79.0 101.7 134.4 177.2 230.0 292.8 365.7 448.6 541.5 14 83.7 96.4 119.2 151.9 194.7 247.5 310.3 383.2 466.1 558.9 Hacım (dm3) Boy (m) 16 18 20 106.6 135.0 168.8 119.4 147.7 181.5 142.1 170.4 204.2 174.8 203.2 237.0 217.6 246.0 279.7 270.4 298.8 332.5 333.2 361.6 395.4 406.1 434.4 468.2 489.0 517.3 551.1 581.9 610.2 644.0 22 208.0 220.7 243.4 276.2 318.9 371.7 434.6 507.4 590.3 683.2 24 252.6 265.3 288.0 320.8 363.6 416.4 479.2 552.0 634.9 727.8 26 302.6 315.3 338.1 370.8 413.6 466.4 529.2 602.1 684.9 777.8 Tablo incelendiğinde, beklenen değerlerin gözlenen değerlere bu defa çok daha yakın olduğu anlaşılmaktadır. Regresyonun varyansı: sd2=130.65, çap'ın varyansı: sb12=4.0523, boy'un varyansı: sb22=4.1815, 2 2 çap ’nin varyansı:sb3 =0.10425, sb42=0.12502 bulunmuştur. boy2'nin varyansı Buna göre katsayıların önemliliği için: tb1=-26.222/4.0523=-6.471 tb2=-8.894/4.1815=-2.123 tb4=0.6784/0.12502=5.423 tb3=1.2529/0.10425=12.018 hesaplanır. n-k=15-5=10 SD’li t tablo değerleri, t0.05=2.228, t0.01=3.169, t0.001=4.587’dir. O halde katsayılardan b1 %99.9 önemli, b2 önemsiz, b3 ve b4 %99.9 önemli görünmektedir. Bu durumda b2 atılarak yeni bir regresyon eşitliği hesaplanabilir veya bu haliyle eşitlik kabul edilir. 187 26 22 18 14 10 Boy (m) Hacım (dm3) 800 700 600 500 400 300 200 100 0 12 14 16 18 20 22 24 26 28 30 Çap (cm) Şekil 14.14: Y=209.5-26.222çap-8.894boy+1.2529çap2+0.6784boy2 regresyonunun 3 boyutlu grafik halinde gösterilişi ve regresyon yüzeyi Varyans analizi ise Tablo 14.15'deki gibi hesaplanmıştır. Tablo 14.15: Misal 14.6'ya ait varyans analizi Varyasyon Kaynağı Regresyon Hata Genel KT 883488.1 130.6 883618.7 SD 2 10 14 KO 220872.0 13.06 F 16912.1*** 4’e 10 SD’li F tablo değerleri, F0.05=3.478, F0.01=5.994, F0.001=11.282 olduğuna göre, regresyon %99.9’dan yüksek güven düzeyinde önemlidir. Bu defa hesaplanan F oranı da önceki modele nazaran belirgin şekilde yükselmiştir. r2=0.9998 hesaplanmıştır. Bu da %99.9 önemlidir. Demek ki eldeki 4 serbest değişken ilişkinin %99.98’ini belirtmiştir. Genel olarak bir önceki model ile karşılaştırıldığında, bu modelin ilişkiyi çok daha iyi temsil ettiği görülmektedir. 14.5.Regresyon Analizi ve Model Seçimi Herhangi bir regresyon eşitliğinin hesabında, ilişkinin denklemi tam olarak bilinmiyorsa veya düşünülen bir kaç modelden en iyisinin seçimi söz 188 konusu ise yukarıdaki misallerde anlatılan işlemler yapılarak regresyona ait istatistikler test edilir. Bütün bu işlemler regresyon analizi olarak adlandırılır. Özellikle çoğul regresyonlarda en iyi eşitliği (modeli) bulmak için tekrar tekrar onlarca analiz yapmak ve grafik çizmek gerekebilir. Regresyon analizleri ve grafik çizimleri günümüzde bilgisayarla kolaylıkla yapılabilmektedir. Regresyon analizleri ve model seçimi şu hususlann ışığında yapılır: • Benzeri bir konuda daha önce bir regresyon eşitliğinin hesaplanıp hesaplanmadığı tetkik edilir veya olayın kanuniyetinin bilinip bilinmediği araştırılır. • Đki boyutlu bir grafikle temsil edilebilecek bir regresyon söz konusu ise, serpilme diyagramı çizilerek noktaların nasıl bir seyir takip ettiğine bakılır. Đki boyutlu grafiklerde noktaların seyri muhtemelen Şekil 14.10'da gösterilen modellerden birine benzeyebilir. Bu muayene ile ayrıca, hatalı ölçülmüş veya regresyonu bozabilecek sapkın değerler de görülebilir. Mümkünse bu değerler düzeltilir veya atılır. • Bir çoğul regresyon üzerinde duruluyorsa ve asli değişkenler yeterli görülmüyorsa veya bir eğrisel regresyon söz konusu ise, eşitlikte yer alması muhtemel değişkenler türetilir. • Korelasyon (veya belirginlik) katsayısı hesaplanarak test edilir, önemli olup olmadığına bakılır. • Regresyon katsayıları hesaplanarak önemlilikleri kontrol edilir. Regresyona ait varyans analizi yapılır. F'in önemliliği kontrol edilir. Çizilebiliyorsa regresyonun grafiği çizilir, hattın noktalara uyumu gözle kontrol edilir. • Özelikle grafiği çizilemeyen çoğul regresyonlarda beklenen değerler hesaplanarak, bunların gözlenen değerlere yakınlığına bakılır. Modelde eğrilik unsuru taşıyan değişkenlerin (karesel, kübik, logaritmik veya ters sayı veya bunların kombinasyonları) bulunması halinde özellikle uç değerlere uyum üzerinde durulur. Bazı modeller uçlarda kıvrılma yapabilmektedir. • Gözlenen sınırlar dışına ait tahmin yapılmak isteniyorsa, seçilen modelin ekstrapolasyona uygun bir model olup olmadığı üzerinde durulur. • Bütün bunlar tatmin edici bir sonuç vermişse model kabul edilir. • Özellikle uç noktalar iyi uyum sağlamamışsa, yeni değişkenler türetilerek başka bir model aramak üzere analizlere devam edilir. • Bir ilişki bekleniyorsa ve bütün bunlara rağmen uygun bir model seçilememişse, verinin yetersizliği akla gelir. Bu durumda yeni veriler toplanarak örnek büyüklüğü genişletilir. Bazı bilgisayar programları, asli ve türetilmiş onlarca serbest değişkene ait regresyon katsayılarını kontrol edip, önemsiz olanları ata ata sonuca giderek 189 model seçmektedirler. Bu tarz regresyon analizine step-wise (adım-adım) analiz denmektedir. Bu metot kullanılsa bile, bilgisayarın seçtiği modele güvenilmeyip, beklenen değerler tablosu yapılarak modelin gerçeğe uygun olup olmadığına mutlaka bakılmalıdır. Uygun model tesbit edildikten sonra, regresyona ait; • korelasyon (veya belirginlik) katsayısı ve önem düzeyi, • regresyon katsayıları ve önem düzeyleri, • regresyonun standart hatası, • varyans analizine ait F oranı ve önem düzeyi ile • grafik ve gerekli hallerde beklenen değerlere ait çözüm tablosu verilir. 190 15. t, KHĐ-KARE VE F DEĞERLERĐNE AĐT OLASILIĞIN HESAPLANMASI 15.1.Giriş Đstatistikte önemlilik kontrollarında, hesaplanan istatistiklerin gerçekleşme olasılıklarını (veya güven düzeylerini) tesbit etmek amacıyla, bilindiği gibi ilgili değerler için düzenlenmiş tablolara bakılmaktadır. Mesela t için Ek Tablo 2'ye, khi-kare için Ek Tablo 3'e ve F için Ek Tablo 4'e bakılır. Ancak bu tablolar, belli serbestlik derecelerine ve belli olasılık derecelerine (genellikle 0.05 ve 0.01) göre düzenlenmişlerdir. Bazı hallerde elde edilen bir istatistiğin mevcut serbestlik dereceleri dahilinde, tam olarak ne olasılıkta gerçekleştiği, yani ne seviyede önemli olduğu bilinmek istenebilir. Đşte bu bölümde bu üç istatistiğin, eldeki serbestlik derecelerine göre gerçekleşme olasılıklarını hesaplamayı sağlayan formüller ve hesap tarzları açıklanacaktır. Metot ilgili bilgisayar programlarında kullanılmaktadır. Formüller, üs alabilen her hangi bir hesap makinesi ile de kolaylıkla çözülebilecek niteliktedir. Đşlemler ne kadar çok ondalık üzerinden yapılırsa, sonucun hassasiyeti o kadar artmaktadır. Bu bölümün hazırlanmasında “Computer Programming in Quantitative Biology, Davies,R.G., Academic Press, London and New York, 1971” adlı eserden yararlanılmıştır. 15.2.t'ye Ait Olasılığın Hesabı Her hangi bir t istatistiğinin olasılığı, kendi SD'ne ve aşağıdaki formüllere göre hesaplanabilir. Bunun için, önce aşağıdaki formüllere göre A ve B gibi iki değer hesaplanır: A= B= 2 9 2 9 × t' ye ait SD Bunlar ve F=FT=t2 olarak hesaplanan değer: 191 (15.1) (15.2) (1 − B) × FT 0.3333333 − 1 + A 0.6666667 +A B× F Z=Mutlak (15.3) formülünde yerine konularak Z bulunur. Ancak Z mutlak değer olarak dikkate alınmalıdır. t'ye ait SD 4'den küçükse (4 ve daha büyük serbestlik dereceleri için bu işlem gerekmez), bulunmuş olan Z değeri üzerinden aşağıdaki formüle göre yeni bir Z değeri hesaplanır: Z=Z× 1 + 0.08 × Z 4 (t ' ye ait SD (15.4) Bu işlemlerden sonra Z, aşağıdaki (15.5) nolu formülde yerine konularak t'nin olasılığı bulunur: P= 0.5 (1 + Z × (0.196865 + Z × (0.115194 + Z × (0.000344 + Z × 0.019527 )))) 4 (15.5) Bir misal olarak, 8.3 nolu maddede hesaplanan 9 SD'li t=3.943’ün oluş ihtimali aşağıdaki gibi hesaplanabilir: A=2/9=0.2222222 B=2/(9×9)=0.0246913 2 F = FT = 3.943 = 15.54725 (1 − 0.0246913) × 15.54725 0.3333333 − 1 + 0.2222222 =2.701249 0.6666667 + 0.2222222 0.0246913 × 15.54725 Z=Mutlak t'nin serbestlik derecesi 3'den büyük olduğundan (15.4) nolu formül kullanılmadan, doğrudan (15.5)'e göre: P= 0 .5 = (1 + 2.7 × (0.196865 + 2.7 × (0.115194 + 2.7 × (0.000344 + 2.7 × 0.019527)))) 4 P=0.00366 bulunur. 0.01>P>0.001 olduğundan, hesaplanan t %99 önemli sayılır. 192 15.3.Khi-kare’ye Ait Olasılığın Hesabı Her hangi bir Khi-kare değerinin olasılığı, yine kendi SD'ne ve yukarıdaki formüllere göre aynı yol izlenerek hesaplanır. Ancak bu defa F değeri olarak, χ2 (15.6) F= 2 χ ' ye ait SD esas alınır. (15.6) nolu formüle göre hesaplanan F, 1'den büyükse, (15.1) ve (15.2) nolu formüller: A= 2 9 × χ ' ye ait SD 2 B=0 şekline dönüşür ve FT=F sayılır. F değeri 1'den küçükse bu defa: A=0 B= 2 9 × χ 2 ' ye ait SD olur ve FT=1/F olarak dikkate alınır. Bundan sonraki işlemler, yine (15.3), (15.4) ve (15.5) nolu formüllere göre yapılır. Ancak (15.4) nolu formül, sadece khi-kare SD'sinin 4'den küçük olması halinde kullanılır; aksi halde dikkate alınmaz. Yine bir misal olarak Madde 7.3'de hesaplanmış 3 SD'li 10.375'lik khikare değerinin olasılığını hesaplayalım: F=10.375/3=3.4583333 bulunur. Bu değer 1’den büyük olduğu için: A=2/(9×3)=0.07407407, B=0, FT=F’dir. Bunlara göre, (1 − 0) × 3.458333330.3333333 − 1 + 0.07407407 =2.154275277 0.6666667 0 × 3.45833333 + 0.07407407 Z=Mutlak hesaplanır. χ2'nin SD=3 olduğundan, (15.4) nolu formüle göre tekrar: Z=2.154275277× 1 + 0.08 × 2.154275277 4 = 2.291752962 32 hesaplanır. Buradan çıkan sonuç: 193 P= 0.5 (1 + 2.291753 × (0.196865 + 2.291753 × (0.115194 + 2.291753 × (0.000344 + 2.291753 × 0.019527)))) 4 = P=0.010959’dur. 0.03>P>0.01 olduğuna göre, χ2 değeri %95 önemli sayılmalıdır. 15.4.F'e Ait Olasılığın Hesabı Bilindiği gibi F istatistiği V1, ve V2 gibi iki varyansın birbirine oranı olup, F= V1/ V2 şeklinde hesaplanmaktadır. Varvans analizinde, Đşlemler (veya Regresyon) Kareler ortalaması = ĐKO = V1 Hata Kareler Ortalaması (residual-error KO) = HKO = V2 olarak dikkate alındığından, burada: A= 2 9 ×V1'e ait SD B= 2 9 ×V2 'ye ait SD ve FT=F’dir. Elde edilen A, B, F ve FT üzerinden hesaplara devam edilerek olasılık (P) bulunur. Burada da (15.4) nolu formül, V2'ye ait SD'nin (yani Hata KO'na ait SD'nin), yalnız 4'den küçük olması halinde kullanılır. Misal olarak, 10.3.2.4 nolu maddede bulunmuş 3.53'lük F oranının olasılığını hesaplayalım: FT=F=3.53'dür. Đşlemlere ait SD 4 olduğundan V1SD=4; hata'ya ait SD 15 olduğundan V2SD=15’dir. O halde: A=2/(9×4)=0.055555 B=2/(9×15)=0.007407 (1 − 0.007407) × 3.530.3333333 − 1 + 0.055555 =2.102111 0.007407 × 3.530.6666667 + 0.055555 Z=Mutlak ve (15.4) nolu formül kullanýlmadan: P= 0.5 (1 + 2.102111 × ( 0.196865 + 2.102111 × (0.115194 + 2.102111 × ( 0.000344 × 2.102111 × 0.019527)))) 4 P=0.01764 bulunur. 0.05>P>0.01 olduğundan, F %95 önemli sayılmalıdır. Varvans analizleri sonucunda daima 1'den büyük F değerleri üzerinde durulduğundan, burada 1’den büyük F değerinin olasılığına ait hesap metodu verilmiştir. 194 16. ARAŞTIRMALARIN ĐSTATĐSTĐK METOTLARA GÖRE DEĞERLENDĐRĐLMESĐ VE SONUÇ RAPORUNUN YAZILMASI Ormancılıkla ilgili bilimsel araştırmalar genellikle 3 ana grupta toplanır: • Mevcut durumu örneklemeye dayalı, ana kütleyi tanıtıcı mahiyette araştırmalar, • Denemelere dayalı araştırmalar, • Yine bir örnekleme ile, sebep-sonuç ilişkisi aramaya yönelik araştırmalar. Araştırma sonuç raporu yazılırken, araştırma çalışmalarının yürütülmesi sırasında yapılan bütün işler ve verinin toplanmasında kullanılan bütün malzeme, ekipman, materyal, raporun materyal ve metot bölümünde ayrıntılı olarak açıklanır. Elde edilen sonuçlar ise bulgular bölümünde anlatılır. 16.1.Ana Kütleyi Tanıtıcı Araştırmalar Bu tip araştırmalar, ana kütleyi layıkıyla temsil edebilecek iyi bir örnekleme gerektirir. Her şeyden önce örnek büyüklüğü yetersiz olmamalıdır. Örneğin nereden (veya nerelerden), ne zaman alındığı, örneği teşkil eden nesneler ve nasıl bir örnekleme yapıldığı rapora ayrıntılı olarak yazılır. Örneğin ne yönüyle ele alındığı, hangi özellik veya özelliklerin; nasıl ölçüldüğü, tartıldığı, sayıldığı anlatılır. Ölçü birimleri verilir. Örneğin ölçülmesi, tartılması veya sayılması sonucu elde edilen veri frekans tablosunda özetlenerek ve grafiği çizilerek populasyonun tipi belirlenir. Sonra da ilgili populasyon tipine özgü dağılımlar yoluyla populasyon tahmin edilmeye; çalışılır. Genellikle karşılaşılacak populasyon, normal dağılım gösteren bir populasyondur. Böyle bir populasyonu tanıtmak için şu işlemler yapılır ve sonuçta şu istatistikler verilir: • Örneğin (veya örneklerin) büyüklüğü, değişim sınırları, aritmetik ortalama ve standart sapmaları verilir. • Ortalamanın standart hatası hesaplanarak populasyonun güven sınırları tahmin edilir. • Belli bir güven düzeyinde % örnekleme hatası verilir. • Dağılımın histogramı çizilir, bu histogramdan normal dağılım eğrisi geçirilir, beklenen frekansları hesaplanır. Normal dağılıma uygunluk testi yapılarak, örneğin böyle bir populasyondan çekilmiş olup olmadığı denetlenir. Sonuç normal dağılıma uygun çıkmamışsa, yapılan 195 yanlışlıklar olup olmadığı gözden geçirilir ve/veya örnek büyüklüğü artırılmaya çalışılır. Her şeye rağmen sağlıklı bir sonuç alınamıyorsa, bunun sebebi izah edilmeye çalışılır. • Dağılımların oransal frekansları grafikler halinde gösterilebilir. • Örneklerin ortalama ve s2 bakımından farklı populasyonlar ait olma olasılığı varsa, ikili karşılaştırmalarla bu olasılıklar denetlenir. Varsa farklılığın olasılığı belirtilir. 16.2.Denemelere Dayalı Araştırmalar Denemeler, bir veya birkaç faktörün bir olgu üzerindeki etkisini görmek maksadıyla tesis edilirler. Değerlendirilmelerinde genellikle varyans analizleri kullanılır. Ormancılıkta genellikle arazi denemeleri düzenlenmektedir. Bu tür araştırmaların raporu yazılırken şu hsuslar dikkate alınır: • Araştırma raporunda, böyle bir denemenin ne amaçla, nerede, ne zaman, nasıl bir deneme desenine göre kurulduğu, ne şekilde yürütüldüğü anlatılır. Yörenin iklim, toprak özellikleri tanıtılır. Tercihan denemenin yürütüldüğü yı1 veya yıllara ilişkin iklim istatistikleri verilir. Deneme materyali ve üzerinde durulan özellikleri belirtilir. Yine verinin nasıl toplandığı, ölçünün, tartının nasıl yapıldığı anlatılır. Denemenin projede öngörülen esaslara göre yürütülüp yürütülmediği, varsa deney ünitelerindeki kayıplar ve karşılaşılan güçlükler, istenmeyen veya yerine getirilemeyen işlemler açıklanır. • Denemenin bitirilmesinden ve verinin elde edilmesinden sonra analizlere geçilir. Yapılacak analizler varyans analizleri ise, bunlar mutlaka tertibe uygun tipte varyans analizleri olmalıdır. Her şeyden önce bu kitapta yer almayan başka deneme tertipleri olduğu unutulmamalı ve deneme hangi deneme tertibine uygun olarak kurulduysa veriye o analiz tekniği uygulanmalıdır. • Çok faktörlü denemelerin değerlendirilmesinde ve yorumunda dikkatli olunmalıdır. Özellikle değişik yörelerde ve yıllarda yürütülen denemelerde uygun analiz metodunun belirlenmesinde hassas davranılmalıdır. • Varyans analizleri ile etkileri aranan işlemlerin gerçekten etkili (signifikant) olup olmadığı, olmuşsa güven düzeyleri bulunur ve sonuç varyans analizi tablosunda verilir. • Đstatistik anlamda önemli bulunan işlemlerin ortalamaları birbirleriyle mukayese edilerek farklı (veya farksız) olanlar belirlenir. Sonuçlar tablolarda özetlenir. Đşlemlere ilişkin tavsiyelerde bulunulurken, uygulama kolaylığı, maliyet vs göz önünde tutulur. • Denemenin değerlendirilmesiyle mantıksız sonuçlar elde edilmişse 196 veya mutlaka etkili olması beklenen işlemler etkisiz çıkmışsa, deneme materyalinin iyi tetkik edilmediği, denemenin elde olan veya olmayan sebeplerden dolayı istenildiği veya projede öngörüldüğü şekilde yürütülemediği, denemeye sahip çıkılamadığı veya ölçmelerin hatalı yapıldığı vs akla gelmelidir. Telafisi mümkünse bu hatalar düzeltilmeye çalışılır; değilse sonuçlara itibar edilmeyerek deneme yenilenir veya dosyası kapatılır. Biyolojiye ve tabii bilimlere aykırı sonuçlanmış bir denemenin sonuçları asla yayınlanmamalıdır. 16.3.Sebep-Sonuç Đlişkisi Arayan Araştırmalar Bu tip araştırmalarda, öncelikle aranan ilişki veya ilişkilerin mantıklı, izah edilebilir olmasına dikkat edilmelidir. Bu tip araştırmaların değerlendirilmesinde korelasyon, regresyon analizleri kullanılır. Normal olarak her veri grubundan her türlü regresyon modeli geçirilebilir. Bağıntı bir basit doğrusal regresyonla ifade edilemeyecekse, regresyon analizlerinde üzerinde durulacak en önemli iş model seçimidir. Teorik olarak iki noktadan bir doğru, üç noktadan bir eğri geçtiği; buna karşılık az sayıda verinin güvensizliği hatırlanarak, regresyon analizleri için yine iyi bir örnekleme ile olabildiğince fazla veri toplanmalıdır. Bu arada, aranacak ilişkinin basit bir korelasyonregresyon mu olduğu, yoksa eğrisel bir model ile mi temsil edilebileceği veya bir çoğul ilişki üzerinde mi durulduğu önceden bilinebilir veya bilinmeyebilir. Korelasyon ve regresyon analizi gerektiren durumlarda veriler şu şekilde değerlendirilir: • Yine önce örnek, örneğin alındığı yer, zaman ve örnekleme metodu hakkında etraflı bilgi verilir. • Araştırma yalnız bir korelasyon analizi ile sonuçlandırılabilecek ilişki üzerinde duruyorsa, gerekli analizler yapılarak korelasyon (veya belirtme) katsayısı hesaplanır, güven düzeyi belirlenir ve bunlar raporda verilir. • Konu bir regresyon ise ve ilişkinin kanuniyeti biliniyorsa, korelasyon katsayısı ile birlikte regresyon katsayısı (veya katsayıları) hesaplanır, önemlilikleri belirlenir; regresyon eşitliği ile birlikte verilir. Bunun yanında regresyonun varyans analizi yapılarak tüm regresvonun önemliliği belirlenir. Varyans analizi, regresyonun önemi ve regresyonun standart hatası ile birlikte verilir. Regresyon 2 veya 3 boyutlu bir grafik halinde gösterilebiliyorsa, bu grafikler çizilir. Çoğul regresyonlarda ayrıca beklenen değerler tablosu verilir. • Korelasyon ve regresyona ait istatistikler, katsayıların önemli çıkmaları halinde verilir. Yapılan analizler sonucu beklenen ilişkiler önemli bulunmamışsa, herhangi bir katsayı, istatistik veya grafik verilmez. Sadece aranan ilginin bulunamadığından söz edilir. 197 • Aranan ilginin var olup olmadığı veya ne tür bir regresyon eşitliği ile temsil edilebileceği bilinmiyorsa Madde 14.5'te açıklananlarla beraber şu işlemler yapılır: • Veri iki boyutlu bir koordinat sisteminde gösterilebilecekse serpilme diyagramı çizilir ve noktalardan bir doğru veya eğri geçip geçmediği gözle kontrol edilir. Noktalar bir doğru veya eğri üzerinde toplanma eğilimi göstermeyip bir daire oluşturacak şekilde dağılmışlarsa, bir ilişki olmadığına hükmedilir. Bir doğru söz konusu ise basit doğrusal regresyonla iş bitirilir. Noktalar bir eğri üzerinde toplanma eğiliminde ise, Şekil 14.10’da gösterilen modellerden hangilerine uyabilecekleri belirlenir. Regresyon analizi yapılıp grafiği çizilerek bir sonuca varılmaya çalışılır. Denenen model veriye uymamışsa, başka bir model belirlenerek ve modeldeki değişkenler türetilerek aynı işler yapılır. Her şeye rağmen Tablo 14.10’daki modeller veriye uymamışsa bu tabloda bulunmayan eşitlik tipleri türetilip denenebilir. Analizlere, uygun bir model bulununcaya kadar devam edilir. • 3 veya daha fazla serbest değişkenli bir çoğul regresyon söz konusu ise, önce doğrudan bunların kendileri üzerinden bir analiz yapılır. Sonuç alınamamışsa ilişkide yer alması muhtemel çeşitli değişkenler türetilerek bir dizi regresyon analizi yapılır. Bu maksatla varsa step-wise regresyon analizi yapabilen bir bilgisayar programı kullanılır. Analizler sonucu bir ilişki belirlenemezse yapılacak bir şey yoktur. Uygun bir model belirlenirse alınan sonuçlar yukarıda açıklandığı gibi rapora yazılır. 16.4. Son Söz Đstatistikte, öncelikle yanlış veya hatalı verilerle doğru sonuca gidilemeyeceği hatırdan çıkarılmamalıdır. Bu sebepten, toplanan verinin doğru ve denemenin veya örneklemenin öngördüğü şekilde elde edilmiş olmasına dikkat edilmelidir. Değerlendirmelerde, istatistiğin bir araç, yapılan işin bir tahmin olduğu unutulmamalıdır. Özellikle denemelerden alınan sonuçlar, o yıla ve o yöreye, hatta o araziye ait olabilir. Bu bakımdan 0.05 olasılıklı sonuçlar ihtiyatla karşılanmalıdır. Bu arada, ormancılıkta objenin, türüne göre ömrü onlarca yılı aşabilen "ağaçlar" olduğu akıldan çıkarılmamalıdır. Böyle bir obje üzerinde erken yaşlarda istatistiğin önemli dediği bir etkinin idare müddetine yansıyıp yansımayacağı göz önünde bulundurulmalı ve bu düşünce ile denemeler kurulmalı ve değerlendirilmelidir. 198 FĐHRĐST 2X2 denemesi 4X3 denemesi binom populasyonları 50 birinci derece interaksiyon 122 birleştirilmiş (toplanmış) varyans 79 bloklar 117 bölünmüş parseller 137 bölünen bölünmüş parseller 137 124 132 A a katsayısının varyansı 157 a katsayısının önemliliği 157 alt parseller 137 alt-alt parseller 137 alternatif hipotez 63 ana kütle 43 ana parseller 137 analitik (parametrik) ortalamalar 13 analitik olmayan ortalamalar 13 ara etki 122 arc-sinüs dönüştürmesi 58 aritmetik ortalama 13 asgari önemli fark 104 atipik olaylar 2 ayrılma 31 Ç Çarpık eğri çarpımlar toplamı çoğul ilişkiler çoğul korelasyon çoğul regresyon çoğul regresyonun varyansı çok basamaklı örnekleme çubuklu diyagram D dağılım dağılımın sınırları dağılma daire grafik değişim değişim genişliği değişim katsayısı değişken ‘den daha az tablosu deneme deneme desenleri deneme parseli deneme tertipleri denemenin planlanması deneysel hata desiller devamlı değişken doğru denklemi dönüştürmeler Duncan testi B bağımsız değişken bağımsız örnekler bağımsızlık kontrolu bağlı değişken Bartlett testi basit etki basit rastgele örnekleme basit seri başarı başarısızlık beklenen değer belirtme katsayısı bilinçli örnekleme Binom dağılımı binom katsayısı 10 145 180 144 144 184 61 8 144 75 72 144 111 124 60 4 50 50 155 180 60 50 51 199 4 32 31 8 31 32 39 3,144 7 3 89,95 94 94 89 78,90 34 3 150 57 105 düzeltme faktörü (terimi) gruplar içi kareler toplamı 97 güven düzeyi 65 güven sınırları 67,163 güven şeridi 163 38,113 E eğrisel regresyon 165 eklemeli (birikimli-kümülatif) frekans tablosu 7 eksik parsel 119 ekstrapolasyon 155 en küçük kareler metodu 152 en küçük önemli fark 103 en küçük önemli genişlikler 105 error kareler toplamı 99 esas etki 124 eş yapma deneme düzeni 75,84 eşleştirilen örnekler 75,85 eşleştirilmiş örneklerin mukayesesi etkileşim 122 H harmonik ortalama hata hata kareleri ortalaması hata kareleri toplamı hipotez kontrolu histogram homojen deney materyali homojenlik testi Đ iki yanlı dağılım iki yanlı güven sınırları iki yanlı kontrol iki yönlü gruplandırmalar ikinci derece interaksiyon interaksiyon istatistik işlem kombinasyonları izolasyon (tecrit) zonları F F istatistiği F oranı F oranının olasılığı F testi faktöriyel denemeler faktörün seviyeleri fonksiyon frekans frekans eğrisi frekans poligonu frekans tablosu 20 99 161 99,159 62 9 91 75 81 81 194 81 122 122 149 6 10 10 4,6 64 67 66 115 122 122 1,2 123 92 K kaba veriler 4 karekök dönüşümü 57 kareler ortalaması 100 kareler toplamı 36 kareli ortalama 22 kartiller 32 katmanlı (tabakalı) örnekleme 61 kendi içinde eşleştirme 75 khi-kare metodu 68 khi-kare olasılığının hesabı 193 konstant (sabite) 150 kontenjans tabloları 73 kontrol parseli 92 G Gerçekleşme olasılıkları 191 genel kareler toplamı 97,158 geometrik ortalama 17 gözlem 3 gözlem sayıları farklı gruplar 108 grafik 8 gruplandırılmış seri 4,14 gruplar arası kareler toplamı 97 200 korelasyon korelasyon katsayısı kota yöntemi küçük örnek küme örneklemesi 144 145 60 59 61 ortalama 11 ortalama sapma 34 ortalamadan ayrılışların kareleri toplamı 36 ortalamadan sapma 31 ortalamaların ortalaması 16 ortalamanın standart hatası 41 ortanca 24 L logaritmik dönüştürme logaritmik fonksiyonlar LSD metodu 57 166 104 Ö örnek 59 örnek büyüklüğü 87 örnek ortalamalarına ait varyans 41 örnekleme hatası 163,165 örnekleme 2 örnekleme hatası % 41 M µ (mü) 44 matematik eşitlik 148,151 matematik ilişki 148 medyan 24 medyan sınıfı 25 mekanda bölünmüş parseller 139 merkezi eğilim noktası 11 merkezi eğilim ölçüsü 11 mod 27 model I 130 model II 130 monografi 60 müşterek varyans 79 P parabol parametre Pascal üçgeni persentiller Poisson populasyonları polinomlar populasyon pozitif korelasyon pozitif meyil N negatif ilişki 150 negatif korelasyon 148 negatif meyil 150 nicel (miktara bağlı, kantitatif) özellik 3 nitel (vasıflandırılabilir, kalitatif) özellik 2 non-signifikant 102 normal dağılış 43 normal populasyonlar 43 nümune 59 166,175 2 51 34 55 166 2 148 150 R RXC tabloları 73 rastgele örnekleme 60 rastgelelik 2 rastlantı blokları 115 red bölgesi 66 regresyon 144 regresyon analizi 188 regresyon düzlemi 181 regresyon eşitliği 152 regresyon kareleri toplamı 159 regresyon katsayısı 150,175 O 201 step-wise (adım-adım) analiz 190 Student’in t dağılımı 63 Student-Newmann-Keuls testi 107 sürekli değişken 3 regresyon katsayısının güven sınırları 157 regresyon katsayısının varyansı 155 regresyon modeli 189 regresyon varyans analizi 158 regresyon yüzeyi 181 regresyonda örnekleme hatası 163 regresyondan ayrılış kareleri ortalaması 156 regresyondan ayrılışların kareleri toplamı 156 regresyonun güven şeridi 163 regresyonun standart hatası 162 regresyonun varyansı 156 residual kareler toplamı 99 r’nin güven sınırları 148 Ş şahit parsel 92 T t dağılımı 63 t istatistiği 63 t istatistiğinin olasılığı 191 tahmin 67 tahminin standart hatası 162 tam (kati) değişken 3 tam ilişki 151 tartılı (ağırlıklı) ortalama 16 tasnif edilmiş seri 4 tek yanlı dağılım 65 tek yanlı güven sınırları 67 tek yanlı hipotez kontrolu 67 tek yönlü gruplandırma 96 tekrarlama (tekerrür) 76,91,94 teorik değer 155 tepe değeri 27 ters sayı fonksiyonları 166 tesadüf örneği 2 tesadüf parselleri deneme düzeni 94 transformasyonlar 57 tesadüfî model 130 tesadüfî örnekleme 2 tesadüfîlik 2 tipik olaylar 2 t kontrolu (t testi) 76 Tukey metodu 102 tüm korelasyon katsayısı 180 türetilmiş değişken 171 S σ (sigma) 44 Σ (büyük sigma) 13 S eğrisi 166 sabit model 130 serbest değişken 144 serbestlik derecesi 36,99 seri 4 serpilme diyagramı 151 sıfır hipotezi 62 simetrik eğri 10 sınıf 5 sınıflanmış seri 14 sınıf açıklığı 5 sınıf değeri 5 sınıf genişliği 5 sınıf sayısı 5 sıralı dizi 4 sistematik (dizgeli) örnekleme 61 standart hata 157,162,173,177 standart hata şeridi 162 standart normal dağılım 46 standart normal varyant 47 standart sapma 36 U uygunluk testi 202 69 Ü üçüncü derece interaksiyon 122 V varyabl 144 varyans 36 varyanslar 100 varyans analizi 94,96 varyans analizi tablosu 101 varyans kaynakları 97 varyansların eşitliğinin kontrolu 81 varyansların homojenliğinin kontrolu 111 varyant 4 varyasyon 31 varyasyon katsayısı 39 varyasyon kaynakları 159 Y yineleme yoğunluk yöntemi 76,91,94 60 Z zamanda bölünmüş parseller 139 203 204 EK TABLOLAR 205 Ek Tablo 1: z Değerleri z 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.0 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3.0 3.1 3.2 3.3 3.4 3.5 3.6 3.7 3.8 3.9 4.0 0.00 0.0000 0.0398 0.0793 0.1179 0.1554 0.1915 0.2257 0.2580 0.2881 0.3159 0.3413 0.3643 0.3849 0.4032 0.4192 0.4332 0.4452 0.4554 0.4641 0.4713 0.4772 0.4821 0.4861 0.4893 0.4918 0.4938 0.4953 0.4965 0.4974 0.4981 0.4987 0.4990 0.4993 0.4995 0.4997 0.4998 0.4998 0.4999 0.4999 0.5000 0.5000 0.01 0.0040 0.0438 0.0832 0.1217 0.1591 0.1950 0.2291 0.2611 0.2910 0.3186 0.3438 0.3665 0.3869 0.4049 0.4207 0.4345 0.4463 0.4564 0.4649 0.4719 0.4778 0.4826 0.4864 0.4896 0.4920 0.4940 0.4955 0.4966 0.4975 0.4982 0.4987 0.4991 0.4993 0.4995 0.4997 0.4998 0.4998 0.4999 0.4999 0.5000 0.5000 0.02 0.0080 0.0478 0.0871 0.1255 0.1628 0.1985 0.2324 0.2642 0.2939 0.3212 0.3461 0.3686 0.3888 0.4066 0.4222 0.4357 0.4474 0.4573 0.4656 0.4726 0.4783 0.4830 0.4868 0.4898 0.4922 0.4941 0.4956 0.4967 0.4976 0.4982 0.4987 0.4991 0.4994 0.4995 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 0.03 0.0120 0.0517 0.0910 0.1293 0.1664 0.2019 0.2357 0.2673 0.2967 0.3238 0.3485 0.3708 0.3907 0.4082 0.4236 0.4370 0.4484 0.4582 0.4664 0.4732 0.4788 0.4834 0.4871 0.4901 0.4925 0.4943 0.4957 0.4968 0.4977 0.4983 0.4988 0.4991 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 0.04 0.0160 0.0557 0.0948 0.1331 0.1700 0.2054 0.2389 0.2704 0.2995 0.3264 0.3508 0.3729 0.3925 0.4099 0.4251 0.4382 0.4495 0.4591 0.4671 0.4738 0.4793 0.4838 0.4875 0.4904 0.4927 0.4945 0.4959 0.4969 0.4977 0.4984 0.4988 0.4992 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 0.05 0.0199 0.0596 0.0987 0.1368 0.1736 0.2088 0.2422 0.2734 0.3023 0.3289 0.3531 0.3749 0.3944 0.4115 0.4265 0.4394 0.4505 0.4599 0.4678 0.4744 0.4798 0.4842 0.4878 0.4906 0.4929 0.4946 0.4960 0.4970 0.4978 0.4984 0.4989 0.4992 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 0.06 0.0239 0.0636 0.1026 0.1406 0.1772 0.2123 0.2454 0.2764 0.3051 0.3315 0.3554 0.3770 0.3962 0.4131 0.4279 0.4406 0.4515 0.4608 0.4686 0.4750 0.4803 0.4846 0.4881 0.4909 0.4931 0.4948 0.4961 0.4971 0.4979 0.4985 0.4989 0.4992 0.4994 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 0.07 0.0279 0.0675 0.1064 0.1443 0.1808 0.2157 0.2486 0.2794 0.3078 0.3340 0.3577 0.3790 0.3980 0.4147 0.4292 0.4418 0.4525 0.4616 0.4693 0.4756 0.4808 0.4850 0.4884 0.4911 0.4932 0.4949 0.4962 0.4972 0.4979 0.4985 0.4989 0.4992 0.4995 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 0.08 0.0319 0.0714 0.1103 0.1480 0.1844 0.2190 0.2517 0.2823 0.3106 0.3365 0.3599 0.3810 0.3997 0.4162 0.4306 0.4429 0.4535 0.4625 0.4699 0.4761 0.4812 0.4854 0.4887 0.4913 0.4934 0.4951 0.4963 0.4973 0.4980 0.4986 0.4990 0.4993 0.4995 0.4996 0.4997 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 0.09 0.0359 0.0753 0.1141 0.1517 0.1879 0.2224 0.2549 0.2852 0.3133 0.3389 0.3621 0.3830 0.4015 0.4177 0.4319 0.4441 0.4545 0.4633 0.4706 0.4767 0.4817 0.4857 0.4890 0.4916 0.4936 0.4952 0.4964 0.4974 0.4981 0.4986 0.4990 0.4993 0.4995 0.4997 0.4998 0.4998 0.4999 0.4999 0.4999 0.5000 0.5000 Tablo değerleri MS Excel NORMDIST(z değeri)-0.5 fonksiyonu ile elde edilmiştir. 206 Ek Tablo 2: t Değerleri Serb. Der. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 55 60 70 80 90 100 0.999 0.0000 0.0020 0.024 0.091 0.210 0.381 0.599 0.857 1.152 1.479 1.834 2.214 2.617 3.041 3.483 3.942 4.416 4.905 5.407 5.921 6.447 6.983 7.529 8.085 8.649 9.222 9.803 10.391 10.986 11.588 14.688 17.917 21.251 24.674 28.173 31.738 39.036 46.520 54.156 61.918 0.990 0.0002 0.0201 0.115 0.297 0.554 0.872 1.239 1.647 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.878 13.565 14.256 14.953 18.509 22.164 25.901 29.707 33.571 37.485 45.442 53.540 61.754 70.065 0.975 0.0010 0.0506 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791 20.569 24.433 28.366 32.357 36.398 40.482 48.758 57.153 65.647 74.222 0.950 0.0039 0.1026 0.352 0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493 22.465 26.509 30.612 34.764 38.958 43.188 51.739 60.391 69.126 77.929 O l 0.900 0.0158 0.2107 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.041 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599 24.797 29.051 33.350 37.689 42.060 46.459 55.329 64.278 73.291 82.358 a s ı l ı k l a r 0.500 0.100 0.455 2.706 1.386 4.605 2.366 6.251 3.357 7.779 4.351 9.236 5.348 10.645 6.346 12.017 7.344 13.362 8.343 14.684 9.342 15.987 10.341 17.275 11.340 18.549 12.340 19.812 13.339 21.064 14.339 22.307 15.338 23.542 16.338 24.769 17.338 25.989 18.338 27.204 19.337 28.412 20.337 29.615 21.337 30.813 22.337 32.007 23.337 33.196 24.337 34.382 25.336 35.563 26.336 36.741 27.336 37.916 28.336 39.087 29.336 40.256 34.336 46.059 39.335 51.805 44.335 57.505 49.335 63.167 54.335 68.796 59.335 74.397 69.334 85.527 79.334 96.578 89.334 107.565 99.334 118.498 0.050 0.025 0.010 0.001 3.841 5.024 6.635 10.827 5.991 7.378 9.210 13.815 7.815 9.348 11.345 16.266 9.488 11.143 13.277 18.466 11.070 12.832 15.086 20.515 12.592 14.449 16.812 22.457 14.067 16.013 18.475 24.321 15.507 17.535 20.090 26.124 16.919 19.023 21.666 27.877 18.307 20.483 23.209 29.588 19.675 21.920 24.725 31.264 21.026 23.337 26.217 32.909 22.362 24.736 27.688 34.527 23.685 26.119 29.141 36.124 24.996 27.488 30.578 37.698 26.296 28.845 32.000 39.252 27.587 30.191 33.409 40.791 28.869 31.526 34.805 42.312 30.144 32.852 36.191 43.819 31.410 34.170 37.566 45.314 32.671 35.479 38.932 46.796 33.924 36.781 40.289 48.268 35.172 38.076 41.638 49.728 36.415 39.364 42.980 51.179 37.652 40.646 44.314 52.619 38.885 41.923 45.642 54.051 40.113 43.195 46.963 55.475 41.337 44.461 48.278 56.892 42.557 45.722 49.588 58.301 43.773 46.979 50.892 59.702 49.802 53.203 57.342 66.619 55.758 59.342 63.691 73.403 61.656 65.410 69.957 80.078 67.505 71.420 76.154 86.660 73.311 77.380 82.292 93.167 79.082 83.298 88.379 99.608 90.531 95.023 100.425 112.317 101.879 106.629 112.329 124.839 113.145 118.136 124.116 137.208 124.342 129.561 135.807 149.449 Tablo Microsoft Excel CHIINV(olasılık,serbestlik derecesi) fonksiyonu ile hazırlanmıştır. 207 Ek Tablo 3: Khi-Kare Değerleri Serb. Der. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 35 40 45 50 55 60 70 80 90 100 O l a s ı l ı k l a r 0.999 0.0000 0.0020 0.024 0.091 0.210 0.381 0.599 0.857 1.152 1.479 1.834 2.214 2.617 3.041 3.483 3.942 4.416 4.905 5.407 5.921 6.447 6.983 7.529 8.085 8.649 9.222 9.803 10.391 10.986 11.588 14.688 17.917 21.251 24.674 28.173 31.738 39.036 46.520 54.156 61.918 0.990 0.0002 0.0201 0.115 0.297 0.554 0.872 1.239 1.647 2.088 2.558 3.053 3.571 4.107 4.660 5.229 5.812 6.408 7.015 7.633 8.260 8.897 9.542 10.196 10.856 11.524 12.198 12.878 13.565 14.256 14.953 18.509 22.164 25.901 29.707 33.571 37.485 45.442 53.540 61.754 70.065 0.975 0.0010 0.0506 0.216 0.484 0.831 1.237 1.690 2.180 2.700 3.247 3.816 4.404 5.009 5.629 6.262 6.908 7.564 8.231 8.907 9.591 10.283 10.982 11.689 12.401 13.120 13.844 14.573 15.308 16.047 16.791 20.569 24.433 28.366 32.357 36.398 40.482 48.758 57.153 65.647 74.222 0.950 0.0039 0.1026 0.352 0.711 1.145 1.635 2.167 2.733 3.325 3.940 4.575 5.226 5.892 6.571 7.261 7.962 8.672 9.390 10.117 10.851 11.591 12.338 13.091 13.848 14.611 15.379 16.151 16.928 17.708 18.493 22.465 26.509 30.612 34.764 38.958 43.188 51.739 60.391 69.126 77.929 0.900 0.0158 0.2107 0.584 1.064 1.610 2.204 2.833 3.490 4.168 4.865 5.578 6.304 7.041 7.790 8.547 9.312 10.085 10.865 11.651 12.443 13.240 14.041 14.848 15.659 16.473 17.292 18.114 18.939 19.768 20.599 24.797 29.051 33.350 37.689 42.060 46.459 55.329 64.278 73.291 82.358 0.500 0.100 0.050 0.025 0.010 0.001 0.455 2.706 3.841 5.024 6.635 10.827 1.386 4.605 5.991 7.378 9.210 13.815 2.366 6.251 7.815 9.348 11.345 16.266 3.357 7.779 9.488 11.143 13.277 18.466 4.351 9.236 11.070 12.832 15.086 20.515 5.348 10.645 12.592 14.449 16.812 22.457 6.346 12.017 14.067 16.013 18.475 24.321 7.344 13.362 15.507 17.535 20.090 26.124 8.343 14.684 16.919 19.023 21.666 27.877 9.342 15.987 18.307 20.483 23.209 29.588 10.341 17.275 19.675 21.920 24.725 31.264 11.340 18.549 21.026 23.337 26.217 32.909 12.340 19.812 22.362 24.736 27.688 34.527 13.339 21.064 23.685 26.119 29.141 36.124 14.339 22.307 24.996 27.488 30.578 37.698 15.338 23.542 26.296 28.845 32.000 39.252 16.338 24.769 27.587 30.191 33.409 40.791 17.338 25.989 28.869 31.526 34.805 42.312 18.338 27.204 30.144 32.852 36.191 43.819 19.337 28.412 31.410 34.170 37.566 45.314 20.337 29.615 32.671 35.479 38.932 46.796 21.337 30.813 33.924 36.781 40.289 48.268 22.337 32.007 35.172 38.076 41.638 49.728 23.337 33.196 36.415 39.364 42.980 51.179 24.337 34.382 37.652 40.646 44.314 52.619 25.336 35.563 38.885 41.923 45.642 54.051 26.336 36.741 40.113 43.195 46.963 55.475 27.336 37.916 41.337 44.461 48.278 56.892 28.336 39.087 42.557 45.722 49.588 58.301 29.336 40.256 43.773 46.979 50.892 59.702 34.336 46.059 49.802 53.203 57.342 66.619 39.335 51.805 55.758 59.342 63.691 73.403 44.335 57.505 61.656 65.410 69.957 80.078 49.335 63.167 67.505 71.420 76.154 86.660 54.335 68.796 73.311 77.380 82.292 93.167 59.335 74.397 79.082 83.298 88.379 99.608 69.334 85.527 90.531 95.023 100.425 112.317 79.334 96.578 101.879 106.629 112.329 124.839 89.334 107.565 113.145 118.136 124.116 137.208 99.334 118.498 124.342 129.561 135.807 149.449 Tablo Microsoft Excel CHIINV(olasılık,serbestlik derecesi) fonksiyonu ile hazırlanmıştır. 208 Ek Tablo 4: F Değerleri (0.05 olasılık için) Bölenin Bölünenin Serbestlik Derecesi SD 1 2 3 4 5 6 7 8 9 10 12 1 161.4 199.5 215.7 224.6 230.2 234.0 236.8 238.9 240.5 241.9 243.9 2 18.51 19.00 19.16 19.25 19.30 19.33 19.35 19.37 19.38 19.40 19.41 3 10.13 9.55 9.28 9.12 9.01 8.94 8.89 8.85 8.81 8.79 8.74 4 7.71 6.94 6.59 6.39 6.26 6.16 6.09 6.04 6.00 5.96 5.91 5 6.61 5.79 5.41 5.19 5.05 4.95 4.88 4.82 4.77 4.74 4.68 6 5.99 5.14 4.76 4.53 4.39 4.28 4.21 4.15 4.10 4.06 4.00 7 5.59 4.74 4.35 4.12 3.97 3.87 3.79 3.73 3.68 3.64 3.57 8 5.32 4.46 4.07 3.84 3.69 3.58 3.50 3.44 3.39 3.35 3.28 9 5.12 4.26 3.86 3.63 3.48 3.37 3.29 3.23 3.18 3.14 3.07 10 4.96 4.10 3.71 3.48 3.33 3.22 3.14 3.07 3.02 2.98 2.91 11 4.84 3.98 3.59 3.36 3.20 3.09 3.01 2.95 2.90 2.85 2.79 12 4.75 3.89 3.49 3.26 3.11 3.00 2.91 2.85 2.80 2.75 2.69 13 4.67 3.81 3.41 3.18 3.03 2.92 2.83 2.77 2.71 2.67 2.60 14 4.60 3.74 3.34 3.11 2.96 2.85 2.76 2.70 2.65 2.60 2.53 15 4.54 3.68 3.29 3.06 2.90 2.79 2.71 2.64 2.59 2.54 2.48 16 4.49 3.63 3.24 3.01 2.85 2.74 2.66 2.59 2.54 2.49 2.42 17 4.45 3.59 3.20 2.96 2.81 2.70 2.61 2.55 2.49 2.45 2.38 18 4.41 3.55 3.16 2.93 2.77 2.66 2.58 2.51 2.46 2.41 2.34 19 4.38 3.52 3.13 2.90 2.74 2.63 2.54 2.48 2.42 2.38 2.31 20 4.35 3.49 3.10 2.87 2.71 2.60 2.51 2.45 2.39 2.35 2.28 22 4.30 3.44 3.05 2.82 2.66 2.55 2.46 2.40 2.34 2.30 2.23 24 4.26 3.40 3.01 2.78 2.62 2.51 2.42 2.36 2.30 2.25 2.18 26 4.23 3.37 2.98 2.74 2.59 2.47 2.39 2.32 2.27 2.22 2.15 28 4.20 3.34 2.95 2.71 2.56 2.45 2.36 2.29 2.24 2.19 2.12 30 4.17 3.32 2.92 2.69 2.53 2.42 2.33 2.27 2.21 2.16 2.09 40 4.08 3.23 2.84 2.61 2.45 2.34 2.25 2.18 2.12 2.08 2.00 60 4.00 3.15 2.76 2.53 2.37 2.25 2.17 2.10 2.04 1.99 1.92 80 3.96 3.11 2.72 2.49 2.33 2.21 2.13 2.06 2.00 1.95 1.88 100 3.94 3.09 2.70 2.46 2.31 2.19 2.10 2.03 1.97 1.93 1.85 140 3.91 3.06 2.67 2.44 2.28 2.16 2.08 2.01 1.95 1.90 1.82 10000 3.84 3.00 2.61 2.37 2.21 2.10 2.01 1.94 1.88 1.83 1.75 F tabloları MS Excel FINV(olasılık,sebestlik_derecesi1,serbestlik_derecesi2) fonksiyonu ile hazırlanmıştır. 209 Ek Tablo 4: F Değerleri (Devam) (0.05 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 14 16 20 Bölünenin Serbestlik Derecesi 23 26 30 40 60 80 120 1000 245.4 246.5 248.0 248.8 249.5 250.1 251.1 252.2 252.7 253.3 254.2 19.42 19.43 19.45 19.45 19.46 19.46 19.47 19.48 19.48 19.49 19.49 8.71 8.69 8.66 8.64 8.63 8.62 8.59 8.57 8.56 8.55 8.53 5.87 5.84 5.80 5.78 5.76 5.75 5.72 5.69 5.67 5.66 5.63 4.64 4.60 4.56 4.53 4.52 4.50 4.46 4.43 4.41 4.40 4.37 3.96 3.92 3.87 3.85 3.83 3.81 3.77 3.74 3.72 3.70 3.67 3.53 3.49 3.44 3.42 3.40 3.38 3.34 3.30 3.29 3.27 3.23 3.24 3.20 3.15 3.12 3.10 3.08 3.04 3.01 2.99 2.97 2.93 3.03 2.99 2.94 2.91 2.89 2.86 2.83 2.79 2.77 2.75 2.71 2.86 2.83 2.77 2.75 2.72 2.70 2.66 2.62 2.60 2.58 2.54 2.74 2.70 2.65 2.62 2.59 2.57 2.53 2.49 2.47 2.45 2.41 2.64 2.60 2.54 2.51 2.49 2.47 2.43 2.38 2.36 2.34 2.30 2.55 2.51 2.46 2.43 2.41 2.38 2.34 2.30 2.27 2.25 2.21 2.48 2.44 2.39 2.36 2.33 2.31 2.27 2.22 2.20 2.18 2.14 2.42 2.38 2.33 2.30 2.27 2.25 2.20 2.16 2.14 2.11 2.07 2.37 2.33 2.28 2.24 2.22 2.19 2.15 2.11 2.08 2.06 2.02 2.33 2.29 2.23 2.20 2.17 2.15 2.10 2.06 2.03 2.01 1.97 2.29 2.25 2.19 2.16 2.13 2.11 2.06 2.02 1.99 1.97 1.92 2.26 2.21 2.16 2.12 2.10 2.07 2.03 1.98 1.96 1.93 1.88 2.22 2.18 2.12 2.09 2.07 2.04 1.99 1.95 1.92 1.90 1.85 2.17 2.13 2.07 2.04 2.01 1.98 1.94 1.89 1.86 1.84 1.79 2.13 2.09 2.03 1.99 1.97 1.94 1.89 1.84 1.82 1.79 1.74 2.09 2.05 1.99 1.96 1.93 1.90 1.85 1.80 1.78 1.75 1.70 2.06 2.02 1.96 1.92 1.90 1.87 1.82 1.77 1.74 1.71 1.66 2.04 1.99 1.93 1.90 1.87 1.84 1.79 1.74 1.71 1.68 1.63 1.95 1.90 1.84 1.80 1.77 1.74 1.69 1.64 1.61 1.58 1.52 1.86 1.82 1.75 1.71 1.68 1.65 1.59 1.53 1.50 1.47 1.40 1.82 1.77 1.70 1.67 1.63 1.60 1.54 1.48 1.45 1.41 1.34 1.79 1.75 1.68 1.64 1.61 1.57 1.52 1.45 1.41 1.38 1.30 1.76 1.72 1.65 1.61 1.57 1.54 1.48 1.41 1.38 1.33 1.25 1.69 1.64 1.57 1.53 1.50 1.46 1.40 1.32 1.28 1.22 1.08 210 Ek Tablo 4: F Değerleri (0.025 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 1 2 3 Bölünenin Serbestlik Derecesi 4 5 6 7 8 9 10 12 647.8 799.5 864.2 899.6 921.8 937.1 948.2 956.7 963.3 968.6 976.7 38.51 39.00 39.17 39.25 39.30 39.33 39.36 39.37 39.39 39.40 39.41 17.44 16.04 15.44 15.10 14.88 14.73 14.62 14.54 14.47 14.42 14.34 12.22 10.65 9.98 9.60 9.36 9.20 9.07 8.98 8.90 8.84 8.75 10.01 8.43 7.76 7.39 7.15 6.98 6.85 6.76 6.68 6.62 6.52 8.81 7.26 6.60 6.23 5.99 5.82 5.70 5.60 5.52 5.46 5.37 8.07 6.54 5.89 5.52 5.29 5.12 4.99 4.90 4.82 4.76 4.67 7.57 6.06 5.42 5.05 4.82 4.65 4.53 4.43 4.36 4.30 4.20 7.21 5.71 5.08 4.72 4.48 4.32 4.20 4.10 4.03 3.96 3.87 6.94 5.46 4.83 4.47 4.24 4.07 3.95 3.85 3.78 3.72 3.62 6.72 5.26 4.63 4.28 4.04 3.88 3.76 3.66 3.59 3.53 3.43 6.55 5.10 4.47 4.12 3.89 3.73 3.61 3.51 3.44 3.37 3.28 6.41 4.97 4.35 4.00 3.77 3.60 3.48 3.39 3.31 3.25 3.15 6.30 4.86 4.24 3.89 3.66 3.50 3.38 3.29 3.21 3.15 3.05 6.20 4.77 4.15 3.80 3.58 3.41 3.29 3.20 3.12 3.06 2.96 6.12 4.69 4.08 3.73 3.50 3.34 3.22 3.12 3.05 2.99 2.89 6.04 4.62 4.01 3.66 3.44 3.28 3.16 3.06 2.98 2.92 2.82 5.98 4.56 3.95 3.61 3.38 3.22 3.10 3.01 2.93 2.87 2.77 5.92 4.51 3.90 3.56 3.33 3.17 3.05 2.96 2.88 2.82 2.72 5.87 4.46 3.86 3.51 3.29 3.13 3.01 2.91 2.84 2.77 2.68 5.79 4.38 3.78 3.44 3.22 3.05 2.93 2.84 2.76 2.70 2.60 5.72 4.32 3.72 3.38 3.15 2.99 2.87 2.78 2.70 2.64 2.54 5.66 4.27 3.67 3.33 3.10 2.94 2.82 2.73 2.65 2.59 2.49 5.61 4.22 3.63 3.29 3.06 2.90 2.78 2.69 2.61 2.55 2.45 5.57 4.18 3.59 3.25 3.03 2.87 2.75 2.65 2.57 2.51 2.41 5.42 4.05 3.46 3.13 2.90 2.74 2.62 2.53 2.45 2.39 2.29 5.29 3.93 3.34 3.01 2.79 2.63 2.51 2.41 2.33 2.27 2.17 5.22 3.86 3.28 2.95 2.73 2.57 2.45 2.35 2.28 2.21 2.11 5.18 3.83 3.25 2.92 2.70 2.54 2.42 2.32 2.24 2.18 2.08 5.13 3.79 3.21 2.88 2.66 2.50 2.38 2.28 2.21 2.14 2.04 5.03 3.69 3.12 2.79 2.57 2.41 2.29 2.19 2.11 2.05 1.95 211 Ek Tablo 4: F Değerleri (Devam) (0.025 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 14 16 20 Bölünenin Serbestlik Derecesi 23 26 30 40 60 80 120 1000 982.5 986.9 993.1 996.3 998.8 1001.4 1005.6 1009.8 1011.9 1014.0 1017.7 39.43 39.44 39.45 39.45 39.46 39.46 39.47 39.48 39.49 39.49 39.50 14.28 14.23 14.17 14.13 14.11 14.08 14.04 13.99 13.97 13.95 13.91 8.68 8.63 8.56 8.52 8.49 8.46 8.41 8.36 8.33 8.31 8.26 6.46 6.40 6.33 6.29 6.26 6.23 6.18 6.12 6.10 6.07 6.02 5.30 5.24 5.17 5.13 5.10 5.07 5.01 4.96 4.93 4.90 4.86 4.60 4.54 4.47 4.43 4.39 4.36 4.31 4.25 4.23 4.20 4.15 4.13 4.08 4.00 3.96 3.93 3.89 3.84 3.78 3.76 3.73 3.68 3.80 3.74 3.67 3.63 3.59 3.56 3.51 3.45 3.42 3.39 3.34 3.55 3.50 3.42 3.38 3.34 3.31 3.26 3.20 3.17 3.14 3.09 3.36 3.30 3.23 3.18 3.15 3.12 3.06 3.00 2.97 2.94 2.89 3.21 3.15 3.07 3.03 3.00 2.96 2.91 2.85 2.82 2.79 2.73 3.08 3.03 2.95 2.91 2.87 2.84 2.78 2.72 2.69 2.66 2.60 2.98 2.92 2.84 2.80 2.77 2.73 2.67 2.61 2.58 2.55 2.50 2.89 2.84 2.76 2.71 2.68 2.64 2.59 2.52 2.49 2.46 2.40 2.82 2.76 2.68 2.64 2.60 2.57 2.51 2.45 2.42 2.38 2.32 2.75 2.70 2.62 2.57 2.54 2.50 2.44 2.38 2.35 2.32 2.26 2.70 2.64 2.56 2.52 2.48 2.44 2.38 2.32 2.29 2.26 2.20 2.65 2.59 2.51 2.46 2.43 2.39 2.33 2.27 2.24 2.20 2.14 2.60 2.55 2.46 2.42 2.39 2.35 2.29 2.22 2.19 2.16 2.09 2.53 2.47 2.39 2.34 2.31 2.27 2.21 2.14 2.11 2.08 2.01 2.47 2.41 2.33 2.28 2.25 2.21 2.15 2.08 2.05 2.01 1.94 2.42 2.36 2.28 2.23 2.19 2.16 2.09 2.03 1.99 1.95 1.89 2.37 2.32 2.23 2.19 2.15 2.11 2.05 1.98 1.94 1.91 1.84 2.34 2.28 2.20 2.15 2.11 2.07 2.01 1.94 1.90 1.87 1.80 2.21 2.15 2.07 2.02 1.98 1.94 1.88 1.80 1.76 1.72 1.65 2.09 2.03 1.94 1.90 1.86 1.82 1.74 1.67 1.63 1.58 1.49 2.03 1.97 1.88 1.83 1.79 1.75 1.68 1.60 1.55 1.51 1.41 2.00 1.94 1.85 1.80 1.76 1.71 1.64 1.56 1.51 1.46 1.36 1.96 1.90 1.81 1.76 1.72 1.67 1.60 1.51 1.46 1.41 1.30 1.87 1.80 1.71 1.66 1.61 1.57 1.49 1.39 1.33 1.27 1.09 212 Ek Tablo 4: F Değerleri (0.01 olasılık için) (0.02 Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 1 2 3 Bölünenin Serbestlik Derecesi 4 5 6 7 8 9 10 12 4052.2 4999.5 5403.4 5624.6 5763.6 5859.0 5928.4 5981.1 6022.5 6055.8 6106.3 98.50 99.00 99.17 99.25 99.30 99.33 99.36 99.37 99.39 99.40 99.42 34.12 30.82 29.46 28.71 28.24 27.91 27.67 27.49 27.35 27.23 27.05 21.20 18.00 16.69 15.98 15.52 15.21 14.98 14.80 14.66 14.55 14.37 16.26 13.27 12.06 11.39 10.97 10.67 10.46 10.29 10.16 10.05 9.89 13.75 10.92 9.78 9.15 8.75 8.47 8.26 8.10 7.98 7.87 7.72 12.25 9.55 8.45 7.85 7.46 7.19 6.99 6.84 6.72 6.62 6.47 11.26 8.65 7.59 7.01 6.63 6.37 6.18 6.03 5.91 5.81 5.67 10.56 8.02 6.99 6.42 6.06 5.80 5.61 5.47 5.35 5.26 5.11 10.04 7.56 6.55 5.99 5.64 5.39 5.20 5.06 4.94 4.85 4.71 9.65 7.21 6.22 5.67 5.32 5.07 4.89 4.74 4.63 4.54 4.40 9.33 6.93 5.95 5.41 5.06 4.82 4.64 4.50 4.39 4.30 4.16 9.07 6.70 5.74 5.21 4.86 4.62 4.44 4.30 4.19 4.10 3.96 8.86 6.51 5.56 5.04 4.69 4.46 4.28 4.14 4.03 3.94 3.80 8.68 6.36 5.42 4.89 4.56 4.32 4.14 4.00 3.89 3.80 3.67 8.53 6.23 5.29 4.77 4.44 4.20 4.03 3.89 3.78 3.69 3.55 8.40 6.11 5.18 4.67 4.34 4.10 3.93 3.79 3.68 3.59 3.46 8.29 6.01 5.09 4.58 4.25 4.01 3.84 3.71 3.60 3.51 3.37 8.18 5.93 5.01 4.50 4.17 3.94 3.77 3.63 3.52 3.43 3.30 8.10 5.85 4.94 4.43 4.10 3.87 3.70 3.56 3.46 3.37 3.23 7.95 5.72 4.82 4.31 3.99 3.76 3.59 3.45 3.35 3.26 3.12 7.82 5.61 4.72 4.22 3.90 3.67 3.50 3.36 3.26 3.17 3.03 7.72 5.53 4.64 4.14 3.82 3.59 3.42 3.29 3.18 3.09 2.96 7.64 5.45 4.57 4.07 3.75 3.53 3.36 3.23 3.12 3.03 2.90 7.56 5.39 4.51 4.02 3.70 3.47 3.30 3.17 3.07 2.98 2.84 7.31 5.18 4.31 3.83 3.51 3.29 3.12 2.99 2.89 2.80 2.66 7.08 4.98 4.13 3.65 3.34 3.12 2.95 2.82 2.72 2.63 2.50 6.96 4.88 4.04 3.56 3.26 3.04 2.87 2.74 2.64 2.55 2.42 6.90 4.82 3.98 3.51 3.21 2.99 2.82 2.69 2.59 2.50 2.37 6.82 4.76 3.92 3.46 3.15 2.93 2.77 2.64 2.54 2.45 2.31 6.64 4.61 3.78 3.32 3.02 2.80 2.64 2.51 2.41 2.32 2.19 213 Ek Tablo 4: F Değerleri (Devam) (0.01 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 14 16 20 Bölünenin Serbestlik Derecesi 23 26 30 40 60 80 120 1000 6142.7 6170.1 6208.7 6229.0 6244.6 6260.6 6286.8 6313.0 6326.2 6339.4 6362.7 99.43 99.44 99.45 99.46 99.46 99.47 99.47 99.48 99.49 99.49 99.50 26.92 26.83 26.69 26.62 26.56 26.50 26.41 26.32 26.27 26.22 26.14 14.25 14.15 14.02 13.95 13.89 13.84 13.75 13.65 13.61 13.56 13.47 9.77 9.68 9.55 9.49 9.43 9.38 9.29 9.20 9.16 9.11 9.03 7.60 7.52 7.40 7.33 7.28 7.23 7.14 7.06 7.01 6.97 6.89 6.36 6.28 6.16 6.09 6.04 5.99 5.91 5.82 5.78 5.74 5.66 5.56 5.48 5.36 5.30 5.25 5.20 5.12 5.03 4.99 4.95 4.87 5.01 4.92 4.81 4.75 4.70 4.65 4.57 4.48 4.44 4.40 4.32 4.60 4.52 4.41 4.34 4.30 4.25 4.17 4.08 4.04 4.00 3.92 4.29 4.21 4.10 4.04 3.99 3.94 3.86 3.78 3.73 3.69 3.61 4.05 3.97 3.86 3.80 3.75 3.70 3.62 3.54 3.49 3.45 3.37 3.86 3.78 3.66 3.60 3.56 3.51 3.43 3.34 3.30 3.25 3.18 3.70 3.62 3.51 3.44 3.40 3.35 3.27 3.18 3.14 3.09 3.02 3.56 3.49 3.37 3.31 3.26 3.21 3.13 3.05 3.00 2.96 2.88 3.45 3.37 3.26 3.20 3.15 3.10 3.02 2.93 2.89 2.84 2.76 3.35 3.27 3.16 3.10 3.05 3.00 2.92 2.83 2.79 2.75 2.66 3.27 3.19 3.08 3.02 2.97 2.92 2.84 2.75 2.70 2.66 2.58 3.19 3.12 3.00 2.94 2.89 2.84 2.76 2.67 2.63 2.58 2.50 3.13 3.05 2.94 2.88 2.83 2.78 2.69 2.61 2.56 2.52 2.43 3.02 2.94 2.83 2.77 2.72 2.67 2.58 2.50 2.45 2.40 2.32 2.93 2.85 2.74 2.68 2.63 2.58 2.49 2.40 2.36 2.31 2.22 2.86 2.78 2.66 2.60 2.55 2.50 2.42 2.33 2.28 2.23 2.14 2.79 2.72 2.60 2.54 2.49 2.44 2.35 2.26 2.22 2.17 2.08 2.74 2.66 2.55 2.49 2.44 2.39 2.30 2.21 2.16 2.11 2.02 2.56 2.48 2.37 2.31 2.26 2.20 2.11 2.02 1.97 1.92 1.82 2.39 2.31 2.20 2.13 2.08 2.03 1.94 1.84 1.78 1.73 1.62 2.31 2.23 2.12 2.05 2.00 1.94 1.85 1.75 1.69 1.63 1.51 2.27 2.19 2.07 2.00 1.95 1.89 1.80 1.69 1.63 1.57 1.45 2.21 2.13 2.01 1.95 1.89 1.84 1.74 1.63 1.57 1.50 1.37 2.08 2.00 1.88 1.81 1.76 1.70 1.59 1.48 1.41 1.33 1.11 214 Ek Tablo 4: F Değerleri (0.005 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 1 2 3 16211 19999 21615 Bölünenin Serbestlik Derecesi 4 5 6 7 8 22500 23056 23437 23715 23925 9 10 12 24091 24224 24426 198.50 199.00 199.17 199.25 199.30 199.33 199.36 199.37 199.39 199.40 199.42 55.55 49.80 47.47 46.19 45.39 44.84 44.43 44.13 43.88 43.69 43.39 31.33 26.28 24.26 23.15 22.46 21.97 21.62 21.35 21.14 20.97 20.70 22.78 18.31 16.53 15.56 14.94 14.51 14.20 13.96 13.77 13.62 13.38 18.63 14.54 12.92 12.03 11.46 11.07 10.79 10.57 10.39 10.25 10.03 16.24 12.40 10.88 10.05 9.52 9.16 8.89 8.68 8.51 8.38 8.18 14.69 11.04 9.60 8.81 8.30 7.95 7.69 7.50 7.34 7.21 7.01 13.61 10.11 8.72 7.96 7.47 7.13 6.88 6.69 6.54 6.42 6.23 12.83 9.43 8.08 7.34 6.87 6.54 6.30 6.12 5.97 5.85 5.66 12.23 8.91 7.60 6.88 6.42 6.10 5.86 5.68 5.54 5.42 5.24 11.75 8.51 7.23 6.52 6.07 5.76 5.52 5.35 5.20 5.09 4.91 11.37 8.19 6.93 6.23 5.79 5.48 5.25 5.08 4.94 4.82 4.64 11.06 7.92 6.68 6.00 5.56 5.26 5.03 4.86 4.72 4.60 4.43 10.80 7.70 6.48 5.80 5.37 5.07 4.85 4.67 4.54 4.42 4.25 10.58 7.51 6.30 5.64 5.21 4.91 4.69 4.52 4.38 4.27 4.10 10.38 7.35 6.16 5.50 5.07 4.78 4.56 4.39 4.25 4.14 3.97 10.22 7.21 6.03 5.37 4.96 4.66 4.44 4.28 4.14 4.03 3.86 10.07 7.09 5.92 5.27 4.85 4.56 4.34 4.18 4.04 3.93 3.76 9.94 6.99 5.82 5.17 4.76 4.47 4.26 4.09 3.96 3.85 3.68 9.73 6.81 5.65 5.02 4.61 4.32 4.11 3.94 3.81 3.70 3.54 9.55 6.66 5.52 4.89 4.49 4.20 3.99 3.83 3.69 3.59 3.42 9.41 6.54 5.41 4.79 4.38 4.10 3.89 3.73 3.60 3.49 3.33 9.28 6.44 5.32 4.70 4.30 4.02 3.81 3.65 3.52 3.41 3.25 9.18 6.35 5.24 4.62 4.23 3.95 3.74 3.58 3.45 3.34 3.18 8.83 6.07 4.98 4.37 3.99 3.71 3.51 3.35 3.22 3.12 2.95 8.49 5.79 4.73 4.14 3.76 3.49 3.29 3.13 3.01 2.90 2.74 8.33 5.67 4.61 4.03 3.65 3.39 3.19 3.03 2.91 2.80 2.64 8.24 5.59 4.54 3.96 3.59 3.33 3.13 2.97 2.85 2.74 2.58 8.14 5.50 4.47 3.89 3.52 3.26 3.06 2.91 2.78 2.68 2.52 7.88 5.30 4.28 3.72 3.35 3.09 2.90 2.75 2.62 2.52 2.36 215 Ek Tablo 4: F Değerleri (Devam) (0.005 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 14 16 20 24572 24681 24836 Bölünenin Serbestlik Derecesi 23 26 30 40 60 24917 24980 25044 25148 25253 80 120 1000 25306 25359 25452 199.43 199.44 199.45 199.46 199.46 199.47 199.47 199.48 199.49 199.49 199.50 43.17 43.01 42.78 42.66 42.56 42.47 42.31 42.15 42.07 41.99 41.85 20.51 20.37 20.17 20.06 19.98 19.89 19.75 19.61 19.54 19.47 19.34 13.21 13.09 12.90 12.81 12.73 12.66 12.53 12.40 12.34 12.27 12.16 9.88 9.76 9.59 9.50 9.43 9.36 9.24 9.12 9.06 9.00 8.89 8.03 7.91 7.75 7.67 7.60 7.53 7.42 7.31 7.25 7.19 7.09 6.87 6.76 6.61 6.53 6.46 6.40 6.29 6.18 6.12 6.06 5.96 6.09 5.98 5.83 5.75 5.69 5.62 5.52 5.41 5.36 5.30 5.20 5.53 5.42 5.27 5.20 5.13 5.07 4.97 4.86 4.80 4.75 4.65 5.10 5.00 4.86 4.78 4.72 4.65 4.55 4.45 4.39 4.34 4.24 4.77 4.67 4.53 4.45 4.39 4.33 4.23 4.12 4.07 4.01 3.92 4.51 4.41 4.27 4.19 4.13 4.07 3.97 3.87 3.81 3.76 3.66 4.30 4.20 4.06 3.98 3.92 3.86 3.76 3.66 3.60 3.55 3.45 4.12 4.02 3.88 3.81 3.75 3.69 3.58 3.48 3.43 3.37 3.27 3.97 3.87 3.73 3.66 3.60 3.54 3.44 3.33 3.28 3.22 3.13 3.84 3.75 3.61 3.53 3.47 3.41 3.31 3.21 3.15 3.10 3.00 3.73 3.64 3.50 3.42 3.36 3.30 3.20 3.10 3.04 2.99 2.89 3.64 3.54 3.40 3.33 3.27 3.21 3.11 3.00 2.95 2.89 2.79 3.55 3.46 3.32 3.24 3.18 3.12 3.02 2.92 2.86 2.81 2.70 3.41 3.31 3.18 3.10 3.04 2.98 2.88 2.77 2.72 2.66 2.56 3.30 3.20 3.06 2.99 2.93 2.87 2.77 2.66 2.60 2.55 2.44 3.20 3.11 2.97 2.89 2.84 2.77 2.67 2.56 2.51 2.45 2.34 3.12 3.03 2.89 2.82 2.76 2.69 2.59 2.48 2.43 2.37 2.26 3.06 2.96 2.82 2.75 2.69 2.63 2.52 2.42 2.36 2.30 2.19 2.83 2.74 2.60 2.52 2.46 2.40 2.30 2.18 2.12 2.06 1.95 2.62 2.53 2.39 2.31 2.25 2.19 2.08 1.96 1.90 1.83 1.71 2.52 2.43 2.29 2.21 2.15 2.08 1.97 1.85 1.79 1.72 1.58 2.46 2.37 2.23 2.15 2.09 2.02 1.91 1.79 1.72 1.65 1.51 2.40 2.30 2.16 2.08 2.02 1.96 1.84 1.72 1.65 1.57 1.42 2.24 2.14 2.00 1.92 1.86 1.79 1.67 1.54 1.46 1.37 1.13 216 Ek Tablo 4: F Değerleri (0.001 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 1 2 3 Bölünenin Serbestlik Derecesi 4 5 6 7 8 9 10 12 405284 499999 540379 562500 576405 585937 592873 598144 602284 605621 610668 998.50 999.00 999.17 999.25 999.30 999.33 999.36 999.37 999.39 999.40 999.42 167.03 148.50 141.11 137.10 134.58 132.85 131.58 130.62 129.86 129.25 128.32 74.14 61.25 56.18 53.44 51.71 50.53 49.66 49.00 48.47 48.05 47.41 47.18 37.12 33.20 31.09 29.75 28.83 28.16 27.65 27.24 26.92 26.42 35.51 27.00 23.70 21.92 20.80 20.03 19.46 19.03 18.69 18.41 17.99 29.25 21.69 18.77 17.20 16.21 15.52 15.02 14.63 14.33 14.08 13.71 25.41 18.49 15.83 14.39 13.48 12.86 12.40 12.05 11.77 11.54 11.19 22.86 16.39 13.90 12.56 11.71 11.13 10.70 10.37 10.11 9.89 9.57 21.04 14.91 12.55 11.28 10.48 9.93 9.52 9.20 8.96 8.75 8.45 19.69 13.81 11.56 10.35 9.58 9.05 8.66 8.35 8.12 7.92 7.63 18.64 12.97 10.80 9.63 8.89 8.38 8.00 7.71 7.48 7.29 7.00 17.82 12.31 10.21 9.07 8.35 7.86 7.49 7.21 6.98 6.80 6.52 17.14 11.78 9.73 8.62 7.92 7.44 7.08 6.80 6.58 6.40 6.13 16.59 11.34 9.34 8.25 7.57 7.09 6.74 6.47 6.26 6.08 5.81 16.12 10.97 9.01 7.94 7.27 6.80 6.46 6.19 5.98 5.81 5.55 15.72 10.66 8.73 7.68 7.02 6.56 6.22 5.96 5.75 5.58 5.32 15.38 10.39 8.49 7.46 6.81 6.35 6.02 5.76 5.56 5.39 5.13 15.08 10.16 8.28 7.27 6.62 6.18 5.85 5.59 5.39 5.22 4.97 14.82 9.95 8.10 7.10 6.46 6.02 5.69 5.44 5.24 5.08 4.82 14.38 9.61 7.80 6.81 6.19 5.76 5.44 5.19 4.99 4.83 4.58 14.03 9.34 7.55 6.59 5.98 5.55 5.23 4.99 4.80 4.64 4.39 13.74 9.12 7.36 6.41 5.80 5.38 5.07 4.83 4.64 4.48 4.24 13.50 8.93 7.19 6.25 5.66 5.24 4.93 4.69 4.50 4.35 4.11 13.29 8.77 7.05 6.12 5.53 5.12 4.82 4.58 4.39 4.24 4.00 12.61 8.25 6.59 5.70 5.13 4.73 4.44 4.21 4.02 3.87 3.64 11.97 7.77 6.17 5.31 4.76 4.37 4.09 3.86 3.69 3.54 3.32 11.67 7.54 5.97 5.12 4.58 4.20 3.92 3.70 3.53 3.39 3.16 11.50 7.41 5.86 5.02 4.48 4.11 3.83 3.61 3.44 3.30 3.07 11.30 7.26 5.73 4.90 4.37 4.00 3.72 3.51 3.34 3.20 2.98 10.83 6.91 5.43 4.62 4.11 3.75 3.48 3.27 3.10 2.96 2.75 217 Ek Tablo 4: F Değerleri (Devam) (0.001 olasılık için) Bölenin SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 22 24 26 28 30 40 60 80 100 140 10000 14 16 20 Bölünenin Serbestlik Derecesi 23 26 30 40 60 80 120 1000 614303 617045 620908 622933 624497 626099 628712 631337 632653 633972 636301 999.43 999.44 999.45 999.46 999.46 999.47 999.47 999.48 999.49 999.49 999.50 127.64 127.14 126.42 126.04 125.75 125.45 124.96 124.47 124.22 123.97 123.53 46.95 46.60 46.10 45.84 45.64 45.43 45.09 44.75 44.57 44.40 44.09 26.06 25.78 25.39 25.19 25.03 24.87 24.60 24.33 24.20 24.06 23.82 17.68 17.45 17.12 16.95 16.81 16.67 16.44 16.21 16.10 15.98 15.77 13.43 13.23 12.93 12.78 12.65 12.53 12.33 12.12 12.01 11.91 11.72 10.94 10.75 10.48 10.34 10.22 10.11 9.92 9.73 9.63 9.53 9.36 9.33 9.15 8.90 8.76 8.66 8.55 8.37 8.19 8.09 8.00 7.84 8.22 8.05 7.80 7.67 7.57 7.47 7.30 7.12 7.03 6.94 6.78 7.41 7.24 7.01 6.88 6.78 6.68 6.52 6.35 6.26 6.18 6.02 6.79 6.63 6.40 6.28 6.19 6.09 5.93 5.76 5.68 5.59 5.44 6.31 6.16 5.93 5.81 5.72 5.63 5.47 5.30 5.22 5.14 4.99 5.93 5.78 5.56 5.44 5.35 5.25 5.10 4.94 4.86 4.77 4.62 5.62 5.46 5.25 5.13 5.04 4.95 4.80 4.64 4.56 4.47 4.33 5.35 5.20 4.99 4.88 4.79 4.70 4.54 4.39 4.31 4.23 4.08 5.13 4.99 4.78 4.66 4.57 4.48 4.33 4.18 4.10 4.02 3.87 4.94 4.80 4.59 4.48 4.39 4.30 4.15 4.00 3.92 3.84 3.69 4.78 4.64 4.43 4.32 4.23 4.14 3.99 3.84 3.76 3.68 3.53 4.64 4.49 4.29 4.18 4.09 4.00 3.86 3.70 3.62 3.54 3.40 4.40 4.26 4.06 3.95 3.86 3.78 3.63 3.48 3.40 3.32 3.17 4.21 4.07 3.87 3.77 3.68 3.59 3.45 3.29 3.22 3.14 2.99 4.06 3.92 3.72 3.62 3.53 3.44 3.30 3.15 3.07 2.99 2.84 3.93 3.80 3.60 3.49 3.41 3.32 3.18 3.02 2.94 2.86 2.72 3.82 3.69 3.49 3.39 3.30 3.22 3.07 2.92 2.84 2.76 2.61 3.47 3.34 3.14 3.04 2.96 2.87 2.73 2.57 2.49 2.41 2.25 3.15 3.02 2.83 2.72 2.64 2.55 2.41 2.25 2.17 2.08 1.92 3.00 2.87 2.68 2.57 2.49 2.41 2.26 2.10 2.01 1.92 1.75 2.91 2.78 2.59 2.49 2.41 2.32 2.17 2.01 1.92 1.83 1.64 2.81 2.68 2.49 2.39 2.31 2.22 2.07 1.91 1.82 1.72 1.52 2.58 2.46 2.27 2.17 2.08 1.99 1.84 1.66 1.56 1.45 1.15 218 2 4.50 3.93 3.64 3.46 3.34 3.26 3.20 3.15 3.11 3.08 3.06 3.03 3.01 3.00 2.98 2.97 2.96 2.95 2.92 2.89 2.86 2.83 2.80 2.77 3 5.91 5.04 4.60 4.34 4.16 4.04 3.95 3.88 3.82 3.77 3.73 3.70 3.67 3.65 3.63 3.61 3.59 3.58 3.53 3.49 3.44 3.40 3.36 3.31 (Kalıpsız, 1981. s. 537) 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 50000 Hata SD 4 6.82 5.76 5.22 4.90 4.68 4.53 4.42 4.33 4.26 4.20 4.15 4.11 4.08 4.05 4.02 4.00 3.98 3.96 3.90 3.84 3.79 3.74 3.69 3.63 5 7.50 6.29 5.67 5.31 5.06 4.89 4.76 4.65 4.57 4.51 4.45 4.41 4.37 4.33 4.30 4.28 4.25 4.23 4.17 4.10 4.04 3.98 3.92 3.86 6 8.04 6.71 6.03 5.63 5.36 5.17 5.02 4.91 4.82 4.75 4.69 4.64 4.60 4.56 4.52 4.49 4.47 4.45 4.37 4.30 4.23 4.16 4.10 4.03 7 8.48 7.05 6.33 5.89 5.61 5.40 5.24 5.12 5.03 4.95 4.88 4.83 4.78 4.74 4.71 4.67 4.65 4.62 4.54 4.46 4.39 4.31 4.24 4.17 8 8.85 7.35 6.58 6.12 5.82 5.60 5.43 5.30 5.20 5.12 5.05 4.99 4.94 4.90 4.86 4.82 4.79 4.77 4.68 4.60 4.52 4.44 4.36 4.29 219 9 9.18 7.60 6.80 6.32 6.00 5.77 5.60 5.46 5.35 5.27 5.19 5.13 5.08 5.03 4.99 4.96 4.92 4.90 4.81 4.72 4.63 4.55 4.48 4.39 10 9.46 7.83 6.99 6.49 6.16 5.92 5.74 5.60 5.49 5.40 5.32 5.25 5.20 5.15 5.11 5.07 5.04 5.01 4.92 4.83 4.74 4.65 4.56 4.47 Grup Sayısı 11 9.72 8.03 7.17 6.65 6.30 6.05 5.87 5.72 5.61 5.51 5.43 5.36 5.31 5.26 5.21 5.17 5.14 5.11 5.01 4.92 4.82 4.75 4.64 4.55 Ek Tablo 5: q Değerleri (0.05 olasılık için) 12 9.95 8.21 7.32 6.79 6.43 6.18 5.97 5.83 5.71 5.62 5.53 5.46 5.40 5.35 5.31 5.27 5.23 5.20 5.10 5.00 4.91 4.81 4.72 4.62 14 10.35 8.52 7.63 7.03 6.66 6.39 6.19 6.03 5.90 5.80 5.71 5.64 5.58 5.52 5.47 5.43 5.39 5.36 5.25 5.15 5.05 4.94 4.84 4.74 16 10.69 8.79 7.83 7.24 6.85 6.57 6.36 6.20 6.06 5.95 5.86 5.79 5.72 5.66 5.61 5.57 5.53 5.49 5.38 5.27 5.16 5.06 4.95 4.85 18 10.98 9.03 8.03 7.43 7.02 6.73 6.51 6.34 6.20 6.09 6.00 5.92 5.85 5.79 5.74 5.69 5.65 5.61 5.50 5.38 5.27 5.16 5.05 4.93 20 11.24 9.23 8.21 7.59 7.17 6.87 6.64 6.47 6.33 6.21 6.11 6.03 5.96 5.90 5.84 5.79 5.75 5.71 5.59 5.48 5.36 5.24 5.13 5.01 Hata SD 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 24 30 40 60 120 50000 2 8.26 6.51 5.70 5.24 4.95 4.74 4.60 4.48 4.39 4.32 4.26 4.21 4.17 4.13 4.10 4.07 4.05 4.02 3.96 3.89 3.82 3.76 3.70 3.64 3 10.6 8.12 6.97 6.33 5.92 5.63 5.43 5.27 5.14 5.04 4.96 4.89 4.83 4.78 4.74 4.70 4.67 4.64 4.54 4.45 4.37 4.28 4.20 4.12 4 12.2 9.17 7.80 7.03 6.54 6.20 5.96 5.77 5.62 5.50 5.40 5.32 5.25 5.19 5.14 5.09 5.05 5.02 4.91 4.80 4.70 4.60 4.50 4.40 5 13.3 9.96 8.42 7.56 7.01 6.63 6.35 6.14 5.97 5.84 5.73 5.63 5.56 5.49 5.43 5.38 5.33 5.29 5.17 5.05 4.93 4.82 4.71 4.60 6 14.2 10.6 8.91 7.97 7.37 6.96 6.66 6.43 6.25 6.10 5.98 5.88 5.80 5.72 5.66 5.60 5.55 5.51 5.37 5.24 5.11 4.99 4.87 4.76 7 15.0 11.1 9.32 8.32 7.68 7.24 6.91 6.67 6.48 6.32 6.19 6.08 5.99 5.92 5.85 5.79 5.73 5.69 5.54 5.40 5.27 5.13 5.01 4.88 8 15.6 11.5 9.67 8.61 7.94 7.47 7.13 6.87 6.67 6.51 6.37 6.26 6.16 6.08 6.01 5.94 5.89 5.84 5.69 5.54 5.39 5.25 5.12 4.99 220 Grup Sayısı 9 10 11 16.2 16.7 17.1 11.9 12.3 12.6 9.97 10.24 10.48 8.87 9.10 9.30 8.17 8.37 8.55 7.68 7.87 8.03 7.32 7.49 7.65 7.05 7.21 7.36 6.84 6.99 7.13 6.67 6.81 6.94 6.53 6.67 6.79 6.41 6.54 6.66 6.31 6.44 6.55 6.22 6.35 6.46 6.15 6.27 6.38 6.08 6.20 6.31 6.02 6.14 6.25 5.97 6.09 6.19 5.81 5.92 6.02 5.65 5.76 5.85 5.50 5.60 5.69 5.36 5.45 5.53 5.21 5.30 5.38 5.08 5.16 5.23 Ek Tablo 5: q Değerleri (Devam) (0.01 olasılık için) 12 17.5 12.8 10.70 9.49 8.71 8.18 7.78 7.48 7.25 7.06 6.90 6.77 6.66 6.56 6.48 6.41 6.34 6.29 6.11 5.93 5.77 5.60 5.44 5.29 14 18.2 13.3 11.08 9.81 9.00 8.44 8.03 7.71 7.46 7.26 7.10 6.96 6.84 6.74 6.66 6.58 6.51 6.45 6.26 6.08 5.90 5.73 5.56 5.40 16 18.8 13.7 11.40 10.08 9.24 8.66 8.23 7.91 7.65 7.44 7.27 7.12 7.00 6.90 6.80 6.72 6.65 6.59 6.39 6.20 6.02 5.84 5.66 5.49 18 19.3 14.1 11.68 10.32 9.46 8.85 8.41 8.07 7.81 7.59 7.42 7.27 7.14 7.03 6.94 6.85 6.78 6.71 6.51 6.31 6.12 5.93 5.75 5.57 20 19.8 14.4 11.95 10.54 9.65 9.03 8.57. 8.22 7.95 7.73 7.55 7.39 7.26 7.15 7.05 6.96 6.89 6.82 6.61 6.41 6.21 6.02 5.83 5.65 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 Olasılık 2 18.0 90.0 6.09 14.0 4.50 8.26 3.93 6.51 3.64 5.70 3.46 5.24 3.35 4.95 3.26 4.74 3.20 4.60 3.15 4.48 3.11 4.39 3.08 4.32 3.06 4.26 3.03 4.21 3.05 4.17 (Yurtsever, 1984. s. 612) 15 14 13 12 11 10 9 8 7 6 5 4 3 2 Hata SD 1 3 18.0 90.0 6.09 14.0 4.50 8.50 4.01 6.80 3.74 5.96 3.58 5.51 3.47 5.22 3.39 5.00 3.34 4.86 3.30 4.73 3.27 4.63 3.23 4.55 3.21 4.48 3.18 4.42 3.16 4.37 4 18.0 90.0 6.09 14.0 4.50 8.60 4.02 6.90 3.79 6.11 3.64 5.65 3.54 5.37 3.47 5.14 3.41 4.99 3.37 4.88 3.35 4.77 3.33 4.68 3.30 4.62 3.27 4.55 3.25 4.50 221 Kontrol edilmekte olan iki ortalama arasındaki ortalama sayısı 5 6 7 8 9 10 12 14 18.0 18.0 18.0 18.0 18.0 18.0 18.0 18.0 90.0 90.0 90.0 90.0 90.0 90.0 90.0 90.0 3.09 6.09 6.09 6.09 6.09 6.09 6.09 6.09 14.0 14.0 14.0 14.0 14.0 14.0 14.0 14.0 4.50 4.50 4.50 4.50 4.50 4.50 4.50 4.50 8.70 8.80 8.90 8.90 9.00 9.00 9.00 9.10 4.02 4.02 4.02 4.02 4.02 4.03 4.02 4.02 7.00 7.10 7.10 7.20 7.20 7.30 7.30 7.40 3.83 3.83 3.83 3.83 3.83 3.83 3.83 3.83 6.18 6.26 6.33 6.40 6.44 6.50 6.60 6.60 3.68 3.68 3.68 3.68 3.68 3.68 3.68 3.68 5.73 5.81 5.88 5.95 6.00 6.00 6.10 6.20 3.58 3.60 3.61 3.61 3.61 3.61 3.61 3.61 5.45 5.53 5.61 5.69 5.73 5.80 5.80 5.90 3.52 3.55 3.56 3.56 3.56 3.56 3.56 3.56 5.23 5.32 5.40 5.47 5.51 5.50 5.60 5.70 3.50 3.47 3.50 3.52 3.52 3.52 3.52 3.52 5.08 5.17 5.25 5.32 5.36 5.40 5.50 5.50 3.43 3.46 3.47 3.47 3.47 3.47 3.47 3.47 4.96 5.06 5.13 5.20 5.24 5.28 5.36 5.42 3.39 3.43 3.44 3.45 3.46 4.46 3.46 3.46 4.86 4.94 5.01 5.06 5.12 5.15 5.24 5.28 3.36 3.40 3.42 4.44 3.44 3.46 3.46 3.46 4.76 4.84 4.92 4.96 5.02 5.07 5.13 5.17 3.35 3.38 3.41 3.42 3.44 3.45 3.45 3.46 4.69 4.74 4.84 4.88 4.94 4.98 5.04 5.08 3.33 3.37 3.39 3.41 3.42 3.44 3.45 3.46 4.63 4.70 4.78 4.83 4.87 4.91 4.96 5.00 3.31 3.36 3.38 3.40 3.42 3.43 3.44 3.45 4.58 4.64 4.72 4.77 4.81 4.84 4.90 4.94 Ek Tablo 6: SSR Değerleri (0.05 ve 0.01 olasılık için) 16 18.0 90.0 6.09 14.0 4.50 9.20 4.02 7.40 3.83 6.70 3.68 6.20 3.61 5.90 3.56 5.70 3.52 5.60 3.47 5.48 3.46 5.34 3.46 5.22 3.46 5.13 3.46 5.04 3.46 4.97 18 18.0 90.0 6.09 14.0 4.50 9.30 4.02 7.50 3.83 6.70 3.68 6.30 3.61 6.00 3.56 5.80 3.52 5.70 3.47 5.54 3.47 5.38 3.47 5.24 3.47 5.14 3.47 5.06 3.47 4.99 20 18.0 90.0 6.09 14.0 4.50 9.30 4.02 7.50 3.83 6.80 3.68 6.30 3.61 6.00 3.56 5.80 3.52 5.70 3.48 5.55 3.48 5.39 3.48 5.26 3.47 5.15 3.47 5.07 3.47 5.00 10000 100 60 40 30 28 26 24 22 20 19 18 17 Hata SD 16 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 Olasılık 2 3.00 4.13 2.98 4.10 2.97 4.07 2.96 4.05 2.95 4.02 2.93 3.99 2.92 3.96 2.91 3.93 2.90 3.91 2.89 3.89 2.80 3.82 2.83 3.76 2.80 3.71 2.77 2.64 3 3.15 4.34 3.13 4.03 3.12 4.27 3.11 4.24 3.10 4.22 3.08 4.17 3.07 4.14 3.06 4.11 3.04 4.08 3.04 4.06 3.01 3.99 2.98 3.92 2.95 3.86 2.92 3.80 4 3.23 4.45 3.22 4.41 3.21 4.38 3.19 4.35 3.18 4.33 3.17 4.28 3.15 4.24 3.14 4.21 3.13 4.18 3.12 4.16 3.10 4.10 3.08 4.08 3.05 3.98 3.02 3.90 222 Kontrol edilmekte olan iki ortalama arasındaki ortalama sayısı 5 6 7 8 9 10 12 14 3.30 3.34 3.37 3.39 3.41 3.43 3.44 3.45 4.54 4.60 4.67 4.72 4.76 4.79 4.84 4.88 3.28 3.33 3.36 3.38 3.40 3.42 3.44 3.45 4.50 4.56 4.63 4.68 4.70 4.75 4.80 4.83 3.27 3.32 3.35 3.37 3.39 3.41 3.43 3.45 4.46 4.53 4.59 4.64 4.68 4.71 4.76 4.79 3.26 3.31 3.35 3.37 3.39 3.41 3.43 3.44 4.43 4.50 4.56 4.61 4.64 4.67 4.72 4.75 3.25 3.30 3.34 3.36 3.38 3.40 3.43 3.44 4.40 4.47 4.53 4.58 4.61 4.65 4.69 4.73 3.24 3.29 3.32 3.35 3.37 3.39 3.42 3.44 4.36 4.42 4.48 4.53 4.57 4.60 4.65 4.68 3.22 3.28 3.31 3.34 3.37 3.38 3.41 3.44 4.33 4.39 4.44 4.49 4.53 4.57 4.62 4.64 3.21 3.27 3.30 3.34 3.36 3.38 3.41 3.43 4.30 4.36 4.41 4.46 4.50 4.53 4.58 4.62 3.20 3.26 3.30 3.33 3.35 3.37 3.40 3.43 4.28 4.34 4.39 4.43 4.47 4.51 4.56 4.60 3.20 3.25 3.29 3.32 3.35 3.37 3.40 3.43 4.22 4.32 4.36 4.41 4.45 4.48 4.54 4.58 3.17 3.22 3.27 3.30 3.33 3.35 3.39 3.42 4.17 4.24 4.30 4.34 4.37 4.41 4.46 4.51 3.14 3.20 3.24 3.28 3.31 3.33 3.37 3.40 4.12 4.17 4.23 4.27 4.31 4.34 4.39 4.44 3.12 3.18 3.22 3.26 3.29 3.32 3.36 3.40 4.06 4.11 4.17 4.21 4.25 4.29 4.35 4.38 3.09 3.15 3.19 3.23 3.26 3.29 3.34 3.38 3.98 4.04 4.09 4.14 4.17 4.20 4.26 4.31 Ek Tablo 6: SSR Değerleri (0.05 ve 0.01 olasılık için) 16 3.46 4.91 3.46 4.86 3.46 4.82 3.46 4.79 3.46 4.76 3.45 4.71 3.45 4.67 3.45 4.65 3.45 4.62 3.44 4.61 3.44 4.54 3.43 4.47 3.42 4.42 3.41 4.34 18 3.47 4.93 3.47 4.88 3.47 4.84 3.47 4.81 3.46 4.78 3.46 4.74 3.46 4.70 3.46 4.67 3.46 4.65 3.46 4.63 3.46 4.57 3.45 4.50 3.45 4.45 3.44 4.38 20 3.47 4.94 3.47 4.89 3.47 4.85 3.47 4.82 3.47 4.79 3.47 4.75 3.47 4.72 3.47 4.69 3.47 4.67 3.47 4.65 3.47 4.59 3.47 4.53 3.47 4.48 3.47 4.41 Ek Tablo 7: r Değerleri (0.05 ve 0.01 olasılıklar için) r SD 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Olasılık 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 Bağımsız değişken adedi 1 2 3 4 0.05 0.997 0.999 0.999 0.01 1.000 1.000 1.000 0.05 0.950 0.975 0.983 0.01 0.990 0.995 0.997 0.05 0.878 0.930 0.950 0.01 0.959 0.976 0.983 0.05 0.811 0.881 0.912 0.01 0.917 0.949 0.962 0.05 0.754 0.836 0.874 0.01 0.874 0.917 0.937 0.05 0.707 0.795 0.839 0.01 0.834 0.886 0.911 0.05 0.666 0.758 0.807 0.01 0.798 0.855 0.885 0.05 0.632 0.726 0.777 0.01 0.765 0.827 0.860 0.05 0.602 0.687 0.750 0.01 0.735 0.800 0.836 0.05 0.576 0.671 0.726 0.01 0.708 0.776 0.814 0.05 0.553 0.648 0.703 0.01 0.684 0.753 0.793 0.05 0.532 0.627 0.683 0.01 0.661 0.732 0.773 0.05 0.514 0.608 0.664 0.01 0.641 0.712 0.755 0.05 0.497 0.590 0.646 0.01 0.623 0.694 0.737 0.05 0.482 0.574 0.630 0.01 0.606 0.677 0.721 0.05 0.468 0.559 0.615 0.01 0.590 0.662 0.708 0.05 0.456 0.545 0.801 0.01 0.575 0.647 0.691 0.05 0.444 0.532 0.587 0.01 0.561 0.633 0.678 0.05 0.433 0.520 0.575 0.01 0.549 0.620 0.665 0.05 0.423 0.509 0.563 0.01 0.537 0.608 0.652 0.05 0.413 0.498 0.522 0.01 0.526 0.596 0.641 0.05 0.404 0.488 0.542 0.01 0.515 0.585 0.630 0.05 0.396 0.479 0.532 0.01 0.505 0.574 0.619 r SD 24 25 26 27 28 29 30 35 40 45 50 60 70 80 90 100 125 150 200 300 400 500 1000 223 Olasılık 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 0.05 0.01 Bağımsız değişken adedi 1 2 3 4 0.388 0.470 0.523 0.562 0.496 0.565 0.609 0.642 0.381 0.462 0.514 0.553 0.487 0.555 0.600 0.633 0.374 0.454 0.606 0.545 0.478 0.546 0.590 0.624 0.367 0.446 0.498 0.536 0.470 0.538 0.582 0.615 0.361 0.439 0.490 0.529 0.463 0.530 0.573 0.606 0.355 0.432 0.482 0.521 0.456 0.522 0.565 0.598 0.349 0.426 0.476 0.514 0.449 0.514 0.558 0.591 0.325 0.397 0.445 0.482 0.418 0.481 0.523 0.556 0.304 0.373 0.419 0.455 0.393 0.454 0.494 0.526 0.288 0.353 0.397 0.432 0.372 0.430 0.470 0.501 0.273 0.336 0.379 0.412 0.354 0.410 0.449 0.479 0.250 0.308 0.348 0.380 0.325 0.377 0.414 0.442 0.232 0.286 0.324 0.354 0.302 0.351 0.386 0.413 0.217 0.269 0.304 0.332 0.283 0.330 0.362 0.389 0.205 0.254 0.288 0.315 0.267 0.312 0.343 0.368 0.195 0.241 0.274 0.300 0.254 0.297 0.327 0.351 0.174 0.216 0.246 0.269 0.228 0.266 0.294 0.316 0.159 0.198 0.225 0.247 0.208 0.244 0.270 0.290 0.138 0.172 0.196 0215 0.181 0.212 0.234 0.253 0.113 0.141 0.160 0.176 0.148 0.174 0.192 0.208 0.098 0.122 0.139 0.153 0.128 0.151 0.167 0.180 0.088 0.109 0.124 0.137 0.115 0.135 0.150 0.162 0.062 0.077 0.088 0.097 0.081 0.096 0.106 0.116