tam metin / full text

Transkript

tam metin / full text
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
DOĞRUSAL OLMAYAN MODELLERİN UYUMUNDA FARKLI İSTATİSTİK PAKET
PROGRAMLARININ KARŞILAŞTIRILMASI
Arş. Gör. Çiğdem YAKUPOĞLU 1
1
2
Doç. Dr. Yavuz AKBAŞ 2
Ege Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, 35100 Bornova İZMİR, e-mail: [email protected]
Ege Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, 35100 Bornova İZMİR, e-mail: [email protected]
Özet
Hayvancılıkta büyüme ve laktasyon eğrisi gibi doğrusal olmayan bir yapı sergileyen sistemlerin tanımlanmasında doğrusal
olmayan modeller kullanılmaktadır. Amaç, söz konusu sistemlere ait verilere en iyi uyumu sağlayacak modelin
geliştirilmesidir. Ayrıca bu modellerin parametreleri kullanarak yorumlanması zor olan çok sayıdaki bilginin, biyolojik
olarak yorumlanabilir şekilde özetlenmesidir. Bu amaçla model geliştirme çalışmaları yanında, geliştirilmiş bazı modellerin
farklı alan ve özelliklere uyumunun incelendiği çalışmalar da mevcuttur.
Doğrusal olmayan modellerin veri setlerine uyumunda SPSS, SAS, STATISTICA, BMDP, SAAM ve MINOS gibi
istatistik paket programlarından yararlanılmaktadır.
Bu çalışmada doğrusal olmayan modellerin parametre tahminlerinin yapılmasında kullanılan bazı paket programlar
ulaşılabilirlik, tanımlama kolaylığı, kullandığı yöntemler gibi özellikler açısından tanıtılacak, uygulamalı karşılaştırmalar
yapılacaktır.
Anahtar Kelimeler: Doğrusal olmayan modeller, bilgisayar yazılımları, büyüme ve laktasyon eğrileri
Abstract
COMPARISON OF DIFFERENT STATISTICAL SOFTWARE FOR FITTING
NONLINEAR MODELS
Nonlinear models have a common use in animal breeding as lactation and growth curves. General purpose is to develop a
model giving the best fitting on data set by summarizing the information into a few biologically interpretable parameters of
the model. In addition to model developing, there are a lot of studies concentrated on fitting accuracy of various models on
different area and traits. There are several statistical software such as SPSS, SAS, STATISTICA, BMDP, SAAM and
MINOS for fitting the nonlinear models. The objectives of this study are to introduce and compare the statistical software
on the basis of availability, easy to use and methods concentrated on giving practical applications.
Key Words: Nonlinear models, software, growth and lactation curves
1. Giriş
Bağımlı değişkenin, bağımsız değişken veya değişkenlerin doğrusal bir fonksiyonu olmadığı modeller
“doğrusal olmayan (nonlinear)” modeller olarak adlandırılmaktadır [1]. Doğrusal olmayan modeller fizyoloji,
kimya, ekonomi ve hayvan yetiştirme gibi bir çok bilim dalında yaygın olarak kullanılmaktadır.
Doğrusal olmayan modellerin tahminlenmesi doğrusal (linear) modellerden çok daha zordur. Bu modellerde
doğrusal modellerde oluğu gibi bağımsız değişkenlerin basitçe listelenmesi yerine, regresyon eşitliğinin
yazılması, parametre işlemlerinin tanımlanması, bunlar için başlangıç değerlerinin seçilmesi ve parametrelere
bağlı olarak modele ait türevlerin belirtilmesi gerekmektedir. Bazı modellerin uyumu zor olduğu gibi,
iterasyon yönteminin, modelin uyumunu başarı ile gerçekleştireceğine garanti verilmemektedir [2].
İterasyon işlemine bir veya daha fazla parametre için mantıklı başlangıç değerlerinin seçilmesi ile
başlanmaktadır. Hesaplamada bu değerleri içeren geçici eşitlik çözülürken, parametre değerleri giderek
sabitleşmektedir. Parametre sayısının artması ile iterasyon sayısı da artış göstermektedir. Tahminlerin yüksek
hızlı bilgisayarlarda yapılması bu konuda oldukça büyük kolalıklar sağlamaktadır [3]. Nitekim gelişen
bilgisayar teknolojisi, kullanımın yaygınlaşması ve uygun yazılımların geliştirilmesi hesaplamalardaki
zorlukları büyük oranda ortadan kaldırmıştır [4].
Bu çalışmada, doğrusal olmayan modellerin uyumunda yararlanılan SPSS, SYSTAT, STATISTICA ve SAS
paket programlarının tanımlama biçimi, kullanılan iterasyon yöntemi ve erişilebilirlik açısından
karşılaştırılması amaçlanmıştır.
2. Kullanılan Programlar ve Genel Özellikleri
Çalışmada, doğrusal olmayan modellerin uyumununa örnek olması açısından, Gompertz büyüme eğrisi
modeli kullanılmıştır. Bu amaçla bir bıldırcının çıkıştan itibaren, dört gün aralıklarla eşeysel olgunluk yaşına
kadar elde edilmiş canlı ağırlık verisi üzerine Gompertz modelinin [5] uyumu yapılmıştır. Uyumu yapılan
Gompertz modelinin fonksiyonu aşağıdaki gibidir.
(
−K.t
Y = A.exp − B.exp
1
)
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
Gompertz fonksiyonunun A, B ve K parametrelerine ait biyolojik yorumlar aşağıdaki gibidir.
t:
Zaman
A:
Zaman sonsuza ulaştığındaki (asimtotik) canlı ağırlık
B:
Başlangıç ağırlığı
K:
Büyüme hızı
Model uyumu yapılırken, parametre başlangıç değerleri daha önceki çalışmalardan ön bilgi alınarak
belirlenebilmektedir. Bu çalışmada A, B ve K parametreleri başlangıç değerleri sırasıyla 200, 3.5 ve 0.07
olarak alınmıştır.
2.1. SPSS
SPSS programının, Windows altında çalışan 6.0 sürümü kullanılarak doğrusal olmayan modellerin uyumunun
yapılması işlemi “Statistics” menüsünden “Regression” alt menüsü ve daha sonra da “nonlinear” seçeneği
işaretlenerek başlatılmaktadır (Şekil 1).
Şekil 1. SPSS programında nonlinear regresyonun tanımlanması
Ekrana gelen pencerede bağımlı değişken “dependent”, model tanımlamaları ise “model expression”
bölümünde yapılmakta, daha sonra parametrelere ait başlangıç değerleri “parameters” bölümünde
belirlenerek modelin uyumuna geçilmektedir (Şekil 2).
Şekil 2. SPSS programında nonlinear modelin tanımlanması
SPSS programı ile doğrusal olmayan modellerin uyumunun yapılmasında kullanılacak kayıp fonksiyonların
tanımlandığı, parametrelere ait çeşitli sınırlamaların getirildiği, kaydedilmesi istenen ayrıntı bilgiler ve
kullanılacak tahminleme yönteminin belirlendiği düğmeler de mevcuttur. Bu düğmeler ve kullanımları
aşağıda açıklanmıştır.
2
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
Genel olarak gözlenen değerlerden beklenen değerlerin sapması tahminlemelerin güvenilirliğindeki
azalmaları (loss) belirtmektedir. Bu nedenle kayıp fonksiyon, parametrelerin tahminlenmesinde
minimizasyonu yapılan fonksiyondur. Yaygın olarak bilinen biçimleri, gözlenen ve beklenen değerler
arasındaki farkın mutlak değerini ve maksimum olabilirlik tahmininin negatifini içermektedir.
SPSS programında kayıp fonksiyon düğmesi kullanıcıya iki uygulama sunmaktadır. Bunlardan ilki olan “user
defined loss function” uygulaması, tanımlanan herhangi bir fonksiyonun toplamının minimize edilmesi
işlemini gerçekleştirmektedir. Program, kayıp fonksiyon belirtilmediği durumda ise en küçük kareler toplamı
temeline dayalı olarak hata kareler toplamında küçültme işlemi yapan “sum of squared residuals”
uygulamasını kullanmaktadır.
Bu düğme ile parametre değerlerine belirli alt ve üst sınırlar tanımlanabilmektedir. Parametre değerleri için
herhangi bir sınırlama yapılmadığında “unconstrained” seçeneği geçerlidir.
Adından da anlaşıldığı gibi saklama düğmesi, isteğe bağlı olarak tahminlenen değerleri (predicted values),
hataları (residuals), parametrelerin her bir iterasyonuna ilişkin türevlerini (derivatives) ve kayıp fonksiyon
değerlerini (loss function values) korumaktadır.
Bu seçenek düğmesi ise doğrusal olmayan modelin uyumu için parametrelere ait tahmin değerlerinin elde
edilmesinde “sequential quadratic programming” veya “levenberg marquardt” tahminleme yönteminin
seçimine imkan tanımaktadır. Herhangi bir tanımlama yapılmadığında “levenberg marquardt” iterasyon
yöntemi kullanılmaktadır.
SPSS programı doğrusal olmayan modeller için yapılan analiz sonucu her bir parametre için hata kareler
toplamını, regresyon belirleme katsayısını, düzeltilmiş ve düzeltilmemiş kareler ortalamasını, asimtotik
parametre tahminleri, standart hataları ve her birinin % 95 güven aralıklarını ve ayrıca parametre
tahminlerinin asimtotik korelasyon matrislerini çıktı halinde verebilmektedir.
2.2. SYSTAT
SYSTAT programının Windows altında çalışan 5.0 sürümünde, herhangi bir doğrusal olmayan modelin
uyumu “Stats” menüsünden “nonlin” alt menüsü yardımı ile başlatılmaktadır (Şekil 3).
Şekil 3. SYSTAT programında nonlinear regresyonun tanımlanması
Bu alt menü kayıp fonksiyonun, uyumu sağlanacak modelin ve uyumun yeniden çalıştırılabildiği işlem
seçeneklerine sahiptir. Modelin uyumunda kullanıcıya çeşitli alternatifler sunan seçenekler ve kullanımları
aşağıdaki gibidir.
SYSTAT programında, bu seçenek ile kullanılacak olan kayıp fonksiyon tanımlanabilmektedir. Ancak bu
işlemin model tanımlamasından önce yapılması öngörülmektedir. Program, kayıp fonksiyon tanımlaması
yapılmadığında en küçük kareler üzerinden minimizasyonu gerçekleştirmektedir.
3
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
Uyumu yapılacak modelin tanımlaması “Model...” seçeneği yardımı ile yapılmaktadır. Ekrana gelen
“Nonlinear Model” penceresinde kullanılacak model “Expression”, parametrelere ait başlangıç değerleri
“Start”, yapılacak iterasyon sayısı “Iterations” ve iterasyon işlemini durduracak maksimum tolerans değeri
“Tolerance” bölmümü ile belirlenebilmektedir (Şekil 4).
Şekil 4. SYSTAT programında nonlinear model uyumu basmaklarının tanımlanması
SYSTAT programında, uyumu yapılacak modelde yer alacak bağımlı ve bağımsız değişkenler Ekle (Add)
düğmesi ile model tanımlamasına alınmaktadır. Bağımlı ve bağımsız değişken dışındaki herhangi bir
tanımlama ise parametre olarak kabul edilmektedir. Parametrelere ilişkin tahmin değerlerinin
hesaplanmasında “Quasi-Newton” ya da “Simplex” iterasyon yöntemlerinden biri seçilebilmektedir.
Herhangi bir yöntem seçilmediğinde “Quasi-Newton” yöntemi üzerinden işlem yapılmaktadır. İterasyon ve
tolerans değerinin belirtilmediği durumda ise, program sırasıyla “20” ve “0.00005” değerlerini kabul
etmektedir.
Tüm işlemler sonunda, hataları, tahminlenen değerleri ve değişkenleri SYSTAT dosyası olarak saklamak için
“Save file” bölümü seçilmektedir.
Modelin uyumunda istenilen sayıda iterasyonla yakınsama gerçekleşmediğinde “Resume...” seçeneği
kullanılmaktadır. Bu seçeneğe geçildiğinde karşımıza gelen “Resume Estimating” penceresinde iterasyon
işlem basamakları için yeniden tanımlamalar yapılabilmektedir. Böylece kullanıcı bir sonraki model uyum
işlemi için önceki özetlerden yararlanabilmektedir.
2.3. STATISTICA
Statistica programının Windows altında çalışan 4.3 sürümü ile doğrusal olmayan modellerin uyumu işlemi,
programın “Analysis” menüsünden “User specified regression” alt menüsü kullanılarak başlatılmaktadır
(Şekil 5).
Şekil 5. STATISTICA programında nonlinear regresyonun tanımlanması
4
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
Bu menü ile ekrana gelen pencerede, uyumu yapılması istenen model ve kayıp fonksiyon “Function to be
estimated & loss function” düğmesi ile tanımlanabilmekte, “Select cases” düğmesi ile veri setlerine ait bazı
mantıksal tanımlamalar yapılabilmektedir. Ayrıca tartı değişkeni ve eksik gözlemler tanımlatılabilmektedir.
(Şekil 6). Bu menülere ait ayrıntı bilgi aşağıda verilmiştir.
Şekil 6.STATISTICA programı doğrusal olmayan model uyumu model tanımlanma penceresi
Bu menü parametreler için bazı mantıksal işlemlerin yapılmasına imkan sağlamaktadır. Örneğin “Exclude if ”
seçeneği seçilip (A<=10) OR (B=C); tanımlaması yapılırsa, A parametresinin 10’ dan küçük ve eşit ya da B
parametresinin C parametresine eşit olduğu durumlarda işlem yapılacağı anlaşılmaktadır.
Bu menü herhangi bir değişkene ait değerler üzerinde işlem yapılacak tartı değişkeninin belirlenmesinde
kullanılmaktadır.
Bu menüde, analiz için kullanılan değişkenlerden herhangi birinin eksik gözlem içermediği ve herhangi bir
tanımlamanın yapılmadığı durumda “Casewise deletion of missing data” seçeneği kullanılmaktadır. Eksik
gözlem bulunduğunda ise “Substituted by means” seçeneği, diğer gözlemlere ait ortalama ile bu eksik
kısımlara bir değer atayarak işlem yapılmasını sağlamaktadır.
Uyumu yapılması istenen model ve kayıp fonksiyonun tanımlaması bu menü yardımıyla yapılmaktadır. Kayıp
fonksiyon için herhangi bir tanımlama yapılmadığında program en küçük kareleri kullanmaktadır (Şekil 7).
Şekil 7. STATISTICA programında model ve kayıp fonksiyon penceresi
Tahminlenecek fonksiyon ve kayıp fonksiyon “Estimated function and loss function” penceresinde
tanımlandıktan sonra, tahminleme yöntemleri “Estimation method”, maksimum iterasyon sayısı “maximum
number of iterations”, yakınsama değeri “Convergence criterion”, parametrelere ait başlangıç değerleri “Start
5
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
values”, denenecek parametre değerlerine ait değişim aralığı “Initial step size”, parametrelere ait ortalama ve
standart sapma değerleri “Means & standart deviations”, değişkenler için matris plotu “Matrix plot for all
variables” ve Box & Whisker plotunun tanımlandığı pencereye geçilmektedir (Şekil 8). Bu penceredeki menü
ve düğmelere ait açıklamalar aşağıda sunulmuştur.
Şekil 8. STATISTICA programında nonlinear model uyumu basmaklarının tanımlanması
STATISTICA programı parametre tahminleme yöntemi olarak “Quasi Newton, Simplex Procedure, HookeJeeves Pattern Moves, Rosenbrock Pattern Search” ve uygun tanımlamalarla bunların çeşitli
kombinasyonlarını kullanmaktadır. Herhangi bir tahminleme yöntemi seçilmediğinde “Quasi
Newton”iterasyon yöntemi ile tahminlemeler yapılmaktadır.
Parametre tahminleme işleminde uygulanacak iterasyon işleminin sayısı, bu bölümde belirtilmektedir.
Programda maksimum iterasyon sayısı bakımından herhangi bir tanımlama yapılmadığında maksimum
iterasyon sayısı “50” kabul edilmektedir.
Yakınsama kriterinin tanımlanabildiği bu bölümde, herhangi bir tanımlama yapılmadığı durumda yakınsama
için “0.0001” değeri kabul edilmektedir.
İterasyon içeren çözümler, başlangıç değerinin seçimine karşı çok hassastırlar. Başlangıç değerinin yanlış
seçilmesi ile bir çözüme ulaşılmayabilir veya bu durumda elde edilen parametre tahminleri matematiksel
olarak doğru ama biyolojik olarak yetersiz olabilir [3]. Başlangıç değerleri botunu ile iterasyonda kullanılacak
parametre başlangıç değerleri belirlenebilmekte ve gereğinde değiştirilebilmektedir. Herhangi bir tanımlama
yapılmadığında program herbir parametre için “0.1” değerini başlangıç kabul etmektedir.
İterasyon işleminin parametreler arasında hangi büyüklükteki adımlarla gerçekleştirileceği bu düğmesi
yardımıyla belirlenmektedir. Program herhangi bir tanımlama yapılmadığında “Quasi-Newton metodu için
0.5, Simplex and Rosenbrock metodu için 1.0 ve Hooke-Jeeves metodu için 2.0 değerini kabul etmektedir.
Seçilen herhangi bir değişkenin veya değişkenlerin ortalama ve standart sapmasına ilişkin sonuçlar bu buton
aracılığı ile alınmaktadır.
Kullanılan değişkenler arasındaki ilişkinin görsel olarak belirlenmesinde bu seçenek kullanılmaktadır.
Değişkenlerin ortalama, medyan ve standart hatalarına göre bir gösterim istendiğinde ise bu seçenek
kullanılmaktadır.
Ayrıca bu pencerede “Asymtotic standart errors” seçeneği ile parametrelere ait asimtotik standart hatalar da
alınabilmektedir.
6
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
Parametre tahminleri için yapılan iterasyonda yakınsama sağlanıp sağlanmadığı “Parametre Tahminleme“
(Parameter Estimation) penceresindeki açıklama ile anlaşılmaktadır (Şekil 9).
Şekil 9. STATISTICA programında parametre tahminleme penceresi
İterasyon sonucu yakınsama sağlanmamışsa değişik parametre başlangıç değerleri ve iterasyon yöntemleriyle
işlem yeniden yapılmalıdır. Eğer yakınsama sağlanmışsa ayrıntıların verildiği “Sonuçlar” (Results)
penceresine ulaşılmaktadır (Şekil 10).
Şekil 10. STATISTICA programında sonuçlar penceresi.
Şekilden de görüldüğü gibi sonuçlar penceresi zengin bir listeye sahiptir. Parametre tahminleri (Parameter
estimates), parametrelere ait kovaryans ve korelasyon değerleri (Cov. /Corr. Of parameters), hata değerleri
(Residual values) ,tahmin değerleri (Predicted values), gözlenen değerler (Observed values), ortalama ve
standart sapmalar (Means & standard deviations), farklar (Difference), tahmin ve hata değerlerini saklama
(Save predicted and residual values), uyumu sağlanan fonksiyonun gözlem değererine göre iki boyutlu grafiği
(Fitted 2D function & observed values), uyumu sağlanan fonksiyonun gözlem değererine göre üç boyutlu
grafiği (Fitted 2D function & observed values), hataların dağılışı (Distribution of residuals), hataların normal
olasılık dağılışı (Normal probability of residuals), yarı normal olasılık dağılışı (Half normal probability plot),
tahminlenen değerlere karşı gözlenen değerler (Predicted versus observed values), tahminlenen değerlere
karşı hata değerleri (Predicted versus residual values), tüm değişkenler için matris plot (Matrix plot for all
variables) ve tüm değişkenler için Box & Whisker plotu (Box & whisker plot for all variables) gibi
düğmelerle istatistik analizler elde edilebilmektedir.
2.4. SAS
Makalenin bu bölümüne kadar Windows altında çalışan paket programlarda uyum işlemi tanıtılmıştır.
Aşağıda açıklanacak olan SAS paket programının 6.02 sürümü ise, DOS altında çalışmaktadır. Bir başka
deyişle, doğrusal olmayan modellerin uyumunda değişik komutlar kullanılmakta ve daha sonra bu komutların
çalıştırılması ile işlem yapılmaktadır (Şekil 11.)
7
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
Şekil 11. SAS programında işlem penceresi
SAS programında, doğrusal olmayan model uyumu için yararlanılan komutlar dizisi “PROC NLIN”
bölümünde tanımlanmaktadır. Bir kısmının zorunlu, bir kısmının da isteğe bağlı olarak kullanıldığı bu
komutlar aşağıdaki gibidir.
PROC NLIN
BOUNDS
PARAMETERS
Kullanılması zorunlu
BY
Kullanılması isteğe bağlı tanımlamalar
MODEL
DER
ID
OUTPUT OUT
SAS programında, herhangi bir doğrusal modelin uyumu işlemi için bir takım adımlar takip edilmektedir.
Analiz edilecek veri setinin adı “DATA” tanımlaması ile açıklandıktan sonra, kullanılacak iterasyon
yönteminin “METHOD” tanımlaması ile seçimi ilk adımı oluşturmaktadır. Daha sonra tahminlenecek
parametre isimleri ve bunlara ait başlangıç değerleri “PARAMETERS” tanımlaması ve uyumu yapılacak
model ise “MODEL” tanımlaması ile belirtilmektedir.
Genel olarak bu program Gauss (Modified gauss-Newton Method), Marquardt (Marquardt Method), Newton
(Newton Method), Gradient (Gradient ya da Steepest-Descent Method) ya da DUD (Multivariate Secant ya
da False Position (DUD)) iterasyon yöntemlerinden birini kullanmaktadır. “DER” tanımlaması DUD metodu
dışında kullanılan iterasyon yöntemlerinde, parametrelere ait kısmi türevlerin kullanılmasını sağlamaktadır.
Program, “DER” tanımlaması yapıldığında DUD metodunu, yapılmadığında ise Gauss metodunu hazır olarak
kullanmaktadır.
Ayrıca programda parametre tahminlerine “BOUNDS” tanımlaması yardımıyla bir sınırlama verilerek,
tahminleme işleminin daha kısa zamanda yapılması sağlanabilmektedir. Çeşitli değişkenlere göre
oluşturulmuş gruplar üzerinde ayrı ayrı analiz istendiğinde ise “BY” tanımlaması kullanılmaktadır. Fakat bu
tanımlama, söz konusu değişkenler için bir sıralamanın yapılması şartını taşımaktadır.
Diğer yandan, iterasyon işlemi için yakınsama kriteri “CONVERGE”, maksimum iterasyon sayısı
“MAXITER” ve kayıp fonksiyon “_LOSS_”tanımlaması ile önceden belirtilebilmektedir. Herhangi bir
tanımlama yapılmadığında program, yakınsama kriteri için “10-8”, maksimum iterasyon sayısı için “50” ve
kayıp fonksiyon için en küçük kareleri kabul etmektedir.
İterasyon işlemi sonucunda değişik amaçlar için çıktı dosyası tanımlanabilmektedir. Eğer çıktı dosyası
parametre tahminleri için isteniyorsa “OUTEST”, değişkenler için isteniyorsa “ID” ve hesaplanan istatistikler
için ise “OUTPUT OUT” tanımlamasının kullanımı uygun olacaktır. Öte yandan, “EFORMAT” tanımlaması
ile çıktı dosyasındaki sayısal değerler “e” notasyonunda gösterilebilmektedir. Dolayısı ile farklı skalalarda
olan sayısal değerler bu komutun kullanılması ile bir örnek hale getirilebilmektedir.
3. Sonuç ve Tartışma
Doğrusal olmayan modellerin uyumu bakımından karşılaştırılan bilgisayar paket programları, kullandığı
işletim sistemi, hard diskte kapladığı yer, verileri tanımlama şekli, öğrenme ve çalıştırma kolaylığı, kullandığı
algoritmalar, analiz sonucu sunduğu bilgiler, çalışma hızı ve kolay elde edilebilirlik bakımından
karşılaştırılmıştır.
DOS altında çalışan SAS programına karşın SPSS, SYSTAT ve STATISTICA programları Windows işletim
sistemi altında çalışması bakımından farklılık göstermektedir.
8
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
Programlar hard diskte çeşitli büyüklüklerde yer kaplamaktadır. SPSS programının 26,5 MB hard disk
kapasitesi ile en fazla, SYSTAT programının 5,37 MB kapasitesi ile en az yer kaplayan program olduğu
saptanmıştır. SAS ve STATISTICA programlarının sırası ile 14 ve 12,5 MB alana gereksinim duyduğu
belirlenmiştir.
SPSS, SYSTAT ve STATISTICA programları Windows uyumlu programlardan veri transferini kolaylıkla
gerçekleştirmektedir. Ayrıca bu programlar kendine ait editör ortamından veri girişine izin vermekte ve belirli
formatlardan da dönüşüme imkan sağlamaktadır. DOS altında çalışan SAS programı ise kendi editörü ile veri
girişi yanında, ASCII yapıdaki dosyaları dışarıdan okuyabilmektedir.
İncelenen programlar arasında SPSS, gerekli tüm tanımlamaları tek pencerede ele alırken, SYSTAT ve
STATISTICA programları ayrı ayrı pencerelerde tanımlama yapmaktadır. Fakat bu programlar Windows
altında çalışma, tanımlamaları çeşitli düğmelerle yapma ve her pencerede yardım menüsünü bulundurma
yönleriyle kullanıcılar için büyük kolaylık sağlamaktadır. Buna karşın, işlemlerde kendi yapısına uygun bir
programlama gerektiren SAS programı için aynı kolaylık söz konusu değildir.
Kullanılan iterasyon yöntemine göre de programlar çeşitlilik göstermektedir. STATISTICA ve SAS paket
programı diğerlerinden farklı olarak, dört ayrı iterasyon yöntemini kullanıma sunmaktadır. Ayrıca,
STATISTICA programı bu yöntemlerin birbirleri arasındaki kombinasyonlarına da imkan tanımakta ve
iterasyon adımlarını program akışı sırasında vermektedir.
Genel olarak tüm programlar, analiz sonuçları olarak iterasyon çözümlerini, doğrusal olmayan regresyon özet
istatistiklerini, parametre tahminleri ve standart hatalarını, asimtotik % 95 güven aralıklarını ve parametre
tahminlerinin asimtotik korelasyon matrisini vermektedir. Ulaşılan bilgi miktarı bakımından, STATISTICA
programının daha ayrıntılı olduğu belirlenmiştir.
Programların çalışma performansları bakımından karşılaştırılması yapıldığında, ele aldığımız veri setinin
küçüklüğü nedeniyle belirgin bir farklılık bulunmamıştır. Ancak daha büyük veri setlerinde çalışma hızı
bakımından farklılıklar beklenebilmektedir.
Günümüz teknolojisinde bu programların elde edilmesinde herhangi bir engel görülmemektedir. İnternet
üzerinden
http://www.spss.com (SPSS)
http://science.software-directory.com (SYSTAT)
http://www.statsoft.com(STATISTICA)
http://www.sas.com
(SAS)
adresleri aracılığı ile programlar hakkında daha detaylı bilgiler istenebilmekte ve satın alma işlemleri
yapılabilmektedir.
Seçilen herhangi bir paket program, ulaşılan bilgi miktarı, kolaylık, çalışma hızı ve veri tanımlama özellikleri
bakımından kullanılabilir olmalıdır. Bu çalışmada veri tanımlaması, kullanım kolaylığı açısından SPSS,
sunduğu bilgi miktarı için STATISTICA ve farklı iterasyon yöntemlerini kullanıma sunması bakımından SAS
paket programının diğerlerine göre üstün olduğu belirlenmiştir.
4. Kaynaklar
1.
2.
3.
4.
5.
Yakupoğlu, Ç., Etlik Piliçlerde Büyüme Eğrilerinin Karşılaştırılması. Ege Üniversitesi Fen Bilimleri
Enstitüsü, Zootekni Anabilim Dalı Yüksek Lisans Tezi.İzmir. 1999.
SAS, Institute Inc., Cary, NC, USA. 1987.
Efe E., Büyüme Eğrileri. Fen Bilimleri Enstitüsü, Zootekni Anabilim Dalı Doktora Tezi.Adana. 1990.
Akbaş,Y., Büyüme Eğrisi Modellerinin Karşılaştırılması. Hayvansal Üretim Dergisi Sayı:36. 1995.
Laird,A. K., Dynamics of Relative Growth. Growth 29, 249-263. 1965.
5. Ek
5.1. SPSS All
Iteration
1
1.1
1.2
2
2.1
3
3.1
4
4.1
5
5.1
6
6.1
7
the derivatives will be
Residual SS
A
B
103175,9915 200,000000
50617834444 -2641,5593
13288,11749 209,277813
13288,11749 209,277813
1095,870034 230,969629
1095,870034 230,969629
271,2985483 197,184864
271,2985483 197,184864
58,22543615 204,096593
58,22543615 204,096593
55,87667297 203,064227
55,87667297 203,064227
55,86826323 203,033951
55,86826323 203,033951
calculated
K
3,50000000
-9,0397156
1,75402573
1,75402573
3,03699315
3,03699315
3,96421589
3,96421589
4,46291936
4,46291936
4,55195728
4,55195728
4,55796613
4,55796613
numerically. SPSS for WINDOWS Release 6.0
,070000000
,711524169
,178240848
,178240848
,188373442
,188373442
,250120951
,250120951
,258852182
,258852182
,262135450
,262135450
,262324736
,262324736
9
3. Tarımda bilgisayar Uygulamaları Sempozyumu. 3-6 Ekim 1999 Çukurova Universitesi, Adana
7.1
55,86824617 203,030730 4,55828912 ,262337973
8
55,86824617 203,030730 4,55828912 ,262337973
8.1
55,86824614 203,030649 4,55830221 ,262338430
Nonlinear Regression Summary Statistics
Dependent Variable WEIGHT
Source
DF Sum of Squares Mean Square
Regression
3
190029,20845
63343,06948
Residual
11
55,86825
5,07893
Uncorrected Total
14
190085,07670
(Corrected Total)
13
50139,07149
R squared = 1 - Residual SS / Corrected SS =
,99889
Asymptotic 95 %
Asymptotic
Confidence Interval
Parameter
Estimate
Std. Error
Lower
Upper
A
203,03064901 3,692927275 194,90257088 211,15872714
B
4,558302207
,186671824 4,147440293 4,969164121
K
,262338430
,009686747
,241018043
,283658817
Asymptotic Correlation Matrix of the Parameter Estimates
A
B
K
A
1,0000
-,6810
-,9030
B
-,6810
1,0000
,9056
K
-,9030
,9056
1,0000
5.2. SYSTATW5
ITERATION
LOSS
PARAMETER VALUES
0
.2308843D+04 .2000D+03 .3500D+01
1
.1202937D+04 .2000D+03 .3499D+01
2
.1200225D+04 .2000D+03 .3548D+01
3
.2285240D+03 .1946D+03 .3511D+01
4
.3223892D+01 .1929D+03 .3489D+01
5
.6089564D-01 .1929D+03 .3483D+01
6
.3980603D-01 .1929D+03 .3480D+01
7
.3359205D-01 .1929D+03 .3477D+01
8
.3246321D-01 .1929D+03 .3476D+01
9
.3226655D-01 .1930D+03 .3476D+01
10
.2843300D-01 .1936D+03 .3479D+01
11
.5823736D-02 .1975D+03 .3494D+01
12
.1305445D-02 .1994D+03 .3499D+01
13
.2863280D-03 .1994D+03 .3498D+01
14
.8142603D-04 .1999D+03 .3499D+01
15
.1460386D-04 .1999D+03 .3500D+01
16
.1010484D-05 .2000D+03 .3500D+01
17
.6882195D-06 .2000D+03 .3500D+01
DEPENDENT VARIABLE IS
WEIGHT
SOURCE
SUM-OF-SQUARES
DF MEAN-SQUARE
REGRESSION
20982.653
3
6994.218
RESIDUAL
0.000
13
0.000
TOTAL
20982.636
16
CORRECTED
4993.476
15
RAW R-SQUARED (1-RESIDUAL/TOTAL)
=
CORRECTED R-SQUARED (1-RESIDUAL/CORRECTED) =
PARAMETER
ESTIMATE
A
199.975
B
3.500
K
0.070
.5000D-01
.8319D-01
.8432D-01
.7774D-01
.7252D-01
.7170D-01
.7159D-01
.7152D-01
.7149D-01
.7148D-01
.7137D-01
.7056D-01
.7015D-01
.7011D-01
.7001D-01
.7002D-01
.7001D-01
.7001D-01
1.000
1.000
5.3. STATISTICA
5.4. SAS
Dependent Variable CANLIAG
Method: Gauss-Newton
Iter
A
B
K
Sum of Squares
0
200.000000
3.500000
0.070000
103176
1
177.800316
3.402033
0.075012
102400
2
145.955403
3.249047
0.084687
101626
3
111.123165
3.063099
0.102918
100508
4
87.929771
2.960871
0.135388
94477
5
91.467330
4.602511
0.520591
32228.416213
6
111.733162
3.080229
0.299562
23834.325673
7
157.114111
3.596100
0.222567
12924.724630
8
202.616985
4.583580
0.269815
129.648794
9
203.091276
4.548021
0.261805
55.938189
10
203.029542
4.558008
0.262333
55.868278
11
203.030909
4.558283
0.262338
55.868246
12
203.030645
4.558302
0.262338
55.868246
NOTE: Convergence criterion met. Non-Linear Least Squares Summary Statistics Dependent Variable CANLIAG
Source
DF Sum of Squares
Mean Square
Regression
3
190029.20845
63343.06948
Residual
11
55.86825
5.07893
Uncorrected Total
14
190085.07670
(Corrected Total)
13
50139.07149
Parameter Estimate
Asymptotic
Asymptotic 95 %
Std. Error
Confidence Interval
Lower
Upper
A
203.0306447 3.6929181012 194.90255574 211.15873370
B
4.5583022 0.1866728547
4.14743645
4.96916795
K
0.2623384 0.0096867578
0.24101795
0.28365893
Asymptotic Correlation Matrix
Corr
A
B
K
A
1
-0.681042317
-0.902972326
B
-0.681042317
1
0.9055961889
K
-0.902972326
0.9055961889
1
10

Benzer belgeler