bildiri özetleri kitabı

Transkript

bildiri özetleri kitabı
BİLDİRİ ÖZETLERİ KİTABI
BİLDİRİ ÖZETLERİ KİTABI
ULUSLARARASI KATILIMLI XIV. ULUSAL BİYOİSTATİSTİK KONGRESİ
BİLDİRİ ÖZETLERİ KİTABI
4-7 EYLÜL 2012, KAYSERİ
Hazırlayanlar
Doç.Dr.Ahmet ÖZTÜRK
Yrd.Doç.Dr.Ferhan ELMALI
Öğr.Gör.Mehmet KÖPRÜ
Ar.Gör.Gökmen ZARARSIZ
Gözde ERTÜRK
Yasemin AKŞEHİRLİ SEYFELİ
Uluslararası Katılımlı XIV. Ulusal Biyoistatistik Kongresi, Erciyes Üniversitesi Bilimsel
Araştırma Projeleri Koordinasyon Birimi tarafından "TSS-12-4045" proje kodu ile
desteklenmiştir.
ÖNSÖZ
Değerli bilim insanları,
Biyoistatistik Derneği ve Erciyes Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıp Bilişimi
Anabilim Dalı olarak 4-7 Eylül 2012 tarihlerinde “Uluslararası Katılımlı XIV. Ulusal Biyoistatistik
Kongresi"ni Kayseri’de düzenlemekten duyduğumuz mutluluğu belirtmek isteriz.
Kongremize yurtiçinden 170, yurtdışından 22 araştırmacı katılmıştır. Kongremizde 4 davetli
konuşmacı sunumu, 48 sözlü sunum, 58 poster sunum yer almıştır. Türkçe sözlü sunumlardan 3,
İngilizce sözlü sunumlardan 3 ve poster sunumlardan 3 bildiri bilimsel jüri tarafından
ödüllendirilmiştir. Ayrıca 4 Eylül 2012 tarihinde Erciyes Üniversitesi’nde düzenlenen dört adet
kursa toplam 110 kursiyer katılmıştır.
Kongremize davetli konuşmacı, oturum başkanı, bildiri sunucusu ve dinleyici olarak
üniversitelerimizden, sağlık kuruluşlarımızdan ve çeşitli iş sektörlerinden katkı veren tüm
katılımcılarımıza teşekkürü bir borç biliriz.
Kongremizin düzenlenmesinde katkıda bulunan ve desteklerini esirgemeyen başta Erciyes
Üniversitesi Rektörlüğü’ne, Kayseri Büyükşehir Belediye Başkanlığı’na, Talas Belediyesi
Başkanlığı’na, Orta Anadolu Kalkınma Ajansı’na, Kayseri Ticaret Odası’na, Merkez Çelik AŞ.’ye, Özel
Modern Dünya Hastanesi’ne, Hisar Pastaneleri’ne, Kadir Has Kongre Merkezi görevlilerine, AÇI
Turizm’e, SAS ve BYSGroup yazılım firmalarına teşekkür ederiz.
Son olarak kongremizin düzenlenmesi ve yürütülmesinde özveriyle çalışan düzenleme
kurulu üyelerine şükranlarımızı sunarız.
Doç.Dr.Ahmet ÖZTÜRK
Prof.Dr.Kadir SÜMBÜLOĞLU
Kongre Başkanı
Biyoistatistik Derneği Başkanı
I
Onursal Kurul
Kongre Onursal Başkanları
Prof. Dr. H. Fahrettin KELEŞTEMUR, Erciyes Üniversitesi Rektörü
Prof. Dr. Kadir SÜMBÜLOĞLU, Biyoistatistik Derneği Başkanı
Onur Kurulu
Mehmet ÖZHASEKİ, Kayseri Büyükşehir Belediye Başkanı
Prof. Dr. Mustafa ÇETİN, Erciyes Üniversitesi Rektör Yardımcısı
Prof. Dr. Muhammet GÜVEN, Erciyes Üniversitesi Tıp Fakültesi Dekanı
Prof. Dr. Osman GÜNAY, Erciyes Üniversitesi Tıp Fakültesi Dekan Yardımcısı
Düzenleme Kurulu
Yrd. Doç. Dr. Ahmet ÖZTÜRK
Erciyes Üniversitesi
Kongre Başkanı
Yrd. Doç. Dr. Ferhan ELMALI
Erciyes Üniversitesi
Kongre Sekreteri
Prof. Dr. Kazım ÖZDAMAR
Eskişehir Osmangazi Üniversitesi
Üye
Prof. Dr. Hamza EROL
Abdullah Gül Üniversitesi
Üye
Doç. Dr. Adem KALINLI
Erciyes Üniversitesi
Üye
Doç. Dr. Betül ÇİÇEK
Erciyes Üniversitesi
Üye
Doç. Dr. Erdem KARABULUT
Hacettepe Üniversitesi
Üye
Doç. Dr. M. Mümtaz MAZICIOĞLU
Erciyes Üniversitesi
Üye
Doç. Dr. Yavuz SANİSOĞLU
Yıldırım Beyazıt Üniversitesi
Üye
Yrd. Doç. Dr. S.Kenan KÖSE
Ankara Üniversitesi
Üye
Yrd. Doç. Dr. Ünal ERKORKMAZ
Gaziosmanpaşa Üniversitesi
Üye
Dr. Marta GARCIA-FINANA
Liverpool Üniversitesi
Üye
Öğr. Gör. Mehmet KÖPRÜ
Erciyes Üniversitesi
Üye
Araş. Gör. Gökmen ZARARSIZ
Erciyes Üniversitesi
Üye
II
Bilimsel Danışma Kurulu
Prof. Dr. A. Ergun KARAAĞAOĞLU
Prof. Dr. Ahmet DİRİCAN
Prof. Dr. Atilla Halil ELHAN
Prof. Dr. Celal Reha ALPAR
Prof. Dr. Emine Arzu KANIK
Prof. Dr. Fikret İKİZ
Prof. Dr. Hafize SEZER
Prof. Dr. Handan ANKARALI
Prof. Dr. İlker ERCAN
Prof. Dr. İsmet DOĞAN
Prof. Dr. Kazım ÖZDAMAR
Prof. Dr. M. Yusuf ÇELİK
Prof. Dr. Mevlüt TÜRE
Prof. Dr. Mustafa ŞENOCAK
Prof. Dr. M. Nurullah ORMAN
Prof. Dr. Nazan ALPARSLAN
Prof. Dr. Nural BEKİROĞLU
Prof. Dr. Osman SAKA
Prof. Dr. Osman SARAÇBAŞI
Prof. Dr. Ömer SATICI
Prof. Dr. Refik BURGUT
Prof. Dr. Rian DİŞÇİ
Prof. Dr. Saim YOLOĞLU
Prof. Dr. Vildan SÜMBÜLOĞLU
Prof. Dr. Yüksel BEK
Doç. Dr. Ayşe Canan YAZICI
Doç. Dr. Bahar TAŞDELEN
Doç. Dr. Beyza AKDAĞ
Doç. Dr. Canan BAYDEMİR
Doç. Dr. Cemil Çolak
Doç. Dr. Erdem KARABULUT
Doç. Dr. Ersin ÖĞÜŞ
Doç. Dr. Fezan MUTLU
Doç. Dr. Gülşah SEYDAOĞLU
Doç. Dr. İmran KURT ÖMÜRLÜ
Doç. Dr. K. Setenay ÖNER
Doç. Dr. Mehtap AKÇİL
Doç. Dr. Meriç ÇOLAK
Doç. Dr. Necdet SÜT
Doç. Dr. Semra AKGÖZ
Doç. Dr. Sıddık KESKİN
Doç. Dr. Yasemin GENÇ
Doç. Dr. Yavuz SANİSOĞLU
Doç. Dr. Zeki AKKUŞ
Doç. Dr. Ayşe Canan YAZICI
Doç. Dr. Bahar TAŞDELEN
Doç. Dr. Beyza AKDAĞ
Doç. Dr. Canan BAYDEMİR
Doç. Dr. Cemil Çolak
Doç. Dr. Erdem KARABULUT
Doç. Dr. Ersin ÖĞÜŞ
Doç. Dr. Fezan MUTLU
Doç. Dr. Gülşah SEYDAOĞLU
Doç. Dr. İmran KURT ÖMÜRLÜ
Doç. Dr. K. Setenay ÖNER
Doç. Dr. Mehtap AKÇİL
Doç. Dr. Meriç ÇOLAK
Doç. Dr. Necdet SÜT
Doç. Dr. Semra AKGÖZ
Doç. Dr. Sıddık KESKİN
Doç. Dr. Yasemin GENÇ
Doç. Dr. Yavuz SANİSOĞLU
Doç. Dr. Zeki AKKUŞ
III
İÇİNDEKİLER
Sunum
ÇAĞRILI BİLDİRİLER
no.
D01
Biyoistatistik Etiği,
Z.Nazan ALPARSLAN ..................................................................................................
D02
Sayfa no
2
Hybrid RBF Neural Network Models for Supervised Classification of Medical Data
With Information Complexity And The Genetic Algorithm,
Hamparsum BOZDOGAN...............................................................................................
D03
Correspondence Analysis in Biological Research,
Michael GREENACRE ..................................................................................................
D04
Sunum
II. SÖZLÜ BİLDİRİLER
no
7
8
ROC Analizinde Kesim Noktası Belirlemede Kullanılan Yöntemlere Alternatif Bir Öneri,
İlker ÜNAL, Refik BURGUT, Yaşar SERTDEMİR .........................................................
S04
Sayfa no
İkili Yöntem Kıyaslamalarında Bir Görsel Yaklaşım Önerisi,
Mustafa Ş. ŞENOCAK....................................................................................................
S03
5
Tanı Testi Yargılamalarında Kesim Noktası Kestirimi İçin Bir Yaklaşım,
Mustafa Ş. ŞENOCAK, Özden CALAY...........................................................................
S02
4
Generalized Penalized Cananical Correlation Analysis,
AeilkoHaving ZWINDERMAN.......................................................................................
S01
3
9
Biyoeşdeğerlik Çalışmalarında Birey İçi Değişkenliğin Eşitliğine Yönelik Testlerin
Değerlendirilmesi,
Nur Özge SEZGİN,Mehmet N. ORMAN..........................................................................
S05
GeneLearneR: Genetik Veri Madenciliği Analiz Aracı,
Erdal COŞGUN, Aydın KAYA, Ali Seydi KEÇELİ, Ergun KARAAĞAOĞLU…………….
S06
12
Major Voting Gap Statistic to Estimate the Number of Clusters in a Dataset,
Gökmen ZARARSIZ, Ahmet OZTÜRK, Erdem KARABULUT, Erdal COŞGUN................
S07
10
14
Dikotom Sonuçlu Yorumlamalarda, 2'den Fazla Değerlendiricinin Sonuç Uyumlarının
Fleiss Kappa ve Cochran Q ile Değerlendirmelerinin İrdelenmesi,
Pınar AMBARCIOĞLU, Nurgül BULUT , Mehmet KIZILÇEÇ .........................................
S08
“Sıfır Olgu” Tasarımının Benzetim Çalışması İle Değerlendirilmesi,
Yeşim TUNÇ,Alev BAKIR, Pınar AMBARCIOĞLU, Mustafa Ş.ŞENOCAK ...................
S09
15
17
Ters örnekleme – I Ters örnekleme yaklaşımında sonuç güvenirliğini etkileyen ögeler,
F. Nesrin TURAN ,Nurgül BULUT , Esra Ş. YILMAZ, Mustafa Ş.ŞENOCAK ..................
IV
19
S10
Ters Örnekleme – II Ters Örnekleme Yaklaşımında Önkabulsel Olgu Sayısının Sonuç
Güvenirliğine Etkileri,
Nurgül BULUT, Alev BAKIR, Pınar AMBARCIOĞLU, Mehmet KIZILÇEÇ , Yeşim
TUNÇ, Esra Ş.YILMAZ, Ali BAYKUŞ, Mustafa Ş.ŞENOCAK........................................
S11
21
Mikrodizilim Gen İfade Çalışmalarında Genelleştirme Yöntemlerinin Regresyon
Modelleri Üzerine Etkisi,
Selen YILMAZ IŞIKHAN, Erdal COŞGUN, Erdem KARABULUT, C. Reha ALPAR ........
S12
Gene Expression Data Mining with Artificial Immune Clonal Selection Algorithms
Akin ÖZÇİFT.................................................................................................................
S13
25
The Application of Time-Weighted Control Charts in Medical Practice,
Leman TOMAK, Yüksel BEK ........................................................................................
S14
23
26
Bayesian Model Selection Criteria for Generalized Linear Models with Nonignorably
Missing Data,
Zeynep Işıl KALAYLIOĞLU ..........................................................................................
S15
Gri İlişki Analizi,
Gürol ZIRHLIOĞLU, Neslihan AKÇA, Serap KESKİN....................................................
S16
27
28
Hastane çalışanlarının Maslach Tükenmişlik ölçeğine göre değerlendirilmesi; Çok
merkezli bir çalışma
M.Yusuf ÇELİK, M.Mutlu DAŞDAĞ, D.ŞAHİN, Ömer SATICI, Zeki AKKUŞ, İsmail YILDIZ
S17
29
Çok Sınıflı Destek Vektör Sınıflamasında Hata Düzeltmeli Çıkış Kodları
Yaklaşımlarının Karşılaştırılması: Bir simülasyon çalışması,
Özge AKŞEHİRLİ, Handan ANKARALI, Duygu AYDIN, Davut BALTACI......................
S18
Posterior Power Analysis with R Software: A Simulation Study,
Pınar Günel KARADENİZ, Nural BEKİROĞLU..............................................................
S19
30
31
Eşit Örneklemli Randomize Kontrollü Çalışmalarda Kullanılan İki Elemanlı Rasgele
Dizinin Karmaşıklık Kriteri,
Ömer Utku ERZENGİN ,Sıddıka Gamze ERZENGİN........................................................
S20
32
Dört Gözlü Kontenjans Tablolarında Yates Düzeltmeli Ki-Kare Testinin İncelenmesi:
Simülasyon Çalışması,
Selçuk KORKMAZ, Necdet SÜT ....................................................................................
S21
33
Maddeler Arası Korelasyon Yapısı ve Örneklem Genişliğinin Faktörleşmedeki Rolü:
Bir Simülasyon Çalışması,
Duygu AYDIN, Handan ANKARALI, Özge Yılmaz AKŞEHİRLİ.....................................
S22
Hibrit Hiyerarşik Kümeleme Yöntemi ve Sağlık Alanında Bir Uygulaması
Gözde ERTÜRK, Gökmen ZARARSIZ, Ahmet OZTURK , Ferhan ELMALI......................
S23
35
Varyans Bileşeni Tahmin Yöntemlerine Yönelik Bir Değerlendirme
İlkay DOĞAN, İbrahim KILIÇ, Cengiz GAZELOĞLU, Sinan SARAÇLI...........................
S24
34
36
Rakip Risk İçeren Sağkalım Fonksiyonlarının Karşılaştırılmasında Log-Rank ve
Wilcoxon Testlerinin Etkinliği: Bir Simülasyon Çalışması,
Melike GEDUK, Yaşar SERTDEMİR, H. Refik BURGUT................................................
V
37
S25
İki Değişkenli Weibull Dağılımları ile Yaşam Verilerinin Modellenmesi,
Ayça Hatice TÜRKAN, Nazif ÇALIŞ, Hamza EROL........................................................
S26
38
Hastalıkların Yersel Kümelenmelerinin Belirlenmesinde Kullanılan Satscan V9.1 ve
Flexscan V3.1 Programlarının Rasgele ve Koşullu, Türetilmiş Verilerde Karşılaştırılması
Özge BOLLUK, Canan BAYDEMİR, Kazım ÖZDAMAR.................................................
S27
Hastanelerin Etkinliklerinin Veri Zarflama Analizi İle Belirlenmesi: Afyonkarahisar Örneği,
Gizem GÜLSEVİN, Ayça Hatice TÜRKAN.....................................................................
S28
40
41
Yaşam Kalitesinin Yapısal Eşitlik Modeli ile Analizi: Afyon Kocatepe
Üniversitesi Akademisyenleri Üzerine Bir Uygulama,
Birol TOPÇU, Sinan SARAÇLI, Cengiz GAZELOĞLU....................................................
S29
43
İzlem Süresi İçerisinde Belirteçlerin Performanslarını Değerlendirmede Zamana Bağlı
ROC Eğrisi,
Eda KARAİSMAİLOĞLU, Umut ARSLAN, A. Ergun KARAAĞAOĞLU........................
S30
45
Veri Madenciliği Sınıflama Yöntemlerinin Başarılarının; Örneklem Büyüklüğü,
Bağımlı Değişken Prevelansı ve Bağımsız Değişkenler Arası İlişki Miktarına Göre
Karşılaştırılması,
M. Özgür DOLGUN, N. Anıl DOLGUN, Osman SARAÇBAŞI.........................................
S31
47
Zaman Serilerinin Modellenmesi ve Geleceğe Yönelik Kestirimlerinin Değerlendirilmesi:
1928-2010 Hekim Başına Düşen Kişi Sayısı Örneği,
Mustafa Agah TEKİNDAL, Yasemin GENÇ...................................................................
S32
Kanonik Uyum Analizi ve Sağlık Alanında Bir Uygulaması,
Sıddık KESKİN, Sadi ELASAN, A. Cumhur DÜLGER.....................................................
S33
49
51
Ülkemizdeki Sezaryen Oranlarının Dünya Verileri ve Çeşitli Kadın İstatistikleri
Işığında Değerlendirilmesi,
Mervin M. ATAY, Z. Nazan ALPARSLAN......................................................................
S34
52
A New Dimension Reduction Technique Using Information Complexity for High
Dimensional Gene Expression Data,
Esra PAMUKCU, Hamparsum BOZDOGAN, Cemil ÇOLAK............................................
S35
53
Doğrulama Yanlılığında Kullanılan Eksik Gözlem Analizi Yöntemlerinin
Performanslarının İncelenmesi,
Jale KARAKAYA, Erdem KARABULUT, Recai YÜCEL, Ergun KARAAĞAOĞLU.........
S36
54
Karar Ağacı Yönteminin Kestirim Yeterliliğinin İrdelenmesi; Bipolar Depresyon
Tanısı Üzerinden Bir Değerlendirme,
Mehmet Güven GÜNVER, Ali BAYKUŞ, Günalp UZUN.................................................
S37
55
Some Observations on the Design of Early Stage Clinical Trials in the
Pharmaceutical Industry,
Hans HOCKEY ............................................................................................................
S38
56
Beta-Weibull Distribution for Simple Linear Regression and Its Locally D-Optimal
Design,
Habib JAFARI..............................................................................................................
VI
57
S39
Estimation under Progressive Type-II censoring for Reciprocal Exponential
Distribution,
Sumeet KAUR...............................................................................................................
S40
58
Small-study Effects in Individual Patient Data Meta-analysis of Prognostic Factor
Studies,
Ghada M. ABO-ZAID, Jon J. DEEKS, Richard D. RILEY.................................................
S41
59
Recent OPLS Statistical Model versus Traditional Linear Regression to Assess
Sonographic Predictors of Stroke Prognosis,
H. Sadeghi-BAZARGANI, K. FATHI, R. MEHDIZADEH, D. Savadi-OSKOUEI,
M. FARHOUDI..............................................................................................................
S42
61
Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different
Temperatures,
H. ESMAILY,M. Hadi ALIJANVAND, H. DOOSTI, M.T. SHAKERI……………..………
S43
62
Salmonella Infantis: Assessing Causes and Trends,
Sarah SALTER, Dr.Kate COWLES, Fan TANG, Monelle TAMEGNON, Amanda LUBY,
Kevin TORRES..............................................................................................................
S44
Thevariance: A New Formula,
Muawia ABDELSALAM................................................................................................
S45
63
64
On the estimation based on generalized order statistics for the location and scale
parameters of Burr12 Distribution,
Reza Arabi BELAGHI,Minoo AMINNEJAD ..................................................................
S46
On The Least Trimmed Square (LTS) Estimation for Burr XII Model,
Reza Arabi BELAGHI,Mehdi Pour ABDOLLAH ............................................................
S47
no
P01
67
WGEE ve MI-GEE Yöntemlerinin Karşılaştırılması,
Gazel SER .....................................................................................................................
Sunum
66
Statistical Models of Postnatal Transmission of HIV-India,
D.M. BASAVARAJAIAH, B.NARASIMHAMURTHY....................................................
S48
65
III-POSTER BİLDİRİLER
68
Sayfa no.
Sınıflandırma Ağacı için Alternatif Bölünme Kurallarının Performanslarının
Karşılaştırılmasına İlişkin Simülasyon Çalışması
İmran Kurt ÖMÜRLÜ, Mevlüt TÜRE..............................................................................
P02
Birinci Tür Hata’nın Kontrolünde Yanlış Bulgu Oranı Yaklaşımı,
Nurhan DOĞAN, İsmet DOĞAN.....................................................................................
P03
71
Birinci Tür Hatanın Kontrolünde Adımsal Çoklu Karşılaştırma İşlemleri,
İsmet DOĞAN, Nurhan DOĞAN.....................................................................................
P04
70
72
Sağlık Personelinin Hasta Hakları Konusunda Bilgi Tutum ve Davranışlarının Ana
Bileşenler Yöntemi İle Değerlendirilmesi,
M. Yusuf ÇELİK, M.Mutlu DAŞDAĞ, Ömer SATICI, Zeki AKKUŞ, İsmail YILDIZ..........
VII
73
P05
Kanserli Hastalarda; Kanserin Vücuttaki Tutulum Bölgeleri, Hastaların Cinsiyet,
Eğitim Düzeyi ve Mevsimsel Dağılımına Göre İncelenmesi,
Ömer SATICI, M.Yusuf ÇELİK, Zeki AKKUŞ, İsmail YILDIZ, M. Mutlu DAŞDAĞ……..
P06
74
Sonuç Değişkeninin İki Sonuçlu Olduğu Durumda İki Değerlendirici ya da İki Yöntem
Arasındaki Uyumun Değerlendirilmesinde Yeni Bir Yaklaşım: Birey Uyum Katsayısı (CIA),
Semra ERDOĞAN, Gülhan OREKİCİ TEMEL.................................................................
P07
76
Adolesan Bireylerin Boy ve Ağırlıklarına İlişkin İfadelerinin, Ölçümlerle
Karşılaştırılması,
Elçin BALCI, Ferhan ELMALI, Osman GÜNAY..............................................................
P08
Bagging Support Vector Machines for Leukemia Classification,
Gökmen ZARARSIZ, Ferhan ELMALI, Ahmet ÖZTÜRK.................................................
P09
85
Tanı Testlerinin Aile Hekimliğindeki Kullanımına Bir Örnek,
Zekeriya AKTÜRK, Kamber KAŞALİ.............................................................................
P12
84
Genellenebilirlik Kuramı,
Pervin DEMİR, Atilla Halil ELHAN, Derya ÖZTUNA......................................................
P11
83
A Voting Approach for SVM Kernel Selection in Gene Expression Profiling
Gökmen ZARARSIZ,Cenk İÇÖZ, Erdener ÖZÇETİN.......................................................
P10
78
86
Yaşam Analizleri’nde Random Survival Forests ve Cox Regresyon Yöntemleri’nin
Karşılaştırılması,
Ferhan ELMALI, Engin ÖZKAN, Ahmet ÖZTÜRK, Gökmen ZARARSIZ, Serdar ŞIVGIN
P13
88
İneklerde Eko-Yapı Değişkenler Kullanılarak Kronik Endometritis Derecelerinin
ROC Eğrisi Yöntemi İle Belirlenmesi,
İ. Safa GÜRCAN,Ayca BABAK, Doğukan ÖZEN,Aytekin YAMAÇ, Özlem GÜLLÜ.........
P14
89
Hayvancılıkta Verimli Yaşam Süresi Hesaplamalarında Frailty Modellerin
Uygulanabilirliği,
Doğukan ÖZEN, İ. Safa GÜRCAN, Özlem GÜLLÜ..........................................................
P15
Etçi Piliçlerde Karkas Özelliklerinin Temel Bileşenler Analizi ile Değerlendirilmesi,
Aytaç AKÇAY, Mustafa UĞURLU, Akın YAKAN, Fatih ATASOY..................................
P16
90
91
Tahmin Modellerinin Performanslarının Değerlendirilmesi,
Özlem GÜLLÜ, Mustafa Agâh TEKİNDAL, Doğukan ÖZEN, İ.Safa GÜRCAN,
Yasemin GENÇ..............................................................................................................
P17
92
Lojistik Regresyon Analizi (Lra), Yapay Sinir Ağları (Ysa) ve Sınıflandırma ve
Regresyon Ağaçları (C&Rt) Yöntemlerinin Karşılaştırılması,
Emre KUYUCU,Ünal ERKORKMAZ, İlker ETİKAN, Osman DEMİR .............................
P18
Ergenlerde Madde Kullanımı Tutum Analizi,
Serpil Sevimli DENİZ,Hayrettin OKUT,Sanem ŞEHRİBANOĞLU....................................
P19
95
Poisson Regresyon ve Sağlık Alanında Bir Uygulaması,
Esra GÜLTÜRK, Sibel ŞENER.......................................................................................
P20
94
96
Genetik Risk Skoru Dağılımını Etkileyen Faktörler,
Bahar TAŞDELEN, Havva Didem OVLA .......................................................................
VIII
97
P21
AB/BA Çapraz Geçişli Denemelerinde Tip I Hata Oranı ile İlişkili Faktörler ,
Didem DERİCİ, Bahar TAŞDELEN ................................................................................
P22
98
Sınıflama Metotlarında Yeni Bir Yaklaşım: Çok Değişkenli Eklemeli Regresyon
Ağaçları (MART) ,
Gülhan OREKİCİ TEMEL, Handan ANKARALI, Semra ERDOĞAN, Aynur ÖZGE...........
P23
99
Boylamsal İki Durumlu Cevap Değişkeni İçin Genelleştirilmiş Tahmin Denklemi ve
Kuadratik Çıkarım Fonksiyonu Yöntemlerinin Karşılaştırılması: Kolon Kanseri verisi
üzerine bir uygulama,
Anıl Aktaş SAMUR, İbrahim GOKTAŞ, Osman SAKA.....................................................
P24
100
Prostat Spesifik Antijeni Yardımı İle Prostat Kanserinin Değişik Yapay Sinir Ağı
Modelleri İle Tahmini, ,
Mehmet Onur KAYA ,Cemil ÇOLAK, Enver ÖZDEMİR ..................................................
P25
101
Bilgi Güvenliği Ve Kalite Yönetim Sistemleri Arasındaki İlişkinin İncelenmesi
Ve Bir Uygulaması,
Necati ALASULU, Nurhan HALİSDEMİR, Cemil ÇOLAK ..............................................
P26
102
Üniversite Hastanelerinde Risk Yönetimi Değişkenlerinin Logistik Regresyon
Yöntemiyle İncelenmesi,
İsmail YILDIZ, Yusuf ÇELİK, Ömer SATICI, Zeki AKKUŞ, Mutlu DAŞDAĞ,
Murat BİÇİMLİ..............................................................................................................
P27
Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri
Funda Seher ÖZALP, Derya ÖZTUNA............................................................................
P28
103
104
Sonuç Ölçümlerinde Değişime Duyarlılığın Değerlendirilmesinde Kullanılan
Yöntemler,
Mustafa Emre NAKIŞ, Derya ÖZTUNA, Atilla Halil ELHAN, Burcu YANIK....................
P29
105
Temel Bileşenler Regresyon Analizi ve Bir Uygulama,
Emrah CİLVEZ, Atilla Halil ELHAN, Derya ÖZTUNA, Halil İbrahim ACAR, Beyza
Doğanay ERDOĞAN......................................................................................................
P30
Sivas’ta Diyabetik Ayak Görülme Sıklığının Bayesçi Yaklaşımla Tahmin Edilmesi,
Hafize SEZER, Sarper YILMAZ, R. Erol SEZER.............................................................
P31
109
Laboratuvar Hayvanlarının Kullanıldığı Özel Deney Tasarımları ve Örneklem Hacmi,
Şengül CANGÜR, Handan ANKARALI...........................................................................
P34
108
Taguchi Metodu ve Hayvancılık Alanında Uygulaması,
Adile TATLIYER, Hikmet ORHAN ...............................................................................
P33
107
Tarama İstatistikleri ve Türkiye Ölüm İstatistikleri Üzerine Uygulamaları,
Ayten YİĞİTER, Rabia Burcu DEMİRTÜRK...................................................................
P32
106
110
K-En Yakın Komşuluk, Yapay Sinir Ağları ve Karar Ağaçları Yöntemlerinin
Sınıflandırma Başarılarının Karşılaştırılması,
Fürüzan KÖKTÜRK,M. Çağatay BÜYÜKUYSAL, Vildan SÜMBÜLOĞLU......................
P35
111
Küresel Sağlık İstatistiklerinin Görsel Sunumu: Gapminder Örneği,
Songül ÇINAROĞLU....................................................................................................
IX
112
P36
Afyonkarahisar İl Jandarma ve Hava Meydan Komutanlığında Görevli Er-Erbaşların
Aile Planlaması Yöntem Kullanma Durumlarının Değerlendirilmesi,
Ebru BÜYÜKEREN.......................................................................................................
P37
113
Adana'da Yaşayan 9-15 Yaş Grubu Çocukların Vücut Kitle İndeksinin (VKİ)
Değerlendirilmesi ve Obezite,
Yaşar SERTDEMİR, Refik BURGUT, İlker ÜNAL...........................................................
P38
Destek Vektör Makinesi Modelleri ile Miyokardİnfarktüsün Sınıflandırılması,
Emek GÜLDOĞAN, Jülide YAĞMUR, Saim YOLOĞLU, Musa H.ASYALI, Cemil ÇOLAK
P39
115
Dekorasist : Bina İçi Dekorasyona Yönelik Öneri Sistemi,
Fidan KAYA,Gürel YILDIZ, Adnan KAVAK...................................................................
P40
114
116
1964-1994 Tarihleri Arasında Bildirilen Kızamık Vakalarından Olan Ölümlerin
Zamana Bağlı İncelenmesi,
Serhat HAYME, Serdal Kenan KÖSE, Derya ÖZTUNA, Beyza Doğanay ERDOĞAN…....
P41
117
Epileptik Hastalarda Algılanan Sosyal Destek Düzeyleri ve Depresyon Durumlarının
İrdelenmesi,
Demet ÜNALAN, Ferhan SOYUER, Ali Özdemir ERSOY................................................
P42
Optimal Cut Finding for the Hierarchical Clustering Using Background Information,
Askar OBULKASIM, Gerrit A. MEIJER, Mark A. van de WIEL........................................
P43
128
Generating Rules to Increase Production Using Decision Tree in Car Industry,
M. DAVOODI, M. HOSEINZADEH, H. Gholami MAZINAN….......................................
P51
127
Identifying Cancer Patterns among Iranian Population using Cluster Analysis,
Navid YARALI, Masoud SALEHI, Ali MOEINI, Iman NAVIDI........................................
P50
126
On Nonparametric Prediction in Reliability Analysis,
M. CHAHKANDI, J. AHMADI.......................................................................................
P49
125
Testingthe Normal Assumption of Data Based on Entropy,
Hadi Alizadeh NOUGHABI, NaserReza ARGHAMI.........................................................
P48
124
Normality and Exponentiality Tests,
Hadi Alizadeh NOUGHABI, Naser Reza ARGHAMI........................................................
P47
123
Guideline for the Design and Statistical Analysis of Biological Experiments,
Mahmoud Hozayn MAHMOUD......................................................................................
P46
122
A Benchmark for Docking of 60 Protein-Ligand Complexes,
Anton STOILOV, Radoslav MAVREVSKI.......................................................................
P45
119
Quality of Life Among Healty Elderly (65 Years and Older) In Shiraz, Iran,
Sareh KESHAVARZI, Seyed Mehdi AHMADI.................................................................
P44
118
129
Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different
Temperatures,
H. ESMAILY, M. Hadi ALIJANVAND, H. DOOSTI, M.T.SHAKERI...............................
P52
130
Age at Menopause Among Rural Women of Marrakech (Morocco),
R. LOTFI,M. LOUKID, M.K. HILALI............................................................................
X
131
P53
Veri Madenciliği Kullanılarak Diyabet Verilerinin Analizi,
Mete ÇELİK, Cevat YAZICI, Mustafa YİĞİTOĞLU, Murat YENİSU, Fatih TANRIVERDİ
P54
İntrauterin İnseminasyon (IUI)’da Ovariyan Rezerv Belirteçlerinin Karşılaştırılması,
Gökalp ÖNER...............................................................................................................
P55
132
134
Birinci Basamak Sağlık Kuruluşlarına Başvuranların Riskli Davranışları ve Etkileyen
Faktörlerin Çok Değişkenli Analizi,
Mahmut KILIÇ..............................................................................................................
P56
135
Childhood Eczema and Asthma: A Multilevel 1958 Birth Cohort Study From
Childhood to Adult
Ghada ABO-ZAID , Nick OSBORNE..............................................................................
P57
136
Gen Ekspresyon Verilerindeyapay Sinir Ağlarına Dayalı Yeni Bir Denetimli Temel
Bileşenler Analizi’nin Geliştirilmesi,
Prof. Dr. Mevlüt TÜRE, Doç. Dr. İmran Kurt ÖMÜRLÜ...................................................
P58
137
Altın Standart Testin Varlığında Çoklu Tanı Testlerinde Birleştirme Yöntemleri
Gülhan OREKİCİ TEMEL, Semra ERDOĞAN……………………………………………
XI
138
I. ÇAĞRILI BİLDİRİLER
1
D01
Biyoistatistik Etiği
Z. Nazan Alparslan1
1
Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana
Özet
İstatistik etiği ilk olarak W.Edward Deming (1900-1993) tarafından tartışılmış bir kavramdır, bu ilk tartışmada
Deming istatistikçinin bilimsel sorumluluklarını ele almıştır. Daha sonra 1999 da ASA (American Statistical
Association) tarafından kabul edilen Ethical Guidelines for Statistical Practice ise istatistikçilerin etik
sorumluluklarını 8 başlık halinde özetler.
Ancak, tabii ki istatistiksel etiğin biyoistatistiksel etikten farkı olması gerekir. Çünkü biyoistatistik bir tıp
alanıdır ve bu bilim dalının yöntemleri ile yapılan hatalar, insan sağlığına veya hayatına bedel olabilir, ya da
bedel olacak yanlış uygulamalara temel oluşturabilir.
Son zamanlarda kanıta dayalı tıp uygulamalarındaki gelişmeler klinik araştırmaya, araştırma metodolojisine
verilen değeri önemli ölçüde etkilemiştir. Bir biyoistatistikçinin de bu alandaki sorumluluğu kanıtı
değerlendirmenin yöntemleri konusunda bilinç geliştirmenin yanında doğru kanıtın yaratılmasına desteği de
içerir. Kanıta dayalı tıp uygulamaları araştırmada biyoistatistikçiye düşen görevin de yeniden şekillenmesine
neden olmuştur. Bu bağlamda biyoistatistik desteğinden beklenti değişmiş, neredeyse ‘uygun p-değeri’ olarak
özetlenebilecek eski beklenti yerini ‘uygun yöntemlerle yapılmış, analiz edilmiş ve yazılmış ‘güvenilir’ bir
araştırma’ beklentisine bırakmıştır. Tıp başta birçok alan ‘kanıt’ peşindedir, biyoistatistik ‘kanıt yaratma’
konusunda önemli bir araçtır ve kanıt yaratma sürecinde farklı aşamalarında biyoistatistikçiye düşen görevler
çok çeşitlidir. Bu görevlerin etik penceresinden gözden geçirilmesi ya da tartışılması biyoistatistik etiği ile ilintili
konuların maddeleşmesi konusunda yol gösterici olabilir.
Kanıt yaratma sürecinde biyoistatistikçiye düşen görevlerin alanları; çalışma planlanırken,çalışma protokolu
oluşturulup kaydı yapılırken, çalışma yürütülürken, analiz edilirken ve raporlanırken olarak gruplanabilir. Bu
gruplamada söz edilen her aşama içerdiği sorumlulukların yerine getirilmesi konusunda kendine has etik
değer(ler) taşır. Bu aşamaların etik penceresinden değerlendirileceği sunumda, ayrıca biyoistatistikçilerin
emeğinin nihai karşılığı olarak nitelendirilebilecek ‘yazarlık hakları’ konusu da bu bağlamda gözden
geçirilecektir.
Bu sunum ile biyoistatistik alanının etik kuralları konusunda bir açılım amaçlanmaktadır.
2
D02
Hybrid RBF Neural Network Models for Supervised Classification of Medical Data With Information
Complexity And The Genetic Algorithm (1)
Hamparsum Bozdogan1
1
The University of Tennessee, Operations and Management Science andCenter for Intelligent Systems and
Machine Learning (CISML), Department of Statistics, Knoxville, TN, U.S.A.
Abstract
In this paper we introduce and develop a novel supervised classification technique using a Hybrid Radial Basis
Function Neural Networks, abbreviated as HRBF-NN. As is well known, recently, kernel-based supervised
classification techniques such as the Support Vector Machines (SVMs) and multi-class SVMs have become
popular. One problem that has not been addressed in the literature is that kernelization and supervised
classification takes place in the high dimensional Reproducing Hilbert Kernel Space (RHKS) and not in the
original data space. The transformed kernel space mapping is not one-to-one and onto, and not invertible to the
original data space due to the dot product operations using the kernel trick. This makes the practical
interpretation of the results difficult even though one can get good classification error rates.
The new HRBF-NN approach proposed in this paper overcomes the difficulties encountered in the RHKS type
supervised classification and provides us a flexible technique in the original data space that combines regression
trees, regularized regression, and the genetic algorithm (GA) with radial basis function (RBF) neural networks
(NN) along with information complexity (ICOMP) criterion as the fitness function to carry out both
classification and at the same time subset selection of best predictors which discriminate between the classes.
We apply HRBF-NN supervised classification to simulated data and as well as on several benchmark real
medical data sets using training and testing, and cross-validate our results 1000 times. We obtain the
classification accuracy of our results for both saturated model and also for best subset GA selected predictors
under the best fitting RBF kernel function.
Our results show the excellent performance of this new approach in the original data space. This new method
handles also categorical variables without any difficulties where one does not need to assume that the categories
come from a "hidden continuous probability distribution.” Indeed, the RBF kernels automatically put “pseudo
distribution” over the categories and overcome the arbitrary assumption of the "hidden continuous probability
distribution." Our numerical results show the high classification accuracy over other supervised classification
methods on the same data sets.
Keywords: Hybrid Radial Basis Function Neural Networks, Supervised Classification, Information Complexity,
the Genetic Algorithm
(1)
Joint work with Dr. Oguz Akbilgic Istanbul University School of Business, Department of Quantitative
Methods, Istanbul, Turkey E-mail: [email protected]
Prof. Dr. Hamparsum Bozdogan: Email: [email protected]
3
D03
Correspondence Analysis in Biological Research
Michael Greenacre1
1
Universitat Pompeu Fabra, Barcelona
Abstract
Correspondence analysis is a method of multivariate analysis similar to principal component analysis but
adapted to categorical data of various types: count data, percentages, survey data. It applies equally well to
nonnegative data on several variables having the same ratio scale: for example, data all in grams, concentrations
in parts per million, financial data in the same monetary unit, etc. In this talk I will present several contexts in the
field of biology, including the health and environmental sciences, where correspondence analysis has been
applied to give insight into large data sets. One of the most extensive areas of application is in the analysis of
ecological data, in the study of the relationship between biological species distribution and environmental
covariates - my own experience has been primarily in marine biology.
In 1974 correspondence analysis was
described as a "neglected multivariate method", but today it is an essential and invaluable tool of multivariate
analysis, available in every major software package as well as in several packages in R.
References:
Greenacre, M. (2007). Correspondence Analysis in Practice. Chapman & Hall / CRC Press.
Greenacre,
M.
(2010).
Biplots
in
Practice.
BBVA
www.multivariatestatistics.org.
4
Foundation,
Madrid.
Free
download
from
D04
Generalized Penalized Cananical Correlation Analysis
Aeilko Having Zwinderman1
1
University of Amsterdam, Academic Medical Center, Dep. Clinical Epidemiology, Biostatistics &
Bioinformatics, Amsterdam, Netherlands
Abstract
Many different factors play a role in the development and progression of complex diseases by studying how and
which factors act together, we get a better understanding about these complex diseases. By adapting penalization
methods to canonical correlation analysis, it is possible to associate two high dimensional sets of factors and
obtain sparse results which tell us something about how certain factors act together. However, two sets might
contain too limited information about the disease under study. We therefore adapted penalization methods to
generalized canonical correlation analysis, such that more than two sets of factors can be associated. We applied
this method to a dataset of 217 patients with renal failure containing three sets of factors, and obtained sparse
interpretable results about the underlying complexity of the disease.
Prof. dr. Aeilko Having Zwinderman: Academic Medical Center, Dep. Clinical Epidemiology, Biostatistics &
Bioinformatics, University of Amsterdam, PO Box 22700, 1100 DE Amsterdam, the Netherlands
e-mail: [email protected]
5
II. SÖZLÜ BİLDİRİLER
6
S01
Tanı Testi Yargılamalarında Kesim Noktası Kestirimi İçin Bir Yaklaşım
Mustafa Ş. Şenocak1, Özden Calay2
1
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
2
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
Özet
Giriş: Sürekli veya sıralı ölçekli değerlendirmelerle yargılamada bulunan tanı testlerinde en önemli sorunlardan
biri tanılama açısından en uygun kesim noktası (cut-off) değerinin saptanmasıdır. Bu amaçla kullanılan çeşitli
görsel , kuramsal , işlemsel yaklaşımlar bulunmaktadır. Bunların kendi aralarında tutarsızlıkları bulunabildiği
gibi tanısal yargı açısından her yönü ile ideal bir çözümün varlığı tartışmalıdır dolayısı ile yeni yöntem arayışları
sürmektedir.
Amaç: Basit ama en sık kullanılan Youden İndeksi (J) , Ayırdetme Göreliliği Oranı (AGO : LR:Likelihood
Ratio) ve Duyarlılık-Özgüllük kesişimi gibi yaklaşımlara karşın kendi öngördüğümüz bir indeks olarak , en
uygun (optimum) Duyarlılık-Özgüllük vektörünün özelliklerini ve artı yönlerini değerlendirmek.
Yöntem: Kendi indeksimiz olarak öngördüğümüz (1/ ((1-Sp)2+(1- Sn)2)0.5) değerinin , özel olarak farklı AUC
düzeyleri için üretilmiş veri setlerindeki sonuçlarını , Youden indeksi ve 1/AGO sonuçları ile kıyaslamalı olarak
değerlendirdik.
Tartışma ve sonuç: Çeşitli tanı geçerliliği yargılama setlerindeki sonuçlara göre indeksimiz sonuçlarının,
belirsizlikleri olan 1/AGO değerinden çok daha verimli olduğu , sıklıkla Youden indeksi ile aynı kesim noktası
değerleri üretebilmesine karşın , duyarlılık , özgüllük uyum ve uygunlukları açısından daha akılcı sonuçlar
üreterek Youden'den farklılaşabildiği gözlenmiştir. Youden indeksindeki bazı yüksek sonuçların sık tekrarlı
olabildiği ve testin özünlü değerlerinden birinin çok yetersiz olması durumunda da ortaya çıkabildiği
görülmektedir. Buna karşılık indeksimizin daha uygun duyarlılık-özgüllük çiftleri belirleyebildiği gözlenmiştir.
İndeksin özelliği açısından 2.8 den yüksek değerlere erişilebilen tanı testi yargılamalarında hem hastaları hem
sağlıklıları belirlemede uygun kararlar alınabileceği de düşünülebilir.
Anahtar kelimeler: Tanı testi , Kesim noktası (cut-off) , Youden indeksi , LR , AGO
Prof. Dr. Mustafa Şenocak: Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303
Tel.: 0 212 414 30 41 E-Posta: [email protected]
7
S02
İkili Yöntem Kıyaslamalarında Bir Görsel Yaklaşım Önerisi
Mustafa Ş.Şenocak1
1
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
Özet
Giriş: Sürekli değişkenlerin konu olduğu ikili yöntem kıyaslamalarında, referansa göre sonuç yargılamalarında
sadece istatistiksel değerlendirmelerle yoruma gitmenin yetersiz olduğu düşünülmektedir. Temelde eşlendirilmiş
dizi konumunda olan
kıyaslama düzeninde bilinen hesaplamaların yanı sıra korelasyon ve regresyon
yaklaşımları da kullanılmakta, ayrıca yöntemler arası farkların veri büyüklüğünden etkilenimi, fark dizisinin
dağılım tipi , farkın anlamlılığı , istatistiksel anlamlılığın veya anlamsızlığın kavramsal nedeni gibi bilgilerin
görsel yaklaşımlarla da vurgulanarak sunulması çok daha yararlı bulunmaktadır. Bu çerçevede en bilinen ve
kullanılan yaklaşımlar Bland-Altman Grafiği, Deming regresyonu Passing-Bablock regresyonudur.
Amaç: Sürekli değişkenlerin konu olduğu ikili yöntem kıyası
amaçlı – eşlendirilmiş – veri dizilerinde yaklaşımların genel fark
yönünü, farklılaşmanın düzenini ve fark dizisinin yapısını
gözlemleme açısından yeni bir yaklaşım önerilmiştir.
Yöntem: Eş çift farkları veri dizisinde , değerlerin temel
farksızlık olan “0” dan farkları , fark dizisi standart sapması
tabanlı olarak z skorlarına dönüştürülmektedir. Oluşan skor
dizisi sıralanarak – büyükten küçüğe veya tersi – iki “fark
düzeni üçgeni “ oluşturulmaktadır. Bunların orta noktaya göre
boyut farkları , iki yöndeki 1.96 sınırlarını geçme ve bakışım
özellikleri , yöntemler arası farkı istatistiksel yargısı ile birlikte
görme açısından yararlı ve tutarlı gözükmektedir. Bu amaçla
farklı örneklem büyüklüklerinde ve istatistiksel yapıları ve
farklılıkları özel olarak hazırlanmış veri setlerinde yaklaşımın
çeşitli özelliklerini açık olarak belirlemek amacı ile uygulamalar gerçekleştirilmiştir..
Tartışma ve sonuç:
Gerçek istatistiksel yapılar ve sonuçlarla görsel yaklaşımın temel özellikleri koşut
açıklayıcılık göstermektedir. Ek olarak olgu numaralarının kullanımı sorunlu çiftleri belirlemede, toplam alanın
iki tarafındaki% 2.5 luk sınırların belirlenmesi verilerin ve farkların dağılım tipini gözlemlemede yarar
sağlamaktadır. Yaklaşımın, uygulama kolaylığı ve bilgi – yorum üretimi verimi ile oldukça yararlı olabileceği
düşünülebilir.
Anahtar kelimeler: Yöntem kıyaslaması, Bland-Altman grafiği, Görsel yaklaşım
Prof. Dr. Mustafa Şenocak: İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişimi
ABD, İstanbul E-Posta: [email protected], [email protected]
8
S03
ROC Analizinde Kesim Noktası Belirlemede Kullanılan Yöntemlere Alternatif Bir Öneri
İlker Ünal1, Refik Burgut2, Yaşar Sertdemir2
1
2
İzmir Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İzmir
Çukurova Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD, Adana
Özet
Amaç: Sayısal bir ölçümün tanı testi olarak kullanılması durumunda ölçümün sınıflamadaki başarısını
belirlemede ROC analizine başvurulur. ROC analizi sonucunda iki bilgi elde edilir: Ölçümün sınıflamadaki
başarısı ve sayısal ölçüm için tanı koymada kullanılacak en uygun kesim noktası. En uygun kesim noktasının
belirlenmesinde maksimum Youden indeksi değeri ve sol üst köşeye en yakın noktayı belirleme yöntemleri
sıklıkla kullanılmaktadır. Bu çalışmada bu iki yönteme alternatif olabilecek yeni yaklaşımlar araştırılmıştır.
Yöntem: Alternatif olarak sunulabilecek ilk öneri duyarlılık ve seçicilik değerinin aynı veya birbirine çok yakın
olduğu ölçüm değerini kesim noktası olarak kullanmaktır. İkinci öneri ise duyarlılık ve seçicilik değerlerinin
ROC eğrisi altında kalan alan değerine en yakın olduğu ölçüm değerini kesim noktası olarak kullanmaktır. Bu
çalışmada önerilen bu yaklaşımlar farklı eğri altında kalan alan değerleri (0.7, 0.8, 0.9), hasta ve kontrol
gruplarının ölçümlerinin değişen dağılımlar göstermesi (normal, normal olmayan), değişen örneklem
büyüklükleri (n=50, 100, 500) durumları altında literatürde belirtilen yöntemlerle karşılaştırılmıştır.
Bulgular: Elde edilen sonuçlara göre yüksek eğri altında kalan alan değerlerinde önerilen yaklaşımlarla elde
edilen kesim noktası değerlerinin %80 oranında literatürde önerilen yaklaşımlarla elde edilen kesim noktaları ile
aynı olduğu görülmüştür. Ayrıca en uygun kesim noktası kavramı duyarlılık ve seçicilik değerinin aynı anda en
yüksek değerde olması olarak kabul edildiğinde, eğri altındaki alan değeri azaldıkça önerilen yaklaşımlarca elde
edilen kesim noktasının yaklaşık %60 oranında daha uygun olduğu görülmüştür. Örneklem büyüklüğünün
yüksek olması durumunda literatürdeki yaklaşımlarla benzer sonuçlar elde edilirken, küçük örneklemlerde
önerilen yaklaşımların daha uygun kesim noktası belirledikleri tespit edilmiştir.
Sonuç: Önerilen yaklaşımlardan, eğri altında kalan alan değerine yakın duyarlılık ve seçicilik değerini veren
ölçüm değerini kesim noktası olarak belirleme yöntemi; hem uygun kesim noktası belirlemede kullanılan diğer
yöntemlerle büyük ölçüde benzer veya daha iyi sonucu vermesi, hem de diğer yöntemlerin aksine matematiksel
işlem gerektirmemesi nedeniyle uygun kesim noktası belirlemede oldukça başarılı bir yöntemdir.
Anahtar Kelimeler: ROC eğrisi, optimal kesim noktası, Youden indeksi
9
S04
Biyoeşdeğerlik Çalışmalarında Birey İçi Değişkenliğin Eşitliğine Yönelik Testlerin Değerlendirilmesi
Nur Özge Sezgin1, Mehmet N. Orman1
1
Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Bornova, İzmir
Özet
Amaç: FDA (Food and Drug Administration), EMA (European Medicines Agency) ve WHO (World Health
Organization) gibi ilaç düzenleme kurumları biyoeşdeğerlik çalışmalarında biyoeşdeğerliğin ispati için sadece
ortalama biyoeşdeğerliği yeterli görmektedirler.
Ortalama biyoeşdeğerlik ise eşdeğerlik sağlansa bile iki ürünün terapötik olarak eşdeğer ve değiştirilebilir
olduğunu garanti etmeyebilir. İki ürünün terapötik olarak eşdeğerliği ve değiştirilebilirliğinin sorgulanmasında
birey içi değişkenliğin kontrolü de önemlidir. Literatürde iki ürünün birey içi değişkenliğinin belirlenmesine
yönelik testler [Pitman-Morgan Düzeltilmiş F Testi (PMD), Spearman Sıra Korelasyon Katsayısını baz alan Test
(SSK), Periyot etkisinden arındırılmış Pitman Morgan Düzeltilmiş F Testi (PMDP), Periyot etkisinden
arındırılmış Spearman Sıra Korelasyon Katsayısını baz alan Test (SSKP)] önerilmiştir.
Bu çalışmada, birey içi değişkenliğin eşitliği için literatürde önerilen istatistiksel testlerin performansları I. tip
hata bakımından değerlendirilmiştir.
Yöntem: Testlerin, I. Tip hata bakımından performans değerlendirilmesi %90, %95 ve %99 güven düzeyinde,
18, 24 ve 36 örneklem büyüklüğünde, 2 farklı bireyler arası değişkenlik (varb) (0.04 ve 0.08) ve 5 farklı
varyasyon katsayısı seviyelerinde (CV) (0.16, 0.23, 0.30, 0.40, 0.50) gerçekleştirilmiştir.
Bulgular: Örneklem sayısı (n) 18 alındığında SSK simülasyon çalışmalarının tümünde güven aralıklarının dışına
çıkmıştır. PMD sadece (α=0.05, varb=0.08, CV=0.16), SSKP sadece (α=0.1, varb=0.08, CV=0.30) ve PMDP ise
sadece (α=0.1, varb=0.04, CV=0.40) durumlarında istenilen aralıkların dışına çıkmıştır. Diğer durumlarda güven
aralığı içindedir.
n= 24 alındığında SSK %90 güven düzeyinde tüm durumlarda ve (α=0.05, varb=0.08, CV=0.16, 0.23, 0.50),
(α=0.05, varb=0.04, CV=0.16, 0.50), (α=0.01, varb=0.08, CV=0.16), (α=0.01, varb=0.04, CV=0.40)
durumlarında belirlenen güven aralıkları dışında diğer durumlarda ise içeridedir. PMD, SSKP ve PMDP testleri
tüm durumlarda belirlenen güven aralıkları içinde bulunmuştur.
n= 36 alındığında sadece SSK %90 güven düzeyinde güven aralığı dışında çıkmıştır. Diğer durumlarda güven
aralıkları içerisindedir. PMD ve PMDP tüm durumlarda güven aralığı içerisinde bulunmuştur.
Sonuç: PMD’nin n=18 alındığında sadece bir durum haricinde başarısız, diğer durumlarda ise başarılı
bulunmuştur. n= 24 ve n=36 alındığında ise tüm durumlarda başarılı bulunmuştur.
SSK, n=18 alındığında tüm simülasyon çalışmaları sonucunda başarısız bulunurken n=24 alındığında %90 güven
düzeyinde başarısız iken %95 ve %99 güven düzeylerinde farklı değerler kullanılarak yapılan simülasyon
çalışmalarının bir kısmında başarılı bulunmuştur. n=36 alındığında ise sadece %90 güven düzeyinde başarısızdır.
10
PMDP ve SSKP n=18 alındığında bir durum dışında başarılı bulunmuşlardır. n=24 olarak alındığında ise başarılı
olmuşlardır. N=36 olarak alındığında PMDP tüm durumlarda güven aralığı içerisinde bulunmuştur.
Anahtar Kelimeler: Birey içi değişkenlik, Biyoeşdeğerlik, Simülasyon, I. Tip hata
Nur Özge Sezgin: E-Posta: [email protected]
11
S05
GeneLearneR: Genetik Veri Madenciliği Analiz Aracı
Erdal Coşgun1, Aydın Kaya2, Ali Seydi Keçeli2, Ergun Karaağaoğlu3
1
2
Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Hacettepe Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Ankara
3
Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Genetik araştırmalar 1970’li yıllarda Sanger ve Coulson tarafından önerilen daha ayrıntılı DNA sekanslama
tekniğinden itibaren hayatımıza doğrudan etki etmeye başlamıştır. Farkında olmadan gördüğümüz tedavi,
yediğimiz yiyecekler, kullandığımız ilaçlar bu araştırmalardan edinilen tecrübeler ışığında üretilmeye
başlamıştır. Bu araştırmalarda araştırıcıların karşısına çıkan en önemli sorun ise çok büyük boyuttaki verinin
doğru şekilde analiz edilmesi olmuştur. Bu sorunun çözümü için makine öğrenmesi (machine learning) ve veri
madenciliği (VM) yöntemlerinin kullanımı yaygınlaşmıştır. Önceleri teorik algoritmalarla sorunları küçük veri
setlerinde çözme işlemi (Machine Learning), sonrasında buradan edinilen deneyimler ile büyük veri setlerinin
analizi için veri madenciliği algoritmaları geliştirildi. Ancak bu zamana kadar temel programcılık bilgisi
olmadan sadece paket program olarak sunulan araçlar ile genetik-veri madenciliği yapılmaktadır. Ancak dikkat
edilmesi gereken en önemli nokta ise her veri setinin karakteristik özelliklerinin olmasıdır. Örneğin: sekanslama
verisine, gen ekspresyon verilerinin analizinde kullanılacak VM yöntemlerini uygulamak imkansızdır. Çünkü
birisi nükleotid (adenin, sitozin, guanin, timin) dizisi, diğeri ise sayısal veri türündedir. Bu nedenle araştırıcılar
sadece kendilerine sunulan ile yetinmek zorunda kalmaktadırlar. Programcılık bilgisi olan araştırıcılar ise daha
çok açık kaynak kodlu programlama dillerine yönelmişlerdir. Çünkü lisanslı paket programlar hem araştırıcıları
kısıtlıyor hem de projelerin bütçelerinde ekstra büyük miktarlar kaplamaktadır. Bu açık kaynak kodlu
programlama dillerinden en çok tercih edileni [R] ’dır. http://www.r-project.org/.
Bu çalışmada hemen hemen her türlü genetik veriyi analiz edebilen analiz aracı tanıtılacaktır. Özetle, temel VM
analiz süreçlerini adım adım kullanıcılara sunan, ön bilgi olmaksızın “veri önişleme- boyut indirgemegenelleştirme- varyant belirleme, sınıflama, kümeleme, etkileşim belirleme- gen ontolojisi” analizlerini tek bir
pencerede yapmaya olanak tanıyan bir analiz aracı geliştirilmiştir. Bu analiz aracı mevcut araçların eksik yönleri
olan:
a) Yöntemlerin kendine ait kullanılması gereken parametrelerinin optimizasyonu,
b) Birden çok performans ölçüsü ile en iyi yöntem / yöntem grubunu seçme aşamalarını,
c)
Elde edilen önemli genetik faktörlerin mevcut veri tabanları ile karşılaştırılmasının anlık olarak
yapılmasını sağlayacak olması,
d) Farklı yöntem gruplarının hibrit kullanılabilmesi,
konularına getirdiği çözümler sayesinde mevcut teknolojilerin kullanımı ve geliştirilmesinde öncü olacaktır. Bu
sayede yeni projelerin yapılabilmesine süreklilik kazandırılacaktır. Aynı zamanda araştırıcılar projelerdeki
lisanslı yazılım alımına ayrılan bütçenin çok daha altında bir maliyetle analizlerini yapabileceklerdir. “En az veri
madenciliği bilgisi ile en doğru bulgunun” ulaşılmasını sağlayacak bir aracı geliştirilmiştir.
12
Anahtar Sözcükler: Genetik İstatistik, Veri Madenciliği, Makine Öğrenmesi, Gen Ekspresyon, Tek Nükleotid
Polimorfizmi, Next Generation Sequencing, optimizasyon
13
S06
Major Voting Gap Statistic to Estimate the Number of Clusters in a Dataset
Gokmen Zararsiz1, Ahmet Ozturk1, Erdem Karabulut2, Erdal Cosgun2
1
Erciyes University, Faculty of Medicine, Department of Biostatistics and Medical Informatics, Kayseri, Turkey
2
Hacettepe University, Faculty of Medicine, Department of Biostatistics, Ankara, Turkey
Abstract
Cluster analysis is an important data mining technique to divide data into groups and find meaningful clusters.
One of the major challenge in this analysis is the prediction of the number of clusters. Albeit there have been lots
of methods proposed for this problem, there is not an optimum solution. Gap statistic (1) is one of the most
powerful method, which compares an observed internal index, such as the within-clusters sum of squares, to its
expectation under a reference null distribution. However, this statistic has 3 widely used orientations
(permutational, principal component and poisson) which have different theories and gain different success rates
in different applications. In this study, we proposed a major voting gap statistic (mvGap) which combines the
results of these 3 orientations. To demonstrate the efficacy of the mvGap, we used datasets from UCI machine
learning repository, also real and simulated microarray datasets. We also compared our results with individual
gap statistic orientations and other powerful methods. Experimental results revealed that mvGap works well and
can be used to estimate the number of clusters in a dataset.
Keywords: Clustering, Cluster Number, Gap Statistic, Within Clusters Sum of Squares
(1) Tibshirani R, Walther G, Hastie T. Estimating the Number of Clusters in a Data Set via the Gap Statistic.
J.R.Statist.Soc.B 2001; 63: 411-423
14
S07
Dikotom Sonuçlu Yorumlamalarda, 2'den Fazla Değerlendiricinin Sonuç Uyumlarının Fleiss Kappa ve
Cochran Q ile Değerlendirmelerinin İrdelenmesi
Pınar Ambarcıoğlu 1, Nurgül Bulut 1, Mehmet Kızılçeç 1
1
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
Özet
Giriş: Fleiss Kappa Katsayısı, ikiden fazla değerlendirici arasındaki uyumun düzeyini ölçen bir istatistik
yöntemdir. Cochran Q Testi ise, eşlendirilmiş iki grup arasındaki farkın önemliliğinin tespit edildiği McNemar
Testi’nin ikiden çok grup için genelleştirilmiş halidir. Diğer bir deyişle, Fleiss Kappa Katsayısı, değerlendiriciler
arası uyumu, Cochran Q Testi ise değerlendiriciler arası farkı belirlemektedir. Buna dayanarak aralarında uyum
gözlenen değerlendiriciler arasında fark gözlenmemesi; benzer şekilde aralarında uyum gözlenmeyen
değerlendiriciler arasında fark gözlenmesi kavramsal olarak beklenebilmektedir. Genel geçerliliği olmayan bu
beklenti uygulamada bazen önemli yorum ve karar yanlışlıklarına da neden olabilmektedir.
Amaç: Farklı örneklem büyüklüğü, değerlendirici sayısı ve sıklığın bulunduğu koşullarda Fleiss Kappa
Katsayısı ve Cochran Q Testi sonuçlarının tutarlılıklarının incelenmesi.
Yöntem: 3, 4 ve 6 değerlendiricinin bulunduğu düzenlerde, dikotom sonuçları %20, %50 ve %80 pozitif oranda
olacak şekilde 20, 50 ve 100 birimlik 1000’er veri seti benzetimi yapıldı. Elde edilen toplam 27000 veri setinin
her biri için hem Fleiss Kappa Katsayısı hesaplandı hem de Cochran Q Testi uygulandı.
Tartışma ve sonuç: Değerlendiriciler arasında uyum gözlenmesi halinde farksızlık, uyum gözlenmemesi
halinde farklılık beklentisi doğrultusunda; değerlendirici sayısına, dikotom sonuçlardaki sıklığa ve örneklem
büyüklüğüne bağımlı olmaksızın Fleiss Kappa Katsayısı ve Cochran Q Testi sonuçlarının birbirini
desteklemediği gözlenmiştir. Bu iki yaklaşımın birbirlerini kavramsal olarak doğrulama oranları aşağıdaki tablo
ile özetlenmiştir:
3 değerlendirici
4 değerlendirici
6 değerlendirici
Örneklem 0,2
0,5
0,8
0,2
0,5
0,8
0,2
0,5
0,8
20
0,045
0,049
0,051
0,038
0,033
0,042
0,035
0,035
0,042
50
0,063
0,049
0,049
0,088
0,06
0,005
0,05
0,048
0,052
100
0,053
0,053
0,059
0,046
0,051
0,052
0,043
0,056
0,04
15
Klinik değerlendirmelerde, fark-farksızlık ve bağıntı-uyum terimlerinin kullanılmasında kavramsal içerikler
titizlikle göz önünde bulundurularak değerlendirme yapılmasının önemi bir kez daha ortaya çıkmaktadır.
Anahtar kelimeler: Fleiss Kappa, Cochran Q, Uyum
Pınar
Ambarcıoğlu:
Cerrahpaşa
Tıp
Fak.
Biyoistatistik
Tel.: 0 212 414 30 41 E-Posta: [email protected]
16
ve
Tıp
Bilişimi
ABD-İstanbul
34303
S08
“Sıfır Olgu” Tasarımının Benzetim Çalışması İle Değerlendirilmesi
Yeşim Tunç1, Alev Bakır2, Pınar Ambarcıoğlu1, Mustafa Ş.Şenocak3
1
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
2
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
3
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik veTıp Bilişimi ABD, İstanbul
Özet
Giriş: Düşük sıklıktaki hastalıkların, özelliklerin belirlenmesinde, öngörülen sıklığa göre örneklem sayısı
belirlenerek taramalar gerçekleştirilmesi belirgin çözüm gibi görünmektedir. Ancak bu koşullarda örneklem
büyüklüğü çok genişlemekte ve beraberinde zaman, kaynak, lojistik, personel sayısı gibi pek çok sorun da
birlikte gelmektedir. Bu çerçevede bir çözüm olarak ilgili konuda taramada saptanan olgu sayısı değil, halen olgu
saptanmaksızın taranmış örneklemin büyüklüğünün yararı düşünülmüştür ve yöntem "sıfır olgu tasarımı" olarak
adlandırılmıştır. Standart istatistiksel kurama göre "P" sıklıkta bulunması öngörülen bir durum için N örneklemin
taranması ile hiçbir olguya rastlanmamış ise bu durumun anlamlılık düzeyi p= (1-P)^N olarak belirlenir ve 0.05
anlamlılık sınırına göre düşük bir olasılık öngörülen sıklıktan aşağıda bulunulduğunu gösterir. Örneğin %3
sıklık öngörüsü ile 98 örneklemde halen ilgili tip olguya rastlanmamış ise öngörülen sıklığın geçerliliği
varsayılabilir. Böylece belli bir sıklık öngörüsünün (P) anlamlı olarak doğru kabulü için en az 3/P örneklemde
olgu bulunmaması hesaplanabilir.Bu yaklaşım öngörülebilir sıklıkların geçerliliği - veya kıyaslanması açısından genel çizgileri ile ve gereğinde güç düzeyini de göz önünde bulundurarak kolay bir yöntem olarak
gözükmektedir. Ancak yaklaşımın sadece %2 den düşük sıklıklar için geçerli olabileceği, sonucun öngörü
sıklığın dışında taramaya açık evrenin boyutundan da etkilenebileceği düşünülmektedir.
Amaç: Sıfır olgu tasarımının öngörü sıklık ve hedef evren boyutundan etkilenim özelliklerinin gözlenmesi.
Yöntem: 500, 1000 ve 4000 örneklemlik kümelerde % 0.5, 1 ,2 ,5 ve 10 öngörü sıklıkları (Π) ile 1000 er
benzetim NCSS programınca üretilmiştir. Her konumda ilk konu olgu saptanana dek gözlenmiş örneklem
büyüklüğü ve bu sınırın öngörü sıklığa göre anlamlılığı, anlamlı fark gösteren durumların oranı (x/1000)
belirlenmiştir.
Tartışma ve sonuç: Farklı sıklıklar, hedef örneklem büyüklükleri, benzetimin ortalama sıklıkları, tip olgu tekrar
aralığı ortalaması (n) ve öngörüden anlamlı farklı sıklıkların oranı tablolanmaktadır.
17
0.005
0.01
0.02
0.05
0.1
Örneklem: 500
1000
4000
π
0,00545±0,00284
0,00507±0,00227
0,00505±0,00106
oran
4/1000
13/1000
38/1000
n
124.87
184.13
194.97
π
0,01009±0,00421
0,01001±0,00316
0,01004±0,00155
oran
6/1000
23/1000
33/1000
n
97.6
99.9
98.7
π
0,02012±0,00635
0,02007±0,00448
0,02009±0,00221
oran
28/1000
38/1000
49/1000
n
48.3
50
50.9
π
0,04994±0,00954
0,05023±0,00684
0,04995±0,00345
oran
48/1000
47/1000
38/1000
n
21.9
19.8
18.7
π
0,09945±0,13107
0,09990±0,00955
0,09986±0,00478
oran
46/1000
43/1000
41/1000
n
10.5
9.6
9.8
Hedef örneklemin büyümesi ile ilk olgu sırası saçınımının artabileceği böylece aykırı durum oranının da
artabileceği gözlenmektedir. Özellikle %2 den yüksek sıklıklarda hatalı sonuç oranının arttığı ancak örneklem
büyüklüğü etkisinin azaldığı düşünülebilir. Yöntemin öngörü sıklığın %2 den düşük olduğu konumlarda
uygulanabileceği ama belli düzeyin aşılmadığına ilişkin yoruma yaramasına karşın gerçek sıklığı belirtmekte
sorunlu olacağı düşünülerek kullanılması uygun gözükmektedir.
Anahtar kelimeler: Sıfır olgu tasarımı, Örneklem büyüklüğü, öngörü sıklık, tarama
Prof. Dr. Mustafa Şenocak: Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303
Tel.: 0 212 414 30 41 E-Posta: [email protected]
18
S09
Ters örnekleme – I
Ters örnekleme yaklaşımında sonuç güvenirliğini etkileyen ögeler
F. Nesrin Turan1, Nurgül Bulut2, Esra Ş. Yılmaz2, Mustafa Ş.Şenocak2
1
2
Trakya Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
Özet
Giriş: Ters örnekleme, özellikle düşük sıklıktaki olayları (öngörülen P< %5) belirlemede, yüksek örneklemlerle
gerçekleştirilecek taramalar yerine daha kısıtlı ve erişilebilir sayılarla kestirimler yapmaya olanak tanıyan bir
yöntemdir.
Belli sayıda konu olgunun (k) eldesine rastgele bir akış ile toplamında erişilen örneklemden (n)
yola çıkarak bir sıklık öngörülebilmektedir (p ) : p = (k-1) / (n-1). Sonuç, örneklemenin kesildiği sayıya ve
bu noktada erişilmiş olan olgu sayısına göre değişim göstermesinin yanı sıra araştırmalarda önerilen formüller
çerçevesinde kestirimsel varyans da bu özelliklere göre farklılaşmaktadır. Konu özelliğin incelendiği ana evrenin
boyutunun kısıtlılığına bağlı olarak da farklılaşımlar ortaya çıkabilmektedir.
Amaç: Ters örnekleme yöntemi ile elde edilen sonuçlara etkisi olduğu anlaşılan ögelerin, oluşturdukları bu
farklılaşmaların düzenini ve düzeyini gözlemlemek.
Yöntem: Kaynaklardan elde edilen formül yaklaşımları çerçevesinde farklı örneklem büyüklükleri için
öngörülen gerçek sıklıklarda ( % 10,5,2,1,0.5) , bu sıklıklara denk gelen olgu sayısı birikimlerinin (200, 500,
1000, 2000, 5000, 10000 büyüklükte örneklemler ve örneğin 200 örneklemde 2 olgu = % 1 olarak) ters
örnekleme yöntemi ile irdelendiğinde verdiği kestirim sıklıkların gerçek sıklığa göre yüzde farkları
hesaplanmıştır. Benzer şekilde kestirimsel varyansdaki temel ve hedef evren büyüklüğüne göre olan
farklılaşmalar da hesaplanmıştır.
Ters örnekleme ile öngörü sıklıkta hata (%)
örneklem
0.005
0.01
0.02
0.05
0.1
200
100.00
49.75
24.62
9.55
4.52
500
39.88
19.84
9.82
3.81
1.80
1000
19.92
9.91
4.90
1.90
0.90
2000
9.95
4.95
2.45
0.95
0.45
5000
3.98
1.98
0.98
0.38
0.18
10000
1.99
0.99
0.49
0.19
0.09
19
Tartışma ve sonuç: Özellikle % 2 den düşük sıklıklarda kısıtlı tip olgu sayıları ile kestirime gitmenin çok
büyük hatalara yol açabileceği anlaşılmaktadır. 2000 ve üzeri örneklem büyüklükleri ile elde edilen tip olgu
sayıları düşük sıklıklarda bile oldukça uygun sonuçlar verebilmektedir. Bu aşamada ters örneklemenin gerçek
taramaya göre avantajı irdelenmelidir. Kestirimsel varyans da tip olgu sayısının kısıtlılığından etkilenmekte
ancak hedef evren büyüklüğünün göz önünde bulundurulmasında fazla değişmemektedir.
Anahtar Kelimeler: Ters Örnekleme , Olgu Sayısı ,Örneklem Büyüklüğü ,Kestirim Sıklıkta Hata
Yrd.Doç. Dr. F. Nesrin Turan: Trakya Üniversitesi Tıp Fakültesi , Biyoistatistik ve Tıp Bilişimi ABD – Edirne
E-Posta: [email protected]
20
S10
Ters Örnekleme – II
Ters Örnekleme Yaklaşımında Önkabulsel Olgu Sayısının Sonuç Güvenirliğine Etkileri
Nurgül Bulut 1, Alev Bakır1, Pınar Ambarcıoğlu1, Mehmet Kızılçeç1 , Yeşim Tunç1, Esra Ş.Yılmaz1,
Ali Baykuş1, Mustafa Ş.Şenocak1
1
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD., İstanbul
Özet
Giriş: Ters örnekleme, düşük sıklıktaki olayları belirlemede, öngörülen hesaplara göre belirlenmiş ve genellikle
yüksek hacimli örneklemlerle gerçekleştirilecek taramalar yerine daha kısıtlı ve erişilebilir sayılarla kestirimler
yapmaya olanak tanıyan bir yaklaşımdır. Rastgele bir akış ile belli bir büyüklüğe erişmiş bir örneklemde (n)
saptanmış belli sayıda konu olgunun (k) düzeyine göre bir sıklık öngörülmesini temel alır. Bu çerçevede
hedeflenen öngörü sıklık ve örneklemenin kesildiği “k” düzeyi sonucun gerçeği yansıtması açısından etkendir ve
biliçsiz ve temelsiz yaklaşımda oldukça yanıltıcı sonuçlarla da karşılaşılabilir.
Amaç: Ters örnekleme yöntemi ile elde edilen sonuçlara, öngörülen sıklığın ve taramanın kesildiği “k”
sayısının etkisini gözlemlemek, güvenilir durumlar için düşünülebilecek sınırları belirlemede ipuçları
yakalamak.
Yöntem: % 0.5, 1, 2 ve 5 sıklıklar öngörülerek NCSS programının benzetim olanağı ile 2500 ve 5000
örneklemli veri dizileri üretilmiştir. İşlem her konum için 500 kez yinelenmiştir. Her dizide 2. , 5. ,10. ve 20
olgunun ana örneklem sıralamasında kaçıncı olduğuna göre ters örneklem yaklaşımının öngördüğü sıklık
hesaplanmıştır. Elde edilen her öngörü sıklık değerinin, toplam örneklemde üreyen gerçek sıklığın %95 güven
aralığı içinde kalıp kalmadığı belirlenmiştir. Ek olarak benzetimle üreyen değil, üretimde öngörülen sıklığın
güven aralığına göre de sonuçlar belirlenmiştir. Bu çerçevede ana örneklem büyüklüğünün bu sonuçlara etkisine
ilişkin ipucu gözlemlemek de beklenmektedir.
Tartışma ve sonuç: Beklendiği üzere sıklık arttıkça ters örnekleme yaklaşımı ile belirlenen öngörü sıklıklardaki
yanlış
sonuç
oranının
arttığı
gözlenmektedir.
Örneklemin kesildiği olgu sayısı “k” ise çok daha önem
taşımakta ve yanlış sonuç oranını çok yüksek katlarla
arttırmaktadır. Ana örneklem hacminin yüksekliği de
olumsuz etki oluşturmaktadır. Hedeflenen bir sıklığa
göre yola çıkılması ise az da olsa bu olumsuzluğu
arttırabilmektedir. Sonuçta,
ters örneklemenin kısıtlı
olgu sayısı erişimi bekleniyorsa %2 ve daha düşük hedef
sıklıklar için gerçekleştirilmesi bunlarda da en az 15 konu olgu erişimi ile öngörü hesaplamalara geçilmesi uygun
gözükmektedir. Optimum k sayısı için önerilen formüllerden yarar sağlanabilir.
Anahtar kelimeler: Ters örnekleme, Uygun gerçek olgu sayısı, kestirimsel sıklık
21
Prof. Dr. Mustafa Şenocak:
Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303.
Tel.: 0 212 414 30 41 E-Posta: [email protected]
22
S11
Mikrodizilim Gen İfade Çalışmalarında Genelleştirme Yöntemlerinin Regresyon Modelleri Üzerine Etkisi
Selen Yılmaz Işıkhan1, Erdal Coşgun2, Erdem Karabulut2, C. Reha Alpar2
1
2
Hacettepe Üniversitesi Sosyal Bilimler Meslek Yüksekokulu, Ankara
Hacettepe Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı, Ankara
Özet
Giriş: Genetik araştırmalarda az sayıda hastaya ait binlerce gen verisinin bulunması, klasik istatistiksel
yöntemlerin (Lojistik Regresyon, Varyans Analizi, Doğrusal Regresyon Analizi vb.) kullanımında sorunlar
ortaya çıkarmaktadır. Tüm genom ölçeği üzerinde gen ifade profilleri ve fenotipler arasındaki ilişkileri
incelemek amacıyla çok sayıda çalışma yapılmıştır.Yakın zamanda sıklıkla kullanılan Destek Vektör Makinaları
(SVM : Support Vector Machine), Karar Ağaçları, Boosted Tree, Random Forest gibi birçok veri madenciliği
yöntemi sınıflandırma amacıyla incelenmiş ve iyi sonuçlar elde edilmiştir. İlk olarak sınıflama problemlerinin
çözümü için geliştirilen bu yöntemler daha sonra regresyon yöntemlerine özellikle doz-yanıt çalışmalarına da
uyarlanmıştır. Bu yöntemlerin klasik regresyon yöntemlerine göre avantajlarından bazıları veri setinin
dağılımına ilişkin varsayım gerektirmemesi ve bağımsız değişkenler arasındaki yüksek ilişkiden (çoklu bağlantı
problemi) etkilenmemesi olarak sıralanabilir. Bu çalışmada en çok tercih edilen yöntemlerden biri olan Destek
Vektör Makinası (DVM) Regresyonun “Bagging” ve “Çapraz Geçerlilik” model genelleştirme yöntemleri ile
elde edilen kestirim performansları karşılaştırılmıştır.
Gereç
ve
Yöntem:
Çalışmada
sözü
edilen
yöntemler
Gene
Expression
Omnibus
(GEO)
(http://www.ncbi.nlm.nih.gov/sites/GDSbrowser) online veri tabanından sağlanan üç aday mikro dizilim gen
ifade
verisine
uygulanmıştır.
Analizler
R-
2.14.0
(http://www.r-project.org/)
ve
ORANGE
(http://orange.biolab.si/) yazılımlarından yararlanılarak yapılmıştır. Model sonuçları, belirtme katsayısı
(coefficient of determination-R2), hata kareler ortalaması (Mean square error-MSE) gibi model performans
kriterleri ile karşılaştırılmıştır.
Bulgular: Bu çalışmada GEO’dan ulaşılan üç mikrodizilim gen ifadesi verisi ile modeller test edilmiştir. Çünkü
orijinal veri setlerinin kullanımı yeni yöntemlerin test edilmesinde en çok tercih edilen yaklaşımlardandır.
Çalışmadaki en önemli bulgu Bagging (Bootstrap Aggregating) ve çapraz geçerlilik gibi birleştirmeye ve
yeniden örneklemeye dayalı genelleştirme yöntemleri kullanıldığında DVR’nin daha iyi kestirim yaptığıdır
(Tablo1).
Tablo 1. Bazı Genelleştirme yöntemleri ile Destek Vektör Regresyonun kestirim performansı sonuçları
VERİ I: GDS630*
VERİ II: GDS635*
VERİ III: GDS991*
YÖNTEM
R2
HKO
R2
HKO
R2
HKO
DVR
0,57
2,607
0,46
10,722
0,57
2,497
DVR-ÇG
0,60
2,312
0,65
8,265
0,58
1,622
DVR-Bagging
0,73
2,232
0,60
9,715
0,80
1,942
*GEO veri tabanında veri seti için verilen indeks numarasıdır.
23
Sonuç: Bu çalışmadaki hedefimiz genelleştirme ölçüleri konusunda çok net olmayan bir konuya açıklık
getirmektedir. Özellikle doğrusal olmayan veri yapısında kullanılan DVR’nin sonuçlarını daha kullanılabilir hale
getirmek için elde ettiğimiz bulgular önemlidir. Çalışmamız sonucunda ulaştığımız sonuçlardan “BaggingDVR”nin iki veri setinde en yüksek, bir veri setinde ise temel yönteme göre daha iyi performans göstermesi,
hem ilgili literatüre hem de bu genelleştirme yöntemlerini kullanacak araştırıcılara yol gösterecek bir durumdur.
Çalışmamız bu konudaki araştırmalar arasında farklı bir soruna çözüm arayan pilot çalışma niteliğindedir. İleriki
çalışmalarda farklı genelleştirme ölçüleri (boosting, bootstrap, Leave-One-Out) ile de çalışmanın genişletilmesi
hedeflenmektedir.
Anahtar kelimeler: Destek Vektör Regresyonu, Genelleştirme yöntemleri, Bagging, Çapraz Geçerlilik
Selen Yılmaz Işıkhan: E-Posta: [email protected]
24
S12
Gene Expression Data Mining with Artificial Immune Clonal Selection Algorithms
Akin Özçift1
1
Dr., Gaziantep Üniversitesi, Gaziantep MYO, Bilgisayar Programcılığı, Gaziantep
Abstract
Gene expression technology oriented data is widely used in disease diagnosis research to design advanced
predictive models. Gene expression technologies produce thousands of outputs from small samples. Extraction
of meaningful information from this high-dimensional space requires application of feature reduction techniques.
In this study, we propose a two-step feature elimination to reduce dimension of nine benchmarking gene
expression datasets. First a Symmetrical Uncertainty Ranker (SUR) is applied to datasets and the 90% of features
of each gene expression data is removed. As a second step, Correlation based Feature Selection (CFS)equipped
with best first search is applied on the datasets to identify the most relevant feature subsets. Subsequently, the
resultant datasets are
classified with the use of eight Artificial Immune Clonal Selection Algorithms on top of 10-fold Cross
Validation (CV). The experimental results demonstrate that the proposed two-step feature selection strategy is
promising and CLONALG is the best algorithm in the classification of gene expression datasets.
25
S13
The Application of Time-Weighted Control Charts in Medical Practice
Leman Tomak1, Yüksel Bek2
1
Ondokuz Mayis Üniversitesi, Tip Fakültesi, Biyoistatistik A.D., Samsun
2
Ondokuz Mayis Üniversitesi, Tip Fakültesi, Biyoistatistik A.D., Samsun
Abstract
Time-weighted graphs are used to detect small shifts in Statistical Process Control. The aim of this study is to
evaluate monitoring the acetabular cup anteversion angles with CUmulative SUM (CUSUM) chart, Moving
Average (MA) chart and Exponentially Weighted Moving Average (EWMA) chart.
The data were obtained directly from thirty patients who had undergone total hip replacement surgery at
Ondokuz Mayis University Faculty of Medicine. The acetabular cup anteversion angles of these people after
total hip replacement were evaluated. CUSUM chart, Moving Average chart, and Exponentially Weighted
Moving Average were used to evaluate the quality control process of cup angles. MINITAB Statistical Software
15.0 was used to generate these control charts.
The assesment done with time-weighted charts revealed that the angles were settled within control limits and the
process was under control. It was determined that the change within the control limits had a random pattern.
As a result of this study it has been obtained that time-weighted quality control charts which are used mostly in
the field of industry can also be used in the field of medicine. It has also been provided that they allow a faster
visual decision.
Key Words: Quality control, control chart, CUSUM, EWMA, MA.
26
S14
Bayesian Model Selection Criteria for Generalized Linear Models with Nonignorably Missing Data
Zeynep Işıl Kalaylıoğlu1
1
Orta Doğu Teknik Üniversitesi, İstatistik Bölümü, Ankara
Abstract
Aim: We are interested in generalized linear models (GLMs) with covariate or response data that are missing not
at random (MNAR). For MNAR data, the underlying missingness mechanism should not be ignored and
modeled along with the main response model, hence called nonignorable missingness model. Another type of
missingness is missing at random (MAR) in which the underlying missingness mechanism can be ignored (hence
called ignorable missingness). Model selection criteria such as the deviance information criterion (DIC) and
weighted L measure (WL) has been modified for missing data situations and their performances (i.e. capability
of selecting the true model) has been assessed for comparison between GLMs with MNAR data and those with
MAR data. Our aim is to evaluate their performances in comparison among a set of nonignorable missingness
models. In addition, we proposed new modificiations to DIC and WL for missing data situations.
Method: Bayesian methodology is adopted to estimate the DIC and WL. Proposed approaches are compared and
discussed based on various different aspects including computational and philosophical. An extensive Monte
Carlo simulation experiment is designed to assess and compare the finite sample performances of all the model
selection criteria considered herein under different scenarios for missingness amounts.
Findings: A comprehensive evaluation of the performances of the DIC and WL as well as our proposed variants
of them are provided as a result of the extensive simulation study. It is shown that for comparison among
nonignorable missingness models, the DIC and WL do not perform as well as they do for comparison between
nonignorable and ignorable missing model frameworks.
Conclusion: Our study indicates that model selection criteria currently employed for analysis of GLM with
MNAR data need improvement. We give the direction to such an improvement.
Zeynep Işıl Kalaycıoğlu: İstatistik Bölümü, Orta Doğu Teknik Üniversitesi, 06530 Ankara
27
S15
Gri İlişki Analizi
1
Gürol Zırhlıoğlu , Neslihan Akça2, Serap Keskin Tunç2
1
2
Yüzüncü Yıl Üniversitesi Eğitim Fakültesi, Van
Yüzüncü Yıl Üniversitesi Diş Hekimliği Fakültesi, Van
Özet
Örneklem hacminin düşüklüğü ve evren dağılımının ya da örnek değişkenliğinin bilinmemesi, bilinen ve çok
kullanılan istatistik çözümleme tekniklerinin güvenilirliğini etkilemektedir. Gerçek hayatta çeşitli nedenlerle
(yetersiz süre, mali problemler, gerçekten veri sayısının azlığı v.b. nedenlerle) pek çok alanda alınan kararların
yetersiz/sınırlı sayıda veri kullanılarak verildiği bilinmektedir. Gri sistem teorisinin temelinde bilinmeyen ya da
tamamlanmamış bilginin “gri eleman” olarak tanımlanması yer almaktadır. “Gri ilişki” belirli bir sistem
içerisinde iki eleman ya da iki alt sistem arasında değişen ilişkinin ölçümünü ifade etmektedir. Analiz edilen
elemanlar arasındaki benzerlikler ya da farklılıklar “gri ilişki” olarak isimlendirilmektedir.
Yapılan bu çalışmada Yüzüncü Yıl Üniversitesi diş hekimliği fakültesi ağız, diş ve çene cerrahisi kliniğine
başvuran hastaların anlık kaygı durumları çeşitli değişkenler bakımından ele alınarak Gri İlişki Çözümlemesi
yöntemi kullanılarak incelenmiştir. Araştırmada kullanılan veriler, söz konusu kliniğine başvuran 30 hastaya
verilen “Anlık Kaygı Ölçeği”nin doldurulması sonucunda elde edilmiştir.
Yapılan çalışma sonucunda gri ilişki dereceleri büyüklük sırasına göre sıralanmış ve “Kendimi emniyette
hissediyorum” ifadesine katılımın gri eleman ile ilişkisinin diğer değişkenlere göre daha yüksek olduğu
belirlenmiştir. “Çok sinirliyim” ifadesine katılımın gri eleman ile ilişkisinin ise diğer değişkenlere göre daha
düşük olduğu sonucu elde edilmiştir.
Anahtar kelimeler: Gri ilişki analizi, gri eleman, anlık kaygı,
28
S16
Hastane çalışanlarının Maslach Tükenmişlik ölçeğine göre değerlendirilmesi; Çok merkezli bir çalışma
MY. Çelik 1, MM. Dasdağ 1, D. Şahin 2, O. Satıcı 1, Z. Akkuş 1, İ. Yıldız 1
1
Dicle Üniversitesi Tıp Fakültesi Biyoistatistik AD.
2
Erzincan Askeri Hastanesi
Özet
Maslach tükenmişliği; "işi gereği insanlarla yoğun bir ilişki içerisinde olanlarda görülen duygusal tükenme,
duyarsızlaşma ve düşük kişisel başarı sendromu" şeklinde tanımlamıştır. Maslach modeline göre tükenmişliğin,
duygusal tükenme, duyarsızlaşma ve başarı duygusunun azalması olmak üzere üç boyutu bulunmaktadır. Bu üç
boyuta ilişkin tükenmişliği ölçebilmek için 22 maddeden oluşan "Maslach Tükenmişlik Ölçeği" geliştirilmiştir.
Bu çalışmanın amacı, hastane çalışanlarının Maslach tükenmişlik ölçeğine göre tutum ve davranışlarını ortaya
koymak ve belirginleştirmektir. Çalışma çok merkezli olup rastgele örnekleme yöntemi ile Erzincan Üniversitesi
Mengücek Gazi Eğitim ve Araştırma hastanesinden 316 kişi, Erzincan Askeri Hastanesinden 53 kişi, Dicle
Üniversitesi hastanesinden 369 kişi, toplamda 738 kişiye ulaşılmıştır.
Elde edilen verilere ilişkin değişkenlerin nasıl kümelendiğini görmek için hiyerarşik küme analizi yöntemiyle
dendogram elde edildi. Dendogram sonuçlarına göre kümeler; duygusal tükenme, kişisel başarı, eğitim ve
konum, duyarsızlaşma gibi kümeler gözlendi. Dendogramdaki ilginç bir sonuç, kişilerin duygusal tükenme
kümesi ile kişisel başarı, eğitim ve konum kümelerinin birleşerek yeni bir küme oluşturmalarıdır.
Bu durum kişilerin içinde bulundukları konum ve aldıkları eğitim gereği, duygusal olarak tükenmiş olmalarına
rağmen, kişisel başarılarını devam ettirdiklerini göstermektedir. Bu durum ayrıca frekans dağılışlarıyla da
doğrulanmıştır.
29
S17
Çok Sınıflı Destek Vektör Sınıflamasında Hata Düzeltmeli Çıkış Kodları Yaklaşımlarının
Karşılaştırılması: Bir simülasyon çalışması
Özge Akşehirli1, Handan Ankaralı2, Duygu Aydın3, Davut Baltacı4
1
2
3
Arş.Gör., Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD, Düzce
Prof.Dr., Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD., Düzce
Arş. Gör., Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD., Düzce
4
Yrd.Doç.Dr., Düzce Üniversitesi, Tıp Fakültesi, Aile Hekimliği ABD., Düzce
Özet
Amaç: Yapı tanımlama, sınıflama ve regresyon amaçlarıyla kullanılan destek vektör makinaları (DVM) ilk
olarak iki sınıfı ayırt etmek amacıyla geliştirilmiş eğiticili bir makine öğrenmesi yöntemidir. Buna karşın gerçek
dünya problemlerinin birçoğunda ve özellikle yapı tanıma çalışmalarında çok sayıda sınıf veya grubun
birbirinden ayırt edici özelliklerinin belirlenmesi amaçlanır. Tıpta, radyoloji, pataloji gibi branşlarda yapı
tanımlama diğer klinik branşlarda ise tanı koyma çalışmaları bu grup içinde düşünülebilir. Çok sayıda grubu
ayırmak için son yıllarda DVM yöntemleri üzerinde yoğun çalışmalar yapılmakta ve hala bu alana yeni metot
veya yaklaşımlar eklenmektedir. Bu çalışmanın amacı, hem orijinal bir veri seti hem de simüle edilmiş veri
setleri üzerinde, hata düzeltmeli çıkış kodlarını (HDÇK) temel alarak geliştirilen 4 farklı DVM yaklaşımını
karşılaştırmalı olarak incelemektir.
Yöntem: Bu çalışmada, HDÇK kodlarını temel alan 4 farklı yaklaşım (bire karşı hepsi, bire karşı bir, kapsamlı
düzeltme kodları ve randomize düzeltme kodları) ile tip II diyabet hastalarının çeşitli demografik ve klinik
özelliklerinin günlük şeker ölçümünü nasıl etkilediği araştırılmıştır. Ayrıca simülasyon yardımıyla 3 farklı
ortalama vektörüne sahip standart çok değişkenli normal dağılımdan üretilen örneklerin, bu 4 yaklaşım ile kendi
grubuna doğru sınıflama başarıları, model hataları ve analiz süreleri karşılaştırmalı olarak incelenmiştir.
Bulgular: Diyabet hastalarına ait veriler üzerinde yapılan yöntem karşılaştırmaları sonucunda, sınıflama
performansları ve analiz süreleri açısından istatistiksel olarak anlamlı bir fark bulunmamıştır. Ayrıca simülasyon
verileri kullanıldığında ise yine yöntemler arasında önemli bir farka rastlanmamıştır. Bu bulgulara karşın
sezgisel olarak bire karşı bir yönteminin sınıflama performansı, model hatası ve analiz süresinin, nispeten diğer 3
yöntemden daha iyi sonuçlar verdiği gözlenmiştir. Ayrıca örneklem genişliğinin özellik sayısına oranı arttıkça
yöntem performanslarının da arttığı belirlenmiştir.
Sonuç: Çok sınıflı problemlerde HDÇK temeline dayanan yöntemler, başarılı bir şekilde kullanılabilir.
Anahtar Kelimeler: Destek vektör makineleri, Çok sınıflı sınıflama, Hata Çıkış Kodları, Veri madenciliği,
Çekirdek fonksiyonlar
Özge Akşehirli: Düzce Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD. Telefon: 0532 5103722
E-Posta: [email protected]
30
S18
Posterior Power Analysis with R Software: A Simulation Study
Pınar Günel Karadeniz1, Nural Bekiroğlu1
1
Marmara Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, İstanbul
Abstract
Objective: In clinical trials, in experimental studies and in some observational studies; applying power analysis
before conducting the study is absolutely recommended in order to guarantee reliable and valid test results.
However, sometimes, the situation comes into question when the power of the test used in the study is asked by
reviewers of the journal which the manuscript was sent. In such posterior power analysis cases, researchers
generally consult a biostatistician to solve it. The aim of this study is to assess posterior power calculation which
is coded by R software for various scenarios.
Methods: R software codes were generated to calculate the power of unpaired t-test, paired t-test and chi-square
test. These R software codes contained significance levels, sample size, standard deviation, effect size and
noncentrality parameter. Under various scenarios simulations were conducted with 1000 runs and power of the
tests was calculated. The power calculation results obtained from R software codes were compared with the
power calculation results obtained from NCSS, G*Power and PS softwares.
Results: The power calculated by R software codes which are given in this study and the power obtained from
NCSS, G*Power and PS programs were matched. Simulation results obtained from different scenarios with R
software codes were given in related tables.
Conclusion: R is a free software and using the R software codes provides the same power results with the results
obtained by licensed softwares such as NCSS, PASS, Power and Precision, Stat Power, etc. Therefore, we
recommend R software codes given in this study, which is more accessible and useful for researchers especially
who apply posterior power analysis.
Keywords: Posterior power analysis, R software codes, simulation
31
S19
Eşit Örneklemli Randomize Kontrollü Çalışmalarda Kullanılan İki Elemanlı Rasgele Dizinin Karmaşıklık
Kriteri
Ömer Utku Erzengin1, Sıddıka Gamze Erzengin2
1
2
Süleyman Demirel Üniversitesi, İstatistik Bölümü, Isparta
Süleyman Demirel Üniversitesi, Kimya Mühendisliği Bölümü, Isparta
Özet
Giriş: Randomize kontrollü çalışmalarda (RKÇ) genel olarak iki tedavi yöntemine (A ve B) genel olarak eşit
miktarda örneklem atanması istenir (n = ma+mb ve ma = mb ). RKÇ’ da peş peşe gelen A ve B uygulamaları
temel olasılık kuralı C(m,2m)'lik kombinasyon havuzu içinden rastgele olarak m tane örneklemi A tedavisine ve
B tedavisine atamaktır. Peş peşe gelen iki elemanlı A ve B dizilerinin rastgeleliğinin sınanması için paket
yazılımlarda genelde hareket testi, işaret testi, yukarı aşağı hareket testi, Mann-Kendall ve Bartlett rank testi
kullanılmaktadır.
Klinik çalışmalardaki atamaların yapılması çoğu zaman randomize iki elemanlı dizi oluşturulup atama yapıldığı
şeklinde belirtilmektedir. Randomize atamalarda yapılan yanlışlıklar hata sapmasına, gizli sapmaya, seçim
sapmasına (Efron 1971) neden olmaktadır. A ve B tedavi gruplarının peş peşe belli bir miktardan fazla gelmesi
çoğu varsayımı ihlal etmekte ve rastgele olmayan belli bir örüntüye sahip yapılar bütün randomizasyon
kabullerini bozmaktadır. Tedavi yöntemlerinin randomizasyonunu sağlayan rastgele seri kendi içinde birbirine
bağımlıysa sonuçlarda kolineerliğe bağlı sapmalar olacaktır. Paket programlardaki kullanılan testler, kolineerite
yaratacak, doğrusal bir formülden gelen rastgele olmayan örüntülü bir seriyi yakalayamayabilir.
Amaç: RKÇ kullanılan İki elemanlı bir dizi (Tedavi-Kontrol veya Tedavi A- Tedavi B gibi) belli bir formülle
üretilmişse Berlekamp–Massey algoritmasıyla dizinin belli bir örüntüye sahip doğrusal tekrarlayan alt dizilerinin
minimum polinomları bulunabilir. İki elemanlı bir RKÇ dizisi eğer doğrusal olmayan bir formülle üretilmişse
bunun sınanması doğrusal ve maksimum sıra karmaşıklığının bulunmasıyla mümkün olacaktır. Yapılacak
sunumda en kısa dizi içindeki örüntüyü elde edebilecek hafızasız doğrusal olmayan geri beslemeli fonksiyonun
nasıl bulunacağı anlatılacaktır. Ayrıca kombinatorik teorisine bağlı olarak klinik denemelerde peş peşe gelen A
ve B seçimlerinin doğrusal ve maksimum sıra karmaşıklıklarının dağılımı gösterilecektir. Teorik olarak rastgele
bir dizinini dağılımı, beklenen değeri ve varyansı bulunacaktır.
Sonuç: Rastgele m taneli ikili bir dizide doğrusal karmaşıklık yaklaşık Normal(n/2+(9+(-1)n+1)/36+(n/3+2/9)/2n,
86/81) olarak dağıldığı bulunmuştur (Gustafson, 1994). Hazır kullanılan paket yazılımlardan elde edilen ikili
dizilerin (Tedavi A ve Tedavi B gibi) karmaşıklıklarının teorik dağılımdan ne kadar uzaklaştığı gösterilecektir.
Ayrıca sanki rasgele sayı üreteçlerinin katsayılarının seçiminde doğrusal karmaşıklığın önemi belirtilecektir.
Anahtar Kelimeler: Randomize Kontrollü Çalışma, Karmaşıklık, Kolineer, Doğrusallık
32
S20
Dört Gözlü Kontenjans Tablolarında Yates Düzeltmeli Ki-Kare Testinin İncelenmesi: Simülasyon
Çalışması
Selçuk Korkmaz1, Necdet Süt2
1
Trakya Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Edirne
2
Trakya Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Edirne
Özet
Dört gözlü kontenjans tabloları ve bu tablolarla ilişkili istatistiksel testler sağlık alanında sıklıkla
kullanılmaktadır. Bu tablolar için Fisher’in kesin testi, Pearson ki-kare testi ve Yates düzeltmeli ki-kare test
istatistiği değerleri hesaplanabilmektedir. Bu testlerden Yates düzeltmeli ki-kare testinin hangi durumlarda
kullanılacağı günümüzde hala tartışma konusudur. Çalışmamızda, dört gözlü kontenjans tablolarında Yates
düzeltmeli ki-kare testinin etkinliğinin incelenmesi amaçlandı. Çalışmada iki farklı tasarım yöntemiyle Yates
düzeltmeli ki-kare, Pearson ki-kare ve Fisher’in kesin testinin etkinlikleri 72876 adet dört gözlü kontenjans
tablosu simüle edilerek karşılaştırıldı. Tasarım 1’de, hem satır hem de sütun toplamlarının sabit olduğu
hipergeometrik dağılım, Tasarım 2’de, satır veya sütun toplamının sabit olduğu binom dağılımı esas alındı.
Simülasyonlarda dört gözlü kontenjans tablolarında olası tüm oranlar için test istatistikleri hesaplandı. Çalışmada
kişi sayıları 10-100 kişi arasında türetildi. Simülasyonlarda hasta-kontrol dizaynı kurgulanarak i) hasta ve
kontrol sayılarının eşit olduğu 5225 adet kontenjas tablosu türetilerek analiz edildi, ii) daha sonra hasta ve
kontrol sayılarının farklı olduğu 67651 adet tablo türetilerek analiz edildi. Tasatım 1’de, Fisher, Pearson ve
Yates yöntemleri için analizler yapılırken, Tasarım 2’de bunlara ek olarak binom olasılıkları da hesaplandı.
Yöntemlerin etkinliklerini karşılaştırmak için, beklenen değeri 5’ten küçük ve 5’ten büyük olan dört gözlü
kontenjans tabloları ayrı ayrı ele alınarak hata kareler ortalaması (HKO), tip I hata ve tip II hata olasılıkları
hesaplandı. Tasarım 1 sonucuna göre, gruplardaki kişi sayılarının eşit olduğu durumlarda Yates’in, Pearson’a
göre daha küçük HKO değerlerine sahip olduğu, gruplardaki kişi sayılarının eşit olmadığı durumlarda, Yates ile
Pearson’ın birbirine yakın HKO değerleri verdikleri görüldü. Pearson ki-kare testinde daha yüksek tip I hata
yapma olasılığı gözlenirken, Yates düzeltmeli ki-kare testinde daha yüksek tip II hata yapma olasılığı gözlendi.
Tasarım 2 sonucuna göre, en yüksek HKO değerine sahip yöntemin Yates düzeltmeli ki-kare testi olduğu
görüldü. Pearson ki-kare testi, örneklem ölçümünün 10 olduğu durumlar hariç tüm durumlarda, Fisher’in kesin
testinden daha küçük HKO değerlerine sahipti. Tasarım 1’de olduğu gibi, Pearson ki-kare testinde, diğer iki teste
göre daha yüksek tip I hata olasılığı gözlenirken, Yates düzeltmeli ki-kare testinde ve Fisher’in kesin testinde
daha yüksek tip II hata yapma olasılığı gözlendi. Çalışmada hipergeometrik tasarım kullanıldığı takdirde, Yates
düzeltmeli ki-kare testinin kullanılabilir bir test olduğu görülürken, binom dağılımı esas alınarak yapılan
çalışmada, Yates düzeltmeli ki-kare testinin hem yüksek HKO değeri, hem de yüksek tip II hata yapma olasılığı
nedenleri ile kullanışsız olduğu görüldü.
Anahtar Kelimeler: Yates düzeltmeli ki-kare testi; Fisher’in kesin testi; Pearson ki-kare testi; Dört gözlü
kontenjans tabloları.
33
S21
Maddeler Arası Korelasyon Yapısı ve Örneklem Genişliğinin Faktörleşmedeki Rolü: Bir Simülasyon
Çalışması
1
Duygu Aydın , Handan Ankaralı2 , Özge Yılmaz Akşehirli2
1
2
Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik ABD, Ankara
Düzce Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD, Düzce
Özet
Amaç: Faktör analizi, gözlenen değişkenler arasındaki ilişkileri temel alarak az sayıda faktör yardımıyla
maksimum varyansı açıklayan analitik bir yöntemdir. Bu yöntem en sık ölçek geliştirme çalışmalarında
kullanılmaktadır. Bir ölçeğin faktör yapısının değişken olması, ölçeğin yaygın kullanımını olumsuz etkileyebilir.
Bu çalışmada, maddeler arası farklı korelasyon yapılarının ve çeşitli örneklem genişliklerinin faktör yapısı
üzerine etkisinin araştırılması amaçlanmıştır.
Gereç ve Yöntemler: Yedi farklı korelasyon yapısı ve üç farklı örneklem genişliği içeren, toplam 21
kombinasyon oluşturulmuştur. Bu kombinasyonlarda oluşturulan 7 ölçek yapısında 4 faktör ve her faktörde 5
madde yer almaktadır. Gerçek yapısı bilinen bu ölçeklere, doğrulayıcı faktör analizi uygulanarak faktör
yapısındaki değişimler incelenmiştir.
Bulgular: Popülasyonda faktörler arası korelasyon 0 olduğu zaman, faktör yükleri döndürüldüğünde
örneklemdeki faktör yapısının değişmediği gözlenmiştir. Bu sonuç üzerinde korelasyon derecesi ve örneklem
genişliğinin etkisi bulunmamaktadır. Ancak popülasyondaki faktörler arası korelasyon 0’ dan farklı ise,
döndürme işlemi yapıldığında örneklemdeki faktör yapısında değişmeler olmaktadır. Popülasyon korelasyon
matrisinin heterojen yapıda olması durumunda örneklemdeki faktör yapısı örneklem genişliğine bağlı olarak
önemli değişmeler göstermiştir. Sonuç: Yedi farklı korelasyon yapısı ile oluşturulan popülasyonlarda, faktör
analizi sonucunda oluşan faktör yapıları maddeler arası ilişkinin yapısından etkilenmiştir. Ayrıca, hangi faktörde
olduğu bilinen maddelerin bir kısmının, başka bir faktörde olduğu gözlenmiştir. Örneklem genişliği arttıkça
faktör yapısı daha belirgin bir hal almaktadır. Buna ilaveten çevresel faktörlerin de faktör yapısını değiştirdiği
söylenebilir. Çünkü çevresel koşullar, sosyo-demografik özellikler ve birçok kültürel etkenler faktör yapısını
belirleyen korelasyonlar üzerinde etkilidir.
Anahtar Kelimeler: Faktör analizi; Faktör yapısı; Faktör döndürmesi; Ölçek Geliştirme
Duygu Aydın: E-Posta: [email protected]
34
S22
Hibrit Hiyerarşik Kümeleme Yöntemi ve Sağlık Alanında Bir Uygulaması
Gözde Ertürk1, Gökmen Zararsız1, Ahmet Ozturk1, Ferhan Elmalı1
1
Erciyes Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Kayseri, Türkiye
Amaç: Kümeleme analizleri, benzer özelliklere sahip nesneleri gruplayan (kümeleyen) bir yöntemdir ve sağlık
alanında hastalıkların sınıflandırılması, kanser hücrelerinin belirlenmesi, hastalık üzerinde etkili genlerin
gruplanması gibi birçok alanda yaygın olarak kullanılmaktadır. Hiyerarşik kümeleme yöntemi bu yöntemlerden
biri olup, Birleştirici ve Ayırıcı hiyerarşik olmak üzere iki temel kümeleme strateji ile kümeleme yapmaktadır.
Bu iki kümeleme stratejisi her ne kadar yaygın kullanılıyor olsa da, birtakım eksiklikleri bulunmaktadır.
Birleştirici kümeleme yöntemi küçük kümeleri belirlemede iyi performans gösterirken büyük kümelerde orta
düzey performans göstermektedir. Tersine, ayırıcı kümeleme yöntemi büyük kümeleri belirlemede iyi
performans gösterirken, küçük kümelerde iyi sonuçlar vermemektedir. Hibrit hiyerarşik kümeleme yöntemi ortak
kümelemenin yeni bir fikri üzerine kurulur. Birbirine en yakın noktaları ortak küme tanımlayarak Ayırıcı ve
Birleştirici hiyerarşik kümeleme yöntemlerinin güçlü yanlarını birleştiren bu noktaları bozmayan kümeleme
yöntemi oluşturmak amaçlanmıştır.
Yöntem: Araştırma Sorlie et al (2001) Meme kanseri tümör alt sınıflarını tanımlamaya yardımcı olan veriden
alındı. Verideki 85 örneğin her biri için 456 c DNA tanımlayıcı gen değerleri kullanıldı.Hibrit hiyerarşik
kümeleme uygulamasında ortak kümeleme yönteminden yararlanıldı.R 2.14.0 istatistik paket programının (The
R Project for Statistical Computing) hiyerarşik kümeleme paketi
yöntemini uygulamada ayırma yöntemi olarak
kullanıldı.Hibrit hiyerarşik kümeleme
TSVQ ayırma tekniği kullanıldı.Örnekler arası uzaklık
hesaplanması için öklit uzaklığının karesi kullanıldı.
Bulgular: Ortak kümeleme sonucunda Sorlie et al (2001) verisi incelendiğinde.85 örnek için 17 ortak küme
bulundu ve 16 tanesi iki nokta içeriyor. Bu ortak noktalardan {31, 32, 33, 34} ortak kümeleri veri setindeki
sadece normal doku örnekleri ve üç iyi huylu doku örneklerinin ikisi de {35,36} olduğu anlaşıldı ortak
kümelerin kanser genlerini doğru ayırdığı gözlemlendi. Sorlie et al (2001) verisi Hibrit hiyerarşik kümeleme
yöntemi tarafından parçalandığında ortak kümelerin hiç birinin bozulmadığı gözlemlendi. Ayırıcı ve Birleştirici
hiyerarşik kümeler ortak kümelerini ayırırken bozduğu gözlemlendi.
Sonuç: Çalışma bulgularına göre Hibrit hiyerarşik kümeleme yöntemi Ayırıcı ve Birleştirici kümelemelerinin
bozduğu ortak kümeleri ayırmada iyi bir yöntem olduğu anlaşıldı.
Anahtar kelime: Kümeleme, Hiyerarşik kümeleme, Hibrit hiyerarşik kümeleme, Ortak küme
35
S23
Varyans Bileşeni Tahmin Yöntemlerine Yönelik Bir Değerlendirme
İlkay Doğan1, İbrahim Kılıç1, Cengiz Gazeloğlu2, Sinan Saraçlı2
1
2
Afyon Kocatepe Üniversitesi Veteriner Fakültesi Biyoistatistik AD, Afyonkarahisar
Afyon Kocatepe Üniversitesi Fen-Edebiyat Fakültesi İstatistik Bölümü, Afyonkarahisar
Özet
Amaç: Bu araştırmada, varyans bileşenlerinin tahmin edilmesinde literatürde yaygın olarak kullanılan
yöntemlerden; ANOVA, Henderson III, ML, REML, MINQUE gibi önemli yöntemlerin incelenmesi
amaçlanmıştır.
Yöntem: Çalışmada, ANOVA, Henderson III, ML, REML, MINQUE yöntemlerine yönelik değerlendirme
yapabilmek için hayvancılık ile ilgili dengeli ve dengeli olmayan veri setleri kullanılmıştır. Bu çerçevede,
etkileşimli ve etkileşimsiz modeller ile söz konusu yöntemler ile elde edilen tahminler karşılaştırılmaya
çalışılmıştır.
Bulgular ve Sonuç: Dengeli verilerde, gerek etkileşimli gerekse etkileşimsiz modelde varyans bileşenleri
tahminleri dört yöntemde (ANOVA, Henderson III, REML, MINQUE) birbirine eşit bulunmuş olup ML
yönteminde ise hata varyansı oranı diğer yöntemlerden daha yüksek bulunmuştur. Dengesiz veriler için ise en
düşük hata varyansı tahmini REML, MINQUE yöntemleri ile elde edilmiştir. Araştırma sonuçlarının, istatistik
literatürüne katkı sunmasının yanı sıra bu yöntemlere ihtiyaç duyan ve farklı alanlardaki araştırmacılara da katkı
sağlayacağı kanaatine varılmıştır.
Anahtar Kelimeler: Varyans bileşenleri tahmini, ANOVA, Henderson yöntemleri, ML, REML, MINQUE
36
S24
Rakip Risk İçeren Sağkalım Fonksiyonlarının Karşılaştırılmasında Log-Rank Ve Wılcoxon Testlerinin
Etkinliği: Bir Simülasyon Çalışması
Melike Geduk1, Yaşar Sertdemir1, H. Refik Burgut1
1
Çukurova Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana
Özet
Amaç: Yaşam tablosu veya Kaplan-Meier yöntemleriyle elde edilen farklı grupların rakip risk içeren sağkalım
süreleri, sağkalım analizine özgü testlerle karşılaştırılabilir. Sansürlü oluş biçimi, rakip risklerin bağımlı ya da
bağımsız olma durumları, hazard oranlarının özellikleri, ölüm oranları gibi farklı koşullara göre bu testlerden
hangisinin seçileceğine karar verilmesi gerekir.
Yöntem: Bu karşılaştırmalarda parametrik olmayan testlerden ikisi, Mantel-Haenszel olarak da bilinen log-rank
ve Wilcoxon testleri kullanılmaktadır. Hangi testin tercih edileceği şartlar, simüle edilmiş ve gerçek verilerle
araştırılacaktır.
Bulgu ve sonuç: Araştırmacılara, bu çalışmanın sonuçları hangi testin seçilmesi konusunda yol gösterici
olacaktır.
Anahtar Kelimeler: Rakip Riskler, Log-Rank Ve Wilcoxon Test, Simülasyon
Efficiency Of Log-Rank And Wilcoxon Tests Used To Compare Survival Disrtibution Under Competing
Risk: A Simulation Study
Abstract
Aim: The survival distribution of different groups under competing risk that obtained from life-table or KaplanMeier methods can be compared by using specific tests for survival time. According to different situations such
as censoring status, dependency of competing risks, state of hazard rates, death rates the choice among these
tests must be determined.
Method: Among nonparametric tests, both log-rank, also known as Mantel-Haenszel test and Wilcoxon test are
being used for comparison. Conditions under which test should be preferred will be investigated using real and
simulated data.
Results: Based on study findings, recommendation to practitioner will be made.
Key Words: Competing Risks, Log-Rank and Wilcoxon Test, Simulation
37
S25
İki Değişkenli Weibull Dağılımları ile Yaşam Verilerinin Modellenmesi
Ayça Hatice Türkan1, Nazif Çalış2, Hamza Erol3
1
Afyon Kocatepe Üniversitesi Fen Edebiyat Fakültesi, İstatistik Anabilim Dalı, Afyonkarahisar
2
3
Adıyaman Üniversitesi İktisadi ve İdari Bilimler Fakültesi, İşletme Anabilim Dalı, Adıyaman
Abdullah Gül Üniversitesi Bilgisayar Bilimleri Fakültesi, Yazılım Mühendisliği Bölümü, Kayseri
Özet
Amaç: İnsan sağlığını yakından ilgilendiren yaşam sürelerinin modellenmesi istatistiksel olarak önemli bir
konudur. Yaşam sürelerinin modellenmesinde en yaygın olarak kullanılan dağılımlar Exponential, Weibull ve
Gamma dağılımlarıdır. Bu dağılımlar verilerin tek değişkenli olması durumunda uygulanabilir dağılımlardır.
Bununla birlikte yaşamı ilgilendiren verilerin tek bir değişkenle açıklanması yetersiz ve yanlış sonuçlara yol
açabilir. İki veya daha fazla değişken içeren yaşam verisi olması durumunda, veri yapısına uygun dağılımlar
yaşam sürelerinin modellenmesinde kullanılabilir.
Yöntem: Çok boyutlu yaşam sürelerine ait verilerin modellenmesinde kullanılabilecek dağılımlar sınırlıdır.
Özellikle Kundu-Dey (2009) ve Kundu-Gupta (2010) tarafından önerilen iki değişkenli Marshal-Olkin Bivariate
Weibull ve Block-Basu Bivariate Weibul dağılımları iki değişkene bağlı yaşam verilerinin modellenmesinde
kullanılabilir. Bu çalışmada, bu dağılımlar gerçek yaşam süresi verilerine uygulanacak ve sonuçlar çok
değişkenli normal dağılım modelleri ile karşılaştırılacaktır.
Bulgular: Diabet rahatsızlığı olan hastalara ait sağ ve sol gözlerinde zamanla oluşan görme kaybı verileri ve bir
yaşından küçük 24 çocuğa ait dominant ulna ve ulna kemik mineral yoğunluğu verileri sırasıyla Marshal-Olkin
Bivariate Weibul ve Block-Basu Bivariate Weibul dağılımları ile modellenmiştir. Oluşturulan dağılım
modellerine ait olasılık yoğunluk fonksiyonları elde edilmiş ve LogLikelihood değerleri hesaplanmıştır. Bu
veriler için aynı zamanda çok değişkenli dağılımlar içerisinde en yaygın kullanılan normal dağılım modeli
oluşturulmuş ve normal dağılıma ait LogLikelihood değerleri hesaplanmıştır.
Sonuç: İki değişkenli yaşam verileri için değişkenlerden birinin diğerine bağlı olması durumunda, örneğin diabet
hastalarının bir gözünde oluşan diabete bağlı görme kaybının diğer göz üzerinde etkisinin olması gibi, dağılım
yapısı gereği Marshal-Olkin Bivariate Weibul ve Block-Basu Bivariate Weibul dağılımları veri yapısı için daha
uygun dağılımlardır. İncelenen veriler için oluşturulan modeller arasında çok değişkenli normal dağılım
modellerine ait LogLikelihood değerleri daha küçük bulunmasına rağmen çok değişkenli normal dağılım
modellerine ait ortalama ve kovaryans parametre değerleri birbirine bağlı yaşam sürelerine ait değişkenler
arasındaki ilişkiyi modellemede yetersiz kalmaktadır.
Anahtar Kelimeler: Block-Basu Bivariate Weibul, Marshal-Olkin Bivariate Weibul, Yaşam Verisi
38
Kaynaklar
[1] D. Kundu and A.K. Dey, Estimating The Parameters Of The Marshall-Olkin Bivariate Weibull Distribution
By EM Algorithm, Computational Statistics and Data Analysis 53, (2009) 956-965.
[2] D. Kundu and R.D. Gupta, A class of absolutely continuous bivariate distributions, Statistical Methodology 7
(2010) 464-477.
Ayça Hatice Türkan: E-Posta: [email protected]
39
S26
Hastalıkların Yersel Kümelenmelerinin Belirlenmesinde Kullanılan Satscan V9.1 ve Flexscan V3.1
Programlarının Rasgele ve Koşullu Türetilmiş Verilerde Karşılaştırılması
Özge Bolluk1, Canan Baydemir2, Kazım Özdamar3
1
2
Arş. Gör., Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Ad, Eskişehir
Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Ad, Eskişehir
3
Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Ad, Eskişehir
Özet
Giriş: Bu araştırmada A2 alanda gözlenen sağlık olayının gözlenme sayısının, rasgele ya da koşullu olarak
gözlenme biçiminin ve dağılım biçiminin Tarama İstatistiği üzerine etkileri SaTScan V9.1 ve FleXScan V3.1
paket programlarında araştırılarak, farklı paket programlarda çözümlerinin sonuçlarındaki farklılıkları
belirlenmiştir.
Yöntem: Tarama istatistikleri yeryüzündeki coğrafi objelere ait yersel, zamansal ve yersel-zamansal verilerinin
toplanması, saklanması, analiz edilmesi ve analizler sonucunda kullanıcıya mevcut sorunlarla ilgili alternatif
çözüm yolları gösteren analiz yöntemidir. Hastalıkların incelenmesinde, risk altındaki toplumun belirlenmesi,
coğrafik bölgedeki yerleşim yerlerinin yüzölçümlerinin farklılıkları ve hastalıkların incelenmesinde
kullanılmaktadır.
Olgu sayıları, nüfus bilgileri ve Yersel Koordinat bilgileri normal ve uniform dağılıma uygun olarak türetilerek
SatScan V9.1 ve FleXScan v3.1 Paket Programları’nda analiz edilerek sonuçları karşılaştırılmıştır.
Bulgular: Rasgele ve koşullu veri setlerinin birim sayısı, teorik dağılım biçimi, farklı paket programlarda
çözümlerinin sonuçları arasındaki farklılıkları incelenerek, Normal ve Uniform dağılıma uygun olarak türetilen
verilerin her iki programdaki analiz sonuçlarında, koşullu türetilen birim sayısı arttıkça önemli kümelenmelerin
olduğu belirlenmiştir. Paket programların çıktıları incelendiğinde, SaTScan paket programında salgının olacağı
öngörülen koordinat değerleri, kümelenen birim sayısı, kümelenmesi beklenen birim sayısı, gözlenen ve
beklenen birim sayılarının oranı, benzerlik oranı ve önemliliği verilirken, FleXScan Paket Programında
kümelenen birim sayısı, kümelenmesi beklenen birim sayısı, benzerlik oranı ve önemliliği verilmektedir.
SaTScan paket programı daha ayrıntılı sonuçlar vermektedir. İncelenen her iki dağılımda da sonuçların küçük
farklılıklarla benzer olduğu belirlenmiştir.
Sonuç: Hastalıkların coğrafik kümelenmelerinde en sık kullanılan SaTScan paket programı ve FleXScan Paket
Programları kullanılarak yapılan çalışmalarda sonuçların benzer olmasına rağmen, SaTScan paket programının
daha ayrıntılı bilgi vermesi nedeniyle tercih edilebilir olduğu belirlenmiştir.
Anahtar Kelimeler: Tarama İstatistikleri, Yersel Kümeleme, SaTScan Paket Programı ve FleXScan Paket
Programı
40
S27
Hastanelerin Etkinliklerinin Veri Zarflama Analizi İle Belirlenmesi: Afyonkarahisar Örneği
Gizem Gülsevin1, Ayça Hatice Türkan1
1
Afyon Kocatepe Üniversitesi Fen Edebiyat Fakültesi, İstatistik Anabilim Dalı, Afyonkarahisar
Özet
Amaç: Bu çalışmanın amacı, hastane faaliyetlerinde performansın ölçülmesi, değerlendirilmesi ve hastanelerin
etkinlik düzeylerinin Veri Zarflama Analizi (VZA) yöntemi ile belirlenmesidir. Charnes, Cooper ve Rhodes
tarafından geliştirilen VZA; doğrusal programlama tabanlı bir teknik olup aynı çoklu girdi ve çıktılar içeren ve
girdi-çıktıların farklı ölçü birimlerine sahip olduğu, homojen yapıdaki işletmelerin performans ve etkinlik
ölçümünde kullanılan bir yöntemdir (YOLUK 2010).
Yöntem: Etkinlik ölçüm yöntemleri oran analizi, parametrik yöntemler ve parametrik olmayan yöntemler olmak
üzere üç sınıfa ayrılır (YOLALAN 1993; Aktaran: BEKTAŞ 2007). VZA, parametrik olmayan etkinlik ölçüm
yöntemi olup diğer etkinlik ölçüm yöntemlerine göre daha gerçekçi ve doğru sonuçlar ortaya çıkarması açısından
çalışmada VZA tekniği kullanılmıştır.
Bu çalışma, Afyonkarahisar İl Sağlık Müdürlüğünden sağlanan Afyonkarahisar’daki Sağlık Bakanlığına bağlı
hastanelerin 2011 yılına ait verilerini inceleyen bir uygulama içermektedir. Sağlık Bakanlığına bağlı
Afyonkarahisar Göğüs Hastalıkları Hastanesi, Afyonkarahisar Zübeyde Hanım Kadın Doğum ve Çocuk
Hastalıkları Hastanesi ve özel hastaneler araştırma kapsamına alınmamıştır. Bunun nedeni VZA modeli
uygulamasında; benzer çıktıları, benzer girdileri kullanarak üreten yani homojen yapıda Karar Verme Birimi
olması gerekliliğidir (BAL 2010).
Hastane yönetiminin girdiler üzerinde kontrol gücü vardır, ancak çıktılar üzerinde kontrol gücü oldukça zordur.
Bu nedenle bu çalışmada girdi yönlü VZA modelleri kullanılmıştır. Bu modelin amacı belirli miktardaki çıktı
düzeyine ulaşabilmek için gerekli olan optimum girdi miktarını tespit etmektir (YOLUK 2010).
VZA modellerini çözmek için, doğrusal programlama modellerinin çözümünde kullanılan programlardan
herhangi biri kullanılabileceği gibi son yıllarda piyasaya sürülen ve windows altında çalışabilen özel VZA
programlarından (WinQSB, LINDO, EMS, Warwick windows DEA, BYU-DEA, Pioneer, Frontier analyst,
SAS-DEA) herhangi biri de kullanılabilir (AYDEMİR 2002). Bu bağlamda uygulamada WinQSB ve EMS
programlarından yararlanarak veriler analiz edilmiştir.
Bulgular ve Sonuç: Bu çalışmada yapılan analiz sonrası elde edilen sonuçlara göre etkin olan hastaneler ile
etkin olmayan hastaneler karşılaştırılarak değerlendirme yapılmıştır. Etkin olmadığı belirlenen hastanelerin,
kendisine referans olan hastanelere göre, girdi miktarlarını ne düzeyde azaltmasını ya da çıktı miktarlarını ne
düzeyde arttırması gerektiği gösterilmeye çalışılmıştır.
Anahtar Kelimeler: Veri Zarflama Analizi, Hastane, Etkinlik
41
Kaynaklar
Aydemir, Z. C. (2002), Bölgesel Rekabet Edebilirlik Kapsamında İllerin Kaynak Kullanım Görece
Verimlilikleri: Veri Zarflama Analizi Uygulaması, Uzmanlık Tezi, Devlet Planlama Teşkilatı, Ankara.
Bal V. (2010), Bilgi Sistemlerinin Sağlık İşletmeleri Performansına Etkilerinin Veri Zarflama Analizi İle
Ölçümü: Türkiye’ deki Devlet Hastanelerinde Bir Araştırma, Doktora Tezi, Süleyman Demirel Üniversitesi,
İşletme Anabilim Dalı, Isparta.
Bektaş B. (2007), Türkiye’de Faaliyet Gösteren Bankaların Farklı Yöntemlerle Sınıflandırılması ve
Etkinliklerinin Belirlenmesi Üzerine Bir Araştırma, Yüksek Lisans Tezi, Gazi Üniversitesi, Fen Bilimleri
Enstitüsü, İstatistik Anabilim Dalı, Ankara.
Yoluk M. (2010), Hastane Performansının Veri Zarflama Analizi (VZA) Yöntemi İle Değerlendirilmesi, Yüksek
Lisans Tezi, Atılım Üniversitesi, Sosyal Bilimler Enstitüsü, Sağlık Kurumları İşletmeciliği Anabilim Dalı,
Ankara.
42
S28
Yaşam Kalitesinin Yapısal Eşitlik Modeli ile Analizi: Afyon Kocatepe Üniversitesi Akademisyenleri
Üzerine Bir Uygulama
Birol Topçu , Sinan Saraçlı2, Cengiz Gazeloğlu2
1
1
Namık Kemal Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Tekirdağ
2
Afyon Kocatepe Üniversitesi Fen-Edebiyat Fakültesi İstatistik Anabilim Dalı, Afyon
Özet
Amaç: Bu çalışmada dünya sağlık örgütünün bireylerin yaşam kalitesini ölçmek için kullandığı yaşam kalitesi
ölçeği ile akademisyenlerin yaşam kalitesi üzerinde etkili olan etmenler arasındaki ilişkilerin yapısal eşitlik
modellemesi ile analizi amaçlanmıştır. Dünya sağlık örgütüne göre bireylerin yaşam kalitesi üzerinde, bedensel,
ruhsal, çevresel ve sosyal alanlardaki düşünceleri etkilidir. Yapılan bu çalışma ile bireylerin bu düşüncelerinin
etkileri araştırılmış ve modellenmeye çalışılmıştır.
Yöntem: Çalışmanın çözümleme safhasında Yapısal Eşitlik Modellemesinden (YEM) yararlanılmıştır. Yapısal
eşitlik modellerinde özelleştirilen bağımlı ve bağımsız ölçüm modelleri, bağımlı ve bağımsız gözlenen değişken
setlerinin her birine ait faktör yapısını ortaya koymaktadır. Bir diğer ifadeyle her bir ölçüm modeli bir onaylayıcı
faktör analizidir. Bu nedenle ölçüm modellerinde kurulan faktör yapısının doğru olması, bağımlı ve bağımsız
faktörler arsındaki ilişkileri gösteren yapısal model için önem taşımaktadır.
Bulgular Araştırma bulguları kısaca özetlenecek olursa; Ruhsal alan değişkeninde meydana gelecek bir birimlik
artış çevresel alandaki memnuniyeti 0,82’ lik bir artışla etkilemektedir veya Çevresel alan değişkeninde meydana
gelecek bir birimlik artış ruhsal alandaki memnuniyeti 0,82’ lik bir artışla etkilemektedir. Bedensel alan
değişkeninde meydana gelecek bir birimlik artış çevresel alandaki memnuniyeti 0,91’ lik bir azalışla
etkilemektedir veya Çevresel alan değişkenindeki meydana gelecek bir birimlik artış bedensel alandaki
memnuniyeti 0,91’ lik bir azalışla etkilemektedir.
Sonuç Dünya Sağlık Örgütü Yaşam Kalitesi Ölçeği kullanılarak yapılan çalışmada analizler LISREL paket
programı yardımıyla yapılmış ve yorumlanmıştır. Analiz sonuçlarına göre bireyin çevresel alandaki
memnuniyeti ile ruhsal alandaki memnuniyeti arasındaki ilişki katsayısı pozitif yönlü ve en yüksek çıkmıştır,
ayrıca çevresel alandaki memnuniyetin ruhsal alandaki memnuniyeti arttırdığını söylemek de mümkündür.
Anahtar Sözcükler: Yaşam Kalitesi Ölçeği, Yapısal Eşitlik Modellemesi, Whoqol-Bref Ölçeği.
Kaynakça
Avcı K., ve Pala K., (2004), “Uludağ Üniversitesi Tıp Fakültesinde Çalışan Araştırma Görevlisi ve Uzman
Doktorların Yaşam Kalitesinin Değerlendirilmesi”, Uludağ Üniversitesi Tıp Fakültesi Dergisi, 30 (2) 81-85.
43
Boysan M., (2006), Çok Örneklemli Yapısal Eşitlik Modelleri Yüzüncü Yıl Üniversitesi Fen Bilimleri Enstitüsü,
Yüksek Lisans Tezi, Van.
Eser E, Fidaner H, Fidaner C, Eser SY, Elbi H, Göker E., WHOQOL-100 ve WHOQOL-BREEF’in psikometrik
özellikleri, 3P Dergisi 1999; 23-40 (Ek 2).
Jöreskog, K. ve Sörbom, D., (2001). “LISREL 8: User’s Reference Guide” Scientific Software International Inc.,
Chicago.
Schermelleh-Engel, K. ve Moosbrugger, H., (2003). Evaluating The Fit of Structural Equation Models: Tests of
Significance and Descriptive Goodness-of-Fit Measures. Methods of Psychological Research Online, Vol:8
No:2, 23-74.
Yılmaz V., (2004), “Consumer Behaviour of Shopping Center Choice”, Social Behavior and Personality, 32 (8),
783-790.
Cengiz Gazeloğlu: E-Posta: [email protected]
44
S29
İzlem Süresi İçerisinde Belirteçlerin Performanslarını Değerlendirmede Zamana Bağlı ROC Eğrisi
Eda Karaismailoğlu1, Umut Arslan1, A. Ergun Karaağaoğlu1
1
Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Giriş: Tıpta; belirteç ya da testler, tanı ve tedaviye yardımcı olmanın yanı sıra, tedavi sonrası hastaların
izleminde de sıklıkla kullanılmaktadır. Belirteçlerin performanslarının değerlendirilmesinde çeşitli yöntemler
geliştirilmiştir. Bunların arasında en yaygın kullanılan yöntem, ROC (receiver operating characteristic)
analizidir. Klasik ROC eğrisinde, bireyin hastalık durumunun zamanla değişmediği varsayılmaktadır. Ancak,
zaman içerisinde kişinin hastalık durumunda değişiklik olabilir. Yani, takip zamanı içerisinde bazı hastalarda
olgu gerçekleşebilir. İzlem süresi boyunca olgu gerçekleşmeyen birey, sansürlü gözlem olarak tanımlanır. Eğer,
sansürlü veriler varsa belirtecin performansı zamana bağlı ROC analizi ile değerlendirilmelidir. Zamana bağlı
ROC eğrisi kullanılarak belirtecin [0,t] zaman aralığında, olgu gerçekleşen ve gerçekleşmeyen bireyleri
ayırmadaki performansı değerlendirilebilir. Bu çalışmanın amacı, sansürlü gözlem ve olgu sıklıkları
farklılaştığında, bununla birlikte belirteç değerleri üzerinde de değişiklikler yapıldığında, farklı senaryolar için
elde edilen zamana bağlı ROC eğrilerinin nasıl değiştiğini incelemektir.
Gereç ve Yöntem: Çalışmada sözü edilen farklı senaryolar, Mayo kliniğinde primer biliyer siroz (PBS) tanısı
almış, 312 hastadan elde edilen ve internet erişimine açık olan veriler üzerinde uygulanmıştır. Bu hastaların
başlangıç albumin, log(protrombin zamanı), ödem varlığı ve yaş değişkenleri kullanılarak, cox modeli ile birinci
tanı belirteci (Mayoskor4), bu değişkenlere log(bilirubin) eklenerek yine cox modeli ile ikinci tanı belirteci
(Mayoskor5) elde edilmiştir. Hastaların on yıllık takip süreleri sonunda, bu belirteçlerin zamana bağlı ROC
eğrileri öncelikle orijinal veriden elde edilmiştir. İlk senaryoda, belirteçler üzerinde hiçbir değişiklik yapılmadan
sansürlü gözlem sıklıkları azaltılarak, ikinci senaryoda yine belirteçler üzerinde hiçbir değişiklik yapılmadan
olgu sıklıkları azaltılarak, üçüncü senaryoda ise olgu gerçekleşen ve gerçekleşmeyen bireylerin belirteç değerleri
farklılaştırılarak zamana bağlı ROC eğrileri elde edilmiştir. Son olarak; hem sansürlü, hem olgu sıklıklarındaki
değişimle birlikte belirteç değerleri farklılaştırılmış ve zamana bağlı ROC eğrileri elde edilmiştir. Buna göre,
sansürlü gözlem ve olgu sıklıkları değiştiğinde ve olgu gerçekleşen ile gerçekleşmeyen bireylerde belirteç
değerleri farklılaştığında elde edilen zamana bağlı ROC eğrileri karşılaştırılmıştır.
Bulgular: İzlem süresi içerisinde olgu gerçekleşen ve gerçekleşmeyen bireylerin belirteç değerleri birbirinden
ayrıştıkça, belirteç, zaman içerisinde daha iyi performans göstermektedir. Olgu sayısı azaldıkça belirteçlerin
zamana bağlı ROC eğrilerinde ani düşüşler ya da yükselişler görülebilmektedir. Sansürlü veri sayısının
azalmasıyla belirteçlerin ROC eğrilerinin zaman içerisinde gösterdiği seyir değişmemekte, fakat eğri altında
kalan alanlar bir miktar düşmektedir.
Sonuç:
Olgu gerçekleşen ve gerçekleşmeyen bireylerin oranı değiştiğinde, belirtecin zamana bağlı ROC eğrisi altında
kalan alanlar da farklılaşmaktadır ve bu değişim, belirtecin zaman içerisindeki tanı performansını etkilemektedir.
45
Ayrıca, olgu gerçekleşen ve olgu gerçekleşmeyen bireylerin ortalama belirteç değerleri birbirinden ayrıştıkça
belirtecin tanı performansı artmaktadır.
Anahtar Kelimeler: Zamana Bağlı ROC Eğrisi, Sağkalım Tahmini, Sansürlü Veri
Eda Karaismailoğlu: e-posta: [email protected]
46
S30
Veri Madenciliği Sınıflama Yöntemlerinin Başarılarının; Örneklem Büyüklüğü, Bağımlı Değişken
Prevelansı ve Bağımsız Değişkenler Arası İlişki Miktarına Göre Karşılaştırılması
M. Özgür Dolgun1, N. Anıl Dolgun1, Osman Saraçbaşı1
1
Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Amaç: Karar Ağaçları, Bayesian Ağları, Karar Destek Makinaları (Support Vector Machines-SVM) gibi
sınıflama yöntemleri literatürde ve uygulamalarda en çok kullanılan istatistiksel ve veri madenciliği kökenli
sınıflama yöntemleri arasında yer almaktadır. Bu yöntemler kullanılırken bağımsız değişkenlerin ölçüm seviyesi
(sürekli, kesikli vb.), bağımsız değişkenlerin dağılımı (simetrik, çarpık dağılım, vb.), bağımsız değişkenler
arasındaki ilişkiler (düşük, orta veya yüksek ilişki), bağımlı değişkenin yapısı gibi başlıca önemli unsurların
model başarısına olan etkileri göz ardı edilmektedir.
Literatürde sınıflama yapmak için sıklıkla kullanılan yöntemler, doğrusal ayırma analizi (linear discriminant) ve
lojistik regresyon analizidir. Bazı varsayım bozulumlarından dolayı; Karar Ağaçları, SVM, Bayesian Ağlar, k-En
Yakın Komşular, Yapay Sinir Ağları, Apriori Algoritması, Genetik Algortimalar, Fuzzy Set Yaklaşımı gibi veri
madenciliği yöntemlerinden yararlanılmaktadır [1, 2, 3, 4, 5].
Bağımsız değişkenler arasında yüksek korelasyon (veya düşük korelasyon) olduğu durumlarda, bağımsız
değişkenlerin simetrik veya çarpık (vb. dağılımlar) dağılması durumlarında sınıflama yöntemlerinin
performansının nasıl etkilendiğine dair çalışmalar neredeyse hiç incelenmemiş bir konudur. İncelenen
çalışmalarda ise model performansların değerlendirmesi genelde tek bir karşılaştırma kriterine göre yapılmış ve
sonuçlar genellenmemiştir.
Yöntem: Çalışmada, örneklem büyüklüğünün, bağımlı ve bağımsız değişkenlerin farklı yapılarda olduğu
durumlarda, Karar Ağaçları, Bayesian Ağlar ve SVM yöntemlerinin model başarılarının karşılaştırılması için
Monte Carlo benzetim çalışmasından yararlanılmıştır.
Kullanılacak senaryolara ilişkin;
i.
Bağımlı değişken prevelansı (p = 0,10; p = 0,50 ve p = 0,75) üç farklı,
ii.
Bağımsız değişken sayısı (5 ve 25) iki farklı,
iii.
Bağımsız değişkenler arasındaki ilişki miktarı (r = 0,25 ve r = 0,75) iki farklı ve
iv.
Örneklem büyüklüğü (n = 100 ve n = 1000) iki farklı
senaryo olmak üzere toplam 24 senaryo bu çalışmada ele alınmıştır.
Her bir senaryo için üretilen veri setlerine aşağıda verilen sınıflama yöntemleri uygulanmış ve yöntemlerin
başarıları birbirleri ile karşılaştırılmıştır.
47
Kullanılan yöntemler;
1.
2.
3.
Karar Ağaçları
a.
Chi-squared Automatic Interaction Detection (CHAID)
b.
Classification and Regression Tree (C&RT)
c.
C5.0
Bayesian Ağlar
a.
Tree Augmented Naïve Bayes (TAN)
b.
Markov Blanket Ağları
Karar Destek Makinaları (Support Vector Machines-SVM)’dır.
Bulgular: Yöntem bölümünde söz edilen 24 senaryo 1000 kere tekrar edilerek veriler türetilmiştir. Elde edilen
senaryolara ilişkin veriler yine yöntem bölümünde bahsedilen 6 yöntem için denenmiş ve hangi senaryo altında
hangi yöntemin daha iyi sonuç verdiği genel doğruluk oranı, duyarlılık, seçicilik vb. kriterlerle
değerlendirilmiştir.
Anahtar Kelimeler: Sınıflama Yöntemleri, Model Karşılaştırma, Benzetim Çalışması
Kaynaklar
Bichler M. and Kiss C. (2004), Comparing Classification Methods for Campaign Management: A Comparison
of Logistic Regression, k-Nearest Neighbor, and Decision Tree Induction for Campaign Management, In:
Proceedings of the Tenth Americas Conference on Information Systems (AMCIS), New York.
Han J. and Kamber M. (2006), Data Mining: Concepts and Techniques, The Morgan Kaufmann, Second
Edition.
Othman M.F. and Yau T.M.S. (2007), Comparison of different Classification Techniques Using WEKA for
Breast Cancer, 3rd Kuala Lumpur International Conference on Biomedical Engineering IFMBE Proceedings,
Volume 15, Part 13, 520-523.
C. Romero S., Ventura C. and Hervás P. Gonzales (2008), Data mining algorithms to classify students,
International Conference on Educational Data Mining (EDM), Montreal.
Michie D., Spiegelhalter D.J., Taylor, C.C. and Campbell J. (1994), Machine Learning, Neural and Statistical
Classification, Ellis Horwood.
M. Özgür Dolgun: E-Posta: [email protected]
48
S31
Zaman Serilerinin Modellenmesi ve Geleceğe Yönelik Kestirimlerinin Değerlendirilmesi: 1928-2010
Hekim Başına Düşen Kişi Sayısı Örneği
Mustafa Agah Tekindal1, Yasemin Genç2
Uzman, Biyoistatistik Anabilim Dalı, Tıp Fakültesi, Başkent Üniversitesi, Ankara
2
Biyoistatistik Anabilim Dalı, Tıp Fakültesi, Ankara Üniversitesi, Ankara
Özet
Amaç: Zaman serisi olaylarını tahminlemede yararlanılan otoregresif tamamlanmış hareketli ortalama süreci
(Auto Regressive Integrated Moving Average, ARIMA) yöntemi, Box ve Jenkins (Box ve Jenkins , 1976)
tarafından geliştirilmiştir. ARIMA modelleme yaklaşımı, değişkenler arasında doğrusallık olması varsayımıyla
sınırlıdır. Bunun yanı sıra araştırmacılar, doğrusallık varsayımını sağlamayan zaman serisi olaylarının
tahminlenmesi için alternatif modelleme bakış açıları geliştirilmiştir. Bu çalışmada; 1928-2010 Hekim başına
düşen kişi sayısı verilerinin farklı yöntemlerle (ARIMA, Hareketli Ortalamalar ve Üssel Düzgünleştirmeler)
modellenerek geleceğe yönelik kestirimleri karşılaştırmalı olarak değerlendirilecektir.
Yöntem: ARIMA ya da Box-Jenkins modelleri d dereceden farkı alınmış serilere uygulanan AR ve MA
modellerinin birer kombinasyonudur. Box-Jenkins yönteminin özü, mevcut verilerin yapısına bağlı olarak, çeşitli
model seçenekleri arasından en elverişli fakat sınırlı sayıda parametre içeren bir ARIMA modelinin seçilmesidir.
Bu modellerin bütün olarak gösterimi ARIMA (p, d, q) şeklindedir. Ayrıca uygulamada hareketli ortalamalar ve
üstel düzgünleştirmeye dayanan kestirim yöntemleri de kullanılmıştır.
Bulgular: 1928-2010 Hekim başına düşen kişi sayısı verilerinin ARIMA, Hareketli Ortalamalar ve Üssel
Düzgünleştirmeler yöntemleri ile modellendikten sonra geleceğe yönelik (2020 yılına kadar) model
performansları değerlendirilmiştir. ARIMA (0,1,0) modeli hem (Mutlak Kestirim Hata Ortalaması Yüzdesi;
Mean Absolute Percentage Error (MAPE)) değeri hem de tahmin tutarlığı açısından en uygun model olarak
belirlenmiştir.
Sonuç ve Öneriler: Zaman Serilerinin Modellenmesi ve Geleceğe Yönelik Kestirimlerinin Değerlendirilmesi
tek bir modele bağımlı kalınmamalıdır. İyi ve kötü birçok senaryo belirlenmelidir. Belirlenen senaryolar
içerisinden tahmin tutarlılığı için önerilen (Kestirim Hata Ortalaması; Mean Forecast Error (MFE or Bias)) ve
(Mutlak Kestirim Hata Ortalaması Yüzdesi; Mean Absolute Percentage Error (MAPE)) değerleri yada bilgi
kriterleri (AIC, BIC) baz alınarak en iyi model seçilmeli ve geleceğe yönelik kestirimleri belirlenmelidir.
Anahtar Kelimeler: Zaman Serileri, Tahmin tutarlılığı, ARIMA Modelleri, Üstel Düzgünleştirme Yöntemleri,
Kestirim, Trend
Kaynaklar
Box, G. E. P., G. M. Jenkins, and G. C. Reinsel. 1994. Time series analysis: Forecasting and control, 3rd
ed. Englewood Cliffs, N.J.: Prentice Hall.
Brockwell, P. J., and R. A. Davis. 1991. Time Series: Theory and Methods, 2 ed. : Springer-Verlag.
49
Gardner, E. S. 1985. Exponential smoothing: The state of the art. Journal of Forecasting, 4, 1-28.
Harvey, A. C. 1989. Forecasting, structural time series models and the Kalman filter. Cambridge:
Cambridge University Press.
Makridakis, S. G., S. C. Wheelwright, and R. J. Hyndman. 1997. Forecasting: Methods and applications,
3rd ed. ed. New York: John Wiley and Sons.
Melard, G. 1984. A fast algorithm for the exact likelihood of autoregressive-moving average models.
Applied Statistics, 33:1, 104-119.
Pena, D., G. C. Tiao, and R. S. Tsay, eds. 2001. A course in time series analysis. New York: John Wiley and
Sons.
GEP Box, JENKİNS G., (1976), Time Series Analysis, Forecasting and Control, San Francisco: HoldenDay
KASAP, R., (1998) Finansal Vektörel Zaman Dizilerinde Özdeğer-Özvektöranaliziyle Eşzamanlı Ve
Gecikmeli Doğrusal İlişkilerin Tesbiti, Dokuz Eylül Üniversitesi, İİBF Dergisi , 13(2),163-171
KASAP, R., (1998) , İstanbul Menkul KıymetlerBorsası'nınincelenmesi: İstatistikselbir yaklaşım- An
analysis of the Istanbul Stock Exchange (ISE) national-100 index: a statistical approach, İMKB Dergisi ISE Review , 6, 27-33
LUND, R., and BASAWA, I.V., (1998), Recursive Prediction and Likelihood Estimation for Periodic
ARMA Models , Journal of Time Series Analysis, Vol. 21, No. 1, pp. 75-93
YAMAN K. , SARUCAN A, ATAK M., AKTÜRK N., (2001) Dinamik Çizelgeleme İçin Görüntü İşleme
Ve Arıma Modelleri Yardımıyla Veri Hazırlama Gazi Üniv. Müh. Mim. Fak. Der., Cilt 16, No 1, 19-40
Mustafa Agah Tekindal: E-Posta: [email protected]
50
S32
Kanonik Uyum Analizi ve Sağlık Alanında Bir Uygulaması
Sıddık Keskin1, Sadi Elasan1, A. Cumhur Dülger2
1
2
Yüzüncü Yıl Üniversitesi, Tıp Fakültesi, Biyoistatistik AD. Van
Yüzüncü Yıl Üniversitesi, Tıp Fakültesi, Gastroenteroloji BD. Van
Özet
Amaç: Bu çalışmanın amacı; Kanonik uyum analizinin tanıtımı, teorik alt yapısı ile işlem aşamalarının
açıklanması ve Sağlık alanında bir uygulama ile elde edilen sonuçların yorumlanmasıdır.
Yöntem: Çalışmada uygulama materyali olarak YYÜ. Tıp Fakültesi, İç Hastalıkları ABD, Gastroenteroloji BD
dan elde edilen hidatik kistli 92 hastanın verileri kullanılmıştır. Veriler, Albümin ve Globülin değişkenlerine ait
değerler ile hidatik kist tipi olarak 5 tip ve kistin yerleştiği bölge olarak da 4 bölgeye ait frekansları içermektedir.
Kanonik uyum analizi; ilk olarak, ekolojik verilerde, canlıların veya türlerin yoğunluğu ile çevresel veriler
arasındaki ilişkileri belirlemek amacıyla geliştirilmiş çok değişkenli analiz yöntemlerinden birisidir. Bu analiz
yöntemi, günümüzde farklı disiplinlerde de yaygın olarak kullanılmaya başlanmıştır. Uyum analizi, Kanonik
korelasyon analizi ve Regresyon analizi yöntemlerinin bir kombinasyonu olarak düşünülebilen Kanonik uyum
analizinde, boyut indirgeme yardımıyla, açıklayıcı değişkenler ile lokasyon (yer veya site) ve nesneler (tür veya
tip vb.) arasındaki ilişkilerin, (genelde) iki boyutlu uzayda görsel olarak sunulması amaçlanır.
Bulgular: Çalışmada Pseudo F değeri 6.813 (p< 0.05) olarak bulunmuştur. Birinci ve ikinci boyutlara ait toplam
varyans açıklama oranı sırası ile % 69. 60 ve % 18.81 olarak bulunmuştur. İki boyut ise toplam varyansın % 88.
41’ini açıklamıştır. Globülinin birinci boyut için regresyon katsayısı negatif olurken, Albümine ait regresyon
katsayısı her iki boyut için de pozitiftir.
Sonuç: Kanonik uyum analizi, her ne kadar, daha çok ekolojik verilerde kullanılmakta ise de sağlık alanındaki
veriler için de rahatlıkla kullanılabileceği söylenebilir. Bunun yanı sıra; Kanonik korelasyon analizine göre
varsayımlara karşı daha esnek olması, çoklu uyum analizine göre de bazı avantajlara sahip olması gibi
üstünlüklerinden de bahsedilebilir.
Anahtar Kelimeler: Inertia, Boyut İndirgeme, Özdeğer, Standart Koordinat
51
S33
Ülkemizdeki Sezaryen Oranlarının Dünya Verileri ve Çeşitli Kadın İstatistikleri Işığında
Değerlendirilmesi
Mervin M. Atay1, Z. Nazan Alparslan2
1
Uzm., Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana
2
Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana
Özet
Amaç: Bu çalışmada, Çukurova Üniversitesi hastanesi verilerinden yola çıkılarak, hastane bazında, ülkemizde
ve dünyada artan sezaryen oranlarını tartışmak ve ülke verilerini ülkelerin kadınlarla ilgili çeşitli istatistikleri ile
ilişkilendirmek amaçlanmıştır.
Yöntem: Bu çalışma, Ocak 1986 ile Aralık 2002 tarihleri arasında Balcalı Hastanesi Doğum Kliniğindeki
kayıtlardan toplanmış olan sezaryen ve normal doğum verileri ve ülkelerin sezaryen doğum ve kadın istatistikleri
değerlendirilerek yapılmıştır.
Bulgular: Çukurova Üniversitesi. Balcalı Hastanesinin 1980’li yıllardan itibaren toplanan istatistikleri gözden
geçirildiğinde, sezaryen oranlarının bazı aylarda %50’lere kadar çıktığı göze çarpmaktadır. Bu yerel veriye
paralel olarak ülke bazında bakıldığında da ülkemizde de sezaryen oranlarının genel bir artış eğilimi gösterdiği
görülmekte, hatta bu hız 2006’da son yılların en yüksek değeri olan %40,8 olarak tespit edilmektedir. OECD
ülkelerinin 2007 yılındaki sezaryen oranları yüksekliğe göre Meksika (%40,7), İtalya (%39,8), Türkiye (%36,0)
olarak sıralanmaktadır. Bu konuda DSÖ’nün esas aldığı oran ise %10-15’dir. Çalışmamızda ülkelerin sezaryen
oranlarının kadınlarla ilgili istatistikler(okullaşma oranları, yaşam boyu ana ölüm riski, erkeklerin yaşam
beklentisinin yüzdesi olarak kadınların yaşam beklentisi gibi) ve demografik özelliklerle kümelenmesi
araştırılmış ve ülkemizin bu ilintideki yeri diğer OECD ülkelerinin verileri ile karşılaştırılmıştır.
Sonuç: Dünya rakamları ile paralel olarak ülkemizde de sezaryen hızları artış göstermektedir; ancak bu hızlar
ve demografik göstergeler açısından bakıldığında, ülkemiz birçok OECD ülkesinden ayrışmaktadır.
Anahtar kelimeler: Sezaryen hızları, kadın istatistikleri, OECD ülkeleri.
Uzm. Mervin M. Atay: E-Mail: [email protected]
52
S34
A New Dimension Reduction Technique Using Information Complexity for High Dimensional Gene
Expression Data
1
Esra Pamukcu , Hamparsum Bozdogan2, Cemil Colak3
1
2
Department Of Statistics, Faculty Of Science, Firat University Elazig, Turkey
Department Of Statistics, Operations And Management Science, The University Of Tennessee, Knoxville, Tn,
USA
3
Department Of Biostatistics And Medical Informatics, Faculty Of Medicine , Inonu University, Malatya, Turkey
Abstract
Objective: Dimension reduction (DR) is of great importance in the applications of biostatistics and
bioinformatics. In this study our objective is DR of high dimensional gene expression data when the number of
observations is much smaller than the dimension of the data to resolve the “curse of dimensionality.”
Material and Method: When the number of observations is much smaller than the number of features (or
variables), the undersized sample problem occurs.In this case the usual sample covariance matrix S degenerates
and it cannot be computed. One possible solution to such a problem is provided by the maximum entropy(ME)
and several other smoothed (or robust) covariance estimators, or by the hybridized forms of these covariance
estimators to carry out the Principal Component Analysis (PCA) for DR. Therefore, in this paper, we introduce
the MEcovariance matrix along with its complexity and ICOMP criterion of Bozdogan (1994,2000, 2010) to
choose the number of principal components (PCs) to reduce the dimensionality of the data. Then, we carry out a
supervised classification using the PCs chosen inboth the Linear Discriminant Analysis(LDA) and Quadratic
Discriminant Analysis (QDA)to study the performance of these two methods of classification in terms of their
error rates (ERs) of classification.
Outcomes: We consider the benchmark colon cancer data set from Alone et al. (1999). This data set has
intensities of p=2,000 genes in 22 normal and 40 tumor colon tissues; totaling n=62 colon tissues. The genes
chosen are the 2,000 genes with highest minimal intensity across the samples.The classical PCA cannot deal
with p=50 or above genes (features). Our approach with ME covariance matrix hybridized with Stipulated Ridge
Estimator, that is, ME_SRECOV does not degenerate to perform the PCA.We score the complexity of the
ME_SRECOV matrix along with ICOMP to choose the number of PCs to reduce the dimension of the colon data
and to choose the best features.
Results: LDA and QDA give 22.5% and 6.5% ERs of classification using the first 20 original raw data features,
respectively.Our approach with 20 PC transformed data presents 27.42% ER in LDA and 1.61 % ER in QDA
for the classification of the colon data.We note that our result with QDA is a remarkable reduction in the ER that
corresponds to one cancerous colon patient that should be re-examined for normalcy. Hence, our results show
the versatility and the utility of the new proposed approach.
Key Words: Maximum Entropy Covariance Estimator, Information Complexity, Principal Component Analysis
53
S35
Doğrulama Yanlılığında Kullanılan Eksik Gözlem Analizi Yöntemlerinin Performanslarının İncelenmesi
Jale Karakaya1, Erdem Karabulut1, Recai Yücel2, Ergun Karaağaoğlu1
1
2
Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara, Turkey
State University at Albany, SUNY, School of Public Health, Department of Epidemiology and Biostatistics, New
York, USA
Özet
Giriş: Teknolojinin ilerlemesi ile birlikte, hem kalite ve hem de maliyet açısından farklı tanı testlerinin göreli
doğruluğunun değerlendirilmesi oldukça önemlidir. Tanı testinin doğruluğunu değerlendirmek için, testin
doğruluğunun yansız kestirimine gereksinim vardır. Test doğruluğunun yansız kestirimini elde etmek için her
hastada hastalık durumunun (var-yok) ve tanı testinin sonucunun bağımsız olarak belirlenmesi gerekir. Oysaki
bazı klinik değerlendirmelerde, test sonucu olan hastaların büyük çoğunluğunun hastalık durumu altın standart
test ile doğrulanamayabilir. Tanı testlerini değerlendirmek için düzenlenmiş çalışmalarda, bu yaklaşım mantıklı
ve maliyet açısından etkin olabilmesine rağmen, testlerin doğruluğunun kestirilmesinde yanlılığa neden
olmaktadır. Yanlılığın bu tipi doğrulama yanlılığı (verification bias) olarak adlandırılmaktadır. Literatürde
doğrulama yanlılığının düzeltebilmek için Begg ve Greens’in yöntemi ve eksik gözlem analizi yaklaşımları
önerilmiştir. Test sonucu olup altın standart teste gönderilmeyen gözlemler eksik gözlem problemi olarak
düşünülebilir ve bu gözlemler uygun yöntemler kullanılarak doldurulabilir.
Amaç: Bu çalışmada amaç, doğrulama yanlılığı problemine çözüm bulabilmek için kullanılan Begg ve
Greens’in yöntemi ve farklı çoklu değer atama (multiple imputation) yöntemlerinin performansını
karşılaştırmaktır.
Yöntem: Doğrulama yanlılığında test performans ölçüleri, Begg ve Greens’in Bayes yaklaşımı yardımıyla
düzeltilebileceği önerilmiştir. Son yıllarda popular olan çoklu değer atama yöntemleri ile Begg ve Greens
yöntemine göre elde edilen performans sonuçları benzetim çalışması ile karşılaştırılacaktır. Çoklu değer atama
yöntemlerinden parametrik ve parametrik olamayan birden fazla yöntem tercih edilecektir. Karşılaştırma kriteri
olarak kapsama oranı ve güven aralığı genişliği kullanılacaktır.
Bulgular: Farklı örneklem büyüklüklerinde, farklı duyarlılık-seçicilik oranlarında ve farklı eksik gözlem
oranlarında Begg ve Greens’in yöntemi ve çoklu değer atama yöntemlerinin başarıları benzetim çalışması ile
incelenecektir.
Sonuç: Yöntemlerin performansları, kapsama oranları ve güven aralığı genişliklerine göre karşılaştırılarak
incelenecektir. Yöntemlerin en başarılı ve en başarısız olduğu durumlar belirlenerek yorumlanacaktır.
Anahtar Kelimeler: Doğrulama Yanlılığı, Eksik Gözlem, Çoklu Değer Atama
54
S36
Karar Ağacı Yönteminin Kestirim Yeterliliğinin İrdelenmesi; Bipolar Depresyon Tanısı Üzerinden Bir
Değerlendirme
Mehmet Güven Günver 1, Ali Baykuş 1, Günalp Uzun 1
1
İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul
Özet
Giriş: Karar Ağacı Yöntemi, çok değişkenli olarak derlenmiş veriseti üzerinden, bağımlı değişkeni bağımsız
değişkenlerin entropik olanlarına istinaden kökten yaprağa doğru bir yol haritası çıkaran bir istatistiksel
yöntemdir. Verisetini oluşturan örneklem büyüklüğü ve örneklemin niteliği ağacın oluşmasını direkt
etkilemektedir. Verisetindeki örneklemlerin rastsal olarak seçilmesi sonucu, entropik değişkenlerin değişebildiği
bilinmektedir.
Amaç: Bipolar depresyon vakalarını içeren veriseti içinden aynı boyutta fakat farklı nitelikte alt verisetleri
üzerinde karar ağacı modelini uygulayarak, sonuçların tutarlılıklarının irdelenmesi.
Yöntem: 964 kayıt bulunan bipolar depresyon verisetinden her biri 868 kayıt içeren 500 alt veriseti rastsal
olarak seçildi. Her bir alt veriseti, CHAID (CHi-squared Automatic Interaction Detection) algoritması ile karar
ağacı modellemesi yapıldı.
Tartışma ve Sonuç: Elde edilen karar ağaçlarında 2 farklı yapı ortaya çıkmıştır. Farklı karar ağacı tiplerinin kaç
kere gözlemlendikleri, düğüm sayıları, her bir tip için entropik değişken sayısı ve ortalama doğruluk düzeyleri
aşağıdaki tablo ile özetlenmiştir:
Gözlemlenme
Düğüm Sayısı
Sayısı
Entropik Değişken
Ortalama
Sayısı
Doğruluk Düzeyi
1. Tip Karar Ağacı
376
8
3
% 76,8
2. Tip Karar Ağacı
124
6
2
%76,4
Aynı veriseti üzerinde değişik rastsal alt verisetleri üzerine inşa edilen karar ağaçlarında, entropik değişken
sayısı ve düğüm sayısı değişse bile ortalama doğruluk düzeyinin tutarlı olduğu gözlemlenmiştir.
Anahtar Kelimeler: Karar Ağacı, Chaid, Tutarlılık
Mehmet Güven Günver: Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303 . Tel.: 0 212
414 30 41 E-Posta: [email protected]
55
S37
Some Observations on the Design of Early Stage Clinical Trials in the Pharmaceutical Industry
Hans Hockey1
1
Biometrics Matters Ltd, Hamilton, New Zealand
Abstract
Early in clinical drug development the pharmacokinetic and pharmacodynamic properties of new compounds
need to be explored, as well as safety and tolerability, particularly in relation to dose level and the subsequent
determination of the maximum tolerated dose. Hence drug half-life, dose proportionality and other
pharmacologic properties of the drug are estimated so as to determine how best to administer the drug. There are
also issues of genotype differences, drug-drug interactions, the effect of food, of bioequivalence between
different formulations, and so on, all of which are typically studied using healthy volunteers. Determination of
efficacy in actual patients suffering from the targetted indication cannot proceed until there is sufficient
knowledge of what effects the bioavailability and other properties of the drug.
Good and bad examples of early stage clinical trial designs in healthy volunteers that I have encountered will be
presented and discussed. These include cross-over designs and studies with a factorial treatment structure. The
various regulatory guidelines in this area and their effect on design and analysis will also be mentioned. Personal
observations, some from an agricultural research perspective, on experimental design and subsequent analyses in
early stage clinical trials will be made.
56
S38
Beta-Weibull Distribution for Simple Linear Regression and its Locally D-Optimal Design
Habib Jafari1
1
Department of Statistics, School of Science, Razi University Kermanshah-Iran
Abstract
In this paper, the Beta-Weibull distribution and its application will be introduced. Afterward, I define a simple
linear regression which its error term has Beta-Weibull distribution. A design will be defined based on some
values of independent variables and then, the Locally D-optimal criterion will be considered for obtaining locally
D-optimal design. I consider the Locally D-optimal criterion, because of depending the information matrix on
unknown parameters (Locally D-optimal criterion is a function of the information matrix).
Keywords: Beta-Weibull Distribution; D-Optimal Criterion; A-Optimal Criterion; Locally D-Optimal Design
57
S39
Estimation under Progressive Type-II censoring for Reciprocal Exponential Distribution
Sumeet Kaur1
1
FORE School of Management, New Delhi, India
Abstract
Estimation related to the parameters of reciprocal exponential distribution is discussed for progressively type-II
censored samples. A maximum likelihood estimator for the parameters is developed. A simulation study is
considered for different pattern of censoring.
Here we have used the simulation algorithm given by Aggarwala (2001) to generate samples. Here we have
specified the proportion of surviving units to be removed at five monitoring and censoring point. The
percentages of removing units from the surviving units at five stages are increasing in pattern R1 while
decreasing in pattern R2. In pattern R3, a conventional type- II censoring scheme is employed.
Using the likelihood level r, the likelihood inequality can be solved in order to construct a likelihood interval for
θ. From a graph of likelihood ratio= L (θˆ ) / L (θ ) plotted against various values of θ, the likelihood interval for
θ can be obtained for given level r, by drawing a horizontal line at L (θˆ ) / L (θ ) =r and the corresponding
likelihood interval will contain all values of θ below this line. For bootstrapping, we again have simulated 1000
samples using the value of
θˆ as a true value of θ and calculated θˆboot ( p ) for p = 0.025 and p = 0.975 to
obtain the 95% confidence interval
Keywords: Reciprocal Exponential Distribution, Progressive Type-II Censoring, Maximum Likelihood
Estimation, Confidence Interval.
Sumeet Kaur: E-Mail: [email protected]
58
S40
Small-study Effects in Individual Patient Data Meta-analysis of Prognostic Factor Studies
Ghada M. Abo-Zaid1, Jon J Deeks2, Richard D. Riley2
1
2
European Centre for Environment and Human Health, University of Exeter
School of Public Health, Epidemiology and Biostatistics, University of Birmingham
Abstract
Background: Prognostic factors (PFs)are patient characteristics (e.g.age, biomarker levels) that are associated
with future clinical out comes in patients with a disease or health condition. Evidence-based PF results are
paramount, for which individual patient data (IPD) meta-analysisis thought to be the’gold-standard’ approach,
asitsynthesises the raw data across related studies. This does not mean that IPD approach without its challenges
and pitfalls; one of these potential challenges is publication bias. It occurs when studies with statistically
significant results are more likely to be published compared to studies with non-significant results. If IPD are
only sought from, or are only available from, published studies then IPD meta-analyses of PFs may be prone to
publication bias. One way to examine potential publication bias is to look for small study effects; that is, the
tendency for smaller studies to give larger prognostic effects than larger studies.
Aims: In this talk, I will assess small-study effects and potential publication bias for unadjusted and adjusted
prognostic factor results within existing IMPF articles.
Methods and Material: A systematic review identified 48 IPD meta-analysis of prognostic factors, and the 20
most recent articles were chosen for the examination of small study effects using visual tools (e.g. a contour
enhanced funnel plot) and statistical methods (i.e. Egger’s method, and the Trim and Fill methpd). Only 1 article
report summary study results to allow such investigations, so I e-mailed 19 articles to ask for their aggregated
data or their IPD; only five other articles provided the information desired.
The strategy for the assessment for the small-study effects was: first, assess small-study effects visually by using
a contour-enhanced funnel plot and a cumulative forest plot; second, estimate the number of missing studies by
using he trim and fill method; third, obtain the p-value for Egger’s test of asymmetry. Then, if the trim and fill
method yielded 2 or more missing studies or Egger’s P-value was less than 0.10, then I used Moreno’s ‘Egger Dvar method’ to adjust for funnel plot asymmetry and estimate an adjusted pooled effect size of the PF.
Results & Conclusion: When reviewing the 20 IMPF articles considered, only 2 articles included unpublished
studies (which raises the threat of publication bias),
and only 2 articles actually examined the issue of
publication bias. My investigation of the 6 articles that gave suitable information shows little evidence for smallstudy effects. This indicates that the IPD prognostic factor meta-analyses have potentially less concern for smallstudy effects or publication bias than meta-analysis of PFs using aggregated data. However, only six examples
could be assessed and so further research is needed. All IPD projects should consider small study effects and the
59
potential impact of publication bias. An example in breast cancer will be shown where small study effects do
exist, and the potential implications on clinical conclusions discussed.
References
Moreno SG, Sutton,A J, Ades,AE,Stanley, T D. Assessment of regression-based methods to adjust for
publication bias through a comprehensive simulation study. BMC Medical Research Methodology 2009;9:2
doi:10.1186/1471-2288-9-2.
Sterne J, Egger M. . Funnel plots for detecting bias in meta-analysis: guidelines on choice of axis. Journal
of Clinical Epidemiology 2001;54(doi:10.1016/S0895-4356(01)00377-8):1046–55.
Riley R, Lambert PC, Abo-Zaid G. Meta-analysis of individual participant data: rationale, conduct, and
reporting. BMJ 2010; 340:c221 doi: 10.1136/bmj.c221.
Keywords: Meta-Analysis, IPD, Prognostic Factor, IMPF, Small-Study Effects, Publicatio
60
S41
Recent OPLS Statistical Model versus Traditional Linear Regression to Assess Sonographic Predictors of
Stroke Prognosis
H. Sadeghi-Bazargani
1
1,2
, K. Fathi3, R. Mehdizadeh3, D. Savadi-oskouei1, M. Farhoudi1
Department of Statistics & Epidemiology, Neuroscience Research Center, Tabriz University of Medical
sciences, Tabriz, Iran
2
Public Health Department, Karolinska Institute , Stockholm, Sweden
3
Department of Statistics, Islamic Azad University, Tehran, Iran
Abstract
Aim: The aim of this study was to compare applicability of orthogonal projections to latent structures (OPLS)
statistical model versus traditional linear regression, in order to investigate the role of Transcranial
Doppler(TCD) sonography in predicting the ischemic stroke prognosis
Methods: The study was conducted on 116 ischemic stroke patients admitted to a specialty neurology ward.
Data were primarily analyzed using simple linear regression and later were considered for multivariate analysis
using PLS/OPLS models through SIMCA P+ 12 statistical software package. A total of 147 variables were
formatted for SIMCA P12 to be analyzed.
Results: The results of linear regression identifying some TCD predictors of stroke prognosis, was confirmed
through OPLS modeling technique. Moreover, the OPLS model appeared to have higher sensitivity in detecting
the predictors of stroke prognosis and detected several more predictors than the linear regression. Applying
OPLS model made it possible to use both single TCD measures/indicators and arbitrarily dichotomized measures
of TCD single vessel involvement as well as the overall TCD result.
Conclusion: Condiering the large number of correlated variables in TCD, the authors recommend PLS/OPLS
methods as complementary or alternative to the available classical regression models such as linear regression.
Keywords: Stroke, Transcranial Doppler, Linear Regression, Partial Least Squares, OPLS, Orthogonal
Projections To Latent Structures, Multicolinearity
H. Sadeghi-Bazargani: E-Mail: [email protected]
61
S42
Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different Temperatures
H. Esmaily1, M. Hadi Alijanvand2, H. Doosti3, M.T. Shakeri4
1
Associate professor of Biostatistics, Health Science Research Center, School of Health, Mashhad University of
Medical Sciences, Mashhad, Iran.
2
MSc of Biostatistics , Biostatistics Department, School of Health, Shahrekord University of Medical Science,
Shahrekord, Iran
3
4
Assistant professor of Statistics , Statistics Department, Kharazmi University,Karaj, Iran
Associate professor of Biostatistics, Community Medicine Dept, Medical School, , Mashhad University of
Medical Sciences, Mashhad, Iran.
Abstract
Introduction: The aggregation of glutamate dehydrogenize enzyme plays an important role in metabolism, liver
function and has pharmaceutical, biotechnological and medical applications. In this study, the enzyme
aggregation kinetic was statistically modeled and the assembly mechanism was conjectured by estimating the
appropriate parameters of nonlinear regression at various temperatures combined with the enzyme kinetic
method.
Method: Nonlinear regression model was considered is nonlinear logistic function with three parameters which
parameter estimation is Gauss Newton method. Evaluation of the model, i.e. the mean structure, homogeneity of
variance, normal distribution, independence of fitted nonlinear model for the aggregation of glutamate
dehydrogenize enzyme data from Institute of Biochemistry and Biophysics, Tehran University (IBB) were
studied. Also remedies of violation from the assumptions of model such as the use of sandwich estimator, the
nonlinear regression with correlation of residuals, grouped nonlinear regression in repeated experiments were
considered. Finally, the sandwich estimator was applied in kinetic interpretation and nonlinear regression model
according to the grouping in repeated experiments and structure of correlation was proposed for optimization of
statistical model.
Results: Three parameters of Nonlinear logistic function in sandwich estimator for interpreting kinetic in various
temperatures was significant (p<0.001). Estimation of parameters in the optimal statistical model was significant
(p<0.001) by grouped nonlinear regression in repeated experiments. This model regarding to structure of
correlation in all temperatures except 57.50C and 600C with the little correlation 0.2 and 0.4, was more
appropriate with less akaike than grouped nonlinear regression in repeated experiments. Variation of released
energy due to protein aggregation with the fitted values of statistical model would demonstrate the melting
temperatures (Tm) of this enzyme 52.50C.
Conclusion: Based on statistical modeling, variations trend of sandwich estimations in nonlinear regression and
interpretations of kinetic, enzyme likely follows polymerization mechanism of dependent on creating nucleus.
We proceeded to identify and control the process of enzyme aggregation with a prediction of Tm.
Keywords: Glutamate Dehydrogenize: Protein Aggregation: Nonlinear Regression: Kinetics.
62
S43
Salmonella Infantis: Assessing Causes and Trends
1
Sarah Salter , Dr.Kate Cowles2, Fan Tang3, Monelle Tamegnon4, Amanda Luby5, Kevin Torres6
1
2
Professor, Dept. of Biostatistics, University of Iowa
Professor, Dept. of Statistics and Actuarial Sciences, University of Iowa
3
Graduate Student Mentor, Dept. of Biostatistics, University of Iowa
4
Graduate Student Mentor, Dept. of Biostatistics, University of Iowa
5
6
Undergraduate Student,College of St.Benedict
Undergraduate Student,University of Puerto Rico at Caya
Abstract
According to the Centers for Disease Control and Prevention, it is estimated that each year foodborne disease is
the cause of roughly 48 million illnesses, 128,000 hospitalizations, and 3,000 deaths among American citizens.
Of the 31 known pathogens that contribute to domestically acquired foodborne illness, Salmonella is deemed the
leading pathogen causing hospitalization and death. Although there has been greater implementation of
government regulations, the CDC has confirmed that since 1998 the rate of infection of Salmonella is slightly
increasing rather than decreasing. For this reason, Salmonella presents itself as a public health concern that
needs to be addressed immediately.
Last year, Diamond Pet Foods recalled a dry dog food product due to a Salmonella Infantis contamination, which
caused an outbreak of Salmonella in humans. In order to gain greater intuition on this particular serotype and
further understand the outbreak trends of Infantis, the research of this project focuses heavily on using Bayesian
statistical methodology to determine changepoints using a Markov Chain Monte Carlo computational method, as
well as a Bayesian Poisson Analysis. Furthermore, a simulation study was developed to evaluate how well these
methods were able to successfully detect outbreaks, as well as how different factors affect these results. Results
showed that the Bayesian Poisson analysis was better at detecting outbreak trends of Salmonella, including the
individual strain Salmonella Infantis.
The simulation study showed that, when using the Poisson-gamma
method, the two most influential factors in detecting the correct number of outbreaks are the frequency of
outbreaks and a parameter value that is used to distinguish between outbreaks and background infections.
63
S44
The variance: A New Formula
Muawia Abdelsalam1
1
University of Gazira, Wad Medani, Sudan
Abstract
There is a question which normal distribution should be called the “standard” one. Various authors answer it
differently. Starting from the works of Gauss the standard normal was considered to be the one with variance
1/2. Stigler (1982) goes even further and insists the standard normal to be with the variance 1/2π.
This paper attempts to present a new formula, a new marginal contribution in statistics; it is related to the nature
of the function of the normal distribution and other probability distribution functions. The paper will answer the
question of why, starting from the works of Gauss, the standard normal distribution was considered to be the one
with variance 1/2. The new formula is an attempt to insist that Gauss’ consideration can really be proved in
statistics. To support this statistical claim, this paper presents a new type of variance.
The new formula is an attempt to insist that Stigler (1982) also has a strong assertion when he goes even further
and insists the standard normal to be the one with the variance 1/2π. As is well known, Stigler’s formulation for
the standard normal distribution function is advantageous because it is a much simpler and easier-to-remember
formula, has unit height at zero, and there are simple approximate formulas for the quantiles of the distribution.
Muawia Abdelsalam:
University of Gazira PO Box 20 Wad Medani 00249 Sudan E-Mail:
[email protected] Mobile Phone :( 00249912801911)
64
S45
On the estimation based on generalized order statistics for the location and scale parameters of Burr12
Distribution
Reza Arabi Belaghi1, Minoo Aminnejad1
1
Faculty Of Mathematical Science, University Of Tabriz, Tabriz, Iran
Abstract
The two parameter Burr XII given by, ‫ݔݔܨܨ‬−‫݇݇ܿܿݔݔ݇݇ܿܿݔݔ‬was introduced by Burr (1941), has gained especial
attention in the last two decades. It’s capacity to cover various shape parameter distribution such as normal,
Weibull, Exponential, logestic, log-logestic, … permits a good fit when it is used to described biological,
clinical, and experimental data. It also has been applied in areas of quality control, reliability studies, duration
and failure time modeling.
Due to it’s importance, in this paper we first verify statistical properties and summarize its relation with some
other distribution. Furthermore we gain the minimum variance unbiased linear estimators of location and scale
parameters based on generalized order statistics applying Gauss Markov theorem.
Keywords: Burr Distribution, Maximum Likelihood Estimator, Gauss Markov Theorem, Generalized Order
Statistics
Reza Arabi Belaghi: E-Mail: [email protected]
65
S46
On The Least Trimmed Square (LTS) Estimation for Burr XII Model
Reza Arabi Belaghi1, Mehdi Pour Abdollah2
1
2
Faculty Of Mathematical Science, University Of Tabriz, Tabriz, Iran
Faculty of Mathematical Science, Ferdowsi University Of Mashhad, Mashhad, Iran
Abstract
The Burr XII distribution function one of the mostly used distribution in the area of survival analysis, reliability
analysis and economics data. It’s capacity to have more flexibility and closed form of the distribution function
allow it to be considered a useful distribution in such areas. Due to it’s importance, Recently, many research
have been done about The Burr XII distribution. So in this paper we consider the estimation of the Burr XII
distribution parameters by means of Least Trimmed Square(LTS) in the presence of one outlier and finally we
will compared this results with the other estimate methods.
Keywords: Bayes Estimation, Burr Distribution Function, Least Terminate Square, Mean Square Error
Reza Arabi Belaghi: E-Mail: [email protected]
66
S47
Statistical Models of Postnatal Transmission of HIV-India
D.M. Basavarajaiah1, B. Narasimhamurthy1
1
Madras University, Department of Biostatistics, National Institute of Epidemiology, ICMR.Ministr of health and
Family welfare, Govt of India
Abstract
Objectives: Study aims to characterize the Peadiatric HIV epidemic in India using a Statistical model, and to use
this model to determine the reasons for the high HIV prevalence in 10-12 years age groups of children’s. Trends
in Peadiatric HIV prevalence in children are significantly affected by prevention of mother-to-child transmission
(PMTCT) and HAART (Highly active antiretroviral therapy) programmes, and this study therefore also aims to
assess the impact of the PMTCT and ART programmes.
Methods: Cohort data Secondary collected from ART centers of Karnataka State, India. Inclusive criteria were
applied for the model setting. A statistical model of HIV incidence in children and HIV survival has been
created, using CMIS -data sources. The model projects the size of the population under the Peadiatric age of 15
at monthly intervals, non-AIDS mortality rates and annual numbers of births to mothers who are HIV-positive
and HIV-negative are obtained from the ASSA model, growth and weighbul distribution.
Results: Since rates of vertical transmission of HIV are dependent on the maternal CD4 count, and since uptake
of HAART relative to short-course ARV prophylaxis will also depend on the pregnant woman‟s CD4 count, it
is necessary to estimate rates of vertical transmission that would be expected in each CD4 stage, and to reexpress the effect of the short-course ARV regimens in terms of percentage reductions in transmission. Based on
a review of CD4 distributions in pregnant HIV-positive Indian women, and relative rates of vertical transmission
in different CD4 intervals, we estimate that the average rate of transmission at or before birth, in the absence of
PMTCT, is 46.0% if the mother has a CD4 count less than 100-200 µ/dL, 19.80% if the mother has a CD4 count
of 201 to <250 µ/dL, 8.60% if the mother has a CD4 count of 251 to350 µ/dL, and 2.5% if the mother has a CD4
count greater than >500 µ/dL
Conclusion: Research Study suggests that the PMTCT programme in India has already had a significant impact
on HIV incidence, and that the recent adoption of new PMTCT protocols can be expected to lead to a roughly
75% reduction in Peadiatric HIV incidence by 2015.
Keywords: ART, HAART, Prophylaxis, HIV, PMTCT, ASSA, PCR
67
S48
WGEE ve MI-GEE Yöntemlerinin Karşılaştırılması
Gazel Ser1
1
Uzman Dr., Yüzüncü Yıl Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, Biyometri ve Genetik A.B.D, Van
Özet
Bağımlı değişkenin normal dağılış göstermediği durumda kullanılan marjinal modeller veya populasyonortalama modeller, şans değişkenlerinin sahip olduğu dağılışı üstel dağılış ailesinde tanımlamaktadır. Sonrasında
eşitliğin her iki yanındaki elemanlar arasında bir bağlantı fonksiyonu kullanmaktadır. GEE (Generalized
Estimating Equations: GEE), uzun süreli verilerde marjinal model analizi için popüler bir araçtır. GEE bağımlı
değişkenin ortak dağılışıyla ilgilenmeyip, bunun yerine zaman aralığındaki tekrarlı ölçümlerin marjinal dağılışını
kullanmaktadır. GEE’nin diğer tahminleme yöntemlerinden farkı tekrarlı ölçümler arasındaki korelasyon
yapısını göz önünde bulundurmasıdır. Veri setinde eksik gözlemin bulunma durumuna bağlı olarak GEE’nin
çeşitli uzantıları geliştirilmiştir. Örneğin, eksik gözlem tamamen şansa bağlı (Missing Completely at Random;
MCAR) olduğunda, standart GEE geçerlidir ancak eksik gözlemin şansa bağlı (Missing at Random: MAR)
olması durumunda ise GEE’nin bir uzantısı olan Ağırlıklandırılmış GEE (Weigted GEE: WGEE) yada Çoklu
atama (Multiple Imputation:MI) uygulamasından sonra kullanılan MI-GEE yöntemleri araştırıcılar tarafından
kullanılmaktadır.
Bu çalışma kapsamında WGEE, MI-GEE yöntemlerinin tanıtılması ve eksik gözlemlerin MI yöntemiyle tahmin
edildiği veri setine uygulanan WGEE, MI-GEE yöntemleri arasındaki benzerlikler ve farklılıkların incelenmesi
amaçlanmıştır.
Anahtar Kelimeler: Marjinal Model, WGEE, MI-GEE
Gazel Ser: E-Posta: [email protected]
68
III-POSTER BİLDİRİLER
69
P01
Sınıflandırma Ağacı için Alternatif Bölünme Kurallarının Performanslarının Karşılaştırılmasına İlişkin
Simülasyon Çalışması
İmran Kurt Ömürlü1, Mevlüt Türe2
1
Adnan Menderes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Aydın 2Adnan
Menderes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Aydın
Özet
Günümüzde bağımlı değişkenin kategorik yapıda olduğu veri setlerinin analizi için birçok yöntem
kullanılmaktadır. Bu yöntemler, bağımsız değişkenlerin bağımlı değişken üzerindeki etkilerini değerlendirmek
ve birimlerin bağımlı değişkenin kategorilerine göre en az hatayla sınıflandırılması için model oluşturmada
araştırmacılara her zaman kılavuz olmaktadır. Bu amaçla kullanılan yöntemlerden biri de sınıflandırma ağacıdır.
Bu yöntemde, ağaç yapısının oluşturulmasındaki en önemli aşama ağaçtaki dallanmanın hangi kurala göre
olacağının belirlenmesidir. Bu çalışmada; sınıflandırma ağacı yöntemi kullanılarak bağımlı değişkenin kategorik
yapıda olduğu durumlar için geliştirilmiş farklı bölünme kurallarının (sıralı impurity, sıralı twoing,
genelleştirilmiş doğrusal Gini ve genelleştirilmiş karesel Gini) farklı koşullar altında türetilmiş veri setlerinde ve
k-kat çapraz geçerlilik yöntemi kullanılarak sınıflandırma performanslarının karşılaştırılması amaçlandı.
Simülasyon algoritmasında, 3 kategorili sıralı ölçekli bağımlı değişken ve farklı bağımsız değişken sayısı (8, 12,
16, 20) kriterlerine dayanarak 250, 500, 750 ve 1000 birimlik veri setleri oluşturuldu. Her bir veri seti için
simülasyon çalışmalarında 1000 tekrar yapıldı ve 10-katlı çapraz geçerlilik yöntemi kullanıldı. Simülasyonlar
sonucunda yöntemler, gamma istatistiği ve yanlış sınıflandırma oranlarına göre karşılaştırıldı. Sonuç olarak;
gamma istatistiği ve yanlış sınıflandırma oranlarına ilişkin bulgulara dayanarak genelleştirilmiş doğrusal Gini ve
genelleştirilmiş karesel Gini bölünme kuralları, sıralı impurity ve twoing kurallarına göre daha iyi performans
gösterirken, birbirlerine göre tahmin performanslarının benzer olduğu belirlendi.
Anahtar Kelimeler: Sınıflandırma Ağacı, Impurity, Twoing, Gini, Simülasyon
70
P02
Birinci Tür Hata’nın Kontrolünde Yanlış Bulgu Oranı Yaklaşımı
Nurhan Doğan1, İsmet Doğan2
1
Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı
2
Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı
Özet
Varyans Analizi sonucunda yokluk hipotezinin reddedilmesi, gruplardan en az birinin diğer gruplardan farklı
olduğunu gösterir. Hangi grubun/grupların farklı olduğunu gösteren genel bir test henüz bulunmadığından,
ortalamalar arasındaki farklılığın yapısını incelemek amacıyla çoklu karşılaştırma testleri kullanılmaktadır.
Çoklu karşılaştırma testlerinde amaç, üç veya daha fazla denemenin yer aldığı bilimsel çalışmalarda hangi
denemelerin en iyi, hangi denemelerin en kötü olduğuna karar vermek ya da karar verirken yanlış karar verme
olasılığını kontrol etmektir. Bu açıklamadan da anlaşılacağı üzere çoklu karşılaştırma testleri, modern bilimsel
araştırmalardan elde edilen verilerin analizinde kilit rol oynamaktadır. Halen bir grup ortalamanın çoklu
karşılaştırma işlemleri gerçekleştirilirken hangi yöntemin hangi durumda kullanılması gerektiği konusunda görüş
birliği bulunmamaktadır. Araştırmacılar, biraz farklı gerekçelerle de olsa kendi tercihlerini yaparak benzer
problemlerin çözülmesinde farklı çoklu karşılaştırma işlemleri kullanmaktadırlar. Literatürede, gerek eşzamanlı
gerekse ardışık çok sayıda çoklu karşılaştırma testi önerilmiştir. Ancak hangi durumda hangi işlemin
kullanılacağına karar vermek kolay değildir.
Eşzamanlı çoklu karşılaştırma testlerinde araştırmacılar karar vermede genellikle, karşılaştırma başına hata
oranını kullanmaktadırlar. Karşılaştırma başına hata oranı, belirlenen α anlamlılık düzeyinde her bir karşılaştırma
için yokluk hipotezinin yanlışlıkla reddedilmesi olasılığını göstermektedir. Karşılaştırma başına hata oranının en
önemli dezavantajı, karşılaştırma sayısının (n) artmasına bağlı olarak değerinin yaklaşık 1-(1-α)n kadar
artmasıdır. Bu dezavantajından dolayı karşılaştırma başına hata oranı ile ilgili eleştiride bulunanlar bunun yerine
deneysel ortak hata oranının kontrol edilmesini önermektedirler. Deneysel ortak hata oranının kontrol altında
tutulması yaklaşımı, araştırmacılar tarafından sıklıkla başvurulan bir yaklaşım olmasına rağmen uygulamalı
araştırmalarda karşılaşılan bazı zorlukları bulunmaktadır. Yanlış bulgu oranı bu zorlukları gidermek üzere farklı
bir yaklaşım olarak önerilmektedir.
Yanlış bulgu oranı, çoklu hipotez testlerinde reddedilen yokluk hipotezleri arasında yanlışlıkla reddedilen
hipotezlerin beklenen oranını ifade eden bir değerdir. Yanlış bulgu oranını dikkate alan yaklaşımlar, gerek
eşzamanlı gerekse ardışık çoklu karşılaştırma testlerine göre deneysel ortak hata oranını kontrol altında tutarak
istatistiksel gücün arttırılmasını sağlayan yöntemlerdir. Bu çalışmada amaç, son yıllarda daha yoğun olarak
kullanılmaya başlanan ancak araştırmacılar tarafından daha az bilinen yanlış bulgu oranı yaklaşımlarını örnekler
vererek tanıtmaktır.
Anahtar Kelimeler: Varyans Analizi, Birinci Tür Hata, Yanlış Bulgu Oranı
Nurhan Doğan: E-Posta: [email protected]
71
P03
Birinci Tür Hatanın Kontrolünde Adımsal Çoklu Karşılaştırma İşlemleri
İsmet Doğan1, Nurhan Doğan2
1
Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı
2
Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı
Özet
Deneysel çalışmalardaki temel amaç, elde edilen sonuçlar ve denemeler arasındaki anlamlı ilişkileri açığa
çıkarmaktır. Bir grup denemeden elde edilen ortalamalar arasında önemli farklılık olup olmadığının
belirlenmesinde çoklu karşılaştırma testleri kullanılabilir. Uygun çoklu karşılaştırma testinin kullanılması
araştırmacılara doğru, eksiksiz ve elverişli sonuçların elde edilmesinde ve elde edilen bilgiler arasındaki
ilişkilerin yorumlanmasında yardımcı olur. Varyans Analizi, ikiden çok ortalamanın karşılaştırılmasında,
ortalamalar arasında fark olup olmadığını belirlemekte, ancak hangi ortalamanın hangi ortalamadan farklı
olduğunu belirleyememektedir. Çoklu karşılaştırma işlemleri ise ortalamalar arasındaki farklılıklar hakkında çok
daha detaylı bilgi vermektedir. Çoklu karşılaştırma terimi bir grup içindeki varyanslar, oranlar ya da ortalamalar
arasındaki farklılığın istatistiksel anlamlılığı için yapılan testleri ifade etmektedir. Çoklu karşılaştırma işlemleri,
çokluluk etkisinden kaynaklanan hatalı sonuç çıkarmaların düzenli kontrolünü göz önünde bulunduran
istatistiksel işlemlerdir.
Bir araştırmada, araştırmacı tarafından kullanılacak hata oranı ve anlamlılık düzeyi belirlendikten sonra uygun
çoklu karşılaştırma testinin seçilmesi gerekmektedir. Literatürde yer alan çoklu karşılaştırma testleri ya
eşzamanlı (simultaneously) ya da adımsal (stepwise) olarak çoklu karşılaştırma işlemlerini gerçekleştirmektedir.
Eşzamanlı çoklu karşılaştırma işlemlerinde tüm ikili karşılaştırmalar için sabit bir anlamlılık düzeyi dikkate
alınırken, adımsal çoklu karşılaştırma testlerinde ikili karşılaştırmaların her biri için anlamlılık düzeyi yeniden
belirlenmektedir. Bir başka ifade ile birinci tür hatanın kontrolünün sağlanabilmesi için adımsal çoklu
karşılaştırma işlemlerinde, ayrı ayrı hipotezlerin test edilmesinde kullanılan önemlilik seviyesi, test edilen
hipotez sayısı dikkate alınarak uyarlanmaktadır.
Bu çalışmada amaç, son yıllarda daha yoğun olarak kullanılmaya başlanan ancak araştırmacılar tarafından daha
az bilinen adımsal çoklu karşılaştırma işlemlerini örnekler vererek tanıtmaktır.
Anahtar Kelimeler: Varyans Analizi, Birinci Tür Hata, Adımsal Çoklu Karşılaştırma İşlemleri
İsmet Doğan: E-Posta: [email protected]
72
P04
Sağlık Personelinin Hasta Hakları Konusunda Bilgi Tutum ve Davranışlarının Ana Bileşenler
Yöntemi İle Değerlendirilmesi
1
MY. Çelik , MM.Dasdağ1, O.Satıcı1, Z.Akkus1, İ.Yıldız 1
1
Dicle Üniversitesi, Tıp Fakültesi, Biyoistatistik AD.
Özet
Hasta hakları; temel insan haklarının sağlık hizmetleri sahasındaki yansımasını ve hasta haklarının somut olarak
gösterilmesini ve sağlık hizmeti verilen bütün kurum ve kuruluşlarda ve sağlık kurum ve kuruluşları dışında
sağlık hizmeti verilen hallerde, insan haysiyetine yakışır şekilde herkesin hasta haklarından faydalanabilmesine,
hak ihlallerinden korunabilmesine ve gerektiğinde hukuki korunma yollarını fiilen kullanabilmesi olarak
tanımlanır.
Çalışmada amaç; sağlık personelinin hasta hakları konusunda bilgi tutum ve davranışlarının Ana Bileşenler
Yöntemi ile değerlendirerek, konuyla ilgili temel bileşenleri ortaya çıkarmak ve yorumlamaktır.
Çalışma çok merkezli olup rastgele örnekleme yöntemi ile Gaziantep Şehit Kamil Devlet Hastanesinden 59 kişi,
Diyarbakır Devlet Eğitim ve Araştırma Hastanesinden 75 kişi, Dicle Üniversitesi hastanesinden 97 kişi,
toplamda 231 kişiye ulaşılmıştır.
Elde edilen verilere ilişkin değişkenlerin hasta hakları ile ilgili oluşturdukları komponentleri elde etmek amacı
ile Ana Bileşenler Yöntemi ve Varimax dönüşümü kullanıldı. Değişkenlerin 10 komponent oluşturduğu bunların
açıklama miktarının %79.95 oranında olduğu görüldü. Elde edilen ana bileşenler sonuçlarına göre; yedi
değişkenden oluşan birinci komponent, “Hasta bilgilendirme komponenti”, beş değişkenden oluşan ikinci
komponent, “Hastaya bilgi verme şekli komponenti”, beş değişkenden oluşan üçüncü komponent, “Hastadan
tıbbi müdahale öncesi izin komponenti”, dört değişkenden oluşan dördüncü komponent, “Hastaya hizmet veren
personelin görevi, deneyimi ve eğitim düzeyi komponenti”, üç değişkenden oluşan beşinci komponent,
“Hastanın yapılmakta olan araştırmaya dahil edilme izni komponenti”, iki değişkenden oluşan altıncı
komponent, “Hastanın muayene sırasında gizliliğinin korunması komponenti”, bir değişkenden oluşan yedinci
komponent, “Personelin cinsiyeti komponenti”, bir değişkenden oluşan sekizinci komponent, “Hastanın kendi
durumunu analiz için benzer bir dosya inceleme komponenti”, bir değişkenden oluşan dokuzuncu komponent,
“Hastanın kendi durumunu analiz için benzer bir dosya inceleme komponenti” ve son olarak bir değişkenden
oluşan onuncu komponent, “Çocukların operasyonuna veli tarafından izin verilmiyorsa sağlık personelinin
tutumu komponenti” olarak bulunmuştur.
Sonuç olarak, sağlık personelinin hasta hakları konusunda bilgi tutum ve davranışları, Ana Bileşenler Yöntemi
sonuçlarına göre on komponent başlığı ile yorumlanabileceği gösterilmiştir.
73
P05
Kanserli Hastalarda; Kanserin Vücuttaki Tutulum Bölgeleri, Hastaların Cinsiyet, Eğitim Düzeyi ve
Mevsimsel Dağılımına Göre İncelenmesi
Ö.Satıcı 1, M.Y.Çelik 1,Z.Akkus1, İ.Yıldız 1, M.M. Dasdag 1
1
Dicle Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Diyarbakır
Özet
Bu çalışmanın amacı, vücudun değişik bölgelerine yayılım göstermiş kanserin tutulum bölgeleri, hastaların
cinsiyet, eğitim düzeyleri ve hastaların hastaneye geliş zamanlarına göre incelenerek, konuyla ilgili tanımlayıcı
bilgileri sunmaktır.
Çalışmanın verileri, Ocak 2009 ile Aralık 2009 tarihleri arasında Diyarbakır Sağlık İl Müdürlüğüne bildirilen
kanser teşhisi konulmuş 579 hastalara aittir. Hastanelere göre bildirilen kanser hastalarının dağılışı; Dicle
Üniversitesi Hastanesi 389 (%67.2), Diyarbakır Devlet Hastanesi 131 (%22.6), Diyarbakır Çocuk hastalıkları
Hastanesi 31 (%5.4), Özel Veni-Vidi Hastanesi 17 (%2.9), Diyarbakır Göğüs Hastalıkları Hastanesi 7 (%1.2),
Özel Diyarbakır Hastanesi 3 (%0.5) ve Diğer Kurum Hastaneleri 1 (%0.2) olarak gözlendi.
Hastaneye başvuran kanserli hastaların cinsiyete göre dağılımları; 327 (%56.5) erkek ve 252 (%43.5)’ si
kadındır. Hastaların 330 (%57)’ si eğitimsiz olup, İlk-Orta öğretim mezunu 192 (%33.2), lise mezunu 41 (%7.1)
ve yüksek okul mezunu 16(%2.8) şeklinde gözlendi.
Hastaların hastalık evrelerine göre dağılımı ise; In Situ 9 (%1.5), Lokalize 241 (%41.6), uzak metaztas 162 (%
28.0), bilinmeyen 57 (%29.9) olarak görüldü.
Kanserin erken tanısı ve vücuttaki tutulum bölgesinin belirlenmesi, hayati öneme sahiptir. Bu nedenle hastaların
vücuttaki lokalizasyonlara göre dağılımı saptanmış olup, büyüklük sırasına göre; cilt 97(%16.1),
71(%12.26), akciğer 67(%11.6), lösemi 60(%10.4), mide 39(%6.7), kolon 36(%6.2),
meme
lenfoma 32(%5.5),
prostat 28(%4.8),
troid 23(%4.0), böbrek 15 (%2.6), beyin 13(%2.2), kemik 11(%1.9), pankreas 11(%1.9), rektum 11(%1.9),
karaciğer 8(%1.8), özefagus 7(%1.2), uterus 7 (%1.2), larenx 6 (%1.0), mesane 6(%1.0), over 6(%1.0) ve diğer
bölgelerde %1’den daha küçük tutulumlar olarak gözlendi.
Kanser hastalarının geldikleri il-ilçelere göre dağılımı; Diyarbakır Merkez 233 (%40.2), Batman-Merkez 25
(%4.3), Mardin Merkez 24 (%4.1), Bismil 20 (%3.5), Ergani 19 (%3.3), Silvan 18 (%3.1), Siverek 18 (%3.1),
Kızıltepe 16 (%2.8), Siirt Merkez 11 (%1.9), Bitlis Merkez 8 (1.4), Muş Merkez 8 (%1.4) şeklinde gözlendi.
Çalışmada kanserli popülasyon için kanserin bölgelere göre tutulum oranları %95 GA (Güven Aralığı) olarak
belirlendi. Bu durumda en yüksek kanser tutulum bölgesi %19.06 oran ile ciltte hesaplandı.
Kanser olgularının hastaneye gelişlerinin mevsimsel dağılımı, yılın soğuk ayları olan (ekim-kasım-aralık-ocakşubat-mart) altı aylık sürede, erkeklerde %63.9 ve kadınlarda %58.7 oranında hastaneye müracaat ettikleri
saptandı.
74
Sonuç olarak, verilen oranlar dikkate alındığında cilt kanserinin bölgede yüksek bir dağılıma sahip olduğu, bu
durumunda bölgedeki güneşli havanın ve çalışma koşullarına bağlı olduğu şeklindedir. Hastaların 522
(%90.2)’sinin eğitimsiz ve ilk-orta öğretim mezunu olduğu dikkati çekmektedir.
Anahtar Kelimeler: Kanser, Vücut Tutulum Bölgeleri, Tanımlayıcı İstatistik
75
P06
Sonuç Değişkeninin İki Sonuçlu Olduğu Durumda İki Değerlendirici Ya Da İki Yöntem Arsındaki
Uyumun Değerlendirilmesinde Yeni Bir Yaklaşım: Birey Uyum Katsayısı (CIA)
Semra Erdoğan1, Gülhan Orekici Temel1
1
Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Mersin
Özet
Amaç: İki farklı yöntemin ya da iki farklı değerlendirici arasındaki uyumu değerlendirirken sonuç değişkenimiz
sürekli ise literatürde çok yaygın olarak Concordance korelasyon katsayısı (CCC) ve Intraclass korelasyon
katsayısının (ICC) farklı versiyonları kullanılırken, sonuç değişkenimiz iki kategorili olduğu durumda çok
yaygın olarak Cohen’in kappa istatistiği kullanılmaktadır. Aynı bireyden farklı yöntemlerle elde edilen ölçümler
arasındaki uyumsuzluk, aynı bireyin aynı yöntemle alınan tekrarlı ölçümleri arasındaki uyumsuzluğun benzer
olduğu ileri sürülerek, değerlendiriciler ya da yöntemler arasındaki uyum katsayısını tahmin etmek ve
tanımlamakta kullanılabilecek yeni bir yaklaşım önerilmiştir. Bu yaklaşım, sürekli ve kategorik değişkenler
üzerinde de tekrarlı ölçümlerin bulunduğu durumlarda kullanılabilecek olan özel bir uyumsuzluk fonksiyonu ile
tanımlanan Birey Uyum Katsayısıdır (CIA). Bu çalışmanın amacı iki değerlendiricinin bulunduğu ve sonuç
değişkeninin iki sonuçlu (hasta-sağlam, var-yok) olduğu bir durumda, değerlendiriciler arasındaki uyumu,
bireylerin eşitliği yaklaşımından yola çıkarak ele alan CIA’yı incelemektir. Gereç ve Yöntem: CIA
hesaplamasında iki farklı durum söz konusudur. Değerlendiricilerin her ikisi de referans olarak
değerlendirilmiyorsa CIA,
ψ N ile gösterilmektedir, X değerlendiricisi referans alınıp Y değerlendiricisi yeni bir
değerlendirici olarak değerlendiriliyorsa CIA,
ψR
şekilde gösterilmektedir ve farklı formüllerle
hesaplanmaktadır. Çalışmada, X değerlendiricisinin duyarlılık değerinin yüksek ve 0.9 olarak, seçicilik değerinin
de yüksek ve 0.8 olarak sabit tutulup Y değerlendiricisi için üç farklı kombinasyon düşünülmüştür. İlk
kombinasyon, Y değerlendiricisinin duyarlılığının 0.80 ve seçiciliğinin 0.70 olarak yüksek olduğu bir durum,
ikinci kombinasyon olarak duyarlılığının 0.80 ile yüksek, seçiciliğinin 0.40 ile düşük olduğu bir durum, son
olarak duyarlılığının da düşük ve 0.50, seçiciliğinin de düşük ve 0.40 olduğu durumlar göz önünde
bulundurulmuştur. Buradan farklı prevelans değerleri için X ve Y değerlendiricileri arasındaki uyum katsayıları
hesaplanmıştır. Bulgular: Duyarlılık ve seçiciliğin yüksek olduğu durumda,
ψ N değeri 0.97 olurken, ψ R
değeri 0.69 ile 0.84 arasında değerler almaktadır. Duyarlılığın yüksek seçiciliğin düşük olduğu durumda,
değeri 0.71 ile 0.96 arasında değer alırken,
ψN
ψ R değeri 0.57 ile 0.69 arasında değerler almaktadır. Duyarlılığın ve
seçiciliği düşük olduğu durumda ise,
ψ N değeri 0.70 olurken, ψ R değeri 0.36 ile 0.57 arasında değerler
almaktadır. Her üç kombinasyonda da
ψ N > ψ R şeklinde olduğu gözlenmiştir. Sonuç: Değerlendiriciler
arasındaki uyumu test etmede çok yaygın olarak kullanılan kappa istatistiğinin prevelanstan etkilendiği ve hatta
düşük ve yüksek prevelansta sıfır değerini aldığı bilinmektedir. Bu çalışma sonunda iki değerlendiricinin
76
bulunduğu ve sonuç değişkeninin ikili olduğu güvenilirlik çalışmalarında değerlendiriciler arasındaki uyum için
araştırmacılara CIA yöntemini kullanmaları önerilmektedir.
Anahtar Kelimeler: Değerlendiriciler Arası Uyum, Metot Karşılaştırması, Birey Uyum Katsayısı, İki Sonuçlu
Veri
Semra Erdoğan: MEÜ. Çiftlikköy Kampüsü, Tıp Fakültesi Dekanlık Binası, Biyoistatistik ve Tıbbi Bilişim AD.
MERSİN/TURKİYE Tel: 0 324 3610684 Cep: 0 533 617 39 13 Fax: 0 324 341 24 00
77
P07
Adolesan Bireylerin Boy ve Ağırlıklarına İlişkin İfadelerinin, Ölçümlerle Karşılaştırılması
Elçin Balcı1, Ferhan Elmalı2, Osman Günay1
1
2
Erciyes Üniversitesi, Tıp Fakültesi, Halk Sağlığı Anabilim Dalı, Kayseri
Erciyes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Kayseri
Özet
Giriş ve Amaç: Toplumun boy ve ağırlık bilgisi; genel sağlık, beslenme düzeyi, şişmanlığın ve diğer
hastalıkların değerlendirilmesi ile ilişkilidir. Bildirilen boy ve ağırlık, bu değişkenlerin kullanıldığı
epidemiyolojik çalışmalarda maliyet etkin bir değerlendirme ve saha çalışmalarında kolaylık sağlar.
Bildirilen değerlerin geçerliliği; çalışma yapılan grubun cins, yaş ve sosyo-ekonomik durumuna göre değişiklik
gösterebilir. Birçok çalışmada ağırlığı daha az, boyu daha fazla beyan etme de kısmen bu durumla ilişkilidir. Bu
da örneğin şişmanlığın belirlenmesinde yaygın olarak kullanılan Beden Kitle İndeksi (BKİ)’nin de düşük
hesaplanmasına ve obezite prevalansında ulaşılacak rakamda hataya yol açar.
Bu çalışma; Kur’an kursunda yatılı olan adolesan bireyler tarafından bildirilen boy ve ağırlık değerlerinin,
yapılan ölçümlerle karşılaştırılması amacıyla yapılmıştır.
Gereç ve Yöntem: Bu çalışmanın amacı yatılı adölesan bireylerin kendi ifade etmiş oldukları boy ve ağırlık
değerlerinden hesaplanan beden kitle indekslerinin bu bireylerden standart ölçümlerle elde edilen boy ve ağırlık
değerlerinden hesaplanan beden kitle indekslerine göre geçerliliğinin belirlenmesidir.
Sosyodemografik ve tanımlayıcı bilgileri ve kişilerin boy, kilo, bel ve kalçalarının ölçüsünü sorgulayan soruların
yer aldığı anket formları, araştırmaya katılmayı kabul eden öğrencilere yüz yüze görüşme yöntemi ile
uygulanmıştır.
Anket bitiminde ölçümler araştırmacı tarafından, katılımcıların mahremiyetleri korunarak üzerlerinde iç
çamaşırları kalacak şekilde ve ikişer kez gerçekleştirilmiştir ve değerlendirmelerde bu değerlerin ortalamaları
kullanılmıştır.
DSÖ’ye göre kadınlarda bel kalça oranı ≥0,85 ve/veya bel çevresi ≥88 cm santral obezite olarak tanımlanmıştır.
Araştırmada kurslara kayıtlı tüm öğrencilere (521 kişi) ulaşılması hedeflenmiş, araştırmaya katılmayı kabul eden
452 kişi (ulaşma oranı %86,7) alınmıştır.
Araştırmanın verileri Kur’an kursundaki adolesan çağdaki kız öğrencilerin depresyonlarının yeme tutumlarına
etkisini inceleyen bir başka çalışmanın alt parçası olarak elde edilmiştir.
Araştırma için idari izinler valilik makamı ve il müftülüğünden, etik çalışma izni ise Erciyes Üniversitesi Etik
kurulu’ndan alınmıştır.
78
İstatistiksel Analiz: Çalışmanın verileri SPSS 19.0 ve MedCalc 8.1.1.0 istatistik paket programında
değerlendirilmiştir. Özet istatistikler ortalama±standart sapma olarak verilmiştir. Verilerin normal dağılımına
Shapiro-Wilk testi ile bakılmıştır. İfade edilen değerler ile ölçülen değerler arasında bir fark olup olmadığına
Bağımlı İki Örnek T Testi ile bakılmıştır. İfade edilen değerler ile ölçülen değerler arasındaki ilişki Pearson
Korelasyon Analizi ile değerlendirilmiştir. İfade edilen değerler aracılığı ile ölçülen değerlerin tahminlenmesi
için Doğrusal Regresyon Analizi’nden yararlanılmıştır. İfade edilen değerler ile ölçülen değerler arasındaki
uyumun belirlenmesinde Bland&Altman Yöntemi’nden yararlanılmıştır. Bland&Altman Yöntemi, ifade edilen
ve ölçülen değerlerin farkına karşılık ifade edilen ve ölçülen değerlerin ortalamasının saçılım grafiğini oluşturan
görsel bir yöntemdir. P<0.05 değeri istatistiksel olarak anlamlı kabul edilmiştir.
Bulgular: Çalışmadaki 388 katılımcının yaşları 17.49 ± 2.28 olarak bulunmuştur. Bireylerin ifade etmiş
oldukları boy, ağırlık ve bunlardan hesaplanan BKİ ile bireylerden ölçümle elde edilen boy, ağırlık ve bunlardan
hesaplanan BKİ değerlerine ait istatistikler Tablo 1’de gösterilmiştir.
Tablo 1: Boy, ağırlık ve beden kitle indekslerine ait istatistikler
Kilo (kg)
Boy (m)
BKİ (kg/m2)
İfade Edilen
54.75±7.86
1.60±0.07
21.50±2.80
Ölçülen
56.59±8.07
1.60±0.06
22.09±2.86
Ortalama Fark a
-1.84±3.21*
-0.0043±0.04*
-0.59±1.53*
Pearson Korelasyon Katsayısıa
0.919
0.843
0.854
a
İfade edilen değerler ile ölçülen değerler arasındakini gösterir.
*
İfade edilen değerler ile ölçülen değerler arasındaki farkın anlamlılığını gösterir (p<0.05).
Tablo 1’e göre ifade edilen kilo, boy ve BKİ değerleri; ölçülen kilo, boy ve BKİ değerlerine göre düşüktür ve
aradaki fark istatistiksel olarak anlamlı bulunmuştur (p<0.05). Katılımcıların boy ve ağırlık tahminleri gerçek
değerlerinden daha düşük olarak bulunmuştur.
Şekil 1: İfade Edilen Kilo ile Ölçülen Kilo Arasındaki İlişki Grafiği
79
Şekil 1’e göre ifade edilen ağırlık ile ölçülen ağırlık arasında pozitif yönde güçlü bir ilişki bulunmuştur (r=0.919,
p<0.001). İki değişken arasındaki regresyon modeli
Ölçülen Ağırlık=4.954+0.943(İfade Edilen Ağırlık)
olarak kurulmuştur ve bu model anlamlı bulunmuştur (p<0.001, r2= 0.845).
Şekil 2: İfade Edilen Boy ile Ölçülen Boy Arasındaki İlişki Grafiği
Şekil 2’ye göre ifade edilen boy ile ölçülen boy arasında pozitif yönde güçlü bir ilişki bulunmuştur (r=0.843,
p<0.001). İki değişken arasındaki regresyon modeli
Ölçülen Boy = 0.434 + 0.730(İfade Edilen Boy)
olarak kurulmuştur ve bu model anlamlı bulunmuştur (p<0.001, r2=0.711).
Şekil 3: İfade Edilen BKİ ile Ölçülen BKİ Arasındaki İlişki Grafiği
Şekil 3’e göre ifade edilen BKİ ile ölçülen BKİ arasında pozitif güçlü bir ilişki bulunmuştur (r=0.854, p<0.001).
İki değişken arasındaki regresyon modeli
80
Ölçülen BKİ=3.332+0.872(İfade Edilen BKİ) olarak kurulmuştur ve bu model anlamlı bulunmuştur (p<0.001,
r2=0.729).
Şekil 4: İfade Edilen Kilo ile Ölçülen Kilo Arasındaki Uyum
Şekil 4’te Bland&Altman yöntemi ile elde edilen ağırlık için uyum gösterilmektedir. Şekildeki kalın çizgi
ortalama farkı, kesikli çizgiler ise farkların %95 güven sınırlarını göstermektedir. Dikey eksen ifade edilen ile
ölçülen değerler arasındaki farkı, yatay eksen ise ifade edilen ile ölçülen değerlerin ortalamasını göstermektedir.
Şekil 4’e göre katılımcılar ölçülen değerlerden ortalama olarak 1.8 kg. düşük tahmin yapmıştır. Katılımcıların
yaklaşık %6’sının ifade ettiği değerler %95 güven sınırlarının dışındadır. Mükemmel bir uyumda şekildeki
noktaların dikey eksene göre 0 (sıfır) bölgesinde toplanması beklenir. Şekil 4’e göre ağırlık değişkeni için ifade
edilen değerler ile ölçülen değerler arasında orta düzeyde bir uyum vardır.
Şekil 5: İfade Edilen Boy ile Ölçülen Boy Arasındaki Uyum
Şekil 5’te ifade edilen boy ile ölçülen boy arasındaki uyum gösterilmektedir. Şekil 5’e göre katılımcıların ifade
ettikleri değerler ölçülen değerlerden ortalama olarak 0.004 m. düşüktür. Katılımcıların yaklaşık %5’inin ifade
ettiği değerler %95 güven sınırlarının dışındadır. Şekil 5’te güven sınırları içerisinde noktalar yayılmış olarak
bulunmaktadır. Boy değişkenine göre ifade edilen değerler ile ölçülen değer arasında orta düzeyde bir uyum
görünmektedir.
81
Şekil 6: İfade Edilen BKİ ile Ölçülen BKİ Arasındaki Uyum
Şekil 6’da BKİ için uyum gösterilmektedir. Katılımcıların yaklaşık %5’inin BKİ için ifade ettiği değerler %95
güven sınırlarının dışındadır. Katılımcılar ölçülen değerlerden ortalama olarak 0.6 kg/m2 düşük tahmin yapmıştır.
Şekildeki noktalar ortalama ve sıfır etrafında toplanmaktadır. Şekil 6’ya göre BKİ değişkeni için ifade edilen
değerler ile ölçülen değerler arasında iyi düzeyde bir uyum vardır.
Sonuç: Adolesan bireylerde ifade edilen kilo, boy ve BKİ değerleri; ölçülen kilo, boy ve BKİ değerlerine göre
düşüktür ve katılımcıların boy ve ağırlık tahminleri gerçek değerlerinden daha düşük olarak bulunmuştur.
Elçin
Balcı:
Erciyes
Üniversitesi,
Tıp
Fakültesi,
Tel: +90 0352 4374937 / 23728 Fax: +90 0352 4375285
82
Halk
Sağlığı
Anabilim
Dalı,
E-Posta: [email protected]
38039-Kayseri
P08
Bagging Support Vector Machines for Leukemia Classification
Gokmen Zararsiz1, Ferhan Elmali1, Ahmet Ozturk1
1
Erciyes University, Faculty of Medicine, Department of Biostatistics and Medical Informatics, Kayseri, Turkey
Abstract
With the development of microarray technology, the expression levels of thousands of genes can be measured
simultaneously. Using these gene expression datasets, machine learning techniques can be applied to classify the
diseases for early diagnosis and treatment. Leukemia is one of the most common cancer type, and its diagnosis
and classification is becoming increasingly complex and important. Here, we used Golub’s leukemia dataset (1)
and adapted bagging support vector machines (bSVM) for leukemia classification. bSVM trains each SVM
seperately using bootstrap technique, then aggregates the performances of each SVM by majority voting. bSVM
showed accuracy between 87.5% - 92.5%, area under ROC curve between 98.0% - 99.2% and outperformed
single SVM and other classification methods. We also compared our results with other study results which used
the same dataset for leukemia classification. Experimental results revealed that bSVM showed the best
performance and can be used as a biomarker for the diagnose of leukemia disease.
Keywords: Bagging, Leukemia diagnosis, Microarray, Support vector machines
(1) Golub TR, Slonim DK, Tamayo P, et al. Molecular Classification of Cancer: Class Discovery and Class
Prediction by Gene Expression Monitoring. Science 1999; 286: 531-537
83
P09
A Voting Approach for SVM Kernel Selection in Gene Expression Profiling
Gokmen Zararsiz1, Cenk Icoz2, Erdener Ozcetin3
1
Erciyes University, Faculty of Medicine, Department of Biostatistics and Medical Informatics, Kayseri, Turkey
2
3
Anadolu University, Faculty of Science, Department of Statistics, Eskisehir, Turkey
Anadolu University,Faculty of Engineering and Achitecture, Dept. of Industrial Engineering, Eskisehir, Turkey
Abstract
With the development of microarray technology, the expression levels of thousands of genes have been
monitored simultaneously and gene expression profiling has been successfully performed to disease diagnosis
and classification. There are lots of machine learning methods have been proposed and successfully applied for
this purpose. Support vector machines (SVM) are one of the most powerful machine learning method which
performs classification by constructing an optimal hyperplane(s) to seperate the data. There are different kernel
functions proposed for SVM and selection of the right kernel function is very important for accurate gene
expression profiling. Here we define a voting approach (VA) which automatically finds the best SVM kernel
function for a given dataset. In first step, VA applies different kernel-SVM models to dataset. Next, VA validates
each model using different performance criterias. Finally, VA aggregates the performances of each criteria using
a rank aggregation idea. The use and the efficiency of VA will be demonstrated on real datasets.
Keywords: Gene expression profiling, Kernel functions, Rank aggregation, Support vector machines, Voting
methods
84
P10
Genellenebilirlik Kuramı
Pervin Demir1, Atilla Halil Elhan1, Derya Öztuna1
1
Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Günlük yaşantımızda ve bilimsel çalışmalarda ölçme önemli bir yer tutar. Ölçme araçları, ölçülen büyüklüğün
sayılarla ifade edilmesini; böylelikle gözlemin daha duyarlı yapılarak objektif ve standart ölçümler elde
edilmesini sağlar. Uygun maddeler seçerek istenen nitelikte bir ölçme aracı geliştirme sürecinde madde analiz
çalışmaları önemli bir yer tutmaktadır. Bu amaçla en yaygın kullanılan teori, klasik test teorisidir(KTT). Ölçme
çalışmalarında amaç, ölçülen özellik bakımından elde edilen puanın olabildiğince gerçek puana yakın olmasının
sağlanmasıdır. Bu nedenle ölçme işlemine karışan hatanın araştırılması yani güvenirliğin test edilmesi gerekir.
Genellenebilirlik kuramı KTT’ndeki sınırlılığı ortadan kaldırmak için puanlayıcı, zaman, test formu, madde ve
görev gibi değişkenlik kaynaklarından gelen hataları birlikte değerlendirerek tek bir güvenirlik katsayısı
hesaplanmasını sağlar.
Çalışmada yer alan puanlayıcıların verdikleri puanlarla evrendeki tüm puanlayıcılara genelleme yapılmak
isteniyorsa, genellenebilirlik kuramından yararlanılabilir. Genellenebilirlik kuramında farklı karar çalışmaları ile
farklı sayıdaki madde ve puanlayıcı sayılarına göre güvenirlik tahminleri yapılarak en uygun madde ve
puanlayıcı sayısına karar verilebilir. Genellenebilirlik kuramı sayesinde araştırmacı toplam varyansın ne
kadarının hangi kaynaktan ortaya çıktığını görebilir.
Bu çalışmada; KTT ve genellenebilirlik kuramı arasındaki farklılıklar ve genellenebilirlik kuramının amacı
üzerinde durulmuştur. Belli bir ölçmenin güvenirliğini değerlendirmek için düzenlenen Genellenebilirlik (G)
çalışması ve Karar (K) çalışmasından bahsedilmiştir.
Anahtar Kelimeler: Klasik test kuramı, Madde yanıt teorisi, Genellenebilirlik kuramı, Karar çalışması
Pervin Demir: E-Posta: [email protected]
85
P11
Tanı Testlerinin Aile Hekimliğindeki Kullanımına Bir Örnek
Zekeriya Aktürk1, Kamber Kaşali2
1
Atatürk Üniversitesi Tıp Fakültesi Aile Hekimliği Anabilim Dalı, Erzurum
2
Atatürk Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı, Erzurum
Özet
Giriş ve Amaç: Her ne kadar aile hekimliği uygulamasında biyopsikosoysal bir yaklaşım önerilse de
teknolojideki ilerlemeler ve tanı testlerinin artmasının da etkisiyle aile hekimleri giderek daha fazla tanı testi
kullanma eğilimindedirler. Doğru kullanıldığında koruyucu hekimlikten, tanı ve tedavide çok faydalı olabilen
tanı testlerinin, uygunsuz kullanımında ciddi sorunlar ortaya çıkabilmektedir. Bu nedenle aile hekimleri tanı
testlerinin kendi pratiklerindeki duyarlılık ve özgüllük değerinin yanı sıra Bayes teoremi, ön test olasılığı,
olabilirlik oranı ve son test olasılığı gibi kavramları da iyi bilmelidirler. Bu makalede tanı testlerinin aile
hekimliği pratiğindeki yerinin Bayes yaklaşımına dayanarak nasıl hesaplanacağının bir örnek üzerinde
açıklanması amaçlanmıştır.
Yöntem: Bayes Teoremi ve Olabilirlik Oranı: Thomas Bayes tarafından geliştirilmiş olan Bayes teoremi
durumsal olasılıkları açıklamaktadır. Bu teorem basitçe karar vermede tek bir olasılığın etkili olmayıp birçok ön
olasılığın üst üste binerek son bir karara yol açtığı esasına dayanır. Örneğin, bir zar atıldığında çift gelme
olasılığı %50’dir. Herhangi bir başka bilgiye sahip olunmazsa bu olasılık hep %50 beklenir, ancak zarın hileli
olduğu ve çift gelme olasılığının arttırıldığı bilgisine sahip olunursa, çift gelme olasılığının %50’den daha fazla
olması beklenir.
Elde edilen bu olasılık, ön test olasılığı olarak kullanılarak varsa başka testler için ihtimaller eklenir ve böylece
olabildiğine yüksek bir doğrulukta karar verilmeye çalışılır. On binde 1 yaygınlıkta görülen bir hastalık için %90
duyarlı ve %86 özgül bir testin pozitif çıkması halinde son test olasılığının %0,064 olduğu hesaplanabilir.
Bulgular: Yeni doğan bir bebeğin rutin muayenesinde birçok test istenilir. Bu testlerden kreatinin fosfokinaz
(CPK) %90 duyarlılığı ve %86 özgüllüğe sahip olan bir testtir. CPK testi pozitif bulunan yeni doğmuş bir
bebeğin musküler distrofinin olma riski araştırılmaktadır.
Musküler distrofinin yaygınlığı 10 binde 1 civarındadır. Öncelikle ön test olasılığı, olasılık oranına (pretest odds)
çevrilir. Ardından testin olabilirlik oranı (LR) hesaplanır. Daha sonra son test olasılık oranı (posttest odds)
hesaplanır. Son olarak ise elde edilen olasılık oranı son test olasılığına çevrilir (Tablo1).
86
Adımlar
1.Pre test olasılığının pre test olasılık oranına (Odds Ratio) çevrilmesi: Pre test OR = Olasılık / (1 - Olasılık)
2. Olabilirlik oranının (LR+) hesaplanması: LR+ = Duyarlılık / (1 - Özgüllük)
3. Bayes Teoreminin hesaplanması: Post test OR = Pre test OR X LR
4. Post test OR’nın olasılığa dönüştürülmesi: Olasılık = Post test OR / (1 + Post test OR)
Tablo 1: Yeni doğan bir bebeğin pozitif CPK testi durumunda musküler distrofi olma olasılığının hesaplanması.
Sonuç: CPK testi pozitif çıkan bir bebeğin musküler distrofi olma olasılığı 10 binde 6 bulunmuştur. Her ne
kadar CPK testi teknik açıdan yüksek duyarlılık ve özgüllük değerlerine sahip bir test olsa da, nadir görülen bir
hastalık olan musküler distrofide tanıya fazla katkıda bulunamamaktadır. Musküler distrofi hastalığının
toplumda yaygınlığı olan 10 binde 1 olasılığı CPK testinin pozitif çıkması halinde 10 binde 6 bulunmuştur.
Aile hekimlerinin sadece testin teknik özelliklerine dayanarak karar vermeleri halinde birçok yalancı pozitif
etiketleme söz konusu olabilecektir. Aile hekimlerinin klinik testleri kullanırken ulusal ve uluslararası rehberleri
dikkate almaları, rehberlerin bulunmadığı durumlarda kullanılan tanı araçlarının olabilirlik oranlarına bakmaları,
mümkünse birden fazla tanı aracını bir arada değerlendirerek Bayes yaklaşımına uygun, daha kesin kararlar
vermeye çalışmaları doğru olacaktır.
Anahtar Kelimeler: Bayes Teoremi, Tanı Testleri, Musküler Distrofi
87
P12
Yaşam Analizleri’nde Random Survival Forests ve Cox Regresyon Yöntemleri’nin Karşılaştırılması
Ferhan Elmalı1, Engin Özkan1, Ahmet Öztürk1, Gökmen Zararsız1, Serdar Şıvgın2
1
Erciyes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Kayseri
2
Erciyes Üniversitesi, Tıp Fakültesi, Hematoloji Anabilim Dalı, Kayseri
Özet
Cox Regresyon yöntemi 1972 yılında Cox tarafından yaşam analizleri için geliştirilmiş bir yöntemdir [1]. Bu
yöntemde yaşam süresi bağımlı değişken, yaşam süresi üzerinde etkisi olduğu düşünülen değişkenler ise
bağımsız
değişkenler
fonksiyonlardan
olarak
yararlanılarak
adlandırılmaktadır.
ilgili
Yaşam
değişkenlerin
süresinin
hastalık
ve
tahminlenmesinde
yaşam
süresi
exponansiyel
üzerindeki
riskleri
belirlenebilmektedir [2]. Cox regresyonun yapılabilmesi için yerine getirilmesi gereken bazı varsayımlar
sözkonusudur. Bu varsayımlar genellikle tahminleme yapmayı güçleştirmektedir. Bu nedenle son yıllarda daha
esnek yapıda olan sınıflandırma yöntemleri geliştirilmiştir. Segal yaşam ağaçlarının oluşturulmasında log-rank
istatistikleri gibi parçalı fonksiyon kullanmıştır [3]. Davis ve Anderson exponansiyel yaşam ağaç modelini
oluşturmak için exponansiyel log likelihood parçalı kriterini kullanmıştır [4]. Leblanc ve Crowley relatif risk
ağaç modelini geliştirmişlerdir [5]. Son zamanlarda Ishwaran ise Random Forests sınıflandırma yönteminin
yaşam analizlerine uyarlaması olan Random Survival Forests yöntemini oluşturmuştur [6]. Türkiye’de ise
Ömürlü ve arkadaşları Random Survival Forests yöntemi ile Cox regresyon yöntemini beş bağımsız değişkenli
türetilmiş verilerde ve meme kanserli hastalarda karşılaştırmışlardır [7].
Bu çalışmada farklı senaryolarda türetilmiş düşük ve yüksek boyutlu veri setlerinde ayrıca Erciyes Üniversitesi
Onkoloji hastanesinin farklı birimlerinden alınacak gerçek veri setlerinde iki yöntem karşılaştırılacaktır. Bu
çalışmanın sonunda belirli bir hastalıktan dolayı tanı konmuş bireyler için kişiye özel daha az hata ile yaşam
süresi tahminlemesi yapılması hedeflenmektedir.
1.
Cox D. R. Regression models and life-tables, Journal of the Royal Statistical Society, Series B, 1972;
34: 187-220.
2.
Cox D. R., Oakes D. Analysis of Survival Data, New York: Chapman and Hall; 1984.
3.
Segal, M. R. Regression Trees for censored data. Biometrics. 1988; 44 (1): 35-48.
4.
Davis, R., Anderson, J. Exponential survival trees. Statistics in Medicine. 1989; 8: 947-961.
5.
Leblanc, M., Crowley, J. Relative risk trees for censored survival data. Biometrics. 1992; 48(2): 411425.
6.
Ishwaran et al. Random Survival Forests. The Annals of Applied Statistics. 2008; Vol.2, No.3: 841-860.
7.
Omurlu I., Ture M, Tokatli F. The comparisons of random survival forests and Cox regression analysis
with simulation and an application related to breast cancer. Expert Syst. Appl. 2009; 36(4): 8582-8588.
88
P13
İneklerde Eko-Yapı Değişkenler Kullanılarak Kronik Endometritis Derecelerinin Roc Eğrisi Yöntemi İle
Belirlenmesi
1
İ. Safa Gürcan , Ayca Babak Doğukan Özen1, Aytekin Yamaç3, Özlem Güllü1
1
2,
Ankara Üniversitesi, Veteriner Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
2
Tarım ve Kırsal Kalkınmayı Destekleme Kurumu
3
Kara Harp Okulu
Özet
Roc Eğrisi, Tanı Testlerinin Performanslarının Değerlendirilmesi Ve Kıyaslanması İçin Yaygın Olarak
Kullanılan Bir Yöntemdir. Roc Eğrisi, Duyarlılık Ve Özgüllük Oranlarını Kullanarak Denekleri Sınıflarına
Ayıran En Uygun Kesim Noktasını Belirler. Sınıflamanın Doğruluğu, Roc Eğrisi Altında Kalan Alanın
Büyüklüğüne Bağlıdır. Roc Eğrisi Altında Kalan Alan, Doğru Tanı Testinin Seçiminde Kullanılan Çok Popüler
Bir Ölçüdür. Çalışma İle, Tanı Amacıyla Geliştirilen Yeni Bir Testin Hasta İle Sağlamları Ayırmadaki
Performansını, Doğruluğunu Ve Hastalık Derecelerinin Geçerli Tanı Eşiğini İncelemekte Kullanılan Roc Analiz
Yöntemini Tanıtmaktır. Bu Amaçla Uygulama Verisi Olarak, Dünyada Tanı Amacıyla Yeni Uygulanan Bir
Yöntem Olan Bilgisayar Destekli Ekostruktur Programları İle Kronik Endometritisli İneklerden Elde Edilen
Ultrasonografik Resimlerin Analiz Değerleri Kullanılmıştır. Endometritisin Değişik Derecelerinde (E1, E2, E3)
Elde Edilen Ekostruktur Değişkenler (Ortalama Gradient, Homojenite, Kontrast, Ortalama Gri Değer) İçin Tanı
Oranları Hesaplanarak, Roc Eğrisi Yöntemi İle Değişik Derecelerdeki Endometritislerin Eşik Değerleri, Tanı
Performansları Ve Doğrulukları İncelenmiştir. Elde Edilen Veriler Roc Eğrisi İle Yapılan İstatistiksel Analizin
Kronik Endometritislerin Düzeylerinin Tanınmasında Yardımcı Bir Hesaplama Yöntemi Olduğunu Göstermiştir.
Anahtar Sözcükler: Duyarlılık, Eko-Yapı Değişkenler, Kronik Endometritis, Özgüllük, Roc Eğrisi, Tanı Testi
89
P14
Hayvancılıkta Verimli Yaşam Süresi Hesaplamalarında Frailty Modellerin Uygulanabilirliği
D.Özen1, İ.S.Gürcan1, Ö.Güllü1
1
Ankara Üniversitesi, Veteriner Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Hayvancılıkta verimli yaşam süresi, hayvanın ilk yavrulamasından sürüden ayrılmasına kadar geçirdiği süre
olarak tanımlanır (Tsuruta ve ark, 2005). Bu süreye etki eden risk faktörlerinin belirlenmesi işletmelerin
ekonomik olarak devamlılığını sürdürebilmesi bakımından büyük önem taşımaktadır. Hayvancılıkta verimli
yaşam süresine etki eden risk faktörlerinin hesaplanmasında sıklıkla cox orantılı riskler modeli kullanılmaktadır.
Bununla birlikte bu tür çalışmalardaki denekler genellikle kümelenmiş olup birbirleriyle ilişkili olma
eğilimindedirler. Ayrıca hayvanlar arasında verimli yaşam sürelerini etkileyen ölçülemeyen genetik faktörler ve
gözlemlenmemiş biyolojik varyasyonlar vardır ve bu durum hayvanlar arasında heterojenlik yaratmaktadır. Bu
çalışmada amaç frailty modeller hakkında bilgi vererek cox orantılı regresyon modelleri yerine frailty modellerin
hayvancılıkta verimli yaşam süresinin hesaplanmasında uygulanabilirliğini göstermektir.
Anahtar Kelimeler: Verimli Yaşam Süresi, Frailty Modeller, Cox Regresyonu
90
P15
Etçi Piliçlerde Karkas Özelliklerinin Temel Bileşenler Analizi ile Değerlendirilmesi
Aytaç Akçay1, Mustafa Uğurlu2, Akın Yakan3, Fatih Atasoy4
1
2
Erciyes Üniversitesi Veteriner Fakültesi Biyometri AD., Kayseri, Türkiye
Ondokuz Mayıs Üniversitesi Veteriner Fakültesi Zootekni AD., Samsun, Türkiye
3
Mustafa Kemal Üniversitesi Veteriner Fakültesi Zootekni AD., Hatay, Türkiye
4
Ankara Üniversitesi Veteriner Fakültesi Zootekni AD., Ankara, Türkiye
Özet
Amaç: Bu araştırma, etçi piliçlerde karkas parçalarının Temel Bileşenler Analizi (TBA) ile değerlendirmek
amacıyla yapılmıştır.
Gereç ve Yöntem: Uygulamada kullanılan veriler Atasoy ve ark. (2010) tarafından Ankara Üniversitesi
Veteriner Fakültesi Uygulama Çiftliğinde yürütülen çalışmadan elde edilmiştir. Atasoy ve ark. (2010)
araştırmalarında, 360 adet 1 günlük erkek ve dişi civcivi, kontrol (K), deneme 1 (D1) ve deneme 2 (D2)
gruplarına ayırmıştır. Bu çalışmada sadece kontrol (K) grubunu oluşturan 114 adet etçi piliç kullanılmıştır.
Piliçlere 1-10. günlerinde % 23.10; 11-31. günlerinde % 21.80, 32-47. günler arasında % 18.40 ham proteinli
rasyon uygulanmıştır. Rasyonların enerjisi yaklaşık 3100 kcal/kg ME olacak şekilde sabit tutulmuştur. Deneme
süresince yem ve su adlibitum olarak verilmiştir. Çalışmada, Etçi piliçlerde yetiştiricilik ve ıslahta önemli olan
karkas özellikleri arasında amaçlı ilişkiyi anlamak ve özellik sayısını azaltmak için Temel Bileşenler Analizi
(PCA=Principal Component Analysis) kullanılmıştır. Bu analizde canlı ağırlık, soğuk karkas, göğüs, but, kanat,
boyun, karaciğer, mide, kalp ve abdominal yağ ağırlıkları olmak üzere toplam 10 özellik değerlendirilmiştir.
Bulgular: Temel bileşenler analizi ile karkas özellikleri bağımsız gruplara ayrılmış, on değişken ayrıntılı olarak
irdelenmiştir. Öncelikle, TBA’ nın uygulanması için tüm korelasyonların sıfıra eşittir boş hipotezi test etmek
amacı ile Bartlett küresellik testi yapılmıştır. Bartlett küresellik testi değeri 409.4 bulunmuş ve bu değer veri
setinin TBA’ya uygun olduğunu göstermiştir (P < 0.001). Örneklem büyüklüğünün uygunluğunu gösteren
Kaiser-Meyer-Olkin (KMO) değeri 0.886 olarak hesaplanmıştır. TBA sonucunda, ilk beş temel bileşenin toplam
varyansın % 80.4’lik bölümünü oluşturduğu ve birinci temel bileşenin tek başına toplam varyansın % 42.3
açıklayabildiği tespit edilmiştir. Karkas özellikleri ile birinci temel bileşen arasındaki korelasyonların tümü
pozitif ve yüksek bulunmuştur. Toplam varyansta en yüksek paya canlı ağırlık, soğuk karkas, göğüs, but sahip
olmuştur. İkinci, üçüncü, dördüncü ve beşinci temel bileşenler için, en büyük korelasyonlar sırasıyla boyun
(0.95), abdominal yağ (0.98), karaciğer (0.97) ve taşlık (0.93) arasında gözlemiştir. Ve ayrıca, bu temel
bileşenler sırasıyla toplam varyansın yaklaşık % 11.7, % 10.7, % 8.4 ve % 7.2 bölümünü açıklamışlardır.
Sonuç: Bu çalışmanın amacı, etçi piliç yetiştiriciliğinde kullanılmak üzere temel bileşenler elde etmek değil,
karmaşıklığını azaltmak için orijinal özelliklerinin doğrusal bir kombinasyonunu elde etmenin mümkün
olduğunu göstermek için yapılmıştır. Sonuçta, ilişkili özellikleri gruplandırarak hayvan yetiştiriciliğinde dikkate
alınması gereken özelliklerin sayısında ciddi bir azalma sağlayan temel bileşenler analizinin, toplam varyansı
değerlendirmede ve anlamada kullanılabilecek bir araç olduğu görülmüştür.
Anahtar Kelimeler: Etçi Piliç, Karkas, Temel Bileşenler Analizi
91
P16
Tahmin Modellerinin Performanslarının Değerlendirilmesi
Özlem Güllü1, Mustafa Agâh Tekindal2, Doğukan Özen1, İ.Safa Gürcan1, Yasemin Genç3
1.
Ankara Üniversitesi Veteriner Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
2.
Başkent Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
3.
Ankara Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Sağlık alanında yaygın olarak kullanılan tahmin modelleri, hastalığın izlenmesi ve zaman içinde gelişiminin
ilerdeki evrelere göre tahmin edilmesi, tanı konması ve uygun tedavi yöntemine karar verilebilmesi için risk
gruplarının (düşük,orta,yüksek vs.) belirlenmesi gibi muhtelif amaçlar için kullanılır. Tahmin modellerinin
güvenilirliğinin belirlenmesindeki temel istatistiksel yaklaşım tahmin edilen değerlerin gerçek değerlere ne kadar
yakın olduğunun belirlenmesidir. Başka bir deyişle, iyi bir model, yüksek risk grubu içinde olan hastalar ile
düşük risk grubu içinde olan hastaları doğru şekilde ayırt etmelidir.
Bu çalışmada model performansını değerlendirmede kullanılan klasik ölçülerin ve son yıllarda geliştirilen yeni
ölçülerin özellikleri tanıtılmıştır. Tahmin modellerinin doğruluğunun ve performansının değerlendirilmesi
konusunda gelecekte yapılabilecek çalışmalar için bir değerlendirme yapmak için yol gösterici olacaktır.
İstatistiksel tahmin modellerinin performansının değerlendirilmesinde kullanılan ölçüler klasik ve yeni olmak
üzere iki temel grup olarak belirlenmiştir. Klasik ölçüler, Açıklanan Değişim (R2), Brier skoru, Ayırt Etme
(Discrimination) ve Kalibrasyon (Calibration) ölçüleridir. Son yıllarda önerilen yeni ölçüler ise Tekrar
Sınıflandırma Tabloları (Reclassification), NRI (Net Reclassification Improvement) ve IDI (Integrated
Discrimation Improvement) olarak sıralanabilir.
Geliştirilen birçok istatistiksel tahmin modeline rağmen mevcut bir modele yeni bir tahmin edici eklendiğinde
tahmin modelinin performansının nasıl değerlendirileceğiyle ilgili ortak bir karara varılmamıştır (Pencina,2008).
Modelin ayırt edebilirliğini ölçmede sıklıkla ROC (receiver operating characteristic curve) eğrisi altında kalan
alan (AUC) ya da c istatistiği kullanılmaktadır (Cook,2007). Son zamanlarda bu metotların bazı kısıtlamaları
olduğu ve yeni eklenen bir tahmin edicinin yararlılığının değerlendirilmesinde yeteri kadar açıklayıcı olmadığı
klinik ve epidemiyolojik çalışmalarda tartışılmaktadır (Cui,2009).
Özellikle ROC eğrisinin, prognaztik modellerde, risk tahminlerindeki değişime karşı hassas bir yöntem olmadığı
söylenmektedir (Cook ve Paynter,2011). Bu hassasiyet problemine karşı tekrar sınıflandırma tablolarının
kullanılması önerilmiştir. Yeni eklenen bir değişkenin modele katkısı AUC ya da c istatistiğine göre çok küçük
ve önemsiz görünürken, tekrar sınıflandırma yapıldığında aynı değişkenin katkısının çok daha önemli olabileceği
görülmüştür. Bu durumda modele yeni eklenen bir tahmin edicinin modele net katkısının hesaplanmasında ve
hastaların risk kategorilerine daha doğru bir şekilde ayırt edilmesinde AUC’nin yanı sıra tekrar sınıflandırma
tablolarının da kullanılması gerektiği önerilir (Steyerberg ve ark.,2010). Sonuç olarak çalışmaların
güvenilirliklerinin arttırılmasının yanında deneme için ayrılan zaman ve kaynağın da israf edilmesinin önüne
geçilebilecektir.
92
Anahtar Kelimeler: İstatistiksel Tahmin Modelleri, ROC Eğrisi, AUC, C İstatistiği, Tekrar Sınıflandırma
Tabloları, Ayırt Edebilirlik Ölçümü, Model Performansı Değerlendirme
Kaynakça
Cook,N.R., BuringJ.E., ve
Ridker, P.M.(2006). The Effect of Including C-Reactive Protein in
Cardiovascular Risk Prediction Models for Women, Annals of Internal Medicine,145:21-29
Cook,N.R.(2007). Use and Misuse of the Receiver Operating Characteristic Curve in Risk Prediction,Journal of
American Heart Association, 115:928-935
Cook, N.R., Paynter,N.P.(2011). Performance of reclassification statistics in comparing risk prediction models,
Biometrical Journal, 53:2, 237–258
Cui, J.(2009). Overview of Risk Prediction Models in Cardiovascular Disease Research, Ann Epidemiol,
19:711–717
Gu,W., Pepe, M.S.(2009). Measures to Summarize and Compare the Predictive Capacity of Markers, UW
Biostatistics Working Paper Series University of Washington, p:342
Pencina, M.J., D’Agostino Sr, R.B., D’Agostino Jr, R.B., ve ark.(2008). Evaluating the added predictive ability
of a new marker: From area under the ROC curve to reclassification and beyond, Statistics In Medicine
,27:157–172
Pepe, M.S., Fengi,Z., Huang, Y., ve ark.(2007). Integrating the Predictiveness of a Marker with Its Performance
as a Classifier, American Journal of Epidemiology ,Vol. 167, No. 3
Pepe, M.S.(2011). Problems With Risk Reclassification Methods for Evaluating Prediction Models. American
Journal of Epidemiology,
Steyerberg,E.W., Vickers,A.J.,Cook,N.R., ve ark.(2010). Assessing the Performance of Prediction Models:A
Framework for Traditional and Novel Measures, Epidemiology, 21: 128–138
Steyerberg,E.W.(2009). Clinical Prediction Models:A Practical Approach to Development, Validation, and
Updating, Springer, p:255-296
Tice, J.A., Cummings,S.R., Smith-Bindman,R.(2008). Using Clinical Factors and Mammographic Breast
Density to Estimate Breast Cancer Risk: Development and Validation of a New Predictive Model, Annals of
Internal Medicine ,148:337-347
Tzoulaki, I., Liberopoulos, G. ve Ioannidis, J.,PA.(2011). Use of reclassification for assessment of improved
prediction: an empirical evaluation, International Journal of Epidemiology ,40:1094–1105
Vickers,A.J, Elkin,E.B.(2006). Decision Curve Analysis: A Novel Method for Evaluating Prediction Models,
Med Decis Making, 26: 565 http://mdm.sagepub.com/content/26/6/565
93
P17
Lojistik Regresyon Analizi (Lra), Yapay Sinir Ağları (Ysa) ve Sınıflandırma ve Regresyon Ağaçları
(C&Rt) Yöntemlerinin Karşılaştırılması
Emre Kuyucu1, Ünal Erkorkmaz1, İlker Etikan1, Osman Demir 1
1
Gaziosmanpaşa Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Tokat
Özet
Amaç: Sınıflandırma uygulamalarında kullanılan pek çok model ve bu modellere ait farklı algoritmalar vardır.
Çok sayıda algoritma olması, her algoritmanın kendi içinde farklı parametrelerle çalışması, her algoritmanın
birden çok versiyonunun bulunması, farklı algoritmaların farklı amaca yönelik olması, kullanılan veri kaynağının
farklı olması, algoritmaların farklı veri tiplerini desteklemesi ve veri üzerinde yapılan önişlemlerin uygulayıcıya
bağlı olması gibi sebeplerle farklı sonuçlar elde edilmiştir. Bu sebeple algoritmaların karşılaştırılarak
değerlendirilmesi büyük önem arz etmektedir. Çalışmada Lojistik Regresyon Analizi (LRA), Yapay Sinir Ağları
(YSA) ve Sınıflandırma ve Regresyon Ağaçları (C&RT) yöntemlerinin sınıflandırma özelliklerinin
karşılaştırılması yapılmıştır.
Yöntem: Karşılaştırma için Tokat Gaziosmanpaşa Üniversitesi Sağlı Araştırma ve Uygulama Merkezi’ne
01.01.2005 tarihi ve 31.05.2011 tarihleri arasında Üroloji Polikliniği’ne başvuran hastaların sonuçları alınmıştır.
Hastalardan kesin tanısı prostat kanseri olan hastalara ait veriler kullanılmış, üç yönteme göre elde edilen
sonuçlar başarı yönünden değerlendirilmiştir. Yöntemlerin karşılaştırılması için Yeni Zelanda’daki Waikato
Üniversitesi tarafından geliştirilen WEKA istatistik paket programı kullanılmıştır.
Bulgular: Karşılaştırılan Lojistik Regresyon Analizi (LRA), Yapay Sinir Ağları (YSA) ve Sınıflandırma ve
Regresyon Ağaçları (C&RT) yöntemlerinden sınıflandırma açısından en iyi sonuçların Yapay Sinir Ağları
(YSA) tarafından sağlandığı bulunmuştur.
Sonuç: Sınıflandırma algoritmalardan hangisinin daha efektif sonuçlar ürettiği, hangi algoritmanın hangi alanda
daha başarılı olduğu sorusuna verilen cevaplar uygulamaların başarımını ve yapılan işin verimini arttıracaktır.
Anahtar Kelimeler: Sınıflandırma, Lojistik Regresyon Analizi (LRA), Yapay Sinir Ağları (YSA),
Sınıflandırma ve Regresyon Ağaçları (C&RT).
94
P18
Ergenlerde Madde Kullanımı Tutum Analizi
Serpil Sevimli Deniz1, Hayrettin Okut2, Sanem Şehribanoğlu3
1
2
Yüzüncü Yıl Üniversitesi Gevaş Meslek Yüksekokulu Öğretim Görevlisi, Van
Yüzüncü Yıl Üniversitesi Ziraat Fakültesi Zootekni Bölümü Biyometri ve Genetik , Van
3
Yüzüncü Yıl Üniversitesi Özalp Meslek Yüksekokulu Uzman, Van
Özet
Amaç: Bu çalışma ergenlerin madde kullanımına karşı tutumlarını belirlemek ve bunu etkileyen risk faktörlerini
incelemek amacıyla yapılmıştır.
Yöntem: Araştırmada Van ili Merkez ilçedeki elli ilköğretim okulu ve on lisede okuyan 13-18 yaş grubundaki
ergenlerin madde kullanımına yönelik tutumlarını belirlemek amacıyla aşağıdaki sorulara,
Araştırmaya katılan ergenlerin:
1.Genel demogrofik özellikleri nasıldır?
2.Madde kullanımına karşı tutumlarını etkileyen faktörler ne düzeydedir?
3. Doğrulayıcı Faktör Analizi ile faktörler arasında anlamlı ilişkiler olup olmadığına yanıt aranmıştır.
Bulgular: 413 erkek, 249 kız olmak üzere 662 ergen üzerinde yapılan çalışmada ergenlerin madde kullanım
tutumunu ölçmek için uygulanan ankette “aşağıdaki ifadelere ne ölçüde katılırsınız” başlıklı 24 sorudan oluşan
soruyu oluşturan sorulara verilen cevaplar, yapılan faktör analizi sonrasında üç alt faktör altında toplanmıştır. Bu
bölümle ilgili yapılan KMO (Kaiser-Meyer-Olkin) testinin sonucunda %99.41 gibi yüksek bir oran elde edilmiş
olup, ankete faktör analizi uygulanabilir olduğunu göstermektedir. Elde edilen faktörlerin toplam varyansı
açıklama yüzdesi %80.07’dir. Cronbach’s Alpha değeri 0.94 bulunmuştur. Yapılan analiz sonrasında birinci
faktörü oluşturan maddeleri “ailenin tutumu”, ikinci faktörü oluşturan maddeleri “sosyal bakış” ve üçüncü
faktörü oluşturan maddeleri de “yaşıt bakışı “ olarak ifade etmek mümkündür.
Sonuç: Ergenlerin madde kullanımına tutumu değerlendirilirken üç boyut öne çıkmaktadır. Bu üç boyut aile,
çevre ve yaşıtlardır.
Anahtar Kelimeler: Faktör Analizi, Madde Kullanımı, Ergen
95
P19
Poisson Regresyon ve Sağlık Alanında Bir Uygulaması
Esra Gültürk1 , Sibel Şener2
1
2
Cumhuriyet Üniversitesi, Tıp Fakultesi, Biyoistatistik ABD
Cumhuriyet Üniversitesi, İ.İ.B.F, Yönetim Bilişim Sistemleri
Özet
Poisson Regresyonu, bağımlı değişken sayılabilir olduğu durumlarda kullanımı tercih edilen bir modeldir.
Verilerin sürekli olduğu durumlarda doğrusal regresyon analizi kullanılabilmektedir. Ancak analizlerde
kullanılacak veriler her zaman sürekli halde bulunmayabilir. Bu gibi durumlarda yani; verilerin kesikli olması
durumunda da doğrusal regresyon modelleri kullanılarak yapılacak analizler etkisiz, tutarsız, ve çelişkili sonuçlar
verecektir. Bu sebepten dolayı kesikli veriler için tüm koşullar sağlandığında kullanılabilecek en etkin model
Poisson Regresyon modellerdir.
Bu çalışma Cumhuriyet Üniversitesi Tıp Fakültesi Yeni Doğan Ünitesindeki Premature babek sayıları üzerinde
etkili olan faktörleri belirlemede poisson regresyon analizi kullanılmıştır. Ocak 2011-Aralık 2011 döneminde
aylara göre Premature bebek sayısı bağımlı değişken, Annenin Yaşı, Annenin Sigara İçme Durumu, Önceki
Gebelik Sayısı, Annenin Çalışıp Çalışmama Durumu ve Gebelik Komplikasyonları bağımsız değişken olarak
belirlenmiştir.
Anahtar Kelimeler: Premature, Poisson Regresyon, Kesikli Değişken
Esra Gültürk:e-mail: [email protected]
96
P20
Genetik Risk Skoru Dağılımını Etkileyen Faktörler
Bahar Taşdelen1, Havva Didem Ovla1
1
Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Mersin
Özet
Amaç: Bu çalışmada, genom çaplı ilişki (genome wide association) çalışmalarında kullanılan tek nükleotid
polimorfizmleri (single nukleotid polymorphism, SNP) ile sonuç değişkenler arasındaki ilişkilerin
değerlendirilmesinde kullanılan genetik risk skorunun dağılımını etkileyen faktörlerin belirlenmesi
amaçlanmıştır.
Yöntem: Genetik epidemiyolojide, belirli bir hastalığa ait aile öyküsüne sahip ve genetik olarak yüksek risk
grubundaki bireyler dikkate alınır ve bu bireylerde hastalıkla ilişkili olabilecek farklı genetik varyantlar
değerlendirilir. En yaygın görülen genetik geçişli hastalıklar arasında, kardiyovasküler hastalıklar, kanser,
diyabet, astım, nörolojik bozukluklar ve son yıllarda tüm dünyanın sorunu haline gelen obezite yer almaktadır.
Hastalık-genetik ilişkisini değerlendirmek amacıyla genetik epidemiyolojide, hasta ve sağlıklı bireylerin DNA
yapılarını karşılaştıran, genom çaplı ilişki çalışmaları yapılmaktadır. Bu tip çalışmalarda özellikle, üzerinde
durulan hastalık ile SNP’ ler arasındaki ilişki değerlendirilir. Kompleks hastalıklar çalışılırken, genellikle fenotip
üzerinde etkili olduğundan şüphelenilen çok sayıda SNP ile çalışılır. Bu durumda, bir SNP diğerinin etkisini
maskeleyebilir veya değiştirebilir (epistatik etki). Üzerinde durulan özelliğe etkisi olduğu düşünülen, birden çok
SNP ile çalışılırken, farklı yaklaşımlar mevcuttur. En çok bilinen yöntem, SNP’ leri aynı modele koymaktır. Bu
yöntemin başarısı SNP sayısına ve örnek genişliğine bağlıdır. Ayrıca minör allel frekansları düşükse homozigot
mutantları görebilmek için gerekli örnek genişliği daha da fazladır. Bu tip sorunların önüne geçmek için önerilen
yöntem SNP’ leri birleştirerek genetik risk skoru (GRS) hesaplamaktır. Bunun için kullanılan iki yöntem
mevcuttur: Basit sayma metodu ile GRS hesaplama ve ağırlıklandırılmış GRS hesaplama metodu. Genetik risk
skoru kullanılarak hastalık bakımından risk grupları belirlenirken, öncelikle kontrol grubuna ait GRS
değerlerinin dağılımı incelenir ve bu dağılıma ait çeyreklikler hesaplanır.
Bulgular: Genetik risk skoru hesaplarken akla gelen sorulardan bazıları: Kaç SNP yeterli? Örnek genişliği en az
kaç olmalı? Minör allel frekansından ne kadar etkileniyor? Veri dönüşümü yapmadan kullanılabilir mi? Veri
dönüşümü gerekliyse hangi dönüşüm yapılmalıdır? Bu sorulara yanıt bulmak amacıyla yapılan çalışmada, her
biri üç genotip grubuna sahip farklı sayıda SNP’ ler (k=5, 10, 20, 50, 100, 100+) için minör allel frekansının
düşük (≤0.20) ve yüksek (>0.20) olduğu durumlarda örnek genişliğine bağlı olarak SNP dağılımları
incelenmiştir.
Sonuç: Genetik risk skorunun minör allel frekanslarından etkilendiği ve sağa çarpık dağılım gösterdiği
belirlenmiştir. Bu durumda genetik risk skoru ile sonuç değişken arasındaki ilişkinin veri dönüşümü yapıldıktan
sonra değerlendirilmesinin daha uygun olacağı düşünülmektedir.
Anahtar Kelimeler: Genetik risk skoru, minör allel frekansı, veri dönüşümü, genetik epidemiyoloji.
97
P21
AB/BA Çapraz Geçişli Denemelerinde Tip I Hata Oranı ile İlişkili Faktörler
Didem Derici1, Bahar Taşdelen1
1
Mersin Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıbbi Bilişim AD, Mersin
Özet
Amaç: Klinik araştırmalarda en sık kullanılan deneme düzenlerinden biri çapraz geçişli denemelerdir. Tedavi
etkinliğini araştırmak amacıyla, tedavilerin bireylere sırayla verildiği deneme düzenleridir. Genellikle kronik ve
durağan hastalıklar için kullanılmaktadır. Çapraz geçişli denemelerin en önemli avantajları birey içi karşılaştırma
sağlaması ve daha az birey ile çalışılmasına rağmen yüksek güce sahip olmasıdır. Fakat istatistiksel analizi diğer
deneme düzenlerine göre daha karmaşıktır. En sık kullanılan çapraz geçişli deneme düzeni AB/BA dizaynıdır.
Bu çalışmanın amacı, AB/BA çapraz geçişli denemelerde örnek genişliği, periyotlar arası ilişki ve her bir
sıradaki eksik gözlem oranının Tip I hata oranı üzerine etkisini incelemektir.
Yöntem: Bu çalışmada AB/BA dizaynı için her bir sıradaki örnek genişliği n=5,10,20,30, periyotlar arası ilişki
r=0,0.95,0.99 ve eksik gözlem oranı p=0,%10,%25,%40,%50 olmak üzere oluşturulan her bir kombinasyon için
SAS programında MVN makrosu ile üretilen ve tamamen rastgele olarak eksiltilen veriler genel doğrusal
modeller ile analiz edilmiş ve bu işlem 1000 kere tekrarlanmıştır.
Bulgular: Yapılan simülasyon çalışması sonucunda tam veri olması durumunda Tip I hata oranı en düşükken,
eksik gözlem oranı arttıkça Tip I hata oranı da artmaktadır. AB/BA dizaynlarında örnek genişliği arttıkça Tip I
hata oranı azalmaktadır. Simülasyonların tümü birlikte değerlendirildiğinde Tip I hata oranı üzerinde korelasyon
ve örnek genişliğinin etkisinden daha çok eksik gözlem oranının etkili olduğu gözlenmiştir.
Sonuç: AB/BA dizaynında bireylerin kendi kendinin kontrolü olmasından dolayı küçük örnek genişliği ile etkili
sonuçlar elde edilebileceği görülmüştür. Çalışmamızda eksik gözlem oranının sıralarda eşit olduğu durum
değerlendirilmiş olup, literatüre benzer sonuçlar elde edilmiştir. Çapraz geçişli denemeler, tek bir merkezde
çalışıldığında yeterli güce sahip tek deneme düzeni olması, her birey üzerinde her tedavinin uygulanmasından
kaynaklı bireysel etkilerin elimine edilmesi sebebiyle Amerikan Gıda ve İlaç Dairesi tarafından yayınlanan
kılavuzlarda önerilen tek deneme düzeni olduğundan klinik çalışmalarda güvenle kullanılabileceği görülmüştür.
Anahtar Sözcükler: Çapraz geçişli denemeler, AB/BA dizaynı, örnek genişliği, eksik gözlem oranı ve
periyotlar arası ilişki
98
P22
Sınıflama Metotlarında Yeni Bir Yaklaşım: Çok Değişkenli Eklemeli Regresyon Ağaçları (MART)
Gülhan Orekici Temel1, Handan Ankaralı2, Semra Erdoğan1, Aynur Özge3
1
Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Mersin
2
Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Düzce
3
Tıp Fakültesi, Nöroloji AD, Mersin
Özet
Amaç: Bu çalışmanın amacı, sınıflama ve regresyon ağaçlarının stokastik gradient boosting yöntemi kullanılarak
genellenmiş hali olan Çok Değişkenli Eklemeli Regresyon Ağaçları (Multivariate Additive Rregression Trees,
MART) yöntemini bir nöroloji veri seti üzerinde tanıtmaktır.
Yöntem: Model zayıf sınıflayıcıları ardışık olarak birleştirerek bir eklemeli model oluşturur. Model bir tür
ağaçlar serisi olarak düşünülebilir. Her ağaç bir önceki ağaçtan beslenerek gelişerek daha homojen ağaç şeklini
alır. İterasyona dayalı danışmanlı öğrenme yöntemlerinden birisidir. Bu modelde bağımlı ve bağımsız
değişkenler sürekli ya da kategorik yapıda olabilirler. Uygulamada Mersin Üniversitesi Tıp Fakültesi Nöroloji
Anabilim Dalı Elektrofizyoloji Laboratuvarına 2006-2010 tarihleri arasında Karpal Tünel Sendromu (KTS) ön
tanısı ile başvuru yapan bireyler çalışmaya alınmıştır. Veri seti toplam 4076 vakadan oluşmaktadır. Toplam 4076
vakadan 3250 vaka (2393 KTS+857 Sağlıklı) eğitim verisi, kalan 826 vaka ise (618 KTS+208 Sağlıklı) test
verisi olarak seçilmiştir. Yapılan 16 elektrofizyolojik ölçüm bağımsız değişken olarak alınmıştır. Bu
değişkenlerin bir bölümü kategorik ve bir bölümü de sürekli yapıdadır. Bağımlı değişken olarak da KTS hastası
olup olmama durumu alınmıştır. MART uygulaması Salford Predictive Modeler Builder v6.6 programında
yapılmıştır.
Bulgular: Yapılan analiz sonucunda modelin doğru sınıflama başarısına ve değişkenlerin önemlilik oranlarına
bakılmıştır. Eğitim verisi kullanılarak modelin doğru sınıflama başarısı % 94 bulunmuş ve test verisi kullanılarak
ise modelin genel doğru sınıflama başarısı % 93 olarak hesaplanmıştır. Ayrıca eğitim verisi kullanıldığında son
modelin sensitivitesi ve spesifitesi ise sırasıyla % 89.2 ve % 95.9, test verisi kullanıldığında % 88 ve % 94.8
olarak hesaplanmıştır.
Sonuç: Modelin tahmin doğruluğu, yapay sinir ağları da dahil olmak üzere diğer makine öğrenme
algoritmalarını kullanan yöntemlere göre eşit ya da daha yüksektir. Modelde değişkenlerle ilgili herhangi bir
varsayımının olmaması, Huber M kayıp fonksiyonunu kullanarak modelin aşırı uyuma karşı koruma sağlaması,
uç değerlerden, interaksiyonlardan etkilenmemesi modele üstünlük sağlar. Model eklemeli ağaç modeli
olduğundan ağaçlar seridir. Bu nedenle tek bir ağaç olarak görüntülenemez. Bu durumda modelin dezavantajı
olarak düşünülebilir.
Anahtar Kelimeler: Çok Değişkenli Eklemeli Ağaçlar, İlaveli Model, Huber M Kayıp Fonksiyonu
Gülhan Orekici Temel: MEÜ. Çiftlikköy Kampüsü, Tıp Fakültesi Dekanlık Binası, Biyoistatistik ve Tıbbi
Bilişim AD., Mersin/Türkiye. E-Posta: [email protected] Tel: 0 324 3610684 Cep: 0 533 615 32 41
Fax: 0 324 341 24 00
99
P23
Boylamsal İki Durumlu Cevap Değişkeni İçin Genelleştirilmiş Tahmin Denklemi ve Kuadratik Çıkarım
Fonksiyonu Yöntemlerinin Karşılaştırılması: Kolon Kanseri verisi üzerine bir uygulama
Anıl Aktaş Samur1, İbrahim Goktas2, Osman Saka1
1
Akdeniz Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Antalya
2
Akdeniz Üniversitesi, Tıp Fakültesi, Dâhiliye Anabilim Dalı, Antalya
Özet
Boylamsal çalışma tasarımları, klinik denemelerde ve gözlemsel çalışmalarda özellikle tedavi etkisinin
belirlenmesi gibi zamanla değişen durumlarda sıklıkla kullanılmaya başlanmıştır. Boylamsal veriler, aynı
denekten farklı zaman noktalarında çoklu gözlemlerin alındığı ve deneklerin kendi içinde ilişkili olduğu
verilerdir.
Bu ilişkiler, veri yapısına uygun analiz yöntemlerin uygulanmasını gerektirir. Önerilen birkaç
yöntemden biri Genelleştirilmiş Tahmin Denklemi (GTD), diğeri Kuadratik Çıkarım Fonksiyonu (KÇF) dur.
Yöntem: GTD, boylamsal ilişkili verilerde sıklıkla kullanılan istatistiksel bir yöntemdir. GTD yaklaşımı,
gözlemler ilişkili olduğunda daha etkili ve yansız regresyon katsayılarının tahmini için geliştirilmiş bir
yöntemdir. Ölçümlerin sürekli olmasının yanı sıra sayılabilir ya da kategorik olması durumunda da sıklıkla
kullanılır. KÇF, GTD yaklaşımının alternatifi olarak geliştirilmiş yeni bir yöntemdir. GTD gibi yarı-olabilirlik
yaklaşımına dayanmaktadır. GTD yaklaşımında olduğu gibi korelasyon yapısı doğru tahmin edilmese bile tutarlı
parametre tahminleri verir.
Amaç: Çalışmada, kolon kanseri olan hastaların kemoterapi aldıktan sonra hemoglobin düzeylerinin düşüşü ile
ilgili olarak örnek bir veri seti kullanılmıştır. Kolon kanseri tanısı konulan hastalar 3’er aylık periyotlarda
kemoterapi aldıktan sonra kan değerleri ölçülmüş ve bazı hastaların hemoglobin değerlerinde düşüşler
gözlenmiştir. Bu çalışmada amaç, hasta verilerine GTD ve KÇF yöntemlerinin uygulanarak iki yöntemden elde
edilen sonuçlarının değerlendirilmesi ve ayrıca hastalarda hemoglobin değerinin düşüşüne neden olan faktörleri
belirlemektir.
Sonuç: Çalışmada, kemoterapi alan 31 hasta bulunmaktadır. Bu hastaların %71 erkek, % 64.5’ unda rektum ve
çevresinde tümör bulunmakta, %54.8’ inde tek organa metastaz yapmıştır. Verilere GTD ve KÇF yöntemi için
AR (1) korelasyon yapısı uygulanarak parametre tahminleri ve standart hataları elde edilmiştir. İncelenen
değişkenler açısından GTD analizine göre sadece metastaz yapma (3 farklı organ) durumu (p=0.0159) etkili
iken, KÇF yöntemine göre cinsiyet (kadın) (p=0.013) ve metastaz yapma (3 farklı organ) (p=0.006) hemoglobin
düşüklüğünde daha etkili bulunmuştur. Sonuç olarak KÇF yöntemi, GTD yöntemine göre daha etkili parametre
tahminleri ortaya koymaktadır (GE=1.13)
Anahtar Kelimeler: Genelleştirilmiş Tahmin Denklemi, Kuadratik Çıkarım Fonksiyonu, İlişkili Veriler
100
P24
Prostat Spesifik Antijeni Yardımı İle Prostat Kanserinin Değişik Yapay Sinir Ağı Modelleri İle Tahmini
Mehmet Onur Kaya1, Cemil Çolak2, Enver Özdemir3
1
2
Fırat Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Elazığ
İnönü Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Malatya
3
Fırat Üniversitesi, Tıp Fakültesi, Üroloji AD, Elazığ
Özet
Amaç: Bu çalışmada, prostat spesifik antijeni (PSA) değerlerinin yardımıyla prostat kanseri olan ve prostat
kanseri olmayan vakaların yapay sinir ağları (YSA) modelleri yardımıyla tahmin edilmesi amaçlanmıştır.
Gereç ve Yöntem: Çalışma, geriye yönelik veri toplama yöntemi ile 203 erkek bireye ait olup, Gazi Üniversitesi
Tıp Fakültesi Üroloji Anabilim Dalı Polikliniği’nden sağlanmıştır. Prostat kanserinin oluşumuna ilişkin PSA
tipleri ve prostat kanserinin tanısında kullanılan değişkenler incelenmiştir. YSA, değişik eğitim algoritmaları
kullanılarak eğitilmiştir. Girdi katmanında 9 işlem elamanı kullanılmıştır. Bu giriş elemanları; yaş, DRE
(Parmakla Rektal Muayene), TPSA (Toplam Prostat Spesifik Antijen), fPSA (Serbest Prostat Spesifik Antijen),
f/t (Serbest PSA/ Toplam PSA oranı), Tvolüm (Toplam Hacim), TZvolüm (Transizyonel Zon Hacmi), PSAD
(Prostat Spesifik Antijen Dansitesi), TZPSAD (Transizyonel Zon Prostat Spesifik Antijen Dansitesi)
değişkenleri idi. Çıktı katmanındaki değişken ise PSA değerlerine göre prostat kanseri olup olmaması idi.
Değişik YSA modelleri ve öğrenme algoritmaları denenerek, en iyi sonuç elde edilmeye çalışılmıştır. Tahmin
edilen her bir farklı model için değişik sayıda örnekler eğitim, doğrulama ve test için kullanılmıştır. YSA
modelleri, ileri beslemeli geriye yayılımlı ağ (feed-forward back propogation) kullanılarak tahminde
bulunulmuştur.
Bulgular: Çalışmadaki YSA modelleri arasında, en iyi YSA modeline ait açıklayıcılık katsayısı (R2) 0.75 ve
hata kareler ortalaması (MSE) 0.07 olarak bulunmuştur. Çalışmadaki diğer YSA modellerinin R2 ve MSE
değerleri ise sırasıyla; 1. model için 0.72 ve 0.09, 2. model için 0.66 ve 0.15, 3. model için 0.61 ve 0.14, 4. model
için 0.49 ve 0.15 olarak elde edilmiştir.
Sonuçlar: Bazı klinik tanı testleri (PSA gibi), tanı ve teşhis sürecinde çok etkili sonuçlar verememekle beraber,
getirdikleri maddi külfetlerin yanı sıra zaman kayıplarına da sebep olabilmektedirler. Ayrıca bazı klasik
istatistiksel metotlar bu tip problemlerin çözümünde yeterli olamamaktadır. Bu nedenle yaptığımız çalışmada
değişik YSA modellerinin, PSA’nın yardımı ile prostat kanserinin tahmin edilmesinde daha etkili ve ümit verici
sonuçlar verebildiği anlaşılmıştır. İleriye yönelik klinik tanı sürecinde kullanılabilir olduğu görülmüştür.
Anahtar Kelimeler: Prostat Spesifik Antijeni, Yapay Sinir Ağları, Tahmin.
Cemil Çolak: E-Posta: [email protected]
101
P25
Bilgi Güvenliği Ve Kalite Yönetim Sistemleri Arasındaki İlişkinin İncelenmesi Ve Bir Uygulaması
Necati Alasulu1, Nurhan Halisdemir2, Cemil Çolak3
1
2
3
KOSGEB, Bilgi İşlem Dairesi Başkanlığı, Ankara
Fırat Üniversitesi, Fen Fakültesi, İstatistik AD, Elazığ
İnönü Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Malatya
Özet
Amaç: Bu çalışmada, Bilgi Güvenliği Yönetim Sistemi (BGYS) ile Kalite Yönetim Sistemleri (KYS) arasındaki
ilişki incelenmiştir. KYS ve BGYS’nin entegre olarak tasarımı, kurulumu ve uygulamasının yapılması
amaçlanmıştır.
Gereç ve Yöntem: Çalışmada ilk olarak temel kalite kavramları tanımlanmış ve KYS Standardı TS EN ISO
9001:2008 ile BGYS Standardı TS ISO /IEC 27001:2005 hakkında açıklamalar yapılmıştır. BGYS’nin standart
maddeleri temel alınarak, KYS ile benzerlikleri incelenmiştir. BGYS Standardı TS ISO /IEC 27001:2005’in ana
maddeleri ve alt maddeleri tek tek uygulanmıştır. Uygulama ve veriler, bilişim sektöründe faaliyet gösteren bir
firmada yapılmıştır. Uygulama aşamasında, bu çalışmada örnek olarak alınan işletmede KYS’nin durumu analiz
edilmiş ve entegre olarak bu sisteme sonradan Bilgi Güvenliği Yönetim Sistemi’nin kurulumu ve uygulaması
yapılmıştır.
Bulgular: Çalışmada KYS Standardı TS EN ISO 9001:2008 ve BGYS Standardı TS ISO /IEC 27001:2005 için
ihtiyaç duyulan prosesler ve uygulamaları tanımlanmış ve yazılı hale getirilmiştir. Kuruluşun ana prosesleri
Yönetim Sorumluluğu Prosesi, Satın alma Prosesi, Sürekli İyileştirme Prosesi, Eğitim ve İnsan Kaynakları
Prosesi, Teknik Servis Prosesi, Tasarım Prosesi ve Sürekli İyileştirme Prosesleri olarak belirlenmiştir. İhtiyaç
duyulan proseslerinin tasarımı, sırası ve etkileşimleri entegre sistem dokümantasyonu çerçevesinde prosedürler
ve talimatlar ile belirlenmiştir. Böylece KYS ve BGYS’nin proseslerinin etkileşimi standardize edilmiştir.
Sonuçlar: Bilgi ve bilgi güvenliğinin önemi sürekli gelişen ve değişen yeni teknolojilerle birlikte artmakta ve
bilgi güvenliği yönetimi daha da karmaşık bir hal almaktadır. KYS’nin bilgi yönetim modellerini oluşturan
bilginin elde edilmesi, bilginin depolanması ve korunması, bilginin paylaşımı-kaynaklara tahsisi, bilgi
teknolojileri ve bilginin uygulanması süreçlerine katkı sağladığı sonucuna varılmıştır. Bilgi güvenliğini sağlamak
isteyen kuruluşun teknolojik olarak bilgi teknolojilerinin uygulaması, donanımsal olarak gerekli tedbirleri
almaları kurumsal bilgi güvenliğinin sağlandığı anlamına gelmemektedir. Bilgi güvenliği bir yönetim sistemi
olup sistemin tasarımı, planlanması, uygulanması ve sürekli iyileştirilmesi gerekmektedir. BGYS’nin KYS ile
entegre kurulması, sistemin etkinlik ve verimlilik ile beraber zamandan ve kaynaklardan önemli ölçüde tasarruf
sağladığı, ayrıca mevcut sistemi geliştirmenin yanında uygulamada oluşabilecek birçok probleme de çözüm
getirdiği görülmüştür. Bu nedenle Bilgi Güvenliği Yönetim Sistemi’nin Kalite Yönetim Sistemi ile entegre
kurulması önerilmiş ve karşılaşılan problemlere çözüm getirilmiştir.
Anahtar Kelimeler: Bilgi Güvenliği, Bilişim Teknolojileri, Entegre Yönetim Sistemleri, Kalite.
102
P26
Üniversite Hastanelerinde Risk Yönetimi Değişkenlerinin Logistik Regresyon Yöntemiyle İncelenmesi
İsmail Yıldız1,Yusuf Çelik1, Ömer Satıcı1, Zeki Akkuş1, Mutlu Daşdağ1, Murat Biçimli2
1
Dicle Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Diyarbakır
2
Dicle Üniversitesi Hastaneleri, Kalite ve Strateji Geliştirme Koordinatörlüğü, Diyarbakır
Özet
Bir sağlık kurumunda risk yönetiminin temel hedefi oluşabilecek her türlü zararı asgariye indirmek için gerekli
tüm önlemleri almak ve oluşabilecek zararların etkisini de olabildiğince azaltmaktır.
Kurumlar tarafından sunulan hizmetlerin ve faaliyetlerin çeşitliliği de dikkate alınarak;
Hizmet sunulmasını engelleyecek veya hizmetin kalitesini düşürecek, Hasta ve Çalışan Güvenliğini sarsabilecek,
Yolsuzluk yapılmasına meydan verecek, Mevzuata aykırılığa imkan tanıyacak, kurum içinden ya da kurum
dışından oluşan her türlü olay RİSK olarak adlandırılabilir.
Sağlık sektöründe risk değişkenlerinin belirlenmesi problemin çözümünde önemli bir aşamadır. Yapılan
çalışmaların tek değişkenli yöntemlerle değerlendirilmesi bilgi kaybına yol açar. Bu nedenle risk oluşturacak
değişkenlerin tümünü bir arada değerlendiren çok değişkenli yöntemlere gereksinim vardır. Çok değişkeni bir
arada değerlendiren ileri kompütürize yöntemler,
değişkenlerdeki bilgi bütününü bozmadan daha duyarlı
sonuçların elde edilmesine yardım eder.
Araştırmalarda önemli olan etkenler arasındaki ilişkiler dikkate alınarak, risk yönünden incelenmesidir. Bağımlı
değişken sonuç ve bağımsız değişkenlere de, bazen risk faktörleri denir. Logistik regresyonun sonuçları Odds
oranları (Odss ratios) sonuçlarını sunar. Lojistik regresyon analizi faktörlerin göreli önemlerinin sonuçlarını
belirlemek ve değerlendirmek için güçlü bir araçtır. Sözü edilen göreli önem regresyon denkleminde olduğu gibi
regresyon katsayılarının hesaplanması, ayrıca ek olarak bağımlı değişken dikkate alınarak, her bağımsız
değişkenin ne kadar risk taşıdığı bulunmaktadır. Bu riskler odds katsayıları ile verilir.
Çalışmada Lojistik regresyon modelinin sağlık sektöründe risk yönetimi konusunda sağlayacağı başarılı
çözümler ele alınarak, Dicle Üniversitesi Hastanelerinde yapılan uygulamalar detaylarıyla anlatılması amaçlandı.
Anahtar Kelimeler: Risk, Risk Yönetimi, Lojistik Regresyon, Odds Katsayısı, Sağlık Sektörü
103
P27
Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri
Funda Seher Özalp1, Derya Öztuna1
1
Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Amaç: Tek yönlü varyans analizi (ANOVA), her biri normal dağılıma sahip olan birbirinden bağımsız ikiden
fazla grup ortalamasını karşılaştırmak amacıyla kullanılır. Varyans analizi uygulayabilmek için temel
varsayımlar, örneklemlerin her birinin normal dağılım göstermesi ve varyanslarının homojen olması,
örneklemlerin rastgele olarak seçilmesi ve bağımsız olmasıdır. Varsayımların bozulması durumunda üç çözüm
yolu önerilmektedir: 1- verilerin, dönüşüm yoluyla varyans analizi tekniğine uygun hale getirilmesi, 2- verilerin,
uygun parametrik olmayan bir yöntem ile analiz edilmesi, 3- varyans analizi tekniği yerine alternatif parametrik
testlerin kullanılması. Yapılan çalışmalara göre verilere dönüşüm uygulanması, genelde iyi bir çözüm yolu
olmamaktadır. Çünkü elde edilen sonuçların yorumlanması orijinal değerler üzerinden yapılamamakta, dönüşüm
sonucu elde edilen değerler üzerinden yapılmakta ve sonuçların yorumlanması aşamasında bazı yanlış yorumlara
sebep olmaktadır. Parametrik olmayan testler ise, varyansların heterojen olmasından olumsuz yönde
etkilendikleri ve etkinlikleri de düşük olduğu için pek tavsiye edilmemektedir.
Yöntem: Bu çalışma kapsamında ANOVA’nın varsayımları sağlanmadığında uygulanabilecek alternatif
parametrik testler tanıtılacak, avantaj ve dezavantajları simülasyon çalışmalarından elde edilen sonuçlar
doğrultusunda ortaya konacaktır. Bu testlerden bazıları, Welch Testi, Değiştirilmiş (Modified) Welch Testi,
Brown-Forsythe Testi, Değiştirilmiş (Modified) Brown-Forsythe Testi, Yaklaşık (Approximate) Anova F Testi,
Cochran Testi, Marascuilo Testi ve Scott-Smith Testi’dir. Bu testlerin sağlık alanından elde edilen gerçek bir
veri seti üzerinde uygulamaları da gerçekleştirilecektir.
Bulgular ve Sonuç: Yapılan benzetim çalışmaları ile ANOVA’ya alternatif parametrik test istatistiklerinin
bazılarının üstün ve eksik yönleri ortaya konmuştur. ANOVA’nın varsayımları yerine getirilemediğinde, verilere
dönüşüm uygulamak ya da verileri parametrik olmayan yöntemlerle analiz etmek yerine, bu alternatif test
istatistiklerini kullanmak, verinin özellikleri de göz önünde bulundurularak tercih edilebilir.
Anahtar kelimeler: varyans analizi, parametrik test, alternatif test istatistikleri
Funda Seher Özalp: E-Posta: [email protected]
104
P28
Sonuç Ölçümlerinde Değişime Duyarlılığın Değerlendirilmesinde Kullanılan Yöntemler
Mustafa Emre Nakış1, Derya Öztuna1, Atilla Halil Elhan1, Burcu Yanık1
1
Ankara Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Özet
Amaç: Klinik denemelerde sonuç ölçümlerinin güvenilir(reliable),geçerli(valid) ve değişime duyarlı(responsive)
olması gerekir. Güvenilirlik; bir deneyin benzer koşullarda iki veya daha fazla kere uygulandığında ölçme
aracının aynı sonuçları üretebilmesidir. Geçerlik; bir ölçme aracının ölçmesi istenen özelliği başka özelliklerle
karıştırmadan ölçebilme yeteneğidir. Geçerlik ve güvenirliğin açık tanımları olmasına rağmen, ölçme aracının
değişime duyarlı olup olmadığının nasıl tanımlanacağı ve değerlendirileceği konusunda bir fikir birliğine
varılamamıştır. Ancak literatürdeduyarlılık, “içsel duyarlılık (internalresponsiveness)” ve “dışsal duyarlılık
(externalresponsiveness)”olarak iki farklı temel bakış açısı ile değerlendirilmektedir. İçsel duyarlılık, belirlenen
bir zaman diliminin sonunda ölçme aracının değişimi ölçebilme yeteneğidir. Dışsal duyarlılık, belirlenen bir
zaman diliminin sonunda ölçme aracında ortaya çıkan değişimin, referans bir ölçme aracındaki değişimle
ilişkisinin değerlendirilmesidir. Bu çalışmanın amacı, değişime duyarlılığın değerlendirilmesinde kullanılan
farklı yöntemlerin tanıtılması ve sağlık alanında kullanılan bir ölçek üzerinde uygulamasının yapılmasıdır.
Yöntem: Çalışma kapsamında, içsel duyarlılığın değerlendirilmesinde “eşleştirilmiş örneklerdet-testi” ve“etki
genişliği istatistiklerinin”, dışsal duyarlılığın değerlendirilmesinde “işlem karakteristik eğrisi altında kalan alan”,
“ilişki katsayısıve regresyon analizinin” kullanımına değinilecektir. Bu kapsamda sağlık alanında yaygın olarak
kullanılan bir ölçeğin değişime duyarlılığının değerlendirilmesi, yukarıda bahsedilen yöntemler üzerinden
uygulamalı olarak gösterilecektir.
Bulgular ve Sonuç: Klinik çalışmalarda kullanım kolaylığına ve etkinliğine dayanarak duyarlılık istatistiklerinin
ikiye ayrılarak tanımlanmasının avantajlı olacağıileri sürülmektedir. Çalışmalarda kullanılan duyarlılık
istatistikleri genelde içsel duyarlılıktır. İçsel duyarlılık istatistiği,hastanın ölçüm seviyesinde değişiklik söz
konusu olduğunda daha fazla önem kazanmaktadır.Dışsal duyarlılık istatistiğinin kullanımıise, çalışmanın
amacına göre belirlenmelidir.
Anahtar kelimeler: Sonuç ölçümü, güvenirlik, geçerlilik, değişime duyarlılık
Emre Nakış: E-Posta: [email protected]
105
P29
Temel Bileşenler Regresyon Analizi ve Bir Uygulama
1
Emrah Cilvez , Atilla Halil Elhan1, Derya Öztuna1, Halil İbrahim Acar2, Beyza Doğanay Erdoğan1
1
2
Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara
Ankara Üniversitesi, Tıp Fakültesi, Anatomi Anabilim Dalı, Ankara
Özet
Amaç: Çok değişkenli doğrusal regresyon analizi, sürekli ölçekle elde edilmiş bağımlı bir değişken üzerinde
etkili olan bağımsız değişkenlerin belirlenmesi amacıyla yapılan çok değişkenli bir analiz yöntemidir.Bu analizin
en temel varsayımı, bağımsız değişkenlerin birbiriyle ilişkisiz olmasıdır. Ancak bazı çalışmalarda bağımsız
değişkenler birbirleriyle ilişkili olabilir ve bu durum“çoklu bağlantı problemi” olarak adlandırılır. Çoklu
bağlantı, bağımsız değişkenlere ilişkin regresyon analizinden elde edilecek regresyon katsayıları üzerinde önemli
etkiye sahiptir. Regresyon katsayılarının hatalı olarak elde edilmesi, regresyon analizinden elde edilecek
sonuçların da yanlış yorumlanmasına neden olmaktadır. Bu çalışmanın amacı,örnek bir uygulama üzerinden
temel bileşenler regresyon analizi ile çoklu bağlantı sorununu çözmek ve en iyi regresyon denklemine
ulaşmaktır.
Yöntem: Çoklu bağlantının varlığı, en yaygın olarak ilişki katsayısı, tolerans veya varyans şişme katsayısı
kullanılarak ortaya konabilir. İki değişken arasındaki ilişki katsayısı çok yüksek ise, bu yapı, çoklu bağlantının
bir göstergesi olabilir. Tolerans değeri, seçilen bir bağımsız değişkenin diğer bağımsız değişkenlerle olan çoklu
ilişkisini gösterir ve sıfıra yakın tolerans değeri, incelenen değişkenin diğer değişkenlerin doğrusal
kombinasyonu olduğunu gösterir. Varyans şişme faktörü, tolerans değerinin tersi olup; yüksek değerli olması
çoklu bağlantı probleminin varlığını gösterir.Temel bileşenler regresyon analizinin amacı, çoklu bağlantı
probleminin olduğu değişkenlerin, temel bileşenler analizi ile ilişkili olmayan temel bileşenlere
dönüştürülmesine dayanır, bu şekliyle doğrusal regresyon ile temel bileşenler analizinin bir birleşimidir.
Standartlaştırma ile temel bileşenler regresyon denklemleri hesaplanıp en büyük düzeltilmiş R2 ve en küçük
standart hata tahminine göre en iyi denklem elde edilir. Son olarak en iyi denklem doğrusal regresyon
denklemine dönüştürülür.
Bulgular ve Sonuç: Çoklu bağlantı durumunda temel bileşenler analizi ile bağımsız değişkenler ile bağımlı
değişken arasındaki ilişki yapıları daha güvenilir olarak ortaya konmaktadır.
Anahtar Kelimeler: Çoklu Bağlantı, Temel Bileşenler Analizi, Temel Bileşenler Regresyonu
Emrah Cilvez: E-Posta: [email protected]
106
P30
Sivas’ta Diyabetik Ayak Görülme Sıklığının Bayesçi Yaklaşımla Tahmin Edilmesi
Hafize Sezer1, Sarper Yılmaz2, R. Erol Sezer3
Cumhuriyet Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Sivas
Cumhuriyet Üniversitesi, Tıp Fakültesi, Plastik Cerrahi Anabilim Dalı, Sivas
Cumhuriyet Üniversitesi, Tıp Fakültesi, Aile Hekimliği Anabilim Dalı, Sivas
Özet
Günümüzde birbiriyle rekabet halinde olan iki istatistiksel analiz yaklaşımı vardır. Frekansçı ( klasik ) ve
bayesçi yaklaşım. Bilimsel araştırmalarda son yıllara kadar klasik yaklaşım daha çok tercih edilirken
üniversitelerde matematiksel istatistik bölümlerinin kurulup gelişmesi ve bilgisayarların artan kuvveti
Bayesçilere yeni bir ivme kazandırmış ve bu yaklaşımın da sıklıkla kullanılır hale gelmesini sağlamıştır. Şimdi
de bu iki yaklaşımla ilgili hangisinin daha üstün olduğu çatışması vardır Fakat bilimsel pratik Bayesçi yaklaşıma
giderek yükselen bir pozisyon vermeye devam etmektedir.
Verinin analizinde bu iki yaklaşım arasında temel farklılıklar vardır. Frekansçı yaklaşımda olasılık tanımı relatif
frekans tanımına dayanmaktadır. Bu yaklaşıma göre bir olayın olasılığı, o olayla ilgili bir rassal deney n kez
tekrarlandıktan sonra hesaplanabilir. Bayesçi yaklaşım ise subjektif tanımı kabul eder ve bir olayın olasılığı,
olayla ilgili ön bilgi ile çalışma verisinin birleştirilmesinden elde edilir. Burada birleştirme işlemi Bayes teoremi
aracılığı ile yapılmaktadır. Frekansçı yaklaşım da popülasyon değerleri bilinmeyen fakat sabit değerler olarak
kabul edilirler. Bayesçi yaklaşım da ise; popülasyon ortalaması ve oranı gibi bilinmeyen değerler bir olasılık
dağılımına sahip olduğu kabul edilir ve parametreye verinin analizinden önce atfedilen dağılıma Önsel (Prior )
dağılım denir.Bu dağılım bir olasılık dağılımı olup, araştırıcının verisini analiz etmeden önce parametre ile ilgili
ön bilgisini (tahminini) yansıtır.Veri analiz edildikten sonra elde edilen sonuçlar ve
önsel dağılım Bayes
kuralına göre birleştirilerek yeni bir dağlım elde edilir, bu dağılıma Sonsal ( Posterior ) dağılım denir. Sonsal
dağılım da bir olasılık dağılımıdır ve. Bayesçi yaklaşımda tüm olasılıklar bu dağılım aracılığı ile hesaplanır.
Bu çalışmanın amacı Sivas’ta diyabetik ayak görülme sıklığını Bayesçi yaklaşımla tahmin etmeye çalışmaktır.
Uygulama için, Sivas’ta yapılan bir saha çalışmasında elde edilen sonuçlar kullanılacaktır. (Bu saha çalışmasında
274 diyabet hastasının 9 unda diyabetik ayak olgusuna rastlanmıştır). Tahminler WIN BUGS yazılım programı
aracılığı ile yapılacaktır.
Anahtar Kelimeler: Bayes Teoremi, Olasılık Dağılımları, Önsel Dağılım, Sonsal Dağılım Diyabetik Ayak
107
P31
Tarama İstatistikleri Ve Türkiye Ölüm İstatistikleri Üzerine Uygulamaları
Ayten Yiğiter1, Rabia Burcu Demirtürk1
1
Hacettepe Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Ankara
Özet
Amaç: Bu çalışmada tarama istatistikleri tanıtılmış ve Türkiye İstatistik Kurumu (TUİK)’nin yayımladığı
Türkiye ölüm istatistikleri kullanılarak uygulamalarına yer verilmiştir.
Yöntem: Tıbbi görüntüleme, enfeksiyon hastalıkları, kanser, kazalar, ormancılık, psikoloji, tarih, kriminoloji,
astronomi ve jeoloji vb. alanlardaki geniş uygulamaları olan tarama (scan) istatistikleri, ilgilenilen veri
kümesinde anlamlı kümelenmelerin olup olmadığının bulunmasında kullanılan bir yöntemdir. Verilerin elde
ediliş sürecine göre zamansal, mekânsal ve uzay-zaman yönünden tarama istatistikleri çeşitli olasılık dağılımları
altında tanımlanmaktadır.
Bulgular ve Sonuç: Uygulamada, TUİK’in 2006-2008 yılları arasında il ve ilçe merkezlerinde meydana gelen
ölüm olayları ve nedenleri ile ilgili veriler kullanılmıştır. Mekânsal tarama istatistikleri kullanarak ölüm
olaylarının nedenlerine göre kümelenmenin olduğu iller araştırılmıştır.
Anahtar Kelimeler: Tarama istatistikleri, mekânsal tarama istatistikleri, Türkiye ölüm istatistikleri
Kaynakça
Glaz, J., Naus, J. and Wallentein, S. 2001. Scan Statistics. Springer-Verlag Inc., 367 p., New York.
Glaz, J. and Naus J., 1983, Multiple clusters on the line, Communications in Statistics:Theory and Methods 12,
1961-1986.
Kulldorff, M., 1999, Spatial scan statistics: Models, calculations and applications. In Balakrishnan and Glaz
(eds), Recent Advances on Scan Statistics and Applications. Boston, USA: Birkhäuser.
Kulldorff, M., 1997, A spatial scan statistic. Communications in Statistics: Theory and Methods, 26:1481–1496.
Kulldorff, M. and Nagarwalla, N., 1995, Spatial disease clusters: Detection and Inference. Statistics in
Medicine,14:799–810.
108
P32
Taguchi Metodu ve Hayvancılık Alanında Uygulaması
Adile Tatlıyer1, Hikmet Orhan1
1
Süleyman Demirel Üniversitesi Ziraat Fakültesi, Zootekni Anabilim Dalı, Isparta
Özet
Bilimsel çalışmalarda sonuç değişkenine etkili olan çok sayıda faktör ve bu faktörlerin seviyelerinin de çok
olduğu denemelerde kullanılan faktöriyel düzenlemeler, deneme materyalinin daha etkili kullanılmasını
sağlamakta, ancak çok uğraş gerektiren ve uzun zaman alabilmektedir.
Taguchi metodu, ortogonal dizileri kullanarak faktöriyel düzenlemelere nazaran zaman ve maliyeti minimize
eden bir tasarım yöntemidir. Aynı zamanda deneme ünitesindeki deney sayısını azaltarak, kontrol edilemeyen
faktörlerin etkilerini de azaltmayı sağlamaktadır. Özellikle çok sayıda deneme yapılması gereken çalışmalarda
daha az sayıda deneme ile ve daha az maliyetle iyi sonuçlar verdiğinden dolayı Taguchi metodunun kullanımı
yaygınlaşmaktadır.
Bu çalışmada Erbeyli İncir Araştırma Enstitüsü Tavukçuluk ünitesinde yürütülmüş 3x3x2 faktörlü bir
araştırmanın sonuçları faktöriyel düzenleme varyans analiz modeli ve Taguchi yöntemi ile analiz edilerek
sonuçlar karşılaştırılmıştır. Çalışmada interaksiyon etkileri dikkate alınmıştır. Varyans analizinde SAS 9,
Taguchi analizinde ise Minitab 16 paket programları kullanılmıştır.
Anahtar Kelimeler: Taguchi, Deneme Planı, Hayvancılık Uygulaması
Adile Tatlıyer: E-Posta: [email protected]
109
P33
Laboratuvar Hayvanlarının Kullanıldığı Özel Deney Tasarımları ve Örneklem Hacmi
Şengül Cangür1, Handan Ankaralı1
1
Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Düzce
Özet
Amaç: Laboratuvar hayvanlarının kullanıldığı biyomedikal çalışmalarda bilimsel amaçlara ulaşabilmek için
uygun deney tasarımı ve örneklem hacmine karar verme işlemi hem etik, hem ekonomik hem de bilimsel açıdan
önem taşımaktadır. Bu çalışmada laboratuvar hayvanlarının yer aldığı araştırmalarda kullanılan Cross-over,
Switch back, Reversal, Change-over ve Latin kare tasarımları gibi özel deney tasarımları kısaca tanıtılarak
avantajlarından bahsedilmiş ve bu tip denemelerde yer alması gereken minimum denek sayısının nasıl
belirlenebileceği konusu üzerinde durulmuştur.
Yöntem: Laboratuvar hayvanları ile yapılan araştırmalarda kullanılan özel deney tasarımları simüle veriler
üzerinde kısaca tanıtılmıştır. Ayrıca uygun denek sayısına karar verirken veri yapısı, tasarım türü ve denek türü
gibi faktörleri de dikkate alarak “kaynak eşitlik yöntemi (resource equation method)”, “güç analizi (power
analysis)” ve diğer pratik yaklaşımlar açıklanmıştır.
Bulgular ve Sonuç: Laboratuvar araştırmalarında özel deney tasarımlarının bilimsel açıdan daha gerçekçi
tahminler ürettiği ve gerekli denek sayısını da en aza indirgediği vurgulanmıştır. Ayrıca etik sorunların getirdiği
kısıtlamalar da dikkate alındığı zaman, laboratuvar hayvanları ile yapılan araştırmaların farklı yer, zaman ve
koşullarda tekrar edilmesi gerekliliği ve aynı konu üzerinde yapılan araştırmaların sonuçlarının ise meta analizi
ile birleştirilmesi gerekliliği açıklanmıştır.
Anahtar Kelimeler: Cross-over, Switch back, Deney tasarımı, Örneklem hacmi, Laboratuvar hayvanları
110
P34
K-En Yakın Komşuluk, Yapay Sinir Ağları ve Karar Ağaçları Yöntemlerinin Sınıflandırma Başarılarının
Karşılaştırılması
1
Fürüzan Köktürk , M. Çağatay Büyükuysal1, Vildan Sümbüloğlu1
1
Bülent Ecevit Üniversitesi, Sağlık Bilimleri Ensititüsü, Biyoistatistik Anabilim Dalı, Zonguldak
Özet
Tıp alanında bulunan mevcut veri oldukça fazla ve hayati öneme sahiptir. Veri madenciliği teknikleri ile hayati
öneme sahip olan bu verilerden daha fazla yararlanmak mümkündür.
Veri madenciliği son yıllarda oldukça önemli bir konu haline gelmesine ve hemen hemen her alanda uygulama
sahası bulmasına rağmen ülkemizde sağlık alanında çok yaygın kullanılmamaktadır.
Bu tez çalışmasında veri madenciliği yöntemlerinden, k-en yakın komşuluk, yapay sinir ağları ve karar ağaçları
yöntemlerinin sınıflandırma başarılarının karşılaştırılması amaçlanmıştır. Bu amaçla Bülent Ecevit Üniversitesi
Uygulama ve Araştırma Hastanesi Kadın Hastalıkları ve Doğum Polikliniği’ne başvuran erken ve zamanında
doğum yapan gebelerden elde edilen veri setine bu üç teknik uygulanarak, sınıflandırma başarıları
hesaplanmıştır. Yapılan analizler sonucunda doğru sınıflandırma oranları, k-en yakın komşuluk analizi için
% 78.3, yapay sinir ağı tekniği için % 90.8 ve karar ağacı yöntemi için ise % 82.5 olarak bulunmuş ve yapay
sinir ağı tekniğinin diğer iki yönteme göre sınıflandırma başarısının daha iyi olduğu görülmüştür.
Anahtar Kelimeler: Veri Madenciliği, K-En Yakın Komşuluk, Yapay Sinir Ağları, Karar Ağaçları, Doğru
Sınıflandırma Oranı
111
P35
Küresel Sağlık İstatistiklerinin Görsel Sunumu: Gapminder Örneği
Songül Çınaroğlu1
1
Hacettepe Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, Sağlık İdaresi Bölümü
Özet
Amaç: "Açık Kaynak" kodlu yazılımlar günümüz sanal ortamında bilgi paylaşımına hız kazandıran ve birçok
şirket tarafından desteklenen yazılımlardır. Bu yazılımlar sayesinde verilere işlerlik kazandırılabilmekte ve veri
paylaşımı kolaylaşmaktadır. Aynı zamanda bu yazılımlar sanal ortamda bilgi paylaşımı ve işbirliğine de hız
kazandırmaktadır. Bu işbirliğinin bir sonucu olarak günümüzde açık kaynak kodlu yazılımlar birçok şirket
tarafından destek görmektedir. Bu araştırmada küresel sağlık istatistiklerinin gösteriminde açık kaynak kodlu
yazılım kullanımının karmaşık istatiksel verileri nasıl ilgi çekici hale getirileceğinin üzerinde durulması
amaçlanmıştır.
Gereç ve Yöntem: Bu amaca ulaşmak için bu araştırmada Hans Rosling (2005) tarafından geliştirilen ve küresel
sağlık istatistiklerinin gösteriminde kullanılan bir açık kodlu yazılım türü olan ‘Gapminder’ incelenecektir.
Sonuç ve Öneriler: Günümüzde yapılan pek çok politik tartışma küresel göstergeler üzerinden yapılmaktadır.
Burada özellikle üzerinden durulan nokta hangi tür verilerin diğerlerine göre daha fazla önem taşıdığı konusudur.
Bu noktada gelecekte daha fazla ilgi çekecek konuların başında küresel ölçekte karşılaştırmalar yapmak için açık
kaynak kodlu yazılımlardan yararlanarak kişilerin kendi istatistiksel analizlerini kendilerinin yapmaları gerektiği
konusudur. Bu konuda en iyi örneklerin başında Gapminder uygulaması gelmektedir. Bu uygulama sayesinde
istatistiksel verilerden eğlenceli bir biçimde kullanılarak küresel sağlık istatistikleri konusunda farkındalık
yaratılabilmektedir.
Anahtar Kelimeler: Küresel Sağlık İstatistikleri, Açık Kaynak Kodlu Yazılım Kullanımı, Gapminder
Songül Çınaroğlu: E-Posta: [email protected]
112
P36
Afyonkarahisar İl Jandarma ve Hava Meydan Komutanlığında Görevli Er-Erbaşların Aile Planlaması
Yöntem Kullanma Durumlarının Değerlendirilmesi
Ebru Büyükeren1,2
1
2
Afyonkarahisar Toplum Sağlığı Merkezi
Hasan Kalyoncu Üniversitesi, Sosyal Bilimler Enstitüsü, Hastane ve Sağlık Kurumları Yönetimi
Özet
Giriş-Amaç: Üreme sağlığı, aile planlamasını, güvenli anneliği, cinsel yolla bulaşan hastalıkları ve bu
hastalıkların önlenmesini kapsamaktadır. Doğurgan yaştaki tüm kadınları ve erkekleri etkileyen istenmeyen
gebelikler hem sağlıkla ilgili, hem sosyal hem de ekonomik bir sorun olarak karşımıza çıkmaktadır. Üreme
sağlığı kavramı, hem kadının hem de erkeğin gereksinimlerini içermektedir. Kadınların olduğu kadar erkeklerin
de toplumdaki statü ve rolleri üreme sağlığında önemlidir. Güvenli annelik ve üreme sağlığı konularında ebe,
hemşire, sağlık memuru gibi sağlık personelinin özellikle halkı bilgilendirmeleri gerekmektedir. Bu çalışmada,
erkek katılımının sağlanması amacıyla erkeklerin üreme sağlığı gereksinimleri göz önünde bulundurularak, ererbaşların aile planlaması yöntem kullanma durumlarının değerlendirilmesi amaçlanmıştır.
Gereç ve Yöntem: Araştırma kesitsel tipte bir araştırmadır. Bu araştırma 15-16 Aralık 2011 tarihlerinde
yapılmıştır. Araştırmanın evrenini İl merkezindeki İl Jandarma Komutanlığı ve İl Hava Meydan
Komutanlığı’nda görevli 230 er-erbaş oluşturmaktadır. Er- erbaşların emniyet ve asayiş hizmetlerinde görevli
olmaları nedeni ile 200 kişi araştırmaya katılmıştır. İl jandarma ve İl Hava Meydan Komutanlığı’nda görevli ererbaşların aile planlaması yöntem kullanma durumlarını değerlendirmek amacıyla soru formları uygulanmıştır.
Bağımlı değişken aile planlaması yöntem kullanma durumu; bağımsız değişkenler yaş, öğrenim durumu, medeni
durumu, evlilik süresi, çocuk sayısı ve sivil yaşamdaki yerleşim yeri olarak kullanılmıştır. Verilerin analizinde
SPSS 15.0 programı, çözümlemede ise ki-kare testi kullanılmıştır.
Bulgular: Er-erbaşların yaş ortalaması 27±10.3 olarak saptanmıştır ( min: 18.0; max: 59.0 ). Er-erbaşların %
69.1'i 27 yaş ve altındadır. Er-erbaşların % 34.0’ü evli, % 66.0’sı bekardır. Er-erbaşların % 61.5’i lise ve
üzerinde öğrenim görmüştür. Er-erbaşların % 60.0'ı il merkezinde, % 23.0'ü ilçede, % 17.0'si köy ve beldede
yaşamaktadır. Er-erbaşların %78.5’i herhangi bir aile planlaması yöntemi kullanmamaktadır. Evli er-erbaşların
%42.6'sı, bekar olanlarınsa % 10.6'sı aile planlaması yöntemi kullanmaktadır. Er-erbaşların % 66.4 'ü aile
planlaması hakkında daha önceden bilgi almasına rağmen sadece % 22.8'i aile planlaması yöntemi
kullanmaktadır. Yapılan analizlerde, yaşı 27 ve üzeri, evli, öğrenim düzeyi lise ve üzeri olanlarda istatistiksel
olarak anlamlı bir şekilde daha fazla aile planlaması yöntemi kullandığı saptanmıştır ( p < 0.05 ).
Sonuç: Aile planlaması hakkında daha önceden bilgi almasına rağmen yöntem kullanma oranı düşüktür.
Özellikle daha genç yaşta ve bekar olan, öğrenim düzeyi lise altında bulunan er-erbaşlara üreme sağlığı
konusunda eğitim programları düzenlenmelidir.
Anahtar Sözcükler: Üreme Sağlığı, Aile Planlaması, Er-Erbaş
Ebru Büyükeren: E-Posta: [email protected]
113
P37
Adana'da Yaşayan 9-15 Yaş Grubu Çocukların Vücut Kitle İndeksinin (VKİ) Değerlendirilmesi ve
Obezite
1
Yaşar Sertdemir , Refik Burgut1, İlker Ünal1
1
Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana
Özet
Giriş: Obezite, dünya genelinde yaşanan bir sağlık sorunudur. Obezitenin ilkokul yaşlarında başladığı
bilinmektedir. Bu yaşlarda edinilen beslenme alışkanlıkları büyük ölçüde hayatın geri kalan kısmında da devam
ettirilmektedir. Dünya sağlık örgütü 1980'den bu yana VKI'ni obezitenin belirlenmesinde standart yöntem olarak
kullanmaktadır. VKI aynı zamanda "Anorexia Nevrosa" ve "Bulimia Nevrosa" hastalığının belirlenmesinde
yardımcı olmaktadır. Dünya sağlık örgütü kriterlerine göre yirmi yaş üstü kişilerde; VKİ < 18.5 malnutrisyon
veya yeme bozukluğunu,VKI 25-30 arası kilolu ve VKİ>30 ise obezitenin göstergesi olarak tanımlanmaktadır.
ilk-orta okul çocuklarında her yaş grubu için belirlenmiş olan VKİ değerlerine göre çocukları zayıf normal
kilolu ve obez olarak sınıflamak mümkündür.
Amaç: Adana da yaşayan çocukların durumunu ortaya koymak için yapılmış olan bu ön çalışmada obezite
oranlarının belirlenmesine çalışılacaktır.
Materyal yöntem: Adana genelinde 50 okuldan toplanan 4098 çocuğun; yaş grupları ve cinsiyete göre VKİ
değerleri , "Centers for Disease Control and Prevention (CDC)" merkezinin 2000 yılı verilerine göre
gruplandırılarak değerlendirilmiştir.
Bulgular: CDC kriterleri esas alındığında; erkek çocukların obezite oranları 9 yaş için %6.7, 10 yaş için %9.6,
11 yaş için %2.1, 12 yaş için %4.1, 13 yaş için %5.9, 14 yaş için %5.5 ve 15 yaş için %4.1, kızlar için ise 9 yaş
için %9.2, 10 yaş için %6.9, 11 yaş için %0.5, 12 yaş için %2.9, 13 yaş için %1.7, 14 yaş için %0.8 ve 15 yaş
için %1.2 olarak gözlenmiştir.
Sonuç: Adana bölgesi 9-15 yaş grubu çocukların VKİ değerleri CDC kriterlerine göre değerlendirildiğinde erkek
ve kızların 9 ve 10 yaşlarında daha obez olduğunu göstermektedir. Yaş ilerledikçe bu oranlarda azalma
gözlenmektedir. Ancak bu azalmanın yaş ilerledikçe obezitenin azalmasını mı yoksa yeni nesillerin daha obez
olduğunu mu gösterdiği longitudinal çalışmalarla araştırılmalıdır.
Anahtar Kelime: Vücut Kitle İndeksi, Obezite, Çocuk
114
P38
Destek Vektör Makinesi Modelleri ile Miyokard İnfarktüsün Sınıflandırılması
Emek Güldoğan1, Jülide Yağmur2, Saim Yoloğlu1, Musa Hakan Asyalı3, Cemil Çolak1
1
İnönü Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Malatya, Türkiye
2
3
İnönü Üniversitesi, Tıp Fakültesi, Kardiyoloji AD, Malatya, Türkiye
Abdullah Gül Üniversitesi, Mühendislik Fakültesi, Biyomedikal Mühendisliği Bölümü, Kayseri, Türkiye
Özet
Amaç: Destek vektör makinesi (Support Vector Machine, SVM), pozitif ve negatif örnekleri bilinen bir uzayı
ikiye ayıran en iyi hiper-düzlemi bulmaya çalışan sınıflandırma yöntemlerinden biridir. Bu çalışmada, Miyokard
İnfarktüsün (Mİ) SVM modelleri ile sınıflandırılması amaçlanmaktadır.
Gereç ve Yöntem: Sınıflandırmada kullanılacak Mİ verileri, İnönü Üniversitesi Tıp Fakültesi Kardiyoloji
anabilim dalı için oluşturulan veritabanından rastgele alınan 184 bireye ilişkin bilgileri içermektedir. Tahmin
edilen SVM’ler, SVM-Doğrusal ve SVM-Radyal Tabanlı kernel fonksiyonlarından oluşturulan modellerdir.
Bulgular: Çalışmada incelenen grubun 90’ı (%48.9) Mİ hastası iken, 94’ü (%51.1) Mİ hastası değildi. Mİ’nin
doğru sınıflama başarısı, SVM-Doğrusal modeli için %83.70 ve SVM-Radyal Tabanlı modeli için %90.76 olarak
elde edilmiştir.
Sonuç: Bu araştırmada Mİ’nin sınıflanmasında radyal tabanlı SVM modelinin, doğrusal SVM modelinden daha
iyi sınıflama performansı gösterdiği belirlenmiştir. Farklı kernel tipi fonksiyonlara dayalı SVM modellerinin
kullanımı, hastalıkların sınıflama performansını artırılabilir.
Anahtar Kelimeler: Destek vektör makineleri, Miyokard İnfarktüsü, Sınıflama
Emek Güldoğan: E-Posta: [email protected], GSM: 0 506 284 49 34
115
P39
Dekorasist: Bina İçi Dekorasyona Yönelik Öneri Sistemi
Fidan Kaya1, Gürel Yıldız, Adnan Kavak
1
Kocaeli Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Kocaeli
Özet
Bu çalışmada ev ,ofis gibi ortamların dekorasyonunu yaparken kullanıcılara yardımcı olmak amacıyla mobilya,
boya ve halı gibi dekorasyon ürünlerinin seçimini sağlayacak mobil ve web uygulamalarından oluşan bir yazılım
gerçeklenmiştir. Çalışmada mobil ve web uygulaması kullanıcının mobil telefonu ile çektiği resmin color
quantization metodlarını kullanarak renk analizini yapmaktadır ve
kullanıcının belirlediği kriterlere göre
sistemde yer alan ürünlerden filtreleme algoritmaları yardımıyla önerilerde bulunmaktadır.
Veri madenciliği tabanlı pek çok kişisel öneri sistemi bulunmaktadır. Ancak uygulamalarda temel olarak
bunlardan iki tanesi karşımıza çıkmaktadır. Bunlar, içerik bazlı filtreleme ve işbirlikçi filtreleme yöntemleridir.
İçerik bazlı filtreleme yöntemleri daha çok müşterilere tarihsel veri kayıtlarını ve ürünler arasındaki ilişkileri
kullanarak önerilerde bulunurken, işbirlikçi filtreleme yöntemleri diğer müşterilerin seçimlerine ve müşterilerin
birbirleri arasındaki benzerliklerine ya da müşterilerin belirli bir içerik ya da meta üzerindeki kişisel görüşlerini
bir araya getirerek önerilerde bulunmaya çalışır.
Çalışma kapsamında da işbirlikçi filtreleme yöntemleri kullanılarak bir öneri sistemi geliştirilmiştir. Geliştirilmiş
olan sistemden öneri alabilmek için sisteme üye olunması gerekmektedir. Sistem öneri üretme aşamasında ilk
olarak sistemde yer alan üyelerin tamamını komşu olarak belirlemektedir. Daha sonra iki farklı yöntem ile
(pearson bağıntısı ve vektör benzerliği) kullanıcılar arasındaki benzerlikler hesaplanmaktadır. Bu hesaplamalar
yapılırken kullanıcıların sistemde yer alan ürünler hakkındaki fikirleri dikkate alınmıştır. Daha sonra hesaplanan
benzerlik değerlerine göre ürün tavsiyesinde bulunulacak kullanıcıya kaç adet komşu seçileceği
belirlenmektedir. Bu aşamada da iki farklı yöntem kullanılmıştır. Bunlar bağıntı eşiği yöntemi ve k en yakın
komşu yöntemleridir. Komşular belirlendikten sonra tavsiye listesinde yer alan ürünler için komşu kullanıcıların
geçmişte verdiği oy değerlerini kullanarak kullanıcının hangi ürünü ne kadar beğeneceği tahmin edilmeye
çalışılmıştır. Bu tahminler doğrultusunda kullanıcılara önerilerde bulunulmuştur.
Çalışma sonucunda mevcut öneri sistemlerine alternatif olacak bir yöntem geliştirilmiştir. Geliştirilmiş olan
yöntemle kullanıcılara ait veri kayıtları kullanılarak kullanıcıların analizleri yapılmış ve onlara hitap eden
ürünlerin öneri olarak sunulması sağlanmıştır. Aynı zamanda benzerlik hesaplamalarında pearson bağıntısı
yönteminin vektör benzerliği yöntemine göre daha avantajlı olduğu ve komşu seçimi sırasında da k en yakın
komşu yönteminin bağıntı eşiği yöntemine göre daha iyi sonuçlar verdiği tespit edilmiştir. Geliştirilmiş olan
ürün mobilya ve dekorasyon sistemine yönelik bir ürün olmasına rağmen kullanılmış olan öneri sistemi yapısı
pek çok alana uygulanabilecek bir yöntem olarak sunulmuştur.
Anahtar Kelimeler: İşbirlikçi Filtreleme, Öneri, Dekorasyon, Benzerlik
Fidan Kaya: E-Posta: [email protected]
116
P40
1964-1994 Tarihleri Arasında Bildirilen Kızamık Vakalarından Olan Ölümlerin Zamana Bağlı
İncelenmesi
1
Serhat Hayme , Serdal Kenan Köse1, Derya Öztuna1, Beyza Doğanay Erdoğan1
1
Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim dalı, Ankara
Özet
Giriş ve Amaç: Kızamık, viral, çok bulaşıcı bir hastalıktır. Solunum yolu ile havadan bulaşır ve bütün vücuda
yayılır. Aşısı 1963 yılında bulunan kızamık halen az gelişmiş ülkelerde görülmekte olup ölüm oranı yüksektir.
Aşı çok yüksek oranda koruyucudur. Geçmişte aşılanma oranları hakkında güvenilir bilgiler mevcut değildir.
Çalışmamızda;
1964-1994 Yılları arasında kızamıktan ölüm oranlarının 1980 yılı öncesi ve sonrasındaki
değişimleri incelenmiştir.
Yöntem: Araştırma verileri, Sağlık Bakanlığı Tarafından 1996 yılında yayınlanan Hastalık İstatistiklerinden
alınmıştır.
1980 yılı kesim noktası olarak alınarak iki farklı döneme ilişkin yıllara bağlı kızamıktan ölüm
oranlarının karşılaştırması Chow testi ile yapılmıştır. Chow testi 1960 yılında C. Chow tarafından geliştirilen ve
farklı dönemlere ilişkin elde edilen regresyon denklemlerinin Hata Kareler Toplamları üzerinde düzeltme
yaparak karşılaştırmasında kullanılan bir testtir. Değerlendirme SAS 9.0 paket programında yapılmıştır.
Bulgular ve Sonuç: Dönem farkı olmaksızın uygulanan en uygun regresyon analizi olan doğrusal regresyon
analizi sonucunda Ölüm oranı = 249,878-0,125*Yıl denklemi elde edilmiş ve R2 değeri 0,364 olarak bulunmuş
olup istatistiksel olarak önemli idi ( p=0.0001). 1980 ve öncesi ile 1980 sonrası için yıllara bağlı ölüm
oranlarındaki değişimler incelendiğinde ise <=1980 için Ölüm oranı = -54,399+0,030*Yıl R2=0,008 p=0,727,
>1980 için Ölüm oranı = 613,201-308*Yıl R2=0,745 p=0,001 değerlleri elde edilmiştir. İki döneme ait elde
edilmiş olan regresyon doğrularının Chow testi ile karşılaştırmasında F=4,76 p=0,0169 değerleri bulunmuş ve bu
da istatistiksel olarak anlamlı bulunmuştur.
Sonuç olarak 1980 yılı sonrası kızamıktan ölüm oranlarında belirgin bir azalma tespit edilmiştir.
Anahtar Kelimeler: Chow testi, Kızamık, Ölüm
117
P41
Epileptik Hastalarda Algılanan Sosyal Destek Düzeyleri ve Depresyon Durumlarının İrdelenmesi
Demet Ünalan, Ferhan Soyuer, Ali Özdemir Ersoy
Özet
Giriş ve amaç:
Epilepsi nöbet durumu ile bire-bir ilişkili, hastalığın tedavisinde kullanılan ilaçların
oluşturabileceği bedensel, ruhsal, fonksiyonel ve sosyal zorlukları beraberinde getiren bir hastalıktır. Bu
çalışmanın amacı, epilepsi hastalarının depresyon durumlarını, algılanan sosyal destek düzeylerini ve belirleyici
faktörleri irdelemektir.
Materyal –metod: Kesitsel tipteki bu araştırma,
Kasım 2011-Temmuz 2012 tarihleri arasında
Erciyes
Üniversitesi Tıp Fakültesi Hastaneleri Nöroloji polikliniğine başvuran 135 epilepsi hastası üzerinde yapılmıştır.
Veri toplama aracı olarak, hastaların demografik sosyo-kültürel özellikleri ile klinik bilgilerini içeren bir anket
formu ile algılanan Sosyal Destek Ölçeği, Beck depresyon ölçeği uygulanmıştır.
Bulgular: Üniversite mezunlarının; arkadaştan, özel bir insandan ve algılanan sosyal destek toplam puan
ortancaları diğer eğitim düzeyine sahip olan hastalardan anlamlı düzeyde yüksek bulunmuştur (p<0.05). Serbest
meslek çalışanı hastaların aileden algıladıkları sosyal destek puan ortancaları diğer meslek mensuplarına göre
anlamlı düzeyde yüksek idi (p<0.05). Nöbet tipi parsiyel olan hastaların arkadaştan, özel bir insandan ve
algılanan sosyal destek toplam puan ortancaları diğer nöbet tiplerine göre anlamlı düzeyde yüksek bulunmuştur
(p<0.05). Son bir ayda birden az nöbet geçiren hastaların özel bir insandan algıladıkları sosyal destek puan
ortancaları, son bir ayda birden fazla nöbet geçirenlere ve nöbet geçirmeyenlere göre anlamlı düzeyde yüksek
bulunmuştur (p<0.05). Araba kullanan hastaların; arkadaştan, özel bir insandan ve algılanan sosyal destek
toplam puan ortancaları araba kullanmayan hastalara göre anlamlı düzeyde yüksek bulunmuştur (p<0.05).
Hastaların geliri ile arkadaştan (rho= 0.286, p=0.044) algılanan sosyal destek puanı, arkadaş sayısı ile aileden
(rho= 0.276, p=0.011) ve arkadaştan (rho= 0.243, p=0.025) algılanan sosyal destek puanı arasında pozitif yönde
anlamlı ilişki vardı. Hastalık süresi ile özel bir insandan (rho= -0.183, p=0.039) algılanan sosyal destek puanı
arasında negatif yönde anlamlı bir ilişki vardır. Hastaların beck depresyon puanı ile arkadaştan (rho= -0.612,
p<0.001), özel bir insandan (rho= -0.515, p<0.001) ve algılanan sosyal destek toplam puanı arasında negatif
yönde anlamlı düzeyde ilişki vardı (p<0.001).
Sonuç: Çalışmamızda epilepsi hastalarında gelir ve arkadaş sayısı ile algılanan sosyal destek puanı arasında
pozitif yönde, hastalık süresi ve depresyonla negatif yönde anlamlı ilişki olduğu tespit edilmiştir.
Anahtar Kelime: Epilepsi Hastaları, Algılanan Sosyal Destek Düzeyi, Depresyon
118
P42
Optimal Cut Finding for the Hierarchical Clustering Using Background Information
Askar Obulkasim1, Gerrit A. Meijer2, Mark A. van de Wiel1
1
VU University Medical Center, Department of Epidemiology and Biostatistics, Amsterdam, Netherlands
2
VU University Medical Center, Department of Pathology, Amsterdam, Netherlands
Abstract
In hierarchical clustering, clusters are defined as branches of a tree. The constant height branch cut, a commonly
used method to identify branches of a cluster tree, may not be ideal for cluster identification in complicated
dendrograms. In this work, we introduce a novel method called piecewise-cut which uses main data type and
available background information to find an optimal cutting point in the dendrogram. The crux of our main idea
as follows: construct hierarchical clustering dendrogram with given molecular data. The resulting dendrogram is
likely to express the tendency of samples are formed clusters guided by their molecular signatures. We presumed
that besides molecular data, we may have the clinical information of the same patients (e.g. patient’s survival
time). Use this clinical data as background information, search through the cluster space which is composed of
all possible partitions in the dendrogram obtained from molecular data. Find a partition in which every cluster is
composed of patients which are homogenous in terms of their background information. Resulting clusters
represents the cluster structure contained in the molecular data and easy to interpret. We applied our approach to
many publicly available molecular data for which patients follow up information is also available. Experimental
results show that our approach able to find a clustering structure which can not be obtained by commonly used
constant height cutting approach.
Keywords: Hierarchical Clustering; Molecular Data; Survival Time
I. Introduction: Hierarchical clustering is a popular data mining technique for detecting clusters of closely
related objects in data; a major application in bioinformatics is clustering of gene expression and DNA copy
number profiles. Hierarchical clustering organizes objects into a hierarchical cluster tree (dendrogram) whose
branches are the desired clusters. There are two drawbacks in hierarchical clustering method. One is, the most
widely used tree cut method is the fixed height branch cut: the user chooses a fixed height on the dendrogram,
and each contiguous branch of objects below that height is considered a separate cluster. When detecting gene
clusters (also referred to as modules), one typically also requires each cluster to have size at least n, a chosen
constant number. The fixed height branch cut is a simple and elegant technique with many desirable properties,
but it is not ideal in situations where one expects a complicated dendrogram structure with nested clusters [1]. It
should be noted that this is not a fault of hierarchical clustering as such: often the dendrogram exhibits distinct
branches corresponding to the desired modules, but no single fixed cut height can identify them correctly.
Second is, also common to other unsupervised learning procedures, hierarchical clustering may identify cancer
subtypes that are unrelated to patients clinical information (e.g. patient survival time). Although several different
subtypes of a given cancer may exist, if the prognosis for all patients is the same regardless of which subtype
they have , then the utility of this information is limited. Since hierarchical cluster do not use the available
119
background information tp identify subtypes, there is no guarantee that the subtypes they identify will be
correlated with available clinical information. To address this problem, we introduce a method called piecewise
cut to find optimal cutting point in the dendrogram using both main data type and available back ground
information. It tries to find a partition in which every cluster is composed of samples which are homogenous in
terms of their background information. Resulting clusters represents the cluster structure contained in the
molecular data and easy to interpret.
II. Method: The procedure of our piecewise cut approach as follows:
A. Construct a dendrogram using molecular data
For given molecular data we construct hierarchical clustering dendrogram using Pearson correlation as a
distance measure and Ward’s minimum variance as a linkage measure. The resulting dendrogram is likely to
express the tendency of samples are formed clusters guided by their molecular signatures.
B. Construct the search space
After obtaining the dendrogram, the search space which is composed of all possible partitions in the dendrogram
need to be constructed. We extract all possible partitions which fulfill following two constraints. First, the
number of observations in each cluster should not be less than predefined threshold(we used 3 in all our
experiment). Second, a partition should respect the leaf ordering in the dendrogram.
This means in order to two observations to be in the same cluster, they should be close in terms of their leaf
ordering produced by hierarchical clustering.
C. Partition evaluation
We presumed that besides molecular data, we may have the clinical information of the same patients (e.g.
patient’s survival time). To select a best partition among large number of potentials, we propose to use this
clinical information to qualitatively evaluate generated partitions. We use each partition as a feature and clinical
information as response variable to check their association. A non-exhaustive list of criteria can be used are:
AIC, BIC, Cross-validated loglikelihood.
D. Validation
Since we are aiming of analyzing high dimensional molecular data, we think that the use of a measure of test set
clusters defined by a classifier made from the training data is the most appropriate to identify reproducible
clusters of genes or arrays with similar interest. For this reason, we divide the data two sets, using only one set
for from dendrogram construction step till best partition selection step. At the end, use selected best partition to
assign cluster labels to testset. We use the Random survival forest (RSF)[2] method to evaluate the
meaningfulness of the clustering one testset. The error rate from the RSF model is equal 1 − C where C is
Harrell’s concordance index[3].
III. Result: One of the dataset we examined is dataset of acute myeloid leukemia patients[4]. It consist of 6283
genes meas urement on 116 patients and patients follow up information . To estimate more stable results, we
conducted 100 bootstrap samplings. In each run, 70% of samples are used for training and 30% for testing. In the
training phase, we extract a best partition by straight line cut and piecewise cut respectively. Then, each test
sample is assigned a cluster label based on its ward distance to each of the cluster in the best partition found in
the training phase. Training set sample’s follow up information and cluster labels are used to contract RSF model
and predict the error rare based on the test sample’s cluster labels. 100 bootstrap sampling results are given in
below table. In the second column, first number represents the number times piecewise cut produced a partition
120
which has smaller error rate than the one from the straight line cut and vice verse for the number inside the
bracket. As we can observe from the Table I, our approach able to produce partitions in which clustered sample
are more homogenous than selected partitions from the straight line cut in terms of their background information.
Not only counting the number of times the piecewise cut produces a partition with smaller error rate than the
straight line cut does, we also checked if the magnitude of the error rate from
piecewise cut significantly different from the straight line cut. Since we used bootstrap sampling to generate the
error rate, 100 error rates (for each approach) are not independent, as a result commonly used tests (e.g. t test)
are not suitable. For this reason, we used permutation test from the R package perm. The last column in the
Table I denotes the P values generated from this test. These P values strong enough to prove that the small error
rate from the piecewise cut is not occurred by chance.
AIC
64(32)
0.001
BIC
65(31)
0.001
Table I: Comparısons Of The Pıecewıse Cut Wıth The Straıght Lıne Usıng Dıfferent Measurements
Criteria Piecewise(straight line) P-value
IV. Conclusion: In this work, we introduce a novel hierarchical cluster dendrogram cut finding method called
piecewise cut which uses given molecular data and available background information to find an optimal cutting
point in the dendrogram. Advantages of our approach is two fold. Firstly, the final partition found by our
approach represents the clustering structure existed in molecular data and selected from among large number
potential partitions by the help of available clinical information. There are some literature showed that clusters
generated by using more than one types of data are more stable. Low error rate from testset further shows the
extrapolatibility of best partition on new data set. Secondly, even if the error rate of the partition selected by
piecewise cut equals the one from straight line cut, our approach is still useful because at least it shows where to
cut.
Acknowledgment: This study was performed within the framework of CTMM, the Center for Translational
Molecular Medicine, DeCoDe (Decrease Colorectal Cancer Death) project (grant 03O-101).
References
[1] T.
Sorlie, M.C. Perou, R. Tibshirani, T. Aas, S. Geisler, H. Johnsenb, T. Hastie, B.M. Eisen, M. van de
Rijn, S.S. Jeffrey, T. Thorsen, H. Quist, C.J. Matese, O. P. Brown, D. Botstein, E.P. Lnning and A.-L. BrresenDale (2001) Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical
implications. Proceedings of the National Academy of Sciences., 19(98):10869-10874.
[2] H. Ishwaran, U.B. Kogalur, E.H. Blackstone and M.S. lauer (2008) Random survival forest The Annuals of
Applied Statistics., 3(2):841-860 .
[3] F.E. Harrel, R.M. Califf, D.B. Pryor, k.L. Lee and R.A. Rosati (1982) Evaluating the yield of medical tests.
The Journal of the American Medical Association, 18(247):2543-2546.
[4] L. Bullinger, K. Dohner, E. Bair, S. Frohling and R. Schlenk (2004) gene expression profiling identifies new
subclasses and improves outcome prediction in adult myeloid leukemia. New England Journall of Medicine,
16(350):1605-1616.
121
P43
Quality of Life Among Healty Elderly (65 Years and Older) In Shiraz,Iran
Sareh Keshavarzi1, Seyed Mehdi Ahmadi2
1
Shiraz University of Medical Sciences, biostatistics, Shiraz, Iran
2
Health Policy Research Center, Shiraz, Iran
Abstract
Background: The increasing aged population has recently become a focus of interest in developing countries.
Many changes occur as people enter old age, and these changes may at times decrease quality of life. The aims
of our study were to evaluate the quality of life (QoL) of elderly people in Shiraz city, the center of Fars
province of Iran.
Method: A cross-sectional study was conducted in 2010 with 114 randomly selected participants aged 65 to 90.
The instrument used was the Persian version of WHOQOL-BREF questionnaire. Inferential statistics were done
using SPSS (version16) software.
Results: The study consisted of 60 males (42%) and 83 females (58%) with mean ( ± SD) ages of 74.1 ± 6.5
and 75.2 ± 6.9 respectively. The highest scores were observed in the social relationships domain (14.18 ± 2.49)
and psychological health domain (13.21 ± 1.99), respectively. However, the lowest scores were found in the
environment (12.41 ± 1.46) and physical domain (12.69 ± 2.30), respectively. The means scores of different
dimensions of Qol were similar between men and women.
Conclusion: The findings suggest that physical, psychological, social and environmental domains of quality of
life need to be evaluated among elders. While aging is an unpreventable physiological state, determining and
solving the problems of elderly people might improve their quality of life.
122
P44
A Benchmark for Docking of 60 Protein-Ligand Complexes
Anton Stoilov1, Radoslav Mavrevski2
1
South-West University, Faculty of Mathematics and Natural Science, Department of Physics, , Blagoevgrad,
Bulgaria
2
South-West University, Faculty of Mathematics and Natural Science, Department of Informatics, Blagoevgrad,
Bulgaria
Abstract
Aim: The binding of small molecule ligands to large protein targets is central to numerous biological processes.
The accurate prediction of the binding modes between the ligand and protein (the docking problem) is of
fundamental importance in modern structure-based drug design. Each docking program makes use of one or
more specific search algorithms, which are the methods used to predict the possible conformations of a binary
complex. An overview of current docking techniques is presented with a description of applications including a
benchmark for docking of 60 protein-ligand complexes. The present benchmark is made from an existing test set
(CCDC/Astex Validation Set) from which are selected typical 60 cases. Selected examples were docked with
AUTODOCK software within the framework of PyRx and present by conformation with minimal binding
energy and their corresponding unbound energy for each obtained ligand-protein complex.
Methods: In this paper the benchmark test set is based on CCDC/Astex Validation Set developed by Cambridge
Crystallographic Data Centre (CCDC) for docking software GOLD. There are 305 entries and protonation states
have been set in all cases. For experiments in this paper was used non modified “protein.mol2” file and
“ligand_reference_min. mol2” file like inputs file for PyRx software and AUTODOCK4. From full CCDC /
Astex Validation Set was choose 60 cases with witch was made docking procedure with PyRx/AUTODOCK4.
For conformational searches, the docking calculations using the “Lamarckian” GA (LGA) procedure with
default parameters was performed.
Results: After successful docking procedure for each test-case is observed by binding energy, intermol energy,
internal energy, torsional energy and unbound energy. The results from experiments will be presented.
After the execution of each docking procedure were obtained 10 conformation from witch is chosen most
energy-favorable i.e. that have the smallest binding energy. It is summary of these most energy-favorable
conformation for each test-case will be presented.
Conclusion: An extensive summary of currently available docking methods has been presented. Comparisons
suggest that the best algorithm for docking is probably a hybrid of various types of algorithm encompassing
novel search and scoring strategies. The most useful docking method will not only perform well, but will be easy
to use and parametrise, and sufficiently adaptable such that different functionality may be selected, depending on
the number of structures to be docked, the available computational resources, and the complexity of the problem.
Keywords: Automated Docking, Binding Energy, Benchmark
Anton Stoilov: E-Mail: [email protected]
123
P45
Guideline for the Design and Statistical Analysis of Biological Experiments
Mahmoud Hozayn Mahmoud1
1
Statistical Consulting Unit, National Research Centre, Cairo, Egypt
Abstract
It is important to design scientific experiments well, to analyze the data correctly. An appropriate statistical
model properly applied to data allows experimental results to be interpreted accurately and completely. In
contrast, inappropriate or incomplete statistical designs can lead to inaccurate, or incomplete, conclusions that
may lead to misinterpretation of the results of the study. Furthermore, the materials and methods section should
describe the statistical methods used in analyzing the results. This guideline is provided to help scientific
research workers perform their experiments efficiently and analyze their results so that they can extract all useful
information from the resulting data. Among the topics discussed are the varying of experiments i.e., simple,
factorial with two and three factors, split and strip plot experiments. As well as factorial within split plot and
split plot within factorial experiments either these experiments designed in completely randomized (CR) and/or
completely randomized block designs (CRBD). Also will be discussed the size of the experiment using power
and sample size calculations; screening raw data for obvious errors; selecting the suitable transformation
methods using SPSS program, assumption and importance of t-test, analysis of variance (ANOVA), simple
correlation and regression, multi comparison i.e., LSD, Duncan, Tukey New LSD testes as parametric analysis;
and effective design of graphical data.
Keywords: Experimental Design; Statistical Analysis, Parametric And Nonparametric Tests
Mahmoud Hozayn Mahmoud: E-Mail: [email protected]
124
P46
Normality and Exponentiality Tests
Hadi Alizadeh Noughabi1, Naser Reza Arghami1
1
Department of Statistics, Ferdowsi University of Mashhad, Mashhad, Iran
Abstract
This article studies four different tests of normality and four different tests of exponentiality. The tests in
question for normality are Vasicek, Shapiro-Wilk, Kolmogorov-Smirnov, and Anderson-Darling. Tests in
question for exponentiality are Kolmogorov-Smirnov, Anderson- Darling, Finkelstein and Schafer, and Ebrahimi
et al. test. Each test is described and power comparisons are made by using Monte Carlo computations. The
results are discussed and interpreted separately.
Keywords: Test of normality, Test of exponentiality, Monte Carlo simulation, Power of test.
Hadi Alizadeh Noughabi: E-Mail: [email protected]
125
P47
Testing the Normal Assumption of Data Based on Entropy
Hadi Alizadeh Noughabi1, Naser Reza Arghami1
1
Ferdowsi University of Mashhad, Department of Statistics, Mashhad, Iran
Abstract
To make a statistical inference, several assumptions about the data must be fulfilled. Most statistical methods
assume an underlying distribution in the derivation of their results. Normality assumption is indispensable in
many statistical procedures, some of which may be quite sensitive to any departure from normality. Therefore,
testing normality is one of the most studied goodness-of-fit problems. In this paper we consider the two entropy
estimators and the nonparametric distribution function corresponding to these estimators. We use the results to
describe goodness of fit test for the normal distribution. The critical values and powers for some alternatives are
obtained by simulation. The powers of the tests under various alternatives are compared with the competitors.
The use of the tests are shown in real examples.
Keywords. Nonparametric Tests, Data Analysis, Normal Distribution, Kullback-Leibler Information
126
P48
On Nonparametric Prediction in Reliability Analysis
M. Chahkandi1, J. Ahmadi1
1
Ferdowsi University of Mashhad, Department of Statistics, Faculty of Mathematical Sciences, Iran
Abstract
Prediction of the future lifetime of a system is very important in the industry and Engineering-Manufactures. In
this paper, we construct some nonparametric prediction intervals for the future lifetime of a coherent system.
These intervals are determined based on the lifetime of k-out-of-n systems and minimal repair times of the
system’s components. The coverage probability of the proposed intervals is expressed based on Samaniego’s
signature. We also discuss about the existence and optimality of the intervals.
Keywords: Coherent System, Minimal Repair, Non Parametric Prediction, Records, Samaniego’s Signature
Majid Chahkandi: E-Mail: [email protected]
127
P49
Identifying Cancer Patterns among Iranian Population using Cluster Analysis
Navid Yarali1, 2, Masoud Salehi3, Ali Moeini1, Iman Navidi4
1
Tehran University of Medical Sciences, Mathematics and Statistics Department, School of Health Management
and Information Sciences, Tehran, Iran
2
3
Tehran University of Medical Sciences, Scientific Research Center, Tehran, Iran
Tehran University of Medical Sciences, Mathematics and Statistics Department, School of Health Management
and Information Sciences, Tehran, Iran
4
Tehran University of Medical Sciences, Department of Epidemiology and Biostatistics, Tehran, Iran
Abstract
Aim: To investigate underlying pattern of cancers and grouping related cancers among Iranian population.
Methods: ASR (Age Standardized Rate in 100,000) of 24 types of cancers among 30 provinces of Iran during
March 2008 to March 2009 which were recorded on the cancer registry center of each province, were used in
this study. Data were entered into Minitab 16 software and analyzed using correlation variable clustering
methods.
Results: The most prevalent cancer for men was skin cancer with ASR=22.62 and for women, breast cancer
with ASR=33.21. Semnan, a central province of Iran, had the highest ASR (396) and Sistan, in southeastern of
Iran, had the lowest ASR (69). For men, Liver and pancreas cancers had the highest rate of similarity with
95.23%. Considering clusters with similarity above 90%, colon and prostate cancers cluster as well as liver and
pancreas cancers cluster were the only clusters which had at least two cancers on it. However, bladder cancer
with 89.07% of similarity was connected to the colon-prostate cluster. Also, lung cancer was connected to the
liver-pancreas cluster with 88.01% of similarity. Other cancers were connected to each other with at most 85%
of similarity. Similarly, for women, by assuming 90% as a cut-off point for similarity of clusters, one cluster for
lung, brain, liver, and pancreas cancers, one cluster for breast, corpus uteri, and ovary cancers as well as one
cluster for each of other cancers obtained. It is noteworthy to say that like men, lung cancer was connected to the
liver-pancreas-brain cluster with 88.51% of similarity; also, ovary cancer had 88.71% of similarity with the
breast-corpus uteri cancers cluster, which is suggested to be considered as a whole cluster.
Conclusions: Clustering cancers, gives the degree of similarity for related cancers. In this study we found that
for both men and women of Iranian population liver, lung, and pancreas cancers were similar to each other. In
addition, bladder, prostate and colon cancers can be considered as a similar group for men and breast, ovary, and
corpus uteri cancers for women. Therefore, it is suggested to have same centers for the cancers in same clusters
in the related provinces.
Keywords: Cancer, Cluster Analysis, Iranian Population
128
P50
Generating Rules to Increase Production Using Decision Tree in Car Industry
M. Davoodi1,4, M. Hoseinzadeh2,4 , H. Gholami Mazinan3,4
1
2
IUST, Industrial Engineering department, , Iran
Tarbiat Modares University, Industrial Engineering department, Iran
3
IUST, School of Railway Engineering, Iran
4
SAIPA KASHAN
Abstract
In today’s world, production development considering current limitations is a crucial subject which was
investigated deeply with various methods such as heuristic approach, data mining, production plan optimization
and etc. In this paper, most efficient factors of production were identified. We use data mining because Data size
was large. Decision Tree as the most popular data mining technique was used for analysis. We use
CART,CHAID and QUEST techniques. Because these techniques have different Specifications. Also the rules
for predicting the production process were extracted. The results were evaluated by using statistic techniques
such as DOE and Regression.
Keyword: CHAID, QUEST,CART, DOE, Regression
M. Davoodi: +983614911666, E-Mail: [email protected]
129
P51
Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different Temperatures
H. Esmaily1, M. Hadi Alijanvand2, H. Doosti3, M.T. Shakeri4
1
Mashhad University of Medical Sciences, Health Science Research Center, School of Health, Mashhad, Iran
2
Shahrekord University of Medical Science, Biostatistics Department, School of Health, , Shahrekord, Iran
3
4
Statistics Department, Kharazmi University,Karaj, Iran
Mashhad University of Medical Sciences, Community Medicine Dept., Medical School, Mashhad, Iran
Abstract
Introduction: The aggregation of glutamate dehydrogenize enzyme plays an important role in metabolism, liver
function and has pharmaceutical, biotechnological and medical applications. In this study, the enzyme
aggregation kinetic was statistically modeled and the assembly mechanism was conjectured by estimating the
appropriate parameters of nonlinear regression at various temperatures combined with the enzyme kinetic
method.
Method: Nonlinear regression model was considered is nonlinear logistic function with three parameters which
parameter estimation is Gauss Newton method. Evaluation of the model, i.e. the mean structure, homogeneity of
variance, normal distribution, independence of fitted nonlinear model for the aggregation of glutamate
dehydrogenize enzyme data from Institute of Biochemistry and Biophysics, Tehran University (IBB) were
studied. Also remedies of violation from the assumptions of model such as the use of sandwich estimator, the
nonlinear regression with correlation of residuals, grouped nonlinear regression in repeated experiments were
considered. Finally, the sandwich estimator was applied in kinetic interpretation and nonlinear regression model
according to the grouping in repeated experiments and structure of correlation was proposed for optimization of
statistical model.
Results: Three parameters of Nonlinear logistic function in sandwich estimator for interpreting kinetic in various
temperatures was significant (p<0.001). Estimation of parameters in the optimal statistical model was significant
(p<0.001) by grouped nonlinear regression in repeated experiments. This model regarding to structure of
correlation in all temperatures except 57.50C and 600C with the little correlation 0.2 and 0.4, was more
appropriate with less akaike than grouped nonlinear regression in repeated experiments. Variation of released
energy due to protein aggregation with the fitted values of statistical model would demonstrate the melting
temperatures (Tm) of this enzyme 52.50C.
Conclusion: Based on statistical modeling, variations trend of sandwich estimations in nonlinear regression and
interpretations of kinetic, enzyme likely follows polymerization mechanism of dependent on creating nucleus.
We proceeded to identify and control the process of enzyme aggregation with a prediction of Tm.
Keywords: Glutamate Dehydrogenize: Protein Aggregation: Nonlinear Regression: Kinetics
130
P52
Age at Menopause Among Rural Women of Marrakech (Morocco)
R. Lotfi1, M. Loukid1, M.K. Hilali1
1
University of Cadi Ayyad, Faculty of Science Semlalia, Laboratory of Human Ecology, Marrakech, Morocco
Abstract
Menopause is diagnosed after 12 months of amenorrhea resulting from the permanent cessation of ovarian
function. The timing of natural menopause may serve as a marker for the process of reproductive ageing,
The enquiry is based on a cross sectional and retrospective method. The present study is based on a cross
sectional survey in the rural area of Marrakech city in Morocco.
The different information has been collected from about 600 women among rural area, in the aim to approach the
process of the reproductive ageing of the Moroccan women and the transition to the menopause with respect to
the socioeconomic and cultural environment and to estimate age at natural menopause and the ways in which this
characteristic could be predicted from variables related to the residential status.
The average age at natural menopause was 49.78 ±4.29 years of rural women, while among urban females it was
47, 10 +5.53 years .Results show a confirmed rural-urban difference in menopausal age related to some
sociodemographic and reproductive variables.
Keywords: Age at Menopause, Rural-Urban, Marrakech (Morocco)
131
P53
Veri Madenciliği Kullanılarak Diyabet Verilerinin Analizi
Mete Çelik1, Cevat Yazıcı2, Mustafa Yiğitoğlu3, Murat Yenisu4, Fatih Tanrıverdi5
1
Erciyes Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Kayseri
2
3
Erciyes Üniversitesi, Tıp Fakültesi, Biyokimya Anabilim Dalı, Kayseri
Erciyes Üniversitesi, Mühendislik Fakültesi, Elk-Elektronik Mühendisliği Bölümü, Kayseri
4
Erciyes Üniversitesi, Gevher Nesibe Hastanesi, Bilgi İşlem Sorumlusu, Kayseri
5
Erciyes Üniversitesi, Tıp Fakültesi, İç Hastalıkları Anabilim Dalı, Kayseri
Özet
Amaç: Diyabetes Mellitus (DM), tüm yaş gruplarında görülebilen, komplikasyonlarla seyreden, iyi
kontrol/tedavi edilmediğinde kalp, damar, göz, böbrek ve sinir dokusu gibi multiorgan patolojilerine neden
olabilen, tedavi maliyetinin çok yüksek olduğu bir sağlık sorunudur. Günümüzde dünyada 290 milyondan fazla
insanı etkileyen DM’un 2025 yılında 380 milyon kişiyi etkilemesi beklenmektedir. Bu nedenle DM’un etkin bir
şekilde tanı ve tedavisinin yapılması ve komplikasyonlarının önlenmesi, tüm dünya ülkelerinin sağlık
politikalarında özel bir önem taşımaktadır. DM ile ilgili yeni bilgilerin çıkarımında veri analizi yöntemi oldukça
yeni ve önemli bir metottur. Daha önce de DM verilerinin analizi için birçok teknik kullanılmıştır. Ancak, bu
çalışmalar genellikle küçük-ölçekli veriler üzerinde yapılmış, basit analizlerle sınırlı kalmış ve dolayısı ile ilginç
ve manalı kuralların çıkarımında yetersiz kalmışlardır. Bu çalışmada, diyabet hastalarına ait verilerinin veri
madenciliği yöntemleri kullanılarak analiz edilmesiyle daha önceden bilinmeyen ve potansiyel olarak faydalı
olabilecek gizli ve ilginç yeni bilgilerin keşfinin sağlaması amaçlanmıştır.
Yöntem: Bu çalışmada 2005-2011 yılları arasında Erciyes Üniversitesi Gevher Nesibe Hastanesi’ne tanı ve
tedavi için başvurmuş ve hastane veritabanında International Classification of Diseases (ICD-10) kodlama
sistemine göre; DM ve onunla ilişkili kod almış hastaları içeren veritabanı kullanılmıştır. Bilgi girişlerinde
eksiklik bulunan hastalardan temizlenen veriler (3212 kayıt); hastalara ait cinsiyet, HbA1C, glukoz, LDL
kolesterol (LDL-K), HDL kolesterol (HDL-K) ve trigliserit parametreleri kullanılarak ICD-10 değerlerine göre
sınıflandırılmıştır. Referans aralıklarına göre ayrıklaştırılan verilerin sınıflandırma için WEKA yazılımının C4.5
karar ağacı algoritması kullanılmıştır.
Bulgular: Çalışma sonucunda diyabet veritabanında HDL-K parametresinin diğer parametrelere göre daha
ayırıcı olduğu gözlemlenmiştir. Karar ağacının ilk adımında HDL-K kayıtların 1/6’ sını; arta kalan verilerin
sınıflandırılması için diğer parametrelerin kombinasyonlarına ihtiyaç duyulduğu gözlemlenmiştir. Diğer bir ifade
ile HDL-K ile veritabanında bulunan hastaların yaklaşık %27’si sınıflandırılabilmiştir. Ayrıca HDL-K değerleri
referans aralıkta bulunan hastaların, DM komplikasyonu göstermeme eğiliminde olduğu tespit edilmiştir.
Sınıflandırılma sonucunda elde edilen karar ağacı aşağıda verilmiştir.
132
Kolesterol HDL
k
düşü
normal
E10.9
Trigliserit
yük
sek
l
norma
Kolesterol LDL
E10.9
E10.9
E10.9
Glukoz
yü
ks
Cinsiyet
E10.9
E10.2
E10.9
Kolesterol LDL
l
ma
nor
E10.2
E10.9
E10.2
Glukoz
E10.2
E10.9
E10.9
E10
E10.2
yük
sek
sek
yük
E10.9
E10.9
K
E
al
rm
al
E10.2
E10.9
no
rm
no
E10.9
Cinsiyet
ek
Glukoz
Trigliserit
al
düşü
rm
k
no
düşük
al
rm
no
l
ma
yük
sek
nor
yüksek
Glukoz
no
rm
al
E10.9
E10.9
E10.2
E10
İnsülin-bağımlı diyabetes mellitus
E10.9
İnsülin bağımlı diyabetes mellitus, komplikasyonları olmayan
E10.2
İnsülin bağımlı diyabetes mellitus, böbrek komplikasyonuyla birlikte
Sonuç: Hastane veritabanlarında yıllar içinde biriken DM hastalarına ait rutin laboratuar verilerinin; veri
madenciliği yöntemleri ile analizi, hastalarda komplikasyon gelişebilme riskini belirleme de kullanılabilecek
yardımcı araçlardan bir tanesi olabilir. Ayrıca daha önceden bilinmeyen ve potansiyel olarak faydalı olabilecek
gizli ve ilginç kuralların belirlenmesi için de kullanılabilecektir.
Anahtar Kelimeler: Diyabetes Mellitus, Diyabet, Veri Madenciliği, Sınıflandırma, Kara Ağaçları, C4.5
133
P54
İntrauterin İnseminasyon (IUI)’da Ovariyan Rezerv Belirteçlerinin Karşılaştırılması
Gökalp Öner1
1
Boğazlıyan Devlet Hastanesi, Kadın Hastalıkları ve Doğum Anabilim Dalı, Yozgat
Özet
Amaç: Over rezervi, overlerde follikulogenez ve steroidogenez fonksiyonunu yerine getirecek folliküllerin sayı
ve kalitesini, yeterliliğini tanımlamaktadır. Kadının yaşı arttıkça over rezervi primordiyal folliküllerin apoptotik
kaybına bağlı olarak azalır. İntrauterin inseminasyon (IUI) takiben devam eden gebelik öngörüsü over rezervini
gösteren belirteçler sayesinde hesaplanabilir. Over rezervinin yaygın olarak kullanılan belirteçleri yaş, bazal
follikül stimule edici hormon (FSH), östradiol (E2), Antral Follikül Sayısı (AFS) ve over hacmidir.
Yöntem: Bu çalışmaya 2009-2011 yılları arasında Erciyes Üniversitesi Kadın Doğum Polikliniğine başvuran 70
infertil hasta dahil olmuştur. Hastalara iki defa klomifen sitrat ile stimulasyon yapıldı ve her iki overde bir adet
18 mm üzeri folikül görüldüğünde hCG yapılıp 36 saat sonra IUI planlandı. Hastalara rutin olarak yapılan over
rezerv belirteçlerinin seviyelerinin prospektif olarak karşılaştırılmıştır. Bu karşılaştırılmalar Spearman
korelasyon testi ile yapıldı. Doğrusal regresyon analizi ile gebelik sonuçları ovariyan belirteçler karşılaştırıldı.
Ayrıca gebelik sonuçlarına göre belirteçlere ROC analizi yapıldı. Ayrıca gebe olan ve olmayan gruplar arasında
normalite testini takiben belirteçler t-test ve Mann Whitney U testi ile karşılaştırıldı. Tüm istatistik analizlerinde
P < 0.05 anlamlı olarak kabul edildi.
Bulgular: Erkek faktörün reddedildiği hastalardan oluşan 70 hastanın 9’unda 2 IUI sonunda gebelik elde
edilirken 61’inde gebelik elde edilmedi (% 12.8). Erken foliküler faz FSH yaş ile pozitif korelasyon gösterirken
(rho=0.273, p<0.03), AFC ve over hacmi ile negatif korelasyon gösterdi. AFS, over hacmi ile pozitif (rho
=0.377, p<0.002), yaş ve FSH (rho =-0.276, p< 0.03) ile negatif korelasyon göstermiştir. Bu testler
kıyaslandığında gebelik oranı ile en anlamlı test AFS olarak bulunmuştur [1.124 (95%CI 1.012-1.248),
p=0.028]. ROC analizine göre gebelik elde etme şansı 35 yaş altı (% 93 sensitivite), over volumü 4.23 üzeri (%
91.5 sensitivite), AFS 12 üzeri (% 85 sensitivite) ve FSH 7 altı ( % 73 sensitivite) artmaktadır. Gebe olan ve
olmayan gruplar karşılaştırıldığında yaş, AFS ve over volümü değerlerinde istatistiksel olarak fark
gözlemlenmiştir (p<0.05).
Sonuç: IUI öncesi yapılan over rezervi testlerinden gebelik başarısını göstermede en faydalı belirteç AFS’dır.
134
P55
Birinci Basamak Sağlık Kuruluşlarına Başvuranların Riskli Davranışları ve Etkileyen Faktörlerin Çok
Değişkenli Analizi
Mahmut KILIÇ1
1
Bozok Üniversitesi, Sağlık Yüksekokulu, Hemşirelik Bölümü, Yozgat
Özet
Amaç: Tüm dünyada bulaşıcı olmayan hastalıklar (NCDs) için 4 majör davranışsal risk faktörü; tütün kullanma,
yetersiz fiziksel aktivite, fazla alkol alma ve sağlıksız diyettir. Araştırmanın amacı, il merkezindeki birinci
basamak sağlık kuruluşlarına başvuranların NCDs için majör riskli davranışları ve etkileyen faktörleri
saptamaktır.
Yöntem: Bu bir kesitsel araştırmadır. Araştırma, Yozgat il merkezindeki birinci basamak sağlık kuruluşlarına
başvuran 18 yaş ve üzeri 1085 yetişkin arasında yapıldı. Veriler, görüşmeci aracılığıyla anket uygulanarak
toplandı. Verilerin çok değişkenli analizinde binary lojistik regresyon kullanıldı. Çoklu analize bağımsız
değişken olarak, yaş, cinsiyet, medeni durum, eğitim durumu, çalışma durumu, ekonomik durum, yaşamından
memnun olma ve tanısı konmuş hastalık/ sağlık sorunu varlığı alındı.
Bulgular: Birinci basamak sağlık kuruluşlarına başvuranlarda en çok görülen riskli davranışlar, yetersiz sebzemeyve tüketme, yetersiz egzersiz yapma, yemeklerde yağı ve tuzu kısıtlamama, yüksek BKİ’ye sahip olma iken
(sırayla %90.9, 75.3, 71.1, 68.3 65.7), en az görülenler ise sigara içme (%28.2) ve haftada bir veya daha sık alkol
alma (%1.3) davranışıdır.
Sigara içme olasılığı, erkeklerde, öğrenim durumu ilköğretim ve üzeri olanlarda okul bitirmemişlere göre,
herhangi bir işte çalışanlarda, yaşamından memnun olmayan/ nötr olanlarda, tanısı konmuş hastalık/ sağlık
sorunu olmayanlarda, evlilerde, yaşı küçük olanlarda; yetersiz egzersiz yapma olasılığı, kadınlarda, eşi ölmüş/
eşinden ayrılmış olanlarda, yaşamından memnun olmayan/ nötr olanlarda, yaşı küçük olanlarda; yetersiz sebzemeyve tüketme olasılığı, yalnız yaşı küçük olanlarda; yemeklerde yağ ve tuz kısıtlamama olasılığı, hastalık/
sağlık sorunu olmayanlarda, yaşı küçük olanlarda daha yüksektir. Yüksek BKİ’ye sahip olma olasılığı, evlilerde,
≤ilkokul mezunu olanlarda, ekonomik durumu orta ve yüksek olanlarda, tanısı konmuş hastalık/ sağlık sorunu
olanlarda, yaşı büyük olanlarda daha yüksektir.
Araştırmaya katılanların %31.6’sı ≤3 riskli davranışa, %36.3’ü ise ≥5 riskli davranışa sahiptir.
Sonuç: İl merkezindeki birinci basamak sağlık kuruluşlarına başvuranların 2/3’ünün (sigara ve alkol kullanımı
hariç) riskli davranışı bulunmaktadır. Yaş küçüldükçe riskli davranışların (Yüksek BKİ hariç) görülme olasılığı
atmaktadır. Sağlık kuruluşlarına başvuran yetişkinlerin yaşam tarzının sorgulanması ve riskli davranışlarla ilgili
danışmanlık verilmesi önerilmektedir.
Anahtar kelimeler: Riskli Davranış; Kronik hastalık; Prevalans; Birincil bakım
135
P56
Childhood Eczema and Asthma: A Multilevel 1958 Birth Cohort Study from Childhood to Adult
Ghada Abo-Zaid and Nick Osborne
Introduction
Asthma is a disorder of the lungs that causes inflammation on the airways. Asthma has a high prevalence in the
UK and places a significant burden on public health purse and the NHS. 5.4 million people in the UK are
currently receiving treatment for asthma: 1.1 million children (1 in 11) and 4.3 million adults (1 in 12). Eczema
is an inflammation of the epidermis (the outer layer of the skin). In England, an estimated 1.7 million have been
diagnosed with eczema in their childhood or it is about 1 in 8 school children in the UK. The prevalence of
eczema has been increased in recent decades. A few numbers of studies have been shown an association between
childhood atopic eczema and asthma either by using cross section data or longitudinal data.
However, the
association between childhood eczema with childhood and adult asthma is still controversial.
Aims
In this talk we aim to examine whether the first year childhood eczema does effect on childhood and adult
asthma before and after controlling by sex, smoking status, socio- economic status, breast feeding, birth order
and mother weight on stone.
Methods and Material
The National Child Development Study (NCDS) or 1958 birth cohort study is a longitudinal cohort study began
at the first week birth in 1958 for over 17 000 births. This longitudinal study has been undertaken to investigate
many aspects of health, education, and social development of the cohort member. It was retraced again at age 7
(1963) by designing a survey to collect a data for their educational, physical and social development, and it is
followed by another surveys at age 11 (1969) and 16 (1974). At this stage it is mainly depended on parent’s
questionnaires. In the adult life, the cohort study has been followed up? again by focusing on interview cohort
member (instead from parent’s questionnaire) began at age 23 (1981), and followed by age 33 (1991), 42 (2000),
and 50 (2008) respectively. The focus in this talk is to fit multilevel logistic regression models to examine the
effect of the first year childhood eczema on the childhood (age 11 and 16), and adults asthma (age 21 and 33)
before and after controlled by sex, smoking status, breast feeding, socio-economic status, birth order, and mother
weight on stone.
Results and conclusions
Eight multilevel logistic regression models have been fitted to examine the effect of eczema on asthma before
and after adjusted by other variables (e.g. sex, smoke status, breast feeding) for childhood and adult. In
childhood, we found that there is an association between eczema and asthma (OR= 3.73; CI: 3.26- 4.27); and the
probability of the risk is barely increased after adjusted by sex, breast feeding, birth order , while it is slightly
increase when adjusted by the number of cigarettes per week (OR=4.14; CI: 3.51- 4.86).
136
P57
Gen Ekspresyon Verilerinde Yapay Sinir Ağlarına Dayalı Yeni Bir Denetimli Temel Bileşenler Analizi’nin
Geliştirilmesi
Prof. Dr. Mevlüt Türe, Doç. Dr. İmran Kurt Ömürlü
Adnan Menderes Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Aydın
Özet
Gelişen teknolojiyle birlikte veri toplama ve veri saklama olanaklarındaki artışlar, çok boyutluluk
problemini de beraberinde getirmiştir. Özellikle değişken sayısının birim sayısından fazla olduğu çok boyutlu
verileri klasik istatistiksel yöntemlerle analiz etmek güçtür. Çok boyutlu problemlerin incelenmesi günümüzde
istatistiksel araştırmaların ilgi odağı haline gelmiştir.
Gen verilerinde DNA mikrodizinleri, messenger RNA (mRNA) seviyelerinin eş zamanlı olarak
ölçülmesini olanaklı hale getiren yüksek işlem kapasiteli teknolojilerdir. Gen, hücrenin fonksiyonlarını
gerçekleştiren proteinleri kodlayan bir DNA dizisinin parçasıdır. Bireyler arasında farklı doku ve hastalık
durumlarında, protein üretiminde bir ara ürün olan mRNA’nın miktarı farklı olacağı için, aynı gen farklı
ekspresyon düzeylerine sahip olacaktır. Bu nedenle gen ekspresyon verileri oldukça yüksek boyutlu bir veri
yapısına sahiptir. İstatistiksel yöntemlerin teorik yapısından kaynaklanan sorunlar nedeniyle (birim sayısı
değişken sayısından az olduğu için klasik yaklaşımlar doğrudan uygulanamamaktadır) bu tip çok boyutlu
verilerin bir arada incelenmesi yerine, boyut indirgemesi yapılarak analiz edilmeleri gerekmektedir. Gen
ekspresyon verisinin çok boyutluluk probleminin çözümü ve gen verilerinin yaşam süresi üzerindeki etkisini
belirlemek için klasik TBA yerine Bair ve Tibshirani (2004) tarafından geliştirilen denetimli temel bileşenler
analizi (D-TBA) tercih edilmektedir. D-TBA’da genler arasındaki ilişkilerin doğrusal olduğu varsayılmaktadır.
Kramer (1991)’in önerdiği yapay sinir ağlarına dayalı temel bileşenler analizi (YSA-TBA) klasik TBA’nın esnek
bir genelleştirmesidir. Bu çalışmada çok boyutlu gen verilerinde denetimli-YSA-TBA yaklaşımının geliştirilmesi
ve D-TBA ile karşılaştırılması amaçlanmıştır.
Bu amaçla bir simülasyon programı geliştirilmiş ve R dilinde kodlar yazılarak ön denemeler yapılmıştır.
Ön denemeler sonucunda (50 deneme) D-TBA ile denetimli-YSA-TBA arasında anlamlı bir fark bulunmamıştır
(p>0.05).
Söz konusu çalışma devam etmekte ve alternatif yaklaşımlar denenmektedir.
Anahtar Kelimeler: Gen Ekspresyon; Denetimli Temel Bileşenler Analizi; Yapay Sinir Ağları; Simülasyon
137
P58
Altın Standart Testin Varlığında Çoklu Tanı Testlerinde Birleştirme Yöntemleri
Gülhan OREKİCİ TEMEL1, Semra ERDOĞAN1
Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, MERSİN
ÖZET
Amaç: Klinikte, belirli bir hastalığın tanısının konulmasında referans teste alternatif olarak iki veya daha
fazla yeni testler bir arada kullanılarak karar verilebilir. Bu testlere çoklu tanı testleri denir. Çoklu tanı testleri,
paralel ve seri testler olmak üzere iki basit yöntemle uygulanmaktadır 1. Bu çalışma ile çoklu tanı testlerinin
birleştirilmesi sonucunda kullanılan yöntemlerin diagnostik performansının klinik uygulamalar ile anlatılması
amaçlanmıştır. Yöntem: Paralel testler, belirli bir hastalığın tanısının konulmasında, iki ve daha fazla tanı
testinin aynı zamanda uygulanması ve yorumlanması şeklinde tanımlanmaktadır. Seri testler ise, paralel testlere
alternatif olarak geliştirilmiş olup, ikinci testin uygulanıp uygulanmayacağı birinci testin sonucuna bağlı olarak
belirlendiği testlerdir. İkinci testin uygulanmasının pahalı ya da riskli olduğu durumlarda tercih edilmekte olup
bazen tek bir test sonucunda bile doğrudan karara varılabilmektedir ve böylece de maliyet düşmektedir. Bu
durum bu testin avantajı olarak görülebilmekte iken ikinci testin sonucunun birinci teste bağlı olması da
dezavantajı olarak kabul edilmektedir
1-4
.Tanı testlerinin birleştirme işleminden sonra, bireyin hasta ya da
sağlıklı olup olmadığına karar vermede kullanılan diagnostik istatistiklerin hesaplanması, kullanılan teste ve
birleştirme yöntemine göre değişmektedir. Literatürde paralel ve seri testlerin birleştirilmesi, AND ve OR
kuralına göre farklı şekillerde hesaplanmakta ve yorumlanmaktadır. Bulgular: AND kuralı ile birleştirme
yapılarak karar verme durumunda, birleştirilmiş testlerin duyarlılık değeri her bir test sonucunda elde edilen
duyarlılık değerinden daha düşük, fakat diğer yandan birleştirilmiş testlerin seçicilik değeri her bir test
sonucunda elde edilen seçicilik değerinden daha yüksek olmaktadır 3-4. Seçicilik değeri daha yüksek olduğu için
sağlıklı olan bireyler beklenenden daha az kaçırılacaktır. Fakat yanlış negatif test teşhisi (NPV) beklenenden
fazla olacaktır
4-5
.OR kuralı ile birleştirme yapılarak karar verme durumunda, birleştirilmiş testlerin duyarlılık
değeri her bir test sonucunda elde edilen duyarlılık değerinden daha yüksek, fakat diğer yandan birleştirilmiş
testlerin seçicilik değeri her bir test sonucunda elde edilen seçicilik değerinden daha düşük olmaktadır
3-4
.
Duyarlılık değeri daha yüksek olduğu için hasta olan bireyler beklenenden daha az kaçırılacaktır. Fakat yanlış
pozitif test teşhisi beklenenden fazla olacaktır 5. Sonuç: Belirli bir hastalığın test edilmesinde, tek bir tanı testine
göre karar vermek yerine birden fazla tanı testinin birleştirilmesi sonucunda karar vermekle yanlış pozitif
sonuçların oluşması engellenebilir 4.
Anahtar Kelimeler: Çoklu Testler, AND Kuralı, OR Kuralı
SEÇİLMİŞ KAYNAKLAR
1.
Fletcher RW, Fletcher SW, editors. Clinical Epidemiology the Essentials. Philadelphia: Lippincott
Williams&Wilkins; 2005.
138
2.
Hershey JC, Cebul RD, Williams SV. Clinical guidelines for using two dichotomous tests. Med Decis
Making 1986;6: 68-78.
3.
Weinstein S, Obuchowski NA, Lieber ML. Fundamentals of Clinical Research for Radiologists. AJR 2005;
184: 14-19.
4.
Vitzthum F, Behrens F, Anderson NL, Shaw JH. Proteomics: From Basic research to Diagnostic
Application. A Review of Requrements & Needs. J Proteome Res 2005; 4: 1086-97.
5.
Zhou X, Obuchowski N, McClish D, editors. Statistical Methods in Diagnostic Medicine. New York: John
Wiley&Sons Inc; 2002.
139