bildiri özetleri kitabı
Transkript
bildiri özetleri kitabı
BİLDİRİ ÖZETLERİ KİTABI BİLDİRİ ÖZETLERİ KİTABI ULUSLARARASI KATILIMLI XIV. ULUSAL BİYOİSTATİSTİK KONGRESİ BİLDİRİ ÖZETLERİ KİTABI 4-7 EYLÜL 2012, KAYSERİ Hazırlayanlar Doç.Dr.Ahmet ÖZTÜRK Yrd.Doç.Dr.Ferhan ELMALI Öğr.Gör.Mehmet KÖPRÜ Ar.Gör.Gökmen ZARARSIZ Gözde ERTÜRK Yasemin AKŞEHİRLİ SEYFELİ Uluslararası Katılımlı XIV. Ulusal Biyoistatistik Kongresi, Erciyes Üniversitesi Bilimsel Araştırma Projeleri Koordinasyon Birimi tarafından "TSS-12-4045" proje kodu ile desteklenmiştir. ÖNSÖZ Değerli bilim insanları, Biyoistatistik Derneği ve Erciyes Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıp Bilişimi Anabilim Dalı olarak 4-7 Eylül 2012 tarihlerinde “Uluslararası Katılımlı XIV. Ulusal Biyoistatistik Kongresi"ni Kayseri’de düzenlemekten duyduğumuz mutluluğu belirtmek isteriz. Kongremize yurtiçinden 170, yurtdışından 22 araştırmacı katılmıştır. Kongremizde 4 davetli konuşmacı sunumu, 48 sözlü sunum, 58 poster sunum yer almıştır. Türkçe sözlü sunumlardan 3, İngilizce sözlü sunumlardan 3 ve poster sunumlardan 3 bildiri bilimsel jüri tarafından ödüllendirilmiştir. Ayrıca 4 Eylül 2012 tarihinde Erciyes Üniversitesi’nde düzenlenen dört adet kursa toplam 110 kursiyer katılmıştır. Kongremize davetli konuşmacı, oturum başkanı, bildiri sunucusu ve dinleyici olarak üniversitelerimizden, sağlık kuruluşlarımızdan ve çeşitli iş sektörlerinden katkı veren tüm katılımcılarımıza teşekkürü bir borç biliriz. Kongremizin düzenlenmesinde katkıda bulunan ve desteklerini esirgemeyen başta Erciyes Üniversitesi Rektörlüğü’ne, Kayseri Büyükşehir Belediye Başkanlığı’na, Talas Belediyesi Başkanlığı’na, Orta Anadolu Kalkınma Ajansı’na, Kayseri Ticaret Odası’na, Merkez Çelik AŞ.’ye, Özel Modern Dünya Hastanesi’ne, Hisar Pastaneleri’ne, Kadir Has Kongre Merkezi görevlilerine, AÇI Turizm’e, SAS ve BYSGroup yazılım firmalarına teşekkür ederiz. Son olarak kongremizin düzenlenmesi ve yürütülmesinde özveriyle çalışan düzenleme kurulu üyelerine şükranlarımızı sunarız. Doç.Dr.Ahmet ÖZTÜRK Prof.Dr.Kadir SÜMBÜLOĞLU Kongre Başkanı Biyoistatistik Derneği Başkanı I Onursal Kurul Kongre Onursal Başkanları Prof. Dr. H. Fahrettin KELEŞTEMUR, Erciyes Üniversitesi Rektörü Prof. Dr. Kadir SÜMBÜLOĞLU, Biyoistatistik Derneği Başkanı Onur Kurulu Mehmet ÖZHASEKİ, Kayseri Büyükşehir Belediye Başkanı Prof. Dr. Mustafa ÇETİN, Erciyes Üniversitesi Rektör Yardımcısı Prof. Dr. Muhammet GÜVEN, Erciyes Üniversitesi Tıp Fakültesi Dekanı Prof. Dr. Osman GÜNAY, Erciyes Üniversitesi Tıp Fakültesi Dekan Yardımcısı Düzenleme Kurulu Yrd. Doç. Dr. Ahmet ÖZTÜRK Erciyes Üniversitesi Kongre Başkanı Yrd. Doç. Dr. Ferhan ELMALI Erciyes Üniversitesi Kongre Sekreteri Prof. Dr. Kazım ÖZDAMAR Eskişehir Osmangazi Üniversitesi Üye Prof. Dr. Hamza EROL Abdullah Gül Üniversitesi Üye Doç. Dr. Adem KALINLI Erciyes Üniversitesi Üye Doç. Dr. Betül ÇİÇEK Erciyes Üniversitesi Üye Doç. Dr. Erdem KARABULUT Hacettepe Üniversitesi Üye Doç. Dr. M. Mümtaz MAZICIOĞLU Erciyes Üniversitesi Üye Doç. Dr. Yavuz SANİSOĞLU Yıldırım Beyazıt Üniversitesi Üye Yrd. Doç. Dr. S.Kenan KÖSE Ankara Üniversitesi Üye Yrd. Doç. Dr. Ünal ERKORKMAZ Gaziosmanpaşa Üniversitesi Üye Dr. Marta GARCIA-FINANA Liverpool Üniversitesi Üye Öğr. Gör. Mehmet KÖPRÜ Erciyes Üniversitesi Üye Araş. Gör. Gökmen ZARARSIZ Erciyes Üniversitesi Üye II Bilimsel Danışma Kurulu Prof. Dr. A. Ergun KARAAĞAOĞLU Prof. Dr. Ahmet DİRİCAN Prof. Dr. Atilla Halil ELHAN Prof. Dr. Celal Reha ALPAR Prof. Dr. Emine Arzu KANIK Prof. Dr. Fikret İKİZ Prof. Dr. Hafize SEZER Prof. Dr. Handan ANKARALI Prof. Dr. İlker ERCAN Prof. Dr. İsmet DOĞAN Prof. Dr. Kazım ÖZDAMAR Prof. Dr. M. Yusuf ÇELİK Prof. Dr. Mevlüt TÜRE Prof. Dr. Mustafa ŞENOCAK Prof. Dr. M. Nurullah ORMAN Prof. Dr. Nazan ALPARSLAN Prof. Dr. Nural BEKİROĞLU Prof. Dr. Osman SAKA Prof. Dr. Osman SARAÇBAŞI Prof. Dr. Ömer SATICI Prof. Dr. Refik BURGUT Prof. Dr. Rian DİŞÇİ Prof. Dr. Saim YOLOĞLU Prof. Dr. Vildan SÜMBÜLOĞLU Prof. Dr. Yüksel BEK Doç. Dr. Ayşe Canan YAZICI Doç. Dr. Bahar TAŞDELEN Doç. Dr. Beyza AKDAĞ Doç. Dr. Canan BAYDEMİR Doç. Dr. Cemil Çolak Doç. Dr. Erdem KARABULUT Doç. Dr. Ersin ÖĞÜŞ Doç. Dr. Fezan MUTLU Doç. Dr. Gülşah SEYDAOĞLU Doç. Dr. İmran KURT ÖMÜRLÜ Doç. Dr. K. Setenay ÖNER Doç. Dr. Mehtap AKÇİL Doç. Dr. Meriç ÇOLAK Doç. Dr. Necdet SÜT Doç. Dr. Semra AKGÖZ Doç. Dr. Sıddık KESKİN Doç. Dr. Yasemin GENÇ Doç. Dr. Yavuz SANİSOĞLU Doç. Dr. Zeki AKKUŞ Doç. Dr. Ayşe Canan YAZICI Doç. Dr. Bahar TAŞDELEN Doç. Dr. Beyza AKDAĞ Doç. Dr. Canan BAYDEMİR Doç. Dr. Cemil Çolak Doç. Dr. Erdem KARABULUT Doç. Dr. Ersin ÖĞÜŞ Doç. Dr. Fezan MUTLU Doç. Dr. Gülşah SEYDAOĞLU Doç. Dr. İmran KURT ÖMÜRLÜ Doç. Dr. K. Setenay ÖNER Doç. Dr. Mehtap AKÇİL Doç. Dr. Meriç ÇOLAK Doç. Dr. Necdet SÜT Doç. Dr. Semra AKGÖZ Doç. Dr. Sıddık KESKİN Doç. Dr. Yasemin GENÇ Doç. Dr. Yavuz SANİSOĞLU Doç. Dr. Zeki AKKUŞ III İÇİNDEKİLER Sunum ÇAĞRILI BİLDİRİLER no. D01 Biyoistatistik Etiği, Z.Nazan ALPARSLAN .................................................................................................. D02 Sayfa no 2 Hybrid RBF Neural Network Models for Supervised Classification of Medical Data With Information Complexity And The Genetic Algorithm, Hamparsum BOZDOGAN............................................................................................... D03 Correspondence Analysis in Biological Research, Michael GREENACRE .................................................................................................. D04 Sunum II. SÖZLÜ BİLDİRİLER no 7 8 ROC Analizinde Kesim Noktası Belirlemede Kullanılan Yöntemlere Alternatif Bir Öneri, İlker ÜNAL, Refik BURGUT, Yaşar SERTDEMİR ......................................................... S04 Sayfa no İkili Yöntem Kıyaslamalarında Bir Görsel Yaklaşım Önerisi, Mustafa Ş. ŞENOCAK.................................................................................................... S03 5 Tanı Testi Yargılamalarında Kesim Noktası Kestirimi İçin Bir Yaklaşım, Mustafa Ş. ŞENOCAK, Özden CALAY........................................................................... S02 4 Generalized Penalized Cananical Correlation Analysis, AeilkoHaving ZWINDERMAN....................................................................................... S01 3 9 Biyoeşdeğerlik Çalışmalarında Birey İçi Değişkenliğin Eşitliğine Yönelik Testlerin Değerlendirilmesi, Nur Özge SEZGİN,Mehmet N. ORMAN.......................................................................... S05 GeneLearneR: Genetik Veri Madenciliği Analiz Aracı, Erdal COŞGUN, Aydın KAYA, Ali Seydi KEÇELİ, Ergun KARAAĞAOĞLU……………. S06 12 Major Voting Gap Statistic to Estimate the Number of Clusters in a Dataset, Gökmen ZARARSIZ, Ahmet OZTÜRK, Erdem KARABULUT, Erdal COŞGUN................ S07 10 14 Dikotom Sonuçlu Yorumlamalarda, 2'den Fazla Değerlendiricinin Sonuç Uyumlarının Fleiss Kappa ve Cochran Q ile Değerlendirmelerinin İrdelenmesi, Pınar AMBARCIOĞLU, Nurgül BULUT , Mehmet KIZILÇEÇ ......................................... S08 “Sıfır Olgu” Tasarımının Benzetim Çalışması İle Değerlendirilmesi, Yeşim TUNÇ,Alev BAKIR, Pınar AMBARCIOĞLU, Mustafa Ş.ŞENOCAK ................... S09 15 17 Ters örnekleme – I Ters örnekleme yaklaşımında sonuç güvenirliğini etkileyen ögeler, F. Nesrin TURAN ,Nurgül BULUT , Esra Ş. YILMAZ, Mustafa Ş.ŞENOCAK .................. IV 19 S10 Ters Örnekleme – II Ters Örnekleme Yaklaşımında Önkabulsel Olgu Sayısının Sonuç Güvenirliğine Etkileri, Nurgül BULUT, Alev BAKIR, Pınar AMBARCIOĞLU, Mehmet KIZILÇEÇ , Yeşim TUNÇ, Esra Ş.YILMAZ, Ali BAYKUŞ, Mustafa Ş.ŞENOCAK........................................ S11 21 Mikrodizilim Gen İfade Çalışmalarında Genelleştirme Yöntemlerinin Regresyon Modelleri Üzerine Etkisi, Selen YILMAZ IŞIKHAN, Erdal COŞGUN, Erdem KARABULUT, C. Reha ALPAR ........ S12 Gene Expression Data Mining with Artificial Immune Clonal Selection Algorithms Akin ÖZÇİFT................................................................................................................. S13 25 The Application of Time-Weighted Control Charts in Medical Practice, Leman TOMAK, Yüksel BEK ........................................................................................ S14 23 26 Bayesian Model Selection Criteria for Generalized Linear Models with Nonignorably Missing Data, Zeynep Işıl KALAYLIOĞLU .......................................................................................... S15 Gri İlişki Analizi, Gürol ZIRHLIOĞLU, Neslihan AKÇA, Serap KESKİN.................................................... S16 27 28 Hastane çalışanlarının Maslach Tükenmişlik ölçeğine göre değerlendirilmesi; Çok merkezli bir çalışma M.Yusuf ÇELİK, M.Mutlu DAŞDAĞ, D.ŞAHİN, Ömer SATICI, Zeki AKKUŞ, İsmail YILDIZ S17 29 Çok Sınıflı Destek Vektör Sınıflamasında Hata Düzeltmeli Çıkış Kodları Yaklaşımlarının Karşılaştırılması: Bir simülasyon çalışması, Özge AKŞEHİRLİ, Handan ANKARALI, Duygu AYDIN, Davut BALTACI...................... S18 Posterior Power Analysis with R Software: A Simulation Study, Pınar Günel KARADENİZ, Nural BEKİROĞLU.............................................................. S19 30 31 Eşit Örneklemli Randomize Kontrollü Çalışmalarda Kullanılan İki Elemanlı Rasgele Dizinin Karmaşıklık Kriteri, Ömer Utku ERZENGİN ,Sıddıka Gamze ERZENGİN........................................................ S20 32 Dört Gözlü Kontenjans Tablolarında Yates Düzeltmeli Ki-Kare Testinin İncelenmesi: Simülasyon Çalışması, Selçuk KORKMAZ, Necdet SÜT .................................................................................... S21 33 Maddeler Arası Korelasyon Yapısı ve Örneklem Genişliğinin Faktörleşmedeki Rolü: Bir Simülasyon Çalışması, Duygu AYDIN, Handan ANKARALI, Özge Yılmaz AKŞEHİRLİ..................................... S22 Hibrit Hiyerarşik Kümeleme Yöntemi ve Sağlık Alanında Bir Uygulaması Gözde ERTÜRK, Gökmen ZARARSIZ, Ahmet OZTURK , Ferhan ELMALI...................... S23 35 Varyans Bileşeni Tahmin Yöntemlerine Yönelik Bir Değerlendirme İlkay DOĞAN, İbrahim KILIÇ, Cengiz GAZELOĞLU, Sinan SARAÇLI........................... S24 34 36 Rakip Risk İçeren Sağkalım Fonksiyonlarının Karşılaştırılmasında Log-Rank ve Wilcoxon Testlerinin Etkinliği: Bir Simülasyon Çalışması, Melike GEDUK, Yaşar SERTDEMİR, H. Refik BURGUT................................................ V 37 S25 İki Değişkenli Weibull Dağılımları ile Yaşam Verilerinin Modellenmesi, Ayça Hatice TÜRKAN, Nazif ÇALIŞ, Hamza EROL........................................................ S26 38 Hastalıkların Yersel Kümelenmelerinin Belirlenmesinde Kullanılan Satscan V9.1 ve Flexscan V3.1 Programlarının Rasgele ve Koşullu, Türetilmiş Verilerde Karşılaştırılması Özge BOLLUK, Canan BAYDEMİR, Kazım ÖZDAMAR................................................. S27 Hastanelerin Etkinliklerinin Veri Zarflama Analizi İle Belirlenmesi: Afyonkarahisar Örneği, Gizem GÜLSEVİN, Ayça Hatice TÜRKAN..................................................................... S28 40 41 Yaşam Kalitesinin Yapısal Eşitlik Modeli ile Analizi: Afyon Kocatepe Üniversitesi Akademisyenleri Üzerine Bir Uygulama, Birol TOPÇU, Sinan SARAÇLI, Cengiz GAZELOĞLU.................................................... S29 43 İzlem Süresi İçerisinde Belirteçlerin Performanslarını Değerlendirmede Zamana Bağlı ROC Eğrisi, Eda KARAİSMAİLOĞLU, Umut ARSLAN, A. Ergun KARAAĞAOĞLU........................ S30 45 Veri Madenciliği Sınıflama Yöntemlerinin Başarılarının; Örneklem Büyüklüğü, Bağımlı Değişken Prevelansı ve Bağımsız Değişkenler Arası İlişki Miktarına Göre Karşılaştırılması, M. Özgür DOLGUN, N. Anıl DOLGUN, Osman SARAÇBAŞI......................................... S31 47 Zaman Serilerinin Modellenmesi ve Geleceğe Yönelik Kestirimlerinin Değerlendirilmesi: 1928-2010 Hekim Başına Düşen Kişi Sayısı Örneği, Mustafa Agah TEKİNDAL, Yasemin GENÇ................................................................... S32 Kanonik Uyum Analizi ve Sağlık Alanında Bir Uygulaması, Sıddık KESKİN, Sadi ELASAN, A. Cumhur DÜLGER..................................................... S33 49 51 Ülkemizdeki Sezaryen Oranlarının Dünya Verileri ve Çeşitli Kadın İstatistikleri Işığında Değerlendirilmesi, Mervin M. ATAY, Z. Nazan ALPARSLAN...................................................................... S34 52 A New Dimension Reduction Technique Using Information Complexity for High Dimensional Gene Expression Data, Esra PAMUKCU, Hamparsum BOZDOGAN, Cemil ÇOLAK............................................ S35 53 Doğrulama Yanlılığında Kullanılan Eksik Gözlem Analizi Yöntemlerinin Performanslarının İncelenmesi, Jale KARAKAYA, Erdem KARABULUT, Recai YÜCEL, Ergun KARAAĞAOĞLU......... S36 54 Karar Ağacı Yönteminin Kestirim Yeterliliğinin İrdelenmesi; Bipolar Depresyon Tanısı Üzerinden Bir Değerlendirme, Mehmet Güven GÜNVER, Ali BAYKUŞ, Günalp UZUN................................................. S37 55 Some Observations on the Design of Early Stage Clinical Trials in the Pharmaceutical Industry, Hans HOCKEY ............................................................................................................ S38 56 Beta-Weibull Distribution for Simple Linear Regression and Its Locally D-Optimal Design, Habib JAFARI.............................................................................................................. VI 57 S39 Estimation under Progressive Type-II censoring for Reciprocal Exponential Distribution, Sumeet KAUR............................................................................................................... S40 58 Small-study Effects in Individual Patient Data Meta-analysis of Prognostic Factor Studies, Ghada M. ABO-ZAID, Jon J. DEEKS, Richard D. RILEY................................................. S41 59 Recent OPLS Statistical Model versus Traditional Linear Regression to Assess Sonographic Predictors of Stroke Prognosis, H. Sadeghi-BAZARGANI, K. FATHI, R. MEHDIZADEH, D. Savadi-OSKOUEI, M. FARHOUDI.............................................................................................................. S42 61 Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different Temperatures, H. ESMAILY,M. Hadi ALIJANVAND, H. DOOSTI, M.T. SHAKERI……………..……… S43 62 Salmonella Infantis: Assessing Causes and Trends, Sarah SALTER, Dr.Kate COWLES, Fan TANG, Monelle TAMEGNON, Amanda LUBY, Kevin TORRES.............................................................................................................. S44 Thevariance: A New Formula, Muawia ABDELSALAM................................................................................................ S45 63 64 On the estimation based on generalized order statistics for the location and scale parameters of Burr12 Distribution, Reza Arabi BELAGHI,Minoo AMINNEJAD .................................................................. S46 On The Least Trimmed Square (LTS) Estimation for Burr XII Model, Reza Arabi BELAGHI,Mehdi Pour ABDOLLAH ............................................................ S47 no P01 67 WGEE ve MI-GEE Yöntemlerinin Karşılaştırılması, Gazel SER ..................................................................................................................... Sunum 66 Statistical Models of Postnatal Transmission of HIV-India, D.M. BASAVARAJAIAH, B.NARASIMHAMURTHY.................................................... S48 65 III-POSTER BİLDİRİLER 68 Sayfa no. Sınıflandırma Ağacı için Alternatif Bölünme Kurallarının Performanslarının Karşılaştırılmasına İlişkin Simülasyon Çalışması İmran Kurt ÖMÜRLÜ, Mevlüt TÜRE.............................................................................. P02 Birinci Tür Hata’nın Kontrolünde Yanlış Bulgu Oranı Yaklaşımı, Nurhan DOĞAN, İsmet DOĞAN..................................................................................... P03 71 Birinci Tür Hatanın Kontrolünde Adımsal Çoklu Karşılaştırma İşlemleri, İsmet DOĞAN, Nurhan DOĞAN..................................................................................... P04 70 72 Sağlık Personelinin Hasta Hakları Konusunda Bilgi Tutum ve Davranışlarının Ana Bileşenler Yöntemi İle Değerlendirilmesi, M. Yusuf ÇELİK, M.Mutlu DAŞDAĞ, Ömer SATICI, Zeki AKKUŞ, İsmail YILDIZ.......... VII 73 P05 Kanserli Hastalarda; Kanserin Vücuttaki Tutulum Bölgeleri, Hastaların Cinsiyet, Eğitim Düzeyi ve Mevsimsel Dağılımına Göre İncelenmesi, Ömer SATICI, M.Yusuf ÇELİK, Zeki AKKUŞ, İsmail YILDIZ, M. Mutlu DAŞDAĞ…….. P06 74 Sonuç Değişkeninin İki Sonuçlu Olduğu Durumda İki Değerlendirici ya da İki Yöntem Arasındaki Uyumun Değerlendirilmesinde Yeni Bir Yaklaşım: Birey Uyum Katsayısı (CIA), Semra ERDOĞAN, Gülhan OREKİCİ TEMEL................................................................. P07 76 Adolesan Bireylerin Boy ve Ağırlıklarına İlişkin İfadelerinin, Ölçümlerle Karşılaştırılması, Elçin BALCI, Ferhan ELMALI, Osman GÜNAY.............................................................. P08 Bagging Support Vector Machines for Leukemia Classification, Gökmen ZARARSIZ, Ferhan ELMALI, Ahmet ÖZTÜRK................................................. P09 85 Tanı Testlerinin Aile Hekimliğindeki Kullanımına Bir Örnek, Zekeriya AKTÜRK, Kamber KAŞALİ............................................................................. P12 84 Genellenebilirlik Kuramı, Pervin DEMİR, Atilla Halil ELHAN, Derya ÖZTUNA...................................................... P11 83 A Voting Approach for SVM Kernel Selection in Gene Expression Profiling Gökmen ZARARSIZ,Cenk İÇÖZ, Erdener ÖZÇETİN....................................................... P10 78 86 Yaşam Analizleri’nde Random Survival Forests ve Cox Regresyon Yöntemleri’nin Karşılaştırılması, Ferhan ELMALI, Engin ÖZKAN, Ahmet ÖZTÜRK, Gökmen ZARARSIZ, Serdar ŞIVGIN P13 88 İneklerde Eko-Yapı Değişkenler Kullanılarak Kronik Endometritis Derecelerinin ROC Eğrisi Yöntemi İle Belirlenmesi, İ. Safa GÜRCAN,Ayca BABAK, Doğukan ÖZEN,Aytekin YAMAÇ, Özlem GÜLLÜ......... P14 89 Hayvancılıkta Verimli Yaşam Süresi Hesaplamalarında Frailty Modellerin Uygulanabilirliği, Doğukan ÖZEN, İ. Safa GÜRCAN, Özlem GÜLLÜ.......................................................... P15 Etçi Piliçlerde Karkas Özelliklerinin Temel Bileşenler Analizi ile Değerlendirilmesi, Aytaç AKÇAY, Mustafa UĞURLU, Akın YAKAN, Fatih ATASOY.................................. P16 90 91 Tahmin Modellerinin Performanslarının Değerlendirilmesi, Özlem GÜLLÜ, Mustafa Agâh TEKİNDAL, Doğukan ÖZEN, İ.Safa GÜRCAN, Yasemin GENÇ.............................................................................................................. P17 92 Lojistik Regresyon Analizi (Lra), Yapay Sinir Ağları (Ysa) ve Sınıflandırma ve Regresyon Ağaçları (C&Rt) Yöntemlerinin Karşılaştırılması, Emre KUYUCU,Ünal ERKORKMAZ, İlker ETİKAN, Osman DEMİR ............................. P18 Ergenlerde Madde Kullanımı Tutum Analizi, Serpil Sevimli DENİZ,Hayrettin OKUT,Sanem ŞEHRİBANOĞLU.................................... P19 95 Poisson Regresyon ve Sağlık Alanında Bir Uygulaması, Esra GÜLTÜRK, Sibel ŞENER....................................................................................... P20 94 96 Genetik Risk Skoru Dağılımını Etkileyen Faktörler, Bahar TAŞDELEN, Havva Didem OVLA ....................................................................... VIII 97 P21 AB/BA Çapraz Geçişli Denemelerinde Tip I Hata Oranı ile İlişkili Faktörler , Didem DERİCİ, Bahar TAŞDELEN ................................................................................ P22 98 Sınıflama Metotlarında Yeni Bir Yaklaşım: Çok Değişkenli Eklemeli Regresyon Ağaçları (MART) , Gülhan OREKİCİ TEMEL, Handan ANKARALI, Semra ERDOĞAN, Aynur ÖZGE........... P23 99 Boylamsal İki Durumlu Cevap Değişkeni İçin Genelleştirilmiş Tahmin Denklemi ve Kuadratik Çıkarım Fonksiyonu Yöntemlerinin Karşılaştırılması: Kolon Kanseri verisi üzerine bir uygulama, Anıl Aktaş SAMUR, İbrahim GOKTAŞ, Osman SAKA..................................................... P24 100 Prostat Spesifik Antijeni Yardımı İle Prostat Kanserinin Değişik Yapay Sinir Ağı Modelleri İle Tahmini, , Mehmet Onur KAYA ,Cemil ÇOLAK, Enver ÖZDEMİR .................................................. P25 101 Bilgi Güvenliği Ve Kalite Yönetim Sistemleri Arasındaki İlişkinin İncelenmesi Ve Bir Uygulaması, Necati ALASULU, Nurhan HALİSDEMİR, Cemil ÇOLAK .............................................. P26 102 Üniversite Hastanelerinde Risk Yönetimi Değişkenlerinin Logistik Regresyon Yöntemiyle İncelenmesi, İsmail YILDIZ, Yusuf ÇELİK, Ömer SATICI, Zeki AKKUŞ, Mutlu DAŞDAĞ, Murat BİÇİMLİ.............................................................................................................. P27 Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri Funda Seher ÖZALP, Derya ÖZTUNA............................................................................ P28 103 104 Sonuç Ölçümlerinde Değişime Duyarlılığın Değerlendirilmesinde Kullanılan Yöntemler, Mustafa Emre NAKIŞ, Derya ÖZTUNA, Atilla Halil ELHAN, Burcu YANIK.................... P29 105 Temel Bileşenler Regresyon Analizi ve Bir Uygulama, Emrah CİLVEZ, Atilla Halil ELHAN, Derya ÖZTUNA, Halil İbrahim ACAR, Beyza Doğanay ERDOĞAN...................................................................................................... P30 Sivas’ta Diyabetik Ayak Görülme Sıklığının Bayesçi Yaklaşımla Tahmin Edilmesi, Hafize SEZER, Sarper YILMAZ, R. Erol SEZER............................................................. P31 109 Laboratuvar Hayvanlarının Kullanıldığı Özel Deney Tasarımları ve Örneklem Hacmi, Şengül CANGÜR, Handan ANKARALI........................................................................... P34 108 Taguchi Metodu ve Hayvancılık Alanında Uygulaması, Adile TATLIYER, Hikmet ORHAN ............................................................................... P33 107 Tarama İstatistikleri ve Türkiye Ölüm İstatistikleri Üzerine Uygulamaları, Ayten YİĞİTER, Rabia Burcu DEMİRTÜRK................................................................... P32 106 110 K-En Yakın Komşuluk, Yapay Sinir Ağları ve Karar Ağaçları Yöntemlerinin Sınıflandırma Başarılarının Karşılaştırılması, Fürüzan KÖKTÜRK,M. Çağatay BÜYÜKUYSAL, Vildan SÜMBÜLOĞLU...................... P35 111 Küresel Sağlık İstatistiklerinin Görsel Sunumu: Gapminder Örneği, Songül ÇINAROĞLU.................................................................................................... IX 112 P36 Afyonkarahisar İl Jandarma ve Hava Meydan Komutanlığında Görevli Er-Erbaşların Aile Planlaması Yöntem Kullanma Durumlarının Değerlendirilmesi, Ebru BÜYÜKEREN....................................................................................................... P37 113 Adana'da Yaşayan 9-15 Yaş Grubu Çocukların Vücut Kitle İndeksinin (VKİ) Değerlendirilmesi ve Obezite, Yaşar SERTDEMİR, Refik BURGUT, İlker ÜNAL........................................................... P38 Destek Vektör Makinesi Modelleri ile Miyokardİnfarktüsün Sınıflandırılması, Emek GÜLDOĞAN, Jülide YAĞMUR, Saim YOLOĞLU, Musa H.ASYALI, Cemil ÇOLAK P39 115 Dekorasist : Bina İçi Dekorasyona Yönelik Öneri Sistemi, Fidan KAYA,Gürel YILDIZ, Adnan KAVAK................................................................... P40 114 116 1964-1994 Tarihleri Arasında Bildirilen Kızamık Vakalarından Olan Ölümlerin Zamana Bağlı İncelenmesi, Serhat HAYME, Serdal Kenan KÖSE, Derya ÖZTUNA, Beyza Doğanay ERDOĞAN….... P41 117 Epileptik Hastalarda Algılanan Sosyal Destek Düzeyleri ve Depresyon Durumlarının İrdelenmesi, Demet ÜNALAN, Ferhan SOYUER, Ali Özdemir ERSOY................................................ P42 Optimal Cut Finding for the Hierarchical Clustering Using Background Information, Askar OBULKASIM, Gerrit A. MEIJER, Mark A. van de WIEL........................................ P43 128 Generating Rules to Increase Production Using Decision Tree in Car Industry, M. DAVOODI, M. HOSEINZADEH, H. Gholami MAZINAN…....................................... P51 127 Identifying Cancer Patterns among Iranian Population using Cluster Analysis, Navid YARALI, Masoud SALEHI, Ali MOEINI, Iman NAVIDI........................................ P50 126 On Nonparametric Prediction in Reliability Analysis, M. CHAHKANDI, J. AHMADI....................................................................................... P49 125 Testingthe Normal Assumption of Data Based on Entropy, Hadi Alizadeh NOUGHABI, NaserReza ARGHAMI......................................................... P48 124 Normality and Exponentiality Tests, Hadi Alizadeh NOUGHABI, Naser Reza ARGHAMI........................................................ P47 123 Guideline for the Design and Statistical Analysis of Biological Experiments, Mahmoud Hozayn MAHMOUD...................................................................................... P46 122 A Benchmark for Docking of 60 Protein-Ligand Complexes, Anton STOILOV, Radoslav MAVREVSKI....................................................................... P45 119 Quality of Life Among Healty Elderly (65 Years and Older) In Shiraz, Iran, Sareh KESHAVARZI, Seyed Mehdi AHMADI................................................................. P44 118 129 Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different Temperatures, H. ESMAILY, M. Hadi ALIJANVAND, H. DOOSTI, M.T.SHAKERI............................... P52 130 Age at Menopause Among Rural Women of Marrakech (Morocco), R. LOTFI,M. LOUKID, M.K. HILALI............................................................................ X 131 P53 Veri Madenciliği Kullanılarak Diyabet Verilerinin Analizi, Mete ÇELİK, Cevat YAZICI, Mustafa YİĞİTOĞLU, Murat YENİSU, Fatih TANRIVERDİ P54 İntrauterin İnseminasyon (IUI)’da Ovariyan Rezerv Belirteçlerinin Karşılaştırılması, Gökalp ÖNER............................................................................................................... P55 132 134 Birinci Basamak Sağlık Kuruluşlarına Başvuranların Riskli Davranışları ve Etkileyen Faktörlerin Çok Değişkenli Analizi, Mahmut KILIÇ.............................................................................................................. P56 135 Childhood Eczema and Asthma: A Multilevel 1958 Birth Cohort Study From Childhood to Adult Ghada ABO-ZAID , Nick OSBORNE.............................................................................. P57 136 Gen Ekspresyon Verilerindeyapay Sinir Ağlarına Dayalı Yeni Bir Denetimli Temel Bileşenler Analizi’nin Geliştirilmesi, Prof. Dr. Mevlüt TÜRE, Doç. Dr. İmran Kurt ÖMÜRLÜ................................................... P58 137 Altın Standart Testin Varlığında Çoklu Tanı Testlerinde Birleştirme Yöntemleri Gülhan OREKİCİ TEMEL, Semra ERDOĞAN…………………………………………… XI 138 I. ÇAĞRILI BİLDİRİLER 1 D01 Biyoistatistik Etiği Z. Nazan Alparslan1 1 Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana Özet İstatistik etiği ilk olarak W.Edward Deming (1900-1993) tarafından tartışılmış bir kavramdır, bu ilk tartışmada Deming istatistikçinin bilimsel sorumluluklarını ele almıştır. Daha sonra 1999 da ASA (American Statistical Association) tarafından kabul edilen Ethical Guidelines for Statistical Practice ise istatistikçilerin etik sorumluluklarını 8 başlık halinde özetler. Ancak, tabii ki istatistiksel etiğin biyoistatistiksel etikten farkı olması gerekir. Çünkü biyoistatistik bir tıp alanıdır ve bu bilim dalının yöntemleri ile yapılan hatalar, insan sağlığına veya hayatına bedel olabilir, ya da bedel olacak yanlış uygulamalara temel oluşturabilir. Son zamanlarda kanıta dayalı tıp uygulamalarındaki gelişmeler klinik araştırmaya, araştırma metodolojisine verilen değeri önemli ölçüde etkilemiştir. Bir biyoistatistikçinin de bu alandaki sorumluluğu kanıtı değerlendirmenin yöntemleri konusunda bilinç geliştirmenin yanında doğru kanıtın yaratılmasına desteği de içerir. Kanıta dayalı tıp uygulamaları araştırmada biyoistatistikçiye düşen görevin de yeniden şekillenmesine neden olmuştur. Bu bağlamda biyoistatistik desteğinden beklenti değişmiş, neredeyse ‘uygun p-değeri’ olarak özetlenebilecek eski beklenti yerini ‘uygun yöntemlerle yapılmış, analiz edilmiş ve yazılmış ‘güvenilir’ bir araştırma’ beklentisine bırakmıştır. Tıp başta birçok alan ‘kanıt’ peşindedir, biyoistatistik ‘kanıt yaratma’ konusunda önemli bir araçtır ve kanıt yaratma sürecinde farklı aşamalarında biyoistatistikçiye düşen görevler çok çeşitlidir. Bu görevlerin etik penceresinden gözden geçirilmesi ya da tartışılması biyoistatistik etiği ile ilintili konuların maddeleşmesi konusunda yol gösterici olabilir. Kanıt yaratma sürecinde biyoistatistikçiye düşen görevlerin alanları; çalışma planlanırken,çalışma protokolu oluşturulup kaydı yapılırken, çalışma yürütülürken, analiz edilirken ve raporlanırken olarak gruplanabilir. Bu gruplamada söz edilen her aşama içerdiği sorumlulukların yerine getirilmesi konusunda kendine has etik değer(ler) taşır. Bu aşamaların etik penceresinden değerlendirileceği sunumda, ayrıca biyoistatistikçilerin emeğinin nihai karşılığı olarak nitelendirilebilecek ‘yazarlık hakları’ konusu da bu bağlamda gözden geçirilecektir. Bu sunum ile biyoistatistik alanının etik kuralları konusunda bir açılım amaçlanmaktadır. 2 D02 Hybrid RBF Neural Network Models for Supervised Classification of Medical Data With Information Complexity And The Genetic Algorithm (1) Hamparsum Bozdogan1 1 The University of Tennessee, Operations and Management Science andCenter for Intelligent Systems and Machine Learning (CISML), Department of Statistics, Knoxville, TN, U.S.A. Abstract In this paper we introduce and develop a novel supervised classification technique using a Hybrid Radial Basis Function Neural Networks, abbreviated as HRBF-NN. As is well known, recently, kernel-based supervised classification techniques such as the Support Vector Machines (SVMs) and multi-class SVMs have become popular. One problem that has not been addressed in the literature is that kernelization and supervised classification takes place in the high dimensional Reproducing Hilbert Kernel Space (RHKS) and not in the original data space. The transformed kernel space mapping is not one-to-one and onto, and not invertible to the original data space due to the dot product operations using the kernel trick. This makes the practical interpretation of the results difficult even though one can get good classification error rates. The new HRBF-NN approach proposed in this paper overcomes the difficulties encountered in the RHKS type supervised classification and provides us a flexible technique in the original data space that combines regression trees, regularized regression, and the genetic algorithm (GA) with radial basis function (RBF) neural networks (NN) along with information complexity (ICOMP) criterion as the fitness function to carry out both classification and at the same time subset selection of best predictors which discriminate between the classes. We apply HRBF-NN supervised classification to simulated data and as well as on several benchmark real medical data sets using training and testing, and cross-validate our results 1000 times. We obtain the classification accuracy of our results for both saturated model and also for best subset GA selected predictors under the best fitting RBF kernel function. Our results show the excellent performance of this new approach in the original data space. This new method handles also categorical variables without any difficulties where one does not need to assume that the categories come from a "hidden continuous probability distribution.” Indeed, the RBF kernels automatically put “pseudo distribution” over the categories and overcome the arbitrary assumption of the "hidden continuous probability distribution." Our numerical results show the high classification accuracy over other supervised classification methods on the same data sets. Keywords: Hybrid Radial Basis Function Neural Networks, Supervised Classification, Information Complexity, the Genetic Algorithm (1) Joint work with Dr. Oguz Akbilgic Istanbul University School of Business, Department of Quantitative Methods, Istanbul, Turkey E-mail: [email protected] Prof. Dr. Hamparsum Bozdogan: Email: [email protected] 3 D03 Correspondence Analysis in Biological Research Michael Greenacre1 1 Universitat Pompeu Fabra, Barcelona Abstract Correspondence analysis is a method of multivariate analysis similar to principal component analysis but adapted to categorical data of various types: count data, percentages, survey data. It applies equally well to nonnegative data on several variables having the same ratio scale: for example, data all in grams, concentrations in parts per million, financial data in the same monetary unit, etc. In this talk I will present several contexts in the field of biology, including the health and environmental sciences, where correspondence analysis has been applied to give insight into large data sets. One of the most extensive areas of application is in the analysis of ecological data, in the study of the relationship between biological species distribution and environmental covariates - my own experience has been primarily in marine biology. In 1974 correspondence analysis was described as a "neglected multivariate method", but today it is an essential and invaluable tool of multivariate analysis, available in every major software package as well as in several packages in R. References: Greenacre, M. (2007). Correspondence Analysis in Practice. Chapman & Hall / CRC Press. Greenacre, M. (2010). Biplots in Practice. BBVA www.multivariatestatistics.org. 4 Foundation, Madrid. Free download from D04 Generalized Penalized Cananical Correlation Analysis Aeilko Having Zwinderman1 1 University of Amsterdam, Academic Medical Center, Dep. Clinical Epidemiology, Biostatistics & Bioinformatics, Amsterdam, Netherlands Abstract Many different factors play a role in the development and progression of complex diseases by studying how and which factors act together, we get a better understanding about these complex diseases. By adapting penalization methods to canonical correlation analysis, it is possible to associate two high dimensional sets of factors and obtain sparse results which tell us something about how certain factors act together. However, two sets might contain too limited information about the disease under study. We therefore adapted penalization methods to generalized canonical correlation analysis, such that more than two sets of factors can be associated. We applied this method to a dataset of 217 patients with renal failure containing three sets of factors, and obtained sparse interpretable results about the underlying complexity of the disease. Prof. dr. Aeilko Having Zwinderman: Academic Medical Center, Dep. Clinical Epidemiology, Biostatistics & Bioinformatics, University of Amsterdam, PO Box 22700, 1100 DE Amsterdam, the Netherlands e-mail: [email protected] 5 II. SÖZLÜ BİLDİRİLER 6 S01 Tanı Testi Yargılamalarında Kesim Noktası Kestirimi İçin Bir Yaklaşım Mustafa Ş. Şenocak1, Özden Calay2 1 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul 2 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul Özet Giriş: Sürekli veya sıralı ölçekli değerlendirmelerle yargılamada bulunan tanı testlerinde en önemli sorunlardan biri tanılama açısından en uygun kesim noktası (cut-off) değerinin saptanmasıdır. Bu amaçla kullanılan çeşitli görsel , kuramsal , işlemsel yaklaşımlar bulunmaktadır. Bunların kendi aralarında tutarsızlıkları bulunabildiği gibi tanısal yargı açısından her yönü ile ideal bir çözümün varlığı tartışmalıdır dolayısı ile yeni yöntem arayışları sürmektedir. Amaç: Basit ama en sık kullanılan Youden İndeksi (J) , Ayırdetme Göreliliği Oranı (AGO : LR:Likelihood Ratio) ve Duyarlılık-Özgüllük kesişimi gibi yaklaşımlara karşın kendi öngördüğümüz bir indeks olarak , en uygun (optimum) Duyarlılık-Özgüllük vektörünün özelliklerini ve artı yönlerini değerlendirmek. Yöntem: Kendi indeksimiz olarak öngördüğümüz (1/ ((1-Sp)2+(1- Sn)2)0.5) değerinin , özel olarak farklı AUC düzeyleri için üretilmiş veri setlerindeki sonuçlarını , Youden indeksi ve 1/AGO sonuçları ile kıyaslamalı olarak değerlendirdik. Tartışma ve sonuç: Çeşitli tanı geçerliliği yargılama setlerindeki sonuçlara göre indeksimiz sonuçlarının, belirsizlikleri olan 1/AGO değerinden çok daha verimli olduğu , sıklıkla Youden indeksi ile aynı kesim noktası değerleri üretebilmesine karşın , duyarlılık , özgüllük uyum ve uygunlukları açısından daha akılcı sonuçlar üreterek Youden'den farklılaşabildiği gözlenmiştir. Youden indeksindeki bazı yüksek sonuçların sık tekrarlı olabildiği ve testin özünlü değerlerinden birinin çok yetersiz olması durumunda da ortaya çıkabildiği görülmektedir. Buna karşılık indeksimizin daha uygun duyarlılık-özgüllük çiftleri belirleyebildiği gözlenmiştir. İndeksin özelliği açısından 2.8 den yüksek değerlere erişilebilen tanı testi yargılamalarında hem hastaları hem sağlıklıları belirlemede uygun kararlar alınabileceği de düşünülebilir. Anahtar kelimeler: Tanı testi , Kesim noktası (cut-off) , Youden indeksi , LR , AGO Prof. Dr. Mustafa Şenocak: Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303 Tel.: 0 212 414 30 41 E-Posta: [email protected] 7 S02 İkili Yöntem Kıyaslamalarında Bir Görsel Yaklaşım Önerisi Mustafa Ş.Şenocak1 1 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul Özet Giriş: Sürekli değişkenlerin konu olduğu ikili yöntem kıyaslamalarında, referansa göre sonuç yargılamalarında sadece istatistiksel değerlendirmelerle yoruma gitmenin yetersiz olduğu düşünülmektedir. Temelde eşlendirilmiş dizi konumunda olan kıyaslama düzeninde bilinen hesaplamaların yanı sıra korelasyon ve regresyon yaklaşımları da kullanılmakta, ayrıca yöntemler arası farkların veri büyüklüğünden etkilenimi, fark dizisinin dağılım tipi , farkın anlamlılığı , istatistiksel anlamlılığın veya anlamsızlığın kavramsal nedeni gibi bilgilerin görsel yaklaşımlarla da vurgulanarak sunulması çok daha yararlı bulunmaktadır. Bu çerçevede en bilinen ve kullanılan yaklaşımlar Bland-Altman Grafiği, Deming regresyonu Passing-Bablock regresyonudur. Amaç: Sürekli değişkenlerin konu olduğu ikili yöntem kıyası amaçlı – eşlendirilmiş – veri dizilerinde yaklaşımların genel fark yönünü, farklılaşmanın düzenini ve fark dizisinin yapısını gözlemleme açısından yeni bir yaklaşım önerilmiştir. Yöntem: Eş çift farkları veri dizisinde , değerlerin temel farksızlık olan “0” dan farkları , fark dizisi standart sapması tabanlı olarak z skorlarına dönüştürülmektedir. Oluşan skor dizisi sıralanarak – büyükten küçüğe veya tersi – iki “fark düzeni üçgeni “ oluşturulmaktadır. Bunların orta noktaya göre boyut farkları , iki yöndeki 1.96 sınırlarını geçme ve bakışım özellikleri , yöntemler arası farkı istatistiksel yargısı ile birlikte görme açısından yararlı ve tutarlı gözükmektedir. Bu amaçla farklı örneklem büyüklüklerinde ve istatistiksel yapıları ve farklılıkları özel olarak hazırlanmış veri setlerinde yaklaşımın çeşitli özelliklerini açık olarak belirlemek amacı ile uygulamalar gerçekleştirilmiştir.. Tartışma ve sonuç: Gerçek istatistiksel yapılar ve sonuçlarla görsel yaklaşımın temel özellikleri koşut açıklayıcılık göstermektedir. Ek olarak olgu numaralarının kullanımı sorunlu çiftleri belirlemede, toplam alanın iki tarafındaki% 2.5 luk sınırların belirlenmesi verilerin ve farkların dağılım tipini gözlemlemede yarar sağlamaktadır. Yaklaşımın, uygulama kolaylığı ve bilgi – yorum üretimi verimi ile oldukça yararlı olabileceği düşünülebilir. Anahtar kelimeler: Yöntem kıyaslaması, Bland-Altman grafiği, Görsel yaklaşım Prof. Dr. Mustafa Şenocak: İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişimi ABD, İstanbul E-Posta: [email protected], [email protected] 8 S03 ROC Analizinde Kesim Noktası Belirlemede Kullanılan Yöntemlere Alternatif Bir Öneri İlker Ünal1, Refik Burgut2, Yaşar Sertdemir2 1 2 İzmir Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İzmir Çukurova Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD, Adana Özet Amaç: Sayısal bir ölçümün tanı testi olarak kullanılması durumunda ölçümün sınıflamadaki başarısını belirlemede ROC analizine başvurulur. ROC analizi sonucunda iki bilgi elde edilir: Ölçümün sınıflamadaki başarısı ve sayısal ölçüm için tanı koymada kullanılacak en uygun kesim noktası. En uygun kesim noktasının belirlenmesinde maksimum Youden indeksi değeri ve sol üst köşeye en yakın noktayı belirleme yöntemleri sıklıkla kullanılmaktadır. Bu çalışmada bu iki yönteme alternatif olabilecek yeni yaklaşımlar araştırılmıştır. Yöntem: Alternatif olarak sunulabilecek ilk öneri duyarlılık ve seçicilik değerinin aynı veya birbirine çok yakın olduğu ölçüm değerini kesim noktası olarak kullanmaktır. İkinci öneri ise duyarlılık ve seçicilik değerlerinin ROC eğrisi altında kalan alan değerine en yakın olduğu ölçüm değerini kesim noktası olarak kullanmaktır. Bu çalışmada önerilen bu yaklaşımlar farklı eğri altında kalan alan değerleri (0.7, 0.8, 0.9), hasta ve kontrol gruplarının ölçümlerinin değişen dağılımlar göstermesi (normal, normal olmayan), değişen örneklem büyüklükleri (n=50, 100, 500) durumları altında literatürde belirtilen yöntemlerle karşılaştırılmıştır. Bulgular: Elde edilen sonuçlara göre yüksek eğri altında kalan alan değerlerinde önerilen yaklaşımlarla elde edilen kesim noktası değerlerinin %80 oranında literatürde önerilen yaklaşımlarla elde edilen kesim noktaları ile aynı olduğu görülmüştür. Ayrıca en uygun kesim noktası kavramı duyarlılık ve seçicilik değerinin aynı anda en yüksek değerde olması olarak kabul edildiğinde, eğri altındaki alan değeri azaldıkça önerilen yaklaşımlarca elde edilen kesim noktasının yaklaşık %60 oranında daha uygun olduğu görülmüştür. Örneklem büyüklüğünün yüksek olması durumunda literatürdeki yaklaşımlarla benzer sonuçlar elde edilirken, küçük örneklemlerde önerilen yaklaşımların daha uygun kesim noktası belirledikleri tespit edilmiştir. Sonuç: Önerilen yaklaşımlardan, eğri altında kalan alan değerine yakın duyarlılık ve seçicilik değerini veren ölçüm değerini kesim noktası olarak belirleme yöntemi; hem uygun kesim noktası belirlemede kullanılan diğer yöntemlerle büyük ölçüde benzer veya daha iyi sonucu vermesi, hem de diğer yöntemlerin aksine matematiksel işlem gerektirmemesi nedeniyle uygun kesim noktası belirlemede oldukça başarılı bir yöntemdir. Anahtar Kelimeler: ROC eğrisi, optimal kesim noktası, Youden indeksi 9 S04 Biyoeşdeğerlik Çalışmalarında Birey İçi Değişkenliğin Eşitliğine Yönelik Testlerin Değerlendirilmesi Nur Özge Sezgin1, Mehmet N. Orman1 1 Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Bornova, İzmir Özet Amaç: FDA (Food and Drug Administration), EMA (European Medicines Agency) ve WHO (World Health Organization) gibi ilaç düzenleme kurumları biyoeşdeğerlik çalışmalarında biyoeşdeğerliğin ispati için sadece ortalama biyoeşdeğerliği yeterli görmektedirler. Ortalama biyoeşdeğerlik ise eşdeğerlik sağlansa bile iki ürünün terapötik olarak eşdeğer ve değiştirilebilir olduğunu garanti etmeyebilir. İki ürünün terapötik olarak eşdeğerliği ve değiştirilebilirliğinin sorgulanmasında birey içi değişkenliğin kontrolü de önemlidir. Literatürde iki ürünün birey içi değişkenliğinin belirlenmesine yönelik testler [Pitman-Morgan Düzeltilmiş F Testi (PMD), Spearman Sıra Korelasyon Katsayısını baz alan Test (SSK), Periyot etkisinden arındırılmış Pitman Morgan Düzeltilmiş F Testi (PMDP), Periyot etkisinden arındırılmış Spearman Sıra Korelasyon Katsayısını baz alan Test (SSKP)] önerilmiştir. Bu çalışmada, birey içi değişkenliğin eşitliği için literatürde önerilen istatistiksel testlerin performansları I. tip hata bakımından değerlendirilmiştir. Yöntem: Testlerin, I. Tip hata bakımından performans değerlendirilmesi %90, %95 ve %99 güven düzeyinde, 18, 24 ve 36 örneklem büyüklüğünde, 2 farklı bireyler arası değişkenlik (varb) (0.04 ve 0.08) ve 5 farklı varyasyon katsayısı seviyelerinde (CV) (0.16, 0.23, 0.30, 0.40, 0.50) gerçekleştirilmiştir. Bulgular: Örneklem sayısı (n) 18 alındığında SSK simülasyon çalışmalarının tümünde güven aralıklarının dışına çıkmıştır. PMD sadece (α=0.05, varb=0.08, CV=0.16), SSKP sadece (α=0.1, varb=0.08, CV=0.30) ve PMDP ise sadece (α=0.1, varb=0.04, CV=0.40) durumlarında istenilen aralıkların dışına çıkmıştır. Diğer durumlarda güven aralığı içindedir. n= 24 alındığında SSK %90 güven düzeyinde tüm durumlarda ve (α=0.05, varb=0.08, CV=0.16, 0.23, 0.50), (α=0.05, varb=0.04, CV=0.16, 0.50), (α=0.01, varb=0.08, CV=0.16), (α=0.01, varb=0.04, CV=0.40) durumlarında belirlenen güven aralıkları dışında diğer durumlarda ise içeridedir. PMD, SSKP ve PMDP testleri tüm durumlarda belirlenen güven aralıkları içinde bulunmuştur. n= 36 alındığında sadece SSK %90 güven düzeyinde güven aralığı dışında çıkmıştır. Diğer durumlarda güven aralıkları içerisindedir. PMD ve PMDP tüm durumlarda güven aralığı içerisinde bulunmuştur. Sonuç: PMD’nin n=18 alındığında sadece bir durum haricinde başarısız, diğer durumlarda ise başarılı bulunmuştur. n= 24 ve n=36 alındığında ise tüm durumlarda başarılı bulunmuştur. SSK, n=18 alındığında tüm simülasyon çalışmaları sonucunda başarısız bulunurken n=24 alındığında %90 güven düzeyinde başarısız iken %95 ve %99 güven düzeylerinde farklı değerler kullanılarak yapılan simülasyon çalışmalarının bir kısmında başarılı bulunmuştur. n=36 alındığında ise sadece %90 güven düzeyinde başarısızdır. 10 PMDP ve SSKP n=18 alındığında bir durum dışında başarılı bulunmuşlardır. n=24 olarak alındığında ise başarılı olmuşlardır. N=36 olarak alındığında PMDP tüm durumlarda güven aralığı içerisinde bulunmuştur. Anahtar Kelimeler: Birey içi değişkenlik, Biyoeşdeğerlik, Simülasyon, I. Tip hata Nur Özge Sezgin: E-Posta: [email protected] 11 S05 GeneLearneR: Genetik Veri Madenciliği Analiz Aracı Erdal Coşgun1, Aydın Kaya2, Ali Seydi Keçeli2, Ergun Karaağaoğlu3 1 2 Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Hacettepe Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Ankara 3 Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Genetik araştırmalar 1970’li yıllarda Sanger ve Coulson tarafından önerilen daha ayrıntılı DNA sekanslama tekniğinden itibaren hayatımıza doğrudan etki etmeye başlamıştır. Farkında olmadan gördüğümüz tedavi, yediğimiz yiyecekler, kullandığımız ilaçlar bu araştırmalardan edinilen tecrübeler ışığında üretilmeye başlamıştır. Bu araştırmalarda araştırıcıların karşısına çıkan en önemli sorun ise çok büyük boyuttaki verinin doğru şekilde analiz edilmesi olmuştur. Bu sorunun çözümü için makine öğrenmesi (machine learning) ve veri madenciliği (VM) yöntemlerinin kullanımı yaygınlaşmıştır. Önceleri teorik algoritmalarla sorunları küçük veri setlerinde çözme işlemi (Machine Learning), sonrasında buradan edinilen deneyimler ile büyük veri setlerinin analizi için veri madenciliği algoritmaları geliştirildi. Ancak bu zamana kadar temel programcılık bilgisi olmadan sadece paket program olarak sunulan araçlar ile genetik-veri madenciliği yapılmaktadır. Ancak dikkat edilmesi gereken en önemli nokta ise her veri setinin karakteristik özelliklerinin olmasıdır. Örneğin: sekanslama verisine, gen ekspresyon verilerinin analizinde kullanılacak VM yöntemlerini uygulamak imkansızdır. Çünkü birisi nükleotid (adenin, sitozin, guanin, timin) dizisi, diğeri ise sayısal veri türündedir. Bu nedenle araştırıcılar sadece kendilerine sunulan ile yetinmek zorunda kalmaktadırlar. Programcılık bilgisi olan araştırıcılar ise daha çok açık kaynak kodlu programlama dillerine yönelmişlerdir. Çünkü lisanslı paket programlar hem araştırıcıları kısıtlıyor hem de projelerin bütçelerinde ekstra büyük miktarlar kaplamaktadır. Bu açık kaynak kodlu programlama dillerinden en çok tercih edileni [R] ’dır. http://www.r-project.org/. Bu çalışmada hemen hemen her türlü genetik veriyi analiz edebilen analiz aracı tanıtılacaktır. Özetle, temel VM analiz süreçlerini adım adım kullanıcılara sunan, ön bilgi olmaksızın “veri önişleme- boyut indirgemegenelleştirme- varyant belirleme, sınıflama, kümeleme, etkileşim belirleme- gen ontolojisi” analizlerini tek bir pencerede yapmaya olanak tanıyan bir analiz aracı geliştirilmiştir. Bu analiz aracı mevcut araçların eksik yönleri olan: a) Yöntemlerin kendine ait kullanılması gereken parametrelerinin optimizasyonu, b) Birden çok performans ölçüsü ile en iyi yöntem / yöntem grubunu seçme aşamalarını, c) Elde edilen önemli genetik faktörlerin mevcut veri tabanları ile karşılaştırılmasının anlık olarak yapılmasını sağlayacak olması, d) Farklı yöntem gruplarının hibrit kullanılabilmesi, konularına getirdiği çözümler sayesinde mevcut teknolojilerin kullanımı ve geliştirilmesinde öncü olacaktır. Bu sayede yeni projelerin yapılabilmesine süreklilik kazandırılacaktır. Aynı zamanda araştırıcılar projelerdeki lisanslı yazılım alımına ayrılan bütçenin çok daha altında bir maliyetle analizlerini yapabileceklerdir. “En az veri madenciliği bilgisi ile en doğru bulgunun” ulaşılmasını sağlayacak bir aracı geliştirilmiştir. 12 Anahtar Sözcükler: Genetik İstatistik, Veri Madenciliği, Makine Öğrenmesi, Gen Ekspresyon, Tek Nükleotid Polimorfizmi, Next Generation Sequencing, optimizasyon 13 S06 Major Voting Gap Statistic to Estimate the Number of Clusters in a Dataset Gokmen Zararsiz1, Ahmet Ozturk1, Erdem Karabulut2, Erdal Cosgun2 1 Erciyes University, Faculty of Medicine, Department of Biostatistics and Medical Informatics, Kayseri, Turkey 2 Hacettepe University, Faculty of Medicine, Department of Biostatistics, Ankara, Turkey Abstract Cluster analysis is an important data mining technique to divide data into groups and find meaningful clusters. One of the major challenge in this analysis is the prediction of the number of clusters. Albeit there have been lots of methods proposed for this problem, there is not an optimum solution. Gap statistic (1) is one of the most powerful method, which compares an observed internal index, such as the within-clusters sum of squares, to its expectation under a reference null distribution. However, this statistic has 3 widely used orientations (permutational, principal component and poisson) which have different theories and gain different success rates in different applications. In this study, we proposed a major voting gap statistic (mvGap) which combines the results of these 3 orientations. To demonstrate the efficacy of the mvGap, we used datasets from UCI machine learning repository, also real and simulated microarray datasets. We also compared our results with individual gap statistic orientations and other powerful methods. Experimental results revealed that mvGap works well and can be used to estimate the number of clusters in a dataset. Keywords: Clustering, Cluster Number, Gap Statistic, Within Clusters Sum of Squares (1) Tibshirani R, Walther G, Hastie T. Estimating the Number of Clusters in a Data Set via the Gap Statistic. J.R.Statist.Soc.B 2001; 63: 411-423 14 S07 Dikotom Sonuçlu Yorumlamalarda, 2'den Fazla Değerlendiricinin Sonuç Uyumlarının Fleiss Kappa ve Cochran Q ile Değerlendirmelerinin İrdelenmesi Pınar Ambarcıoğlu 1, Nurgül Bulut 1, Mehmet Kızılçeç 1 1 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul Özet Giriş: Fleiss Kappa Katsayısı, ikiden fazla değerlendirici arasındaki uyumun düzeyini ölçen bir istatistik yöntemdir. Cochran Q Testi ise, eşlendirilmiş iki grup arasındaki farkın önemliliğinin tespit edildiği McNemar Testi’nin ikiden çok grup için genelleştirilmiş halidir. Diğer bir deyişle, Fleiss Kappa Katsayısı, değerlendiriciler arası uyumu, Cochran Q Testi ise değerlendiriciler arası farkı belirlemektedir. Buna dayanarak aralarında uyum gözlenen değerlendiriciler arasında fark gözlenmemesi; benzer şekilde aralarında uyum gözlenmeyen değerlendiriciler arasında fark gözlenmesi kavramsal olarak beklenebilmektedir. Genel geçerliliği olmayan bu beklenti uygulamada bazen önemli yorum ve karar yanlışlıklarına da neden olabilmektedir. Amaç: Farklı örneklem büyüklüğü, değerlendirici sayısı ve sıklığın bulunduğu koşullarda Fleiss Kappa Katsayısı ve Cochran Q Testi sonuçlarının tutarlılıklarının incelenmesi. Yöntem: 3, 4 ve 6 değerlendiricinin bulunduğu düzenlerde, dikotom sonuçları %20, %50 ve %80 pozitif oranda olacak şekilde 20, 50 ve 100 birimlik 1000’er veri seti benzetimi yapıldı. Elde edilen toplam 27000 veri setinin her biri için hem Fleiss Kappa Katsayısı hesaplandı hem de Cochran Q Testi uygulandı. Tartışma ve sonuç: Değerlendiriciler arasında uyum gözlenmesi halinde farksızlık, uyum gözlenmemesi halinde farklılık beklentisi doğrultusunda; değerlendirici sayısına, dikotom sonuçlardaki sıklığa ve örneklem büyüklüğüne bağımlı olmaksızın Fleiss Kappa Katsayısı ve Cochran Q Testi sonuçlarının birbirini desteklemediği gözlenmiştir. Bu iki yaklaşımın birbirlerini kavramsal olarak doğrulama oranları aşağıdaki tablo ile özetlenmiştir: 3 değerlendirici 4 değerlendirici 6 değerlendirici Örneklem 0,2 0,5 0,8 0,2 0,5 0,8 0,2 0,5 0,8 20 0,045 0,049 0,051 0,038 0,033 0,042 0,035 0,035 0,042 50 0,063 0,049 0,049 0,088 0,06 0,005 0,05 0,048 0,052 100 0,053 0,053 0,059 0,046 0,051 0,052 0,043 0,056 0,04 15 Klinik değerlendirmelerde, fark-farksızlık ve bağıntı-uyum terimlerinin kullanılmasında kavramsal içerikler titizlikle göz önünde bulundurularak değerlendirme yapılmasının önemi bir kez daha ortaya çıkmaktadır. Anahtar kelimeler: Fleiss Kappa, Cochran Q, Uyum Pınar Ambarcıoğlu: Cerrahpaşa Tıp Fak. Biyoistatistik Tel.: 0 212 414 30 41 E-Posta: [email protected] 16 ve Tıp Bilişimi ABD-İstanbul 34303 S08 “Sıfır Olgu” Tasarımının Benzetim Çalışması İle Değerlendirilmesi Yeşim Tunç1, Alev Bakır2, Pınar Ambarcıoğlu1, Mustafa Ş.Şenocak3 1 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul 2 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul 3 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik veTıp Bilişimi ABD, İstanbul Özet Giriş: Düşük sıklıktaki hastalıkların, özelliklerin belirlenmesinde, öngörülen sıklığa göre örneklem sayısı belirlenerek taramalar gerçekleştirilmesi belirgin çözüm gibi görünmektedir. Ancak bu koşullarda örneklem büyüklüğü çok genişlemekte ve beraberinde zaman, kaynak, lojistik, personel sayısı gibi pek çok sorun da birlikte gelmektedir. Bu çerçevede bir çözüm olarak ilgili konuda taramada saptanan olgu sayısı değil, halen olgu saptanmaksızın taranmış örneklemin büyüklüğünün yararı düşünülmüştür ve yöntem "sıfır olgu tasarımı" olarak adlandırılmıştır. Standart istatistiksel kurama göre "P" sıklıkta bulunması öngörülen bir durum için N örneklemin taranması ile hiçbir olguya rastlanmamış ise bu durumun anlamlılık düzeyi p= (1-P)^N olarak belirlenir ve 0.05 anlamlılık sınırına göre düşük bir olasılık öngörülen sıklıktan aşağıda bulunulduğunu gösterir. Örneğin %3 sıklık öngörüsü ile 98 örneklemde halen ilgili tip olguya rastlanmamış ise öngörülen sıklığın geçerliliği varsayılabilir. Böylece belli bir sıklık öngörüsünün (P) anlamlı olarak doğru kabulü için en az 3/P örneklemde olgu bulunmaması hesaplanabilir.Bu yaklaşım öngörülebilir sıklıkların geçerliliği - veya kıyaslanması açısından genel çizgileri ile ve gereğinde güç düzeyini de göz önünde bulundurarak kolay bir yöntem olarak gözükmektedir. Ancak yaklaşımın sadece %2 den düşük sıklıklar için geçerli olabileceği, sonucun öngörü sıklığın dışında taramaya açık evrenin boyutundan da etkilenebileceği düşünülmektedir. Amaç: Sıfır olgu tasarımının öngörü sıklık ve hedef evren boyutundan etkilenim özelliklerinin gözlenmesi. Yöntem: 500, 1000 ve 4000 örneklemlik kümelerde % 0.5, 1 ,2 ,5 ve 10 öngörü sıklıkları (Π) ile 1000 er benzetim NCSS programınca üretilmiştir. Her konumda ilk konu olgu saptanana dek gözlenmiş örneklem büyüklüğü ve bu sınırın öngörü sıklığa göre anlamlılığı, anlamlı fark gösteren durumların oranı (x/1000) belirlenmiştir. Tartışma ve sonuç: Farklı sıklıklar, hedef örneklem büyüklükleri, benzetimin ortalama sıklıkları, tip olgu tekrar aralığı ortalaması (n) ve öngörüden anlamlı farklı sıklıkların oranı tablolanmaktadır. 17 0.005 0.01 0.02 0.05 0.1 Örneklem: 500 1000 4000 π 0,00545±0,00284 0,00507±0,00227 0,00505±0,00106 oran 4/1000 13/1000 38/1000 n 124.87 184.13 194.97 π 0,01009±0,00421 0,01001±0,00316 0,01004±0,00155 oran 6/1000 23/1000 33/1000 n 97.6 99.9 98.7 π 0,02012±0,00635 0,02007±0,00448 0,02009±0,00221 oran 28/1000 38/1000 49/1000 n 48.3 50 50.9 π 0,04994±0,00954 0,05023±0,00684 0,04995±0,00345 oran 48/1000 47/1000 38/1000 n 21.9 19.8 18.7 π 0,09945±0,13107 0,09990±0,00955 0,09986±0,00478 oran 46/1000 43/1000 41/1000 n 10.5 9.6 9.8 Hedef örneklemin büyümesi ile ilk olgu sırası saçınımının artabileceği böylece aykırı durum oranının da artabileceği gözlenmektedir. Özellikle %2 den yüksek sıklıklarda hatalı sonuç oranının arttığı ancak örneklem büyüklüğü etkisinin azaldığı düşünülebilir. Yöntemin öngörü sıklığın %2 den düşük olduğu konumlarda uygulanabileceği ama belli düzeyin aşılmadığına ilişkin yoruma yaramasına karşın gerçek sıklığı belirtmekte sorunlu olacağı düşünülerek kullanılması uygun gözükmektedir. Anahtar kelimeler: Sıfır olgu tasarımı, Örneklem büyüklüğü, öngörü sıklık, tarama Prof. Dr. Mustafa Şenocak: Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303 Tel.: 0 212 414 30 41 E-Posta: [email protected] 18 S09 Ters örnekleme – I Ters örnekleme yaklaşımında sonuç güvenirliğini etkileyen ögeler F. Nesrin Turan1, Nurgül Bulut2, Esra Ş. Yılmaz2, Mustafa Ş.Şenocak2 1 2 Trakya Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul Özet Giriş: Ters örnekleme, özellikle düşük sıklıktaki olayları (öngörülen P< %5) belirlemede, yüksek örneklemlerle gerçekleştirilecek taramalar yerine daha kısıtlı ve erişilebilir sayılarla kestirimler yapmaya olanak tanıyan bir yöntemdir. Belli sayıda konu olgunun (k) eldesine rastgele bir akış ile toplamında erişilen örneklemden (n) yola çıkarak bir sıklık öngörülebilmektedir (p ) : p = (k-1) / (n-1). Sonuç, örneklemenin kesildiği sayıya ve bu noktada erişilmiş olan olgu sayısına göre değişim göstermesinin yanı sıra araştırmalarda önerilen formüller çerçevesinde kestirimsel varyans da bu özelliklere göre farklılaşmaktadır. Konu özelliğin incelendiği ana evrenin boyutunun kısıtlılığına bağlı olarak da farklılaşımlar ortaya çıkabilmektedir. Amaç: Ters örnekleme yöntemi ile elde edilen sonuçlara etkisi olduğu anlaşılan ögelerin, oluşturdukları bu farklılaşmaların düzenini ve düzeyini gözlemlemek. Yöntem: Kaynaklardan elde edilen formül yaklaşımları çerçevesinde farklı örneklem büyüklükleri için öngörülen gerçek sıklıklarda ( % 10,5,2,1,0.5) , bu sıklıklara denk gelen olgu sayısı birikimlerinin (200, 500, 1000, 2000, 5000, 10000 büyüklükte örneklemler ve örneğin 200 örneklemde 2 olgu = % 1 olarak) ters örnekleme yöntemi ile irdelendiğinde verdiği kestirim sıklıkların gerçek sıklığa göre yüzde farkları hesaplanmıştır. Benzer şekilde kestirimsel varyansdaki temel ve hedef evren büyüklüğüne göre olan farklılaşmalar da hesaplanmıştır. Ters örnekleme ile öngörü sıklıkta hata (%) örneklem 0.005 0.01 0.02 0.05 0.1 200 100.00 49.75 24.62 9.55 4.52 500 39.88 19.84 9.82 3.81 1.80 1000 19.92 9.91 4.90 1.90 0.90 2000 9.95 4.95 2.45 0.95 0.45 5000 3.98 1.98 0.98 0.38 0.18 10000 1.99 0.99 0.49 0.19 0.09 19 Tartışma ve sonuç: Özellikle % 2 den düşük sıklıklarda kısıtlı tip olgu sayıları ile kestirime gitmenin çok büyük hatalara yol açabileceği anlaşılmaktadır. 2000 ve üzeri örneklem büyüklükleri ile elde edilen tip olgu sayıları düşük sıklıklarda bile oldukça uygun sonuçlar verebilmektedir. Bu aşamada ters örneklemenin gerçek taramaya göre avantajı irdelenmelidir. Kestirimsel varyans da tip olgu sayısının kısıtlılığından etkilenmekte ancak hedef evren büyüklüğünün göz önünde bulundurulmasında fazla değişmemektedir. Anahtar Kelimeler: Ters Örnekleme , Olgu Sayısı ,Örneklem Büyüklüğü ,Kestirim Sıklıkta Hata Yrd.Doç. Dr. F. Nesrin Turan: Trakya Üniversitesi Tıp Fakültesi , Biyoistatistik ve Tıp Bilişimi ABD – Edirne E-Posta: [email protected] 20 S10 Ters Örnekleme – II Ters Örnekleme Yaklaşımında Önkabulsel Olgu Sayısının Sonuç Güvenirliğine Etkileri Nurgül Bulut 1, Alev Bakır1, Pınar Ambarcıoğlu1, Mehmet Kızılçeç1 , Yeşim Tunç1, Esra Ş.Yılmaz1, Ali Baykuş1, Mustafa Ş.Şenocak1 1 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD., İstanbul Özet Giriş: Ters örnekleme, düşük sıklıktaki olayları belirlemede, öngörülen hesaplara göre belirlenmiş ve genellikle yüksek hacimli örneklemlerle gerçekleştirilecek taramalar yerine daha kısıtlı ve erişilebilir sayılarla kestirimler yapmaya olanak tanıyan bir yaklaşımdır. Rastgele bir akış ile belli bir büyüklüğe erişmiş bir örneklemde (n) saptanmış belli sayıda konu olgunun (k) düzeyine göre bir sıklık öngörülmesini temel alır. Bu çerçevede hedeflenen öngörü sıklık ve örneklemenin kesildiği “k” düzeyi sonucun gerçeği yansıtması açısından etkendir ve biliçsiz ve temelsiz yaklaşımda oldukça yanıltıcı sonuçlarla da karşılaşılabilir. Amaç: Ters örnekleme yöntemi ile elde edilen sonuçlara, öngörülen sıklığın ve taramanın kesildiği “k” sayısının etkisini gözlemlemek, güvenilir durumlar için düşünülebilecek sınırları belirlemede ipuçları yakalamak. Yöntem: % 0.5, 1, 2 ve 5 sıklıklar öngörülerek NCSS programının benzetim olanağı ile 2500 ve 5000 örneklemli veri dizileri üretilmiştir. İşlem her konum için 500 kez yinelenmiştir. Her dizide 2. , 5. ,10. ve 20 olgunun ana örneklem sıralamasında kaçıncı olduğuna göre ters örneklem yaklaşımının öngördüğü sıklık hesaplanmıştır. Elde edilen her öngörü sıklık değerinin, toplam örneklemde üreyen gerçek sıklığın %95 güven aralığı içinde kalıp kalmadığı belirlenmiştir. Ek olarak benzetimle üreyen değil, üretimde öngörülen sıklığın güven aralığına göre de sonuçlar belirlenmiştir. Bu çerçevede ana örneklem büyüklüğünün bu sonuçlara etkisine ilişkin ipucu gözlemlemek de beklenmektedir. Tartışma ve sonuç: Beklendiği üzere sıklık arttıkça ters örnekleme yaklaşımı ile belirlenen öngörü sıklıklardaki yanlış sonuç oranının arttığı gözlenmektedir. Örneklemin kesildiği olgu sayısı “k” ise çok daha önem taşımakta ve yanlış sonuç oranını çok yüksek katlarla arttırmaktadır. Ana örneklem hacminin yüksekliği de olumsuz etki oluşturmaktadır. Hedeflenen bir sıklığa göre yola çıkılması ise az da olsa bu olumsuzluğu arttırabilmektedir. Sonuçta, ters örneklemenin kısıtlı olgu sayısı erişimi bekleniyorsa %2 ve daha düşük hedef sıklıklar için gerçekleştirilmesi bunlarda da en az 15 konu olgu erişimi ile öngörü hesaplamalara geçilmesi uygun gözükmektedir. Optimum k sayısı için önerilen formüllerden yarar sağlanabilir. Anahtar kelimeler: Ters örnekleme, Uygun gerçek olgu sayısı, kestirimsel sıklık 21 Prof. Dr. Mustafa Şenocak: Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303. Tel.: 0 212 414 30 41 E-Posta: [email protected] 22 S11 Mikrodizilim Gen İfade Çalışmalarında Genelleştirme Yöntemlerinin Regresyon Modelleri Üzerine Etkisi Selen Yılmaz Işıkhan1, Erdal Coşgun2, Erdem Karabulut2, C. Reha Alpar2 1 2 Hacettepe Üniversitesi Sosyal Bilimler Meslek Yüksekokulu, Ankara Hacettepe Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı, Ankara Özet Giriş: Genetik araştırmalarda az sayıda hastaya ait binlerce gen verisinin bulunması, klasik istatistiksel yöntemlerin (Lojistik Regresyon, Varyans Analizi, Doğrusal Regresyon Analizi vb.) kullanımında sorunlar ortaya çıkarmaktadır. Tüm genom ölçeği üzerinde gen ifade profilleri ve fenotipler arasındaki ilişkileri incelemek amacıyla çok sayıda çalışma yapılmıştır.Yakın zamanda sıklıkla kullanılan Destek Vektör Makinaları (SVM : Support Vector Machine), Karar Ağaçları, Boosted Tree, Random Forest gibi birçok veri madenciliği yöntemi sınıflandırma amacıyla incelenmiş ve iyi sonuçlar elde edilmiştir. İlk olarak sınıflama problemlerinin çözümü için geliştirilen bu yöntemler daha sonra regresyon yöntemlerine özellikle doz-yanıt çalışmalarına da uyarlanmıştır. Bu yöntemlerin klasik regresyon yöntemlerine göre avantajlarından bazıları veri setinin dağılımına ilişkin varsayım gerektirmemesi ve bağımsız değişkenler arasındaki yüksek ilişkiden (çoklu bağlantı problemi) etkilenmemesi olarak sıralanabilir. Bu çalışmada en çok tercih edilen yöntemlerden biri olan Destek Vektör Makinası (DVM) Regresyonun “Bagging” ve “Çapraz Geçerlilik” model genelleştirme yöntemleri ile elde edilen kestirim performansları karşılaştırılmıştır. Gereç ve Yöntem: Çalışmada sözü edilen yöntemler Gene Expression Omnibus (GEO) (http://www.ncbi.nlm.nih.gov/sites/GDSbrowser) online veri tabanından sağlanan üç aday mikro dizilim gen ifade verisine uygulanmıştır. Analizler R- 2.14.0 (http://www.r-project.org/) ve ORANGE (http://orange.biolab.si/) yazılımlarından yararlanılarak yapılmıştır. Model sonuçları, belirtme katsayısı (coefficient of determination-R2), hata kareler ortalaması (Mean square error-MSE) gibi model performans kriterleri ile karşılaştırılmıştır. Bulgular: Bu çalışmada GEO’dan ulaşılan üç mikrodizilim gen ifadesi verisi ile modeller test edilmiştir. Çünkü orijinal veri setlerinin kullanımı yeni yöntemlerin test edilmesinde en çok tercih edilen yaklaşımlardandır. Çalışmadaki en önemli bulgu Bagging (Bootstrap Aggregating) ve çapraz geçerlilik gibi birleştirmeye ve yeniden örneklemeye dayalı genelleştirme yöntemleri kullanıldığında DVR’nin daha iyi kestirim yaptığıdır (Tablo1). Tablo 1. Bazı Genelleştirme yöntemleri ile Destek Vektör Regresyonun kestirim performansı sonuçları VERİ I: GDS630* VERİ II: GDS635* VERİ III: GDS991* YÖNTEM R2 HKO R2 HKO R2 HKO DVR 0,57 2,607 0,46 10,722 0,57 2,497 DVR-ÇG 0,60 2,312 0,65 8,265 0,58 1,622 DVR-Bagging 0,73 2,232 0,60 9,715 0,80 1,942 *GEO veri tabanında veri seti için verilen indeks numarasıdır. 23 Sonuç: Bu çalışmadaki hedefimiz genelleştirme ölçüleri konusunda çok net olmayan bir konuya açıklık getirmektedir. Özellikle doğrusal olmayan veri yapısında kullanılan DVR’nin sonuçlarını daha kullanılabilir hale getirmek için elde ettiğimiz bulgular önemlidir. Çalışmamız sonucunda ulaştığımız sonuçlardan “BaggingDVR”nin iki veri setinde en yüksek, bir veri setinde ise temel yönteme göre daha iyi performans göstermesi, hem ilgili literatüre hem de bu genelleştirme yöntemlerini kullanacak araştırıcılara yol gösterecek bir durumdur. Çalışmamız bu konudaki araştırmalar arasında farklı bir soruna çözüm arayan pilot çalışma niteliğindedir. İleriki çalışmalarda farklı genelleştirme ölçüleri (boosting, bootstrap, Leave-One-Out) ile de çalışmanın genişletilmesi hedeflenmektedir. Anahtar kelimeler: Destek Vektör Regresyonu, Genelleştirme yöntemleri, Bagging, Çapraz Geçerlilik Selen Yılmaz Işıkhan: E-Posta: [email protected] 24 S12 Gene Expression Data Mining with Artificial Immune Clonal Selection Algorithms Akin Özçift1 1 Dr., Gaziantep Üniversitesi, Gaziantep MYO, Bilgisayar Programcılığı, Gaziantep Abstract Gene expression technology oriented data is widely used in disease diagnosis research to design advanced predictive models. Gene expression technologies produce thousands of outputs from small samples. Extraction of meaningful information from this high-dimensional space requires application of feature reduction techniques. In this study, we propose a two-step feature elimination to reduce dimension of nine benchmarking gene expression datasets. First a Symmetrical Uncertainty Ranker (SUR) is applied to datasets and the 90% of features of each gene expression data is removed. As a second step, Correlation based Feature Selection (CFS)equipped with best first search is applied on the datasets to identify the most relevant feature subsets. Subsequently, the resultant datasets are classified with the use of eight Artificial Immune Clonal Selection Algorithms on top of 10-fold Cross Validation (CV). The experimental results demonstrate that the proposed two-step feature selection strategy is promising and CLONALG is the best algorithm in the classification of gene expression datasets. 25 S13 The Application of Time-Weighted Control Charts in Medical Practice Leman Tomak1, Yüksel Bek2 1 Ondokuz Mayis Üniversitesi, Tip Fakültesi, Biyoistatistik A.D., Samsun 2 Ondokuz Mayis Üniversitesi, Tip Fakültesi, Biyoistatistik A.D., Samsun Abstract Time-weighted graphs are used to detect small shifts in Statistical Process Control. The aim of this study is to evaluate monitoring the acetabular cup anteversion angles with CUmulative SUM (CUSUM) chart, Moving Average (MA) chart and Exponentially Weighted Moving Average (EWMA) chart. The data were obtained directly from thirty patients who had undergone total hip replacement surgery at Ondokuz Mayis University Faculty of Medicine. The acetabular cup anteversion angles of these people after total hip replacement were evaluated. CUSUM chart, Moving Average chart, and Exponentially Weighted Moving Average were used to evaluate the quality control process of cup angles. MINITAB Statistical Software 15.0 was used to generate these control charts. The assesment done with time-weighted charts revealed that the angles were settled within control limits and the process was under control. It was determined that the change within the control limits had a random pattern. As a result of this study it has been obtained that time-weighted quality control charts which are used mostly in the field of industry can also be used in the field of medicine. It has also been provided that they allow a faster visual decision. Key Words: Quality control, control chart, CUSUM, EWMA, MA. 26 S14 Bayesian Model Selection Criteria for Generalized Linear Models with Nonignorably Missing Data Zeynep Işıl Kalaylıoğlu1 1 Orta Doğu Teknik Üniversitesi, İstatistik Bölümü, Ankara Abstract Aim: We are interested in generalized linear models (GLMs) with covariate or response data that are missing not at random (MNAR). For MNAR data, the underlying missingness mechanism should not be ignored and modeled along with the main response model, hence called nonignorable missingness model. Another type of missingness is missing at random (MAR) in which the underlying missingness mechanism can be ignored (hence called ignorable missingness). Model selection criteria such as the deviance information criterion (DIC) and weighted L measure (WL) has been modified for missing data situations and their performances (i.e. capability of selecting the true model) has been assessed for comparison between GLMs with MNAR data and those with MAR data. Our aim is to evaluate their performances in comparison among a set of nonignorable missingness models. In addition, we proposed new modificiations to DIC and WL for missing data situations. Method: Bayesian methodology is adopted to estimate the DIC and WL. Proposed approaches are compared and discussed based on various different aspects including computational and philosophical. An extensive Monte Carlo simulation experiment is designed to assess and compare the finite sample performances of all the model selection criteria considered herein under different scenarios for missingness amounts. Findings: A comprehensive evaluation of the performances of the DIC and WL as well as our proposed variants of them are provided as a result of the extensive simulation study. It is shown that for comparison among nonignorable missingness models, the DIC and WL do not perform as well as they do for comparison between nonignorable and ignorable missing model frameworks. Conclusion: Our study indicates that model selection criteria currently employed for analysis of GLM with MNAR data need improvement. We give the direction to such an improvement. Zeynep Işıl Kalaycıoğlu: İstatistik Bölümü, Orta Doğu Teknik Üniversitesi, 06530 Ankara 27 S15 Gri İlişki Analizi 1 Gürol Zırhlıoğlu , Neslihan Akça2, Serap Keskin Tunç2 1 2 Yüzüncü Yıl Üniversitesi Eğitim Fakültesi, Van Yüzüncü Yıl Üniversitesi Diş Hekimliği Fakültesi, Van Özet Örneklem hacminin düşüklüğü ve evren dağılımının ya da örnek değişkenliğinin bilinmemesi, bilinen ve çok kullanılan istatistik çözümleme tekniklerinin güvenilirliğini etkilemektedir. Gerçek hayatta çeşitli nedenlerle (yetersiz süre, mali problemler, gerçekten veri sayısının azlığı v.b. nedenlerle) pek çok alanda alınan kararların yetersiz/sınırlı sayıda veri kullanılarak verildiği bilinmektedir. Gri sistem teorisinin temelinde bilinmeyen ya da tamamlanmamış bilginin “gri eleman” olarak tanımlanması yer almaktadır. “Gri ilişki” belirli bir sistem içerisinde iki eleman ya da iki alt sistem arasında değişen ilişkinin ölçümünü ifade etmektedir. Analiz edilen elemanlar arasındaki benzerlikler ya da farklılıklar “gri ilişki” olarak isimlendirilmektedir. Yapılan bu çalışmada Yüzüncü Yıl Üniversitesi diş hekimliği fakültesi ağız, diş ve çene cerrahisi kliniğine başvuran hastaların anlık kaygı durumları çeşitli değişkenler bakımından ele alınarak Gri İlişki Çözümlemesi yöntemi kullanılarak incelenmiştir. Araştırmada kullanılan veriler, söz konusu kliniğine başvuran 30 hastaya verilen “Anlık Kaygı Ölçeği”nin doldurulması sonucunda elde edilmiştir. Yapılan çalışma sonucunda gri ilişki dereceleri büyüklük sırasına göre sıralanmış ve “Kendimi emniyette hissediyorum” ifadesine katılımın gri eleman ile ilişkisinin diğer değişkenlere göre daha yüksek olduğu belirlenmiştir. “Çok sinirliyim” ifadesine katılımın gri eleman ile ilişkisinin ise diğer değişkenlere göre daha düşük olduğu sonucu elde edilmiştir. Anahtar kelimeler: Gri ilişki analizi, gri eleman, anlık kaygı, 28 S16 Hastane çalışanlarının Maslach Tükenmişlik ölçeğine göre değerlendirilmesi; Çok merkezli bir çalışma MY. Çelik 1, MM. Dasdağ 1, D. Şahin 2, O. Satıcı 1, Z. Akkuş 1, İ. Yıldız 1 1 Dicle Üniversitesi Tıp Fakültesi Biyoistatistik AD. 2 Erzincan Askeri Hastanesi Özet Maslach tükenmişliği; "işi gereği insanlarla yoğun bir ilişki içerisinde olanlarda görülen duygusal tükenme, duyarsızlaşma ve düşük kişisel başarı sendromu" şeklinde tanımlamıştır. Maslach modeline göre tükenmişliğin, duygusal tükenme, duyarsızlaşma ve başarı duygusunun azalması olmak üzere üç boyutu bulunmaktadır. Bu üç boyuta ilişkin tükenmişliği ölçebilmek için 22 maddeden oluşan "Maslach Tükenmişlik Ölçeği" geliştirilmiştir. Bu çalışmanın amacı, hastane çalışanlarının Maslach tükenmişlik ölçeğine göre tutum ve davranışlarını ortaya koymak ve belirginleştirmektir. Çalışma çok merkezli olup rastgele örnekleme yöntemi ile Erzincan Üniversitesi Mengücek Gazi Eğitim ve Araştırma hastanesinden 316 kişi, Erzincan Askeri Hastanesinden 53 kişi, Dicle Üniversitesi hastanesinden 369 kişi, toplamda 738 kişiye ulaşılmıştır. Elde edilen verilere ilişkin değişkenlerin nasıl kümelendiğini görmek için hiyerarşik küme analizi yöntemiyle dendogram elde edildi. Dendogram sonuçlarına göre kümeler; duygusal tükenme, kişisel başarı, eğitim ve konum, duyarsızlaşma gibi kümeler gözlendi. Dendogramdaki ilginç bir sonuç, kişilerin duygusal tükenme kümesi ile kişisel başarı, eğitim ve konum kümelerinin birleşerek yeni bir küme oluşturmalarıdır. Bu durum kişilerin içinde bulundukları konum ve aldıkları eğitim gereği, duygusal olarak tükenmiş olmalarına rağmen, kişisel başarılarını devam ettirdiklerini göstermektedir. Bu durum ayrıca frekans dağılışlarıyla da doğrulanmıştır. 29 S17 Çok Sınıflı Destek Vektör Sınıflamasında Hata Düzeltmeli Çıkış Kodları Yaklaşımlarının Karşılaştırılması: Bir simülasyon çalışması Özge Akşehirli1, Handan Ankaralı2, Duygu Aydın3, Davut Baltacı4 1 2 3 Arş.Gör., Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD, Düzce Prof.Dr., Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD., Düzce Arş. Gör., Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD., Düzce 4 Yrd.Doç.Dr., Düzce Üniversitesi, Tıp Fakültesi, Aile Hekimliği ABD., Düzce Özet Amaç: Yapı tanımlama, sınıflama ve regresyon amaçlarıyla kullanılan destek vektör makinaları (DVM) ilk olarak iki sınıfı ayırt etmek amacıyla geliştirilmiş eğiticili bir makine öğrenmesi yöntemidir. Buna karşın gerçek dünya problemlerinin birçoğunda ve özellikle yapı tanıma çalışmalarında çok sayıda sınıf veya grubun birbirinden ayırt edici özelliklerinin belirlenmesi amaçlanır. Tıpta, radyoloji, pataloji gibi branşlarda yapı tanımlama diğer klinik branşlarda ise tanı koyma çalışmaları bu grup içinde düşünülebilir. Çok sayıda grubu ayırmak için son yıllarda DVM yöntemleri üzerinde yoğun çalışmalar yapılmakta ve hala bu alana yeni metot veya yaklaşımlar eklenmektedir. Bu çalışmanın amacı, hem orijinal bir veri seti hem de simüle edilmiş veri setleri üzerinde, hata düzeltmeli çıkış kodlarını (HDÇK) temel alarak geliştirilen 4 farklı DVM yaklaşımını karşılaştırmalı olarak incelemektir. Yöntem: Bu çalışmada, HDÇK kodlarını temel alan 4 farklı yaklaşım (bire karşı hepsi, bire karşı bir, kapsamlı düzeltme kodları ve randomize düzeltme kodları) ile tip II diyabet hastalarının çeşitli demografik ve klinik özelliklerinin günlük şeker ölçümünü nasıl etkilediği araştırılmıştır. Ayrıca simülasyon yardımıyla 3 farklı ortalama vektörüne sahip standart çok değişkenli normal dağılımdan üretilen örneklerin, bu 4 yaklaşım ile kendi grubuna doğru sınıflama başarıları, model hataları ve analiz süreleri karşılaştırmalı olarak incelenmiştir. Bulgular: Diyabet hastalarına ait veriler üzerinde yapılan yöntem karşılaştırmaları sonucunda, sınıflama performansları ve analiz süreleri açısından istatistiksel olarak anlamlı bir fark bulunmamıştır. Ayrıca simülasyon verileri kullanıldığında ise yine yöntemler arasında önemli bir farka rastlanmamıştır. Bu bulgulara karşın sezgisel olarak bire karşı bir yönteminin sınıflama performansı, model hatası ve analiz süresinin, nispeten diğer 3 yöntemden daha iyi sonuçlar verdiği gözlenmiştir. Ayrıca örneklem genişliğinin özellik sayısına oranı arttıkça yöntem performanslarının da arttığı belirlenmiştir. Sonuç: Çok sınıflı problemlerde HDÇK temeline dayanan yöntemler, başarılı bir şekilde kullanılabilir. Anahtar Kelimeler: Destek vektör makineleri, Çok sınıflı sınıflama, Hata Çıkış Kodları, Veri madenciliği, Çekirdek fonksiyonlar Özge Akşehirli: Düzce Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD. Telefon: 0532 5103722 E-Posta: [email protected] 30 S18 Posterior Power Analysis with R Software: A Simulation Study Pınar Günel Karadeniz1, Nural Bekiroğlu1 1 Marmara Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, İstanbul Abstract Objective: In clinical trials, in experimental studies and in some observational studies; applying power analysis before conducting the study is absolutely recommended in order to guarantee reliable and valid test results. However, sometimes, the situation comes into question when the power of the test used in the study is asked by reviewers of the journal which the manuscript was sent. In such posterior power analysis cases, researchers generally consult a biostatistician to solve it. The aim of this study is to assess posterior power calculation which is coded by R software for various scenarios. Methods: R software codes were generated to calculate the power of unpaired t-test, paired t-test and chi-square test. These R software codes contained significance levels, sample size, standard deviation, effect size and noncentrality parameter. Under various scenarios simulations were conducted with 1000 runs and power of the tests was calculated. The power calculation results obtained from R software codes were compared with the power calculation results obtained from NCSS, G*Power and PS softwares. Results: The power calculated by R software codes which are given in this study and the power obtained from NCSS, G*Power and PS programs were matched. Simulation results obtained from different scenarios with R software codes were given in related tables. Conclusion: R is a free software and using the R software codes provides the same power results with the results obtained by licensed softwares such as NCSS, PASS, Power and Precision, Stat Power, etc. Therefore, we recommend R software codes given in this study, which is more accessible and useful for researchers especially who apply posterior power analysis. Keywords: Posterior power analysis, R software codes, simulation 31 S19 Eşit Örneklemli Randomize Kontrollü Çalışmalarda Kullanılan İki Elemanlı Rasgele Dizinin Karmaşıklık Kriteri Ömer Utku Erzengin1, Sıddıka Gamze Erzengin2 1 2 Süleyman Demirel Üniversitesi, İstatistik Bölümü, Isparta Süleyman Demirel Üniversitesi, Kimya Mühendisliği Bölümü, Isparta Özet Giriş: Randomize kontrollü çalışmalarda (RKÇ) genel olarak iki tedavi yöntemine (A ve B) genel olarak eşit miktarda örneklem atanması istenir (n = ma+mb ve ma = mb ). RKÇ’ da peş peşe gelen A ve B uygulamaları temel olasılık kuralı C(m,2m)'lik kombinasyon havuzu içinden rastgele olarak m tane örneklemi A tedavisine ve B tedavisine atamaktır. Peş peşe gelen iki elemanlı A ve B dizilerinin rastgeleliğinin sınanması için paket yazılımlarda genelde hareket testi, işaret testi, yukarı aşağı hareket testi, Mann-Kendall ve Bartlett rank testi kullanılmaktadır. Klinik çalışmalardaki atamaların yapılması çoğu zaman randomize iki elemanlı dizi oluşturulup atama yapıldığı şeklinde belirtilmektedir. Randomize atamalarda yapılan yanlışlıklar hata sapmasına, gizli sapmaya, seçim sapmasına (Efron 1971) neden olmaktadır. A ve B tedavi gruplarının peş peşe belli bir miktardan fazla gelmesi çoğu varsayımı ihlal etmekte ve rastgele olmayan belli bir örüntüye sahip yapılar bütün randomizasyon kabullerini bozmaktadır. Tedavi yöntemlerinin randomizasyonunu sağlayan rastgele seri kendi içinde birbirine bağımlıysa sonuçlarda kolineerliğe bağlı sapmalar olacaktır. Paket programlardaki kullanılan testler, kolineerite yaratacak, doğrusal bir formülden gelen rastgele olmayan örüntülü bir seriyi yakalayamayabilir. Amaç: RKÇ kullanılan İki elemanlı bir dizi (Tedavi-Kontrol veya Tedavi A- Tedavi B gibi) belli bir formülle üretilmişse Berlekamp–Massey algoritmasıyla dizinin belli bir örüntüye sahip doğrusal tekrarlayan alt dizilerinin minimum polinomları bulunabilir. İki elemanlı bir RKÇ dizisi eğer doğrusal olmayan bir formülle üretilmişse bunun sınanması doğrusal ve maksimum sıra karmaşıklığının bulunmasıyla mümkün olacaktır. Yapılacak sunumda en kısa dizi içindeki örüntüyü elde edebilecek hafızasız doğrusal olmayan geri beslemeli fonksiyonun nasıl bulunacağı anlatılacaktır. Ayrıca kombinatorik teorisine bağlı olarak klinik denemelerde peş peşe gelen A ve B seçimlerinin doğrusal ve maksimum sıra karmaşıklıklarının dağılımı gösterilecektir. Teorik olarak rastgele bir dizinini dağılımı, beklenen değeri ve varyansı bulunacaktır. Sonuç: Rastgele m taneli ikili bir dizide doğrusal karmaşıklık yaklaşık Normal(n/2+(9+(-1)n+1)/36+(n/3+2/9)/2n, 86/81) olarak dağıldığı bulunmuştur (Gustafson, 1994). Hazır kullanılan paket yazılımlardan elde edilen ikili dizilerin (Tedavi A ve Tedavi B gibi) karmaşıklıklarının teorik dağılımdan ne kadar uzaklaştığı gösterilecektir. Ayrıca sanki rasgele sayı üreteçlerinin katsayılarının seçiminde doğrusal karmaşıklığın önemi belirtilecektir. Anahtar Kelimeler: Randomize Kontrollü Çalışma, Karmaşıklık, Kolineer, Doğrusallık 32 S20 Dört Gözlü Kontenjans Tablolarında Yates Düzeltmeli Ki-Kare Testinin İncelenmesi: Simülasyon Çalışması Selçuk Korkmaz1, Necdet Süt2 1 Trakya Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Edirne 2 Trakya Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Edirne Özet Dört gözlü kontenjans tabloları ve bu tablolarla ilişkili istatistiksel testler sağlık alanında sıklıkla kullanılmaktadır. Bu tablolar için Fisher’in kesin testi, Pearson ki-kare testi ve Yates düzeltmeli ki-kare test istatistiği değerleri hesaplanabilmektedir. Bu testlerden Yates düzeltmeli ki-kare testinin hangi durumlarda kullanılacağı günümüzde hala tartışma konusudur. Çalışmamızda, dört gözlü kontenjans tablolarında Yates düzeltmeli ki-kare testinin etkinliğinin incelenmesi amaçlandı. Çalışmada iki farklı tasarım yöntemiyle Yates düzeltmeli ki-kare, Pearson ki-kare ve Fisher’in kesin testinin etkinlikleri 72876 adet dört gözlü kontenjans tablosu simüle edilerek karşılaştırıldı. Tasarım 1’de, hem satır hem de sütun toplamlarının sabit olduğu hipergeometrik dağılım, Tasarım 2’de, satır veya sütun toplamının sabit olduğu binom dağılımı esas alındı. Simülasyonlarda dört gözlü kontenjans tablolarında olası tüm oranlar için test istatistikleri hesaplandı. Çalışmada kişi sayıları 10-100 kişi arasında türetildi. Simülasyonlarda hasta-kontrol dizaynı kurgulanarak i) hasta ve kontrol sayılarının eşit olduğu 5225 adet kontenjas tablosu türetilerek analiz edildi, ii) daha sonra hasta ve kontrol sayılarının farklı olduğu 67651 adet tablo türetilerek analiz edildi. Tasatım 1’de, Fisher, Pearson ve Yates yöntemleri için analizler yapılırken, Tasarım 2’de bunlara ek olarak binom olasılıkları da hesaplandı. Yöntemlerin etkinliklerini karşılaştırmak için, beklenen değeri 5’ten küçük ve 5’ten büyük olan dört gözlü kontenjans tabloları ayrı ayrı ele alınarak hata kareler ortalaması (HKO), tip I hata ve tip II hata olasılıkları hesaplandı. Tasarım 1 sonucuna göre, gruplardaki kişi sayılarının eşit olduğu durumlarda Yates’in, Pearson’a göre daha küçük HKO değerlerine sahip olduğu, gruplardaki kişi sayılarının eşit olmadığı durumlarda, Yates ile Pearson’ın birbirine yakın HKO değerleri verdikleri görüldü. Pearson ki-kare testinde daha yüksek tip I hata yapma olasılığı gözlenirken, Yates düzeltmeli ki-kare testinde daha yüksek tip II hata yapma olasılığı gözlendi. Tasarım 2 sonucuna göre, en yüksek HKO değerine sahip yöntemin Yates düzeltmeli ki-kare testi olduğu görüldü. Pearson ki-kare testi, örneklem ölçümünün 10 olduğu durumlar hariç tüm durumlarda, Fisher’in kesin testinden daha küçük HKO değerlerine sahipti. Tasarım 1’de olduğu gibi, Pearson ki-kare testinde, diğer iki teste göre daha yüksek tip I hata olasılığı gözlenirken, Yates düzeltmeli ki-kare testinde ve Fisher’in kesin testinde daha yüksek tip II hata yapma olasılığı gözlendi. Çalışmada hipergeometrik tasarım kullanıldığı takdirde, Yates düzeltmeli ki-kare testinin kullanılabilir bir test olduğu görülürken, binom dağılımı esas alınarak yapılan çalışmada, Yates düzeltmeli ki-kare testinin hem yüksek HKO değeri, hem de yüksek tip II hata yapma olasılığı nedenleri ile kullanışsız olduğu görüldü. Anahtar Kelimeler: Yates düzeltmeli ki-kare testi; Fisher’in kesin testi; Pearson ki-kare testi; Dört gözlü kontenjans tabloları. 33 S21 Maddeler Arası Korelasyon Yapısı ve Örneklem Genişliğinin Faktörleşmedeki Rolü: Bir Simülasyon Çalışması 1 Duygu Aydın , Handan Ankaralı2 , Özge Yılmaz Akşehirli2 1 2 Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik ABD, Ankara Düzce Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim ABD, Düzce Özet Amaç: Faktör analizi, gözlenen değişkenler arasındaki ilişkileri temel alarak az sayıda faktör yardımıyla maksimum varyansı açıklayan analitik bir yöntemdir. Bu yöntem en sık ölçek geliştirme çalışmalarında kullanılmaktadır. Bir ölçeğin faktör yapısının değişken olması, ölçeğin yaygın kullanımını olumsuz etkileyebilir. Bu çalışmada, maddeler arası farklı korelasyon yapılarının ve çeşitli örneklem genişliklerinin faktör yapısı üzerine etkisinin araştırılması amaçlanmıştır. Gereç ve Yöntemler: Yedi farklı korelasyon yapısı ve üç farklı örneklem genişliği içeren, toplam 21 kombinasyon oluşturulmuştur. Bu kombinasyonlarda oluşturulan 7 ölçek yapısında 4 faktör ve her faktörde 5 madde yer almaktadır. Gerçek yapısı bilinen bu ölçeklere, doğrulayıcı faktör analizi uygulanarak faktör yapısındaki değişimler incelenmiştir. Bulgular: Popülasyonda faktörler arası korelasyon 0 olduğu zaman, faktör yükleri döndürüldüğünde örneklemdeki faktör yapısının değişmediği gözlenmiştir. Bu sonuç üzerinde korelasyon derecesi ve örneklem genişliğinin etkisi bulunmamaktadır. Ancak popülasyondaki faktörler arası korelasyon 0’ dan farklı ise, döndürme işlemi yapıldığında örneklemdeki faktör yapısında değişmeler olmaktadır. Popülasyon korelasyon matrisinin heterojen yapıda olması durumunda örneklemdeki faktör yapısı örneklem genişliğine bağlı olarak önemli değişmeler göstermiştir. Sonuç: Yedi farklı korelasyon yapısı ile oluşturulan popülasyonlarda, faktör analizi sonucunda oluşan faktör yapıları maddeler arası ilişkinin yapısından etkilenmiştir. Ayrıca, hangi faktörde olduğu bilinen maddelerin bir kısmının, başka bir faktörde olduğu gözlenmiştir. Örneklem genişliği arttıkça faktör yapısı daha belirgin bir hal almaktadır. Buna ilaveten çevresel faktörlerin de faktör yapısını değiştirdiği söylenebilir. Çünkü çevresel koşullar, sosyo-demografik özellikler ve birçok kültürel etkenler faktör yapısını belirleyen korelasyonlar üzerinde etkilidir. Anahtar Kelimeler: Faktör analizi; Faktör yapısı; Faktör döndürmesi; Ölçek Geliştirme Duygu Aydın: E-Posta: [email protected] 34 S22 Hibrit Hiyerarşik Kümeleme Yöntemi ve Sağlık Alanında Bir Uygulaması Gözde Ertürk1, Gökmen Zararsız1, Ahmet Ozturk1, Ferhan Elmalı1 1 Erciyes Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Kayseri, Türkiye Amaç: Kümeleme analizleri, benzer özelliklere sahip nesneleri gruplayan (kümeleyen) bir yöntemdir ve sağlık alanında hastalıkların sınıflandırılması, kanser hücrelerinin belirlenmesi, hastalık üzerinde etkili genlerin gruplanması gibi birçok alanda yaygın olarak kullanılmaktadır. Hiyerarşik kümeleme yöntemi bu yöntemlerden biri olup, Birleştirici ve Ayırıcı hiyerarşik olmak üzere iki temel kümeleme strateji ile kümeleme yapmaktadır. Bu iki kümeleme stratejisi her ne kadar yaygın kullanılıyor olsa da, birtakım eksiklikleri bulunmaktadır. Birleştirici kümeleme yöntemi küçük kümeleri belirlemede iyi performans gösterirken büyük kümelerde orta düzey performans göstermektedir. Tersine, ayırıcı kümeleme yöntemi büyük kümeleri belirlemede iyi performans gösterirken, küçük kümelerde iyi sonuçlar vermemektedir. Hibrit hiyerarşik kümeleme yöntemi ortak kümelemenin yeni bir fikri üzerine kurulur. Birbirine en yakın noktaları ortak küme tanımlayarak Ayırıcı ve Birleştirici hiyerarşik kümeleme yöntemlerinin güçlü yanlarını birleştiren bu noktaları bozmayan kümeleme yöntemi oluşturmak amaçlanmıştır. Yöntem: Araştırma Sorlie et al (2001) Meme kanseri tümör alt sınıflarını tanımlamaya yardımcı olan veriden alındı. Verideki 85 örneğin her biri için 456 c DNA tanımlayıcı gen değerleri kullanıldı.Hibrit hiyerarşik kümeleme uygulamasında ortak kümeleme yönteminden yararlanıldı.R 2.14.0 istatistik paket programının (The R Project for Statistical Computing) hiyerarşik kümeleme paketi yöntemini uygulamada ayırma yöntemi olarak kullanıldı.Hibrit hiyerarşik kümeleme TSVQ ayırma tekniği kullanıldı.Örnekler arası uzaklık hesaplanması için öklit uzaklığının karesi kullanıldı. Bulgular: Ortak kümeleme sonucunda Sorlie et al (2001) verisi incelendiğinde.85 örnek için 17 ortak küme bulundu ve 16 tanesi iki nokta içeriyor. Bu ortak noktalardan {31, 32, 33, 34} ortak kümeleri veri setindeki sadece normal doku örnekleri ve üç iyi huylu doku örneklerinin ikisi de {35,36} olduğu anlaşıldı ortak kümelerin kanser genlerini doğru ayırdığı gözlemlendi. Sorlie et al (2001) verisi Hibrit hiyerarşik kümeleme yöntemi tarafından parçalandığında ortak kümelerin hiç birinin bozulmadığı gözlemlendi. Ayırıcı ve Birleştirici hiyerarşik kümeler ortak kümelerini ayırırken bozduğu gözlemlendi. Sonuç: Çalışma bulgularına göre Hibrit hiyerarşik kümeleme yöntemi Ayırıcı ve Birleştirici kümelemelerinin bozduğu ortak kümeleri ayırmada iyi bir yöntem olduğu anlaşıldı. Anahtar kelime: Kümeleme, Hiyerarşik kümeleme, Hibrit hiyerarşik kümeleme, Ortak küme 35 S23 Varyans Bileşeni Tahmin Yöntemlerine Yönelik Bir Değerlendirme İlkay Doğan1, İbrahim Kılıç1, Cengiz Gazeloğlu2, Sinan Saraçlı2 1 2 Afyon Kocatepe Üniversitesi Veteriner Fakültesi Biyoistatistik AD, Afyonkarahisar Afyon Kocatepe Üniversitesi Fen-Edebiyat Fakültesi İstatistik Bölümü, Afyonkarahisar Özet Amaç: Bu araştırmada, varyans bileşenlerinin tahmin edilmesinde literatürde yaygın olarak kullanılan yöntemlerden; ANOVA, Henderson III, ML, REML, MINQUE gibi önemli yöntemlerin incelenmesi amaçlanmıştır. Yöntem: Çalışmada, ANOVA, Henderson III, ML, REML, MINQUE yöntemlerine yönelik değerlendirme yapabilmek için hayvancılık ile ilgili dengeli ve dengeli olmayan veri setleri kullanılmıştır. Bu çerçevede, etkileşimli ve etkileşimsiz modeller ile söz konusu yöntemler ile elde edilen tahminler karşılaştırılmaya çalışılmıştır. Bulgular ve Sonuç: Dengeli verilerde, gerek etkileşimli gerekse etkileşimsiz modelde varyans bileşenleri tahminleri dört yöntemde (ANOVA, Henderson III, REML, MINQUE) birbirine eşit bulunmuş olup ML yönteminde ise hata varyansı oranı diğer yöntemlerden daha yüksek bulunmuştur. Dengesiz veriler için ise en düşük hata varyansı tahmini REML, MINQUE yöntemleri ile elde edilmiştir. Araştırma sonuçlarının, istatistik literatürüne katkı sunmasının yanı sıra bu yöntemlere ihtiyaç duyan ve farklı alanlardaki araştırmacılara da katkı sağlayacağı kanaatine varılmıştır. Anahtar Kelimeler: Varyans bileşenleri tahmini, ANOVA, Henderson yöntemleri, ML, REML, MINQUE 36 S24 Rakip Risk İçeren Sağkalım Fonksiyonlarının Karşılaştırılmasında Log-Rank Ve Wılcoxon Testlerinin Etkinliği: Bir Simülasyon Çalışması Melike Geduk1, Yaşar Sertdemir1, H. Refik Burgut1 1 Çukurova Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana Özet Amaç: Yaşam tablosu veya Kaplan-Meier yöntemleriyle elde edilen farklı grupların rakip risk içeren sağkalım süreleri, sağkalım analizine özgü testlerle karşılaştırılabilir. Sansürlü oluş biçimi, rakip risklerin bağımlı ya da bağımsız olma durumları, hazard oranlarının özellikleri, ölüm oranları gibi farklı koşullara göre bu testlerden hangisinin seçileceğine karar verilmesi gerekir. Yöntem: Bu karşılaştırmalarda parametrik olmayan testlerden ikisi, Mantel-Haenszel olarak da bilinen log-rank ve Wilcoxon testleri kullanılmaktadır. Hangi testin tercih edileceği şartlar, simüle edilmiş ve gerçek verilerle araştırılacaktır. Bulgu ve sonuç: Araştırmacılara, bu çalışmanın sonuçları hangi testin seçilmesi konusunda yol gösterici olacaktır. Anahtar Kelimeler: Rakip Riskler, Log-Rank Ve Wilcoxon Test, Simülasyon Efficiency Of Log-Rank And Wilcoxon Tests Used To Compare Survival Disrtibution Under Competing Risk: A Simulation Study Abstract Aim: The survival distribution of different groups under competing risk that obtained from life-table or KaplanMeier methods can be compared by using specific tests for survival time. According to different situations such as censoring status, dependency of competing risks, state of hazard rates, death rates the choice among these tests must be determined. Method: Among nonparametric tests, both log-rank, also known as Mantel-Haenszel test and Wilcoxon test are being used for comparison. Conditions under which test should be preferred will be investigated using real and simulated data. Results: Based on study findings, recommendation to practitioner will be made. Key Words: Competing Risks, Log-Rank and Wilcoxon Test, Simulation 37 S25 İki Değişkenli Weibull Dağılımları ile Yaşam Verilerinin Modellenmesi Ayça Hatice Türkan1, Nazif Çalış2, Hamza Erol3 1 Afyon Kocatepe Üniversitesi Fen Edebiyat Fakültesi, İstatistik Anabilim Dalı, Afyonkarahisar 2 3 Adıyaman Üniversitesi İktisadi ve İdari Bilimler Fakültesi, İşletme Anabilim Dalı, Adıyaman Abdullah Gül Üniversitesi Bilgisayar Bilimleri Fakültesi, Yazılım Mühendisliği Bölümü, Kayseri Özet Amaç: İnsan sağlığını yakından ilgilendiren yaşam sürelerinin modellenmesi istatistiksel olarak önemli bir konudur. Yaşam sürelerinin modellenmesinde en yaygın olarak kullanılan dağılımlar Exponential, Weibull ve Gamma dağılımlarıdır. Bu dağılımlar verilerin tek değişkenli olması durumunda uygulanabilir dağılımlardır. Bununla birlikte yaşamı ilgilendiren verilerin tek bir değişkenle açıklanması yetersiz ve yanlış sonuçlara yol açabilir. İki veya daha fazla değişken içeren yaşam verisi olması durumunda, veri yapısına uygun dağılımlar yaşam sürelerinin modellenmesinde kullanılabilir. Yöntem: Çok boyutlu yaşam sürelerine ait verilerin modellenmesinde kullanılabilecek dağılımlar sınırlıdır. Özellikle Kundu-Dey (2009) ve Kundu-Gupta (2010) tarafından önerilen iki değişkenli Marshal-Olkin Bivariate Weibull ve Block-Basu Bivariate Weibul dağılımları iki değişkene bağlı yaşam verilerinin modellenmesinde kullanılabilir. Bu çalışmada, bu dağılımlar gerçek yaşam süresi verilerine uygulanacak ve sonuçlar çok değişkenli normal dağılım modelleri ile karşılaştırılacaktır. Bulgular: Diabet rahatsızlığı olan hastalara ait sağ ve sol gözlerinde zamanla oluşan görme kaybı verileri ve bir yaşından küçük 24 çocuğa ait dominant ulna ve ulna kemik mineral yoğunluğu verileri sırasıyla Marshal-Olkin Bivariate Weibul ve Block-Basu Bivariate Weibul dağılımları ile modellenmiştir. Oluşturulan dağılım modellerine ait olasılık yoğunluk fonksiyonları elde edilmiş ve LogLikelihood değerleri hesaplanmıştır. Bu veriler için aynı zamanda çok değişkenli dağılımlar içerisinde en yaygın kullanılan normal dağılım modeli oluşturulmuş ve normal dağılıma ait LogLikelihood değerleri hesaplanmıştır. Sonuç: İki değişkenli yaşam verileri için değişkenlerden birinin diğerine bağlı olması durumunda, örneğin diabet hastalarının bir gözünde oluşan diabete bağlı görme kaybının diğer göz üzerinde etkisinin olması gibi, dağılım yapısı gereği Marshal-Olkin Bivariate Weibul ve Block-Basu Bivariate Weibul dağılımları veri yapısı için daha uygun dağılımlardır. İncelenen veriler için oluşturulan modeller arasında çok değişkenli normal dağılım modellerine ait LogLikelihood değerleri daha küçük bulunmasına rağmen çok değişkenli normal dağılım modellerine ait ortalama ve kovaryans parametre değerleri birbirine bağlı yaşam sürelerine ait değişkenler arasındaki ilişkiyi modellemede yetersiz kalmaktadır. Anahtar Kelimeler: Block-Basu Bivariate Weibul, Marshal-Olkin Bivariate Weibul, Yaşam Verisi 38 Kaynaklar [1] D. Kundu and A.K. Dey, Estimating The Parameters Of The Marshall-Olkin Bivariate Weibull Distribution By EM Algorithm, Computational Statistics and Data Analysis 53, (2009) 956-965. [2] D. Kundu and R.D. Gupta, A class of absolutely continuous bivariate distributions, Statistical Methodology 7 (2010) 464-477. Ayça Hatice Türkan: E-Posta: [email protected] 39 S26 Hastalıkların Yersel Kümelenmelerinin Belirlenmesinde Kullanılan Satscan V9.1 ve Flexscan V3.1 Programlarının Rasgele ve Koşullu Türetilmiş Verilerde Karşılaştırılması Özge Bolluk1, Canan Baydemir2, Kazım Özdamar3 1 2 Arş. Gör., Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Ad, Eskişehir Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Ad, Eskişehir 3 Eskişehir Osmangazi Üniversitesi Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Ad, Eskişehir Özet Giriş: Bu araştırmada A2 alanda gözlenen sağlık olayının gözlenme sayısının, rasgele ya da koşullu olarak gözlenme biçiminin ve dağılım biçiminin Tarama İstatistiği üzerine etkileri SaTScan V9.1 ve FleXScan V3.1 paket programlarında araştırılarak, farklı paket programlarda çözümlerinin sonuçlarındaki farklılıkları belirlenmiştir. Yöntem: Tarama istatistikleri yeryüzündeki coğrafi objelere ait yersel, zamansal ve yersel-zamansal verilerinin toplanması, saklanması, analiz edilmesi ve analizler sonucunda kullanıcıya mevcut sorunlarla ilgili alternatif çözüm yolları gösteren analiz yöntemidir. Hastalıkların incelenmesinde, risk altındaki toplumun belirlenmesi, coğrafik bölgedeki yerleşim yerlerinin yüzölçümlerinin farklılıkları ve hastalıkların incelenmesinde kullanılmaktadır. Olgu sayıları, nüfus bilgileri ve Yersel Koordinat bilgileri normal ve uniform dağılıma uygun olarak türetilerek SatScan V9.1 ve FleXScan v3.1 Paket Programları’nda analiz edilerek sonuçları karşılaştırılmıştır. Bulgular: Rasgele ve koşullu veri setlerinin birim sayısı, teorik dağılım biçimi, farklı paket programlarda çözümlerinin sonuçları arasındaki farklılıkları incelenerek, Normal ve Uniform dağılıma uygun olarak türetilen verilerin her iki programdaki analiz sonuçlarında, koşullu türetilen birim sayısı arttıkça önemli kümelenmelerin olduğu belirlenmiştir. Paket programların çıktıları incelendiğinde, SaTScan paket programında salgının olacağı öngörülen koordinat değerleri, kümelenen birim sayısı, kümelenmesi beklenen birim sayısı, gözlenen ve beklenen birim sayılarının oranı, benzerlik oranı ve önemliliği verilirken, FleXScan Paket Programında kümelenen birim sayısı, kümelenmesi beklenen birim sayısı, benzerlik oranı ve önemliliği verilmektedir. SaTScan paket programı daha ayrıntılı sonuçlar vermektedir. İncelenen her iki dağılımda da sonuçların küçük farklılıklarla benzer olduğu belirlenmiştir. Sonuç: Hastalıkların coğrafik kümelenmelerinde en sık kullanılan SaTScan paket programı ve FleXScan Paket Programları kullanılarak yapılan çalışmalarda sonuçların benzer olmasına rağmen, SaTScan paket programının daha ayrıntılı bilgi vermesi nedeniyle tercih edilebilir olduğu belirlenmiştir. Anahtar Kelimeler: Tarama İstatistikleri, Yersel Kümeleme, SaTScan Paket Programı ve FleXScan Paket Programı 40 S27 Hastanelerin Etkinliklerinin Veri Zarflama Analizi İle Belirlenmesi: Afyonkarahisar Örneği Gizem Gülsevin1, Ayça Hatice Türkan1 1 Afyon Kocatepe Üniversitesi Fen Edebiyat Fakültesi, İstatistik Anabilim Dalı, Afyonkarahisar Özet Amaç: Bu çalışmanın amacı, hastane faaliyetlerinde performansın ölçülmesi, değerlendirilmesi ve hastanelerin etkinlik düzeylerinin Veri Zarflama Analizi (VZA) yöntemi ile belirlenmesidir. Charnes, Cooper ve Rhodes tarafından geliştirilen VZA; doğrusal programlama tabanlı bir teknik olup aynı çoklu girdi ve çıktılar içeren ve girdi-çıktıların farklı ölçü birimlerine sahip olduğu, homojen yapıdaki işletmelerin performans ve etkinlik ölçümünde kullanılan bir yöntemdir (YOLUK 2010). Yöntem: Etkinlik ölçüm yöntemleri oran analizi, parametrik yöntemler ve parametrik olmayan yöntemler olmak üzere üç sınıfa ayrılır (YOLALAN 1993; Aktaran: BEKTAŞ 2007). VZA, parametrik olmayan etkinlik ölçüm yöntemi olup diğer etkinlik ölçüm yöntemlerine göre daha gerçekçi ve doğru sonuçlar ortaya çıkarması açısından çalışmada VZA tekniği kullanılmıştır. Bu çalışma, Afyonkarahisar İl Sağlık Müdürlüğünden sağlanan Afyonkarahisar’daki Sağlık Bakanlığına bağlı hastanelerin 2011 yılına ait verilerini inceleyen bir uygulama içermektedir. Sağlık Bakanlığına bağlı Afyonkarahisar Göğüs Hastalıkları Hastanesi, Afyonkarahisar Zübeyde Hanım Kadın Doğum ve Çocuk Hastalıkları Hastanesi ve özel hastaneler araştırma kapsamına alınmamıştır. Bunun nedeni VZA modeli uygulamasında; benzer çıktıları, benzer girdileri kullanarak üreten yani homojen yapıda Karar Verme Birimi olması gerekliliğidir (BAL 2010). Hastane yönetiminin girdiler üzerinde kontrol gücü vardır, ancak çıktılar üzerinde kontrol gücü oldukça zordur. Bu nedenle bu çalışmada girdi yönlü VZA modelleri kullanılmıştır. Bu modelin amacı belirli miktardaki çıktı düzeyine ulaşabilmek için gerekli olan optimum girdi miktarını tespit etmektir (YOLUK 2010). VZA modellerini çözmek için, doğrusal programlama modellerinin çözümünde kullanılan programlardan herhangi biri kullanılabileceği gibi son yıllarda piyasaya sürülen ve windows altında çalışabilen özel VZA programlarından (WinQSB, LINDO, EMS, Warwick windows DEA, BYU-DEA, Pioneer, Frontier analyst, SAS-DEA) herhangi biri de kullanılabilir (AYDEMİR 2002). Bu bağlamda uygulamada WinQSB ve EMS programlarından yararlanarak veriler analiz edilmiştir. Bulgular ve Sonuç: Bu çalışmada yapılan analiz sonrası elde edilen sonuçlara göre etkin olan hastaneler ile etkin olmayan hastaneler karşılaştırılarak değerlendirme yapılmıştır. Etkin olmadığı belirlenen hastanelerin, kendisine referans olan hastanelere göre, girdi miktarlarını ne düzeyde azaltmasını ya da çıktı miktarlarını ne düzeyde arttırması gerektiği gösterilmeye çalışılmıştır. Anahtar Kelimeler: Veri Zarflama Analizi, Hastane, Etkinlik 41 Kaynaklar Aydemir, Z. C. (2002), Bölgesel Rekabet Edebilirlik Kapsamında İllerin Kaynak Kullanım Görece Verimlilikleri: Veri Zarflama Analizi Uygulaması, Uzmanlık Tezi, Devlet Planlama Teşkilatı, Ankara. Bal V. (2010), Bilgi Sistemlerinin Sağlık İşletmeleri Performansına Etkilerinin Veri Zarflama Analizi İle Ölçümü: Türkiye’ deki Devlet Hastanelerinde Bir Araştırma, Doktora Tezi, Süleyman Demirel Üniversitesi, İşletme Anabilim Dalı, Isparta. Bektaş B. (2007), Türkiye’de Faaliyet Gösteren Bankaların Farklı Yöntemlerle Sınıflandırılması ve Etkinliklerinin Belirlenmesi Üzerine Bir Araştırma, Yüksek Lisans Tezi, Gazi Üniversitesi, Fen Bilimleri Enstitüsü, İstatistik Anabilim Dalı, Ankara. Yoluk M. (2010), Hastane Performansının Veri Zarflama Analizi (VZA) Yöntemi İle Değerlendirilmesi, Yüksek Lisans Tezi, Atılım Üniversitesi, Sosyal Bilimler Enstitüsü, Sağlık Kurumları İşletmeciliği Anabilim Dalı, Ankara. 42 S28 Yaşam Kalitesinin Yapısal Eşitlik Modeli ile Analizi: Afyon Kocatepe Üniversitesi Akademisyenleri Üzerine Bir Uygulama Birol Topçu , Sinan Saraçlı2, Cengiz Gazeloğlu2 1 1 Namık Kemal Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Tekirdağ 2 Afyon Kocatepe Üniversitesi Fen-Edebiyat Fakültesi İstatistik Anabilim Dalı, Afyon Özet Amaç: Bu çalışmada dünya sağlık örgütünün bireylerin yaşam kalitesini ölçmek için kullandığı yaşam kalitesi ölçeği ile akademisyenlerin yaşam kalitesi üzerinde etkili olan etmenler arasındaki ilişkilerin yapısal eşitlik modellemesi ile analizi amaçlanmıştır. Dünya sağlık örgütüne göre bireylerin yaşam kalitesi üzerinde, bedensel, ruhsal, çevresel ve sosyal alanlardaki düşünceleri etkilidir. Yapılan bu çalışma ile bireylerin bu düşüncelerinin etkileri araştırılmış ve modellenmeye çalışılmıştır. Yöntem: Çalışmanın çözümleme safhasında Yapısal Eşitlik Modellemesinden (YEM) yararlanılmıştır. Yapısal eşitlik modellerinde özelleştirilen bağımlı ve bağımsız ölçüm modelleri, bağımlı ve bağımsız gözlenen değişken setlerinin her birine ait faktör yapısını ortaya koymaktadır. Bir diğer ifadeyle her bir ölçüm modeli bir onaylayıcı faktör analizidir. Bu nedenle ölçüm modellerinde kurulan faktör yapısının doğru olması, bağımlı ve bağımsız faktörler arsındaki ilişkileri gösteren yapısal model için önem taşımaktadır. Bulgular Araştırma bulguları kısaca özetlenecek olursa; Ruhsal alan değişkeninde meydana gelecek bir birimlik artış çevresel alandaki memnuniyeti 0,82’ lik bir artışla etkilemektedir veya Çevresel alan değişkeninde meydana gelecek bir birimlik artış ruhsal alandaki memnuniyeti 0,82’ lik bir artışla etkilemektedir. Bedensel alan değişkeninde meydana gelecek bir birimlik artış çevresel alandaki memnuniyeti 0,91’ lik bir azalışla etkilemektedir veya Çevresel alan değişkenindeki meydana gelecek bir birimlik artış bedensel alandaki memnuniyeti 0,91’ lik bir azalışla etkilemektedir. Sonuç Dünya Sağlık Örgütü Yaşam Kalitesi Ölçeği kullanılarak yapılan çalışmada analizler LISREL paket programı yardımıyla yapılmış ve yorumlanmıştır. Analiz sonuçlarına göre bireyin çevresel alandaki memnuniyeti ile ruhsal alandaki memnuniyeti arasındaki ilişki katsayısı pozitif yönlü ve en yüksek çıkmıştır, ayrıca çevresel alandaki memnuniyetin ruhsal alandaki memnuniyeti arttırdığını söylemek de mümkündür. Anahtar Sözcükler: Yaşam Kalitesi Ölçeği, Yapısal Eşitlik Modellemesi, Whoqol-Bref Ölçeği. Kaynakça Avcı K., ve Pala K., (2004), “Uludağ Üniversitesi Tıp Fakültesinde Çalışan Araştırma Görevlisi ve Uzman Doktorların Yaşam Kalitesinin Değerlendirilmesi”, Uludağ Üniversitesi Tıp Fakültesi Dergisi, 30 (2) 81-85. 43 Boysan M., (2006), Çok Örneklemli Yapısal Eşitlik Modelleri Yüzüncü Yıl Üniversitesi Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi, Van. Eser E, Fidaner H, Fidaner C, Eser SY, Elbi H, Göker E., WHOQOL-100 ve WHOQOL-BREEF’in psikometrik özellikleri, 3P Dergisi 1999; 23-40 (Ek 2). Jöreskog, K. ve Sörbom, D., (2001). “LISREL 8: User’s Reference Guide” Scientific Software International Inc., Chicago. Schermelleh-Engel, K. ve Moosbrugger, H., (2003). Evaluating The Fit of Structural Equation Models: Tests of Significance and Descriptive Goodness-of-Fit Measures. Methods of Psychological Research Online, Vol:8 No:2, 23-74. Yılmaz V., (2004), “Consumer Behaviour of Shopping Center Choice”, Social Behavior and Personality, 32 (8), 783-790. Cengiz Gazeloğlu: E-Posta: [email protected] 44 S29 İzlem Süresi İçerisinde Belirteçlerin Performanslarını Değerlendirmede Zamana Bağlı ROC Eğrisi Eda Karaismailoğlu1, Umut Arslan1, A. Ergun Karaağaoğlu1 1 Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Giriş: Tıpta; belirteç ya da testler, tanı ve tedaviye yardımcı olmanın yanı sıra, tedavi sonrası hastaların izleminde de sıklıkla kullanılmaktadır. Belirteçlerin performanslarının değerlendirilmesinde çeşitli yöntemler geliştirilmiştir. Bunların arasında en yaygın kullanılan yöntem, ROC (receiver operating characteristic) analizidir. Klasik ROC eğrisinde, bireyin hastalık durumunun zamanla değişmediği varsayılmaktadır. Ancak, zaman içerisinde kişinin hastalık durumunda değişiklik olabilir. Yani, takip zamanı içerisinde bazı hastalarda olgu gerçekleşebilir. İzlem süresi boyunca olgu gerçekleşmeyen birey, sansürlü gözlem olarak tanımlanır. Eğer, sansürlü veriler varsa belirtecin performansı zamana bağlı ROC analizi ile değerlendirilmelidir. Zamana bağlı ROC eğrisi kullanılarak belirtecin [0,t] zaman aralığında, olgu gerçekleşen ve gerçekleşmeyen bireyleri ayırmadaki performansı değerlendirilebilir. Bu çalışmanın amacı, sansürlü gözlem ve olgu sıklıkları farklılaştığında, bununla birlikte belirteç değerleri üzerinde de değişiklikler yapıldığında, farklı senaryolar için elde edilen zamana bağlı ROC eğrilerinin nasıl değiştiğini incelemektir. Gereç ve Yöntem: Çalışmada sözü edilen farklı senaryolar, Mayo kliniğinde primer biliyer siroz (PBS) tanısı almış, 312 hastadan elde edilen ve internet erişimine açık olan veriler üzerinde uygulanmıştır. Bu hastaların başlangıç albumin, log(protrombin zamanı), ödem varlığı ve yaş değişkenleri kullanılarak, cox modeli ile birinci tanı belirteci (Mayoskor4), bu değişkenlere log(bilirubin) eklenerek yine cox modeli ile ikinci tanı belirteci (Mayoskor5) elde edilmiştir. Hastaların on yıllık takip süreleri sonunda, bu belirteçlerin zamana bağlı ROC eğrileri öncelikle orijinal veriden elde edilmiştir. İlk senaryoda, belirteçler üzerinde hiçbir değişiklik yapılmadan sansürlü gözlem sıklıkları azaltılarak, ikinci senaryoda yine belirteçler üzerinde hiçbir değişiklik yapılmadan olgu sıklıkları azaltılarak, üçüncü senaryoda ise olgu gerçekleşen ve gerçekleşmeyen bireylerin belirteç değerleri farklılaştırılarak zamana bağlı ROC eğrileri elde edilmiştir. Son olarak; hem sansürlü, hem olgu sıklıklarındaki değişimle birlikte belirteç değerleri farklılaştırılmış ve zamana bağlı ROC eğrileri elde edilmiştir. Buna göre, sansürlü gözlem ve olgu sıklıkları değiştiğinde ve olgu gerçekleşen ile gerçekleşmeyen bireylerde belirteç değerleri farklılaştığında elde edilen zamana bağlı ROC eğrileri karşılaştırılmıştır. Bulgular: İzlem süresi içerisinde olgu gerçekleşen ve gerçekleşmeyen bireylerin belirteç değerleri birbirinden ayrıştıkça, belirteç, zaman içerisinde daha iyi performans göstermektedir. Olgu sayısı azaldıkça belirteçlerin zamana bağlı ROC eğrilerinde ani düşüşler ya da yükselişler görülebilmektedir. Sansürlü veri sayısının azalmasıyla belirteçlerin ROC eğrilerinin zaman içerisinde gösterdiği seyir değişmemekte, fakat eğri altında kalan alanlar bir miktar düşmektedir. Sonuç: Olgu gerçekleşen ve gerçekleşmeyen bireylerin oranı değiştiğinde, belirtecin zamana bağlı ROC eğrisi altında kalan alanlar da farklılaşmaktadır ve bu değişim, belirtecin zaman içerisindeki tanı performansını etkilemektedir. 45 Ayrıca, olgu gerçekleşen ve olgu gerçekleşmeyen bireylerin ortalama belirteç değerleri birbirinden ayrıştıkça belirtecin tanı performansı artmaktadır. Anahtar Kelimeler: Zamana Bağlı ROC Eğrisi, Sağkalım Tahmini, Sansürlü Veri Eda Karaismailoğlu: e-posta: [email protected] 46 S30 Veri Madenciliği Sınıflama Yöntemlerinin Başarılarının; Örneklem Büyüklüğü, Bağımlı Değişken Prevelansı ve Bağımsız Değişkenler Arası İlişki Miktarına Göre Karşılaştırılması M. Özgür Dolgun1, N. Anıl Dolgun1, Osman Saraçbaşı1 1 Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Amaç: Karar Ağaçları, Bayesian Ağları, Karar Destek Makinaları (Support Vector Machines-SVM) gibi sınıflama yöntemleri literatürde ve uygulamalarda en çok kullanılan istatistiksel ve veri madenciliği kökenli sınıflama yöntemleri arasında yer almaktadır. Bu yöntemler kullanılırken bağımsız değişkenlerin ölçüm seviyesi (sürekli, kesikli vb.), bağımsız değişkenlerin dağılımı (simetrik, çarpık dağılım, vb.), bağımsız değişkenler arasındaki ilişkiler (düşük, orta veya yüksek ilişki), bağımlı değişkenin yapısı gibi başlıca önemli unsurların model başarısına olan etkileri göz ardı edilmektedir. Literatürde sınıflama yapmak için sıklıkla kullanılan yöntemler, doğrusal ayırma analizi (linear discriminant) ve lojistik regresyon analizidir. Bazı varsayım bozulumlarından dolayı; Karar Ağaçları, SVM, Bayesian Ağlar, k-En Yakın Komşular, Yapay Sinir Ağları, Apriori Algoritması, Genetik Algortimalar, Fuzzy Set Yaklaşımı gibi veri madenciliği yöntemlerinden yararlanılmaktadır [1, 2, 3, 4, 5]. Bağımsız değişkenler arasında yüksek korelasyon (veya düşük korelasyon) olduğu durumlarda, bağımsız değişkenlerin simetrik veya çarpık (vb. dağılımlar) dağılması durumlarında sınıflama yöntemlerinin performansının nasıl etkilendiğine dair çalışmalar neredeyse hiç incelenmemiş bir konudur. İncelenen çalışmalarda ise model performansların değerlendirmesi genelde tek bir karşılaştırma kriterine göre yapılmış ve sonuçlar genellenmemiştir. Yöntem: Çalışmada, örneklem büyüklüğünün, bağımlı ve bağımsız değişkenlerin farklı yapılarda olduğu durumlarda, Karar Ağaçları, Bayesian Ağlar ve SVM yöntemlerinin model başarılarının karşılaştırılması için Monte Carlo benzetim çalışmasından yararlanılmıştır. Kullanılacak senaryolara ilişkin; i. Bağımlı değişken prevelansı (p = 0,10; p = 0,50 ve p = 0,75) üç farklı, ii. Bağımsız değişken sayısı (5 ve 25) iki farklı, iii. Bağımsız değişkenler arasındaki ilişki miktarı (r = 0,25 ve r = 0,75) iki farklı ve iv. Örneklem büyüklüğü (n = 100 ve n = 1000) iki farklı senaryo olmak üzere toplam 24 senaryo bu çalışmada ele alınmıştır. Her bir senaryo için üretilen veri setlerine aşağıda verilen sınıflama yöntemleri uygulanmış ve yöntemlerin başarıları birbirleri ile karşılaştırılmıştır. 47 Kullanılan yöntemler; 1. 2. 3. Karar Ağaçları a. Chi-squared Automatic Interaction Detection (CHAID) b. Classification and Regression Tree (C&RT) c. C5.0 Bayesian Ağlar a. Tree Augmented Naïve Bayes (TAN) b. Markov Blanket Ağları Karar Destek Makinaları (Support Vector Machines-SVM)’dır. Bulgular: Yöntem bölümünde söz edilen 24 senaryo 1000 kere tekrar edilerek veriler türetilmiştir. Elde edilen senaryolara ilişkin veriler yine yöntem bölümünde bahsedilen 6 yöntem için denenmiş ve hangi senaryo altında hangi yöntemin daha iyi sonuç verdiği genel doğruluk oranı, duyarlılık, seçicilik vb. kriterlerle değerlendirilmiştir. Anahtar Kelimeler: Sınıflama Yöntemleri, Model Karşılaştırma, Benzetim Çalışması Kaynaklar Bichler M. and Kiss C. (2004), Comparing Classification Methods for Campaign Management: A Comparison of Logistic Regression, k-Nearest Neighbor, and Decision Tree Induction for Campaign Management, In: Proceedings of the Tenth Americas Conference on Information Systems (AMCIS), New York. Han J. and Kamber M. (2006), Data Mining: Concepts and Techniques, The Morgan Kaufmann, Second Edition. Othman M.F. and Yau T.M.S. (2007), Comparison of different Classification Techniques Using WEKA for Breast Cancer, 3rd Kuala Lumpur International Conference on Biomedical Engineering IFMBE Proceedings, Volume 15, Part 13, 520-523. C. Romero S., Ventura C. and Hervás P. Gonzales (2008), Data mining algorithms to classify students, International Conference on Educational Data Mining (EDM), Montreal. Michie D., Spiegelhalter D.J., Taylor, C.C. and Campbell J. (1994), Machine Learning, Neural and Statistical Classification, Ellis Horwood. M. Özgür Dolgun: E-Posta: [email protected] 48 S31 Zaman Serilerinin Modellenmesi ve Geleceğe Yönelik Kestirimlerinin Değerlendirilmesi: 1928-2010 Hekim Başına Düşen Kişi Sayısı Örneği Mustafa Agah Tekindal1, Yasemin Genç2 Uzman, Biyoistatistik Anabilim Dalı, Tıp Fakültesi, Başkent Üniversitesi, Ankara 2 Biyoistatistik Anabilim Dalı, Tıp Fakültesi, Ankara Üniversitesi, Ankara Özet Amaç: Zaman serisi olaylarını tahminlemede yararlanılan otoregresif tamamlanmış hareketli ortalama süreci (Auto Regressive Integrated Moving Average, ARIMA) yöntemi, Box ve Jenkins (Box ve Jenkins , 1976) tarafından geliştirilmiştir. ARIMA modelleme yaklaşımı, değişkenler arasında doğrusallık olması varsayımıyla sınırlıdır. Bunun yanı sıra araştırmacılar, doğrusallık varsayımını sağlamayan zaman serisi olaylarının tahminlenmesi için alternatif modelleme bakış açıları geliştirilmiştir. Bu çalışmada; 1928-2010 Hekim başına düşen kişi sayısı verilerinin farklı yöntemlerle (ARIMA, Hareketli Ortalamalar ve Üssel Düzgünleştirmeler) modellenerek geleceğe yönelik kestirimleri karşılaştırmalı olarak değerlendirilecektir. Yöntem: ARIMA ya da Box-Jenkins modelleri d dereceden farkı alınmış serilere uygulanan AR ve MA modellerinin birer kombinasyonudur. Box-Jenkins yönteminin özü, mevcut verilerin yapısına bağlı olarak, çeşitli model seçenekleri arasından en elverişli fakat sınırlı sayıda parametre içeren bir ARIMA modelinin seçilmesidir. Bu modellerin bütün olarak gösterimi ARIMA (p, d, q) şeklindedir. Ayrıca uygulamada hareketli ortalamalar ve üstel düzgünleştirmeye dayanan kestirim yöntemleri de kullanılmıştır. Bulgular: 1928-2010 Hekim başına düşen kişi sayısı verilerinin ARIMA, Hareketli Ortalamalar ve Üssel Düzgünleştirmeler yöntemleri ile modellendikten sonra geleceğe yönelik (2020 yılına kadar) model performansları değerlendirilmiştir. ARIMA (0,1,0) modeli hem (Mutlak Kestirim Hata Ortalaması Yüzdesi; Mean Absolute Percentage Error (MAPE)) değeri hem de tahmin tutarlığı açısından en uygun model olarak belirlenmiştir. Sonuç ve Öneriler: Zaman Serilerinin Modellenmesi ve Geleceğe Yönelik Kestirimlerinin Değerlendirilmesi tek bir modele bağımlı kalınmamalıdır. İyi ve kötü birçok senaryo belirlenmelidir. Belirlenen senaryolar içerisinden tahmin tutarlılığı için önerilen (Kestirim Hata Ortalaması; Mean Forecast Error (MFE or Bias)) ve (Mutlak Kestirim Hata Ortalaması Yüzdesi; Mean Absolute Percentage Error (MAPE)) değerleri yada bilgi kriterleri (AIC, BIC) baz alınarak en iyi model seçilmeli ve geleceğe yönelik kestirimleri belirlenmelidir. Anahtar Kelimeler: Zaman Serileri, Tahmin tutarlılığı, ARIMA Modelleri, Üstel Düzgünleştirme Yöntemleri, Kestirim, Trend Kaynaklar Box, G. E. P., G. M. Jenkins, and G. C. Reinsel. 1994. Time series analysis: Forecasting and control, 3rd ed. Englewood Cliffs, N.J.: Prentice Hall. Brockwell, P. J., and R. A. Davis. 1991. Time Series: Theory and Methods, 2 ed. : Springer-Verlag. 49 Gardner, E. S. 1985. Exponential smoothing: The state of the art. Journal of Forecasting, 4, 1-28. Harvey, A. C. 1989. Forecasting, structural time series models and the Kalman filter. Cambridge: Cambridge University Press. Makridakis, S. G., S. C. Wheelwright, and R. J. Hyndman. 1997. Forecasting: Methods and applications, 3rd ed. ed. New York: John Wiley and Sons. Melard, G. 1984. A fast algorithm for the exact likelihood of autoregressive-moving average models. Applied Statistics, 33:1, 104-119. Pena, D., G. C. Tiao, and R. S. Tsay, eds. 2001. A course in time series analysis. New York: John Wiley and Sons. GEP Box, JENKİNS G., (1976), Time Series Analysis, Forecasting and Control, San Francisco: HoldenDay KASAP, R., (1998) Finansal Vektörel Zaman Dizilerinde Özdeğer-Özvektöranaliziyle Eşzamanlı Ve Gecikmeli Doğrusal İlişkilerin Tesbiti, Dokuz Eylül Üniversitesi, İİBF Dergisi , 13(2),163-171 KASAP, R., (1998) , İstanbul Menkul KıymetlerBorsası'nınincelenmesi: İstatistikselbir yaklaşım- An analysis of the Istanbul Stock Exchange (ISE) national-100 index: a statistical approach, İMKB Dergisi ISE Review , 6, 27-33 LUND, R., and BASAWA, I.V., (1998), Recursive Prediction and Likelihood Estimation for Periodic ARMA Models , Journal of Time Series Analysis, Vol. 21, No. 1, pp. 75-93 YAMAN K. , SARUCAN A, ATAK M., AKTÜRK N., (2001) Dinamik Çizelgeleme İçin Görüntü İşleme Ve Arıma Modelleri Yardımıyla Veri Hazırlama Gazi Üniv. Müh. Mim. Fak. Der., Cilt 16, No 1, 19-40 Mustafa Agah Tekindal: E-Posta: [email protected] 50 S32 Kanonik Uyum Analizi ve Sağlık Alanında Bir Uygulaması Sıddık Keskin1, Sadi Elasan1, A. Cumhur Dülger2 1 2 Yüzüncü Yıl Üniversitesi, Tıp Fakültesi, Biyoistatistik AD. Van Yüzüncü Yıl Üniversitesi, Tıp Fakültesi, Gastroenteroloji BD. Van Özet Amaç: Bu çalışmanın amacı; Kanonik uyum analizinin tanıtımı, teorik alt yapısı ile işlem aşamalarının açıklanması ve Sağlık alanında bir uygulama ile elde edilen sonuçların yorumlanmasıdır. Yöntem: Çalışmada uygulama materyali olarak YYÜ. Tıp Fakültesi, İç Hastalıkları ABD, Gastroenteroloji BD dan elde edilen hidatik kistli 92 hastanın verileri kullanılmıştır. Veriler, Albümin ve Globülin değişkenlerine ait değerler ile hidatik kist tipi olarak 5 tip ve kistin yerleştiği bölge olarak da 4 bölgeye ait frekansları içermektedir. Kanonik uyum analizi; ilk olarak, ekolojik verilerde, canlıların veya türlerin yoğunluğu ile çevresel veriler arasındaki ilişkileri belirlemek amacıyla geliştirilmiş çok değişkenli analiz yöntemlerinden birisidir. Bu analiz yöntemi, günümüzde farklı disiplinlerde de yaygın olarak kullanılmaya başlanmıştır. Uyum analizi, Kanonik korelasyon analizi ve Regresyon analizi yöntemlerinin bir kombinasyonu olarak düşünülebilen Kanonik uyum analizinde, boyut indirgeme yardımıyla, açıklayıcı değişkenler ile lokasyon (yer veya site) ve nesneler (tür veya tip vb.) arasındaki ilişkilerin, (genelde) iki boyutlu uzayda görsel olarak sunulması amaçlanır. Bulgular: Çalışmada Pseudo F değeri 6.813 (p< 0.05) olarak bulunmuştur. Birinci ve ikinci boyutlara ait toplam varyans açıklama oranı sırası ile % 69. 60 ve % 18.81 olarak bulunmuştur. İki boyut ise toplam varyansın % 88. 41’ini açıklamıştır. Globülinin birinci boyut için regresyon katsayısı negatif olurken, Albümine ait regresyon katsayısı her iki boyut için de pozitiftir. Sonuç: Kanonik uyum analizi, her ne kadar, daha çok ekolojik verilerde kullanılmakta ise de sağlık alanındaki veriler için de rahatlıkla kullanılabileceği söylenebilir. Bunun yanı sıra; Kanonik korelasyon analizine göre varsayımlara karşı daha esnek olması, çoklu uyum analizine göre de bazı avantajlara sahip olması gibi üstünlüklerinden de bahsedilebilir. Anahtar Kelimeler: Inertia, Boyut İndirgeme, Özdeğer, Standart Koordinat 51 S33 Ülkemizdeki Sezaryen Oranlarının Dünya Verileri ve Çeşitli Kadın İstatistikleri Işığında Değerlendirilmesi Mervin M. Atay1, Z. Nazan Alparslan2 1 Uzm., Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana 2 Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana Özet Amaç: Bu çalışmada, Çukurova Üniversitesi hastanesi verilerinden yola çıkılarak, hastane bazında, ülkemizde ve dünyada artan sezaryen oranlarını tartışmak ve ülke verilerini ülkelerin kadınlarla ilgili çeşitli istatistikleri ile ilişkilendirmek amaçlanmıştır. Yöntem: Bu çalışma, Ocak 1986 ile Aralık 2002 tarihleri arasında Balcalı Hastanesi Doğum Kliniğindeki kayıtlardan toplanmış olan sezaryen ve normal doğum verileri ve ülkelerin sezaryen doğum ve kadın istatistikleri değerlendirilerek yapılmıştır. Bulgular: Çukurova Üniversitesi. Balcalı Hastanesinin 1980’li yıllardan itibaren toplanan istatistikleri gözden geçirildiğinde, sezaryen oranlarının bazı aylarda %50’lere kadar çıktığı göze çarpmaktadır. Bu yerel veriye paralel olarak ülke bazında bakıldığında da ülkemizde de sezaryen oranlarının genel bir artış eğilimi gösterdiği görülmekte, hatta bu hız 2006’da son yılların en yüksek değeri olan %40,8 olarak tespit edilmektedir. OECD ülkelerinin 2007 yılındaki sezaryen oranları yüksekliğe göre Meksika (%40,7), İtalya (%39,8), Türkiye (%36,0) olarak sıralanmaktadır. Bu konuda DSÖ’nün esas aldığı oran ise %10-15’dir. Çalışmamızda ülkelerin sezaryen oranlarının kadınlarla ilgili istatistikler(okullaşma oranları, yaşam boyu ana ölüm riski, erkeklerin yaşam beklentisinin yüzdesi olarak kadınların yaşam beklentisi gibi) ve demografik özelliklerle kümelenmesi araştırılmış ve ülkemizin bu ilintideki yeri diğer OECD ülkelerinin verileri ile karşılaştırılmıştır. Sonuç: Dünya rakamları ile paralel olarak ülkemizde de sezaryen hızları artış göstermektedir; ancak bu hızlar ve demografik göstergeler açısından bakıldığında, ülkemiz birçok OECD ülkesinden ayrışmaktadır. Anahtar kelimeler: Sezaryen hızları, kadın istatistikleri, OECD ülkeleri. Uzm. Mervin M. Atay: E-Mail: [email protected] 52 S34 A New Dimension Reduction Technique Using Information Complexity for High Dimensional Gene Expression Data 1 Esra Pamukcu , Hamparsum Bozdogan2, Cemil Colak3 1 2 Department Of Statistics, Faculty Of Science, Firat University Elazig, Turkey Department Of Statistics, Operations And Management Science, The University Of Tennessee, Knoxville, Tn, USA 3 Department Of Biostatistics And Medical Informatics, Faculty Of Medicine , Inonu University, Malatya, Turkey Abstract Objective: Dimension reduction (DR) is of great importance in the applications of biostatistics and bioinformatics. In this study our objective is DR of high dimensional gene expression data when the number of observations is much smaller than the dimension of the data to resolve the “curse of dimensionality.” Material and Method: When the number of observations is much smaller than the number of features (or variables), the undersized sample problem occurs.In this case the usual sample covariance matrix S degenerates and it cannot be computed. One possible solution to such a problem is provided by the maximum entropy(ME) and several other smoothed (or robust) covariance estimators, or by the hybridized forms of these covariance estimators to carry out the Principal Component Analysis (PCA) for DR. Therefore, in this paper, we introduce the MEcovariance matrix along with its complexity and ICOMP criterion of Bozdogan (1994,2000, 2010) to choose the number of principal components (PCs) to reduce the dimensionality of the data. Then, we carry out a supervised classification using the PCs chosen inboth the Linear Discriminant Analysis(LDA) and Quadratic Discriminant Analysis (QDA)to study the performance of these two methods of classification in terms of their error rates (ERs) of classification. Outcomes: We consider the benchmark colon cancer data set from Alone et al. (1999). This data set has intensities of p=2,000 genes in 22 normal and 40 tumor colon tissues; totaling n=62 colon tissues. The genes chosen are the 2,000 genes with highest minimal intensity across the samples.The classical PCA cannot deal with p=50 or above genes (features). Our approach with ME covariance matrix hybridized with Stipulated Ridge Estimator, that is, ME_SRECOV does not degenerate to perform the PCA.We score the complexity of the ME_SRECOV matrix along with ICOMP to choose the number of PCs to reduce the dimension of the colon data and to choose the best features. Results: LDA and QDA give 22.5% and 6.5% ERs of classification using the first 20 original raw data features, respectively.Our approach with 20 PC transformed data presents 27.42% ER in LDA and 1.61 % ER in QDA for the classification of the colon data.We note that our result with QDA is a remarkable reduction in the ER that corresponds to one cancerous colon patient that should be re-examined for normalcy. Hence, our results show the versatility and the utility of the new proposed approach. Key Words: Maximum Entropy Covariance Estimator, Information Complexity, Principal Component Analysis 53 S35 Doğrulama Yanlılığında Kullanılan Eksik Gözlem Analizi Yöntemlerinin Performanslarının İncelenmesi Jale Karakaya1, Erdem Karabulut1, Recai Yücel2, Ergun Karaağaoğlu1 1 2 Hacettepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara, Turkey State University at Albany, SUNY, School of Public Health, Department of Epidemiology and Biostatistics, New York, USA Özet Giriş: Teknolojinin ilerlemesi ile birlikte, hem kalite ve hem de maliyet açısından farklı tanı testlerinin göreli doğruluğunun değerlendirilmesi oldukça önemlidir. Tanı testinin doğruluğunu değerlendirmek için, testin doğruluğunun yansız kestirimine gereksinim vardır. Test doğruluğunun yansız kestirimini elde etmek için her hastada hastalık durumunun (var-yok) ve tanı testinin sonucunun bağımsız olarak belirlenmesi gerekir. Oysaki bazı klinik değerlendirmelerde, test sonucu olan hastaların büyük çoğunluğunun hastalık durumu altın standart test ile doğrulanamayabilir. Tanı testlerini değerlendirmek için düzenlenmiş çalışmalarda, bu yaklaşım mantıklı ve maliyet açısından etkin olabilmesine rağmen, testlerin doğruluğunun kestirilmesinde yanlılığa neden olmaktadır. Yanlılığın bu tipi doğrulama yanlılığı (verification bias) olarak adlandırılmaktadır. Literatürde doğrulama yanlılığının düzeltebilmek için Begg ve Greens’in yöntemi ve eksik gözlem analizi yaklaşımları önerilmiştir. Test sonucu olup altın standart teste gönderilmeyen gözlemler eksik gözlem problemi olarak düşünülebilir ve bu gözlemler uygun yöntemler kullanılarak doldurulabilir. Amaç: Bu çalışmada amaç, doğrulama yanlılığı problemine çözüm bulabilmek için kullanılan Begg ve Greens’in yöntemi ve farklı çoklu değer atama (multiple imputation) yöntemlerinin performansını karşılaştırmaktır. Yöntem: Doğrulama yanlılığında test performans ölçüleri, Begg ve Greens’in Bayes yaklaşımı yardımıyla düzeltilebileceği önerilmiştir. Son yıllarda popular olan çoklu değer atama yöntemleri ile Begg ve Greens yöntemine göre elde edilen performans sonuçları benzetim çalışması ile karşılaştırılacaktır. Çoklu değer atama yöntemlerinden parametrik ve parametrik olamayan birden fazla yöntem tercih edilecektir. Karşılaştırma kriteri olarak kapsama oranı ve güven aralığı genişliği kullanılacaktır. Bulgular: Farklı örneklem büyüklüklerinde, farklı duyarlılık-seçicilik oranlarında ve farklı eksik gözlem oranlarında Begg ve Greens’in yöntemi ve çoklu değer atama yöntemlerinin başarıları benzetim çalışması ile incelenecektir. Sonuç: Yöntemlerin performansları, kapsama oranları ve güven aralığı genişliklerine göre karşılaştırılarak incelenecektir. Yöntemlerin en başarılı ve en başarısız olduğu durumlar belirlenerek yorumlanacaktır. Anahtar Kelimeler: Doğrulama Yanlılığı, Eksik Gözlem, Çoklu Değer Atama 54 S36 Karar Ağacı Yönteminin Kestirim Yeterliliğinin İrdelenmesi; Bipolar Depresyon Tanısı Üzerinden Bir Değerlendirme Mehmet Güven Günver 1, Ali Baykuş 1, Günalp Uzun 1 1 İstanbul Üniversitesi, Cerrahpaşa Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi ABD, İstanbul Özet Giriş: Karar Ağacı Yöntemi, çok değişkenli olarak derlenmiş veriseti üzerinden, bağımlı değişkeni bağımsız değişkenlerin entropik olanlarına istinaden kökten yaprağa doğru bir yol haritası çıkaran bir istatistiksel yöntemdir. Verisetini oluşturan örneklem büyüklüğü ve örneklemin niteliği ağacın oluşmasını direkt etkilemektedir. Verisetindeki örneklemlerin rastsal olarak seçilmesi sonucu, entropik değişkenlerin değişebildiği bilinmektedir. Amaç: Bipolar depresyon vakalarını içeren veriseti içinden aynı boyutta fakat farklı nitelikte alt verisetleri üzerinde karar ağacı modelini uygulayarak, sonuçların tutarlılıklarının irdelenmesi. Yöntem: 964 kayıt bulunan bipolar depresyon verisetinden her biri 868 kayıt içeren 500 alt veriseti rastsal olarak seçildi. Her bir alt veriseti, CHAID (CHi-squared Automatic Interaction Detection) algoritması ile karar ağacı modellemesi yapıldı. Tartışma ve Sonuç: Elde edilen karar ağaçlarında 2 farklı yapı ortaya çıkmıştır. Farklı karar ağacı tiplerinin kaç kere gözlemlendikleri, düğüm sayıları, her bir tip için entropik değişken sayısı ve ortalama doğruluk düzeyleri aşağıdaki tablo ile özetlenmiştir: Gözlemlenme Düğüm Sayısı Sayısı Entropik Değişken Ortalama Sayısı Doğruluk Düzeyi 1. Tip Karar Ağacı 376 8 3 % 76,8 2. Tip Karar Ağacı 124 6 2 %76,4 Aynı veriseti üzerinde değişik rastsal alt verisetleri üzerine inşa edilen karar ağaçlarında, entropik değişken sayısı ve düğüm sayısı değişse bile ortalama doğruluk düzeyinin tutarlı olduğu gözlemlenmiştir. Anahtar Kelimeler: Karar Ağacı, Chaid, Tutarlılık Mehmet Güven Günver: Cerrahpaşa Tıp Fak. Biyoistatistik ve Tıp Bilişimi ABD-İstanbul 34303 . Tel.: 0 212 414 30 41 E-Posta: [email protected] 55 S37 Some Observations on the Design of Early Stage Clinical Trials in the Pharmaceutical Industry Hans Hockey1 1 Biometrics Matters Ltd, Hamilton, New Zealand Abstract Early in clinical drug development the pharmacokinetic and pharmacodynamic properties of new compounds need to be explored, as well as safety and tolerability, particularly in relation to dose level and the subsequent determination of the maximum tolerated dose. Hence drug half-life, dose proportionality and other pharmacologic properties of the drug are estimated so as to determine how best to administer the drug. There are also issues of genotype differences, drug-drug interactions, the effect of food, of bioequivalence between different formulations, and so on, all of which are typically studied using healthy volunteers. Determination of efficacy in actual patients suffering from the targetted indication cannot proceed until there is sufficient knowledge of what effects the bioavailability and other properties of the drug. Good and bad examples of early stage clinical trial designs in healthy volunteers that I have encountered will be presented and discussed. These include cross-over designs and studies with a factorial treatment structure. The various regulatory guidelines in this area and their effect on design and analysis will also be mentioned. Personal observations, some from an agricultural research perspective, on experimental design and subsequent analyses in early stage clinical trials will be made. 56 S38 Beta-Weibull Distribution for Simple Linear Regression and its Locally D-Optimal Design Habib Jafari1 1 Department of Statistics, School of Science, Razi University Kermanshah-Iran Abstract In this paper, the Beta-Weibull distribution and its application will be introduced. Afterward, I define a simple linear regression which its error term has Beta-Weibull distribution. A design will be defined based on some values of independent variables and then, the Locally D-optimal criterion will be considered for obtaining locally D-optimal design. I consider the Locally D-optimal criterion, because of depending the information matrix on unknown parameters (Locally D-optimal criterion is a function of the information matrix). Keywords: Beta-Weibull Distribution; D-Optimal Criterion; A-Optimal Criterion; Locally D-Optimal Design 57 S39 Estimation under Progressive Type-II censoring for Reciprocal Exponential Distribution Sumeet Kaur1 1 FORE School of Management, New Delhi, India Abstract Estimation related to the parameters of reciprocal exponential distribution is discussed for progressively type-II censored samples. A maximum likelihood estimator for the parameters is developed. A simulation study is considered for different pattern of censoring. Here we have used the simulation algorithm given by Aggarwala (2001) to generate samples. Here we have specified the proportion of surviving units to be removed at five monitoring and censoring point. The percentages of removing units from the surviving units at five stages are increasing in pattern R1 while decreasing in pattern R2. In pattern R3, a conventional type- II censoring scheme is employed. Using the likelihood level r, the likelihood inequality can be solved in order to construct a likelihood interval for θ. From a graph of likelihood ratio= L (θˆ ) / L (θ ) plotted against various values of θ, the likelihood interval for θ can be obtained for given level r, by drawing a horizontal line at L (θˆ ) / L (θ ) =r and the corresponding likelihood interval will contain all values of θ below this line. For bootstrapping, we again have simulated 1000 samples using the value of θˆ as a true value of θ and calculated θˆboot ( p ) for p = 0.025 and p = 0.975 to obtain the 95% confidence interval Keywords: Reciprocal Exponential Distribution, Progressive Type-II Censoring, Maximum Likelihood Estimation, Confidence Interval. Sumeet Kaur: E-Mail: [email protected] 58 S40 Small-study Effects in Individual Patient Data Meta-analysis of Prognostic Factor Studies Ghada M. Abo-Zaid1, Jon J Deeks2, Richard D. Riley2 1 2 European Centre for Environment and Human Health, University of Exeter School of Public Health, Epidemiology and Biostatistics, University of Birmingham Abstract Background: Prognostic factors (PFs)are patient characteristics (e.g.age, biomarker levels) that are associated with future clinical out comes in patients with a disease or health condition. Evidence-based PF results are paramount, for which individual patient data (IPD) meta-analysisis thought to be the’gold-standard’ approach, asitsynthesises the raw data across related studies. This does not mean that IPD approach without its challenges and pitfalls; one of these potential challenges is publication bias. It occurs when studies with statistically significant results are more likely to be published compared to studies with non-significant results. If IPD are only sought from, or are only available from, published studies then IPD meta-analyses of PFs may be prone to publication bias. One way to examine potential publication bias is to look for small study effects; that is, the tendency for smaller studies to give larger prognostic effects than larger studies. Aims: In this talk, I will assess small-study effects and potential publication bias for unadjusted and adjusted prognostic factor results within existing IMPF articles. Methods and Material: A systematic review identified 48 IPD meta-analysis of prognostic factors, and the 20 most recent articles were chosen for the examination of small study effects using visual tools (e.g. a contour enhanced funnel plot) and statistical methods (i.e. Egger’s method, and the Trim and Fill methpd). Only 1 article report summary study results to allow such investigations, so I e-mailed 19 articles to ask for their aggregated data or their IPD; only five other articles provided the information desired. The strategy for the assessment for the small-study effects was: first, assess small-study effects visually by using a contour-enhanced funnel plot and a cumulative forest plot; second, estimate the number of missing studies by using he trim and fill method; third, obtain the p-value for Egger’s test of asymmetry. Then, if the trim and fill method yielded 2 or more missing studies or Egger’s P-value was less than 0.10, then I used Moreno’s ‘Egger Dvar method’ to adjust for funnel plot asymmetry and estimate an adjusted pooled effect size of the PF. Results & Conclusion: When reviewing the 20 IMPF articles considered, only 2 articles included unpublished studies (which raises the threat of publication bias), and only 2 articles actually examined the issue of publication bias. My investigation of the 6 articles that gave suitable information shows little evidence for smallstudy effects. This indicates that the IPD prognostic factor meta-analyses have potentially less concern for smallstudy effects or publication bias than meta-analysis of PFs using aggregated data. However, only six examples could be assessed and so further research is needed. All IPD projects should consider small study effects and the 59 potential impact of publication bias. An example in breast cancer will be shown where small study effects do exist, and the potential implications on clinical conclusions discussed. References Moreno SG, Sutton,A J, Ades,AE,Stanley, T D. Assessment of regression-based methods to adjust for publication bias through a comprehensive simulation study. BMC Medical Research Methodology 2009;9:2 doi:10.1186/1471-2288-9-2. Sterne J, Egger M. . Funnel plots for detecting bias in meta-analysis: guidelines on choice of axis. Journal of Clinical Epidemiology 2001;54(doi:10.1016/S0895-4356(01)00377-8):1046–55. Riley R, Lambert PC, Abo-Zaid G. Meta-analysis of individual participant data: rationale, conduct, and reporting. BMJ 2010; 340:c221 doi: 10.1136/bmj.c221. Keywords: Meta-Analysis, IPD, Prognostic Factor, IMPF, Small-Study Effects, Publicatio 60 S41 Recent OPLS Statistical Model versus Traditional Linear Regression to Assess Sonographic Predictors of Stroke Prognosis H. Sadeghi-Bazargani 1 1,2 , K. Fathi3, R. Mehdizadeh3, D. Savadi-oskouei1, M. Farhoudi1 Department of Statistics & Epidemiology, Neuroscience Research Center, Tabriz University of Medical sciences, Tabriz, Iran 2 Public Health Department, Karolinska Institute , Stockholm, Sweden 3 Department of Statistics, Islamic Azad University, Tehran, Iran Abstract Aim: The aim of this study was to compare applicability of orthogonal projections to latent structures (OPLS) statistical model versus traditional linear regression, in order to investigate the role of Transcranial Doppler(TCD) sonography in predicting the ischemic stroke prognosis Methods: The study was conducted on 116 ischemic stroke patients admitted to a specialty neurology ward. Data were primarily analyzed using simple linear regression and later were considered for multivariate analysis using PLS/OPLS models through SIMCA P+ 12 statistical software package. A total of 147 variables were formatted for SIMCA P12 to be analyzed. Results: The results of linear regression identifying some TCD predictors of stroke prognosis, was confirmed through OPLS modeling technique. Moreover, the OPLS model appeared to have higher sensitivity in detecting the predictors of stroke prognosis and detected several more predictors than the linear regression. Applying OPLS model made it possible to use both single TCD measures/indicators and arbitrarily dichotomized measures of TCD single vessel involvement as well as the overall TCD result. Conclusion: Condiering the large number of correlated variables in TCD, the authors recommend PLS/OPLS methods as complementary or alternative to the available classical regression models such as linear regression. Keywords: Stroke, Transcranial Doppler, Linear Regression, Partial Least Squares, OPLS, Orthogonal Projections To Latent Structures, Multicolinearity H. Sadeghi-Bazargani: E-Mail: [email protected] 61 S42 Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different Temperatures H. Esmaily1, M. Hadi Alijanvand2, H. Doosti3, M.T. Shakeri4 1 Associate professor of Biostatistics, Health Science Research Center, School of Health, Mashhad University of Medical Sciences, Mashhad, Iran. 2 MSc of Biostatistics , Biostatistics Department, School of Health, Shahrekord University of Medical Science, Shahrekord, Iran 3 4 Assistant professor of Statistics , Statistics Department, Kharazmi University,Karaj, Iran Associate professor of Biostatistics, Community Medicine Dept, Medical School, , Mashhad University of Medical Sciences, Mashhad, Iran. Abstract Introduction: The aggregation of glutamate dehydrogenize enzyme plays an important role in metabolism, liver function and has pharmaceutical, biotechnological and medical applications. In this study, the enzyme aggregation kinetic was statistically modeled and the assembly mechanism was conjectured by estimating the appropriate parameters of nonlinear regression at various temperatures combined with the enzyme kinetic method. Method: Nonlinear regression model was considered is nonlinear logistic function with three parameters which parameter estimation is Gauss Newton method. Evaluation of the model, i.e. the mean structure, homogeneity of variance, normal distribution, independence of fitted nonlinear model for the aggregation of glutamate dehydrogenize enzyme data from Institute of Biochemistry and Biophysics, Tehran University (IBB) were studied. Also remedies of violation from the assumptions of model such as the use of sandwich estimator, the nonlinear regression with correlation of residuals, grouped nonlinear regression in repeated experiments were considered. Finally, the sandwich estimator was applied in kinetic interpretation and nonlinear regression model according to the grouping in repeated experiments and structure of correlation was proposed for optimization of statistical model. Results: Three parameters of Nonlinear logistic function in sandwich estimator for interpreting kinetic in various temperatures was significant (p<0.001). Estimation of parameters in the optimal statistical model was significant (p<0.001) by grouped nonlinear regression in repeated experiments. This model regarding to structure of correlation in all temperatures except 57.50C and 600C with the little correlation 0.2 and 0.4, was more appropriate with less akaike than grouped nonlinear regression in repeated experiments. Variation of released energy due to protein aggregation with the fitted values of statistical model would demonstrate the melting temperatures (Tm) of this enzyme 52.50C. Conclusion: Based on statistical modeling, variations trend of sandwich estimations in nonlinear regression and interpretations of kinetic, enzyme likely follows polymerization mechanism of dependent on creating nucleus. We proceeded to identify and control the process of enzyme aggregation with a prediction of Tm. Keywords: Glutamate Dehydrogenize: Protein Aggregation: Nonlinear Regression: Kinetics. 62 S43 Salmonella Infantis: Assessing Causes and Trends 1 Sarah Salter , Dr.Kate Cowles2, Fan Tang3, Monelle Tamegnon4, Amanda Luby5, Kevin Torres6 1 2 Professor, Dept. of Biostatistics, University of Iowa Professor, Dept. of Statistics and Actuarial Sciences, University of Iowa 3 Graduate Student Mentor, Dept. of Biostatistics, University of Iowa 4 Graduate Student Mentor, Dept. of Biostatistics, University of Iowa 5 6 Undergraduate Student,College of St.Benedict Undergraduate Student,University of Puerto Rico at Caya Abstract According to the Centers for Disease Control and Prevention, it is estimated that each year foodborne disease is the cause of roughly 48 million illnesses, 128,000 hospitalizations, and 3,000 deaths among American citizens. Of the 31 known pathogens that contribute to domestically acquired foodborne illness, Salmonella is deemed the leading pathogen causing hospitalization and death. Although there has been greater implementation of government regulations, the CDC has confirmed that since 1998 the rate of infection of Salmonella is slightly increasing rather than decreasing. For this reason, Salmonella presents itself as a public health concern that needs to be addressed immediately. Last year, Diamond Pet Foods recalled a dry dog food product due to a Salmonella Infantis contamination, which caused an outbreak of Salmonella in humans. In order to gain greater intuition on this particular serotype and further understand the outbreak trends of Infantis, the research of this project focuses heavily on using Bayesian statistical methodology to determine changepoints using a Markov Chain Monte Carlo computational method, as well as a Bayesian Poisson Analysis. Furthermore, a simulation study was developed to evaluate how well these methods were able to successfully detect outbreaks, as well as how different factors affect these results. Results showed that the Bayesian Poisson analysis was better at detecting outbreak trends of Salmonella, including the individual strain Salmonella Infantis. The simulation study showed that, when using the Poisson-gamma method, the two most influential factors in detecting the correct number of outbreaks are the frequency of outbreaks and a parameter value that is used to distinguish between outbreaks and background infections. 63 S44 The variance: A New Formula Muawia Abdelsalam1 1 University of Gazira, Wad Medani, Sudan Abstract There is a question which normal distribution should be called the “standard” one. Various authors answer it differently. Starting from the works of Gauss the standard normal was considered to be the one with variance 1/2. Stigler (1982) goes even further and insists the standard normal to be with the variance 1/2π. This paper attempts to present a new formula, a new marginal contribution in statistics; it is related to the nature of the function of the normal distribution and other probability distribution functions. The paper will answer the question of why, starting from the works of Gauss, the standard normal distribution was considered to be the one with variance 1/2. The new formula is an attempt to insist that Gauss’ consideration can really be proved in statistics. To support this statistical claim, this paper presents a new type of variance. The new formula is an attempt to insist that Stigler (1982) also has a strong assertion when he goes even further and insists the standard normal to be the one with the variance 1/2π. As is well known, Stigler’s formulation for the standard normal distribution function is advantageous because it is a much simpler and easier-to-remember formula, has unit height at zero, and there are simple approximate formulas for the quantiles of the distribution. Muawia Abdelsalam: University of Gazira PO Box 20 Wad Medani 00249 Sudan E-Mail: [email protected] Mobile Phone :( 00249912801911) 64 S45 On the estimation based on generalized order statistics for the location and scale parameters of Burr12 Distribution Reza Arabi Belaghi1, Minoo Aminnejad1 1 Faculty Of Mathematical Science, University Of Tabriz, Tabriz, Iran Abstract The two parameter Burr XII given by, ݔݔܨܨ−݇݇ܿܿݔݔ݇݇ܿܿݔݔwas introduced by Burr (1941), has gained especial attention in the last two decades. It’s capacity to cover various shape parameter distribution such as normal, Weibull, Exponential, logestic, log-logestic, … permits a good fit when it is used to described biological, clinical, and experimental data. It also has been applied in areas of quality control, reliability studies, duration and failure time modeling. Due to it’s importance, in this paper we first verify statistical properties and summarize its relation with some other distribution. Furthermore we gain the minimum variance unbiased linear estimators of location and scale parameters based on generalized order statistics applying Gauss Markov theorem. Keywords: Burr Distribution, Maximum Likelihood Estimator, Gauss Markov Theorem, Generalized Order Statistics Reza Arabi Belaghi: E-Mail: [email protected] 65 S46 On The Least Trimmed Square (LTS) Estimation for Burr XII Model Reza Arabi Belaghi1, Mehdi Pour Abdollah2 1 2 Faculty Of Mathematical Science, University Of Tabriz, Tabriz, Iran Faculty of Mathematical Science, Ferdowsi University Of Mashhad, Mashhad, Iran Abstract The Burr XII distribution function one of the mostly used distribution in the area of survival analysis, reliability analysis and economics data. It’s capacity to have more flexibility and closed form of the distribution function allow it to be considered a useful distribution in such areas. Due to it’s importance, Recently, many research have been done about The Burr XII distribution. So in this paper we consider the estimation of the Burr XII distribution parameters by means of Least Trimmed Square(LTS) in the presence of one outlier and finally we will compared this results with the other estimate methods. Keywords: Bayes Estimation, Burr Distribution Function, Least Terminate Square, Mean Square Error Reza Arabi Belaghi: E-Mail: [email protected] 66 S47 Statistical Models of Postnatal Transmission of HIV-India D.M. Basavarajaiah1, B. Narasimhamurthy1 1 Madras University, Department of Biostatistics, National Institute of Epidemiology, ICMR.Ministr of health and Family welfare, Govt of India Abstract Objectives: Study aims to characterize the Peadiatric HIV epidemic in India using a Statistical model, and to use this model to determine the reasons for the high HIV prevalence in 10-12 years age groups of children’s. Trends in Peadiatric HIV prevalence in children are significantly affected by prevention of mother-to-child transmission (PMTCT) and HAART (Highly active antiretroviral therapy) programmes, and this study therefore also aims to assess the impact of the PMTCT and ART programmes. Methods: Cohort data Secondary collected from ART centers of Karnataka State, India. Inclusive criteria were applied for the model setting. A statistical model of HIV incidence in children and HIV survival has been created, using CMIS -data sources. The model projects the size of the population under the Peadiatric age of 15 at monthly intervals, non-AIDS mortality rates and annual numbers of births to mothers who are HIV-positive and HIV-negative are obtained from the ASSA model, growth and weighbul distribution. Results: Since rates of vertical transmission of HIV are dependent on the maternal CD4 count, and since uptake of HAART relative to short-course ARV prophylaxis will also depend on the pregnant woman‟s CD4 count, it is necessary to estimate rates of vertical transmission that would be expected in each CD4 stage, and to reexpress the effect of the short-course ARV regimens in terms of percentage reductions in transmission. Based on a review of CD4 distributions in pregnant HIV-positive Indian women, and relative rates of vertical transmission in different CD4 intervals, we estimate that the average rate of transmission at or before birth, in the absence of PMTCT, is 46.0% if the mother has a CD4 count less than 100-200 µ/dL, 19.80% if the mother has a CD4 count of 201 to <250 µ/dL, 8.60% if the mother has a CD4 count of 251 to350 µ/dL, and 2.5% if the mother has a CD4 count greater than >500 µ/dL Conclusion: Research Study suggests that the PMTCT programme in India has already had a significant impact on HIV incidence, and that the recent adoption of new PMTCT protocols can be expected to lead to a roughly 75% reduction in Peadiatric HIV incidence by 2015. Keywords: ART, HAART, Prophylaxis, HIV, PMTCT, ASSA, PCR 67 S48 WGEE ve MI-GEE Yöntemlerinin Karşılaştırılması Gazel Ser1 1 Uzman Dr., Yüzüncü Yıl Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, Biyometri ve Genetik A.B.D, Van Özet Bağımlı değişkenin normal dağılış göstermediği durumda kullanılan marjinal modeller veya populasyonortalama modeller, şans değişkenlerinin sahip olduğu dağılışı üstel dağılış ailesinde tanımlamaktadır. Sonrasında eşitliğin her iki yanındaki elemanlar arasında bir bağlantı fonksiyonu kullanmaktadır. GEE (Generalized Estimating Equations: GEE), uzun süreli verilerde marjinal model analizi için popüler bir araçtır. GEE bağımlı değişkenin ortak dağılışıyla ilgilenmeyip, bunun yerine zaman aralığındaki tekrarlı ölçümlerin marjinal dağılışını kullanmaktadır. GEE’nin diğer tahminleme yöntemlerinden farkı tekrarlı ölçümler arasındaki korelasyon yapısını göz önünde bulundurmasıdır. Veri setinde eksik gözlemin bulunma durumuna bağlı olarak GEE’nin çeşitli uzantıları geliştirilmiştir. Örneğin, eksik gözlem tamamen şansa bağlı (Missing Completely at Random; MCAR) olduğunda, standart GEE geçerlidir ancak eksik gözlemin şansa bağlı (Missing at Random: MAR) olması durumunda ise GEE’nin bir uzantısı olan Ağırlıklandırılmış GEE (Weigted GEE: WGEE) yada Çoklu atama (Multiple Imputation:MI) uygulamasından sonra kullanılan MI-GEE yöntemleri araştırıcılar tarafından kullanılmaktadır. Bu çalışma kapsamında WGEE, MI-GEE yöntemlerinin tanıtılması ve eksik gözlemlerin MI yöntemiyle tahmin edildiği veri setine uygulanan WGEE, MI-GEE yöntemleri arasındaki benzerlikler ve farklılıkların incelenmesi amaçlanmıştır. Anahtar Kelimeler: Marjinal Model, WGEE, MI-GEE Gazel Ser: E-Posta: [email protected] 68 III-POSTER BİLDİRİLER 69 P01 Sınıflandırma Ağacı için Alternatif Bölünme Kurallarının Performanslarının Karşılaştırılmasına İlişkin Simülasyon Çalışması İmran Kurt Ömürlü1, Mevlüt Türe2 1 Adnan Menderes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Aydın 2Adnan Menderes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Aydın Özet Günümüzde bağımlı değişkenin kategorik yapıda olduğu veri setlerinin analizi için birçok yöntem kullanılmaktadır. Bu yöntemler, bağımsız değişkenlerin bağımlı değişken üzerindeki etkilerini değerlendirmek ve birimlerin bağımlı değişkenin kategorilerine göre en az hatayla sınıflandırılması için model oluşturmada araştırmacılara her zaman kılavuz olmaktadır. Bu amaçla kullanılan yöntemlerden biri de sınıflandırma ağacıdır. Bu yöntemde, ağaç yapısının oluşturulmasındaki en önemli aşama ağaçtaki dallanmanın hangi kurala göre olacağının belirlenmesidir. Bu çalışmada; sınıflandırma ağacı yöntemi kullanılarak bağımlı değişkenin kategorik yapıda olduğu durumlar için geliştirilmiş farklı bölünme kurallarının (sıralı impurity, sıralı twoing, genelleştirilmiş doğrusal Gini ve genelleştirilmiş karesel Gini) farklı koşullar altında türetilmiş veri setlerinde ve k-kat çapraz geçerlilik yöntemi kullanılarak sınıflandırma performanslarının karşılaştırılması amaçlandı. Simülasyon algoritmasında, 3 kategorili sıralı ölçekli bağımlı değişken ve farklı bağımsız değişken sayısı (8, 12, 16, 20) kriterlerine dayanarak 250, 500, 750 ve 1000 birimlik veri setleri oluşturuldu. Her bir veri seti için simülasyon çalışmalarında 1000 tekrar yapıldı ve 10-katlı çapraz geçerlilik yöntemi kullanıldı. Simülasyonlar sonucunda yöntemler, gamma istatistiği ve yanlış sınıflandırma oranlarına göre karşılaştırıldı. Sonuç olarak; gamma istatistiği ve yanlış sınıflandırma oranlarına ilişkin bulgulara dayanarak genelleştirilmiş doğrusal Gini ve genelleştirilmiş karesel Gini bölünme kuralları, sıralı impurity ve twoing kurallarına göre daha iyi performans gösterirken, birbirlerine göre tahmin performanslarının benzer olduğu belirlendi. Anahtar Kelimeler: Sınıflandırma Ağacı, Impurity, Twoing, Gini, Simülasyon 70 P02 Birinci Tür Hata’nın Kontrolünde Yanlış Bulgu Oranı Yaklaşımı Nurhan Doğan1, İsmet Doğan2 1 Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı 2 Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı Özet Varyans Analizi sonucunda yokluk hipotezinin reddedilmesi, gruplardan en az birinin diğer gruplardan farklı olduğunu gösterir. Hangi grubun/grupların farklı olduğunu gösteren genel bir test henüz bulunmadığından, ortalamalar arasındaki farklılığın yapısını incelemek amacıyla çoklu karşılaştırma testleri kullanılmaktadır. Çoklu karşılaştırma testlerinde amaç, üç veya daha fazla denemenin yer aldığı bilimsel çalışmalarda hangi denemelerin en iyi, hangi denemelerin en kötü olduğuna karar vermek ya da karar verirken yanlış karar verme olasılığını kontrol etmektir. Bu açıklamadan da anlaşılacağı üzere çoklu karşılaştırma testleri, modern bilimsel araştırmalardan elde edilen verilerin analizinde kilit rol oynamaktadır. Halen bir grup ortalamanın çoklu karşılaştırma işlemleri gerçekleştirilirken hangi yöntemin hangi durumda kullanılması gerektiği konusunda görüş birliği bulunmamaktadır. Araştırmacılar, biraz farklı gerekçelerle de olsa kendi tercihlerini yaparak benzer problemlerin çözülmesinde farklı çoklu karşılaştırma işlemleri kullanmaktadırlar. Literatürede, gerek eşzamanlı gerekse ardışık çok sayıda çoklu karşılaştırma testi önerilmiştir. Ancak hangi durumda hangi işlemin kullanılacağına karar vermek kolay değildir. Eşzamanlı çoklu karşılaştırma testlerinde araştırmacılar karar vermede genellikle, karşılaştırma başına hata oranını kullanmaktadırlar. Karşılaştırma başına hata oranı, belirlenen α anlamlılık düzeyinde her bir karşılaştırma için yokluk hipotezinin yanlışlıkla reddedilmesi olasılığını göstermektedir. Karşılaştırma başına hata oranının en önemli dezavantajı, karşılaştırma sayısının (n) artmasına bağlı olarak değerinin yaklaşık 1-(1-α)n kadar artmasıdır. Bu dezavantajından dolayı karşılaştırma başına hata oranı ile ilgili eleştiride bulunanlar bunun yerine deneysel ortak hata oranının kontrol edilmesini önermektedirler. Deneysel ortak hata oranının kontrol altında tutulması yaklaşımı, araştırmacılar tarafından sıklıkla başvurulan bir yaklaşım olmasına rağmen uygulamalı araştırmalarda karşılaşılan bazı zorlukları bulunmaktadır. Yanlış bulgu oranı bu zorlukları gidermek üzere farklı bir yaklaşım olarak önerilmektedir. Yanlış bulgu oranı, çoklu hipotez testlerinde reddedilen yokluk hipotezleri arasında yanlışlıkla reddedilen hipotezlerin beklenen oranını ifade eden bir değerdir. Yanlış bulgu oranını dikkate alan yaklaşımlar, gerek eşzamanlı gerekse ardışık çoklu karşılaştırma testlerine göre deneysel ortak hata oranını kontrol altında tutarak istatistiksel gücün arttırılmasını sağlayan yöntemlerdir. Bu çalışmada amaç, son yıllarda daha yoğun olarak kullanılmaya başlanan ancak araştırmacılar tarafından daha az bilinen yanlış bulgu oranı yaklaşımlarını örnekler vererek tanıtmaktır. Anahtar Kelimeler: Varyans Analizi, Birinci Tür Hata, Yanlış Bulgu Oranı Nurhan Doğan: E-Posta: [email protected] 71 P03 Birinci Tür Hatanın Kontrolünde Adımsal Çoklu Karşılaştırma İşlemleri İsmet Doğan1, Nurhan Doğan2 1 Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı 2 Afyon Kocatepe Üniversitesi, Tıp Fakültesi, Biyoistatistik Ve Tıbbi Bilişim Anabilim Dalı Özet Deneysel çalışmalardaki temel amaç, elde edilen sonuçlar ve denemeler arasındaki anlamlı ilişkileri açığa çıkarmaktır. Bir grup denemeden elde edilen ortalamalar arasında önemli farklılık olup olmadığının belirlenmesinde çoklu karşılaştırma testleri kullanılabilir. Uygun çoklu karşılaştırma testinin kullanılması araştırmacılara doğru, eksiksiz ve elverişli sonuçların elde edilmesinde ve elde edilen bilgiler arasındaki ilişkilerin yorumlanmasında yardımcı olur. Varyans Analizi, ikiden çok ortalamanın karşılaştırılmasında, ortalamalar arasında fark olup olmadığını belirlemekte, ancak hangi ortalamanın hangi ortalamadan farklı olduğunu belirleyememektedir. Çoklu karşılaştırma işlemleri ise ortalamalar arasındaki farklılıklar hakkında çok daha detaylı bilgi vermektedir. Çoklu karşılaştırma terimi bir grup içindeki varyanslar, oranlar ya da ortalamalar arasındaki farklılığın istatistiksel anlamlılığı için yapılan testleri ifade etmektedir. Çoklu karşılaştırma işlemleri, çokluluk etkisinden kaynaklanan hatalı sonuç çıkarmaların düzenli kontrolünü göz önünde bulunduran istatistiksel işlemlerdir. Bir araştırmada, araştırmacı tarafından kullanılacak hata oranı ve anlamlılık düzeyi belirlendikten sonra uygun çoklu karşılaştırma testinin seçilmesi gerekmektedir. Literatürde yer alan çoklu karşılaştırma testleri ya eşzamanlı (simultaneously) ya da adımsal (stepwise) olarak çoklu karşılaştırma işlemlerini gerçekleştirmektedir. Eşzamanlı çoklu karşılaştırma işlemlerinde tüm ikili karşılaştırmalar için sabit bir anlamlılık düzeyi dikkate alınırken, adımsal çoklu karşılaştırma testlerinde ikili karşılaştırmaların her biri için anlamlılık düzeyi yeniden belirlenmektedir. Bir başka ifade ile birinci tür hatanın kontrolünün sağlanabilmesi için adımsal çoklu karşılaştırma işlemlerinde, ayrı ayrı hipotezlerin test edilmesinde kullanılan önemlilik seviyesi, test edilen hipotez sayısı dikkate alınarak uyarlanmaktadır. Bu çalışmada amaç, son yıllarda daha yoğun olarak kullanılmaya başlanan ancak araştırmacılar tarafından daha az bilinen adımsal çoklu karşılaştırma işlemlerini örnekler vererek tanıtmaktır. Anahtar Kelimeler: Varyans Analizi, Birinci Tür Hata, Adımsal Çoklu Karşılaştırma İşlemleri İsmet Doğan: E-Posta: [email protected] 72 P04 Sağlık Personelinin Hasta Hakları Konusunda Bilgi Tutum ve Davranışlarının Ana Bileşenler Yöntemi İle Değerlendirilmesi 1 MY. Çelik , MM.Dasdağ1, O.Satıcı1, Z.Akkus1, İ.Yıldız 1 1 Dicle Üniversitesi, Tıp Fakültesi, Biyoistatistik AD. Özet Hasta hakları; temel insan haklarının sağlık hizmetleri sahasındaki yansımasını ve hasta haklarının somut olarak gösterilmesini ve sağlık hizmeti verilen bütün kurum ve kuruluşlarda ve sağlık kurum ve kuruluşları dışında sağlık hizmeti verilen hallerde, insan haysiyetine yakışır şekilde herkesin hasta haklarından faydalanabilmesine, hak ihlallerinden korunabilmesine ve gerektiğinde hukuki korunma yollarını fiilen kullanabilmesi olarak tanımlanır. Çalışmada amaç; sağlık personelinin hasta hakları konusunda bilgi tutum ve davranışlarının Ana Bileşenler Yöntemi ile değerlendirerek, konuyla ilgili temel bileşenleri ortaya çıkarmak ve yorumlamaktır. Çalışma çok merkezli olup rastgele örnekleme yöntemi ile Gaziantep Şehit Kamil Devlet Hastanesinden 59 kişi, Diyarbakır Devlet Eğitim ve Araştırma Hastanesinden 75 kişi, Dicle Üniversitesi hastanesinden 97 kişi, toplamda 231 kişiye ulaşılmıştır. Elde edilen verilere ilişkin değişkenlerin hasta hakları ile ilgili oluşturdukları komponentleri elde etmek amacı ile Ana Bileşenler Yöntemi ve Varimax dönüşümü kullanıldı. Değişkenlerin 10 komponent oluşturduğu bunların açıklama miktarının %79.95 oranında olduğu görüldü. Elde edilen ana bileşenler sonuçlarına göre; yedi değişkenden oluşan birinci komponent, “Hasta bilgilendirme komponenti”, beş değişkenden oluşan ikinci komponent, “Hastaya bilgi verme şekli komponenti”, beş değişkenden oluşan üçüncü komponent, “Hastadan tıbbi müdahale öncesi izin komponenti”, dört değişkenden oluşan dördüncü komponent, “Hastaya hizmet veren personelin görevi, deneyimi ve eğitim düzeyi komponenti”, üç değişkenden oluşan beşinci komponent, “Hastanın yapılmakta olan araştırmaya dahil edilme izni komponenti”, iki değişkenden oluşan altıncı komponent, “Hastanın muayene sırasında gizliliğinin korunması komponenti”, bir değişkenden oluşan yedinci komponent, “Personelin cinsiyeti komponenti”, bir değişkenden oluşan sekizinci komponent, “Hastanın kendi durumunu analiz için benzer bir dosya inceleme komponenti”, bir değişkenden oluşan dokuzuncu komponent, “Hastanın kendi durumunu analiz için benzer bir dosya inceleme komponenti” ve son olarak bir değişkenden oluşan onuncu komponent, “Çocukların operasyonuna veli tarafından izin verilmiyorsa sağlık personelinin tutumu komponenti” olarak bulunmuştur. Sonuç olarak, sağlık personelinin hasta hakları konusunda bilgi tutum ve davranışları, Ana Bileşenler Yöntemi sonuçlarına göre on komponent başlığı ile yorumlanabileceği gösterilmiştir. 73 P05 Kanserli Hastalarda; Kanserin Vücuttaki Tutulum Bölgeleri, Hastaların Cinsiyet, Eğitim Düzeyi ve Mevsimsel Dağılımına Göre İncelenmesi Ö.Satıcı 1, M.Y.Çelik 1,Z.Akkus1, İ.Yıldız 1, M.M. Dasdag 1 1 Dicle Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Diyarbakır Özet Bu çalışmanın amacı, vücudun değişik bölgelerine yayılım göstermiş kanserin tutulum bölgeleri, hastaların cinsiyet, eğitim düzeyleri ve hastaların hastaneye geliş zamanlarına göre incelenerek, konuyla ilgili tanımlayıcı bilgileri sunmaktır. Çalışmanın verileri, Ocak 2009 ile Aralık 2009 tarihleri arasında Diyarbakır Sağlık İl Müdürlüğüne bildirilen kanser teşhisi konulmuş 579 hastalara aittir. Hastanelere göre bildirilen kanser hastalarının dağılışı; Dicle Üniversitesi Hastanesi 389 (%67.2), Diyarbakır Devlet Hastanesi 131 (%22.6), Diyarbakır Çocuk hastalıkları Hastanesi 31 (%5.4), Özel Veni-Vidi Hastanesi 17 (%2.9), Diyarbakır Göğüs Hastalıkları Hastanesi 7 (%1.2), Özel Diyarbakır Hastanesi 3 (%0.5) ve Diğer Kurum Hastaneleri 1 (%0.2) olarak gözlendi. Hastaneye başvuran kanserli hastaların cinsiyete göre dağılımları; 327 (%56.5) erkek ve 252 (%43.5)’ si kadındır. Hastaların 330 (%57)’ si eğitimsiz olup, İlk-Orta öğretim mezunu 192 (%33.2), lise mezunu 41 (%7.1) ve yüksek okul mezunu 16(%2.8) şeklinde gözlendi. Hastaların hastalık evrelerine göre dağılımı ise; In Situ 9 (%1.5), Lokalize 241 (%41.6), uzak metaztas 162 (% 28.0), bilinmeyen 57 (%29.9) olarak görüldü. Kanserin erken tanısı ve vücuttaki tutulum bölgesinin belirlenmesi, hayati öneme sahiptir. Bu nedenle hastaların vücuttaki lokalizasyonlara göre dağılımı saptanmış olup, büyüklük sırasına göre; cilt 97(%16.1), 71(%12.26), akciğer 67(%11.6), lösemi 60(%10.4), mide 39(%6.7), kolon 36(%6.2), meme lenfoma 32(%5.5), prostat 28(%4.8), troid 23(%4.0), böbrek 15 (%2.6), beyin 13(%2.2), kemik 11(%1.9), pankreas 11(%1.9), rektum 11(%1.9), karaciğer 8(%1.8), özefagus 7(%1.2), uterus 7 (%1.2), larenx 6 (%1.0), mesane 6(%1.0), over 6(%1.0) ve diğer bölgelerde %1’den daha küçük tutulumlar olarak gözlendi. Kanser hastalarının geldikleri il-ilçelere göre dağılımı; Diyarbakır Merkez 233 (%40.2), Batman-Merkez 25 (%4.3), Mardin Merkez 24 (%4.1), Bismil 20 (%3.5), Ergani 19 (%3.3), Silvan 18 (%3.1), Siverek 18 (%3.1), Kızıltepe 16 (%2.8), Siirt Merkez 11 (%1.9), Bitlis Merkez 8 (1.4), Muş Merkez 8 (%1.4) şeklinde gözlendi. Çalışmada kanserli popülasyon için kanserin bölgelere göre tutulum oranları %95 GA (Güven Aralığı) olarak belirlendi. Bu durumda en yüksek kanser tutulum bölgesi %19.06 oran ile ciltte hesaplandı. Kanser olgularının hastaneye gelişlerinin mevsimsel dağılımı, yılın soğuk ayları olan (ekim-kasım-aralık-ocakşubat-mart) altı aylık sürede, erkeklerde %63.9 ve kadınlarda %58.7 oranında hastaneye müracaat ettikleri saptandı. 74 Sonuç olarak, verilen oranlar dikkate alındığında cilt kanserinin bölgede yüksek bir dağılıma sahip olduğu, bu durumunda bölgedeki güneşli havanın ve çalışma koşullarına bağlı olduğu şeklindedir. Hastaların 522 (%90.2)’sinin eğitimsiz ve ilk-orta öğretim mezunu olduğu dikkati çekmektedir. Anahtar Kelimeler: Kanser, Vücut Tutulum Bölgeleri, Tanımlayıcı İstatistik 75 P06 Sonuç Değişkeninin İki Sonuçlu Olduğu Durumda İki Değerlendirici Ya Da İki Yöntem Arsındaki Uyumun Değerlendirilmesinde Yeni Bir Yaklaşım: Birey Uyum Katsayısı (CIA) Semra Erdoğan1, Gülhan Orekici Temel1 1 Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Mersin Özet Amaç: İki farklı yöntemin ya da iki farklı değerlendirici arasındaki uyumu değerlendirirken sonuç değişkenimiz sürekli ise literatürde çok yaygın olarak Concordance korelasyon katsayısı (CCC) ve Intraclass korelasyon katsayısının (ICC) farklı versiyonları kullanılırken, sonuç değişkenimiz iki kategorili olduğu durumda çok yaygın olarak Cohen’in kappa istatistiği kullanılmaktadır. Aynı bireyden farklı yöntemlerle elde edilen ölçümler arasındaki uyumsuzluk, aynı bireyin aynı yöntemle alınan tekrarlı ölçümleri arasındaki uyumsuzluğun benzer olduğu ileri sürülerek, değerlendiriciler ya da yöntemler arasındaki uyum katsayısını tahmin etmek ve tanımlamakta kullanılabilecek yeni bir yaklaşım önerilmiştir. Bu yaklaşım, sürekli ve kategorik değişkenler üzerinde de tekrarlı ölçümlerin bulunduğu durumlarda kullanılabilecek olan özel bir uyumsuzluk fonksiyonu ile tanımlanan Birey Uyum Katsayısıdır (CIA). Bu çalışmanın amacı iki değerlendiricinin bulunduğu ve sonuç değişkeninin iki sonuçlu (hasta-sağlam, var-yok) olduğu bir durumda, değerlendiriciler arasındaki uyumu, bireylerin eşitliği yaklaşımından yola çıkarak ele alan CIA’yı incelemektir. Gereç ve Yöntem: CIA hesaplamasında iki farklı durum söz konusudur. Değerlendiricilerin her ikisi de referans olarak değerlendirilmiyorsa CIA, ψ N ile gösterilmektedir, X değerlendiricisi referans alınıp Y değerlendiricisi yeni bir değerlendirici olarak değerlendiriliyorsa CIA, ψR şekilde gösterilmektedir ve farklı formüllerle hesaplanmaktadır. Çalışmada, X değerlendiricisinin duyarlılık değerinin yüksek ve 0.9 olarak, seçicilik değerinin de yüksek ve 0.8 olarak sabit tutulup Y değerlendiricisi için üç farklı kombinasyon düşünülmüştür. İlk kombinasyon, Y değerlendiricisinin duyarlılığının 0.80 ve seçiciliğinin 0.70 olarak yüksek olduğu bir durum, ikinci kombinasyon olarak duyarlılığının 0.80 ile yüksek, seçiciliğinin 0.40 ile düşük olduğu bir durum, son olarak duyarlılığının da düşük ve 0.50, seçiciliğinin de düşük ve 0.40 olduğu durumlar göz önünde bulundurulmuştur. Buradan farklı prevelans değerleri için X ve Y değerlendiricileri arasındaki uyum katsayıları hesaplanmıştır. Bulgular: Duyarlılık ve seçiciliğin yüksek olduğu durumda, ψ N değeri 0.97 olurken, ψ R değeri 0.69 ile 0.84 arasında değerler almaktadır. Duyarlılığın yüksek seçiciliğin düşük olduğu durumda, değeri 0.71 ile 0.96 arasında değer alırken, ψN ψ R değeri 0.57 ile 0.69 arasında değerler almaktadır. Duyarlılığın ve seçiciliği düşük olduğu durumda ise, ψ N değeri 0.70 olurken, ψ R değeri 0.36 ile 0.57 arasında değerler almaktadır. Her üç kombinasyonda da ψ N > ψ R şeklinde olduğu gözlenmiştir. Sonuç: Değerlendiriciler arasındaki uyumu test etmede çok yaygın olarak kullanılan kappa istatistiğinin prevelanstan etkilendiği ve hatta düşük ve yüksek prevelansta sıfır değerini aldığı bilinmektedir. Bu çalışma sonunda iki değerlendiricinin 76 bulunduğu ve sonuç değişkeninin ikili olduğu güvenilirlik çalışmalarında değerlendiriciler arasındaki uyum için araştırmacılara CIA yöntemini kullanmaları önerilmektedir. Anahtar Kelimeler: Değerlendiriciler Arası Uyum, Metot Karşılaştırması, Birey Uyum Katsayısı, İki Sonuçlu Veri Semra Erdoğan: MEÜ. Çiftlikköy Kampüsü, Tıp Fakültesi Dekanlık Binası, Biyoistatistik ve Tıbbi Bilişim AD. MERSİN/TURKİYE Tel: 0 324 3610684 Cep: 0 533 617 39 13 Fax: 0 324 341 24 00 77 P07 Adolesan Bireylerin Boy ve Ağırlıklarına İlişkin İfadelerinin, Ölçümlerle Karşılaştırılması Elçin Balcı1, Ferhan Elmalı2, Osman Günay1 1 2 Erciyes Üniversitesi, Tıp Fakültesi, Halk Sağlığı Anabilim Dalı, Kayseri Erciyes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Kayseri Özet Giriş ve Amaç: Toplumun boy ve ağırlık bilgisi; genel sağlık, beslenme düzeyi, şişmanlığın ve diğer hastalıkların değerlendirilmesi ile ilişkilidir. Bildirilen boy ve ağırlık, bu değişkenlerin kullanıldığı epidemiyolojik çalışmalarda maliyet etkin bir değerlendirme ve saha çalışmalarında kolaylık sağlar. Bildirilen değerlerin geçerliliği; çalışma yapılan grubun cins, yaş ve sosyo-ekonomik durumuna göre değişiklik gösterebilir. Birçok çalışmada ağırlığı daha az, boyu daha fazla beyan etme de kısmen bu durumla ilişkilidir. Bu da örneğin şişmanlığın belirlenmesinde yaygın olarak kullanılan Beden Kitle İndeksi (BKİ)’nin de düşük hesaplanmasına ve obezite prevalansında ulaşılacak rakamda hataya yol açar. Bu çalışma; Kur’an kursunda yatılı olan adolesan bireyler tarafından bildirilen boy ve ağırlık değerlerinin, yapılan ölçümlerle karşılaştırılması amacıyla yapılmıştır. Gereç ve Yöntem: Bu çalışmanın amacı yatılı adölesan bireylerin kendi ifade etmiş oldukları boy ve ağırlık değerlerinden hesaplanan beden kitle indekslerinin bu bireylerden standart ölçümlerle elde edilen boy ve ağırlık değerlerinden hesaplanan beden kitle indekslerine göre geçerliliğinin belirlenmesidir. Sosyodemografik ve tanımlayıcı bilgileri ve kişilerin boy, kilo, bel ve kalçalarının ölçüsünü sorgulayan soruların yer aldığı anket formları, araştırmaya katılmayı kabul eden öğrencilere yüz yüze görüşme yöntemi ile uygulanmıştır. Anket bitiminde ölçümler araştırmacı tarafından, katılımcıların mahremiyetleri korunarak üzerlerinde iç çamaşırları kalacak şekilde ve ikişer kez gerçekleştirilmiştir ve değerlendirmelerde bu değerlerin ortalamaları kullanılmıştır. DSÖ’ye göre kadınlarda bel kalça oranı ≥0,85 ve/veya bel çevresi ≥88 cm santral obezite olarak tanımlanmıştır. Araştırmada kurslara kayıtlı tüm öğrencilere (521 kişi) ulaşılması hedeflenmiş, araştırmaya katılmayı kabul eden 452 kişi (ulaşma oranı %86,7) alınmıştır. Araştırmanın verileri Kur’an kursundaki adolesan çağdaki kız öğrencilerin depresyonlarının yeme tutumlarına etkisini inceleyen bir başka çalışmanın alt parçası olarak elde edilmiştir. Araştırma için idari izinler valilik makamı ve il müftülüğünden, etik çalışma izni ise Erciyes Üniversitesi Etik kurulu’ndan alınmıştır. 78 İstatistiksel Analiz: Çalışmanın verileri SPSS 19.0 ve MedCalc 8.1.1.0 istatistik paket programında değerlendirilmiştir. Özet istatistikler ortalama±standart sapma olarak verilmiştir. Verilerin normal dağılımına Shapiro-Wilk testi ile bakılmıştır. İfade edilen değerler ile ölçülen değerler arasında bir fark olup olmadığına Bağımlı İki Örnek T Testi ile bakılmıştır. İfade edilen değerler ile ölçülen değerler arasındaki ilişki Pearson Korelasyon Analizi ile değerlendirilmiştir. İfade edilen değerler aracılığı ile ölçülen değerlerin tahminlenmesi için Doğrusal Regresyon Analizi’nden yararlanılmıştır. İfade edilen değerler ile ölçülen değerler arasındaki uyumun belirlenmesinde Bland&Altman Yöntemi’nden yararlanılmıştır. Bland&Altman Yöntemi, ifade edilen ve ölçülen değerlerin farkına karşılık ifade edilen ve ölçülen değerlerin ortalamasının saçılım grafiğini oluşturan görsel bir yöntemdir. P<0.05 değeri istatistiksel olarak anlamlı kabul edilmiştir. Bulgular: Çalışmadaki 388 katılımcının yaşları 17.49 ± 2.28 olarak bulunmuştur. Bireylerin ifade etmiş oldukları boy, ağırlık ve bunlardan hesaplanan BKİ ile bireylerden ölçümle elde edilen boy, ağırlık ve bunlardan hesaplanan BKİ değerlerine ait istatistikler Tablo 1’de gösterilmiştir. Tablo 1: Boy, ağırlık ve beden kitle indekslerine ait istatistikler Kilo (kg) Boy (m) BKİ (kg/m2) İfade Edilen 54.75±7.86 1.60±0.07 21.50±2.80 Ölçülen 56.59±8.07 1.60±0.06 22.09±2.86 Ortalama Fark a -1.84±3.21* -0.0043±0.04* -0.59±1.53* Pearson Korelasyon Katsayısıa 0.919 0.843 0.854 a İfade edilen değerler ile ölçülen değerler arasındakini gösterir. * İfade edilen değerler ile ölçülen değerler arasındaki farkın anlamlılığını gösterir (p<0.05). Tablo 1’e göre ifade edilen kilo, boy ve BKİ değerleri; ölçülen kilo, boy ve BKİ değerlerine göre düşüktür ve aradaki fark istatistiksel olarak anlamlı bulunmuştur (p<0.05). Katılımcıların boy ve ağırlık tahminleri gerçek değerlerinden daha düşük olarak bulunmuştur. Şekil 1: İfade Edilen Kilo ile Ölçülen Kilo Arasındaki İlişki Grafiği 79 Şekil 1’e göre ifade edilen ağırlık ile ölçülen ağırlık arasında pozitif yönde güçlü bir ilişki bulunmuştur (r=0.919, p<0.001). İki değişken arasındaki regresyon modeli Ölçülen Ağırlık=4.954+0.943(İfade Edilen Ağırlık) olarak kurulmuştur ve bu model anlamlı bulunmuştur (p<0.001, r2= 0.845). Şekil 2: İfade Edilen Boy ile Ölçülen Boy Arasındaki İlişki Grafiği Şekil 2’ye göre ifade edilen boy ile ölçülen boy arasında pozitif yönde güçlü bir ilişki bulunmuştur (r=0.843, p<0.001). İki değişken arasındaki regresyon modeli Ölçülen Boy = 0.434 + 0.730(İfade Edilen Boy) olarak kurulmuştur ve bu model anlamlı bulunmuştur (p<0.001, r2=0.711). Şekil 3: İfade Edilen BKİ ile Ölçülen BKİ Arasındaki İlişki Grafiği Şekil 3’e göre ifade edilen BKİ ile ölçülen BKİ arasında pozitif güçlü bir ilişki bulunmuştur (r=0.854, p<0.001). İki değişken arasındaki regresyon modeli 80 Ölçülen BKİ=3.332+0.872(İfade Edilen BKİ) olarak kurulmuştur ve bu model anlamlı bulunmuştur (p<0.001, r2=0.729). Şekil 4: İfade Edilen Kilo ile Ölçülen Kilo Arasındaki Uyum Şekil 4’te Bland&Altman yöntemi ile elde edilen ağırlık için uyum gösterilmektedir. Şekildeki kalın çizgi ortalama farkı, kesikli çizgiler ise farkların %95 güven sınırlarını göstermektedir. Dikey eksen ifade edilen ile ölçülen değerler arasındaki farkı, yatay eksen ise ifade edilen ile ölçülen değerlerin ortalamasını göstermektedir. Şekil 4’e göre katılımcılar ölçülen değerlerden ortalama olarak 1.8 kg. düşük tahmin yapmıştır. Katılımcıların yaklaşık %6’sının ifade ettiği değerler %95 güven sınırlarının dışındadır. Mükemmel bir uyumda şekildeki noktaların dikey eksene göre 0 (sıfır) bölgesinde toplanması beklenir. Şekil 4’e göre ağırlık değişkeni için ifade edilen değerler ile ölçülen değerler arasında orta düzeyde bir uyum vardır. Şekil 5: İfade Edilen Boy ile Ölçülen Boy Arasındaki Uyum Şekil 5’te ifade edilen boy ile ölçülen boy arasındaki uyum gösterilmektedir. Şekil 5’e göre katılımcıların ifade ettikleri değerler ölçülen değerlerden ortalama olarak 0.004 m. düşüktür. Katılımcıların yaklaşık %5’inin ifade ettiği değerler %95 güven sınırlarının dışındadır. Şekil 5’te güven sınırları içerisinde noktalar yayılmış olarak bulunmaktadır. Boy değişkenine göre ifade edilen değerler ile ölçülen değer arasında orta düzeyde bir uyum görünmektedir. 81 Şekil 6: İfade Edilen BKİ ile Ölçülen BKİ Arasındaki Uyum Şekil 6’da BKİ için uyum gösterilmektedir. Katılımcıların yaklaşık %5’inin BKİ için ifade ettiği değerler %95 güven sınırlarının dışındadır. Katılımcılar ölçülen değerlerden ortalama olarak 0.6 kg/m2 düşük tahmin yapmıştır. Şekildeki noktalar ortalama ve sıfır etrafında toplanmaktadır. Şekil 6’ya göre BKİ değişkeni için ifade edilen değerler ile ölçülen değerler arasında iyi düzeyde bir uyum vardır. Sonuç: Adolesan bireylerde ifade edilen kilo, boy ve BKİ değerleri; ölçülen kilo, boy ve BKİ değerlerine göre düşüktür ve katılımcıların boy ve ağırlık tahminleri gerçek değerlerinden daha düşük olarak bulunmuştur. Elçin Balcı: Erciyes Üniversitesi, Tıp Fakültesi, Tel: +90 0352 4374937 / 23728 Fax: +90 0352 4375285 82 Halk Sağlığı Anabilim Dalı, E-Posta: [email protected] 38039-Kayseri P08 Bagging Support Vector Machines for Leukemia Classification Gokmen Zararsiz1, Ferhan Elmali1, Ahmet Ozturk1 1 Erciyes University, Faculty of Medicine, Department of Biostatistics and Medical Informatics, Kayseri, Turkey Abstract With the development of microarray technology, the expression levels of thousands of genes can be measured simultaneously. Using these gene expression datasets, machine learning techniques can be applied to classify the diseases for early diagnosis and treatment. Leukemia is one of the most common cancer type, and its diagnosis and classification is becoming increasingly complex and important. Here, we used Golub’s leukemia dataset (1) and adapted bagging support vector machines (bSVM) for leukemia classification. bSVM trains each SVM seperately using bootstrap technique, then aggregates the performances of each SVM by majority voting. bSVM showed accuracy between 87.5% - 92.5%, area under ROC curve between 98.0% - 99.2% and outperformed single SVM and other classification methods. We also compared our results with other study results which used the same dataset for leukemia classification. Experimental results revealed that bSVM showed the best performance and can be used as a biomarker for the diagnose of leukemia disease. Keywords: Bagging, Leukemia diagnosis, Microarray, Support vector machines (1) Golub TR, Slonim DK, Tamayo P, et al. Molecular Classification of Cancer: Class Discovery and Class Prediction by Gene Expression Monitoring. Science 1999; 286: 531-537 83 P09 A Voting Approach for SVM Kernel Selection in Gene Expression Profiling Gokmen Zararsiz1, Cenk Icoz2, Erdener Ozcetin3 1 Erciyes University, Faculty of Medicine, Department of Biostatistics and Medical Informatics, Kayseri, Turkey 2 3 Anadolu University, Faculty of Science, Department of Statistics, Eskisehir, Turkey Anadolu University,Faculty of Engineering and Achitecture, Dept. of Industrial Engineering, Eskisehir, Turkey Abstract With the development of microarray technology, the expression levels of thousands of genes have been monitored simultaneously and gene expression profiling has been successfully performed to disease diagnosis and classification. There are lots of machine learning methods have been proposed and successfully applied for this purpose. Support vector machines (SVM) are one of the most powerful machine learning method which performs classification by constructing an optimal hyperplane(s) to seperate the data. There are different kernel functions proposed for SVM and selection of the right kernel function is very important for accurate gene expression profiling. Here we define a voting approach (VA) which automatically finds the best SVM kernel function for a given dataset. In first step, VA applies different kernel-SVM models to dataset. Next, VA validates each model using different performance criterias. Finally, VA aggregates the performances of each criteria using a rank aggregation idea. The use and the efficiency of VA will be demonstrated on real datasets. Keywords: Gene expression profiling, Kernel functions, Rank aggregation, Support vector machines, Voting methods 84 P10 Genellenebilirlik Kuramı Pervin Demir1, Atilla Halil Elhan1, Derya Öztuna1 1 Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Günlük yaşantımızda ve bilimsel çalışmalarda ölçme önemli bir yer tutar. Ölçme araçları, ölçülen büyüklüğün sayılarla ifade edilmesini; böylelikle gözlemin daha duyarlı yapılarak objektif ve standart ölçümler elde edilmesini sağlar. Uygun maddeler seçerek istenen nitelikte bir ölçme aracı geliştirme sürecinde madde analiz çalışmaları önemli bir yer tutmaktadır. Bu amaçla en yaygın kullanılan teori, klasik test teorisidir(KTT). Ölçme çalışmalarında amaç, ölçülen özellik bakımından elde edilen puanın olabildiğince gerçek puana yakın olmasının sağlanmasıdır. Bu nedenle ölçme işlemine karışan hatanın araştırılması yani güvenirliğin test edilmesi gerekir. Genellenebilirlik kuramı KTT’ndeki sınırlılığı ortadan kaldırmak için puanlayıcı, zaman, test formu, madde ve görev gibi değişkenlik kaynaklarından gelen hataları birlikte değerlendirerek tek bir güvenirlik katsayısı hesaplanmasını sağlar. Çalışmada yer alan puanlayıcıların verdikleri puanlarla evrendeki tüm puanlayıcılara genelleme yapılmak isteniyorsa, genellenebilirlik kuramından yararlanılabilir. Genellenebilirlik kuramında farklı karar çalışmaları ile farklı sayıdaki madde ve puanlayıcı sayılarına göre güvenirlik tahminleri yapılarak en uygun madde ve puanlayıcı sayısına karar verilebilir. Genellenebilirlik kuramı sayesinde araştırmacı toplam varyansın ne kadarının hangi kaynaktan ortaya çıktığını görebilir. Bu çalışmada; KTT ve genellenebilirlik kuramı arasındaki farklılıklar ve genellenebilirlik kuramının amacı üzerinde durulmuştur. Belli bir ölçmenin güvenirliğini değerlendirmek için düzenlenen Genellenebilirlik (G) çalışması ve Karar (K) çalışmasından bahsedilmiştir. Anahtar Kelimeler: Klasik test kuramı, Madde yanıt teorisi, Genellenebilirlik kuramı, Karar çalışması Pervin Demir: E-Posta: [email protected] 85 P11 Tanı Testlerinin Aile Hekimliğindeki Kullanımına Bir Örnek Zekeriya Aktürk1, Kamber Kaşali2 1 Atatürk Üniversitesi Tıp Fakültesi Aile Hekimliği Anabilim Dalı, Erzurum 2 Atatürk Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı, Erzurum Özet Giriş ve Amaç: Her ne kadar aile hekimliği uygulamasında biyopsikosoysal bir yaklaşım önerilse de teknolojideki ilerlemeler ve tanı testlerinin artmasının da etkisiyle aile hekimleri giderek daha fazla tanı testi kullanma eğilimindedirler. Doğru kullanıldığında koruyucu hekimlikten, tanı ve tedavide çok faydalı olabilen tanı testlerinin, uygunsuz kullanımında ciddi sorunlar ortaya çıkabilmektedir. Bu nedenle aile hekimleri tanı testlerinin kendi pratiklerindeki duyarlılık ve özgüllük değerinin yanı sıra Bayes teoremi, ön test olasılığı, olabilirlik oranı ve son test olasılığı gibi kavramları da iyi bilmelidirler. Bu makalede tanı testlerinin aile hekimliği pratiğindeki yerinin Bayes yaklaşımına dayanarak nasıl hesaplanacağının bir örnek üzerinde açıklanması amaçlanmıştır. Yöntem: Bayes Teoremi ve Olabilirlik Oranı: Thomas Bayes tarafından geliştirilmiş olan Bayes teoremi durumsal olasılıkları açıklamaktadır. Bu teorem basitçe karar vermede tek bir olasılığın etkili olmayıp birçok ön olasılığın üst üste binerek son bir karara yol açtığı esasına dayanır. Örneğin, bir zar atıldığında çift gelme olasılığı %50’dir. Herhangi bir başka bilgiye sahip olunmazsa bu olasılık hep %50 beklenir, ancak zarın hileli olduğu ve çift gelme olasılığının arttırıldığı bilgisine sahip olunursa, çift gelme olasılığının %50’den daha fazla olması beklenir. Elde edilen bu olasılık, ön test olasılığı olarak kullanılarak varsa başka testler için ihtimaller eklenir ve böylece olabildiğine yüksek bir doğrulukta karar verilmeye çalışılır. On binde 1 yaygınlıkta görülen bir hastalık için %90 duyarlı ve %86 özgül bir testin pozitif çıkması halinde son test olasılığının %0,064 olduğu hesaplanabilir. Bulgular: Yeni doğan bir bebeğin rutin muayenesinde birçok test istenilir. Bu testlerden kreatinin fosfokinaz (CPK) %90 duyarlılığı ve %86 özgüllüğe sahip olan bir testtir. CPK testi pozitif bulunan yeni doğmuş bir bebeğin musküler distrofinin olma riski araştırılmaktadır. Musküler distrofinin yaygınlığı 10 binde 1 civarındadır. Öncelikle ön test olasılığı, olasılık oranına (pretest odds) çevrilir. Ardından testin olabilirlik oranı (LR) hesaplanır. Daha sonra son test olasılık oranı (posttest odds) hesaplanır. Son olarak ise elde edilen olasılık oranı son test olasılığına çevrilir (Tablo1). 86 Adımlar 1.Pre test olasılığının pre test olasılık oranına (Odds Ratio) çevrilmesi: Pre test OR = Olasılık / (1 - Olasılık) 2. Olabilirlik oranının (LR+) hesaplanması: LR+ = Duyarlılık / (1 - Özgüllük) 3. Bayes Teoreminin hesaplanması: Post test OR = Pre test OR X LR 4. Post test OR’nın olasılığa dönüştürülmesi: Olasılık = Post test OR / (1 + Post test OR) Tablo 1: Yeni doğan bir bebeğin pozitif CPK testi durumunda musküler distrofi olma olasılığının hesaplanması. Sonuç: CPK testi pozitif çıkan bir bebeğin musküler distrofi olma olasılığı 10 binde 6 bulunmuştur. Her ne kadar CPK testi teknik açıdan yüksek duyarlılık ve özgüllük değerlerine sahip bir test olsa da, nadir görülen bir hastalık olan musküler distrofide tanıya fazla katkıda bulunamamaktadır. Musküler distrofi hastalığının toplumda yaygınlığı olan 10 binde 1 olasılığı CPK testinin pozitif çıkması halinde 10 binde 6 bulunmuştur. Aile hekimlerinin sadece testin teknik özelliklerine dayanarak karar vermeleri halinde birçok yalancı pozitif etiketleme söz konusu olabilecektir. Aile hekimlerinin klinik testleri kullanırken ulusal ve uluslararası rehberleri dikkate almaları, rehberlerin bulunmadığı durumlarda kullanılan tanı araçlarının olabilirlik oranlarına bakmaları, mümkünse birden fazla tanı aracını bir arada değerlendirerek Bayes yaklaşımına uygun, daha kesin kararlar vermeye çalışmaları doğru olacaktır. Anahtar Kelimeler: Bayes Teoremi, Tanı Testleri, Musküler Distrofi 87 P12 Yaşam Analizleri’nde Random Survival Forests ve Cox Regresyon Yöntemleri’nin Karşılaştırılması Ferhan Elmalı1, Engin Özkan1, Ahmet Öztürk1, Gökmen Zararsız1, Serdar Şıvgın2 1 Erciyes Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Kayseri 2 Erciyes Üniversitesi, Tıp Fakültesi, Hematoloji Anabilim Dalı, Kayseri Özet Cox Regresyon yöntemi 1972 yılında Cox tarafından yaşam analizleri için geliştirilmiş bir yöntemdir [1]. Bu yöntemde yaşam süresi bağımlı değişken, yaşam süresi üzerinde etkisi olduğu düşünülen değişkenler ise bağımsız değişkenler fonksiyonlardan olarak yararlanılarak adlandırılmaktadır. ilgili Yaşam değişkenlerin süresinin hastalık ve tahminlenmesinde yaşam süresi exponansiyel üzerindeki riskleri belirlenebilmektedir [2]. Cox regresyonun yapılabilmesi için yerine getirilmesi gereken bazı varsayımlar sözkonusudur. Bu varsayımlar genellikle tahminleme yapmayı güçleştirmektedir. Bu nedenle son yıllarda daha esnek yapıda olan sınıflandırma yöntemleri geliştirilmiştir. Segal yaşam ağaçlarının oluşturulmasında log-rank istatistikleri gibi parçalı fonksiyon kullanmıştır [3]. Davis ve Anderson exponansiyel yaşam ağaç modelini oluşturmak için exponansiyel log likelihood parçalı kriterini kullanmıştır [4]. Leblanc ve Crowley relatif risk ağaç modelini geliştirmişlerdir [5]. Son zamanlarda Ishwaran ise Random Forests sınıflandırma yönteminin yaşam analizlerine uyarlaması olan Random Survival Forests yöntemini oluşturmuştur [6]. Türkiye’de ise Ömürlü ve arkadaşları Random Survival Forests yöntemi ile Cox regresyon yöntemini beş bağımsız değişkenli türetilmiş verilerde ve meme kanserli hastalarda karşılaştırmışlardır [7]. Bu çalışmada farklı senaryolarda türetilmiş düşük ve yüksek boyutlu veri setlerinde ayrıca Erciyes Üniversitesi Onkoloji hastanesinin farklı birimlerinden alınacak gerçek veri setlerinde iki yöntem karşılaştırılacaktır. Bu çalışmanın sonunda belirli bir hastalıktan dolayı tanı konmuş bireyler için kişiye özel daha az hata ile yaşam süresi tahminlemesi yapılması hedeflenmektedir. 1. Cox D. R. Regression models and life-tables, Journal of the Royal Statistical Society, Series B, 1972; 34: 187-220. 2. Cox D. R., Oakes D. Analysis of Survival Data, New York: Chapman and Hall; 1984. 3. Segal, M. R. Regression Trees for censored data. Biometrics. 1988; 44 (1): 35-48. 4. Davis, R., Anderson, J. Exponential survival trees. Statistics in Medicine. 1989; 8: 947-961. 5. Leblanc, M., Crowley, J. Relative risk trees for censored survival data. Biometrics. 1992; 48(2): 411425. 6. Ishwaran et al. Random Survival Forests. The Annals of Applied Statistics. 2008; Vol.2, No.3: 841-860. 7. Omurlu I., Ture M, Tokatli F. The comparisons of random survival forests and Cox regression analysis with simulation and an application related to breast cancer. Expert Syst. Appl. 2009; 36(4): 8582-8588. 88 P13 İneklerde Eko-Yapı Değişkenler Kullanılarak Kronik Endometritis Derecelerinin Roc Eğrisi Yöntemi İle Belirlenmesi 1 İ. Safa Gürcan , Ayca Babak Doğukan Özen1, Aytekin Yamaç3, Özlem Güllü1 1 2, Ankara Üniversitesi, Veteriner Fakültesi, Biyoistatistik Anabilim Dalı, Ankara 2 Tarım ve Kırsal Kalkınmayı Destekleme Kurumu 3 Kara Harp Okulu Özet Roc Eğrisi, Tanı Testlerinin Performanslarının Değerlendirilmesi Ve Kıyaslanması İçin Yaygın Olarak Kullanılan Bir Yöntemdir. Roc Eğrisi, Duyarlılık Ve Özgüllük Oranlarını Kullanarak Denekleri Sınıflarına Ayıran En Uygun Kesim Noktasını Belirler. Sınıflamanın Doğruluğu, Roc Eğrisi Altında Kalan Alanın Büyüklüğüne Bağlıdır. Roc Eğrisi Altında Kalan Alan, Doğru Tanı Testinin Seçiminde Kullanılan Çok Popüler Bir Ölçüdür. Çalışma İle, Tanı Amacıyla Geliştirilen Yeni Bir Testin Hasta İle Sağlamları Ayırmadaki Performansını, Doğruluğunu Ve Hastalık Derecelerinin Geçerli Tanı Eşiğini İncelemekte Kullanılan Roc Analiz Yöntemini Tanıtmaktır. Bu Amaçla Uygulama Verisi Olarak, Dünyada Tanı Amacıyla Yeni Uygulanan Bir Yöntem Olan Bilgisayar Destekli Ekostruktur Programları İle Kronik Endometritisli İneklerden Elde Edilen Ultrasonografik Resimlerin Analiz Değerleri Kullanılmıştır. Endometritisin Değişik Derecelerinde (E1, E2, E3) Elde Edilen Ekostruktur Değişkenler (Ortalama Gradient, Homojenite, Kontrast, Ortalama Gri Değer) İçin Tanı Oranları Hesaplanarak, Roc Eğrisi Yöntemi İle Değişik Derecelerdeki Endometritislerin Eşik Değerleri, Tanı Performansları Ve Doğrulukları İncelenmiştir. Elde Edilen Veriler Roc Eğrisi İle Yapılan İstatistiksel Analizin Kronik Endometritislerin Düzeylerinin Tanınmasında Yardımcı Bir Hesaplama Yöntemi Olduğunu Göstermiştir. Anahtar Sözcükler: Duyarlılık, Eko-Yapı Değişkenler, Kronik Endometritis, Özgüllük, Roc Eğrisi, Tanı Testi 89 P14 Hayvancılıkta Verimli Yaşam Süresi Hesaplamalarında Frailty Modellerin Uygulanabilirliği D.Özen1, İ.S.Gürcan1, Ö.Güllü1 1 Ankara Üniversitesi, Veteriner Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Hayvancılıkta verimli yaşam süresi, hayvanın ilk yavrulamasından sürüden ayrılmasına kadar geçirdiği süre olarak tanımlanır (Tsuruta ve ark, 2005). Bu süreye etki eden risk faktörlerinin belirlenmesi işletmelerin ekonomik olarak devamlılığını sürdürebilmesi bakımından büyük önem taşımaktadır. Hayvancılıkta verimli yaşam süresine etki eden risk faktörlerinin hesaplanmasında sıklıkla cox orantılı riskler modeli kullanılmaktadır. Bununla birlikte bu tür çalışmalardaki denekler genellikle kümelenmiş olup birbirleriyle ilişkili olma eğilimindedirler. Ayrıca hayvanlar arasında verimli yaşam sürelerini etkileyen ölçülemeyen genetik faktörler ve gözlemlenmemiş biyolojik varyasyonlar vardır ve bu durum hayvanlar arasında heterojenlik yaratmaktadır. Bu çalışmada amaç frailty modeller hakkında bilgi vererek cox orantılı regresyon modelleri yerine frailty modellerin hayvancılıkta verimli yaşam süresinin hesaplanmasında uygulanabilirliğini göstermektir. Anahtar Kelimeler: Verimli Yaşam Süresi, Frailty Modeller, Cox Regresyonu 90 P15 Etçi Piliçlerde Karkas Özelliklerinin Temel Bileşenler Analizi ile Değerlendirilmesi Aytaç Akçay1, Mustafa Uğurlu2, Akın Yakan3, Fatih Atasoy4 1 2 Erciyes Üniversitesi Veteriner Fakültesi Biyometri AD., Kayseri, Türkiye Ondokuz Mayıs Üniversitesi Veteriner Fakültesi Zootekni AD., Samsun, Türkiye 3 Mustafa Kemal Üniversitesi Veteriner Fakültesi Zootekni AD., Hatay, Türkiye 4 Ankara Üniversitesi Veteriner Fakültesi Zootekni AD., Ankara, Türkiye Özet Amaç: Bu araştırma, etçi piliçlerde karkas parçalarının Temel Bileşenler Analizi (TBA) ile değerlendirmek amacıyla yapılmıştır. Gereç ve Yöntem: Uygulamada kullanılan veriler Atasoy ve ark. (2010) tarafından Ankara Üniversitesi Veteriner Fakültesi Uygulama Çiftliğinde yürütülen çalışmadan elde edilmiştir. Atasoy ve ark. (2010) araştırmalarında, 360 adet 1 günlük erkek ve dişi civcivi, kontrol (K), deneme 1 (D1) ve deneme 2 (D2) gruplarına ayırmıştır. Bu çalışmada sadece kontrol (K) grubunu oluşturan 114 adet etçi piliç kullanılmıştır. Piliçlere 1-10. günlerinde % 23.10; 11-31. günlerinde % 21.80, 32-47. günler arasında % 18.40 ham proteinli rasyon uygulanmıştır. Rasyonların enerjisi yaklaşık 3100 kcal/kg ME olacak şekilde sabit tutulmuştur. Deneme süresince yem ve su adlibitum olarak verilmiştir. Çalışmada, Etçi piliçlerde yetiştiricilik ve ıslahta önemli olan karkas özellikleri arasında amaçlı ilişkiyi anlamak ve özellik sayısını azaltmak için Temel Bileşenler Analizi (PCA=Principal Component Analysis) kullanılmıştır. Bu analizde canlı ağırlık, soğuk karkas, göğüs, but, kanat, boyun, karaciğer, mide, kalp ve abdominal yağ ağırlıkları olmak üzere toplam 10 özellik değerlendirilmiştir. Bulgular: Temel bileşenler analizi ile karkas özellikleri bağımsız gruplara ayrılmış, on değişken ayrıntılı olarak irdelenmiştir. Öncelikle, TBA’ nın uygulanması için tüm korelasyonların sıfıra eşittir boş hipotezi test etmek amacı ile Bartlett küresellik testi yapılmıştır. Bartlett küresellik testi değeri 409.4 bulunmuş ve bu değer veri setinin TBA’ya uygun olduğunu göstermiştir (P < 0.001). Örneklem büyüklüğünün uygunluğunu gösteren Kaiser-Meyer-Olkin (KMO) değeri 0.886 olarak hesaplanmıştır. TBA sonucunda, ilk beş temel bileşenin toplam varyansın % 80.4’lik bölümünü oluşturduğu ve birinci temel bileşenin tek başına toplam varyansın % 42.3 açıklayabildiği tespit edilmiştir. Karkas özellikleri ile birinci temel bileşen arasındaki korelasyonların tümü pozitif ve yüksek bulunmuştur. Toplam varyansta en yüksek paya canlı ağırlık, soğuk karkas, göğüs, but sahip olmuştur. İkinci, üçüncü, dördüncü ve beşinci temel bileşenler için, en büyük korelasyonlar sırasıyla boyun (0.95), abdominal yağ (0.98), karaciğer (0.97) ve taşlık (0.93) arasında gözlemiştir. Ve ayrıca, bu temel bileşenler sırasıyla toplam varyansın yaklaşık % 11.7, % 10.7, % 8.4 ve % 7.2 bölümünü açıklamışlardır. Sonuç: Bu çalışmanın amacı, etçi piliç yetiştiriciliğinde kullanılmak üzere temel bileşenler elde etmek değil, karmaşıklığını azaltmak için orijinal özelliklerinin doğrusal bir kombinasyonunu elde etmenin mümkün olduğunu göstermek için yapılmıştır. Sonuçta, ilişkili özellikleri gruplandırarak hayvan yetiştiriciliğinde dikkate alınması gereken özelliklerin sayısında ciddi bir azalma sağlayan temel bileşenler analizinin, toplam varyansı değerlendirmede ve anlamada kullanılabilecek bir araç olduğu görülmüştür. Anahtar Kelimeler: Etçi Piliç, Karkas, Temel Bileşenler Analizi 91 P16 Tahmin Modellerinin Performanslarının Değerlendirilmesi Özlem Güllü1, Mustafa Agâh Tekindal2, Doğukan Özen1, İ.Safa Gürcan1, Yasemin Genç3 1. Ankara Üniversitesi Veteriner Fakültesi, Biyoistatistik Anabilim Dalı, Ankara 2. Başkent Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara 3. Ankara Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Sağlık alanında yaygın olarak kullanılan tahmin modelleri, hastalığın izlenmesi ve zaman içinde gelişiminin ilerdeki evrelere göre tahmin edilmesi, tanı konması ve uygun tedavi yöntemine karar verilebilmesi için risk gruplarının (düşük,orta,yüksek vs.) belirlenmesi gibi muhtelif amaçlar için kullanılır. Tahmin modellerinin güvenilirliğinin belirlenmesindeki temel istatistiksel yaklaşım tahmin edilen değerlerin gerçek değerlere ne kadar yakın olduğunun belirlenmesidir. Başka bir deyişle, iyi bir model, yüksek risk grubu içinde olan hastalar ile düşük risk grubu içinde olan hastaları doğru şekilde ayırt etmelidir. Bu çalışmada model performansını değerlendirmede kullanılan klasik ölçülerin ve son yıllarda geliştirilen yeni ölçülerin özellikleri tanıtılmıştır. Tahmin modellerinin doğruluğunun ve performansının değerlendirilmesi konusunda gelecekte yapılabilecek çalışmalar için bir değerlendirme yapmak için yol gösterici olacaktır. İstatistiksel tahmin modellerinin performansının değerlendirilmesinde kullanılan ölçüler klasik ve yeni olmak üzere iki temel grup olarak belirlenmiştir. Klasik ölçüler, Açıklanan Değişim (R2), Brier skoru, Ayırt Etme (Discrimination) ve Kalibrasyon (Calibration) ölçüleridir. Son yıllarda önerilen yeni ölçüler ise Tekrar Sınıflandırma Tabloları (Reclassification), NRI (Net Reclassification Improvement) ve IDI (Integrated Discrimation Improvement) olarak sıralanabilir. Geliştirilen birçok istatistiksel tahmin modeline rağmen mevcut bir modele yeni bir tahmin edici eklendiğinde tahmin modelinin performansının nasıl değerlendirileceğiyle ilgili ortak bir karara varılmamıştır (Pencina,2008). Modelin ayırt edebilirliğini ölçmede sıklıkla ROC (receiver operating characteristic curve) eğrisi altında kalan alan (AUC) ya da c istatistiği kullanılmaktadır (Cook,2007). Son zamanlarda bu metotların bazı kısıtlamaları olduğu ve yeni eklenen bir tahmin edicinin yararlılığının değerlendirilmesinde yeteri kadar açıklayıcı olmadığı klinik ve epidemiyolojik çalışmalarda tartışılmaktadır (Cui,2009). Özellikle ROC eğrisinin, prognaztik modellerde, risk tahminlerindeki değişime karşı hassas bir yöntem olmadığı söylenmektedir (Cook ve Paynter,2011). Bu hassasiyet problemine karşı tekrar sınıflandırma tablolarının kullanılması önerilmiştir. Yeni eklenen bir değişkenin modele katkısı AUC ya da c istatistiğine göre çok küçük ve önemsiz görünürken, tekrar sınıflandırma yapıldığında aynı değişkenin katkısının çok daha önemli olabileceği görülmüştür. Bu durumda modele yeni eklenen bir tahmin edicinin modele net katkısının hesaplanmasında ve hastaların risk kategorilerine daha doğru bir şekilde ayırt edilmesinde AUC’nin yanı sıra tekrar sınıflandırma tablolarının da kullanılması gerektiği önerilir (Steyerberg ve ark.,2010). Sonuç olarak çalışmaların güvenilirliklerinin arttırılmasının yanında deneme için ayrılan zaman ve kaynağın da israf edilmesinin önüne geçilebilecektir. 92 Anahtar Kelimeler: İstatistiksel Tahmin Modelleri, ROC Eğrisi, AUC, C İstatistiği, Tekrar Sınıflandırma Tabloları, Ayırt Edebilirlik Ölçümü, Model Performansı Değerlendirme Kaynakça Cook,N.R., BuringJ.E., ve Ridker, P.M.(2006). The Effect of Including C-Reactive Protein in Cardiovascular Risk Prediction Models for Women, Annals of Internal Medicine,145:21-29 Cook,N.R.(2007). Use and Misuse of the Receiver Operating Characteristic Curve in Risk Prediction,Journal of American Heart Association, 115:928-935 Cook, N.R., Paynter,N.P.(2011). Performance of reclassification statistics in comparing risk prediction models, Biometrical Journal, 53:2, 237–258 Cui, J.(2009). Overview of Risk Prediction Models in Cardiovascular Disease Research, Ann Epidemiol, 19:711–717 Gu,W., Pepe, M.S.(2009). Measures to Summarize and Compare the Predictive Capacity of Markers, UW Biostatistics Working Paper Series University of Washington, p:342 Pencina, M.J., D’Agostino Sr, R.B., D’Agostino Jr, R.B., ve ark.(2008). Evaluating the added predictive ability of a new marker: From area under the ROC curve to reclassification and beyond, Statistics In Medicine ,27:157–172 Pepe, M.S., Fengi,Z., Huang, Y., ve ark.(2007). Integrating the Predictiveness of a Marker with Its Performance as a Classifier, American Journal of Epidemiology ,Vol. 167, No. 3 Pepe, M.S.(2011). Problems With Risk Reclassification Methods for Evaluating Prediction Models. American Journal of Epidemiology, Steyerberg,E.W., Vickers,A.J.,Cook,N.R., ve ark.(2010). Assessing the Performance of Prediction Models:A Framework for Traditional and Novel Measures, Epidemiology, 21: 128–138 Steyerberg,E.W.(2009). Clinical Prediction Models:A Practical Approach to Development, Validation, and Updating, Springer, p:255-296 Tice, J.A., Cummings,S.R., Smith-Bindman,R.(2008). Using Clinical Factors and Mammographic Breast Density to Estimate Breast Cancer Risk: Development and Validation of a New Predictive Model, Annals of Internal Medicine ,148:337-347 Tzoulaki, I., Liberopoulos, G. ve Ioannidis, J.,PA.(2011). Use of reclassification for assessment of improved prediction: an empirical evaluation, International Journal of Epidemiology ,40:1094–1105 Vickers,A.J, Elkin,E.B.(2006). Decision Curve Analysis: A Novel Method for Evaluating Prediction Models, Med Decis Making, 26: 565 http://mdm.sagepub.com/content/26/6/565 93 P17 Lojistik Regresyon Analizi (Lra), Yapay Sinir Ağları (Ysa) ve Sınıflandırma ve Regresyon Ağaçları (C&Rt) Yöntemlerinin Karşılaştırılması Emre Kuyucu1, Ünal Erkorkmaz1, İlker Etikan1, Osman Demir 1 1 Gaziosmanpaşa Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Tokat Özet Amaç: Sınıflandırma uygulamalarında kullanılan pek çok model ve bu modellere ait farklı algoritmalar vardır. Çok sayıda algoritma olması, her algoritmanın kendi içinde farklı parametrelerle çalışması, her algoritmanın birden çok versiyonunun bulunması, farklı algoritmaların farklı amaca yönelik olması, kullanılan veri kaynağının farklı olması, algoritmaların farklı veri tiplerini desteklemesi ve veri üzerinde yapılan önişlemlerin uygulayıcıya bağlı olması gibi sebeplerle farklı sonuçlar elde edilmiştir. Bu sebeple algoritmaların karşılaştırılarak değerlendirilmesi büyük önem arz etmektedir. Çalışmada Lojistik Regresyon Analizi (LRA), Yapay Sinir Ağları (YSA) ve Sınıflandırma ve Regresyon Ağaçları (C&RT) yöntemlerinin sınıflandırma özelliklerinin karşılaştırılması yapılmıştır. Yöntem: Karşılaştırma için Tokat Gaziosmanpaşa Üniversitesi Sağlı Araştırma ve Uygulama Merkezi’ne 01.01.2005 tarihi ve 31.05.2011 tarihleri arasında Üroloji Polikliniği’ne başvuran hastaların sonuçları alınmıştır. Hastalardan kesin tanısı prostat kanseri olan hastalara ait veriler kullanılmış, üç yönteme göre elde edilen sonuçlar başarı yönünden değerlendirilmiştir. Yöntemlerin karşılaştırılması için Yeni Zelanda’daki Waikato Üniversitesi tarafından geliştirilen WEKA istatistik paket programı kullanılmıştır. Bulgular: Karşılaştırılan Lojistik Regresyon Analizi (LRA), Yapay Sinir Ağları (YSA) ve Sınıflandırma ve Regresyon Ağaçları (C&RT) yöntemlerinden sınıflandırma açısından en iyi sonuçların Yapay Sinir Ağları (YSA) tarafından sağlandığı bulunmuştur. Sonuç: Sınıflandırma algoritmalardan hangisinin daha efektif sonuçlar ürettiği, hangi algoritmanın hangi alanda daha başarılı olduğu sorusuna verilen cevaplar uygulamaların başarımını ve yapılan işin verimini arttıracaktır. Anahtar Kelimeler: Sınıflandırma, Lojistik Regresyon Analizi (LRA), Yapay Sinir Ağları (YSA), Sınıflandırma ve Regresyon Ağaçları (C&RT). 94 P18 Ergenlerde Madde Kullanımı Tutum Analizi Serpil Sevimli Deniz1, Hayrettin Okut2, Sanem Şehribanoğlu3 1 2 Yüzüncü Yıl Üniversitesi Gevaş Meslek Yüksekokulu Öğretim Görevlisi, Van Yüzüncü Yıl Üniversitesi Ziraat Fakültesi Zootekni Bölümü Biyometri ve Genetik , Van 3 Yüzüncü Yıl Üniversitesi Özalp Meslek Yüksekokulu Uzman, Van Özet Amaç: Bu çalışma ergenlerin madde kullanımına karşı tutumlarını belirlemek ve bunu etkileyen risk faktörlerini incelemek amacıyla yapılmıştır. Yöntem: Araştırmada Van ili Merkez ilçedeki elli ilköğretim okulu ve on lisede okuyan 13-18 yaş grubundaki ergenlerin madde kullanımına yönelik tutumlarını belirlemek amacıyla aşağıdaki sorulara, Araştırmaya katılan ergenlerin: 1.Genel demogrofik özellikleri nasıldır? 2.Madde kullanımına karşı tutumlarını etkileyen faktörler ne düzeydedir? 3. Doğrulayıcı Faktör Analizi ile faktörler arasında anlamlı ilişkiler olup olmadığına yanıt aranmıştır. Bulgular: 413 erkek, 249 kız olmak üzere 662 ergen üzerinde yapılan çalışmada ergenlerin madde kullanım tutumunu ölçmek için uygulanan ankette “aşağıdaki ifadelere ne ölçüde katılırsınız” başlıklı 24 sorudan oluşan soruyu oluşturan sorulara verilen cevaplar, yapılan faktör analizi sonrasında üç alt faktör altında toplanmıştır. Bu bölümle ilgili yapılan KMO (Kaiser-Meyer-Olkin) testinin sonucunda %99.41 gibi yüksek bir oran elde edilmiş olup, ankete faktör analizi uygulanabilir olduğunu göstermektedir. Elde edilen faktörlerin toplam varyansı açıklama yüzdesi %80.07’dir. Cronbach’s Alpha değeri 0.94 bulunmuştur. Yapılan analiz sonrasında birinci faktörü oluşturan maddeleri “ailenin tutumu”, ikinci faktörü oluşturan maddeleri “sosyal bakış” ve üçüncü faktörü oluşturan maddeleri de “yaşıt bakışı “ olarak ifade etmek mümkündür. Sonuç: Ergenlerin madde kullanımına tutumu değerlendirilirken üç boyut öne çıkmaktadır. Bu üç boyut aile, çevre ve yaşıtlardır. Anahtar Kelimeler: Faktör Analizi, Madde Kullanımı, Ergen 95 P19 Poisson Regresyon ve Sağlık Alanında Bir Uygulaması Esra Gültürk1 , Sibel Şener2 1 2 Cumhuriyet Üniversitesi, Tıp Fakultesi, Biyoistatistik ABD Cumhuriyet Üniversitesi, İ.İ.B.F, Yönetim Bilişim Sistemleri Özet Poisson Regresyonu, bağımlı değişken sayılabilir olduğu durumlarda kullanımı tercih edilen bir modeldir. Verilerin sürekli olduğu durumlarda doğrusal regresyon analizi kullanılabilmektedir. Ancak analizlerde kullanılacak veriler her zaman sürekli halde bulunmayabilir. Bu gibi durumlarda yani; verilerin kesikli olması durumunda da doğrusal regresyon modelleri kullanılarak yapılacak analizler etkisiz, tutarsız, ve çelişkili sonuçlar verecektir. Bu sebepten dolayı kesikli veriler için tüm koşullar sağlandığında kullanılabilecek en etkin model Poisson Regresyon modellerdir. Bu çalışma Cumhuriyet Üniversitesi Tıp Fakültesi Yeni Doğan Ünitesindeki Premature babek sayıları üzerinde etkili olan faktörleri belirlemede poisson regresyon analizi kullanılmıştır. Ocak 2011-Aralık 2011 döneminde aylara göre Premature bebek sayısı bağımlı değişken, Annenin Yaşı, Annenin Sigara İçme Durumu, Önceki Gebelik Sayısı, Annenin Çalışıp Çalışmama Durumu ve Gebelik Komplikasyonları bağımsız değişken olarak belirlenmiştir. Anahtar Kelimeler: Premature, Poisson Regresyon, Kesikli Değişken Esra Gültürk:e-mail: [email protected] 96 P20 Genetik Risk Skoru Dağılımını Etkileyen Faktörler Bahar Taşdelen1, Havva Didem Ovla1 1 Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Mersin Özet Amaç: Bu çalışmada, genom çaplı ilişki (genome wide association) çalışmalarında kullanılan tek nükleotid polimorfizmleri (single nukleotid polymorphism, SNP) ile sonuç değişkenler arasındaki ilişkilerin değerlendirilmesinde kullanılan genetik risk skorunun dağılımını etkileyen faktörlerin belirlenmesi amaçlanmıştır. Yöntem: Genetik epidemiyolojide, belirli bir hastalığa ait aile öyküsüne sahip ve genetik olarak yüksek risk grubundaki bireyler dikkate alınır ve bu bireylerde hastalıkla ilişkili olabilecek farklı genetik varyantlar değerlendirilir. En yaygın görülen genetik geçişli hastalıklar arasında, kardiyovasküler hastalıklar, kanser, diyabet, astım, nörolojik bozukluklar ve son yıllarda tüm dünyanın sorunu haline gelen obezite yer almaktadır. Hastalık-genetik ilişkisini değerlendirmek amacıyla genetik epidemiyolojide, hasta ve sağlıklı bireylerin DNA yapılarını karşılaştıran, genom çaplı ilişki çalışmaları yapılmaktadır. Bu tip çalışmalarda özellikle, üzerinde durulan hastalık ile SNP’ ler arasındaki ilişki değerlendirilir. Kompleks hastalıklar çalışılırken, genellikle fenotip üzerinde etkili olduğundan şüphelenilen çok sayıda SNP ile çalışılır. Bu durumda, bir SNP diğerinin etkisini maskeleyebilir veya değiştirebilir (epistatik etki). Üzerinde durulan özelliğe etkisi olduğu düşünülen, birden çok SNP ile çalışılırken, farklı yaklaşımlar mevcuttur. En çok bilinen yöntem, SNP’ leri aynı modele koymaktır. Bu yöntemin başarısı SNP sayısına ve örnek genişliğine bağlıdır. Ayrıca minör allel frekansları düşükse homozigot mutantları görebilmek için gerekli örnek genişliği daha da fazladır. Bu tip sorunların önüne geçmek için önerilen yöntem SNP’ leri birleştirerek genetik risk skoru (GRS) hesaplamaktır. Bunun için kullanılan iki yöntem mevcuttur: Basit sayma metodu ile GRS hesaplama ve ağırlıklandırılmış GRS hesaplama metodu. Genetik risk skoru kullanılarak hastalık bakımından risk grupları belirlenirken, öncelikle kontrol grubuna ait GRS değerlerinin dağılımı incelenir ve bu dağılıma ait çeyreklikler hesaplanır. Bulgular: Genetik risk skoru hesaplarken akla gelen sorulardan bazıları: Kaç SNP yeterli? Örnek genişliği en az kaç olmalı? Minör allel frekansından ne kadar etkileniyor? Veri dönüşümü yapmadan kullanılabilir mi? Veri dönüşümü gerekliyse hangi dönüşüm yapılmalıdır? Bu sorulara yanıt bulmak amacıyla yapılan çalışmada, her biri üç genotip grubuna sahip farklı sayıda SNP’ ler (k=5, 10, 20, 50, 100, 100+) için minör allel frekansının düşük (≤0.20) ve yüksek (>0.20) olduğu durumlarda örnek genişliğine bağlı olarak SNP dağılımları incelenmiştir. Sonuç: Genetik risk skorunun minör allel frekanslarından etkilendiği ve sağa çarpık dağılım gösterdiği belirlenmiştir. Bu durumda genetik risk skoru ile sonuç değişken arasındaki ilişkinin veri dönüşümü yapıldıktan sonra değerlendirilmesinin daha uygun olacağı düşünülmektedir. Anahtar Kelimeler: Genetik risk skoru, minör allel frekansı, veri dönüşümü, genetik epidemiyoloji. 97 P21 AB/BA Çapraz Geçişli Denemelerinde Tip I Hata Oranı ile İlişkili Faktörler Didem Derici1, Bahar Taşdelen1 1 Mersin Üniversitesi Tıp Fakültesi Biyoistatistik ve Tıbbi Bilişim AD, Mersin Özet Amaç: Klinik araştırmalarda en sık kullanılan deneme düzenlerinden biri çapraz geçişli denemelerdir. Tedavi etkinliğini araştırmak amacıyla, tedavilerin bireylere sırayla verildiği deneme düzenleridir. Genellikle kronik ve durağan hastalıklar için kullanılmaktadır. Çapraz geçişli denemelerin en önemli avantajları birey içi karşılaştırma sağlaması ve daha az birey ile çalışılmasına rağmen yüksek güce sahip olmasıdır. Fakat istatistiksel analizi diğer deneme düzenlerine göre daha karmaşıktır. En sık kullanılan çapraz geçişli deneme düzeni AB/BA dizaynıdır. Bu çalışmanın amacı, AB/BA çapraz geçişli denemelerde örnek genişliği, periyotlar arası ilişki ve her bir sıradaki eksik gözlem oranının Tip I hata oranı üzerine etkisini incelemektir. Yöntem: Bu çalışmada AB/BA dizaynı için her bir sıradaki örnek genişliği n=5,10,20,30, periyotlar arası ilişki r=0,0.95,0.99 ve eksik gözlem oranı p=0,%10,%25,%40,%50 olmak üzere oluşturulan her bir kombinasyon için SAS programında MVN makrosu ile üretilen ve tamamen rastgele olarak eksiltilen veriler genel doğrusal modeller ile analiz edilmiş ve bu işlem 1000 kere tekrarlanmıştır. Bulgular: Yapılan simülasyon çalışması sonucunda tam veri olması durumunda Tip I hata oranı en düşükken, eksik gözlem oranı arttıkça Tip I hata oranı da artmaktadır. AB/BA dizaynlarında örnek genişliği arttıkça Tip I hata oranı azalmaktadır. Simülasyonların tümü birlikte değerlendirildiğinde Tip I hata oranı üzerinde korelasyon ve örnek genişliğinin etkisinden daha çok eksik gözlem oranının etkili olduğu gözlenmiştir. Sonuç: AB/BA dizaynında bireylerin kendi kendinin kontrolü olmasından dolayı küçük örnek genişliği ile etkili sonuçlar elde edilebileceği görülmüştür. Çalışmamızda eksik gözlem oranının sıralarda eşit olduğu durum değerlendirilmiş olup, literatüre benzer sonuçlar elde edilmiştir. Çapraz geçişli denemeler, tek bir merkezde çalışıldığında yeterli güce sahip tek deneme düzeni olması, her birey üzerinde her tedavinin uygulanmasından kaynaklı bireysel etkilerin elimine edilmesi sebebiyle Amerikan Gıda ve İlaç Dairesi tarafından yayınlanan kılavuzlarda önerilen tek deneme düzeni olduğundan klinik çalışmalarda güvenle kullanılabileceği görülmüştür. Anahtar Sözcükler: Çapraz geçişli denemeler, AB/BA dizaynı, örnek genişliği, eksik gözlem oranı ve periyotlar arası ilişki 98 P22 Sınıflama Metotlarında Yeni Bir Yaklaşım: Çok Değişkenli Eklemeli Regresyon Ağaçları (MART) Gülhan Orekici Temel1, Handan Ankaralı2, Semra Erdoğan1, Aynur Özge3 1 Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Mersin 2 Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, Düzce 3 Tıp Fakültesi, Nöroloji AD, Mersin Özet Amaç: Bu çalışmanın amacı, sınıflama ve regresyon ağaçlarının stokastik gradient boosting yöntemi kullanılarak genellenmiş hali olan Çok Değişkenli Eklemeli Regresyon Ağaçları (Multivariate Additive Rregression Trees, MART) yöntemini bir nöroloji veri seti üzerinde tanıtmaktır. Yöntem: Model zayıf sınıflayıcıları ardışık olarak birleştirerek bir eklemeli model oluşturur. Model bir tür ağaçlar serisi olarak düşünülebilir. Her ağaç bir önceki ağaçtan beslenerek gelişerek daha homojen ağaç şeklini alır. İterasyona dayalı danışmanlı öğrenme yöntemlerinden birisidir. Bu modelde bağımlı ve bağımsız değişkenler sürekli ya da kategorik yapıda olabilirler. Uygulamada Mersin Üniversitesi Tıp Fakültesi Nöroloji Anabilim Dalı Elektrofizyoloji Laboratuvarına 2006-2010 tarihleri arasında Karpal Tünel Sendromu (KTS) ön tanısı ile başvuru yapan bireyler çalışmaya alınmıştır. Veri seti toplam 4076 vakadan oluşmaktadır. Toplam 4076 vakadan 3250 vaka (2393 KTS+857 Sağlıklı) eğitim verisi, kalan 826 vaka ise (618 KTS+208 Sağlıklı) test verisi olarak seçilmiştir. Yapılan 16 elektrofizyolojik ölçüm bağımsız değişken olarak alınmıştır. Bu değişkenlerin bir bölümü kategorik ve bir bölümü de sürekli yapıdadır. Bağımlı değişken olarak da KTS hastası olup olmama durumu alınmıştır. MART uygulaması Salford Predictive Modeler Builder v6.6 programında yapılmıştır. Bulgular: Yapılan analiz sonucunda modelin doğru sınıflama başarısına ve değişkenlerin önemlilik oranlarına bakılmıştır. Eğitim verisi kullanılarak modelin doğru sınıflama başarısı % 94 bulunmuş ve test verisi kullanılarak ise modelin genel doğru sınıflama başarısı % 93 olarak hesaplanmıştır. Ayrıca eğitim verisi kullanıldığında son modelin sensitivitesi ve spesifitesi ise sırasıyla % 89.2 ve % 95.9, test verisi kullanıldığında % 88 ve % 94.8 olarak hesaplanmıştır. Sonuç: Modelin tahmin doğruluğu, yapay sinir ağları da dahil olmak üzere diğer makine öğrenme algoritmalarını kullanan yöntemlere göre eşit ya da daha yüksektir. Modelde değişkenlerle ilgili herhangi bir varsayımının olmaması, Huber M kayıp fonksiyonunu kullanarak modelin aşırı uyuma karşı koruma sağlaması, uç değerlerden, interaksiyonlardan etkilenmemesi modele üstünlük sağlar. Model eklemeli ağaç modeli olduğundan ağaçlar seridir. Bu nedenle tek bir ağaç olarak görüntülenemez. Bu durumda modelin dezavantajı olarak düşünülebilir. Anahtar Kelimeler: Çok Değişkenli Eklemeli Ağaçlar, İlaveli Model, Huber M Kayıp Fonksiyonu Gülhan Orekici Temel: MEÜ. Çiftlikköy Kampüsü, Tıp Fakültesi Dekanlık Binası, Biyoistatistik ve Tıbbi Bilişim AD., Mersin/Türkiye. E-Posta: [email protected] Tel: 0 324 3610684 Cep: 0 533 615 32 41 Fax: 0 324 341 24 00 99 P23 Boylamsal İki Durumlu Cevap Değişkeni İçin Genelleştirilmiş Tahmin Denklemi ve Kuadratik Çıkarım Fonksiyonu Yöntemlerinin Karşılaştırılması: Kolon Kanseri verisi üzerine bir uygulama Anıl Aktaş Samur1, İbrahim Goktas2, Osman Saka1 1 Akdeniz Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi Anabilim Dalı, Antalya 2 Akdeniz Üniversitesi, Tıp Fakültesi, Dâhiliye Anabilim Dalı, Antalya Özet Boylamsal çalışma tasarımları, klinik denemelerde ve gözlemsel çalışmalarda özellikle tedavi etkisinin belirlenmesi gibi zamanla değişen durumlarda sıklıkla kullanılmaya başlanmıştır. Boylamsal veriler, aynı denekten farklı zaman noktalarında çoklu gözlemlerin alındığı ve deneklerin kendi içinde ilişkili olduğu verilerdir. Bu ilişkiler, veri yapısına uygun analiz yöntemlerin uygulanmasını gerektirir. Önerilen birkaç yöntemden biri Genelleştirilmiş Tahmin Denklemi (GTD), diğeri Kuadratik Çıkarım Fonksiyonu (KÇF) dur. Yöntem: GTD, boylamsal ilişkili verilerde sıklıkla kullanılan istatistiksel bir yöntemdir. GTD yaklaşımı, gözlemler ilişkili olduğunda daha etkili ve yansız regresyon katsayılarının tahmini için geliştirilmiş bir yöntemdir. Ölçümlerin sürekli olmasının yanı sıra sayılabilir ya da kategorik olması durumunda da sıklıkla kullanılır. KÇF, GTD yaklaşımının alternatifi olarak geliştirilmiş yeni bir yöntemdir. GTD gibi yarı-olabilirlik yaklaşımına dayanmaktadır. GTD yaklaşımında olduğu gibi korelasyon yapısı doğru tahmin edilmese bile tutarlı parametre tahminleri verir. Amaç: Çalışmada, kolon kanseri olan hastaların kemoterapi aldıktan sonra hemoglobin düzeylerinin düşüşü ile ilgili olarak örnek bir veri seti kullanılmıştır. Kolon kanseri tanısı konulan hastalar 3’er aylık periyotlarda kemoterapi aldıktan sonra kan değerleri ölçülmüş ve bazı hastaların hemoglobin değerlerinde düşüşler gözlenmiştir. Bu çalışmada amaç, hasta verilerine GTD ve KÇF yöntemlerinin uygulanarak iki yöntemden elde edilen sonuçlarının değerlendirilmesi ve ayrıca hastalarda hemoglobin değerinin düşüşüne neden olan faktörleri belirlemektir. Sonuç: Çalışmada, kemoterapi alan 31 hasta bulunmaktadır. Bu hastaların %71 erkek, % 64.5’ unda rektum ve çevresinde tümör bulunmakta, %54.8’ inde tek organa metastaz yapmıştır. Verilere GTD ve KÇF yöntemi için AR (1) korelasyon yapısı uygulanarak parametre tahminleri ve standart hataları elde edilmiştir. İncelenen değişkenler açısından GTD analizine göre sadece metastaz yapma (3 farklı organ) durumu (p=0.0159) etkili iken, KÇF yöntemine göre cinsiyet (kadın) (p=0.013) ve metastaz yapma (3 farklı organ) (p=0.006) hemoglobin düşüklüğünde daha etkili bulunmuştur. Sonuç olarak KÇF yöntemi, GTD yöntemine göre daha etkili parametre tahminleri ortaya koymaktadır (GE=1.13) Anahtar Kelimeler: Genelleştirilmiş Tahmin Denklemi, Kuadratik Çıkarım Fonksiyonu, İlişkili Veriler 100 P24 Prostat Spesifik Antijeni Yardımı İle Prostat Kanserinin Değişik Yapay Sinir Ağı Modelleri İle Tahmini Mehmet Onur Kaya1, Cemil Çolak2, Enver Özdemir3 1 2 Fırat Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Elazığ İnönü Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Malatya 3 Fırat Üniversitesi, Tıp Fakültesi, Üroloji AD, Elazığ Özet Amaç: Bu çalışmada, prostat spesifik antijeni (PSA) değerlerinin yardımıyla prostat kanseri olan ve prostat kanseri olmayan vakaların yapay sinir ağları (YSA) modelleri yardımıyla tahmin edilmesi amaçlanmıştır. Gereç ve Yöntem: Çalışma, geriye yönelik veri toplama yöntemi ile 203 erkek bireye ait olup, Gazi Üniversitesi Tıp Fakültesi Üroloji Anabilim Dalı Polikliniği’nden sağlanmıştır. Prostat kanserinin oluşumuna ilişkin PSA tipleri ve prostat kanserinin tanısında kullanılan değişkenler incelenmiştir. YSA, değişik eğitim algoritmaları kullanılarak eğitilmiştir. Girdi katmanında 9 işlem elamanı kullanılmıştır. Bu giriş elemanları; yaş, DRE (Parmakla Rektal Muayene), TPSA (Toplam Prostat Spesifik Antijen), fPSA (Serbest Prostat Spesifik Antijen), f/t (Serbest PSA/ Toplam PSA oranı), Tvolüm (Toplam Hacim), TZvolüm (Transizyonel Zon Hacmi), PSAD (Prostat Spesifik Antijen Dansitesi), TZPSAD (Transizyonel Zon Prostat Spesifik Antijen Dansitesi) değişkenleri idi. Çıktı katmanındaki değişken ise PSA değerlerine göre prostat kanseri olup olmaması idi. Değişik YSA modelleri ve öğrenme algoritmaları denenerek, en iyi sonuç elde edilmeye çalışılmıştır. Tahmin edilen her bir farklı model için değişik sayıda örnekler eğitim, doğrulama ve test için kullanılmıştır. YSA modelleri, ileri beslemeli geriye yayılımlı ağ (feed-forward back propogation) kullanılarak tahminde bulunulmuştur. Bulgular: Çalışmadaki YSA modelleri arasında, en iyi YSA modeline ait açıklayıcılık katsayısı (R2) 0.75 ve hata kareler ortalaması (MSE) 0.07 olarak bulunmuştur. Çalışmadaki diğer YSA modellerinin R2 ve MSE değerleri ise sırasıyla; 1. model için 0.72 ve 0.09, 2. model için 0.66 ve 0.15, 3. model için 0.61 ve 0.14, 4. model için 0.49 ve 0.15 olarak elde edilmiştir. Sonuçlar: Bazı klinik tanı testleri (PSA gibi), tanı ve teşhis sürecinde çok etkili sonuçlar verememekle beraber, getirdikleri maddi külfetlerin yanı sıra zaman kayıplarına da sebep olabilmektedirler. Ayrıca bazı klasik istatistiksel metotlar bu tip problemlerin çözümünde yeterli olamamaktadır. Bu nedenle yaptığımız çalışmada değişik YSA modellerinin, PSA’nın yardımı ile prostat kanserinin tahmin edilmesinde daha etkili ve ümit verici sonuçlar verebildiği anlaşılmıştır. İleriye yönelik klinik tanı sürecinde kullanılabilir olduğu görülmüştür. Anahtar Kelimeler: Prostat Spesifik Antijeni, Yapay Sinir Ağları, Tahmin. Cemil Çolak: E-Posta: [email protected] 101 P25 Bilgi Güvenliği Ve Kalite Yönetim Sistemleri Arasındaki İlişkinin İncelenmesi Ve Bir Uygulaması Necati Alasulu1, Nurhan Halisdemir2, Cemil Çolak3 1 2 3 KOSGEB, Bilgi İşlem Dairesi Başkanlığı, Ankara Fırat Üniversitesi, Fen Fakültesi, İstatistik AD, Elazığ İnönü Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Malatya Özet Amaç: Bu çalışmada, Bilgi Güvenliği Yönetim Sistemi (BGYS) ile Kalite Yönetim Sistemleri (KYS) arasındaki ilişki incelenmiştir. KYS ve BGYS’nin entegre olarak tasarımı, kurulumu ve uygulamasının yapılması amaçlanmıştır. Gereç ve Yöntem: Çalışmada ilk olarak temel kalite kavramları tanımlanmış ve KYS Standardı TS EN ISO 9001:2008 ile BGYS Standardı TS ISO /IEC 27001:2005 hakkında açıklamalar yapılmıştır. BGYS’nin standart maddeleri temel alınarak, KYS ile benzerlikleri incelenmiştir. BGYS Standardı TS ISO /IEC 27001:2005’in ana maddeleri ve alt maddeleri tek tek uygulanmıştır. Uygulama ve veriler, bilişim sektöründe faaliyet gösteren bir firmada yapılmıştır. Uygulama aşamasında, bu çalışmada örnek olarak alınan işletmede KYS’nin durumu analiz edilmiş ve entegre olarak bu sisteme sonradan Bilgi Güvenliği Yönetim Sistemi’nin kurulumu ve uygulaması yapılmıştır. Bulgular: Çalışmada KYS Standardı TS EN ISO 9001:2008 ve BGYS Standardı TS ISO /IEC 27001:2005 için ihtiyaç duyulan prosesler ve uygulamaları tanımlanmış ve yazılı hale getirilmiştir. Kuruluşun ana prosesleri Yönetim Sorumluluğu Prosesi, Satın alma Prosesi, Sürekli İyileştirme Prosesi, Eğitim ve İnsan Kaynakları Prosesi, Teknik Servis Prosesi, Tasarım Prosesi ve Sürekli İyileştirme Prosesleri olarak belirlenmiştir. İhtiyaç duyulan proseslerinin tasarımı, sırası ve etkileşimleri entegre sistem dokümantasyonu çerçevesinde prosedürler ve talimatlar ile belirlenmiştir. Böylece KYS ve BGYS’nin proseslerinin etkileşimi standardize edilmiştir. Sonuçlar: Bilgi ve bilgi güvenliğinin önemi sürekli gelişen ve değişen yeni teknolojilerle birlikte artmakta ve bilgi güvenliği yönetimi daha da karmaşık bir hal almaktadır. KYS’nin bilgi yönetim modellerini oluşturan bilginin elde edilmesi, bilginin depolanması ve korunması, bilginin paylaşımı-kaynaklara tahsisi, bilgi teknolojileri ve bilginin uygulanması süreçlerine katkı sağladığı sonucuna varılmıştır. Bilgi güvenliğini sağlamak isteyen kuruluşun teknolojik olarak bilgi teknolojilerinin uygulaması, donanımsal olarak gerekli tedbirleri almaları kurumsal bilgi güvenliğinin sağlandığı anlamına gelmemektedir. Bilgi güvenliği bir yönetim sistemi olup sistemin tasarımı, planlanması, uygulanması ve sürekli iyileştirilmesi gerekmektedir. BGYS’nin KYS ile entegre kurulması, sistemin etkinlik ve verimlilik ile beraber zamandan ve kaynaklardan önemli ölçüde tasarruf sağladığı, ayrıca mevcut sistemi geliştirmenin yanında uygulamada oluşabilecek birçok probleme de çözüm getirdiği görülmüştür. Bu nedenle Bilgi Güvenliği Yönetim Sistemi’nin Kalite Yönetim Sistemi ile entegre kurulması önerilmiş ve karşılaşılan problemlere çözüm getirilmiştir. Anahtar Kelimeler: Bilgi Güvenliği, Bilişim Teknolojileri, Entegre Yönetim Sistemleri, Kalite. 102 P26 Üniversite Hastanelerinde Risk Yönetimi Değişkenlerinin Logistik Regresyon Yöntemiyle İncelenmesi İsmail Yıldız1,Yusuf Çelik1, Ömer Satıcı1, Zeki Akkuş1, Mutlu Daşdağ1, Murat Biçimli2 1 Dicle Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Diyarbakır 2 Dicle Üniversitesi Hastaneleri, Kalite ve Strateji Geliştirme Koordinatörlüğü, Diyarbakır Özet Bir sağlık kurumunda risk yönetiminin temel hedefi oluşabilecek her türlü zararı asgariye indirmek için gerekli tüm önlemleri almak ve oluşabilecek zararların etkisini de olabildiğince azaltmaktır. Kurumlar tarafından sunulan hizmetlerin ve faaliyetlerin çeşitliliği de dikkate alınarak; Hizmet sunulmasını engelleyecek veya hizmetin kalitesini düşürecek, Hasta ve Çalışan Güvenliğini sarsabilecek, Yolsuzluk yapılmasına meydan verecek, Mevzuata aykırılığa imkan tanıyacak, kurum içinden ya da kurum dışından oluşan her türlü olay RİSK olarak adlandırılabilir. Sağlık sektöründe risk değişkenlerinin belirlenmesi problemin çözümünde önemli bir aşamadır. Yapılan çalışmaların tek değişkenli yöntemlerle değerlendirilmesi bilgi kaybına yol açar. Bu nedenle risk oluşturacak değişkenlerin tümünü bir arada değerlendiren çok değişkenli yöntemlere gereksinim vardır. Çok değişkeni bir arada değerlendiren ileri kompütürize yöntemler, değişkenlerdeki bilgi bütününü bozmadan daha duyarlı sonuçların elde edilmesine yardım eder. Araştırmalarda önemli olan etkenler arasındaki ilişkiler dikkate alınarak, risk yönünden incelenmesidir. Bağımlı değişken sonuç ve bağımsız değişkenlere de, bazen risk faktörleri denir. Logistik regresyonun sonuçları Odds oranları (Odss ratios) sonuçlarını sunar. Lojistik regresyon analizi faktörlerin göreli önemlerinin sonuçlarını belirlemek ve değerlendirmek için güçlü bir araçtır. Sözü edilen göreli önem regresyon denkleminde olduğu gibi regresyon katsayılarının hesaplanması, ayrıca ek olarak bağımlı değişken dikkate alınarak, her bağımsız değişkenin ne kadar risk taşıdığı bulunmaktadır. Bu riskler odds katsayıları ile verilir. Çalışmada Lojistik regresyon modelinin sağlık sektöründe risk yönetimi konusunda sağlayacağı başarılı çözümler ele alınarak, Dicle Üniversitesi Hastanelerinde yapılan uygulamalar detaylarıyla anlatılması amaçlandı. Anahtar Kelimeler: Risk, Risk Yönetimi, Lojistik Regresyon, Odds Katsayısı, Sağlık Sektörü 103 P27 Varsayımlar Bozulduğunda ANOVA’ya Alternatif Test İstatistikleri Funda Seher Özalp1, Derya Öztuna1 1 Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Amaç: Tek yönlü varyans analizi (ANOVA), her biri normal dağılıma sahip olan birbirinden bağımsız ikiden fazla grup ortalamasını karşılaştırmak amacıyla kullanılır. Varyans analizi uygulayabilmek için temel varsayımlar, örneklemlerin her birinin normal dağılım göstermesi ve varyanslarının homojen olması, örneklemlerin rastgele olarak seçilmesi ve bağımsız olmasıdır. Varsayımların bozulması durumunda üç çözüm yolu önerilmektedir: 1- verilerin, dönüşüm yoluyla varyans analizi tekniğine uygun hale getirilmesi, 2- verilerin, uygun parametrik olmayan bir yöntem ile analiz edilmesi, 3- varyans analizi tekniği yerine alternatif parametrik testlerin kullanılması. Yapılan çalışmalara göre verilere dönüşüm uygulanması, genelde iyi bir çözüm yolu olmamaktadır. Çünkü elde edilen sonuçların yorumlanması orijinal değerler üzerinden yapılamamakta, dönüşüm sonucu elde edilen değerler üzerinden yapılmakta ve sonuçların yorumlanması aşamasında bazı yanlış yorumlara sebep olmaktadır. Parametrik olmayan testler ise, varyansların heterojen olmasından olumsuz yönde etkilendikleri ve etkinlikleri de düşük olduğu için pek tavsiye edilmemektedir. Yöntem: Bu çalışma kapsamında ANOVA’nın varsayımları sağlanmadığında uygulanabilecek alternatif parametrik testler tanıtılacak, avantaj ve dezavantajları simülasyon çalışmalarından elde edilen sonuçlar doğrultusunda ortaya konacaktır. Bu testlerden bazıları, Welch Testi, Değiştirilmiş (Modified) Welch Testi, Brown-Forsythe Testi, Değiştirilmiş (Modified) Brown-Forsythe Testi, Yaklaşık (Approximate) Anova F Testi, Cochran Testi, Marascuilo Testi ve Scott-Smith Testi’dir. Bu testlerin sağlık alanından elde edilen gerçek bir veri seti üzerinde uygulamaları da gerçekleştirilecektir. Bulgular ve Sonuç: Yapılan benzetim çalışmaları ile ANOVA’ya alternatif parametrik test istatistiklerinin bazılarının üstün ve eksik yönleri ortaya konmuştur. ANOVA’nın varsayımları yerine getirilemediğinde, verilere dönüşüm uygulamak ya da verileri parametrik olmayan yöntemlerle analiz etmek yerine, bu alternatif test istatistiklerini kullanmak, verinin özellikleri de göz önünde bulundurularak tercih edilebilir. Anahtar kelimeler: varyans analizi, parametrik test, alternatif test istatistikleri Funda Seher Özalp: E-Posta: [email protected] 104 P28 Sonuç Ölçümlerinde Değişime Duyarlılığın Değerlendirilmesinde Kullanılan Yöntemler Mustafa Emre Nakış1, Derya Öztuna1, Atilla Halil Elhan1, Burcu Yanık1 1 Ankara Üniversitesi Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Özet Amaç: Klinik denemelerde sonuç ölçümlerinin güvenilir(reliable),geçerli(valid) ve değişime duyarlı(responsive) olması gerekir. Güvenilirlik; bir deneyin benzer koşullarda iki veya daha fazla kere uygulandığında ölçme aracının aynı sonuçları üretebilmesidir. Geçerlik; bir ölçme aracının ölçmesi istenen özelliği başka özelliklerle karıştırmadan ölçebilme yeteneğidir. Geçerlik ve güvenirliğin açık tanımları olmasına rağmen, ölçme aracının değişime duyarlı olup olmadığının nasıl tanımlanacağı ve değerlendirileceği konusunda bir fikir birliğine varılamamıştır. Ancak literatürdeduyarlılık, “içsel duyarlılık (internalresponsiveness)” ve “dışsal duyarlılık (externalresponsiveness)”olarak iki farklı temel bakış açısı ile değerlendirilmektedir. İçsel duyarlılık, belirlenen bir zaman diliminin sonunda ölçme aracının değişimi ölçebilme yeteneğidir. Dışsal duyarlılık, belirlenen bir zaman diliminin sonunda ölçme aracında ortaya çıkan değişimin, referans bir ölçme aracındaki değişimle ilişkisinin değerlendirilmesidir. Bu çalışmanın amacı, değişime duyarlılığın değerlendirilmesinde kullanılan farklı yöntemlerin tanıtılması ve sağlık alanında kullanılan bir ölçek üzerinde uygulamasının yapılmasıdır. Yöntem: Çalışma kapsamında, içsel duyarlılığın değerlendirilmesinde “eşleştirilmiş örneklerdet-testi” ve“etki genişliği istatistiklerinin”, dışsal duyarlılığın değerlendirilmesinde “işlem karakteristik eğrisi altında kalan alan”, “ilişki katsayısıve regresyon analizinin” kullanımına değinilecektir. Bu kapsamda sağlık alanında yaygın olarak kullanılan bir ölçeğin değişime duyarlılığının değerlendirilmesi, yukarıda bahsedilen yöntemler üzerinden uygulamalı olarak gösterilecektir. Bulgular ve Sonuç: Klinik çalışmalarda kullanım kolaylığına ve etkinliğine dayanarak duyarlılık istatistiklerinin ikiye ayrılarak tanımlanmasının avantajlı olacağıileri sürülmektedir. Çalışmalarda kullanılan duyarlılık istatistikleri genelde içsel duyarlılıktır. İçsel duyarlılık istatistiği,hastanın ölçüm seviyesinde değişiklik söz konusu olduğunda daha fazla önem kazanmaktadır.Dışsal duyarlılık istatistiğinin kullanımıise, çalışmanın amacına göre belirlenmelidir. Anahtar kelimeler: Sonuç ölçümü, güvenirlik, geçerlilik, değişime duyarlılık Emre Nakış: E-Posta: [email protected] 105 P29 Temel Bileşenler Regresyon Analizi ve Bir Uygulama 1 Emrah Cilvez , Atilla Halil Elhan1, Derya Öztuna1, Halil İbrahim Acar2, Beyza Doğanay Erdoğan1 1 2 Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Ankara Ankara Üniversitesi, Tıp Fakültesi, Anatomi Anabilim Dalı, Ankara Özet Amaç: Çok değişkenli doğrusal regresyon analizi, sürekli ölçekle elde edilmiş bağımlı bir değişken üzerinde etkili olan bağımsız değişkenlerin belirlenmesi amacıyla yapılan çok değişkenli bir analiz yöntemidir.Bu analizin en temel varsayımı, bağımsız değişkenlerin birbiriyle ilişkisiz olmasıdır. Ancak bazı çalışmalarda bağımsız değişkenler birbirleriyle ilişkili olabilir ve bu durum“çoklu bağlantı problemi” olarak adlandırılır. Çoklu bağlantı, bağımsız değişkenlere ilişkin regresyon analizinden elde edilecek regresyon katsayıları üzerinde önemli etkiye sahiptir. Regresyon katsayılarının hatalı olarak elde edilmesi, regresyon analizinden elde edilecek sonuçların da yanlış yorumlanmasına neden olmaktadır. Bu çalışmanın amacı,örnek bir uygulama üzerinden temel bileşenler regresyon analizi ile çoklu bağlantı sorununu çözmek ve en iyi regresyon denklemine ulaşmaktır. Yöntem: Çoklu bağlantının varlığı, en yaygın olarak ilişki katsayısı, tolerans veya varyans şişme katsayısı kullanılarak ortaya konabilir. İki değişken arasındaki ilişki katsayısı çok yüksek ise, bu yapı, çoklu bağlantının bir göstergesi olabilir. Tolerans değeri, seçilen bir bağımsız değişkenin diğer bağımsız değişkenlerle olan çoklu ilişkisini gösterir ve sıfıra yakın tolerans değeri, incelenen değişkenin diğer değişkenlerin doğrusal kombinasyonu olduğunu gösterir. Varyans şişme faktörü, tolerans değerinin tersi olup; yüksek değerli olması çoklu bağlantı probleminin varlığını gösterir.Temel bileşenler regresyon analizinin amacı, çoklu bağlantı probleminin olduğu değişkenlerin, temel bileşenler analizi ile ilişkili olmayan temel bileşenlere dönüştürülmesine dayanır, bu şekliyle doğrusal regresyon ile temel bileşenler analizinin bir birleşimidir. Standartlaştırma ile temel bileşenler regresyon denklemleri hesaplanıp en büyük düzeltilmiş R2 ve en küçük standart hata tahminine göre en iyi denklem elde edilir. Son olarak en iyi denklem doğrusal regresyon denklemine dönüştürülür. Bulgular ve Sonuç: Çoklu bağlantı durumunda temel bileşenler analizi ile bağımsız değişkenler ile bağımlı değişken arasındaki ilişki yapıları daha güvenilir olarak ortaya konmaktadır. Anahtar Kelimeler: Çoklu Bağlantı, Temel Bileşenler Analizi, Temel Bileşenler Regresyonu Emrah Cilvez: E-Posta: [email protected] 106 P30 Sivas’ta Diyabetik Ayak Görülme Sıklığının Bayesçi Yaklaşımla Tahmin Edilmesi Hafize Sezer1, Sarper Yılmaz2, R. Erol Sezer3 Cumhuriyet Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Sivas Cumhuriyet Üniversitesi, Tıp Fakültesi, Plastik Cerrahi Anabilim Dalı, Sivas Cumhuriyet Üniversitesi, Tıp Fakültesi, Aile Hekimliği Anabilim Dalı, Sivas Özet Günümüzde birbiriyle rekabet halinde olan iki istatistiksel analiz yaklaşımı vardır. Frekansçı ( klasik ) ve bayesçi yaklaşım. Bilimsel araştırmalarda son yıllara kadar klasik yaklaşım daha çok tercih edilirken üniversitelerde matematiksel istatistik bölümlerinin kurulup gelişmesi ve bilgisayarların artan kuvveti Bayesçilere yeni bir ivme kazandırmış ve bu yaklaşımın da sıklıkla kullanılır hale gelmesini sağlamıştır. Şimdi de bu iki yaklaşımla ilgili hangisinin daha üstün olduğu çatışması vardır Fakat bilimsel pratik Bayesçi yaklaşıma giderek yükselen bir pozisyon vermeye devam etmektedir. Verinin analizinde bu iki yaklaşım arasında temel farklılıklar vardır. Frekansçı yaklaşımda olasılık tanımı relatif frekans tanımına dayanmaktadır. Bu yaklaşıma göre bir olayın olasılığı, o olayla ilgili bir rassal deney n kez tekrarlandıktan sonra hesaplanabilir. Bayesçi yaklaşım ise subjektif tanımı kabul eder ve bir olayın olasılığı, olayla ilgili ön bilgi ile çalışma verisinin birleştirilmesinden elde edilir. Burada birleştirme işlemi Bayes teoremi aracılığı ile yapılmaktadır. Frekansçı yaklaşım da popülasyon değerleri bilinmeyen fakat sabit değerler olarak kabul edilirler. Bayesçi yaklaşım da ise; popülasyon ortalaması ve oranı gibi bilinmeyen değerler bir olasılık dağılımına sahip olduğu kabul edilir ve parametreye verinin analizinden önce atfedilen dağılıma Önsel (Prior ) dağılım denir.Bu dağılım bir olasılık dağılımı olup, araştırıcının verisini analiz etmeden önce parametre ile ilgili ön bilgisini (tahminini) yansıtır.Veri analiz edildikten sonra elde edilen sonuçlar ve önsel dağılım Bayes kuralına göre birleştirilerek yeni bir dağlım elde edilir, bu dağılıma Sonsal ( Posterior ) dağılım denir. Sonsal dağılım da bir olasılık dağılımıdır ve. Bayesçi yaklaşımda tüm olasılıklar bu dağılım aracılığı ile hesaplanır. Bu çalışmanın amacı Sivas’ta diyabetik ayak görülme sıklığını Bayesçi yaklaşımla tahmin etmeye çalışmaktır. Uygulama için, Sivas’ta yapılan bir saha çalışmasında elde edilen sonuçlar kullanılacaktır. (Bu saha çalışmasında 274 diyabet hastasının 9 unda diyabetik ayak olgusuna rastlanmıştır). Tahminler WIN BUGS yazılım programı aracılığı ile yapılacaktır. Anahtar Kelimeler: Bayes Teoremi, Olasılık Dağılımları, Önsel Dağılım, Sonsal Dağılım Diyabetik Ayak 107 P31 Tarama İstatistikleri Ve Türkiye Ölüm İstatistikleri Üzerine Uygulamaları Ayten Yiğiter1, Rabia Burcu Demirtürk1 1 Hacettepe Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Ankara Özet Amaç: Bu çalışmada tarama istatistikleri tanıtılmış ve Türkiye İstatistik Kurumu (TUİK)’nin yayımladığı Türkiye ölüm istatistikleri kullanılarak uygulamalarına yer verilmiştir. Yöntem: Tıbbi görüntüleme, enfeksiyon hastalıkları, kanser, kazalar, ormancılık, psikoloji, tarih, kriminoloji, astronomi ve jeoloji vb. alanlardaki geniş uygulamaları olan tarama (scan) istatistikleri, ilgilenilen veri kümesinde anlamlı kümelenmelerin olup olmadığının bulunmasında kullanılan bir yöntemdir. Verilerin elde ediliş sürecine göre zamansal, mekânsal ve uzay-zaman yönünden tarama istatistikleri çeşitli olasılık dağılımları altında tanımlanmaktadır. Bulgular ve Sonuç: Uygulamada, TUİK’in 2006-2008 yılları arasında il ve ilçe merkezlerinde meydana gelen ölüm olayları ve nedenleri ile ilgili veriler kullanılmıştır. Mekânsal tarama istatistikleri kullanarak ölüm olaylarının nedenlerine göre kümelenmenin olduğu iller araştırılmıştır. Anahtar Kelimeler: Tarama istatistikleri, mekânsal tarama istatistikleri, Türkiye ölüm istatistikleri Kaynakça Glaz, J., Naus, J. and Wallentein, S. 2001. Scan Statistics. Springer-Verlag Inc., 367 p., New York. Glaz, J. and Naus J., 1983, Multiple clusters on the line, Communications in Statistics:Theory and Methods 12, 1961-1986. Kulldorff, M., 1999, Spatial scan statistics: Models, calculations and applications. In Balakrishnan and Glaz (eds), Recent Advances on Scan Statistics and Applications. Boston, USA: Birkhäuser. Kulldorff, M., 1997, A spatial scan statistic. Communications in Statistics: Theory and Methods, 26:1481–1496. Kulldorff, M. and Nagarwalla, N., 1995, Spatial disease clusters: Detection and Inference. Statistics in Medicine,14:799–810. 108 P32 Taguchi Metodu ve Hayvancılık Alanında Uygulaması Adile Tatlıyer1, Hikmet Orhan1 1 Süleyman Demirel Üniversitesi Ziraat Fakültesi, Zootekni Anabilim Dalı, Isparta Özet Bilimsel çalışmalarda sonuç değişkenine etkili olan çok sayıda faktör ve bu faktörlerin seviyelerinin de çok olduğu denemelerde kullanılan faktöriyel düzenlemeler, deneme materyalinin daha etkili kullanılmasını sağlamakta, ancak çok uğraş gerektiren ve uzun zaman alabilmektedir. Taguchi metodu, ortogonal dizileri kullanarak faktöriyel düzenlemelere nazaran zaman ve maliyeti minimize eden bir tasarım yöntemidir. Aynı zamanda deneme ünitesindeki deney sayısını azaltarak, kontrol edilemeyen faktörlerin etkilerini de azaltmayı sağlamaktadır. Özellikle çok sayıda deneme yapılması gereken çalışmalarda daha az sayıda deneme ile ve daha az maliyetle iyi sonuçlar verdiğinden dolayı Taguchi metodunun kullanımı yaygınlaşmaktadır. Bu çalışmada Erbeyli İncir Araştırma Enstitüsü Tavukçuluk ünitesinde yürütülmüş 3x3x2 faktörlü bir araştırmanın sonuçları faktöriyel düzenleme varyans analiz modeli ve Taguchi yöntemi ile analiz edilerek sonuçlar karşılaştırılmıştır. Çalışmada interaksiyon etkileri dikkate alınmıştır. Varyans analizinde SAS 9, Taguchi analizinde ise Minitab 16 paket programları kullanılmıştır. Anahtar Kelimeler: Taguchi, Deneme Planı, Hayvancılık Uygulaması Adile Tatlıyer: E-Posta: [email protected] 109 P33 Laboratuvar Hayvanlarının Kullanıldığı Özel Deney Tasarımları ve Örneklem Hacmi Şengül Cangür1, Handan Ankaralı1 1 Düzce Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı, Düzce Özet Amaç: Laboratuvar hayvanlarının kullanıldığı biyomedikal çalışmalarda bilimsel amaçlara ulaşabilmek için uygun deney tasarımı ve örneklem hacmine karar verme işlemi hem etik, hem ekonomik hem de bilimsel açıdan önem taşımaktadır. Bu çalışmada laboratuvar hayvanlarının yer aldığı araştırmalarda kullanılan Cross-over, Switch back, Reversal, Change-over ve Latin kare tasarımları gibi özel deney tasarımları kısaca tanıtılarak avantajlarından bahsedilmiş ve bu tip denemelerde yer alması gereken minimum denek sayısının nasıl belirlenebileceği konusu üzerinde durulmuştur. Yöntem: Laboratuvar hayvanları ile yapılan araştırmalarda kullanılan özel deney tasarımları simüle veriler üzerinde kısaca tanıtılmıştır. Ayrıca uygun denek sayısına karar verirken veri yapısı, tasarım türü ve denek türü gibi faktörleri de dikkate alarak “kaynak eşitlik yöntemi (resource equation method)”, “güç analizi (power analysis)” ve diğer pratik yaklaşımlar açıklanmıştır. Bulgular ve Sonuç: Laboratuvar araştırmalarında özel deney tasarımlarının bilimsel açıdan daha gerçekçi tahminler ürettiği ve gerekli denek sayısını da en aza indirgediği vurgulanmıştır. Ayrıca etik sorunların getirdiği kısıtlamalar da dikkate alındığı zaman, laboratuvar hayvanları ile yapılan araştırmaların farklı yer, zaman ve koşullarda tekrar edilmesi gerekliliği ve aynı konu üzerinde yapılan araştırmaların sonuçlarının ise meta analizi ile birleştirilmesi gerekliliği açıklanmıştır. Anahtar Kelimeler: Cross-over, Switch back, Deney tasarımı, Örneklem hacmi, Laboratuvar hayvanları 110 P34 K-En Yakın Komşuluk, Yapay Sinir Ağları ve Karar Ağaçları Yöntemlerinin Sınıflandırma Başarılarının Karşılaştırılması 1 Fürüzan Köktürk , M. Çağatay Büyükuysal1, Vildan Sümbüloğlu1 1 Bülent Ecevit Üniversitesi, Sağlık Bilimleri Ensititüsü, Biyoistatistik Anabilim Dalı, Zonguldak Özet Tıp alanında bulunan mevcut veri oldukça fazla ve hayati öneme sahiptir. Veri madenciliği teknikleri ile hayati öneme sahip olan bu verilerden daha fazla yararlanmak mümkündür. Veri madenciliği son yıllarda oldukça önemli bir konu haline gelmesine ve hemen hemen her alanda uygulama sahası bulmasına rağmen ülkemizde sağlık alanında çok yaygın kullanılmamaktadır. Bu tez çalışmasında veri madenciliği yöntemlerinden, k-en yakın komşuluk, yapay sinir ağları ve karar ağaçları yöntemlerinin sınıflandırma başarılarının karşılaştırılması amaçlanmıştır. Bu amaçla Bülent Ecevit Üniversitesi Uygulama ve Araştırma Hastanesi Kadın Hastalıkları ve Doğum Polikliniği’ne başvuran erken ve zamanında doğum yapan gebelerden elde edilen veri setine bu üç teknik uygulanarak, sınıflandırma başarıları hesaplanmıştır. Yapılan analizler sonucunda doğru sınıflandırma oranları, k-en yakın komşuluk analizi için % 78.3, yapay sinir ağı tekniği için % 90.8 ve karar ağacı yöntemi için ise % 82.5 olarak bulunmuş ve yapay sinir ağı tekniğinin diğer iki yönteme göre sınıflandırma başarısının daha iyi olduğu görülmüştür. Anahtar Kelimeler: Veri Madenciliği, K-En Yakın Komşuluk, Yapay Sinir Ağları, Karar Ağaçları, Doğru Sınıflandırma Oranı 111 P35 Küresel Sağlık İstatistiklerinin Görsel Sunumu: Gapminder Örneği Songül Çınaroğlu1 1 Hacettepe Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, Sağlık İdaresi Bölümü Özet Amaç: "Açık Kaynak" kodlu yazılımlar günümüz sanal ortamında bilgi paylaşımına hız kazandıran ve birçok şirket tarafından desteklenen yazılımlardır. Bu yazılımlar sayesinde verilere işlerlik kazandırılabilmekte ve veri paylaşımı kolaylaşmaktadır. Aynı zamanda bu yazılımlar sanal ortamda bilgi paylaşımı ve işbirliğine de hız kazandırmaktadır. Bu işbirliğinin bir sonucu olarak günümüzde açık kaynak kodlu yazılımlar birçok şirket tarafından destek görmektedir. Bu araştırmada küresel sağlık istatistiklerinin gösteriminde açık kaynak kodlu yazılım kullanımının karmaşık istatiksel verileri nasıl ilgi çekici hale getirileceğinin üzerinde durulması amaçlanmıştır. Gereç ve Yöntem: Bu amaca ulaşmak için bu araştırmada Hans Rosling (2005) tarafından geliştirilen ve küresel sağlık istatistiklerinin gösteriminde kullanılan bir açık kodlu yazılım türü olan ‘Gapminder’ incelenecektir. Sonuç ve Öneriler: Günümüzde yapılan pek çok politik tartışma küresel göstergeler üzerinden yapılmaktadır. Burada özellikle üzerinden durulan nokta hangi tür verilerin diğerlerine göre daha fazla önem taşıdığı konusudur. Bu noktada gelecekte daha fazla ilgi çekecek konuların başında küresel ölçekte karşılaştırmalar yapmak için açık kaynak kodlu yazılımlardan yararlanarak kişilerin kendi istatistiksel analizlerini kendilerinin yapmaları gerektiği konusudur. Bu konuda en iyi örneklerin başında Gapminder uygulaması gelmektedir. Bu uygulama sayesinde istatistiksel verilerden eğlenceli bir biçimde kullanılarak küresel sağlık istatistikleri konusunda farkındalık yaratılabilmektedir. Anahtar Kelimeler: Küresel Sağlık İstatistikleri, Açık Kaynak Kodlu Yazılım Kullanımı, Gapminder Songül Çınaroğlu: E-Posta: [email protected] 112 P36 Afyonkarahisar İl Jandarma ve Hava Meydan Komutanlığında Görevli Er-Erbaşların Aile Planlaması Yöntem Kullanma Durumlarının Değerlendirilmesi Ebru Büyükeren1,2 1 2 Afyonkarahisar Toplum Sağlığı Merkezi Hasan Kalyoncu Üniversitesi, Sosyal Bilimler Enstitüsü, Hastane ve Sağlık Kurumları Yönetimi Özet Giriş-Amaç: Üreme sağlığı, aile planlamasını, güvenli anneliği, cinsel yolla bulaşan hastalıkları ve bu hastalıkların önlenmesini kapsamaktadır. Doğurgan yaştaki tüm kadınları ve erkekleri etkileyen istenmeyen gebelikler hem sağlıkla ilgili, hem sosyal hem de ekonomik bir sorun olarak karşımıza çıkmaktadır. Üreme sağlığı kavramı, hem kadının hem de erkeğin gereksinimlerini içermektedir. Kadınların olduğu kadar erkeklerin de toplumdaki statü ve rolleri üreme sağlığında önemlidir. Güvenli annelik ve üreme sağlığı konularında ebe, hemşire, sağlık memuru gibi sağlık personelinin özellikle halkı bilgilendirmeleri gerekmektedir. Bu çalışmada, erkek katılımının sağlanması amacıyla erkeklerin üreme sağlığı gereksinimleri göz önünde bulundurularak, ererbaşların aile planlaması yöntem kullanma durumlarının değerlendirilmesi amaçlanmıştır. Gereç ve Yöntem: Araştırma kesitsel tipte bir araştırmadır. Bu araştırma 15-16 Aralık 2011 tarihlerinde yapılmıştır. Araştırmanın evrenini İl merkezindeki İl Jandarma Komutanlığı ve İl Hava Meydan Komutanlığı’nda görevli 230 er-erbaş oluşturmaktadır. Er- erbaşların emniyet ve asayiş hizmetlerinde görevli olmaları nedeni ile 200 kişi araştırmaya katılmıştır. İl jandarma ve İl Hava Meydan Komutanlığı’nda görevli ererbaşların aile planlaması yöntem kullanma durumlarını değerlendirmek amacıyla soru formları uygulanmıştır. Bağımlı değişken aile planlaması yöntem kullanma durumu; bağımsız değişkenler yaş, öğrenim durumu, medeni durumu, evlilik süresi, çocuk sayısı ve sivil yaşamdaki yerleşim yeri olarak kullanılmıştır. Verilerin analizinde SPSS 15.0 programı, çözümlemede ise ki-kare testi kullanılmıştır. Bulgular: Er-erbaşların yaş ortalaması 27±10.3 olarak saptanmıştır ( min: 18.0; max: 59.0 ). Er-erbaşların % 69.1'i 27 yaş ve altındadır. Er-erbaşların % 34.0’ü evli, % 66.0’sı bekardır. Er-erbaşların % 61.5’i lise ve üzerinde öğrenim görmüştür. Er-erbaşların % 60.0'ı il merkezinde, % 23.0'ü ilçede, % 17.0'si köy ve beldede yaşamaktadır. Er-erbaşların %78.5’i herhangi bir aile planlaması yöntemi kullanmamaktadır. Evli er-erbaşların %42.6'sı, bekar olanlarınsa % 10.6'sı aile planlaması yöntemi kullanmaktadır. Er-erbaşların % 66.4 'ü aile planlaması hakkında daha önceden bilgi almasına rağmen sadece % 22.8'i aile planlaması yöntemi kullanmaktadır. Yapılan analizlerde, yaşı 27 ve üzeri, evli, öğrenim düzeyi lise ve üzeri olanlarda istatistiksel olarak anlamlı bir şekilde daha fazla aile planlaması yöntemi kullandığı saptanmıştır ( p < 0.05 ). Sonuç: Aile planlaması hakkında daha önceden bilgi almasına rağmen yöntem kullanma oranı düşüktür. Özellikle daha genç yaşta ve bekar olan, öğrenim düzeyi lise altında bulunan er-erbaşlara üreme sağlığı konusunda eğitim programları düzenlenmelidir. Anahtar Sözcükler: Üreme Sağlığı, Aile Planlaması, Er-Erbaş Ebru Büyükeren: E-Posta: [email protected] 113 P37 Adana'da Yaşayan 9-15 Yaş Grubu Çocukların Vücut Kitle İndeksinin (VKİ) Değerlendirilmesi ve Obezite 1 Yaşar Sertdemir , Refik Burgut1, İlker Ünal1 1 Çukurova Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Adana Özet Giriş: Obezite, dünya genelinde yaşanan bir sağlık sorunudur. Obezitenin ilkokul yaşlarında başladığı bilinmektedir. Bu yaşlarda edinilen beslenme alışkanlıkları büyük ölçüde hayatın geri kalan kısmında da devam ettirilmektedir. Dünya sağlık örgütü 1980'den bu yana VKI'ni obezitenin belirlenmesinde standart yöntem olarak kullanmaktadır. VKI aynı zamanda "Anorexia Nevrosa" ve "Bulimia Nevrosa" hastalığının belirlenmesinde yardımcı olmaktadır. Dünya sağlık örgütü kriterlerine göre yirmi yaş üstü kişilerde; VKİ < 18.5 malnutrisyon veya yeme bozukluğunu,VKI 25-30 arası kilolu ve VKİ>30 ise obezitenin göstergesi olarak tanımlanmaktadır. ilk-orta okul çocuklarında her yaş grubu için belirlenmiş olan VKİ değerlerine göre çocukları zayıf normal kilolu ve obez olarak sınıflamak mümkündür. Amaç: Adana da yaşayan çocukların durumunu ortaya koymak için yapılmış olan bu ön çalışmada obezite oranlarının belirlenmesine çalışılacaktır. Materyal yöntem: Adana genelinde 50 okuldan toplanan 4098 çocuğun; yaş grupları ve cinsiyete göre VKİ değerleri , "Centers for Disease Control and Prevention (CDC)" merkezinin 2000 yılı verilerine göre gruplandırılarak değerlendirilmiştir. Bulgular: CDC kriterleri esas alındığında; erkek çocukların obezite oranları 9 yaş için %6.7, 10 yaş için %9.6, 11 yaş için %2.1, 12 yaş için %4.1, 13 yaş için %5.9, 14 yaş için %5.5 ve 15 yaş için %4.1, kızlar için ise 9 yaş için %9.2, 10 yaş için %6.9, 11 yaş için %0.5, 12 yaş için %2.9, 13 yaş için %1.7, 14 yaş için %0.8 ve 15 yaş için %1.2 olarak gözlenmiştir. Sonuç: Adana bölgesi 9-15 yaş grubu çocukların VKİ değerleri CDC kriterlerine göre değerlendirildiğinde erkek ve kızların 9 ve 10 yaşlarında daha obez olduğunu göstermektedir. Yaş ilerledikçe bu oranlarda azalma gözlenmektedir. Ancak bu azalmanın yaş ilerledikçe obezitenin azalmasını mı yoksa yeni nesillerin daha obez olduğunu mu gösterdiği longitudinal çalışmalarla araştırılmalıdır. Anahtar Kelime: Vücut Kitle İndeksi, Obezite, Çocuk 114 P38 Destek Vektör Makinesi Modelleri ile Miyokard İnfarktüsün Sınıflandırılması Emek Güldoğan1, Jülide Yağmur2, Saim Yoloğlu1, Musa Hakan Asyalı3, Cemil Çolak1 1 İnönü Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi AD, Malatya, Türkiye 2 3 İnönü Üniversitesi, Tıp Fakültesi, Kardiyoloji AD, Malatya, Türkiye Abdullah Gül Üniversitesi, Mühendislik Fakültesi, Biyomedikal Mühendisliği Bölümü, Kayseri, Türkiye Özet Amaç: Destek vektör makinesi (Support Vector Machine, SVM), pozitif ve negatif örnekleri bilinen bir uzayı ikiye ayıran en iyi hiper-düzlemi bulmaya çalışan sınıflandırma yöntemlerinden biridir. Bu çalışmada, Miyokard İnfarktüsün (Mİ) SVM modelleri ile sınıflandırılması amaçlanmaktadır. Gereç ve Yöntem: Sınıflandırmada kullanılacak Mİ verileri, İnönü Üniversitesi Tıp Fakültesi Kardiyoloji anabilim dalı için oluşturulan veritabanından rastgele alınan 184 bireye ilişkin bilgileri içermektedir. Tahmin edilen SVM’ler, SVM-Doğrusal ve SVM-Radyal Tabanlı kernel fonksiyonlarından oluşturulan modellerdir. Bulgular: Çalışmada incelenen grubun 90’ı (%48.9) Mİ hastası iken, 94’ü (%51.1) Mİ hastası değildi. Mİ’nin doğru sınıflama başarısı, SVM-Doğrusal modeli için %83.70 ve SVM-Radyal Tabanlı modeli için %90.76 olarak elde edilmiştir. Sonuç: Bu araştırmada Mİ’nin sınıflanmasında radyal tabanlı SVM modelinin, doğrusal SVM modelinden daha iyi sınıflama performansı gösterdiği belirlenmiştir. Farklı kernel tipi fonksiyonlara dayalı SVM modellerinin kullanımı, hastalıkların sınıflama performansını artırılabilir. Anahtar Kelimeler: Destek vektör makineleri, Miyokard İnfarktüsü, Sınıflama Emek Güldoğan: E-Posta: [email protected], GSM: 0 506 284 49 34 115 P39 Dekorasist: Bina İçi Dekorasyona Yönelik Öneri Sistemi Fidan Kaya1, Gürel Yıldız, Adnan Kavak 1 Kocaeli Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Kocaeli Özet Bu çalışmada ev ,ofis gibi ortamların dekorasyonunu yaparken kullanıcılara yardımcı olmak amacıyla mobilya, boya ve halı gibi dekorasyon ürünlerinin seçimini sağlayacak mobil ve web uygulamalarından oluşan bir yazılım gerçeklenmiştir. Çalışmada mobil ve web uygulaması kullanıcının mobil telefonu ile çektiği resmin color quantization metodlarını kullanarak renk analizini yapmaktadır ve kullanıcının belirlediği kriterlere göre sistemde yer alan ürünlerden filtreleme algoritmaları yardımıyla önerilerde bulunmaktadır. Veri madenciliği tabanlı pek çok kişisel öneri sistemi bulunmaktadır. Ancak uygulamalarda temel olarak bunlardan iki tanesi karşımıza çıkmaktadır. Bunlar, içerik bazlı filtreleme ve işbirlikçi filtreleme yöntemleridir. İçerik bazlı filtreleme yöntemleri daha çok müşterilere tarihsel veri kayıtlarını ve ürünler arasındaki ilişkileri kullanarak önerilerde bulunurken, işbirlikçi filtreleme yöntemleri diğer müşterilerin seçimlerine ve müşterilerin birbirleri arasındaki benzerliklerine ya da müşterilerin belirli bir içerik ya da meta üzerindeki kişisel görüşlerini bir araya getirerek önerilerde bulunmaya çalışır. Çalışma kapsamında da işbirlikçi filtreleme yöntemleri kullanılarak bir öneri sistemi geliştirilmiştir. Geliştirilmiş olan sistemden öneri alabilmek için sisteme üye olunması gerekmektedir. Sistem öneri üretme aşamasında ilk olarak sistemde yer alan üyelerin tamamını komşu olarak belirlemektedir. Daha sonra iki farklı yöntem ile (pearson bağıntısı ve vektör benzerliği) kullanıcılar arasındaki benzerlikler hesaplanmaktadır. Bu hesaplamalar yapılırken kullanıcıların sistemde yer alan ürünler hakkındaki fikirleri dikkate alınmıştır. Daha sonra hesaplanan benzerlik değerlerine göre ürün tavsiyesinde bulunulacak kullanıcıya kaç adet komşu seçileceği belirlenmektedir. Bu aşamada da iki farklı yöntem kullanılmıştır. Bunlar bağıntı eşiği yöntemi ve k en yakın komşu yöntemleridir. Komşular belirlendikten sonra tavsiye listesinde yer alan ürünler için komşu kullanıcıların geçmişte verdiği oy değerlerini kullanarak kullanıcının hangi ürünü ne kadar beğeneceği tahmin edilmeye çalışılmıştır. Bu tahminler doğrultusunda kullanıcılara önerilerde bulunulmuştur. Çalışma sonucunda mevcut öneri sistemlerine alternatif olacak bir yöntem geliştirilmiştir. Geliştirilmiş olan yöntemle kullanıcılara ait veri kayıtları kullanılarak kullanıcıların analizleri yapılmış ve onlara hitap eden ürünlerin öneri olarak sunulması sağlanmıştır. Aynı zamanda benzerlik hesaplamalarında pearson bağıntısı yönteminin vektör benzerliği yöntemine göre daha avantajlı olduğu ve komşu seçimi sırasında da k en yakın komşu yönteminin bağıntı eşiği yöntemine göre daha iyi sonuçlar verdiği tespit edilmiştir. Geliştirilmiş olan ürün mobilya ve dekorasyon sistemine yönelik bir ürün olmasına rağmen kullanılmış olan öneri sistemi yapısı pek çok alana uygulanabilecek bir yöntem olarak sunulmuştur. Anahtar Kelimeler: İşbirlikçi Filtreleme, Öneri, Dekorasyon, Benzerlik Fidan Kaya: E-Posta: [email protected] 116 P40 1964-1994 Tarihleri Arasında Bildirilen Kızamık Vakalarından Olan Ölümlerin Zamana Bağlı İncelenmesi 1 Serhat Hayme , Serdal Kenan Köse1, Derya Öztuna1, Beyza Doğanay Erdoğan1 1 Ankara Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim dalı, Ankara Özet Giriş ve Amaç: Kızamık, viral, çok bulaşıcı bir hastalıktır. Solunum yolu ile havadan bulaşır ve bütün vücuda yayılır. Aşısı 1963 yılında bulunan kızamık halen az gelişmiş ülkelerde görülmekte olup ölüm oranı yüksektir. Aşı çok yüksek oranda koruyucudur. Geçmişte aşılanma oranları hakkında güvenilir bilgiler mevcut değildir. Çalışmamızda; 1964-1994 Yılları arasında kızamıktan ölüm oranlarının 1980 yılı öncesi ve sonrasındaki değişimleri incelenmiştir. Yöntem: Araştırma verileri, Sağlık Bakanlığı Tarafından 1996 yılında yayınlanan Hastalık İstatistiklerinden alınmıştır. 1980 yılı kesim noktası olarak alınarak iki farklı döneme ilişkin yıllara bağlı kızamıktan ölüm oranlarının karşılaştırması Chow testi ile yapılmıştır. Chow testi 1960 yılında C. Chow tarafından geliştirilen ve farklı dönemlere ilişkin elde edilen regresyon denklemlerinin Hata Kareler Toplamları üzerinde düzeltme yaparak karşılaştırmasında kullanılan bir testtir. Değerlendirme SAS 9.0 paket programında yapılmıştır. Bulgular ve Sonuç: Dönem farkı olmaksızın uygulanan en uygun regresyon analizi olan doğrusal regresyon analizi sonucunda Ölüm oranı = 249,878-0,125*Yıl denklemi elde edilmiş ve R2 değeri 0,364 olarak bulunmuş olup istatistiksel olarak önemli idi ( p=0.0001). 1980 ve öncesi ile 1980 sonrası için yıllara bağlı ölüm oranlarındaki değişimler incelendiğinde ise <=1980 için Ölüm oranı = -54,399+0,030*Yıl R2=0,008 p=0,727, >1980 için Ölüm oranı = 613,201-308*Yıl R2=0,745 p=0,001 değerlleri elde edilmiştir. İki döneme ait elde edilmiş olan regresyon doğrularının Chow testi ile karşılaştırmasında F=4,76 p=0,0169 değerleri bulunmuş ve bu da istatistiksel olarak anlamlı bulunmuştur. Sonuç olarak 1980 yılı sonrası kızamıktan ölüm oranlarında belirgin bir azalma tespit edilmiştir. Anahtar Kelimeler: Chow testi, Kızamık, Ölüm 117 P41 Epileptik Hastalarda Algılanan Sosyal Destek Düzeyleri ve Depresyon Durumlarının İrdelenmesi Demet Ünalan, Ferhan Soyuer, Ali Özdemir Ersoy Özet Giriş ve amaç: Epilepsi nöbet durumu ile bire-bir ilişkili, hastalığın tedavisinde kullanılan ilaçların oluşturabileceği bedensel, ruhsal, fonksiyonel ve sosyal zorlukları beraberinde getiren bir hastalıktır. Bu çalışmanın amacı, epilepsi hastalarının depresyon durumlarını, algılanan sosyal destek düzeylerini ve belirleyici faktörleri irdelemektir. Materyal –metod: Kesitsel tipteki bu araştırma, Kasım 2011-Temmuz 2012 tarihleri arasında Erciyes Üniversitesi Tıp Fakültesi Hastaneleri Nöroloji polikliniğine başvuran 135 epilepsi hastası üzerinde yapılmıştır. Veri toplama aracı olarak, hastaların demografik sosyo-kültürel özellikleri ile klinik bilgilerini içeren bir anket formu ile algılanan Sosyal Destek Ölçeği, Beck depresyon ölçeği uygulanmıştır. Bulgular: Üniversite mezunlarının; arkadaştan, özel bir insandan ve algılanan sosyal destek toplam puan ortancaları diğer eğitim düzeyine sahip olan hastalardan anlamlı düzeyde yüksek bulunmuştur (p<0.05). Serbest meslek çalışanı hastaların aileden algıladıkları sosyal destek puan ortancaları diğer meslek mensuplarına göre anlamlı düzeyde yüksek idi (p<0.05). Nöbet tipi parsiyel olan hastaların arkadaştan, özel bir insandan ve algılanan sosyal destek toplam puan ortancaları diğer nöbet tiplerine göre anlamlı düzeyde yüksek bulunmuştur (p<0.05). Son bir ayda birden az nöbet geçiren hastaların özel bir insandan algıladıkları sosyal destek puan ortancaları, son bir ayda birden fazla nöbet geçirenlere ve nöbet geçirmeyenlere göre anlamlı düzeyde yüksek bulunmuştur (p<0.05). Araba kullanan hastaların; arkadaştan, özel bir insandan ve algılanan sosyal destek toplam puan ortancaları araba kullanmayan hastalara göre anlamlı düzeyde yüksek bulunmuştur (p<0.05). Hastaların geliri ile arkadaştan (rho= 0.286, p=0.044) algılanan sosyal destek puanı, arkadaş sayısı ile aileden (rho= 0.276, p=0.011) ve arkadaştan (rho= 0.243, p=0.025) algılanan sosyal destek puanı arasında pozitif yönde anlamlı ilişki vardı. Hastalık süresi ile özel bir insandan (rho= -0.183, p=0.039) algılanan sosyal destek puanı arasında negatif yönde anlamlı bir ilişki vardır. Hastaların beck depresyon puanı ile arkadaştan (rho= -0.612, p<0.001), özel bir insandan (rho= -0.515, p<0.001) ve algılanan sosyal destek toplam puanı arasında negatif yönde anlamlı düzeyde ilişki vardı (p<0.001). Sonuç: Çalışmamızda epilepsi hastalarında gelir ve arkadaş sayısı ile algılanan sosyal destek puanı arasında pozitif yönde, hastalık süresi ve depresyonla negatif yönde anlamlı ilişki olduğu tespit edilmiştir. Anahtar Kelime: Epilepsi Hastaları, Algılanan Sosyal Destek Düzeyi, Depresyon 118 P42 Optimal Cut Finding for the Hierarchical Clustering Using Background Information Askar Obulkasim1, Gerrit A. Meijer2, Mark A. van de Wiel1 1 VU University Medical Center, Department of Epidemiology and Biostatistics, Amsterdam, Netherlands 2 VU University Medical Center, Department of Pathology, Amsterdam, Netherlands Abstract In hierarchical clustering, clusters are defined as branches of a tree. The constant height branch cut, a commonly used method to identify branches of a cluster tree, may not be ideal for cluster identification in complicated dendrograms. In this work, we introduce a novel method called piecewise-cut which uses main data type and available background information to find an optimal cutting point in the dendrogram. The crux of our main idea as follows: construct hierarchical clustering dendrogram with given molecular data. The resulting dendrogram is likely to express the tendency of samples are formed clusters guided by their molecular signatures. We presumed that besides molecular data, we may have the clinical information of the same patients (e.g. patient’s survival time). Use this clinical data as background information, search through the cluster space which is composed of all possible partitions in the dendrogram obtained from molecular data. Find a partition in which every cluster is composed of patients which are homogenous in terms of their background information. Resulting clusters represents the cluster structure contained in the molecular data and easy to interpret. We applied our approach to many publicly available molecular data for which patients follow up information is also available. Experimental results show that our approach able to find a clustering structure which can not be obtained by commonly used constant height cutting approach. Keywords: Hierarchical Clustering; Molecular Data; Survival Time I. Introduction: Hierarchical clustering is a popular data mining technique for detecting clusters of closely related objects in data; a major application in bioinformatics is clustering of gene expression and DNA copy number profiles. Hierarchical clustering organizes objects into a hierarchical cluster tree (dendrogram) whose branches are the desired clusters. There are two drawbacks in hierarchical clustering method. One is, the most widely used tree cut method is the fixed height branch cut: the user chooses a fixed height on the dendrogram, and each contiguous branch of objects below that height is considered a separate cluster. When detecting gene clusters (also referred to as modules), one typically also requires each cluster to have size at least n, a chosen constant number. The fixed height branch cut is a simple and elegant technique with many desirable properties, but it is not ideal in situations where one expects a complicated dendrogram structure with nested clusters [1]. It should be noted that this is not a fault of hierarchical clustering as such: often the dendrogram exhibits distinct branches corresponding to the desired modules, but no single fixed cut height can identify them correctly. Second is, also common to other unsupervised learning procedures, hierarchical clustering may identify cancer subtypes that are unrelated to patients clinical information (e.g. patient survival time). Although several different subtypes of a given cancer may exist, if the prognosis for all patients is the same regardless of which subtype they have , then the utility of this information is limited. Since hierarchical cluster do not use the available 119 background information tp identify subtypes, there is no guarantee that the subtypes they identify will be correlated with available clinical information. To address this problem, we introduce a method called piecewise cut to find optimal cutting point in the dendrogram using both main data type and available back ground information. It tries to find a partition in which every cluster is composed of samples which are homogenous in terms of their background information. Resulting clusters represents the cluster structure contained in the molecular data and easy to interpret. II. Method: The procedure of our piecewise cut approach as follows: A. Construct a dendrogram using molecular data For given molecular data we construct hierarchical clustering dendrogram using Pearson correlation as a distance measure and Ward’s minimum variance as a linkage measure. The resulting dendrogram is likely to express the tendency of samples are formed clusters guided by their molecular signatures. B. Construct the search space After obtaining the dendrogram, the search space which is composed of all possible partitions in the dendrogram need to be constructed. We extract all possible partitions which fulfill following two constraints. First, the number of observations in each cluster should not be less than predefined threshold(we used 3 in all our experiment). Second, a partition should respect the leaf ordering in the dendrogram. This means in order to two observations to be in the same cluster, they should be close in terms of their leaf ordering produced by hierarchical clustering. C. Partition evaluation We presumed that besides molecular data, we may have the clinical information of the same patients (e.g. patient’s survival time). To select a best partition among large number of potentials, we propose to use this clinical information to qualitatively evaluate generated partitions. We use each partition as a feature and clinical information as response variable to check their association. A non-exhaustive list of criteria can be used are: AIC, BIC, Cross-validated loglikelihood. D. Validation Since we are aiming of analyzing high dimensional molecular data, we think that the use of a measure of test set clusters defined by a classifier made from the training data is the most appropriate to identify reproducible clusters of genes or arrays with similar interest. For this reason, we divide the data two sets, using only one set for from dendrogram construction step till best partition selection step. At the end, use selected best partition to assign cluster labels to testset. We use the Random survival forest (RSF)[2] method to evaluate the meaningfulness of the clustering one testset. The error rate from the RSF model is equal 1 − C where C is Harrell’s concordance index[3]. III. Result: One of the dataset we examined is dataset of acute myeloid leukemia patients[4]. It consist of 6283 genes meas urement on 116 patients and patients follow up information . To estimate more stable results, we conducted 100 bootstrap samplings. In each run, 70% of samples are used for training and 30% for testing. In the training phase, we extract a best partition by straight line cut and piecewise cut respectively. Then, each test sample is assigned a cluster label based on its ward distance to each of the cluster in the best partition found in the training phase. Training set sample’s follow up information and cluster labels are used to contract RSF model and predict the error rare based on the test sample’s cluster labels. 100 bootstrap sampling results are given in below table. In the second column, first number represents the number times piecewise cut produced a partition 120 which has smaller error rate than the one from the straight line cut and vice verse for the number inside the bracket. As we can observe from the Table I, our approach able to produce partitions in which clustered sample are more homogenous than selected partitions from the straight line cut in terms of their background information. Not only counting the number of times the piecewise cut produces a partition with smaller error rate than the straight line cut does, we also checked if the magnitude of the error rate from piecewise cut significantly different from the straight line cut. Since we used bootstrap sampling to generate the error rate, 100 error rates (for each approach) are not independent, as a result commonly used tests (e.g. t test) are not suitable. For this reason, we used permutation test from the R package perm. The last column in the Table I denotes the P values generated from this test. These P values strong enough to prove that the small error rate from the piecewise cut is not occurred by chance. AIC 64(32) 0.001 BIC 65(31) 0.001 Table I: Comparısons Of The Pıecewıse Cut Wıth The Straıght Lıne Usıng Dıfferent Measurements Criteria Piecewise(straight line) P-value IV. Conclusion: In this work, we introduce a novel hierarchical cluster dendrogram cut finding method called piecewise cut which uses given molecular data and available background information to find an optimal cutting point in the dendrogram. Advantages of our approach is two fold. Firstly, the final partition found by our approach represents the clustering structure existed in molecular data and selected from among large number potential partitions by the help of available clinical information. There are some literature showed that clusters generated by using more than one types of data are more stable. Low error rate from testset further shows the extrapolatibility of best partition on new data set. Secondly, even if the error rate of the partition selected by piecewise cut equals the one from straight line cut, our approach is still useful because at least it shows where to cut. Acknowledgment: This study was performed within the framework of CTMM, the Center for Translational Molecular Medicine, DeCoDe (Decrease Colorectal Cancer Death) project (grant 03O-101). References [1] T. Sorlie, M.C. Perou, R. Tibshirani, T. Aas, S. Geisler, H. Johnsenb, T. Hastie, B.M. Eisen, M. van de Rijn, S.S. Jeffrey, T. Thorsen, H. Quist, C.J. Matese, O. P. Brown, D. Botstein, E.P. Lnning and A.-L. BrresenDale (2001) Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications. Proceedings of the National Academy of Sciences., 19(98):10869-10874. [2] H. Ishwaran, U.B. Kogalur, E.H. Blackstone and M.S. lauer (2008) Random survival forest The Annuals of Applied Statistics., 3(2):841-860 . [3] F.E. Harrel, R.M. Califf, D.B. Pryor, k.L. Lee and R.A. Rosati (1982) Evaluating the yield of medical tests. The Journal of the American Medical Association, 18(247):2543-2546. [4] L. Bullinger, K. Dohner, E. Bair, S. Frohling and R. Schlenk (2004) gene expression profiling identifies new subclasses and improves outcome prediction in adult myeloid leukemia. New England Journall of Medicine, 16(350):1605-1616. 121 P43 Quality of Life Among Healty Elderly (65 Years and Older) In Shiraz,Iran Sareh Keshavarzi1, Seyed Mehdi Ahmadi2 1 Shiraz University of Medical Sciences, biostatistics, Shiraz, Iran 2 Health Policy Research Center, Shiraz, Iran Abstract Background: The increasing aged population has recently become a focus of interest in developing countries. Many changes occur as people enter old age, and these changes may at times decrease quality of life. The aims of our study were to evaluate the quality of life (QoL) of elderly people in Shiraz city, the center of Fars province of Iran. Method: A cross-sectional study was conducted in 2010 with 114 randomly selected participants aged 65 to 90. The instrument used was the Persian version of WHOQOL-BREF questionnaire. Inferential statistics were done using SPSS (version16) software. Results: The study consisted of 60 males (42%) and 83 females (58%) with mean ( ± SD) ages of 74.1 ± 6.5 and 75.2 ± 6.9 respectively. The highest scores were observed in the social relationships domain (14.18 ± 2.49) and psychological health domain (13.21 ± 1.99), respectively. However, the lowest scores were found in the environment (12.41 ± 1.46) and physical domain (12.69 ± 2.30), respectively. The means scores of different dimensions of Qol were similar between men and women. Conclusion: The findings suggest that physical, psychological, social and environmental domains of quality of life need to be evaluated among elders. While aging is an unpreventable physiological state, determining and solving the problems of elderly people might improve their quality of life. 122 P44 A Benchmark for Docking of 60 Protein-Ligand Complexes Anton Stoilov1, Radoslav Mavrevski2 1 South-West University, Faculty of Mathematics and Natural Science, Department of Physics, , Blagoevgrad, Bulgaria 2 South-West University, Faculty of Mathematics and Natural Science, Department of Informatics, Blagoevgrad, Bulgaria Abstract Aim: The binding of small molecule ligands to large protein targets is central to numerous biological processes. The accurate prediction of the binding modes between the ligand and protein (the docking problem) is of fundamental importance in modern structure-based drug design. Each docking program makes use of one or more specific search algorithms, which are the methods used to predict the possible conformations of a binary complex. An overview of current docking techniques is presented with a description of applications including a benchmark for docking of 60 protein-ligand complexes. The present benchmark is made from an existing test set (CCDC/Astex Validation Set) from which are selected typical 60 cases. Selected examples were docked with AUTODOCK software within the framework of PyRx and present by conformation with minimal binding energy and their corresponding unbound energy for each obtained ligand-protein complex. Methods: In this paper the benchmark test set is based on CCDC/Astex Validation Set developed by Cambridge Crystallographic Data Centre (CCDC) for docking software GOLD. There are 305 entries and protonation states have been set in all cases. For experiments in this paper was used non modified “protein.mol2” file and “ligand_reference_min. mol2” file like inputs file for PyRx software and AUTODOCK4. From full CCDC / Astex Validation Set was choose 60 cases with witch was made docking procedure with PyRx/AUTODOCK4. For conformational searches, the docking calculations using the “Lamarckian” GA (LGA) procedure with default parameters was performed. Results: After successful docking procedure for each test-case is observed by binding energy, intermol energy, internal energy, torsional energy and unbound energy. The results from experiments will be presented. After the execution of each docking procedure were obtained 10 conformation from witch is chosen most energy-favorable i.e. that have the smallest binding energy. It is summary of these most energy-favorable conformation for each test-case will be presented. Conclusion: An extensive summary of currently available docking methods has been presented. Comparisons suggest that the best algorithm for docking is probably a hybrid of various types of algorithm encompassing novel search and scoring strategies. The most useful docking method will not only perform well, but will be easy to use and parametrise, and sufficiently adaptable such that different functionality may be selected, depending on the number of structures to be docked, the available computational resources, and the complexity of the problem. Keywords: Automated Docking, Binding Energy, Benchmark Anton Stoilov: E-Mail: [email protected] 123 P45 Guideline for the Design and Statistical Analysis of Biological Experiments Mahmoud Hozayn Mahmoud1 1 Statistical Consulting Unit, National Research Centre, Cairo, Egypt Abstract It is important to design scientific experiments well, to analyze the data correctly. An appropriate statistical model properly applied to data allows experimental results to be interpreted accurately and completely. In contrast, inappropriate or incomplete statistical designs can lead to inaccurate, or incomplete, conclusions that may lead to misinterpretation of the results of the study. Furthermore, the materials and methods section should describe the statistical methods used in analyzing the results. This guideline is provided to help scientific research workers perform their experiments efficiently and analyze their results so that they can extract all useful information from the resulting data. Among the topics discussed are the varying of experiments i.e., simple, factorial with two and three factors, split and strip plot experiments. As well as factorial within split plot and split plot within factorial experiments either these experiments designed in completely randomized (CR) and/or completely randomized block designs (CRBD). Also will be discussed the size of the experiment using power and sample size calculations; screening raw data for obvious errors; selecting the suitable transformation methods using SPSS program, assumption and importance of t-test, analysis of variance (ANOVA), simple correlation and regression, multi comparison i.e., LSD, Duncan, Tukey New LSD testes as parametric analysis; and effective design of graphical data. Keywords: Experimental Design; Statistical Analysis, Parametric And Nonparametric Tests Mahmoud Hozayn Mahmoud: E-Mail: [email protected] 124 P46 Normality and Exponentiality Tests Hadi Alizadeh Noughabi1, Naser Reza Arghami1 1 Department of Statistics, Ferdowsi University of Mashhad, Mashhad, Iran Abstract This article studies four different tests of normality and four different tests of exponentiality. The tests in question for normality are Vasicek, Shapiro-Wilk, Kolmogorov-Smirnov, and Anderson-Darling. Tests in question for exponentiality are Kolmogorov-Smirnov, Anderson- Darling, Finkelstein and Schafer, and Ebrahimi et al. test. Each test is described and power comparisons are made by using Monte Carlo computations. The results are discussed and interpreted separately. Keywords: Test of normality, Test of exponentiality, Monte Carlo simulation, Power of test. Hadi Alizadeh Noughabi: E-Mail: [email protected] 125 P47 Testing the Normal Assumption of Data Based on Entropy Hadi Alizadeh Noughabi1, Naser Reza Arghami1 1 Ferdowsi University of Mashhad, Department of Statistics, Mashhad, Iran Abstract To make a statistical inference, several assumptions about the data must be fulfilled. Most statistical methods assume an underlying distribution in the derivation of their results. Normality assumption is indispensable in many statistical procedures, some of which may be quite sensitive to any departure from normality. Therefore, testing normality is one of the most studied goodness-of-fit problems. In this paper we consider the two entropy estimators and the nonparametric distribution function corresponding to these estimators. We use the results to describe goodness of fit test for the normal distribution. The critical values and powers for some alternatives are obtained by simulation. The powers of the tests under various alternatives are compared with the competitors. The use of the tests are shown in real examples. Keywords. Nonparametric Tests, Data Analysis, Normal Distribution, Kullback-Leibler Information 126 P48 On Nonparametric Prediction in Reliability Analysis M. Chahkandi1, J. Ahmadi1 1 Ferdowsi University of Mashhad, Department of Statistics, Faculty of Mathematical Sciences, Iran Abstract Prediction of the future lifetime of a system is very important in the industry and Engineering-Manufactures. In this paper, we construct some nonparametric prediction intervals for the future lifetime of a coherent system. These intervals are determined based on the lifetime of k-out-of-n systems and minimal repair times of the system’s components. The coverage probability of the proposed intervals is expressed based on Samaniego’s signature. We also discuss about the existence and optimality of the intervals. Keywords: Coherent System, Minimal Repair, Non Parametric Prediction, Records, Samaniego’s Signature Majid Chahkandi: E-Mail: [email protected] 127 P49 Identifying Cancer Patterns among Iranian Population using Cluster Analysis Navid Yarali1, 2, Masoud Salehi3, Ali Moeini1, Iman Navidi4 1 Tehran University of Medical Sciences, Mathematics and Statistics Department, School of Health Management and Information Sciences, Tehran, Iran 2 3 Tehran University of Medical Sciences, Scientific Research Center, Tehran, Iran Tehran University of Medical Sciences, Mathematics and Statistics Department, School of Health Management and Information Sciences, Tehran, Iran 4 Tehran University of Medical Sciences, Department of Epidemiology and Biostatistics, Tehran, Iran Abstract Aim: To investigate underlying pattern of cancers and grouping related cancers among Iranian population. Methods: ASR (Age Standardized Rate in 100,000) of 24 types of cancers among 30 provinces of Iran during March 2008 to March 2009 which were recorded on the cancer registry center of each province, were used in this study. Data were entered into Minitab 16 software and analyzed using correlation variable clustering methods. Results: The most prevalent cancer for men was skin cancer with ASR=22.62 and for women, breast cancer with ASR=33.21. Semnan, a central province of Iran, had the highest ASR (396) and Sistan, in southeastern of Iran, had the lowest ASR (69). For men, Liver and pancreas cancers had the highest rate of similarity with 95.23%. Considering clusters with similarity above 90%, colon and prostate cancers cluster as well as liver and pancreas cancers cluster were the only clusters which had at least two cancers on it. However, bladder cancer with 89.07% of similarity was connected to the colon-prostate cluster. Also, lung cancer was connected to the liver-pancreas cluster with 88.01% of similarity. Other cancers were connected to each other with at most 85% of similarity. Similarly, for women, by assuming 90% as a cut-off point for similarity of clusters, one cluster for lung, brain, liver, and pancreas cancers, one cluster for breast, corpus uteri, and ovary cancers as well as one cluster for each of other cancers obtained. It is noteworthy to say that like men, lung cancer was connected to the liver-pancreas-brain cluster with 88.51% of similarity; also, ovary cancer had 88.71% of similarity with the breast-corpus uteri cancers cluster, which is suggested to be considered as a whole cluster. Conclusions: Clustering cancers, gives the degree of similarity for related cancers. In this study we found that for both men and women of Iranian population liver, lung, and pancreas cancers were similar to each other. In addition, bladder, prostate and colon cancers can be considered as a similar group for men and breast, ovary, and corpus uteri cancers for women. Therefore, it is suggested to have same centers for the cancers in same clusters in the related provinces. Keywords: Cancer, Cluster Analysis, Iranian Population 128 P50 Generating Rules to Increase Production Using Decision Tree in Car Industry M. Davoodi1,4, M. Hoseinzadeh2,4 , H. Gholami Mazinan3,4 1 2 IUST, Industrial Engineering department, , Iran Tarbiat Modares University, Industrial Engineering department, Iran 3 IUST, School of Railway Engineering, Iran 4 SAIPA KASHAN Abstract In today’s world, production development considering current limitations is a crucial subject which was investigated deeply with various methods such as heuristic approach, data mining, production plan optimization and etc. In this paper, most efficient factors of production were identified. We use data mining because Data size was large. Decision Tree as the most popular data mining technique was used for analysis. We use CART,CHAID and QUEST techniques. Because these techniques have different Specifications. Also the rules for predicting the production process were extracted. The results were evaluated by using statistic techniques such as DOE and Regression. Keyword: CHAID, QUEST,CART, DOE, Regression M. Davoodi: +983614911666, E-Mail: [email protected] 129 P51 Statistical Modeling of Aggregation of Glutamate Dehydrogenize Enzyme in Different Temperatures H. Esmaily1, M. Hadi Alijanvand2, H. Doosti3, M.T. Shakeri4 1 Mashhad University of Medical Sciences, Health Science Research Center, School of Health, Mashhad, Iran 2 Shahrekord University of Medical Science, Biostatistics Department, School of Health, , Shahrekord, Iran 3 4 Statistics Department, Kharazmi University,Karaj, Iran Mashhad University of Medical Sciences, Community Medicine Dept., Medical School, Mashhad, Iran Abstract Introduction: The aggregation of glutamate dehydrogenize enzyme plays an important role in metabolism, liver function and has pharmaceutical, biotechnological and medical applications. In this study, the enzyme aggregation kinetic was statistically modeled and the assembly mechanism was conjectured by estimating the appropriate parameters of nonlinear regression at various temperatures combined with the enzyme kinetic method. Method: Nonlinear regression model was considered is nonlinear logistic function with three parameters which parameter estimation is Gauss Newton method. Evaluation of the model, i.e. the mean structure, homogeneity of variance, normal distribution, independence of fitted nonlinear model for the aggregation of glutamate dehydrogenize enzyme data from Institute of Biochemistry and Biophysics, Tehran University (IBB) were studied. Also remedies of violation from the assumptions of model such as the use of sandwich estimator, the nonlinear regression with correlation of residuals, grouped nonlinear regression in repeated experiments were considered. Finally, the sandwich estimator was applied in kinetic interpretation and nonlinear regression model according to the grouping in repeated experiments and structure of correlation was proposed for optimization of statistical model. Results: Three parameters of Nonlinear logistic function in sandwich estimator for interpreting kinetic in various temperatures was significant (p<0.001). Estimation of parameters in the optimal statistical model was significant (p<0.001) by grouped nonlinear regression in repeated experiments. This model regarding to structure of correlation in all temperatures except 57.50C and 600C with the little correlation 0.2 and 0.4, was more appropriate with less akaike than grouped nonlinear regression in repeated experiments. Variation of released energy due to protein aggregation with the fitted values of statistical model would demonstrate the melting temperatures (Tm) of this enzyme 52.50C. Conclusion: Based on statistical modeling, variations trend of sandwich estimations in nonlinear regression and interpretations of kinetic, enzyme likely follows polymerization mechanism of dependent on creating nucleus. We proceeded to identify and control the process of enzyme aggregation with a prediction of Tm. Keywords: Glutamate Dehydrogenize: Protein Aggregation: Nonlinear Regression: Kinetics 130 P52 Age at Menopause Among Rural Women of Marrakech (Morocco) R. Lotfi1, M. Loukid1, M.K. Hilali1 1 University of Cadi Ayyad, Faculty of Science Semlalia, Laboratory of Human Ecology, Marrakech, Morocco Abstract Menopause is diagnosed after 12 months of amenorrhea resulting from the permanent cessation of ovarian function. The timing of natural menopause may serve as a marker for the process of reproductive ageing, The enquiry is based on a cross sectional and retrospective method. The present study is based on a cross sectional survey in the rural area of Marrakech city in Morocco. The different information has been collected from about 600 women among rural area, in the aim to approach the process of the reproductive ageing of the Moroccan women and the transition to the menopause with respect to the socioeconomic and cultural environment and to estimate age at natural menopause and the ways in which this characteristic could be predicted from variables related to the residential status. The average age at natural menopause was 49.78 ±4.29 years of rural women, while among urban females it was 47, 10 +5.53 years .Results show a confirmed rural-urban difference in menopausal age related to some sociodemographic and reproductive variables. Keywords: Age at Menopause, Rural-Urban, Marrakech (Morocco) 131 P53 Veri Madenciliği Kullanılarak Diyabet Verilerinin Analizi Mete Çelik1, Cevat Yazıcı2, Mustafa Yiğitoğlu3, Murat Yenisu4, Fatih Tanrıverdi5 1 Erciyes Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Kayseri 2 3 Erciyes Üniversitesi, Tıp Fakültesi, Biyokimya Anabilim Dalı, Kayseri Erciyes Üniversitesi, Mühendislik Fakültesi, Elk-Elektronik Mühendisliği Bölümü, Kayseri 4 Erciyes Üniversitesi, Gevher Nesibe Hastanesi, Bilgi İşlem Sorumlusu, Kayseri 5 Erciyes Üniversitesi, Tıp Fakültesi, İç Hastalıkları Anabilim Dalı, Kayseri Özet Amaç: Diyabetes Mellitus (DM), tüm yaş gruplarında görülebilen, komplikasyonlarla seyreden, iyi kontrol/tedavi edilmediğinde kalp, damar, göz, böbrek ve sinir dokusu gibi multiorgan patolojilerine neden olabilen, tedavi maliyetinin çok yüksek olduğu bir sağlık sorunudur. Günümüzde dünyada 290 milyondan fazla insanı etkileyen DM’un 2025 yılında 380 milyon kişiyi etkilemesi beklenmektedir. Bu nedenle DM’un etkin bir şekilde tanı ve tedavisinin yapılması ve komplikasyonlarının önlenmesi, tüm dünya ülkelerinin sağlık politikalarında özel bir önem taşımaktadır. DM ile ilgili yeni bilgilerin çıkarımında veri analizi yöntemi oldukça yeni ve önemli bir metottur. Daha önce de DM verilerinin analizi için birçok teknik kullanılmıştır. Ancak, bu çalışmalar genellikle küçük-ölçekli veriler üzerinde yapılmış, basit analizlerle sınırlı kalmış ve dolayısı ile ilginç ve manalı kuralların çıkarımında yetersiz kalmışlardır. Bu çalışmada, diyabet hastalarına ait verilerinin veri madenciliği yöntemleri kullanılarak analiz edilmesiyle daha önceden bilinmeyen ve potansiyel olarak faydalı olabilecek gizli ve ilginç yeni bilgilerin keşfinin sağlaması amaçlanmıştır. Yöntem: Bu çalışmada 2005-2011 yılları arasında Erciyes Üniversitesi Gevher Nesibe Hastanesi’ne tanı ve tedavi için başvurmuş ve hastane veritabanında International Classification of Diseases (ICD-10) kodlama sistemine göre; DM ve onunla ilişkili kod almış hastaları içeren veritabanı kullanılmıştır. Bilgi girişlerinde eksiklik bulunan hastalardan temizlenen veriler (3212 kayıt); hastalara ait cinsiyet, HbA1C, glukoz, LDL kolesterol (LDL-K), HDL kolesterol (HDL-K) ve trigliserit parametreleri kullanılarak ICD-10 değerlerine göre sınıflandırılmıştır. Referans aralıklarına göre ayrıklaştırılan verilerin sınıflandırma için WEKA yazılımının C4.5 karar ağacı algoritması kullanılmıştır. Bulgular: Çalışma sonucunda diyabet veritabanında HDL-K parametresinin diğer parametrelere göre daha ayırıcı olduğu gözlemlenmiştir. Karar ağacının ilk adımında HDL-K kayıtların 1/6’ sını; arta kalan verilerin sınıflandırılması için diğer parametrelerin kombinasyonlarına ihtiyaç duyulduğu gözlemlenmiştir. Diğer bir ifade ile HDL-K ile veritabanında bulunan hastaların yaklaşık %27’si sınıflandırılabilmiştir. Ayrıca HDL-K değerleri referans aralıkta bulunan hastaların, DM komplikasyonu göstermeme eğiliminde olduğu tespit edilmiştir. Sınıflandırılma sonucunda elde edilen karar ağacı aşağıda verilmiştir. 132 Kolesterol HDL k düşü normal E10.9 Trigliserit yük sek l norma Kolesterol LDL E10.9 E10.9 E10.9 Glukoz yü ks Cinsiyet E10.9 E10.2 E10.9 Kolesterol LDL l ma nor E10.2 E10.9 E10.2 Glukoz E10.2 E10.9 E10.9 E10 E10.2 yük sek sek yük E10.9 E10.9 K E al rm al E10.2 E10.9 no rm no E10.9 Cinsiyet ek Glukoz Trigliserit al düşü rm k no düşük al rm no l ma yük sek nor yüksek Glukoz no rm al E10.9 E10.9 E10.2 E10 İnsülin-bağımlı diyabetes mellitus E10.9 İnsülin bağımlı diyabetes mellitus, komplikasyonları olmayan E10.2 İnsülin bağımlı diyabetes mellitus, böbrek komplikasyonuyla birlikte Sonuç: Hastane veritabanlarında yıllar içinde biriken DM hastalarına ait rutin laboratuar verilerinin; veri madenciliği yöntemleri ile analizi, hastalarda komplikasyon gelişebilme riskini belirleme de kullanılabilecek yardımcı araçlardan bir tanesi olabilir. Ayrıca daha önceden bilinmeyen ve potansiyel olarak faydalı olabilecek gizli ve ilginç kuralların belirlenmesi için de kullanılabilecektir. Anahtar Kelimeler: Diyabetes Mellitus, Diyabet, Veri Madenciliği, Sınıflandırma, Kara Ağaçları, C4.5 133 P54 İntrauterin İnseminasyon (IUI)’da Ovariyan Rezerv Belirteçlerinin Karşılaştırılması Gökalp Öner1 1 Boğazlıyan Devlet Hastanesi, Kadın Hastalıkları ve Doğum Anabilim Dalı, Yozgat Özet Amaç: Over rezervi, overlerde follikulogenez ve steroidogenez fonksiyonunu yerine getirecek folliküllerin sayı ve kalitesini, yeterliliğini tanımlamaktadır. Kadının yaşı arttıkça over rezervi primordiyal folliküllerin apoptotik kaybına bağlı olarak azalır. İntrauterin inseminasyon (IUI) takiben devam eden gebelik öngörüsü over rezervini gösteren belirteçler sayesinde hesaplanabilir. Over rezervinin yaygın olarak kullanılan belirteçleri yaş, bazal follikül stimule edici hormon (FSH), östradiol (E2), Antral Follikül Sayısı (AFS) ve over hacmidir. Yöntem: Bu çalışmaya 2009-2011 yılları arasında Erciyes Üniversitesi Kadın Doğum Polikliniğine başvuran 70 infertil hasta dahil olmuştur. Hastalara iki defa klomifen sitrat ile stimulasyon yapıldı ve her iki overde bir adet 18 mm üzeri folikül görüldüğünde hCG yapılıp 36 saat sonra IUI planlandı. Hastalara rutin olarak yapılan over rezerv belirteçlerinin seviyelerinin prospektif olarak karşılaştırılmıştır. Bu karşılaştırılmalar Spearman korelasyon testi ile yapıldı. Doğrusal regresyon analizi ile gebelik sonuçları ovariyan belirteçler karşılaştırıldı. Ayrıca gebelik sonuçlarına göre belirteçlere ROC analizi yapıldı. Ayrıca gebe olan ve olmayan gruplar arasında normalite testini takiben belirteçler t-test ve Mann Whitney U testi ile karşılaştırıldı. Tüm istatistik analizlerinde P < 0.05 anlamlı olarak kabul edildi. Bulgular: Erkek faktörün reddedildiği hastalardan oluşan 70 hastanın 9’unda 2 IUI sonunda gebelik elde edilirken 61’inde gebelik elde edilmedi (% 12.8). Erken foliküler faz FSH yaş ile pozitif korelasyon gösterirken (rho=0.273, p<0.03), AFC ve over hacmi ile negatif korelasyon gösterdi. AFS, over hacmi ile pozitif (rho =0.377, p<0.002), yaş ve FSH (rho =-0.276, p< 0.03) ile negatif korelasyon göstermiştir. Bu testler kıyaslandığında gebelik oranı ile en anlamlı test AFS olarak bulunmuştur [1.124 (95%CI 1.012-1.248), p=0.028]. ROC analizine göre gebelik elde etme şansı 35 yaş altı (% 93 sensitivite), over volumü 4.23 üzeri (% 91.5 sensitivite), AFS 12 üzeri (% 85 sensitivite) ve FSH 7 altı ( % 73 sensitivite) artmaktadır. Gebe olan ve olmayan gruplar karşılaştırıldığında yaş, AFS ve over volümü değerlerinde istatistiksel olarak fark gözlemlenmiştir (p<0.05). Sonuç: IUI öncesi yapılan over rezervi testlerinden gebelik başarısını göstermede en faydalı belirteç AFS’dır. 134 P55 Birinci Basamak Sağlık Kuruluşlarına Başvuranların Riskli Davranışları ve Etkileyen Faktörlerin Çok Değişkenli Analizi Mahmut KILIÇ1 1 Bozok Üniversitesi, Sağlık Yüksekokulu, Hemşirelik Bölümü, Yozgat Özet Amaç: Tüm dünyada bulaşıcı olmayan hastalıklar (NCDs) için 4 majör davranışsal risk faktörü; tütün kullanma, yetersiz fiziksel aktivite, fazla alkol alma ve sağlıksız diyettir. Araştırmanın amacı, il merkezindeki birinci basamak sağlık kuruluşlarına başvuranların NCDs için majör riskli davranışları ve etkileyen faktörleri saptamaktır. Yöntem: Bu bir kesitsel araştırmadır. Araştırma, Yozgat il merkezindeki birinci basamak sağlık kuruluşlarına başvuran 18 yaş ve üzeri 1085 yetişkin arasında yapıldı. Veriler, görüşmeci aracılığıyla anket uygulanarak toplandı. Verilerin çok değişkenli analizinde binary lojistik regresyon kullanıldı. Çoklu analize bağımsız değişken olarak, yaş, cinsiyet, medeni durum, eğitim durumu, çalışma durumu, ekonomik durum, yaşamından memnun olma ve tanısı konmuş hastalık/ sağlık sorunu varlığı alındı. Bulgular: Birinci basamak sağlık kuruluşlarına başvuranlarda en çok görülen riskli davranışlar, yetersiz sebzemeyve tüketme, yetersiz egzersiz yapma, yemeklerde yağı ve tuzu kısıtlamama, yüksek BKİ’ye sahip olma iken (sırayla %90.9, 75.3, 71.1, 68.3 65.7), en az görülenler ise sigara içme (%28.2) ve haftada bir veya daha sık alkol alma (%1.3) davranışıdır. Sigara içme olasılığı, erkeklerde, öğrenim durumu ilköğretim ve üzeri olanlarda okul bitirmemişlere göre, herhangi bir işte çalışanlarda, yaşamından memnun olmayan/ nötr olanlarda, tanısı konmuş hastalık/ sağlık sorunu olmayanlarda, evlilerde, yaşı küçük olanlarda; yetersiz egzersiz yapma olasılığı, kadınlarda, eşi ölmüş/ eşinden ayrılmış olanlarda, yaşamından memnun olmayan/ nötr olanlarda, yaşı küçük olanlarda; yetersiz sebzemeyve tüketme olasılığı, yalnız yaşı küçük olanlarda; yemeklerde yağ ve tuz kısıtlamama olasılığı, hastalık/ sağlık sorunu olmayanlarda, yaşı küçük olanlarda daha yüksektir. Yüksek BKİ’ye sahip olma olasılığı, evlilerde, ≤ilkokul mezunu olanlarda, ekonomik durumu orta ve yüksek olanlarda, tanısı konmuş hastalık/ sağlık sorunu olanlarda, yaşı büyük olanlarda daha yüksektir. Araştırmaya katılanların %31.6’sı ≤3 riskli davranışa, %36.3’ü ise ≥5 riskli davranışa sahiptir. Sonuç: İl merkezindeki birinci basamak sağlık kuruluşlarına başvuranların 2/3’ünün (sigara ve alkol kullanımı hariç) riskli davranışı bulunmaktadır. Yaş küçüldükçe riskli davranışların (Yüksek BKİ hariç) görülme olasılığı atmaktadır. Sağlık kuruluşlarına başvuran yetişkinlerin yaşam tarzının sorgulanması ve riskli davranışlarla ilgili danışmanlık verilmesi önerilmektedir. Anahtar kelimeler: Riskli Davranış; Kronik hastalık; Prevalans; Birincil bakım 135 P56 Childhood Eczema and Asthma: A Multilevel 1958 Birth Cohort Study from Childhood to Adult Ghada Abo-Zaid and Nick Osborne Introduction Asthma is a disorder of the lungs that causes inflammation on the airways. Asthma has a high prevalence in the UK and places a significant burden on public health purse and the NHS. 5.4 million people in the UK are currently receiving treatment for asthma: 1.1 million children (1 in 11) and 4.3 million adults (1 in 12). Eczema is an inflammation of the epidermis (the outer layer of the skin). In England, an estimated 1.7 million have been diagnosed with eczema in their childhood or it is about 1 in 8 school children in the UK. The prevalence of eczema has been increased in recent decades. A few numbers of studies have been shown an association between childhood atopic eczema and asthma either by using cross section data or longitudinal data. However, the association between childhood eczema with childhood and adult asthma is still controversial. Aims In this talk we aim to examine whether the first year childhood eczema does effect on childhood and adult asthma before and after controlling by sex, smoking status, socio- economic status, breast feeding, birth order and mother weight on stone. Methods and Material The National Child Development Study (NCDS) or 1958 birth cohort study is a longitudinal cohort study began at the first week birth in 1958 for over 17 000 births. This longitudinal study has been undertaken to investigate many aspects of health, education, and social development of the cohort member. It was retraced again at age 7 (1963) by designing a survey to collect a data for their educational, physical and social development, and it is followed by another surveys at age 11 (1969) and 16 (1974). At this stage it is mainly depended on parent’s questionnaires. In the adult life, the cohort study has been followed up? again by focusing on interview cohort member (instead from parent’s questionnaire) began at age 23 (1981), and followed by age 33 (1991), 42 (2000), and 50 (2008) respectively. The focus in this talk is to fit multilevel logistic regression models to examine the effect of the first year childhood eczema on the childhood (age 11 and 16), and adults asthma (age 21 and 33) before and after controlled by sex, smoking status, breast feeding, socio-economic status, birth order, and mother weight on stone. Results and conclusions Eight multilevel logistic regression models have been fitted to examine the effect of eczema on asthma before and after adjusted by other variables (e.g. sex, smoke status, breast feeding) for childhood and adult. In childhood, we found that there is an association between eczema and asthma (OR= 3.73; CI: 3.26- 4.27); and the probability of the risk is barely increased after adjusted by sex, breast feeding, birth order , while it is slightly increase when adjusted by the number of cigarettes per week (OR=4.14; CI: 3.51- 4.86). 136 P57 Gen Ekspresyon Verilerinde Yapay Sinir Ağlarına Dayalı Yeni Bir Denetimli Temel Bileşenler Analizi’nin Geliştirilmesi Prof. Dr. Mevlüt Türe, Doç. Dr. İmran Kurt Ömürlü Adnan Menderes Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, Aydın Özet Gelişen teknolojiyle birlikte veri toplama ve veri saklama olanaklarındaki artışlar, çok boyutluluk problemini de beraberinde getirmiştir. Özellikle değişken sayısının birim sayısından fazla olduğu çok boyutlu verileri klasik istatistiksel yöntemlerle analiz etmek güçtür. Çok boyutlu problemlerin incelenmesi günümüzde istatistiksel araştırmaların ilgi odağı haline gelmiştir. Gen verilerinde DNA mikrodizinleri, messenger RNA (mRNA) seviyelerinin eş zamanlı olarak ölçülmesini olanaklı hale getiren yüksek işlem kapasiteli teknolojilerdir. Gen, hücrenin fonksiyonlarını gerçekleştiren proteinleri kodlayan bir DNA dizisinin parçasıdır. Bireyler arasında farklı doku ve hastalık durumlarında, protein üretiminde bir ara ürün olan mRNA’nın miktarı farklı olacağı için, aynı gen farklı ekspresyon düzeylerine sahip olacaktır. Bu nedenle gen ekspresyon verileri oldukça yüksek boyutlu bir veri yapısına sahiptir. İstatistiksel yöntemlerin teorik yapısından kaynaklanan sorunlar nedeniyle (birim sayısı değişken sayısından az olduğu için klasik yaklaşımlar doğrudan uygulanamamaktadır) bu tip çok boyutlu verilerin bir arada incelenmesi yerine, boyut indirgemesi yapılarak analiz edilmeleri gerekmektedir. Gen ekspresyon verisinin çok boyutluluk probleminin çözümü ve gen verilerinin yaşam süresi üzerindeki etkisini belirlemek için klasik TBA yerine Bair ve Tibshirani (2004) tarafından geliştirilen denetimli temel bileşenler analizi (D-TBA) tercih edilmektedir. D-TBA’da genler arasındaki ilişkilerin doğrusal olduğu varsayılmaktadır. Kramer (1991)’in önerdiği yapay sinir ağlarına dayalı temel bileşenler analizi (YSA-TBA) klasik TBA’nın esnek bir genelleştirmesidir. Bu çalışmada çok boyutlu gen verilerinde denetimli-YSA-TBA yaklaşımının geliştirilmesi ve D-TBA ile karşılaştırılması amaçlanmıştır. Bu amaçla bir simülasyon programı geliştirilmiş ve R dilinde kodlar yazılarak ön denemeler yapılmıştır. Ön denemeler sonucunda (50 deneme) D-TBA ile denetimli-YSA-TBA arasında anlamlı bir fark bulunmamıştır (p>0.05). Söz konusu çalışma devam etmekte ve alternatif yaklaşımlar denenmektedir. Anahtar Kelimeler: Gen Ekspresyon; Denetimli Temel Bileşenler Analizi; Yapay Sinir Ağları; Simülasyon 137 P58 Altın Standart Testin Varlığında Çoklu Tanı Testlerinde Birleştirme Yöntemleri Gülhan OREKİCİ TEMEL1, Semra ERDOĞAN1 Mersin Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD, MERSİN ÖZET Amaç: Klinikte, belirli bir hastalığın tanısının konulmasında referans teste alternatif olarak iki veya daha fazla yeni testler bir arada kullanılarak karar verilebilir. Bu testlere çoklu tanı testleri denir. Çoklu tanı testleri, paralel ve seri testler olmak üzere iki basit yöntemle uygulanmaktadır 1. Bu çalışma ile çoklu tanı testlerinin birleştirilmesi sonucunda kullanılan yöntemlerin diagnostik performansının klinik uygulamalar ile anlatılması amaçlanmıştır. Yöntem: Paralel testler, belirli bir hastalığın tanısının konulmasında, iki ve daha fazla tanı testinin aynı zamanda uygulanması ve yorumlanması şeklinde tanımlanmaktadır. Seri testler ise, paralel testlere alternatif olarak geliştirilmiş olup, ikinci testin uygulanıp uygulanmayacağı birinci testin sonucuna bağlı olarak belirlendiği testlerdir. İkinci testin uygulanmasının pahalı ya da riskli olduğu durumlarda tercih edilmekte olup bazen tek bir test sonucunda bile doğrudan karara varılabilmektedir ve böylece de maliyet düşmektedir. Bu durum bu testin avantajı olarak görülebilmekte iken ikinci testin sonucunun birinci teste bağlı olması da dezavantajı olarak kabul edilmektedir 1-4 .Tanı testlerinin birleştirme işleminden sonra, bireyin hasta ya da sağlıklı olup olmadığına karar vermede kullanılan diagnostik istatistiklerin hesaplanması, kullanılan teste ve birleştirme yöntemine göre değişmektedir. Literatürde paralel ve seri testlerin birleştirilmesi, AND ve OR kuralına göre farklı şekillerde hesaplanmakta ve yorumlanmaktadır. Bulgular: AND kuralı ile birleştirme yapılarak karar verme durumunda, birleştirilmiş testlerin duyarlılık değeri her bir test sonucunda elde edilen duyarlılık değerinden daha düşük, fakat diğer yandan birleştirilmiş testlerin seçicilik değeri her bir test sonucunda elde edilen seçicilik değerinden daha yüksek olmaktadır 3-4. Seçicilik değeri daha yüksek olduğu için sağlıklı olan bireyler beklenenden daha az kaçırılacaktır. Fakat yanlış negatif test teşhisi (NPV) beklenenden fazla olacaktır 4-5 .OR kuralı ile birleştirme yapılarak karar verme durumunda, birleştirilmiş testlerin duyarlılık değeri her bir test sonucunda elde edilen duyarlılık değerinden daha yüksek, fakat diğer yandan birleştirilmiş testlerin seçicilik değeri her bir test sonucunda elde edilen seçicilik değerinden daha düşük olmaktadır 3-4 . Duyarlılık değeri daha yüksek olduğu için hasta olan bireyler beklenenden daha az kaçırılacaktır. Fakat yanlış pozitif test teşhisi beklenenden fazla olacaktır 5. Sonuç: Belirli bir hastalığın test edilmesinde, tek bir tanı testine göre karar vermek yerine birden fazla tanı testinin birleştirilmesi sonucunda karar vermekle yanlış pozitif sonuçların oluşması engellenebilir 4. Anahtar Kelimeler: Çoklu Testler, AND Kuralı, OR Kuralı SEÇİLMİŞ KAYNAKLAR 1. Fletcher RW, Fletcher SW, editors. Clinical Epidemiology the Essentials. Philadelphia: Lippincott Williams&Wilkins; 2005. 138 2. Hershey JC, Cebul RD, Williams SV. Clinical guidelines for using two dichotomous tests. Med Decis Making 1986;6: 68-78. 3. Weinstein S, Obuchowski NA, Lieber ML. Fundamentals of Clinical Research for Radiologists. AJR 2005; 184: 14-19. 4. Vitzthum F, Behrens F, Anderson NL, Shaw JH. Proteomics: From Basic research to Diagnostic Application. A Review of Requrements & Needs. J Proteome Res 2005; 4: 1086-97. 5. Zhou X, Obuchowski N, McClish D, editors. Statistical Methods in Diagnostic Medicine. New York: John Wiley&Sons Inc; 2002. 139