Araştırmalarda Đki Aşamalı Kümeleme (Two-Step Clustering

Transkript

Araştırmalarda Đki Aşamalı Kümeleme (Two-Step Clustering
Eurasian Journal of Educational Research, 28, pp, 89-99 / 2007
Araştırmalarda Đki Aşamalı Kümeleme
(Two-Step Clustering) Analizi ve Bir Uygulaması
Murat KAYRĐ
Öz
Problem Durumu: Heterojen olan bir veri setinin elde edeceği tanımlayıcı istatistik ve parametre tahminleme denklem değerlerinin sapmalı olacağı bildirilmektedir. Heterojen
olan veri setinin homojen olan alt sınıf ya da kümelere bölünmesinden sonra elde edilen
istatistiksel çalışmaların daha sağlıklı sonuçlara sahip olduğu literatürde bildirilmektedir. Eğitim bilimleri araştırmaları için veri setindeki birey ya da değişkenlerin çok olması durumunda iki aşamalı kümeleme analizinin uygulanabilirliği çalışmanın temel
problemini oluşturmaktadır.
Araştırmanın amacı: Bu çalışmada, genel amacı gruplanmamış verileri benzerliklerine
göre kümelemek olan iki aşamalı kümeleme analizi ele alınmıştır. Küme sayısı hususunda bir ön bilginin olmadığı durumlarda kullanılabilen iki aşamalı kümeleme analizinin avantaj ve dezavantajları irdelenmiştir. Özellikle gizli sınıf (latent class) ve küme
analiz (cluster analysis) ileri istatistik tekniklerinin log-olabilirlik (log-likelihood) uzayında verileri nasıl grupladığı ve yine aynı uzay içerisinde kullanmış olduğu Bayesçi
bilgi ve Akaike bilgi ölçütlerinin (BIC, AIC) nasıl bir fonksiyon üstlendikleri açıklanmaya çalışılmıştır. Araştırmanın Yöntemi: Örneklem olarak Doğu Anadolu bölgesindeki büyük bir üniversitede okuyan 608 öğrenciye ait bir veri seti incelenmiştir. Bu veri setine
ait 7 adet değişken kullanılmıştır. Bu verilerden üç tanesi sürekli değişken (öss puanı,
mekik skoru, oöbp), geriye kalan dört değişken ise kategorik özellik arz etmektedir (baba mesleği, lise mezuniyet kolu, bölge ve cinsiyet) . Bu 7 değişken merkezli 608 birey
kümelenmiştir. 608 bireyden oluşan veri setine iki aşamalı kümeleme yöntemi kullanılmıştır.
Bulgular ve Sonuçlar: Bu çalışmanın sonucunda, log-olabilirlik temelli Bayesçi bilgi kriteri (BIC)doğrultusunda 608 birey ortak özellikleri bakımından (7 değişken merkezinde)
7 kümeye anlamlı bir şekilde bölünmüştür. Đki aşamalı kümeleme analizinin sürekli ve
kategorik verileri bir arada kümeleyebildiği gözlemlenmiştir. Yine bu çalışmada iki aşamalı kümeleme analizinin sürekli ve kategorik değişkenleri kümelemede bazen yetersiz kaldığı bulgusuna rastlanmıştır. Bununla birlikte sürekli değişkenleri ideal düzeyde
kümeleyebildiği kabul edilmiştir.
Öneriler: Eğitim bilimcilerin karışık (sophisticated) istatistik içerikli araştırmalarında bu
tür ileri düzey istatistikleri bilinçli bir şekilde kullanmaları önerilmektedir. Bu çalışma
ile iki aşamalı küme analiz tekniğinin bilimsel çalışmalara farklı bir ışık tutacağı düşünülmektedir.
Sınırlılıkları ile birlikte iki aşamalı kümeleme analizinin homojen olmayan büyük veri
setlerine uygulanabilirliği kanısına varılmıştır.
Anahtar Sözcükler: Küme analizi, iki aşamalı kümeleme analizi, Bayesçi bilgi ölçütü,
eğitim bilimleri
89

Benzer belgeler

P9-Kümeleme Analizi - Başkent Üniversitesi Tıp Fakültesi

P9-Kümeleme Analizi - Başkent Üniversitesi Tıp Fakültesi içinde bulunan gözlemlerden ortalama uzaklığını esas alır. Hiyerarşik kümeleme tekniklerinde kümeler art arda birleştirilir ve bir grup diğeri ile bir kez birleştirildikten sonra, devam eden adımla...

Detaylı