ölçme ve değerlendirme - Kpssegitimmerkezi.com

Transkript

ölçme ve değerlendirme - Kpssegitimmerkezi.com
2010–2011 EĞĠTĠM ÖĞRETĠM YILI
KPSS DERS NOTLARI
ÖLÇME VE DEĞERLENDĠRME
Bir dersin öğretiminde öğrencilerin belirlenen programın hedeflerine ulaĢıp ulaĢmadıkları
ölçme ve değerlendirme ile ortaya çıkarılır.
ÖLÇME:
Belli bir nesnenin belli bir özelliğe sahip olup olmadığının; sahipse sahip oluĢ
derecesinin gözlenip, gözlem sonuçlarının sayı ve sembollerle ifade edilmesidir. Ölçme bir
betimleme iĢidir.
Örnekler:
* Öğrenci ödevlerine puan vermek.
* Odanın sıcaklığı 22 °C‘dir
* Bizim kursun öğrencilerinin %80‘nini kız öğrenciler oluĢturmaktadır.
* Bu takım elbisenin fiyatı 250 YTL‘dir,
* Beden eğitimi dersinde öğrencileri boy sırasına göre sıralamak,
* Öğrenci ödevlerine puan vermek,
* Bayramda hava sıcaklığı 21 derece olacak.
* Seminer salonu ağzına kadar doluydu.
* Seher‘in saçlarının rengi sarıdır.
* Park yerinde 30 araba var.
Tanımda da belirtildiği üzere ölçmenin üç temel özelliği vardır:
1) Ölçülecek bir niteliğin olması,
2) Niteliğin gözlenebilmesi,
3) Amaca uygun sayı ve sembollerle gösterilmesi,
NESNELERĠN
1
VARLIKLARIN
SAYI YA DA SEMBOLLERLE
ĠFADE
GÖZLEM
OLAYLARIN
= ÖLÇME
Özellikleri
Görüldüğü üzere ölçme iĢleminde ölçülmek isten niteliğin ne olduğu belirlenir ve bu
niteliğin hangi sayı ve sembollerle ifade edileceği kararlaĢtırılır.
NOT: Ölçme iĢinde ölçme konusu olan Ģey bir özelliktir. Özelliğe sahip olup olmama sahip oluĢ
derecesi nesneden nesneye, durumdan duruma, aynı nesne içinde zamandan zamana ya da yerden
yere değiĢebilir. Cinsiyet, medeni durum, ağırlık kiĢiden kiĢiye: sıcaklık zamandan zamana ya da
yerden yere değiĢebilir. Belli bir özelliğe sahip olmama veya sahip olma derecesi bakımından
bireyler arasında farklılıklar vardır. ĠĢte bu farklılıklar ölçme için temeldir. Eğer bütün insanlar
aynı uzunlukta olsaydı ya da sıcaklık her zaman ve her yerde aynı olsaydı bu değerlerin ölçülmesi
diye bir durum söz konusu olmazdı.
ÖLÇME ÇEġĠTLERĠ:
1) DOĞRUDAN (TEMEL) ÖLÇME: Ölçülmek istenen özellik ya da nesnenin evrende var
olduğu Ģekliyle kendi cinsinden bir birimle ölçülmesidir.
Örn: Boyun metre ile ağırlığın terazi ile ölçülmesi gibi. Yani ağırlığın bir baĢka ağırlık ile
uzunluğun bir baĢka uzunluk ile ölçülmesidir.
Doğrudan ölçmede geçerliği ve güvenirliği yüksek olan bir ölçme elde edilir. Ağırlık, uzunluk, renk
vb. doğrudan ölçülebilir.
ÖRNEKLER:
* Boy uzunluğunun ölçülmesi
* ArkadaĢ sayısının belirlenmesi
2002 KPSS
* Devam edilen ders sayısı
* Sahip olunan kitap sayısının belirlenmesi
* AyĢe‘nin kaç kardeĢinin olduğunun belirlenmesi
2) DOLAYLI ÖLÇME: Ölçülmek istenen özellik ile ölçmede kullanılan aracın özelliği
birbirinden farklı ise bu tür ölçmelere dolaylı ölçme adı verilir. Özellik kendisine ait olmayan
baĢka bir araçla ölçülür. Geçerlilik ve güvenirlik düĢüktür. EĞĠTĠMDEKĠ ÖLÇÜMLERĠN BÜYÜK
BĠR KISMI DOLAYLI ÖLÇÜMDÜR.
Eğitimde genellikle ölçme konusu olan davranıĢ değil onunla ilgili olduğu sanılan davranıĢlar
gözlenip, gözlem sonucu asıl ölçme konusu olan davranıĢa yüklenir.
Eğitimdeki ölçmelerin genellikle dolaylı olması eğitimdeki ölçme sonuçlarına daha çok hatanın
karıĢması ihtimalini arttırır.
Zekâ, baĢarı, kiĢilik, akademik baĢarı vb. özellikler dolaylı ölçme ile ölçülür.
ÖRNEKLER
2
* Öğrencinin zekâ düzeyinin ölçülmesi,
* Öğrencinin yeteneklerinin ve kiĢilik özelliklerinin ölçülmesi,
* Bir odanın sıcaklığının termometre ile ölçülmesi…
* Tutum ölçmek
2008 KPSS: AĢağıdakilerden hangisi ölçülürken dolaylı ölçme yapılır?
A) Park yerindeki araçların sayısı
B) Bilgisayar masasının yüksekliği
C) Bir sepet elmanın kütlesi
D) Öğrencilerin dört iĢlem becerileri
E) Koridorun uzunluğu
3) TÜRETĠLMĠġ ÖLÇME: Ġki değiĢken arasında aritmetik bir iĢlemle elde edilen
ölçmeye türetilmiĢ ölçme denir. Örneğin bir cismin hacmi kütlesine bölünürse yoğunluğu bulunur.
Dolayısıyla iki ölçme arasında aritmetiksel bir iĢlem yapılması bir ölçme iĢlemini yani türetilmiĢ
ölçmeyi ifade eder. Bir otomobilin hızını bulmak için önce otomobilin aldığı yolu ve bu yolu ne
kadar zamanda aldığı tespit edilir. Daha sonra arabanın hızını bulmak için alınan yol zamana
bölünür. Yine aritmetiksel iĢlem yapıldığı için yapılan ölçme türetilmiĢtir.
ÖLÇMEDE BĠRĠM:
Ölçme iĢleminin sonucunu sayısal olarak ifade edebilmek için bir
birime ihtiyaç duyulur. Metre, kilogram, kilowatt, derece, saat, lira, puan, adım, karıĢ vb. çeĢitli
ölçme araçlarına iliĢkin ölçme birimleridir. Sonuçlar ifade edilirken bu birimler kullanılır. 20
öğrenci, 25 derece gibi… Birimler 2 türlüdür:
* DOĞAL BĠRĠM: Bir değiĢkenin hangi niteliğine ya da miktarına bir birim denileceğinin
tanımlanmamıĢ olduğu birimlerdir.
Örn: Sınıftaki öğrenci sayısını sayarken 1 öğrenci 1 birim olarak kabul edilir.
* TANIMLANMIġ BĠRĠM: DeğiĢkenin ne kadarlık miktarına 1 birim denileceği
uzmanlarca tanımlanmıĢ birimlerdir.
Örn: Saat, metre, kilogram vb…
Ölçme iĢleminde kullanılacak birimlerde üç özelliğin bir arada bulunması önemlidir:
1)Birimlerin EĢitliği: Ölçme aracını oluĢturan birimlerin eĢit dilimler halinde olmasıdır. Yani
Kullanılan ölçme aracındaki birimlerin ölçme iĢlemi boyunca değiĢmemesi ve birbirine eĢit
olmasıdır.
Örn: Kilogramda her bir gram 1 birime eĢittir.
2)Birimlerin Genelliği:
kullanmasıdır.
Ölçmede aynı birimleri kullanan herkesin o birimi aynı anlamda
Örn: Bazı insanların uzunlukları metre ile, bazı insanların kulaç kullanarak ölçmeleri birimlerin
genelliğini bozar, veya ağırlık ölçmede kullanılan kilogram dünyanın her yerinde kabul edilen genel
3
bir birim iken geçmiĢte kullanıĢmıĢ olan okka günümüzde herkes tarafından kullanılmadığı için
genel bir birim değildir.
3)Birimlerin Amaca Uygunluğu: Ölçme amacımıza uygun birimlerin seçilmesidir.
Örn: Kayseri-Sivas arasını metreyle değil de kilometre ile ifade etmek. Mesela Sivas Kayseri
arasını 196 km demek yerine 196.000 m demek zorunda kalırdır.
Örn: Ġnsanların ağırlığının ton ile değil de kilo ile ifade edilmesi…
ÖLÇÜM:
Ölçme sonucudur. BaĢka bir ifade ile ölçme iĢlemi sonucunda elde edilen sayı veya
semboldür. Örn: Bir öğrencinin bir sınavdan almıĢ olduğu puan bir ölçümü ifade etmektedir. Yani
ölçüm ölçme iĢlemi bittikten sonra elde edilen niceliktir.
ÖLÇMEDE SIFIR NOKTASI:
Ölçülecek değiĢkenin sıfır değerinin tayin
edilebilmesi ve ölçmede bu değerin sıfır sayısı ile gösterilebilmesi çok istenen bir özelliktir. Bazı
değiĢkenlerin doğal (gerçek) sıfır noktası vardır. Bir kursa devam eden öğrencileri sayıyorsak,
hiçbir öğrencinin gelmediği bir günde devam eden öğrenci sayısı sıfırdır ve sıfır doğaldır. Doğal
sıfır değerine mutlak sıfır da denilmektedir.
Bazı değiĢkenlerin doğal sıfır değeri bulunmaz. Örn; sıcaklık ölçmekte kullanılan
santigrat ve fahrenheit derecelerinin sıfırları itibaridir (bağıldır). Bir uzunluk için yüksekliğin
doğal sıfırı anlamlı olduğu halde, yeryüzündeki coğrafi yüksekliklerin ölçülmesinde kullanılan sıfır
itibari yani bağıldır. Eğitimde sıkça kullanılan baĢarı ölçmede takdir edilen notun sıfırı itibari yani
bağıldır.
2007 KPSS: AĢağıdaki örneklerin hangisinde sözü edilen ölçme iĢleminde bağıl (keyfî, itibari)
sıfır söz konusu değildir?
A) Ankara ili Çankaya ilçesinin deniz seviyesinden yüksekliği 870 metredir.
B) Öğrencilerin felsefe dersine karĢı tutum puanları ortalaması 207 dir.
C) Tarih sorularından en az dört tanesine doğru cevap veremeyenler sıfır puan almıĢtır.
D) Bugün hava sıcaklığı 15 ºC dir.
E) Bu kitabın ilk 4 sayfasında kitabın kapsamı tanıtılmaktadır.
ÖLÇÜT
(kriter, standart, norm): Ölçümler hakkında bir karara varırken kullanılan
kriterlerdir. Örn: Bir öğrencinin baĢarılı sayılabilmesi için istendik davranıĢların % 50 sini
kazanmıĢ olması, % 30‘dan fazla devamsızlık etmemiĢ olması ya da geçme notu 100 üzerinden en
az 45 olanların baĢarılı olması, sayılması gibi… Ölçüt ikiye ayrılır:
4
a) Mutlak ölçüt: Değerlendirilecek grup dikkate alınmadan ölçme iĢleminden önce belli olan
ölçüte mutlak ölçüt adı verilir. Mutlak ölçüt kesindir, gruba ve kiĢiye göre değiĢmez.
ÖRNEK: Cumhuriyet Üniversitesinde geçme notu 60 dır.
Programın hedefleri
Askere alınma yaĢı
Okula baĢlama yaĢı
LES‘ ten 45 ve üzeri puan alanlar yüksek lisansa baĢvurabilir.
-Memur olmak için askerlikle iliĢiğinin olmaması gerekir.
-Bu kurumda sigara içmenin cezası 69 TL dir.
-Ölçme dersini geçmek için soruların %75 ini yapmak gerekir.
-Ölçme dersinden 50 ve üzerinde puan alan öğrenciler baĢarılı sayılacaktır.
- Yüksek lisansa baĢvurabilmek için en az ALES‘ten 70 almak gerekir.
b) Bağıl ölçüt: Ölçme iĢleminden sonra grubun baĢarısına göre değiĢen ölçüte bağıl ölçüt adı
verilir. Ölçüt kesin değildir, gruptan gruba ve kiĢiden kiĢiye göre değiĢebilir.
ÖRNEK: Sınıf ortalamasının üzerinde not alanlar dersten geçer.
Akademik baĢarısı en yüksek 20 kiĢi süper liseye alınacak…
Bölgesel normlar
KiĢisel yetenekler
2009 KPSS SORUSU: AĢağıdaki değerlendirme süreçlerinin hangisinde bağıl ölçüt kullanılmıĢtır?
A) Mezun olmak için diploma notunun 4 üzerinden en az 2 olması
B) Ortalamanın 10 puan üzerinde alanların sınıfı geçmesi
C) Askere ağırlığı 150 kg‟nin altındaki erkeklerin alınması
D) Soruların % 80‟ini doğru cevaplayanların bilgi yarıĢması elemelerine katılması
E) Yüksek lisansa girebilmek için yabancı dil sınavından en az 70 puan alınması
2006 KPSS:
I. Matematik sorularının %75‘ini, fizik sorularının da %60‘ını doğru cevaplayan öğrenciler bu
dersleri baĢarmıĢ sayılır.
II. Ġlk iki sorudan alınabilecek en yüksek puan 25‘tir.
III. Sınavda 65‘in altında puan alan öğrenciler dersi tekrar ederler.
IV. Türkçe ve matematik derslerinden baĢarısız olan öğrenciler bir sonraki döneme devam
edemezler.
Yukarıdakilerden hangileri birer değerlendirme ölçütünü ifade etmektedir?
A) Yalnız I
B) Yalnız II
C) II ve III
D) III ve IV
5
E) I, III ve IV
DEĞERLENDĠRME:
Ölçme sonuçlarını bir ölçütle karĢılaĢtırıp, bir değer yargısına
oradan da bir karara ulaĢma sürecidir.
AĢağıda bazı ölçme sonuçları verilmiĢtir:
A → Ayhan‘ın boyunu ölçtük ve 164 cm bulduk.
B → Yeni doğan bir bebeğin ağırlığını 1,9 kg olarak tespit ettik.
C → Bir öğrencinin A BaĢarı testindeki puanını 23 olarak bulduk.
Bu örneklerin her biri bir ölçme sonucudur. Ama bunlar kendi baĢlarına hiç bir Ģey ifade etmezler.
Elde ettiğimiz sayıların bizimle konuĢması, bazı fikirler vermesi gerekir.
ġimdi aĢağıdaki örnekleri inceleyelim:
A → Polis okuluna kayıt yaptırabilmek için en az 167 cm boya sahip olunmalıdır.
B → Yeni doğan sağlıklı bir bebeğin ağırlığı 2–4,5 kg arasında olmalıdır.
C → A baĢarı testinden geçer not alabilmek için en az 25 almak gerekir.
ĠĢte Ģimdi yukarda verilen ölçme sonuçları bir anlam kazandı yani her birisi bize fikir
verecek duruma geldi. Görüldüğü üzere değerlendirme ile ölçme sonuçları anlamlandırıldı.
Değerlendirme için ölçüm, ölçüt ve değer yargısına ihtiyaç vardır.
ÖLÇME SONUCU
(ÖLÇÜM)
Değer Yargısı
Karar
(Ölçüt)
AYHAN 164 cm
boyundadır.
ÖRNEKLER:
Kriter
Polis
okuluna ön
kayıt için
167 cm.
boya sahip
olmak
gerekir.
Ayhan’ın
boyu
kısadır.
Polis
okuluna
giremez.
* ĠĢ deneyimi 6 yıl ve üzerinde olanlar iĢe alınmıĢtır. (2003 KPSS)
* Hale ortalamanın üzerinde puan alarak sınıfını geçmiĢtir. (2003 KPSS)
* Demet 160‘ın üzerinde puan aldığı için sınavı kazandı. (2004 KPSS)
* Elmas sınıfını pekiyi ile geçerek birinci oldu. (2004 KPSS)
6
Değerlendirme sürecinde en önemli öğe kriterdir. Değerlendirme sürecinde kullanılan
kriterlere göre değer yargısı ve dolayısıyla karar değiĢecektir. Bir dersin ölçüt alınabilecek en
önemli öğesi hedef ve davranıĢlardır.
2007 KPSS: Değerlendirme yapılırken, ölçüt ile ölçme sonuçlarının aynı birimle ifade edilmesi
gerekir. Bunun en önemli amacı aĢağıdakilerden hangisidir?
A) Ölçme aracının geçerliğini artırmak
B) KarĢılaĢtırmada doğru karar verilmesini sağlamak
C) Ölçme aracının güvenirliğini artırmak
D) Sonuçların anlaĢılmasını kolaylaĢtırmak
E) Ölçütün uygun olmasını sağlamak
ÖLÇME VE DEĞERLENDĠRME KAVRAMLARININ KARġILAġTIRILMASI
→ Ölçme özelliğin miktarını gösterir; değerlendirme ise bu miktarın yeterli olup olmadığını ya da
amaca uygun olup olmadığını belirler.
→ Ölçme, değerlendirmeden önce gelir. Ölçme yapıldıktan sonra değerlendirmeye geçilir bu sıra
hiç değiĢmez.
→ Ölçme, objektiftir yani fotoğraf çeker gibi mevcut
Değerlendirme ise sübjektiftir. KiĢisel kanılara dayanır.
durumu
ortaya
koymaktadır.
→ Ölçme daha çok gözleme; değerlendirme ise daha çok karĢılaĢtırmaya, yorum ve yargıya
dayanır.
→ Değerlendirme ölçmeyi de içine alan bir kavramdır, dolayısıyla ölçmeye göre daha kapsamlıdır.
ÖRN: Öğrencinin tarih dersinden 70 puan alması bir ÖLÇMEDĠR. Sadece puanına bakarak tarih
dersinden geçip geçmeyeceğine karar vermek oldukça zordur. Bu konuda karar için öğrencinin
puanının bir ölçütle karĢılaĢtırılması gerekir. Eğer öğretmen 70 puanın geçebilmek için yeterli
olacağını önceden belirtmiĢse öğrenci tarih dersinden geçebilecektir. Bu durumda öğrencinin
geçebileceğine iliĢkin karar verilmiĢtir. Yani DEĞERLENDĠRME yapılmıĢtır.
ÖLÇME VE DEĞERLENDĠRME KAVRAMLARININ ÖRNEKLERLE KARġILAġTIRILMASI:
ÖLÇME
DEĞERLENDĠRME
►Bugün hava sıcaktır.
►Bugün hava sıcak olduğu için maç yapılabilir.
►Fatih matematikten pekiyi aldı.
►Fatih matematikten pekiyi ile geçti.
►Abdulsamet kısa boyludur.
►Abdulsamet kısa boylu olduğu için kaleci olamaz.
►Furkan sınavdan en yüksek puanı aldı.
►Furkan en yüksek puanı alarak sınıfını geçti.
►Ebubekir iyi bir çocuktur.
►Ebubekir iyi çocuk olduğu için sevilebilir.
►Bu gömlek 75 ytl dir.
►Bu gömlek 50 ytl den fazla olduğu için pahalıdır.
►AyĢe bayandır.
►AyĢe bayan olduğu için manken olabilir.
7
EĞĠTĠM SÜRECĠ ĠÇĠNDE ÖLÇME VE DEĞERLENDĠRMENĠN YERĠ VE ÖNEMĠ
Eğitim süreci içinde ölçme ve değerlendirme, öğrencilerimizin hedef davranıĢların ne
kadarını gerçekleĢtirdiklerini, gerçekleĢtirilmeyen amaçların neler olduğu, hangi konuların
yeterince öğrenilip öğrenilmediği, hangi konuların eksik ya da yanlıĢ öğrenildiği hakkında bilgi
verir.
►Yeterince baĢarılı olan öğrenciyi motive eder.
►Öğrenci hakkında verilecek kararlara dayanak olur.
►Öğretmenin kendi öğretiminin ne derece etkili olduğunu kestirmesine yardım eder.
►Uygulanan eğitim programının baĢarılı olup olmadığı hakkında yöneticilere ve diğer ilgililere bilgi
verir.
DEĞERLENDĠRME BĠÇĠMLERĠ
A) ÖLÇÜTE GÖRE YAPILAN DEĞERLENDĠRME
1) MUTLAK DEĞERLENDĠRME (Kriter Dayanıklı Değerlendirme): Mutlak ölçüt kullanılarak
hedefe dayalı olarak yapılan değerlendirmedir.
Örn:
-ALES‘ten 55 alarak baĢarılı oldu.
-100 metreyi 18 saniye ve daha altında koĢanlar okul takımına alınmıĢtır.
-Hasan kapalı alanda sigara içtiği için ceza kesildi.
- Ahmet asker kaçağı olduğu için memuriyete alınmadı.
- 50 sorunun 40 tanesini doğru yapan öğrenciler baĢarılı sayıldı.
- Ölçme dersinin hedeflerinin %70 bilen öğrenciler dersi, geçti.
Mutlak ölçüte göre yapılan değerlendirmede kriter önceden belirlenmiĢtir.
Mutlak değerlendirmede öğrencinin grup içindeki baĢarısına bakılmaz. Yani burada birey testteki
baĢarısına göre testle ölçülmek istenen nitelikler yönünden grup içindeki diğer bireylerle
karĢılaĢtırılmaz. Mutlak değerlendirmede bireyin bireysel baĢarısı dikkate alınır.
2) BAĞIL DEĞERLENDĠRME (Norm Dayanaklı Değerlendirme): Bağıl ölçüt kullanılarak,
bireyleri birbirleriyle karĢılaĢtırarak yapılan değerlendirmedir. Bağıl ölçütte öğrencinin bulunduğu
grup içindeki göreli yeri esas alınır.
Örn:
100 metre koĢuda ilk 3 e girerek takıma girmeye hak kazandı.
Sınıf ortalamasının üzerinde not alanlar baĢarılı oldu.
Norm dayanıklı değerlendirme bireylerin testteki baĢarılarını testi alan grubun
istatistiklerine göre belirler ve yerlerini gruptaki diğer bireylerle karĢılaĢtırılır.
ÖRNEK: Bir okula öğrenci seçmek amaçlı olarak yapılan 100 soruluk çoktan seçmeli bir seçme
sınavında sınava giren öğrencilerin test puanları ortalamaları alınarak bu ortalama puan üzerinde
puan alan öğrencilerin okula kabul edilmesi.
8
Bağıl ölçüte göre yapılan değerlendirme sonucunda verilen not öğrencinin belli bir bilgi
veya beceriler toplamından baĢka, bir değiĢkene göre ne kadarını öğrendiğinin bir göstergesidir.
Bağıl değerlendirmede kriter grubun baĢarısına göre belirlenir.
ÖRNEK:
* Sınıfın aritmetik ortalamasının altında kalanların baĢarısız sayılması.
* 100 metre yarıĢına katılanlar arasında yarıĢı ilk 5'e girerek tamamlayanların
okul takımına seçilmesi.
* Sınıfın en baĢarısız % 20‘lik dilimine giren öğrencilere ek öğretim
hizmetlerinin sunulması.
NOT: AĢağıdaki üç amaç için hangi değerlendirme türleri kullanılır:
1) Öğrencilerin birbirine göre baĢarı düzeylerini belirleyerek ileri ve geri öğrenciler için ek
önlemler alma: BAĞIL DEĞERLENDĠRME.
2) Ders süresince öğrencilerin öğrenme eksikliklerini belirleyerek bunları giderme: MUTLAK
DEĞERLENDĠRME (Hedefe dayalı yapılmıĢtır)
3) Dönem sonunda öğrencilerin dersten alacakları notu belirlerken sınıf ortalamasını dikkate alma:
BAĞIL DEĞERLENDĠRME
AĢağıdakiler Bağıl değerlendirmedir.
a-Öğrencilerin sırasına göre değerlendirme yapmak Örneğin: Okulda ilk 5 giren öğrencilere burs
vermek
b-Normal dağılım eğrisine (çan eğrisine) göre değerlendirme yapmak
c-Standart puanlara göre değerlendirme yapmak ( Z ve T puanlar)
d-Standart sapmaya göre değerlendirme yapmak
e-Öğrencilerin ilk baĢarı durumları ile son baĢarı durumları arasında ki farkın değerlendirmede
kullanılması
f-Norma dayalı değerlendirme yapmak
g-Öğretmenlerin öğrencilerin yetenek düzeylerine dayalı beklentilerine göre değerlendirme
yapmaları
2006 KPSS: AĢağıdakilerden hangisi bağıl değerlendirmede kullanılan bir ölçüt değildir?
A) Sınıftaki diğer öğrencilerin baĢarısı
B) Ġzlenen programın hedefleri
C) Öğrencinin yeteneği
D) Ülke çapındaki normlar
E) Öğrencinin sınıf içindeki baĢarı sırası
2008 KPSS: Değerlendirme, ölçme sonuçlarının bir ölçütle karĢılaĢtırılarak bir yargıya varılması
iĢidir.
AĢağıdakilerden hangisi ―mutlak ölçüt‖ün kullanıldığı değerlendirmeye örnektir?
A) Bilgi yarıĢmasında en az puanla elenen kiĢi olma
B) Yüksek atlamada en iyi dereceyi yapma
C) Sınıfta baĢarı açısından ilk yüzde yirmilik grupta olma
D) 100 sorudan 50‘sini doğru cevaplama
E) Grup ortalamasının üzerinde performans gösterme
9
B) AMACINA GÖRE YAPILAN DEĞERLENDĠRME
Eğitim öğretimde temelde üç amaç için değerlendirme yapılır:
1) TANIMA-YERLEġTĠRMEYE YÖNELĠK (Tanılayıcı) DEĞERLENDĠRME:
Öğrencilerin belli bir kurs, ders ya da ünitenin önkoĢulu niteliğindeki ―giriĢ davranıĢlarına‖
sahip olma derecesini belirlemek amacı ile yapılan değerlendirmedir. Bu değerlendirmedeki amaç;
Ġlgili kursun geliĢtirmeyi düĢündüğü davranıĢlardan öğrencilerce önceden edinilenlerin olup
olmadığını belirlemektir.
Bu belirlemeler sonunda öğretimin baĢlangıç noktası belirlenir ve eğitim öğrenci düzeyine göre
ayarlanır.
YerleĢtirmeye yönelik değerlendirme ise öğrencileri eğitimsel açıdan gruplama sorunuyla
ilgilenir.
Örn: Öğrencilerin belli üniversitelere, bir üniversitenin değiĢik fakültelerine yada bir fakültenin
farklı bölümlerine yerleĢtirilmeleri, onların bu öğretim kurumlarında baĢarılı olmak için gerekli
olduğu düĢünülen giriĢ davranıĢlarına sahip oluĢ derecelerine göre yapılır. Bu anlamda yerleĢtirme
YORDAMA ile yakından ilgilidir.
Bu değerlendirmede kullanılan ölçme araçları Ģunlardır: Yetenek testi, tanıma testi, yerleĢtirme
testi, muafiyet testi, seviye tespit sınavı, hazırbulunuĢluk testi,
NOT: HazırbulunuĢluk testi, önkoĢul bilgileri ölçme amacıyla yapılır. Seçme testi ise bireylerin
belli özelliklere sahip olma düzeylerini değerlendirme amacıyla yapılır.
ÖRN: Sınıfta Ġngilizcesi en iyi olan beĢ kiĢiyi belirlemek (BAĞIL)
ÖRN: Eğitim Fakültesine girecek olan öğrencileri ÖSS ile belirlemek
2009 KPSS SORUSU: Arif Öğretmen, öğretim yılının baĢında, öğrencilerinin matematik dersine
karĢı tutumlarının nasıl olduğunu belirlemek ve elde edilen sonuçlardan hareketle öğretim
uygulamalarına yön vermek istemektedir. Bu amaçla 10 maddeden oluĢan bir tutum ölçeğini
öğrencilerine uygulamıĢ ve onların matematik dersine karĢı tutumlarını ölçmüĢtür.
Arif Öğretmen bu uygulamasında hangi ölçme ve değerlendirme türlerini kullanmaktadır?
A) Dolaylı Tanılayıcı
B) Doğrudan Biçimlendirici
C) TüretilmiĢ Tanılayıcı
D) Dolaylı Düzey belirleyici
E) Doğrudan Düzey belirleyici
2) BĠÇĠMLENDĠRME-YETĠġTĠRMEYE (FORMATĠF Değerlendirme , Öğrenme Eksikliklerinin
Değerlendirilmesi, Ġzlemeye Dayalı Değerlendirme) YÖNELĠK DEĞERLENDĠRME:
Program sürecinde yapılan değerlendirme biçimlendirici değerlendirmedir. Bu
değerlendirmenin ana iĢlevi, öğretim sürüp giderken her bir ünitedeki öğrenme eksikliklerini ve
güçlüklerini belirlemek, bu eksiklik ve yetersizliklerin giderilmesi yani ünitenin daha iyi
öğrenilebilmesi için her öğrenciye ayrı ayrı önerilerde bulunmaktır.
Bu değerlendirme programa sürekli dönüt sağlamakta ve iyileĢtirici önlemlerin alınması için bir
kontrol sistemi oluĢturmaktadır. Aynı zamanda bu değerlendirme yeni bir programın denenmesi ve
geliĢtirilmesi ile ilgili olarak uygun kanıtlar toplama olanağı verir. Bu kanıtlara dayanarak
programda gerekli ve yerinde düzeltmeler yapılabilir.
10
Biçimlendirme-yetiĢtirmeye
yönelik
değerlendirme
maksadıyla
kullanılan
testlere
FORMATĠF TESTLER ya da ünite testleri denilmektedir. Bu testler yalnızca belli bir öğretim
ÜNĠTESĠNĠN BĠTĠMĠNDE uygulanır.
Bu değerlendirmede kullanılan test çeĢitleri izlenme testleri, kısa sınavlar (kuiz), ara sınavlar ya
da aylık sınavlardan oluĢmaktadır.
Bu değerlendirmede ―not verme‖ yaklaĢımı uygulanmaz. Çünkü amaç ünite sonundaki eksiklikleri
belirlemek ve bunları gidermektir.
NOT: Öğrenme güçlüklerinin ve eksikliklerinin nedenleri araĢtırılarak bir yandan öğrencilere
yardımcı olunmaya çalıĢılmakta öte yandan da öğretim ortamı ve yöntemleri sürekli olarak gözden
geçirilmektedir.
3) DEĞER BĠÇMEYE YÖNELĠK DEĞERLENDĠRME (Sonuç Değerlendirmesi, Düzey Belirleyici
Değerlendirme, Summatif-Özetleyici Değerlendirme):
Programın sonunda öğrencilerin kazanılmıĢ davranıĢ, özellik ve becerilerini ölçmeye
yarayan değerlendirme türüdür.
Genellikle öğretim devresi sonunda programın öngördüğü hedeflere ulaĢılıp ulaĢılmadığına
bakılarak öğrenci, öğretmen ve programa iliĢkin yargılarda bulunulur. Yani öğrenci baĢarısı ve
öğrenme düzeyini belirlemek amacıyla yapılır.
2008 KPSS: Durum değerlendirme ya da düzey belirleme denen ölçme ve buna bağlı
değerlendirme sürecinde temel amaç aĢağıdakilerden hangisidir?
A) Öğretim programında belirtilen kazanımların gerçekleĢme derecesini belirlemek
B) Öğrencilerin yaĢadıkları öğrenme güçlüklerini ortaya çıkarmak
C) Öğrencilerin sosyal, psikolojik ve ekonomik durumlarını belirlemek
D) Öğrencileri belli özelliklere göre sıralayıp ilgili programlara yerleĢtirmek
E) Öğrencilerin kavramsal geliĢim düzeylerini ve kavram yanılgılarını tespit etmek
Bu tür değerlendirmede kullanılacak veriler; bir kursun tümünü içerecek biçimde kursun
bitiminde ya da birkaç üniteyi kapsayacak biçimde öğretim dersi içinde uygulanan testlerle elde
edilir. Böylece bir testin sonuçları birçok bakımdan kullanılacaktır. Öğrencilere not verme,
öğrencilerin gelecek kurslardaki baĢarısını yordama, bir sonraki kursta öğretimin baĢlangıç
noktasını saptama, öğrencilere ve öğretmene öğrenmenin yeterliliğine ya da öğretimin etkililiğine
iliĢkin dönüt sağlama, farklı öğrenci gruplarının baĢarı durumlarını kararlaĢtırma.
Öğrencilerle ilgili olarak verilecek kararlar onların bir okuldan mezun olup olmayacağına, bir üst
kurs ya da sınıfa geçip geçmeyeceğine ya da farklı programlardan hangisine yönelmesi gerektiğine
değin olabilir.
NOT: Değer biçmeye yönelik değerlendirme; öğretim programlarının hedeflerine ulaĢma düzeyi,
öğrenme düzeyi ve öğrencilerin baĢarı düzeylerini belirlemek için yapılır. EriĢi testi, baĢarı testi,
bitirme testi (final), yeterlilik testi ve uzmanlık testleri, vize testi gibi test türleri kullanılır.
→ EriĢi Testi: Bir öğretim programının giriĢ davranıĢları ile çıkıĢ davranıĢları arasındaki farkı
bulmak için yapılır.
→ BaĢarı Testi: Öğrencinin öğrenme düzeyini belirlemek amacıyla yapılır.
NOT: Amaca yönelik değerlendirmede:
1) Programa GĠRĠġTE yapılan değerlendirme  Tanılayıcı Değerlendirme
2) Program SÜRECĠNDE yapılan değerlendirme  Biçimlendirici Değerlendirme.
3) Programın ÇIKIġINDA yapılan değerlendirme  DÜZEY Belirleyici değerlendirmedir.
11
EĞĠTĠM ÖĞRETĠMDE KULLANILAN DEĞERLENDĠRME TÜRLERĠ:
1) HAZIRBULUNUġLUK DÜZEYĠNĠN DEĞERLENDĠRĠLMESĠ: Bir öğrenme ünitesi, kurs ve
benzeri etkinliklerin önkoĢul davranıĢlarının (giriĢ davranıĢlarının) belirlenmesi amacına dönüktür.
GiriĢ sınavları, ön test sınavları, muafiyet sınavları vb…
2) GELĠġTĠRĠCĠ (FORMATĠF) DEĞERLENDĠRME: Öğrenme eksikliklerinin belirlenmesi ve
giderilmesi etkinliklerinde kullanılır. Bu değerlendirmede dersin hedef davranıĢlarının
gerçekleĢme düzeyi ve öğrenme eksiklikleri üzerinde durulur.
Her ünitenin sonunda kullanılır. GeliĢtirici değerlendirmede formatif testler, izleme testleri ve
ünite testleri olmak üzere baĢlıca üç tür test kullanılır. Bu değerlendirme türünde öğrenme
eksiklikleri ve hedef davranıĢların gerçekleĢme düzeyleri belirlenerek gerekli önlemler alınır.
3) ÖZETLEYĠCĠ (SUMMATĠF) DEĞERLENDĠRME: Eğitimde en çok kullanılan değerlendirme
türüdür. Bu değerlendirme ile öğrencinin baĢarı düzeyi belirlenir. Örn: Bu değerlendirmede
öğrenci hakkında geçti, kaldı, baĢarılı, baĢarısız gibi kararlar alınır. BaĢarı, eriĢi ve benzeri
testler kullanılır. Dönem içerisinde yapılan ara sınavlar ve dönem sonunda yapılan yılsonu sınavları
summatif testler Ģeklinde yapılır.
Bu değerlendirme türünde öğretim programının, öğretmen vb. etkisine bakılır ve değerlendirme
yapılır.
4) EĞĠTĠM PROGRAMININ DEĞERLENDĠRĠLMESĠ: Eğitim programının bir bütün halinde ve
her bir öğesinin etkinliği değerlendirilir.
NOT: Eğitim Programlarının öğeleri; hedef davranıĢ, içerik, eğitim durumları (öğrenme ilkeleri,
stratejileri, yöntemler, teknikler, Araç-gereç) ölçme ve değerlendirmeden oluĢur.
5) ÖĞRETMENĠN DEĞERLENDĠRĠLMESĠ: Öğrenci ve program değerlendirildikten sonra
öğretmen de değerlendirilir. Eskiden öğretmenleri sadece müfettiĢ ve idare değerlendirirken
Ģimdi ise performans değerlendirme sistemi uygulanmaktadır. Yani değerlendirmeye idare,
müfettiĢ, öğrenci, veli ve diğer öğretmenlerde katılmaktadır.
NOT: Değerlendirmede bir sınıflamada değerlendirmenin PLANLANIġINA göre yapılır.
A) DÜZENLĠ DEĞERLENDĠRME: Belli ölçütleri, planlı ve düzenli gözlemi,
karĢılaĢtırmaları, standartlaĢtırılmıĢ sınama yollarını içeren değerlendirme türüdür.
kontrollü
B) GELĠġĠGÜZEL DEĞERLENDĠRME: Ölçütler ya da varılmak istenen son nokta belirgin
değildir. Sübjektif yargılar baskın çıkar. Öğrenmedeki yetersizlik ve aksaklıkların kaynağı tam
olarak belirlenemez.
DEĞERLENDĠRME VE TEST ÇEġĠTLERĠ
TANILAYICI
Tanıma
YerleĢtirme
Muafiyet
Seçme
Yetenek
testleri
GĠRĠġ
BĠÇĠMLENDĠRĠCĠ
Biçimlendirici Sınav
Kısa Sınav
Ara Sınav
Ünite testleri
SÜREÇ
DÜZEY BELĠRLEYĠCĠ
Bitirme Sınavı (Final)
BAġARI
YETERLĠLĠK
Vize
Summatif
ÇIKIġ
12
ÖLÇEK:
Belirli bir özelliği ölçmek için hazırlanmıĢ ve üzerinde birimleri hep aynı cinsten koyulmuĢ
bir ölçme aracını tanımlar. Yani belli bir baĢlangıç noktasından itibaren eĢit birimlerle
bölmelenmiĢ ölçme aracına ölçek adı verilmektedir. Ölçek; nesnelere verilen sayıların anlamlarını
ya da nesnelere sayılar vermede ve verilen sayıların kullanılmasında uyulması gereken kurallar ve
kısıtlamaları belirtmek için kullanılır. BaĢlıca ölçek türleri Ģunlardır:
1) SINIFLAMA (Adlandırma-Gruplandırma-Kategorileme-Nominal) ÖLÇEKLERĠ: Sınıflama
ölçeği nesneleri belli bir yönden benzeyip benzemediklerine göre sınıflandırmaya dayanır.
Nesneler arasındaki farklılıklar ve benzerlikler çok kaba biçimde belirlenir. Gözlemin en basit
biçimidir. Bu ölçekte nesneler sınıf, tip ve kategorilere ayrılır. Bu ölçek eğitimde nadiren
kullanılır. Bazı tanımlayıcı nitelikler (göz ve saç rengi gibi) insanların yaĢadığı coğrafi bölgeler,
matematiksel olarak yalnızca elimizde FREKANSLAR VARDIR. Ġstatistiksel iĢlemlerden sadece
MOD bulunabilir.
Dolayısıyla frekanslara dayalı analizler dıĢında birçok matematiksel iĢlemi yapmak anlamsızdır.
ÖRNEKLER:
* Ġnsanları medeni durumlarına göre evli, bekâr, dul, boĢanmıĢ Ģeklinde
ayırmak
* Cinsiyete göre kadın, erkek
* Tenlerine göre esmer, sarıĢın
* Derse gelenler, gelmeyenler
* Gözlük takanlar, takmayanlar
* Ġllere plaka numarası verilmesi
* Kısa ve uzun boylu öğrencileri ayırma
* KiĢileri dinlerine ve mesleklerine göre ayırma.
NOT: Adlandırma ölçeğinin baĢlıca iki özelliği vardır: SĠMETRĠKLĠK-GEÇĠġLĠLĠK
Örn: Bir akraba sınıfını ele alalım Aslı Burak‘ın akrabası ise Burak‘ta Aslı‘nın akrabasıdır. Bu
iliĢkiye SĠMETRĠKLĠK adı verilir. A = B  B = A
Öte yandan Aslı Burak‘ın kardeĢi, Burak‘ta Ceylanın kardeĢi ise o zaman Aslı‘da Ceylan‘ın
kardeĢidir. Yani A = B, B = C  A = C Bu iliĢkiye GEÇĠġLĠLĠK adı verilir.
NOT: Her bir grubu bir sayı ile ifade edersek, örneğin kadınlara 1, erkeklere 2 dersek sınıflama
ölçeği ile ölçme yapmıĢ oluruz.
2006 KPSS: ĠĢ birliğine dayalı bir öğrenme uygulamasında gruplar öğrencilerin soyadlarının baĢ
harfleri kullanılarak oluĢturulmuĢtur.
Bu uygulamadaki gruplara ayırma, bir ölçme iĢlemi olarak kabul edilirse kullanılan ölçek türü
aĢağıdakilerden hangisidir?
A) Sıralama
D) Dereceleme
B) EĢit oranlı
E) EĢit aralıklı
C) Sınıflama
13
2) SIRALAMA (DERECELEME-ORDĠNAL) ÖLÇEĞĠ: Nesneleri belli bir özelliğe sahip oluĢ
miktarı bakımından sıraya koymakla elde edilir. Yani bu ölçek niteliklerin belli bir boyutta
büyükten küçüğe, küçükten büyüğe, iyiden kötüye veya kötüden iyiye doğru sıralanması ile elde
edilir. Bu sıralar sayı ile ifade edileceği gibi birinci, ikinci, üçüncü vb. sıfatlarda da ifade
edilebilir; pekiyi, iyi, orta, geçer, kalır gibi…
Bu tür ölçeklerde öğrencilerin tüm grup içindeki yeri belirlenmektedir. Birinci, ikinci, üçüncü… gibi
numaralar öğrencilerin grup içindeki yerini belirlemede kullanılabilir. Bu ölçekte nesnelere verilen
semboller (sayılar) nesnelerin belli bir özelliğe, birbirine göre daha az ya da daha çok sahip
olduğunu belirtir.
Bu ölçekte baĢlangıç noktası ve sıralar sabit değildir.30 kiĢilik bir grup baĢarı durumlarına
göre sıralanmıĢ olsa herkesin bir sırası olur ; fakat gruba yeni bireyler katılırsa , sıralamada ki
baĢlangıç noktasında ve kiĢilerin eski sıralarında değiĢme meydana gelir.
Fakat sıraları gösteren sayılar arasındaki farklar özelliğe sahip oluĢun ve nesneler arasındaki
farkın miktarını yansıtmaz. Örn: BaĢarı sıralamasına göre veya boy uzunluğuna göre 2. öğrencinin
4. öğrenciden 2 birim daha üstün olduğu söylenemez. Bu yüzden bu tip ölçeklerden elde edilen
veriler üzerinde MOD VE MEDYAN(ORTANCA) bulunabilir. Yüzdelik hesapları yapılabilir, sıra
farkları korelasyonu da hesaplanabilir.
Bu ölçek türüne de dört iĢlemi uygulamanın bir anlamı yoktur çünkü rakamların matematiksel
anlamı yoktur. Sadece özelliğin azlık-çokluk; büyüklük-küçüklük sırasını verir.
Sıralamada sıfırın anlamı yoktur.
ÖRNEKLER:
* Üniversiteyi 1. tercihimde kazandım.
* Öğrencilerin boy sırasına konulması…
* Sınav notlarına göre sıralama yapma…
* Sınıftaki en baĢarılı ilk 5 öğrencinin belirlenmesi 1. 2. 3. 4. 5. …
* Okulların üniversiteye giriĢ sınavı sonuçlarına göre sıralanması,
NOT: Bu ölçek türüyle elde edilen ölçme sonuçları arasında iki türlü iliĢki vardır: GEÇĠġLĠLĠK ve
ASĠMETRĠKLĠK…
ÖRN: Ali AyĢe‘den uzundur diye AyĢe de Ali den uzundur diyemeyiz. Yani A>B
diyemeyiz. Bu özelliğe ASĠMETRĠKLĠK adı verilir.
fakat B>A
ÖRN: Ali AyĢe‘den uzundur. AyĢe de Ezgi‘den uzundur. Dolayısı ile Ali Ezgi den uzundur. Yani A>B
ve B>C ise A>C dir.
3) EġĠT ARALIKLI (ĠNTERVAL) ÖLÇEKLER: Nesnelerin belirli bir baĢlangıç noktasına göre ve
belli bir özelliğe sahip oluĢ derecesi bakımından eĢit aralıklarla sıralanmasıdır. EĢit aralıklı ölçek
birimlerde eĢitliğin sağlandığı ve sıfırın tanımlanmıĢ olduğu ölçek türüdür.
Örn: Termometre-Takvim-Santigrat-Fahrenayt. Termometre sıfırı gösterdiğinde sıcaklık
gerçektende sıfır değildir. Aslında belli bir sıcaklık vardır ancak hem termometrenin
geliĢtiricileri hem de kullanıcıları sıfır olarak tanımlanan noktayı baĢlangıç olarak kabul
etmiĢlerdir.
Örn: Sıfır noktası olarak kabul ettiğimiz ĠSA‘nın doğumu aslında tarihin baĢlangıç noktası
değildir. Bu nokta herkesin sıfır noktası olarak kabul ettiği noktadır.
14
Görüldüğü gibi bu ölçekte baĢlangıç noktası (0) tanımlanmıĢtır. Sıfır noktası keyfidir ve eĢit
aralıklarla bölmelenmiĢtir. Bu yüzden eĢit aralıklı ölçeklerde ölçümlerin birbirine oranlanması
anlamlı değildir yani termometre ölçeği ile 10 °C olan sıcaklığın 5 °C olan bir sıcaklıktan 2 kat
fazla olduğunu söylemenin bir anlamı yoktur.
Bu ölçekte elde edilen veriler üzerinde sınıflama ve sıralama ölçeklerinden elde edilen veriler
üzerine yapılanlara ek olarak ARĠTMETĠK ORTALAMA, STANDART SAPMA, PEARSONMOMENTLER ÇARPIMI KORELÂSYON KATSAYISI hesaplanabilir.
EĢit aralıklı ölçekler üzerinde toplam çıkarma iĢlemleri yapılırken, gerçek bir sıfır noktası
olmadığı için çarpma bölme iĢlemi yapılamaz. Örneğin; 20 santigrat 10 santigrat‘ın iki katıdır
denemez.
ÖRNEKLER:
*Termometre, Takvim, Sınav…
* Hava sıcaklığının 20 °C olarak belirlenmesi,
* Bir öğrencinin eğitim dersindeki baĢarısı,
* Bir öğrencinin tarih dersine olan tutumu
4) EġĠT ORANLI (RATĠO) ÖLÇEKLER: BaĢlangıç noktası gerçek sıfırı yani yokluğu gösteren,
birimleri eĢit ve birimleri arasında oransal iliĢki kurulabilen ölçekler oranlı ölçeklerdir. Bu ölçeğin
öncekilerden üstünlüğü SIFIR‘ın (0) gerçek anlamda yokluğu ifade etmesidir. Yani baĢlangıç
noktası olan SIFIR NOKTASI gerçek bir SIFIR NOKTASIDIR. Uzunluğun ve ağırlığın ölçülmesi
bu tür ölçeklerle yapılır. ÖRN: Ali 60 kg ve Ayhan 30 kg ise Ali‘nin ağırlığı Ayhan‘ın ağırlığının iki
katıdır, denilebilir.
Ölçme sonuçları üzerinde her türlü MATEMATĠKSEL ĠġLEM yapılabilir. METRE, KĠLOGRAM gibi
ölçme araçları bu tür ölçek esasına göre geliĢtirilmiĢtir.
2006 KPSS: Yabancı dil sınavında Duru 80, Berke 40 puan almıĢtır.
Duru‟nun yabancı dil bilgisinin Berke‟nin yabancı dil bilgisinin iki katı kadar olduğunu öne
süren bir kiĢi, bu ölçme sonuçlarının aĢağıdaki ölçek türlerinin hangisiyle elde edildiğini kabul
etmektedir?
A) EĢit aralıklı
D) Sınıflama
B) Sıralama
E) EĢit oranlı
C) Dereceleme
Örnekler: Metre ile boy ölçmek, terazi ile ağırlık ölçmek, Okulda bulunan öğrenci sayısını
belirlemek, Bir öğrencini arkadaĢ sayısını belirlemek,
NOT: Dört ölçek türünden en yaygın olarak kullanılanları eĢit aralıklı ve sıralama ölçeklerdir.
Eğitimsel ve psikolojik ölçmelerde en çok kullanılan ölçekler yine sıralama ve eĢit aralıklı
ölçeklerdir.
NOT: Bu dört ölçek grubunu istatistiksel uygulama için iki grupta toplayabiliriz. Sınıflayıcı ve
sıralayıcı ölçeklerle elde edilen veriler ve değiĢkenler NĠTEL; buna karĢılık eĢit aralıklı ve
ORANLI ölçeklerle elde edilen veriler ve değiĢkenler ise NĠCEL olarak sınıflandırılabilir.
NOT: Ölçme düzeyi SINIFLAYICIDAN ORANLI‘ ya doğru kuvvetlenmektedir.
15
ÖLÇMEDE HATA:
Ölçülen nesnenin gerçek değeri ile gözlem ya da ölçme sonucunda
elde edilen değer arasındaki farka ölçme hatası denir.
Örn: Gerçek boy uzunluğu 180 cm. olan bir insanın boyu ölçüm sonucu 177 cm. bulunduysa bu
ölçmede 3 cm. ölçme hatası vardır.
Kim, hangi özelliği hangi araç ile ölçerse ölçsün ölçmede hata yapacaktır. Öyleyse bir ölçme
sonucundaki hata miktarı ne kadardır? Sorusu akla gelir. Bir ölçme sonucundaki hata miktarı o
ölçme iĢleminde kullanılan birimin yarısı kadardır. Buradan Ģu sonuca ulaĢırız: Birim ne kadar
küçülürse hata miktarı o kadar azalır. Bu ifadeyi Ģu örnekle açıklayabiliriz:
ÖRNEK:
A Sınavı: Sadece 1 soru sorulmuĢ,
100 puan üzerinden puanlanmıĢ,
B Sınavı: Ġki soru sorulmuĢ,
50 puan üzerinden puanlanmıĢ,
C Sınavı: On soru sorulmuĢ,
10 puan üzerinden hesaplanmıĢ,
D Sınavı: Yüz soru sorulmuĢ ,
1 puan üzerinden hesaplanmıĢ,
Yukarıda verilen sınavların sizce en güvenilir olanı hangisidir? Bu örnekten Ģunu anlıyoruz:
Bir ölçme iĢleminde kullanılan birim ile ölçme sonucuna karıĢan hata miktarı birbiri ile yakından
iliĢkilidir. Birim küçüldükçe hata miktarı da azalır.
ÖLÇMEDE HATA TÜRLERĠ
1) SABĠT HATA: Bir ölçmeden diğerine miktarı değiĢmeyen hatalardır. Sabit hatada ölçülen
özelliğin miktarı ne olursa olsun hata miktarı değiĢmemektedir.
Sınav aracı, yanlıĢ cevap anahtarı, soruların sınavda yoklanacak hedef davranıĢları uygun
örneklendirmemesi durumunda ortaya çıkar.
ÖRNEKLER:
* Bakkalın terazisinin her ölçtüğü ağırlığı 50 gram fazla göstermesi…
* Öğretmenin okuduğu her yazılı kâğıdına 10 puan fazla vermesi…
* Bir termometrenin ölçtüğü her sıcaklığı 2 °C fazla göstermesi…
* Bir metrenin ölçtüğü her uzunluğu 3 cm eksik ölçmesi.
* 30 soruluk bir kısa cevaplı testteki 15. sorunun okunamaması nedeni ile hiçbir
öğrenci tarafından cevaplandırılamaması.
* 25 soruluk çoktan seçmeli bir testin 25. sorusu sınav süresi yetersiz olduğu için
hiçbir öğrenci tarafından cevaplandırılamamıĢsa bu sorudan hiçbir öğrenci puan alamaz. Bu durum
tüm öğrencileri aynı oranda etkilediğinden öğrencilerin puanlarına sabit hata karıĢmıĢtır.
Sabit hatalar her ölçme sonucuna aynı yönde ve aynı miktarda karıĢtıkları için standart
sapma ve varyans değerlerini etkilemezler. Bu nedenle güvenirlik sabit hatalardan etkilenmez.
2) SĠSTEMATĠK (YANLI) HATA: Ölçülen büyüklüğe, ölçmeye ve ölçme koĢullarına göre miktarı
farklılık gösteren hatalardır. Sistematik hatada hata miktarı ölçümden ölçüme belli bir oranda
artar ya da azalır. Sistematik hata ölçmeyi yapanın yanlılığından da kaynaklanır. Ölçülen
büyüklüğe, ölçmeciye ve ölçülen koĢullara göre miktarı değiĢen bu hatalar puanlayıcının sübjektif
davrandığı hatalardır. Sistematik hatalarda yapılan ölçümün birden fazla tekrarlanması gerekir.
16
Örneğin; ilk 3 cm ‗lik kısmı kırık olan 50 cm‘lik bir cetveli,n büyük bir uzunluğu ölçmek
amacıyla birden fazla kullanılması durumunda hata miktarı cetvelin kullanım sayısına bağlı olarak
sistematik bir Ģekilde artacaktır.
ÖRNEKLER:
* Bir öğretmenin öğrencilerin cinsiyetlerine göre fazla puan vermesi, (Kız öğr.
10 puan fazla verilmesi)
*Yazılı sınavlarda yazı güzelliğine, ifade düzgünlüğüne, tertip ve düzene fazla
puan verilmesi.
* Öğretmenin 50 puan alan kâğıda 10, 60 puan kâğıda 15, 70 puan alan kâğıda 20
puan fazla vermesi…
* Terazinin 1 kg.lık bir kütleyi, 50 gram fazla; 2 kg.lık kütleyi 100 gram fazla, 3
kg.lık kütleyi 150 gram fazla göstermesi…
* Öğretmenin öğrencilerin almıĢ olduğu puanlara %10 ekleme yapması.
2009 KPSS SORUSU: Öğretmenler genellikle söz dinleyen ve kurallara uygun davranan öğrencilere sempati
duyarlar. Yapılan araĢtırmalar, öğretmenlerin tepkilerinin, öğrencilerin derslerdeki baĢarısızlıklarından çok,
kurallara uymamalarına yönelik olduğunu ortaya koymaktadır. Öğrencilere bu konuda bir açıklama yapılmasa
da onlar, kurallara uygun davrandıklarında bunun baĢarı olasılığını etkileyebileceğini, sınavda doğru yanıtlar
vermeseler de iyi not alabileceklerini düĢünürler. Bu durumda,
kurallara karĢı çıktıklarında
cezalandırılabileceklerini ya da öğretmenleri tarafından dıĢlanabileceklerini öğrenirler.
Kurallara uyan
aĢağıdakilerden
hangisi yapılmıĢ olur?
A) Rastlantısal hata
öğrencilere
daha
yüksek
puan
vererek
gerçekleĢtirilen
bu
ölçmelerde
B) Gözlem yetersizliği C) Sabit hata D) Mantık hatası E) Sistematik hata
3) RASTGELE (TESADÜFÎ) HATA: Hatanın miktarı ve yönü ölçülen özelliğin miktarından
bağımsız olarak ve düzensizce artıp azalabilmektedir. Hatanın kaynağı bilinmez. Bu tür hatalar
ölçme sonuçlarına geliĢi güzel katılır.
ÖRNEKLER:
* Dikkatsizce puanlanan, okunan veya doğru okunduğu halde yanlıĢ kaydedilen notlar.
* Öğrencinin sınav günü hasta olması, sınav salonunun soğuk olması, Ģans baĢarısı, kopya çeken
öğrencinin aldığı puan.
* Terazinin bir ölçtüğü kütleyi 50 gram fazla gösterirken, bir baĢka kütleyi 120 gram eksik, bir
diğerini 250 gram fazla göstermesi
* Öğretmenin bir kâğıda 5 puan fazla verirken, farkında olmadan bir baĢka kâğıda 10 puan eksik
vermesi.
2008 KPSS: Bir sınavda her öğrenciye 5 puan fazla verilmesi ---- hataya örnektir. Öğrencilerin
puanlarını, aldıkları puanların yüzde 10‘u kadar artırmak ise ---- hataya örnek olabilir.
Bu parçadaki boĢluklara, aĢağıdakilerin hangisindeki sözcükler sırasıyla getirilmelidir?
A) rasgele - sabit
B) rasgele - sistematik
C) sabit - sistematik
D) sabit – rasgele
E) sistematik - sabit
17
ÖLÇMEDE HATA KAYNAKLARI
1) ÖLÇME ARACINDAN KAYNAKLANAN HATALAR: Sorunun yanlıĢ olması, çift seçenekli
olması, eksik olması, yazım hatası, ölçme aracında yönerge olmaması, ölçme aracının iyi
yapılandırılmamıĢ olması
2) ÖLÇÜLENDEN (ÖĞRENCĠDEN) KAYNAKLANAN HATALAR: Öğrencinin hasta, aĢırı kaygılı,
dikkatinin dağınık, moralinin bozuk olması, zihinsel, psikolojik ve fiziksel sorununun olmasından
kaynaklanan hatalardır. Örn: Öğrencinin değildir li soruları dir li görüp yanlıĢ yapması, 1.sorunun
cevabını 6. sorunun cevabına yazması… Süre yetmediği için birkaç öğrencinin son soruyu
yanıtlayamaması…
3) ÖLÇME YÖNTEMĠNDEN KAYNAKLANAN HATALAR: Ölçülecek özelliği en iyi ölçen tekniği
kullanmamaktan kaynaklanan hatalardır. Örn: Künyeyi ölçmek için kuyumcu terazisi yerine manav
terazisini kullanmak, sıcaklığı metre ile ölçmek, süre yetmediği için bütün öğrencilerin son soruyu
yanıtlayamaması…
4) ORTAMDAN KAYNAKLANAN HATALAR: Ses, ıĢık, gözetmenler, havasızlık, sıraların rahat
olmaması gibi çevresel etkenlerden kaynaklanan hatalardır.
5) ÖLÇMECĠDEN (ÖLÇMEYĠ YAPANDAN)
KAYNAKLANAN HATALAR: Bu hata kaynağı;
sonuç, puanlama ve değerlendirme aĢamasında karĢımıza çıkar. Yazılı yoklamada puanları eksik
toplama, yanlı davranma vs… Optik okuyucudan kaynaklanan hata sonuç aĢamasında karĢımıza
çıktığı için ölçme aracından değil ölçmeciden kaynaklanan bir hatadır.
BĠR ÖLÇME ARACINDA BULUNMASI GEREKEN NĠTELĠKLER
1) GÜVENĠRLĠK:
Güvenilir bir ölçme aracı aynı özellik ile ilgili olarak arka arkaya
yapılan ölçmelerde yaklaĢık olarak aynı sayısal sonucu verir.(tutarlılık) Güvenilir bir test aynı
gruba iki ya da üç kez uygulandığında gruptaki her bir kiĢi bütün uygulamalarda yaklaĢık aynı puanı
almalıdır. Bir baĢka deyiĢle GÜVENĠRLĠK ölçme sonuçlarının hatalarından arınıklık derecesidir.
Ölçme aracının duyarlılık, tutarlılık ve kararlılık gibi özellikleri güvenirlikle ilgilidir.
Ölçmede güvenirliği belirleyen 2 temel özellik vardır:
DUYARLILIK (Hassasiyet) : Ne kadar az hata yapılırsa duyarlılık o kadar fazla olur. Ölçme
aracının birimi ne kadar küçük olursa o oranda hassas ölçüm yapar.
ÖRN: Altın tartarken kg. yerine mg. kullanılması veya sınavda az soru yerine çok soru sorulması
duyarlılığı arttırır.
TUTARLILIK (Kararlılık) : Ölçme aracının birkaç kez uygulandığında benzer sonuçları vermesi
düzeyidir.
ÖRN: Bir zekâ testinin ilk uygulanıĢında zekâ bölümünü 80, ikinci uygulanıĢında 120 ve üçüncü
uygulanıĢında 90 buluyorsak yani sonuçlar arasında tutarlılığın sağlanmamıĢ olması bu zekâ
testinin yeterince güvenilir olmadığının bir göstergesidir.
OBJEKTĠFLĠK: Bir ölçme iĢlemini kim yaparsa yaptın ölçme iĢlemini yapan kiĢinin aynı sonuca
ulaĢması demektir. Örneği, bir matematik öğretmeni bir öğrencinin sınavdan aldığı puanı 70 olarak
hesaplamıĢsa , baĢka bir öğretmende aynı öğrencini puanını 70 olarak hesaplıyorsa , yapılan ölçme
iĢlemi objektif dolayısıyla da güvenilirdir.
18
2009 KPSS SORUSU: Bir okulda, fen bilgisi proje ödevi verilmiĢtir. Ürünlerin puanlanmasının
sınıfta derse giren öğretmen yerine, diğer sınıfın öğretmeni tarafından yapılması sağlanmıĢtır.
Projelere kod numaraları verilmiĢ ve öğrenci isimleri, projeleri değerlendiren öğretmenden
gizlenmiĢtir.
Ayrıca değerlendirme için (kapsamlı, detaylı ve açık) bir puanlama rehberi
oluĢturulmuĢ, öğretmenin bu rehbere göre puan vermesi istenmiĢtir. Yukarıda anlatılan
iĢlemler, kullanılan ölçme aracının hangi özelliğini iyileĢtirmek amacıyla gerçekleĢtirilmiĢtir?
A) Objektiflik B) Ġç tutarlık C) KullanıĢlılık D) GörünüĢ geçerliği E) Yapı geçerliği
* Güvenirlik, sayısal değer alan güvenirlik katsayısı (r) adı verilen bir katsayı ile ifade edilir ve 0
ile 1 arasında değer alır. Güvenirlik katsayısı ölçümlerdeki hatayı değil hatasızlığı belirtir. Yani
güvenirlik katsayısı yüksekse ölçme aracının hatalardan arınıklık derecesinin yüksek olduğu
söylenir. Güvenirlik katsayısının yüksek olması ölçme hatasının düĢük olmasının ifadesidir.
* Güvenilir bir ölçme aracının hatası az, güvenilir olmayan ölçme aracının hatası daha fazladır.
Ölçme hatalarının kestirilmesi ölçümlerin tekrarı ile mümkündür. Aynı koĢullar altında tekrarlanan
ölçümler birbirini tutmayan sonuçlar veriyorsa güvenirlikten söz etmek mümkün değildir.
GÜVENĠRLĠLĠĞĠ HESAPLAMADA KULLANILAN YÖNTEMLER: (Güvenirliği Kestirme Yolları)
A-BĠRDEN FAZLA UYGULAMAYLA GÜVENĠRLĠK BELĠRLEME
1) TEST-TEKRAR TEST YÖNTEMĠ (tutarlık ve kararlılık katsayısı): Güvenirliği hesaplanacak
olan testin, AYNI GRUBA belirli aralıklarla 2 kez uygulanmasıdır. Ġki uygulamanın sonuçları
arasındaki korelasyon katsayısı bulunur. Korelâsyon katsayısı -1.00 ile +1.00 arasında bir değerdir.
Güvenirlik için korelasyon katsayısının +1‘e yaklaĢması gerekir.
Burada bulunan korelasyon katsayısı kararlılık katsayısı olarak bilinir. Korelâsyon katsayısının
yeteri kadar yüksek olması testten elde edilen ölçmenin kararlılığını gösterir. ( 2004 KPSS)
NOT: Bu yöntem daha çok ilgi, tutum, yetenek testlerinde uygulanır. Çünkü ilgi, tutum, yetenek
ölçümden ölçüme değiĢmez.
KORELÂSYON: Ġki değiĢken arasındaki iliĢki miktarını gösterir. Bu iliĢki miktarını gösteren
katsayıya korelasyon katsayısı adı verilmektedir. Bu katsayı -1.00 ile +1.00 arasında bir değer alır.
Örn: AyĢe öğretmen sınıfa uyguladığı testi belli bir zaman sonra tekrar uygulamıĢ ve aralarındaki
güvenirliği tespit etmeye çalıĢmıĢtır.
AyĢe öğretmen güvenirliği bulmada hangi yöntemi kullanmıĢtır? Test – Tekrar Test Yöntemi (E)
2004 KPSS
2007 KPSS: Lisedeki bir rehber öğretmen öğrencilerin mesleki ilgilerini belirlemek için mesleki
ilgi envanteri geliĢtirmiĢtir. Güvenirliğini belirlemek için bu envanteri aynı öğrencilere altı hafta
arayla iki kez uygulamıĢ ve iki uygulamadan elde edilen ölçüler arasındaki iliĢkiyi (korelasyon) 0,45
bulmuĢtur. AĢağıdakilerden hangisi, bu korelasyon değerinin düĢüklüğü için gerekçe olarak
gösterilemez?
A) Ölçülen özellik kolay değiĢme gösteren bir yapıdadır.
B) Ġki uygulamanın koĢulları birbirinden oldukça farklıdır.
C) Öğrenciler maddelere yanıt verirken gerçekçi davranmamıĢlardır.
D) Sorular her okumada farklı anlamlara gelebilmektedir.
E) Ġki uygulama arasında geçen süre çok kısadır.
19
2) PARALEL TESTLER YÖNTEMĠ (EġDEĞER FORMLAR YÖNTEMĠ) (eĢdeğerlik katsayısı):
Bu yöntemde bir testin güvenirliğinin tahmini için; bir testin en az iki eĢdeğer formunun
geliĢtirilmiĢ olması gerekmektedir. Paralel iki testin eĢdeğer olabilmesi için her iki test içindeki
maddelerin sayısı, niteliği ve ölçtükleri davranıĢlar bakımından birbirine denk olması gerekir.
Bu yöntemle güvenirliğin tahmini için yapılması gereken iĢlemler Ģöyledir: Paralel formların
her ikisi de aynı öğrenci grubuna uygulanır ve öğrencilerin iki ayrı formdan almıĢ oldukları puanlar
arasındaki korelasyon hesaplanır.
Paralel testler yöntemiyle elde edilen güvenirlik katsayısı +1.00‘e yakın ise ölçme aracının
hatalardan arınıklığının ve tutarlılığının yüksek olduğu söylenebilir.
EĢdeğer formlar yöntemiyle bulunan bu katsayı EġDEĞERLĠK KATSAYISI olarak da
bilinir. Genellikle bu yöntemle elde edilen güvenirlik katsayısı diğer yöntemlerle elde edilenlerden
daha küçük çıkar. Fakat paralel testler yöntemi bir testin tek formunun aynı öğrenci grubuna iki
kez uygulanmasından daha kullanıĢlıdır.
B- TEK UYGULAMAYLA GÜVENĠRLĠK BELĠRLEME
3) TESTĠ YARILAMA YÖNTEMĠ (EĢdeğer Yarılar Yöntemi)(içtutarlık katsayısı):
Test
güvenirliğini tahmin etmede en çok kullanılan yöntemdir. Çünkü bu yöntem tek bir test formu, tek
bir öğrenci grubu ve tek bir test uygulaması gerektirir.
Bu metotta test maddelerinin yarısı birine diğer yarısı ötekine düĢecek Ģekilde iki ayrı
teste ayrılır. Ġki yarı iki ayrı test imiĢ gibi kabul edilip, aralarındaki korelasyon hesaplanır. Ve
elde edilen değer; test yarı yarıya kısalmıĢ olduğundan yarılardan birinin güvenirlik katsayısını
verir. Testin bütününün güvenirliğini tahmin etmede aĢağıdaki SPEARMAN-BROWN formülü
kullanılır.
2.r¹,²
rx = ————
1+ r¹,²
rx = Elde edilen puanların güvenirlik katsayısı
r¹,² = Yarı testin güvenirlik katsayısı
ÖRNEK: Testi yarılama tekniğiyle elde edilen bir testin güvenirlik katsayısı 0,80 çıkmıĢtır.
Testin tümünün güvenirliği kaçtır?
2. r¹,²
rx = ————— =
1+ r¹,²
2.0,80
———= 0,89
1+0,80
Güvenirliği 1'e yaklaĢtığı için
yüksektir.
Bu yöntemle elde edilen güvenirlik katsayısının yüksek oluĢu her iki formun da güvenilir
olduğuna; yeteri kadar yüksek olmayıĢı da her iki formun güvenirliğinin düĢük olduğuna iĢaret
eder.
Testi yarılarken Ģöyle yapabiliriz = 50 sorudan oluĢan bir matematik testinin soruları 1, 3,
5 gibi tek numaralı sorular Ģeklinde iki ayrı gruba ayrılırsa ve bu iki grup sorudan elde edilen
puanlar arasında korelasyon hesaplanırsa elde edilen katsayı tüm testi ikiye bölerek elde
ettiğimiz yarım testlere ait korelasyon katsayısını yani yarım testlerin güvenirliğini verecektir.
20
4) ĠÇ TUTARLILIK YÖNTEMĠ:
Ġç tutarlılık katsayısı testin bir defa uygulanması ile
güvenirliğin kestirilmesini sağlayan katsayıdır. Bir testteki maddelere verilen cevaplar toplam
test puanı ile uyumlu ise bu durumda testin iç tutarlılığa sahip olduğu söylenebilir. Yani bir testi
oluĢturan maddelerin birbiriyle uyumu iç tutarlılığı ifade eder. Ġç tutarlılık anlamında güvenirliğin
hesaplanabilmesi için birden fazla formül bulunmaktadır. Bu formüller testi oluĢturan maddelerin
niteliğine göre değiĢir. Buna göre KR–20, KR–21 ve ALPHA GÜVENĠRLĠK katsayısı adı verilen
formüller kullanılır.
KUDER-RĠCHARDSON 20 ve 21 FORMÜLLERĠ (KR–20, KR–21)
1 ile 0 Ģeklinde puanlanan maddelerden oluĢan testlerin güvenirliği hesaplanırken KR–20 denilen
bir formül kullanılır. Bu formül testteki tüm maddelerin aynı psikolojik özelliği ölçtüğü
varsayımdan yola çıkar.
KR–20 güvenirlik katsayısı bir defada uygulanan bir ölçme aracının iç tutarlılığını veren bir
katsayıdır. Kuder Richardson formülleri testteki her bir maddenin aynı değiĢkeni ölçtüğü yani
testtin ölçtüğü Ģeyin HOMOJEN olduğu sayıltısına dayanır. KR–20 formülü sadece doğru
cevaplandırılan maddelere 1 puan vererek yanlıĢ cevaplandırılan ve boĢ bırakılan maddelere ise hiç
puan verilmeksizin puanlanan testlere uygulanabilir. Eğer testteki maddeler farklı ağırlıklar ile
puanlanmıĢ ise bu formül kullanılmaz. Test içerisindeki her bir maddenin güçlük derecesi yani her
bir maddeye doğru cevap veren öğrencilerin toplam öğrencilere oranı hesaplanan bir testin
güvenirliğini tahmin etmek için KR–20 formülünü kullanırız.
NOT: 10–15 civarında maddeden oluĢan çoktan seçmeli bir testte 0,50 kadar düĢük bir KR–20
güvenirlik katsayısı yeterlidir. Ancak 50 maddenin üzerindeki testler için KR–20 değeri en az
0,80 olmalıdır.
KR–20 ile belirlenen güvenirlik katsayısı yüksek ise testle ilgili aĢağıdaki yorumlar
yapılabilir.
►Puanlar tesadüfü hatalardan arınıktır yani duyarlıdır. Hatası azdır.
►Ölçülen değiĢkenler tek boyutludur.
►Testi oluĢturan maddeler homojendir. Yani testteki her bir madde aynı değiĢkeni ölçmüĢtür ve
maddeler birbiriyle uyumludur.
► Grup heterojendir. Yani uygulanan test gruptaki öğrencileri birbirinden iyi ayırmıĢtır.
►Testin yapı geçerliliği yüksektir.
NOT: KR–20 Formülü 1 ile 0 Ģeklinde puanlanan maddeler için kullanılmaktadır ve bu maddeler
farklı zorluk düzeyine sahiptirler. Bazı durumlarda testi oluĢturan maddelerin zorluk dereceleri
birbirine çok yakın olabilir. O zaman KR–21 denilen ve KR–20 formülünün özel bir durumu olan
baĢka bir formül kullanılır.
KR-21 ile hesaplanan güvenirlik katsayısı , KR-20 ile hesaplanan güvenirlik katsayısından
her zaman küçüktür.( KR21<KR20)
KR-21 ĠLE hesaplanan güvenrilik katsayısı KR-20 ile hesaplanan güvenirlik katsayısından
küçük olduğu için ; KR-21 güvenirliğin alt sınırıdır.
Örnek: KR–20 formülünün kullanıldığı çoktan seçmeli bir teste maddelerin güçlük düzeyleri 0,70;
0,60; 0,50 vb. olabilirken KR–21 Formülünün uygulandığı bir testte madde güçlükleri 0,71; 0,72;
0,73; 0,74 Ģeklinde birbirine daha yakındır.
21
ALPHA () GÜVENĠRLĠK KATSAYISI:
Alpha güvenirlik katsayısı tek bir uygulama gerektiren güvenirlik bulma tekniklerden
biridir. Ağırlıklı puanlama ve dereceleme yöntemiyle puanlama yapıldığı durumlarda
kullanılabilecek bir güvenirlik bulma tekniğidir. Testi oluĢturan maddelerin dereceleme ölçeğine
göre puanlanması (1 den 5‘e kadar veya 0 dan 4‘e kadar puan verilmesi gibi ) genellikle psikomotor
becerileri ölçmek amacıyla hazırlanan ölçme araçlarının puanlanmasında veya tutum ölçeklerinin
puanlanmasında kullanılmakta birlikte KISA CEVAPLI TESTLERĠN güvenirliğinin kestirilmesinde
kullanılır.
Alpha güvenirlik katsayısı KR–20 güvenirlik katsayısının genelleĢtirilmiĢ bir Ģeklidir. Alpha
güvenirlik katsayısı da tıpkı KR–20 güvenirlik katsayısı gibi bir iç tutarlılık katsayısıdır. 0 ile 1
arasında değer almaktadır.
NOT: Testte ölçülecek olan özellik heterojen bir yapıda ise KR–20 ya da Alpha güvenirlik
katsayılarının yerine Testi Yarılama Yöntemi kullanılmalıdır. Heterojen bir yapıda olan test için
testi yarılama yönteminin kullanımı daha uygundur ve yüksek güvenirlik katsayısı verir.
NOT:
KR–20 ve KR–21 iç tutarlılık katsayıları 0 ile 1 Ģeklinde puanlanan testlerde kullanılırken
ALPHA güvenirlik katsayısı ise dereceleme ölçeğine göre puanlanması durumunda kullanılır. Örn: 1
den 5‘e kadar veya 0 dan 4‘e kadar puanlama.
Hem KR–20–21 hem de ALPHA güvenirlik katsayısı test maddelerinin homojen olduğu
durumlarda kullanılır, her ölçüde iç tutarlılık katsayısını ifade eder. Eğer test maddeleri arasında
heterojenlik söz konusu ise TESTĠ YARILAMA yöntemi daha güvenilir sonuçlar verir.
ÖLÇMENĠN STANDART HATASI:
Bir testten elde edilen puanlardaki
hata miktarını belirten göstergelerden biri de ölçmenin standart hatasıdır. Ölçmenin standart
hatası Ģu formül ile hesaplanabilir:
Se = Sx.
1  rx
Se: Ölçmenin standart hatası
Sx: Test puanlarının standart kayması (sapması)
rx: Testin güvenirliği
Formülden de anlaĢılacağı üzere ölçmenin güvenirliği ile standart hatası arasında ters
yönlü bir iliĢki vardır. Yani standart hata azaldıkça ölçümlerin güvenirliği artar.
Örneğin; güvenirlik 1 ise ölçmenin standart hatası 0,00 olur. Ki bu ölçmenin standart
hatasının alabileceği en küçük değerdir. Güvenirlik 0,00 ise ölçmenin standart hatası standart
sapmaya eĢit olur bu ölçmenin standart hatasının maksimum değeri olur.
2004 KPSS: AĢağıda standart sapma ve güvenirlik katsayıları verilmiĢtir. Hangisinin
ölçmede standart hatası en düĢüktür?
SS
GÜVENĠRLĠK
A)
2
0,50
B)
4
0,50
C)
5
0,30
D)
2
0,90
E)
5
0,60
22
→
Güvenirlik katsayısının
yüksek olması bu Ģıktaki
standart hatanın düĢük
olmasını göstermektedir.
BĠR TESTĠN GÜVENĠRLĠĞĠNĠ ETKĠLEYEN BAġLICA FAKTÖRLER
A) TESTĠN UZUN OLMASI: Bir testteki soru sayısı arttıkça testin güvenirliği de artar. Bunu
Ģöyle açıklayabiliriz: Seçmeli testlerden elde edilen puanlara, doğru cevabın Ģansla
bulunabilmesinden doğan Ģans hatası karıĢır. Test puanlarına Ģans hatası karıĢtığı oranda testin
güvenirliği düĢer. Soru ve seçenek sayısı arttıkça doğru cevabın bulunma olasılığı azalır.
Dolayısıyla testin güvenirliği artar. (soru sayısını artırmak güvenirliği artırmanın en öncelikli
yoludur.)
2003 KPSS: Bir lise öğretmeni kullandığı 4 seçenekli sorularını seçenek sayısını artırarak 5
seçeneğe çıkmıĢtır. Öğretmen bu değiĢikliği aĢağıdakilerden hangisini gerçekleĢtirmek amacıyla
yapmıĢ olabilir?
A) ġans baĢarısını azaltmak, → *
B) Testin kapsamını zenginleĢtirmek,
C) Puanlamayı kolaylaĢtırmak,
D) Çeldiricilerin aynı derecede çalıĢmasını sağlamak,
E) Soruları güçleĢtirmek,
NOT: Bir testi uzatmakla yani bir teste önceki maddelere benzer yeni maddeler eklemekle
güvenirlikteki beklenen artıĢı yordamak için SPEARMAN-BROLUN formülü adıyla bir formül
kullanılır.
n.rs
rn = —————
(n-1). rs+1
rn: Kısa testin n katı uzatılan testin güvenirlik katsayısı
rs: Uzatılacak olan kısa testin güvenirlik katsayısı
n : Kısa test kaç kat uzatılmak isteniyorsa o katsayısı
ÖRNEK: Güvenirliği 0,50 den 0,90‘a çıkarmak istediğimiz bir testi ilk uzunluğunun kaç katı
uzatmak gerekir?
n.0,50
n= 9 TTest 9 kat uzatılmalıdır.
0,90 = —————— = 9
(n-1).0,50+1
Spearman-BROWN FORMÜLÜ = * Teste sonradan konulan maddelerin önceki maddeler gibi aynı
davranıĢları ölçtüğü ve yeni maddelerin ortalama güçlüklerinin önceki maddelerin ortalama
güçlüklerine denk olduğu.
* Test uzamakla birlikte cevaplayıcıların ona cevap verme biçiminin değiĢmediği sayıltılarına
dayanır.
23
B) TEST YÖNERGESĠNĠN VE TEST MADDELERĠNĠN ĠFADESĠ: Sınav yönergesi ve sorular
ne kadar açık ve anlaĢılır olursa güvenirlik o kadar yükselir. Testin baĢında cevaplayıcılar için bir
yönerge bulunmalıdır. Cevaplama iĢleminin nasıl yapılacağı, testin nasıl puanlanacağı, testte kaç
soru bulunduğu vb. yönergede açıkça belirtilmiĢ olmalıdır.
Testte yer alan soruların açık ve anlaĢılır olup olmaması da testten elde edilen puanların
güvenirliğine etki eder. AnlaĢılması güç ve ne sorduğu açıkça anlaĢılmayan sorulara verilen
cevaplar güvenilir olmaz. Çünkü bu tür sorular ya cevaplayıcıların soruya verdiği anlama göre ya da
büsbütün geliĢi güzel cevaplandırılırlar. Böylesi sorulara değiĢik zamanlarda verilen cevaplar farklı
olacağından içinde bu tür soruların yer aldığı bir testin güvenirliği düĢük olur. Bu nedenle bir
testteki maddelerin anlatımı yalın ve anlaĢılır olmalıdır.
C) TEST ĠÇERĠĞĠNĠN BENZEġĠKLĠĞĠ (HOMOJENLĠĞĠ): Ölçtükleri davranıĢ ve konu
bakımından homojen maddelerden oluĢan bir testten elde edilen puanlar heterojen bir testten
elde edilen puanlardan daha güvenilir olur. Sözgelimi 100 maddelik bir SOSYOLOJĠ TESTĠ 100
maddelik bir SOSYAL BĠLĠMLER testinden daha güvenilirdir.
D) PUANLAMADAKĠ NESNELLĠK: Bir testin güvenirliğini onun puanlamasının nesnel olup
olmayıĢı büyük ölçüde etkiler. Bir testin değiĢik kiĢilerce ya da aynı kiĢi tarafından değiĢik
zamanlarda puanlanmasından elde edilen puanlar arasındaki tutarlılığa o testin puanlama
güvenirliği denir. Bir testten elde edilen puan puanlayıcıya veya puanlandığı zamana göre
değiĢmiyorsa o testin puanlama güvenirliği yüksektir. Puanlama güvenirliği yüksek olan bir testin
güvenirliği de yüksek olur.
E) SINAVIN YAPILDIĞI ORTAM: Ortamda ısı, ıĢık, havalandırma, nem, güneĢ alma, gürültü gibi
değiĢkenlerin düzenli olması güvenirliği etkiler. Standart koĢullar altında yapılmayan bir ölçme
bireylere daha baĢlangıçta eĢit fırsatlar tanımadığından güvenirliği düĢürür.
F) ZAMAN (SÜRE): Sınava verilen sürenin gereğinden az olması veya gereğinden fazla olması
güvenirliği etkiler.
G) TESTĠN GÜÇLÜK DÜZEYĠ: Test maddelerinin çok kolay ya da çok zor oluĢu testin
güvenirliğini etkiler. Sorular orta güçlükte olmalıdır.
H) KOPYA ÇEKME: Kopya çekme davranıĢı öğrencinin gerçek bilgisini göstermediğinden dolayı
güvenirliği etkiler.
I) ÖLÇMENĠN YAPILDIĞI KĠġĠLER: Bireylerin ölçüme alındığı zamanda içinde bulundukları
özel koĢullar ve geçirdikleri olumsuz yaĢantılar güvenirliği etkiler. Örn: Öğrencinin sınav günü
hasta olması, hızlı okuma becerisinin düĢük olması vb…
2006
KPSS:
Hazırladığı
testin
güvenirliğini
artırmak
isteyen
bir
öğretmen
aĢağıdakilerden hangisini sağlamaya çalıĢmalıdır?
A) Testteki soruların ve seçeneklerin dil bilgisi kurallarına uygun olmasını
B) Soruların açık, net ve anlaĢılır olmasını
C) Seçenekler ile soru kökünün ifade bakımından birbirleriyle tutarlı olmasını
D) Test kapsamında ölçülmek istenilen her özelliğe ait soru bulunmasını
E) Seçeneklerin birbirine eĢit ya da yakın uzunlukta olmasını
24
öncelikle
ÖLÇME ARACININ GÜVENĠRLĠĞĠNĠ ARTIRACAK GENEL ĠLKELER
1) Soru sayısı arttıkça sınavın güvenirliği artar. Çünkü soru sayısı arttıkça ölçme hatası
azalır.
2) Sorular öğrencilerin düzeylerine uygun hazırlanmalıdır. Sınav soruları öğrenci seviyesinin
üzerinde ya da altında hazırlanmıĢsa güvenirlik azalır.
3) Cevaplayıcıların soruları cevaplama yönünde istekli oluĢu güvenirliği arttırır.
4) Sınav süresinin soru sayısı ve güçlüğü ile iliĢkili olması güvenirliği etkiler.
5) Sorular bilenle bilmeyeni ayırıcı nitelikte olmalıdır.
6) Ölçme iĢlemi titizlikle yapılmalı, kopya çekilmesi önlenmelidir.
7) Sınavda sorulan sorular açık, anlaĢılabilir ve kesin cevaplanabilir nitelikte olmalıdır. Bu
durum öğrencilerin geliĢi güzel cevaplarını engellediği için güvenirliği arttırır.
8) Sınavın objektif yollarla puanlanması ve cevap anahtarının önceden hazırlanması
güvenirliği arttırır.
9) Öğrencilerin sınavlarla ilgili fikirleri ve önyargıları olumsuz ise bu durum güvenirliği
düĢürür.
10) Duyarlığı yüksek bir araç sürekli yüksek güvenirlik verir.
2008 KPSS: Bir öğretmen aynı kapsamda ve düzeyde iki ayrı sınav hazırlamıĢ ve aynı gruba
uygulamıĢtır. Bu sınavların özellikleri Ģöyledir:

Birinci sınavda 25 soru vardır ve her soru 4 puan değerindedir.

Ġkinci sınavda 10 soru vardır ve her soru 10 puan değerindedir.
―Birinci sınavdan elde edilen puanların güvenirliği daha yüksektir.‖ diyen bir kiĢi bu iddiasını
aĢağıdaki açıklamalardan hangisiyle destekleyebilir?
A) Bir sınavda yanıtların nasıl puanlanacağı kullanılan soru tipine göre değiĢir.
B) Puanlamanın nesnelliği ölçmeden kaynaklanabilecek hatayı azaltır.
C) Soruların ayırt edicilik dereceleri test puanlarının güvenirliğini etkiler.
D) Soruların güçlük dereceleri test puanlarının güvenirliğini etkiler.
E) Testteki soru sayısı arttıkça ölçme sonuçlarına karıĢan hata miktarı azalır.
2) GEÇERLĠK:
Ölçme araçlarında bulunması gereken üç nitelik içinde en önemlisi GEÇERLĠK tir.
GEÇERLĠK; bir ölçme aracının ölçmeyi amaçladığı özelliği, baĢka herhangi bir özellikle
karıĢtırmadan doğru olarak ölçebilme derecesidir. BaĢka bir deyiĢle bir ölçme aracının
geliĢtirilmiĢ bulunduğu konuda maksada hizmet etmesidir.
ÖRNEK: Uzunluk ölçmek için geliĢtirilmiĢ olan metre kiĢilerin boylarını ölçme amacına hizmet
eder. Bu demektir ki bir ölçme aracı olan metre, uzunluk ölçmede geçerlidir fakat ağırlık ölçmede
geçerli değildir.
25
Bir aracın geçerli olması için, onun sadece ölçmek için düzenlendiği özelliği ölçmesi yani
onu baĢka özelliklerle karıĢtırmadan ölçmesi de gerekir. Mesela; yazı güzelliği, ifade biçimi, sayfa
düzeni, yanlılık vb. etkenlerin de ölçmeye karıĢmaması gerekir. Bu etkenlerin ölçmeye karıĢması
geçerliği düĢürür.
ÖRNEK: Bir öğretmen yaptığı bir Biyoloji sınavında yüksek bir okuma yeteneği ve kelime bilgisi
gerektirecek sorular sormuĢ ve puanlama yaparken de yazı güzelliği, sayfa düzeni vb. özelliklere
de fazla puan vermiĢtir. Böyle bir test ölçmeyi amaçladığı özelliği baĢka özellikleri de karıĢtırarak
ölçtüğü için geçerliliği düĢüktür.
NOT: Bir baĢarı testinin niteliği; ölçülecek olanın ne olduğuna ve onun nasıl ölçüleceğinin açıkça
belirlenmiĢ olmasına bağlıdır. Ne ölçülecek sorusunun cevabı testin uygunluk ve ilgililik özelliği ile
ilgilidir. Nasıl ölçülecek sorusunun cevabı büyük ölçüde testin güvenirliği ile ilgilidir.
Ölçtüğü Ģeyle ilgili olan ve ölçtüğü Ģeyi tutarlı olarak ölçen bir test GEÇERLĠDĠR. Bu yargı
geçerliğin iki önemli öğesi olduğunu belirtir:
► UYGUNLUK VE ĠLGĠLĠLĠK: Bir test için uygunluk onun ölçmek için düzenlediği özellik ya da
özelliklerle ilgili olmasıdır. Bir testin kapsadığı maddeler dersin geliĢtirmek istediği davranıĢları
yansıtıyor ve onları yeterince örnekliyorsa o zamanda ĠLGĠLĠ dir.
► GÜVENĠRLĠK: Bir testin geçerli olması için tutarlı bir biçimde ölçümde yapması gerekir. Bu
nedenle güvenirlik geçerliğin önemli bir parçasıdır. Bir test geçerli olmak için güvenilir olmak
zorundadır ancak güvenirlik geçerlik için bir önkoĢul olmasına karĢın yeterli değildir. Güvenilir olan
bir test her zaman geçerli olmayabilir.
ÖRN: Bir kısmı olmayan bir cetvelle bir kitabın boyunu 4 defa ölçerek aynı sonuca ulaĢabiliriz.
(Güvenilirdir) Fakat bu ölçme amacına hizmet etmekten uzaktır yani doğru ölçüm yapmamaktadır.
Dolayısıyla GEÇERLĠ değildir. Yani test tutarlı ölçme yapabilir ama ölçmek istediği özelliği
ölçmeyebilir.
Bir testin geçerliği bir derece sorunudur. Ya hep ya hiç sorunu değildir. Bir test hepten
geçerli veya hepten geçersiz olmak yerine daha çok veya daha az geçerli olabilir. (yüksek orta
veya düĢük)
Bir testin geçerliği o testten elde edilen puanlarla belli bir ölçütler takımı arasındaki iliĢki
bakımından belirlenir. Burada ölçütler takımı olarak neyin alınması gerektiği testin kullanılıĢ
maksadına bağlıdır. Test puanları ile ölçütler takımı arasındaki iliĢki katsayısına GEÇERLĠK
KATSAYISI adı verilir. Geçerlik katsayısı -1.00 ile +1.00 arasında değiĢir. Bir test için geçerlilik
en fazla GÜVENĠRLĠĞĠN KAREKÖKÜNE EġĠT OLABĠLĠR.
ÖRN: Güvenirliği 0,81 olan bir testin geçerliği en fazla kaç olur?
0,81  0,90 → GEÇERLĠK
EĞĠTĠMDE KULLANILAN
TÜRLERĠ ġUNLARDIR:
TESTLER
ĠÇĠN
SÖZKONUSU
OLAN
BAġLICA
GEÇERLĠK
1) KAPSAM GEÇERLĠĞĠ: Bir ölçme aracındaki en önemli geçerlik türüdür. Kapsam geçerliği bir
bütün olarak testin ve testteki her bir maddenin maksada ne derce hizmet ettiğidir. Bir testin
kapsam geçerliği:
a) O testteki toplam maddelerin ölçülecek davranıĢları ve konu içeriğini örnekleme
derecesine ve
b) Testteki her bir maddenin ölçmek istediği davranıĢı ne derece iyi ölçtüğüne bağlıdır.
26
Bir testin kapsam geçerliğine sahip olması için bu iki isteğin birlikte karĢılanması gerekir.
Ölçme konusu; evreni yeterli ve dengeli olarak örnekleyen ve kapsadığı maddelerin her biri
ölçmek istediği davranıĢı gerçekten ölçen bir test kapsam geçerliğine sahiptir.
Bir testin kapsam geçerliği Ģu iki ana yaklaĢımdan birisiyle belirlenebilir:
► Mantıksal ya da Rasyonel YaklaĢım: Mantıksal olarak kapsam geçerliğini belirlemede
testteki her bir maddenin ve bir bütün olarak testteki maddelerin dağılımının testin ölçmeye
yöneldiği davranıĢlarla, konuları kapsayıp kapsamadığına bakılır. Bunun içinde;
→ Testteki maddelerin dağılımının belirtke tablosundaki dağılıma uygun olup olmadığına;
→ Her bir maddenin diğer maddelerce ölçülenlerden farklı bir davranıĢı ölçmeye yönelip
yönelmediğini ve ölçmeye yöneldiği davranıĢı ölçmedeki elveriĢliliğine bakılır.
Bu konuda baĢvurulabilecek bir yolda Ģudur: Belirtke tablosuna bağlı kalarak hazırlanan bir test
aynı dersi okutan baĢka öğretmenlere, testin ilgili olduğu konuyu iyi bilen kiĢilere (konu alanı
uzmanlarına) ve ölçme değerlendirme uzmanlarına incelettirilebilir.
►Ġstatistiksel YaklaĢım: Bir testin geçerliğini belirlemede ĠSTATĠKSEL YAKLAġIM da
kullanılabilir. Bu yaklaĢımda bir konuya iliĢkin bir ölçme aracı yeni hazırlanmıĢ ise daha önceden
hazırlanmıĢ ve uygulanmıĢ yani geçerliği tespit edilmiĢ baĢka bir araçla karĢılaĢtırılır. Bu iĢlemler
yapılırken Ģu yollar izlenir:
→ Her iki ölçüm aracı aynı öğrencilere uygulanarak öğrencilerin aldıkları puanlar birbirleriyle
karĢılaĢtırılır.
→ Daha sonra korelasyon katsayısı bulunur ve elde edilen korelasyon katsayısı ne kadar büyükse
(yani +1.00‘a yakın ise) uygulanacak aracın geçerliği de o oranda yüksek olacaktır.
Görüldüğü üzere KAPSAM GEÇERLĠĞĠ, bir testin ölçmek istediği davranıĢları ne kadar kapsadığı
ile ilgilidir.
2009 KPSS SORUSU: Bir araĢtırmacı çoklu zekâ alanlarını ölçmek amacıyla geliĢtirdiği çok boyutlu testi,
dil bilimi, matematik, resim, heykel, müzik, beden eğitimi, iletiĢim, psikoloji bölümlerindeki öğrencilere
uygulamıĢtır. Uygulama sonucunda farklı bölümlerdeki öğrencilerin kendi alanıyla ilgili sorulardan yüksek,
diğer alanlardaki sorulardan ise daha düĢük puan aldıklarını saptamıĢtır.
Buna göre, ölçme aracı için aĢağıdakilerden hangisi söylenebilir?
A) Amaca hizmet etme derecesi düĢüktür.
B) Hata düzeyi düĢüktür.
C) Geçerliği yüksektir.
D) KullanıĢlılığı yüksektir.
E) Güvenirliği düĢüktür.
2001 KMS: Bir matematik öğretmeni derste problem çözmeye yönelik aktivitelere ağırlık verdiği
halde yaptığı sınav daha çok dört iĢlem yapabilme becerisini ölçen sorulardan oluĢmuĢtur.
Öğretmen bu yaklaĢımıyla aĢağıdakilerden hangisini olumsuz yönde etkilemiĢtir?
A) Puanıyla güvenirliği
B) Test-tekrar test güvenirliği
C) Testin kullanıĢlılığı
D) Testin kapsam geçerliği
*
E) Soruların ayırt ediciliği
27
2003 KPSS: Bir baĢarı testinde kapsam geçerliği yüksek ise aĢağıdaki sonuçlardan hangisi
doğrudur?
A) Tutarlı ve kararlı sonuçlar veren bir testten yararlandığı;
B) Testteki soruların pek çoğunu öğrencilerin doğru olarak yanıtlayabildikleri,
C) Testteki soruların konu alanını iyi bir Ģekilde örneklediği,
D) Testteki soruların güçlük düzeylerinin gerçekleĢmesi beklenen öğrenme
düzeylerine uygun olduğu,
E) Öğrencilerin testteki soruları yanıtlamaya çalıĢtıkları,
2) ÖLÇÜT GEÇERLĠĞĠ: Ġkiye ayrılır:
a) Yordama geçerliği:
YORDAMA; Ġstatistiksel teknikler kullanılarak ve bilinenlerden
yararlanarak bilinmeyen durumlar hakkında GELECEĞE YÖNELĠK tahminlerde bulunma iĢlemidir.
Yordama bir tahmindir. Ancak her tahmin bir yordama değildir. Bir tahminin yordama olabilmesi
için onun geleceğe dönük olması ve belli bilgiler temelinde bazı teknikler kullanılarak yapılmıĢ
olması gerekir.
Eğitimde kullanılan ölçme araçlarından bazıları özellikle bireylerin bir okulda ya da
bir iĢte göstermeleri gereken baĢarıları YORDAMAK için düzenlenmiĢlerdir. Genellikle bireylerin
bir programa ya da bir iĢe alınıp alınmaması onların bir testten elde ettikleri puanlara veya daha
önceki bir programda almıĢ oldukları notlara göre karara bağlanır.
ÖRNEK: Eğitim enstitülerine veya üniversitelere alınacak öğrencileri seçmek için yapılan sınavlar.
Yapılacak sınavın bir üst eğitime geçebilecek öğrencileri seçebilme düzeyinin incelenmesi de bir
yordama geçerliğidir.
ÖRNEK: Öğrencinin matematik testindeki puanını göz önüne alarak fizik dersindeki baĢarı
durumu hakkında fikir yürütmek.
ÖRNEK: Okula daha baĢlamamıĢ bir öğrencinin zekâ testinden aldığı puana bakarak okuldaki
baĢarı durumunun ne olacağını tahmin etmeye yönelik yapılan çalıĢma da YORDAMA çalıĢmasıdır.
KiĢilerin gelecekteki baĢarılarını yordamak için kullanılan testlerin bu maksada hizmet etmesi yani
yordama geçerliğine sahip olması istenir. Bir testin yordama geçerliği o testten elde edilen
puanlar ile testin yordamak için düzenlendiği değiĢkenin doğrudan ölçüsü olan ve daha sonra elde
edilen ölçüt arasındaki KORELÂSYONDUR.
Bu biçimde hesaplanan korelasyon katsayısı YORDAMA GEÇERLĠĞĠ katsayısı olarak adlandırılır.
Korelâsyon katsayısının büyüklüğü YORDAMA geçerliğinin yüksekliğine iĢaret eder.
NOT: Genellikle bir zekâ ya da baĢarı testinin yordama geçerliğini belirlemede ölçüt olarak ders
notları alınır. SözgeliĢi üniversiteler arası seçme sınavında almıĢ oldukları puanlara göre,
üniversitelere girmiĢ olan öğrencilerin üniversitelerde almıĢ oldukları notlar arasındaki korelasyon
katsayısı üniversiteler arası seçme sınavının YORDAMA GEÇERLĠĞĠ katsayısıdır. Genel bir kural
olarak test puanının elde edilmesi ile ölçüt ölçüsünün (üniversitelerde almıĢ olduğu puanlar) elde
edilmesi arasında geçen zaman arttıkça korelasyon düĢer.
28
2007 KPSS: Pazarlama elemanları seçiminde kullanılmak üzere bir test geliĢtirilmiĢ ve iĢe
alımlarda bu test uygulanmıĢtır. Daha sonra, iĢe alınan elemanların ilk aydaki baĢarılı satıĢ sayıları
ile iĢe giriĢte aldıkları test puanları arasındaki uyum incelenmiĢtir.
Yukarıda belirtilen inceleme, uygulanan testin hangi özelliği hakkında bilgi verir?
A) Yordama geçerliği
B) Yapı geçerliği
C) Kapsam geçerliği
D) Ġç tutarlığı
E) Puanlayıcılar arası güvenirliği
b) Uygunluk Geçerliği: Yordayıcı puanın sonradan elde edildiği geçerlik türüdür. Yani bu geçerlik
türünde sürece bakıp öğrencinin sınav sonucu tahmin edilmektedir.
ÖRN: Öğrencinin ilköğretimdeki baĢarısına bakılarak OKS puanının tahmin edilmesi…
NOT: Yordama geçerliğinde öğrencinin sınav sonucuna bakıp süreçteki baĢarısı tahmin edilmekte
iken; uygunluk geçerliğinde süreçteki baĢarısına bakılarak sınav sonucu tahmin edilmektedir.
2003, 2004 KPSS: AĢağıdakilerden hangisinde bir yordama geçerliği vardır?
CEVAP: Yapılan bir sınavın bir üst eğitime geçebilecek öğrencileri seçebilme düzeyinin
incelenmesi…
3) YAPI GEÇERLĠĞĠ: Birbiriyle iliĢkili olduğu düĢünülen belli öğelerin ya da öğeler arasındaki
iliĢkilerin oluĢturduğu bütüne yapı denir. Bir testin içinde yer alan her bir maddenin, testin
bütünüyle iliĢkili olmasıdır. Testin bir maddesi bile testin bütününden ayrı olmamalıdır.
Yapı geçerliği; bütüne aykırı soru sorulduğu zaman bozulur. Türkçe testinin soruları
içerisinde bir Tarih sorusu sorulursa bütün bozulmuĢ ve yapı geçerliği düĢmüĢ olur.
Zekâ, yetenek, kritik düĢünme gibi özellikler bir yapıdır. Mesela; zekânın kendine özgü alt öğeleri
vardır ve bu öğeler birbirleri arasında iliĢkilidir. Bu tür yapıların ölçülmesinde ölçülecek olan yapı
tanımlanır, bunlardan ölçülebilir davranıĢlar çıkarılır ve bunları ölçecek test maddeleri geliĢtirilir.
Bir testin yapı geçerliğinin çalıĢılması testin maddelerinin ilgili olduğu alanı kapsamasına ve
maddeler arasındaki iliĢkilerin analizine dayanır.
Yapı geçerliği, bir testin veya ölçme iĢleminin teorik bir yapıyı ölçüp ölçmediğinin
belirlenmesidir. (Teorik yapı: KiĢilik, yaratıcılık, ilgi, zekâ, tutum vb) Yapı geçerliğinin temel
mantığı; ölçülmesi planlanan teorik yapıya yüksek derecede sahip olan bir grupla düĢük derecede
sahip olan baĢka bir gruba testi uygulayıp testin bu grupları ne derece uygun olarak ayırıp
ayırmadığına bakmaktır.
Yapı geçerliğini kanıtlamada kullanılan en geçerli yollar;
* faktör analizi yapmak ( Sorular arasında ki iliĢkileri inceleyerek birbirleriyle çok iliĢkili olan
soru grupları oluĢturmak demektir.)

*uzman görüĢünü almak

*Testin bilgili ve bilgisiz öğrenciler arasındaki ayrımı yapılabilmesi/ayırt edebilmesi

* her sorunun yapının bir tek bölümünü ölçtüğünün gösterilmesi

*Testi cevaplayanlarla nasıl cevapladıkları hakkında görüĢülmesi

*Testin uzun dönemde kararlı olduğunun gösterilmesi.
29
ÖRNEK: 25 maddeden oluĢan bir testin bir grup öğrenciye uygulandığını düĢünelim. Testin birinci
maddesinin testin bütünüyle iliĢkili olup olmadığını anlamak için bu maddeye öğrencilerin verdikleri
cevaplardan elde edilen puanlar ile bu madde dıĢında 24 maddeden öğrencilerin elde ettiği puanlar
arasındaki korelasyona bakılır. Birinci maddeden elde edilen puanlar ile diğer 24 maddeden elde
edilen puanlar arasındaki korelasyon yüksek ise bu madde YAPI GEÇERLĠĞĠNE sahiptir. Bu iĢlem
testte yer alan her bir madde için ayrı ayrı gerçekleĢtirilerek her bir maddenin YAPI GEÇERLĠĞĠ
tespit edilir.
4) GÖRÜNÜġ GEÇERLĠĞĠ: Bir testin gerçekten ne ölçtüğü ile değil onun ne ölçüyor göründüğü
ile ilgilidir. Bir testin görünüĢ geçerliği o testin ölçmek istediği Ģeyi ölçüyor görünmesidir.
GörünüĢ geçerliği olan bir test kapağında ne yazılıysa onu ölçüyor görünür. ÖRNEK: Kapağında
Ġngilizce testi yazılı olan bir testin içinde Ġngilizce ile ilgili sorular varsa bu testin görünüĢ
geçerliği vardır.
NOT: Testin görünüĢ geçerliği bazı durumlarda yükseltilmeli bazı durumlarda gizlenmelidir. Eğer
bir test piyasaya kabul ettirilmek isteniyorsa görünüĢ geçerliği yükseltilmelidir. Buna karĢılık
KĠġĠLĠK TESTLERĠNĠN ve kiĢilik testlerindeki maddelerin görünüĢ geçerlikleri gizlenmelidir.
Yoksa kiĢiler maddelere doğru cevap vermekten kaçınabilirler.
5) MEVCUT HAL GEÇERLĠĞĠ (hali hazır geçerliği): Öğrencinin bugünkü durumunu belirlemek
amacıyla kullanılan ölçme aracının sahip olması gereken bir özelliktir. Daha çok öğrencinin Ģimdiki
davranıĢı ile ilgilidir. Eğer öğrenciler sınava girmeden önce iyi hazırlanmıĢlar ise sınavda baĢarılı
olacaklardır.
NOT: PSĠKOLOJĠK TESTLER ĠÇĠN ÖNCELĠKLE YAPI GEÇERLĠĞĠNE, BAġARI TESTLERĠ
ĠÇĠN KAPSAM GEÇERLĠĞĠNE, TANIMA VE YERLEġTĠRME TESTLERĠ ĠÇĠN ĠSE ÖNCELĠKLE
YORDAMA GEÇERLĠĞĠNE BAKILMALIDIR.
GEÇERLĠĞĠ ETKĠLEYEN FAKTÖRLER
►Güvenirlik: Bir testin güvenilir olması geçerli olmasını etkileyen faktörlerden biridir. Güvenirlik
geçerlik için gerekli ama yeterli bir Ģart değildir.
►Ölçme Sisteminden Kaynaklanan Hatalar(Sistematik-Yanlılık): Ölçme iĢlemine katılan sabit
hatalar ile sistematik hatalar geçerliği düĢürür.
►Ölçme Yönteminin Bireyin Alacağı Puanı Etkilemesi: Bir derste yazılı yoklama, çoktan seçmeli
test ya da doğru-yanlıĢ testi gibi yöntemlerden birinin kullanılması öğrencinin alacağı puandaki
hata miktarını değiĢtirebilir.
►Ġstenmeyen DeğiĢkenlerin Ölçümlere KarıĢması: Sınavın ölçmeyi hedeflediği özelliklerden
baĢka özellikleri ölçmesi geçerliği düĢürür. Örn: Coğrafya dersinin sınav kâğıdında yazının
güzelliğinden veya çizilen grafiğin düzgünlüğünden etkilenerek fazla puan verilmesi geçerliği
düĢürür.
►Sınavda ölçülecek davranıĢları uygun maddeler ile ölçmemek geçerliği düĢürür.
NOT: Bir ölçme aracının geçerliğini artırmak için alınması gereken önlemler Ģunlardır:
>Dersin kapsamını, hedef davranıĢları kapsayacak Ģekilde sorular hazırlanmalıdır.(kapsam
geçerliği)
>Ölçme aracında yer alan bütün sorular ölçülmek istenilen özellik ile ilgili olmalıdır.
>Ölçme aracında çok zor ya da çok kolay soruların olması geçerliği düĢürür. Sorular orta güçlükte
olmalıdır.
>Güvenirliği artırıcı önlemleri uygulamak geçerliği de artırır.
30
>Ġyi bir sınav planı hazırlanmalıdır.
>Sınavdan önce öğrencilere sorular ile ilgili ipuçları verilmemelidir.
>Her sınavda öğrencilere farklı sorular sorulmalıdır.
>Aynı cevap Ģıkları ardı ardına konulmamalı (örn: a-a-a-a-a)
nedenle cevap seçenekleri soru sayısına orantılı dağıtılmalıdır.
Bu durum geçerliği düĢürür. Bu
GEÇERLĠK VE GÜVENĠRLĠK ARASINDAKĠ ĠLĠġKĠ
►Bir ölçme aracı için en önemli özellik geçerliktir. Yani ölçme aracının amaca hizmet etme
derecesidir
►Güvenirlik geçerlik için bir ön koĢuldur ancak tek baĢına yeterli değildir.
►Güvenilir olan bir test her zaman geçerli olmayabilir ancak geçerli olan bir test mutlaka
güvenilirdir.
►Genel anlamda bir ölçme aracının güvenirliğini sağlayan bütün çalıĢmalar geçerliği de etkiler.
►Bazı durumlarda güvenirliği arttırmaya yönelik bir çalıĢma geçerliği düĢürebilir. ÖRN: Bir
testte aynı özelliği taĢıyan sorular çoğaltılarak (homojenlik) güvenirlik artırılabilir. Ancak bu
Ģekilde yapılan bir düzenleme de sorular hedef alanlarını ve konuları yeterince örnekleyemeyeceği
için testin kapsam geçerliği dolayısı ile geçerliği düĢmüĢ olur.
►Bir ölçme aracı için geçerlik katsayısı maksimum güvenirlik katsayısının kareköküne eĢittir.
0,81  0,90 → GEÇERLĠK
►Geçerlik güvenirliği de kapsayan daha geniĢ kapsamlı bir kavramdır.
►ġans baĢarısı ve kopya hem geçerliği hem de güvenirliği etkiler.
►Bir öğretmenin her yıl aynı sınav sorularını sorması öncelikle geçerliği düĢürür. Soruların
öğrencilerin bildiği bir kaynaktan aynen alınıp kullanılması, sınavdan önce soruların verilmesi, sınav
süresi kısa olduğu için bazı soruların yanıtlanamaması, sınav süresinin gereğinden uzun olması
nedeni ile kopya çekilmesine fırsat verilmesi gibi durumlar geçerliği düĢüren nedenlerdir.
►Güvenirlik sadece tesadüfî hatalardan etkilenir. Geçerlik sabit ve sistematik hatadan doğrudan,
tesadüfî hatadan ise dolaylı olarak etkilenir.
GÜVENĠRLĠK
GEÇERLĠK
Tesadüfü hatalardan etkilenir.
Doğrudan , sabit ve sistematik hatadan dolaylı
olarak tesadüfü hatadan etkilenir
Genellikle ölçme aracı ile ilgilidir.
Ölçme iĢleminin amacı ile ilgilidir.
Hatalardan arınıklık derecesidir.
Amaca hizmet etme derecesidir.
Anahtar
kelimeler:
kararlılık, ,objektiflik
Duyarlılık,
tutarlılık,
Anahtar kelimeler: Amaç, amaca uygunluk,
hedef davranıĢ
Güvenilir her test geçerli değildir.
Geçerli test güvenilirdir.
Geçerlik için ön koĢuldur
Güvenirliği içine alır
Katsayısı 0 ile +1 arasındadır
Katsayısı -1 ile +1 arasındadır.
31
2007 / KPSS
Bir dersteki baĢarıyı ölçmek için geliĢtirilmiĢ beĢ testle ilgili olarak tablodaki bilgiler elde
edilmiĢtir.
Test
1
2
3
4
5
Güvenirlik Yordama Kapsam Ortalama
Katsayısı Geçerliği Geçerliği Güçlük
0,72
0,65
0,83
0,92
0,61
0,45
0,29
0,64
0,18
-0.55
Orta
Yüksek
Yüksek
Düşük
Düşük
0,70
0,35
0,58
0,40
0,50
1. Sınıfındaki öğrenciler arasında bu dersteki baĢarısı yüksek olanları seçmek isteyen bir
öğretmenin hangi testi kullanması en uygun olur?
A) 1
B) 2
C) 3
D) 4
E) 5
2. ―Bir testin güvenirliğinin yüksek olması, geçerli bir test elde etmek için yeterli değildir.‖
yargısını desteklemek için hangi test örnek gösterilebilir?
A) 1
B) 2
C) 3
D) 4
E) 5
3. Diğerlerinden daha kolay olduğu halde kabul edilebilir düzeyde güvenilir ve geçerli olan
test hangisidir?
A) 1
B) 2
C) 3
D) 4
E) 5
3) KULLANIġLILIK:
Bir testin kullanıĢlılığı güvenirliği ve geçerliğinden sonra düĢünülmesi gereken bir
özelliktir. KullanıĢlılık; bir testin kullanılmasındaki kolaylıktır. KullanıĢlılık özelliğine sahip bir
testin uygulanması emek, para ve zaman gibi faktörler açısından ekonomik sayılabilecek sınırlar
içindedir.
Kullanılması zor olan; ileri derecede uzmanlık gerektiren emek, para, zaman gibi açılardan ağır
sayılabilecek gerekçeleri olan bir test kullanıĢlı değildir.
Bir testin kullanıĢlı olabilmesi için;
►Hazırlanmasının kolay,
►Uygulanmasının kolay,
►Puanlanmasının kolay,
►Çoğaltılmasının kolay,
►Cevaplama yönünden kullanıĢlı,
►Yönergesinin çok iyi,
►Baskı kalitesinin iyi,
►Ucuza mal edilmiĢ yani ekonomik olması gerekmektedir.
32
TESTLER VE TESTLERĠN SINIFLANDIRILMASI
Test: bireylerin belli özelliklerini ölçmek için düzenlenen ve onu alan herkes için aynı olan
sorulardan oluĢan bir ölçme aracıdır.
Testleri ölçmek istediği özelliğe göre ikiye ayırabiliriz:
1) Tipik DavranıĢ Testlerinde: Bu tür testlerde amaç, kiĢinin belli bir durumda nasıl davrandığını
ortaya çıkarmaktır. Tutum ölçekleri, ilgi ölçekleri ve kiĢilik ölçekleri bu gruba girer.
2) Maksimum Yeterlik Testleri: Bir kiĢinin bir iĢi belli bir durumda ne kadar iyi yada doğru
yapılabildiği belirlenmeye çalıĢılır. Bu da kendi içerisinde ikiye ayrılır:
a) Yetenek Testi: Yetenek testlerinin; doğuĢtan getirildiğine, çevre etkileriyle çok az
değiĢtiğine ve özellikle belli bir alandaki baĢarının belirleyicisi olduğuna inanılan bir zihin gücünü
ölçtüğü kabul edilir. Öyleyse yetenek testleri genellikle ileride kiĢinin kendisine fırsat
verildiğinde, belli bir Ģeyi ne kadar öğrenebileceğini yordamada yani ÖĞRENME GÜCÜNÜ ölçmede
kullanılır. Yetenek testleri de kendi içinde ikiye ayrılır:
* Genel Yetenek Testi: Bireyin kalıtsal gizil güçleriyle çevresel etkenlerin
etkileĢimi sonucunda oluĢan ve kiĢinin yapmaya çalıĢtığı her iĢin
baĢarılmasında aynı derecede kendini duyuran genel zihin gücünü ölçmek
için hazırlanmıĢ testlerdir. ÖRN: LES SINAVI
* Özel Yetenek Testi: Sınırlı ve dar bir alanda sahip olunan zihin gücünü
ölçmek için düzenlenmiĢ testlerdir. Müzik yeteneği testi gibi.
b) BaĢarı Testi: KiĢinin bir eğitim süreci içinde ya da daha geniĢ anlamda çevre koĢulları
altında ne kadar öğrendiğini ölçen testlerdir. Bu testler bireylerin ileride ne kadar
öğrenebileceğini değil geçmiĢte ne kadar öğrendiğini ortaya çıkarmak için kullanılır. Örn:
öğretmenlerin sınıflarda uyguladığı testler baĢarı testidir.
Testler: Bir uygulayıcının bir defada uygulayabildiği kiĢi sayısı bakımından;
1) Bireysel Testler: Bir uygulayıcı tarafından bir defada yalnız bir kiĢiye uygulanabilen
testlerdir. KiĢinin okuma, konuĢma durumunu belirlemek için bireysel test kullanmak zorunludur.
Bireysel testlerde ürünle birlikte süreçte gözlenir. Stanford-Binet Zekâ testi, okuma testleri
örnek olarak verilebilir.
2) Grup Testleri: Bir uygulayıcı tarafından bir defada birçok kiĢiye uygulanabilir. Bu tür testler
daha çok okunduğunu anlama gücüne dayanır. Uygulanması ve planlanması oldukça kolay ve ucuzdur.
Bunlarda ürün gözlenebilir ancak süreç (davranıĢın ortaya çıkması) gözlenemez. Sınıfta
öğretmenlerce kullanılan bütün yazılı sınavlar bu gruba girer. ÖSS sınavında kullanılan testler.
Testler: uygulama zamanının uzunluğu bakımından da ikiye ayrılır:
1) Hız testleri: Hız testlerinde bir iĢin bitirilme süresi, testten alınan puanı belirleyen en önemli
etkendir. Hız testleri, zaman yetse bütün cevaplayıcıların doğru cevaplayabileceği kolaylıktaki
maddelerden oluĢur. Böyle testlerde puan eriĢebilen soru sayısına bağlıdır. Genel yada özel
yetenek testi.
2) Güç testleri: TanımlanmıĢ bilgi ve beceriler bakımından kiĢilerin baĢarı düzeyini ölçmeye
yöneliktir. Bu testler gittikçe güçleĢen bir seri sorudan oluĢur. Güç testinde cevaplayıcının her
soruyu cevaplamasına yetecek kadar zaman verilir. Ya da zaman sınırlaması hiç yoktur. Güç
testinde cevaplayıcının hızına değil kaç soruyu doğru cevapladığına bakılır. (BaĢarı testleri)
33
PuanlanıĢlarında puanlayıcının öznel kanı ve görüĢlerinin
bakımından testler OBJEKTĠF ve SUBJEKTĠF olarak ikiye ayrılır:
etkisi
olup
olmaması
1) Objektif testler: Bir test, testin ölçtüğü alanda ve uzmanlaĢmıĢ olsun ya da olmasın herkesin
puanlayabileceği ve her kim puanlarsa puanlasın bir kiĢinin alacağı puan değiĢmeyecek Ģekilde
geliĢtirilmiĢse o test tamamen objektiftir. Doğru-yanlıĢ testleri, çoktan seçmeli testler büsbütün
objektiftir. Kısa cevap ya da tamamlama maddelerinin puanlanması kısmen objektiftir.
2) Subjektif Testler: KiĢinin alacağı puanın testi puanlayanın öznel kanı ve yargısından
etkilendiği testlere subjektif testler denir. Sözlü yoklamalar ve yazılı yoklamalarda belli bir
cevaba verilen puan: puanlayıcıdan puanlayıcıya değiĢir.
Soruların soruluĢ biçimine ya da cevaplayıcıdan istenen davranıĢın türüne göre testler
ikiye ayrılır:
1) Dile Dayalı Testler: Sorular yazılı ya da sözlü olarak sorulur ve cevaplarda yine sözlü yada
yazılı olarak alınır.
2) Dile Dayalı Olmayan Testler: Soruların ya da yönergelerin sunuluĢunda yazılı ya da sözlü tek
bir sözcük kullanılmaz. Bütün yönergeler demontrasyon ve pandomim ile sunulur. Okuma yazma
bilmeyenler, baĢka bir dil konuĢanlar ve sağırlar için bu tür testler kullanılmak zorundadır.
Performans testleri de denilen testlerin büyük bir kısmı, dile dayalı olmayan testler grubuna
girer. Bu testlerde kiĢilerden belli bir yol izleyerek belli bir ürün ortaya çıkarmaları istenir.
Burada kiĢinin bir iĢi yapıĢ Ģekli ve o iĢin kalitesi gözlenmek istenir.
Ölçülecek hedefin davranıĢsal olarak gözleniĢine göre testler 4 gruba ayrılır:
1) ÖzdeĢ Öğeler Testi: Test durumunda gözlenen davranıĢ asıl ölçülmesi düĢünülen davranıĢın
kendisidir. Bu tür testlerde ölçülen davranıĢlar doğrudan ölçülürler. Performans testleri.
2) Ġlgili DavranıĢ Testi: Burada kiĢiler gerçek iĢ koĢullarına benzetilmiĢ koĢullar içine sokulur ve
yapay durumda gözlenen davranıĢlardan onların gerçek yaĢam durumundaki baĢarıları yordanmaya
çalıĢılır. Tıpta kadavra üzerinde çalıĢma, pilotların eğitimi örnek olarak verilebilir.
3) SözelleĢtirilmiĢ DavranıĢ Testi: Bazı eğitim hedeflerinin ölçülmesi öğrencilerin okuldan
mezun olduktan sonra gerçek yaĢam durumlarında gözlenmesini ve izlenmesini gerektirir. Mesela;
seçimde oy kullanma, vergi verme, askerlik görevini yapma gibi davranıĢlar sosyal bilgiler dersinde
vardır. Ve bu davranıĢlar okul çağında hemen ölçülemediklerinden dolayı sözel olarak ölçülürler.
Öğrencilere bir vatandaĢ olarak sorumluluklarının ne olduğu ve bunları nasıl yerine getirecekleri
sorulabilir.
4) Bilgi Testi: Bilgi testinin kullanılmasıyla sahip olunan bilgi ölçülür.
Testler öğretmen yapımı testler ve standart testler diye de ikiye ayrılır:
1) Öğretmen Yapımı Testler: Sınıf öğretmenlerinin kendisinin, sınıftaki öğretimin etkinliğini
ölçmek ya da artırmak için geliĢtirdiği testlerdir.
2) Standart Testler: Çok daha kapsamlı bir kullanılıĢ için genellikle uzmanlarca geliĢtirilirler.
Ünite testleri gibi.
Testleri
mümkündür:
sınıftaki kullanılıĢ
maksatlarına
ya
da iĢlevlerine
göre de
sınıflamak
1) Öğretim Testleri: Bu testleri kullanmadaki amaç öğretimi geliĢtirmedir. Öğrencilerin zayıf ve
güçlü yanlarını görmelerini sağlamak, öğrenilecek önemli noktaları vurgulamak ve pekiĢtirmek için
düzenlenirler.
34
2) Ehliyet Testleri: Bir öğrencinin öğrendiği esas konu içeriği yani daha üst düzeydeki ve daha
ileri öğrenmeler için temel olan bilgi ve beceriler oranını belirlemek için kullanılır.
Örn: Öğrenciler daha karmaĢık çarpma ve bölme iĢlemlerine geçmeden önce çarpım tablosunu
ezberlemiĢ olmalıdırlar.
3) Ölçme Testleri: Bir öğretim birimi sonunda ya da öğretim sürüp giderken her bir öğrencinin
baĢarısının kesin ölçüsünü elde etmeyi amaçlar. Değer biçmeye yönelik değerlendirmelerin
dayanacağı ölçümler bu testlerle elde edilir.
SINAV PLANLARI (TEST PLANI)
Bir sınav planı gerçekleĢtireceğimiz sınava ve bu sınavda kullanacağımız araca iliĢkin,
öğretmenin vereceği bazı kararların kâğıda aktarılmasıyla hazırlanır. Bir sınav yapılacağı zaman
belli bir plana göre hareket etmek gerekir. Planlama yapılmadan hazırlanan ölçme aracı güvenirlik,
geçerlik, kullanıĢlık yönünden düĢük seviyede olur. Bir sınav planında bulunması ve açıklığa
kavuĢturulması gereken hususlar Ģu Ģekildedir:
1) Testin Kullanılacağı Amaç Belirlenmelidir: Bu karar sınava iliĢkin verilecek kararlardan daha
önce gelmelidir. Çünkü sınavın amacına göre diğer hususlar değiĢecektir. ÖRN: Sınavın güçlük
derecesine karar verirken öncelikle sınavın amacına bakılır. Bir sınavın amacı Ģunlar olabilir:
Seçme, yerleĢtirme, öğrenme düzeyini belirleme, geçme, kalma kararını verme vb.
2001 KMS: Sınavların bir plana göre hazırlanması gerekir. Sınav planı adı verilen bu
hazırlıkta ilk olarak aĢağıdakilerden hangisi belirlenir?
A) Sınavda kullanılacak soru sayısı
B) Sınavda kapsanacak konular
C) Sınavın kimlere uygulanacağı
D) Sınavın amacı
*
E) Cevapları puanlama yöntemi
2) Ölçülecek DavranıĢlar ve Bu DavranıĢların Hangi Ġçerikler Ġçinde Ölçüleceği
Belirlenmelidir: Burada öncelikle testte ölçülecek hedef davranıĢ kapsamı belirlenir. Bundan
sonra açıkta yoklanacak hedef davranıĢ kalmaması ve soruların konulara dengeli bir Ģekilde
dağıtılması için…
3)Belirtke Tablosu Hazırlanmalıdır: Belirtke tablosunun hazırlanması, testin planlanmasındaki
en önemli etkendir. Belirtke tablosu bir yanında ölçülecek davranıĢların öteki yanında sınava
girecek konuların yer aldığı iki boyutlu bir tablodur. Bu tablo yardımıyla sorulabilecek sorular
evrenini temsil edici dengeli ve geçerli bir soru örneklemi seçilir. Belirtke tablosunda ünitenin
konuları ile hedefleri bir birine paralel olarak yer alır. Hedeflerin hangi kategoride (biliĢsel,
duyuĢsal, psikomotor) ve hangi düzeyde (bilgi, kavrama…) oldukları belirlenir. Bu Ģekilde
hedeflerin ünite bazında toplam sayıları belirlenmiĢ olur.
35
ÖRNEK:
KONULAR
BĠLĠġSEL ALAN
HEDEFLER
BĠLGĠ
Y.
-YaĢadığımız
çevre ünitesinde
geçen kavramların
anlam bilgisi
KAVRAMA
UYGULAMA
ANALĠZ
SENTEZ
DEĞ.
*
4)Kullanılacak Soru Tipi KararlaĢtırılmalıdır:
Bu madde sınavda kullanılacak olan ölçme
araçlarıyla ilgilidir. (kısa cevaplı, çoktan seçmeli…) Seçilecek olan soru tipi ölçülecek olan hedef
davranıĢa ve konuların içeriğine göre değiĢir.
2003 KPSS: Test planında yapılması gereken bazı iĢlemler aĢağıda sıralanmıĢtır.
1 . ────
2 . Yoklanacak davranıĢların belirlenmesi
3 . Belirtke tablosunun hazırlanması
4 . ────
5 . Test maddelerinin (soruların) yazılması
6 . Maddelerin (soruların) test düzenine konması.
Bu sıralamada 1 ve 4 numaralı satırlara hangi iĢlemler getirilmelidir?
A)
1. Sınavın amacının belirlenmesi
4. Kullanılacak madde (soru) türünün belirlenmesi
5) Testte Bulunacak Soru Sayısı Belirlenmelidir: Testle bulunacak soru sayısının
belirlenmesinde birçok etken göz önünde bulundurulmalıdır. Bunlar sınav süresi, kullanılacak soru
tipi, soruların güçlük derecesi, öğrencilerin seviyesi, sınav sonuçlarına dayalı olarak verilecek
kararın önemi.
Bu faktörler birlikte dikkate alınarak soru sayısı kararlaĢtırılır.
6) Testin Güçlüğü ve Testte Bulunacak Soruların Güçlük Dağılımı KararlaĢtırılmalıdır: Testin
ortalama güçlük düzeyi ve testteki maddelerin güçlük dağılımı testin kullanılıĢ amacına uygun
olmalıdır. Bunun için bir testin ortalama güçlüğü 0,50 civarında olmalıdır. Çünkü çok güç ve kolay
testler ayırt edici değildir. Bir testte çok kolay, kolay, güç ve çok güç maddeler yer almalı fakat
orta güçlükteki maddeler diğer güçlük düzeyindeki maddelerden daha çok olmalıdır.
NOT: Bir soruya doğru cevap verenleri soruyu cevaplayanların sayısına bölersek o sorunun zorluk
(güçlük) derecesini bulmuĢ oluruz.
NOT: Sınavdaki soruların güçlük dağılımı ile ilgili genel olarak kabul edilen yaklaĢım Ģu Ģekildedir:
Soruların % 10‘u çok kolay; % 20‘si kolay; % 40‘ı vasat (orta); % 20‘si zor ve %10‘u çok zor
sorulardan oluĢmalıdır. Böyle bir baĢarı testi iyi bir ölçme aracıdır.
36
7) Sınavın Süresini Belirleme: Bir sınavın amacı, soru sayısı, zorluk düzeyi, soru tipi öncelikle ve
sınava giren öğrencilerden en zayıf olan öğrencinin durumu dikkate alınarak bir düzenleme yapılır.
8) Soru (madde) Yazımı: Bir test planlanırken madde yazma aĢamasında, sınav sorularının kimin
tarafından yazılacağı ve yazılmıĢ olan sorulardan hangilerinin sınava dahil edileceği belirlenir.
9) Soruların Gözden Geçirilmesi Ve Seçilmesi: HazırlanmıĢ olan maddeler; dil, anlatım,
davranıĢa uygunluk, imla hataları vb. açılardan gözden geçirilir.
10) Puanlama Anahtarının Hazırlanması: Puanlama cetvelinin hazırlanmasındaki amaç, testte yer
alan her bir maddenin değerini belirlemektir. Puanlama anahtarı puanlayıcıdan puanlayıcıya
değiĢiklik göstermez. Bu durum testin puanlama güvenirliğinin yüksek olduğunun kanıtıdır.
11) Soruların Çoğaltmaya Hazırlanması: Gözden geçirilen ve gerekli düzeltmeler yapılarak teste
alınmasına karar verilen soruların testte ya da sınav kâğıdında hangi sırada yer alacağı ve nasıl
yazılacağı belirlenir.
12) Uygulama
13) Puanlama ve Puanlamaya ĠliĢkin BaĢka ĠĢlemler Belirlenmelidir:
* Cevapların puanlanmasının elle mi yoksa makine ile mi yapılacağı kararlaĢtırılmalıdır.
* Soru kâğıdından veya kitapçığından ayrı bir cevap kâğıdı kullanılıp kullanılmayacağı karara
bağlanmalıdır.
* Testte yer alan maddelerin her birine verilecek puan belirlenmelidir.
* Elde edilen puanları Ģans baĢarısından arıtmak için DÜZELTME FORMÜLÜ kullanılıp
kullanılmayacağı bir karara bağlanmalıdır. Bunun belirlenmesi özellikle seçmeli testler için bir
zorunluluktur. Seçmeli testler grubunda yer alan doğru-yanlıĢ maddeleri ile çoktan seçmeli
maddelerde doğru cevabın Ģansla bulunma olasılığı vardır. Böyle maddelerde maddenin yokladığı
bilgiye sahip olmayan bir cevaplayıcı tahmine baĢvurarak salt Ģansla doğru cevabı bulabilir. Doğru
cevabın Ģansla bulunma olasılığı seçenek sayısı azaldıkça artar.
ÖRN: Bir doğru yanlıĢ testinde doğru cevabın Ģansla bulunma olasılığı 1/2‘dir. BeĢ seçenekli
çoktan seçmeli bir soruda ise bu olasılık 1/5‘tir. Test puanına Ģans baĢarısından ileri gelen bir
hata karıĢmıĢsa bu test puanının GEÇERLĠĞĠNĠ düĢürür. Bir cevaplayıcının seçmeli testlerden
elde ettiği toplam puanını Ģans baĢarısından arıtmak için düzeltme formülü adıyla bilinen formül
kullanılır.
Düzeltme formülünün uygulanıp uygulanmayacağına iliĢkin karar test uygulanmadan önce verilmiĢ
olmalıdır. Bu karar test yönergesinde de belirtilmelidir.
DüzeltilmiĢ Puan = Doğru Sayısı -
YanlıĢ
———————
Seçenek Sayısı – 1
ÖRNEK: Her biri 5 Ģıklı 100 çoktan seçmeli maddeyi kapsayan bir test uyguladığımızı düĢünelim.
Bir öğrenci bu testte 60 maddeyi doğru cevaplandırmıĢ, 32 maddeyi yanlıĢ cevaplandırmıĢ ve 8
maddeyi de cevapsız bırakmıĢ olsun. Bu öğrencinin düzeltilmiĢ puanı kaçtır?
32
Bu öğrencinin düzeltilmiĢ puanı = 60 ─ ——— =
52
5–1
Düzeltme formülünün uygulanması öncelikle testin güvenirliğini etkiler.
37
Kısaca özetlersek bir sınav planı aĢağıdaki 13 basamaktan oluĢmaktadır:
1) Sınavın amacını belirleme,
2) Ölçülecek davranıĢların belirlenmesi,
3) Belirtke tablosunun hazırlanması,
4) Soru tipini belirleme,
5) Soru sayısını belirleme,
6) Soruların güçlük derecesine karar verme,
7) Sınav süresini belirleme,
8) Soru (madde) yazımı,
9) Soruların gözden geçirilmesi ve seçilmesi,
10) Puanlama anahtarının hazırlanması,
11) Soruların çoğaltmaya hazırlanması,
12) Uygulama,
13) Puanlama iĢlemleri,
EĞĠTĠMDE KULLANILAN ÖLÇME ARAÇLARI
BĠLĠġSEL ALANDAKĠ DAVRANIġLARIN ÖLÇÜLMESĠNDE KULLANILAN ARAÇLAR
1) YAZILI YOKLAMALAR (Uzun Yazmalı Sınavlar –Essey Tipi, Klasik Tip – Kompozisyon Tipi)
Eğitimde en sık kullanılan eğitim aracıdır. Bunun nedeni bu sınav türünün hazırlanmasının
kolay olması, uzun zaman almaması ve öğretmenlerce iyi biliniyor olmasıdır. Bu tür sınavlar
soruların bir kâğıtta yazılı olarak verilmesi ve cevapların yazılı olarak istenmesi Ģeklinde uygulanır.
Yazılı yoklamaların en önemli avantajı bilgi düzeyinin üstündeki üst düzey zihinsel iĢlemler
(uygulama, analiz, sentez, değerlendirme, organize etme, orijinal görüĢ ve ürünler ortaya
koyabilme ) gerektiren türdeki hedefleri ölçebilmesidir.
Yazılı Yoklamaların Özellikleri:
* Öğrenci yazılı sınavlarda cevabı kendisi düĢünüp bulmak zorundadır.
* Yazılı yoklamada öğrenciye cevaplama özgürlüğü tanındığı için cevaplar yorumlanarak ĢiĢirilebilir.
* Yazılı yoklamada diğer sınav türlerine göre daha az soru sorulur, çünkü cevaplar yazılı olarak
verilmektedir.
* Hazırlanması kolay, puanlanması yorucu ve uzun zaman alan sübjektif bir özelliğe sahiptir.
* ġans baĢarısı yoktur.
* Sorulara verilen cevaplar çoğunlukla tamamen doğru ya da yanlıĢ olarak değerlendirilemez.
* Üst düzey zihinsel hedef alanlarına (analiz-sentez-değerlendirme) yönelik özellikler
ölçülebilir.
38
* Bu sınav türüyle kompozisyon becerileri ya da bilgiyi sentez etme yeteneklerinin ölçülmesi
durumunda yazılı sınavların yeri önemlidir.
Yazılı Sınavların Kullanılacağı Durumlar:
* Sınav sorularını hazırlamak için az zaman olduğunda,
* Dil ve imla bilgileri ölçülmek istendiğinde,
* Öğrencilerin analiz-sentez-değerlendirme becerileri ölçülmek istendiğinde,
* Öğrencilerin kendini ifade etme becerisi ölçülmek istendiğinde,
* Öğrenci sayısının az olduğu durumlarda,
* Öğretmen; çoktan seçmeli test ve diğer sınav türlerini geliĢtirmede yeterli değilse kullanılabilir.
Yazılı Sınavlarda Dikkat Edilecek Noktalar:
* Mutlaka bir test planı hazırlanmalıdır,
* Kapalı uçlu sorular tercih edilmelidir,
* Çok genel sorular sorulmamalıdır,
* Sorular çok, cevaplar kısa olmalıdır,
* Puanlama anahtarı hazırlanarak her sorunun kaç puan olduğu belirtilmelidir,
* Öğrencilerin cevap anahtarında olmayan orijinal cevaplarına puan verilmelidir,
* Açık kitap sınavından kaçınılmalıdır,
* Yazılı kâğıdı okunurken öğrencinin isminin olduğu bölüm kapatılmalı yani objektif olunmalıdır,
* En uygun okuma Ģekli olarak bütün kâğıtlardaki aynı sorular okunmalıdır,
* Dersin amaçları içinde olmadığı sürece imla, yazı güzelliği gibi durumlara puan verilmemeli,
* Öğrenci bir sorunun cevabını bir baĢka sorunun cevabı içinde veriyorsa puan kırılmalıdır,
* Sorular önceden çoğaltılarak öğrenciye dağıtılmalı, sınav ortamında sorular yazdırılmamalıdır,
* Sınavda kullanılacak soru sayısının üç katı kadar soru hazırlanıp, bunlar arasından sorulacak
sorular seçilmelidir,
Yazılı Yoklamanın Sınırlı Yönleri:
* Soruların okunması ve puanlanması için uzun zamana ihtiyaç vardır,
* Puanlamada objektif olmak zordur,
* Cevabın sınırlarını belirlemek zordur öğrencilerin ĢiĢirme cevap olasılığı yüksektir.
* Soru sayısı çok olduğunda çok zaman alır az olduğunda da güvenirlik ve geçerlik düĢer.
Yazılı Yoklamada Puanlama Yöntemleri:
1)Genel Ġzlenimle Puanlama: Öğrencinin sınav kâğıdı baĢtan sona okunur ve genel izlenimle puan
verilir. Kompozisyon sınavları için uygundur.
2)Sıralama Yolu ile Puanlama: Sınav kâğıtları genel izlenimle okunur; iyi kâğıtlar üste kötü
kâğıtlar alta alta konulur ve iyiden kötüye puan verilir.
39
3)Sınıflama Yolu ile Puanlama: Sınav kâğıtları genel izlenimle okunur kâğıtlar iyi, kötü, orta
Ģeklinde gruplara ayrılır. Daha sonra puanlama yapılır.,
4)Anahtarla Puanlama: Soruları hazırlayan kiĢinin sorularda mutlaka bulunması gereken yanıtları
içerecek Ģekilde cevap anahtarı hazırlayıp sınav kâğıtlarını bu anahtara göre değerlendirmesidir.
En sağlıklı puanlama cevap anahtarına göre yapılan puanlamadır.
NOT: Yazılı yoklamalar öğrencilerin konuyu derinlemesine kavrayıp kavramadıklarını öğrenmek
için uygundur. Bu Ģekilde öğrencilerin yanlıĢ bilgileri kolayca tespit edilir. Sınav kâğıdı birden
fazla puanlayıcı tarafından puanlandığında benzer sonuçları vermeli yani puanlama güvenirliği
sağlanmalıdır.
2002 KPSS: Bir öğretmen yalnızca “yazmalı bir yazılı sınav” hazırlamak istemektedir.
AĢağıdakilerden hangisi bu sınavdan elde edilecek puanların güvenirliğini ve geçerliğini
artırmaz?
A) Çabuk cevaplanabilen türden çok sayıda soru sorulması ve sınavın bir süre
sonra tekrar uygulanması
B) Objektif tipte olmayan sorular için ayrıntılı cevap anahtarının hazırlanması,
C) Bir öğrencinin bütün cevaplarının okunması ve sonunda öğrenci hakkındaki
izlenimlerde dikkate alınarak tümüne birden puan verilmesi
D) Sınav kâğıtlarının birden fazla puanlayıcı tarafından puanlanarak puanlarının
ortalamasının alınması,
E) Cevapların aynı puanlayıcı tarafından sıraları değiĢtirilerek ikinci kez
puanlanması ve puanlar arasında fark varsa bir daha puanlama yapılması.
2007 KPSS: Yazılı yoklamalardaki sorularda, öğrencilerin cevaplarını düĢünerek bulmaları ve
buldukları bilgileri organize ederek yazmaları gerekir. Bu tür sorularla üst düzeydeki zihinsel
beceriler ölçülebilir. AĢağıdaki sorulardan hangisi, yazılı yoklamaların bu avantajlarını ortaya
koyan uygun bir örnek değildir?
A) Enflasyonu düĢürmek için ne tür önlemler alına-bilir? Örnek vererek irdeleyiniz.
B)Avrupa Birliği‘ne katılma konusundaki görüĢleriniz nelerdir? Bu Ģekilde düĢünmenizin
nedenlerini açıklayınız.
C) Ġzlediğiniz en iyi sinema filmi hangisidir? Bu filmi neden beğendiğinizi gerekçeleriyle
açıklayınız.
D) BaĢarı ile yetenek arasındaki iliĢkiyi bir örnekle açıklayınız. Sizce insan yaĢamında hangisi
daha ön plandadır?
E) Ölçme nasıl tanımlanır? Eğitimde yapılan ölçmeler kaç gruba ayrılır?
2) KISA CEVAPLI (BOġLUK DOLDURMALI) TESTLER
Cevabı bir kelime, bir cümle, bir tarih ve birkaç madde olan sorulara kısa cevaplı testler
denir. Bu tür testlerde düz ifadeli bir cümle hazırlanır. Sonra bu düz cümlenin içinden bir kelime
çıkarılır ve boĢluğu öğrencinin tamamlaması istenir. Yazılı yoklamalardan farkı cevabın en fazla bir
cümle olması, seçmeli testlerden farkı ise cevabın öğrenciye verilmeyip kendisinin yazmasıdır.
40
ÖZELLĠKLERĠ:
* Öğrencilerin KĠLĠT KAVRAMLARI, TANIMLARI, ĠFADELERĠ bilip bilmediklerini ölçme imkânı
verir.
* Yazılı yoklamaların alternatifi olan bir sınav türüdür.
* Özellikle ALT DÜZEY HEDEFLERĠN ölçülmesinde kullanılır.
* Bu tür testlerle bilme düzeyindeki kısmen de kavrama düzeyindeki davranıĢlar ölçülür.
* Kısa cevaplı bir test maddesi direk soru cümlesi olarak ya da eksik cümleli olarak sorulabilir.
* Daha çok ilköğretimin ilk sınıflarında kullanılır.
* Puanlanması kolaydır.
KISA CEVAP GEREKTĠREN TESTLER EN ĠYĠ HANGĠ NĠTELĠKLERĠ YOKLAR?
Bu tip sorular HATIRLAMA GÜCÜNÜ ölçen ve ġANS BAġARISINA da hemen hiç yer
vermeyen soru tipidir. Eğer yoklayacağınız konular arasında önemli terimler, tarihler, sayılar,
ibareler yoğun olarak yer alıyorsa ve bunların öğrenci tarafından bilinip bilinmediğini ölçmek önem
taĢıyorsa bu teknik kullanılır.
KISA CEVAPLI TESTLERĠN YARARLARI:
1) Cevaplar kısa olduğundan çok soru sorularak fazla bilgi yoklanabilir. Bu da sınavın kapsam
geçerliğini yükseltir.
2) Puanlama yazılı sınavlara göre daha objektiftir. Geçerlik ve güvenirlik yazılı yoklamalardan daha
yüksektir.
3) Cevaplamada Ģans faktörü yok denecek kadar azdır.
4) Ġmla, yazı güzelliği gibi yanlılık oluĢturacak etkenlerin puanlamaya katılması engellenir.
5) Birçok kritik davranıĢın ölçülmesinde kullanılabilir.
KISA CEVAPLI TESTLERĠN SINIRLILIKLARI:
1) Kısa cevap gerektiren maddeler ile yapılan bir yoklama ile öğrencilerin kendi düĢüncelerini
organize ederek tanıtmaları imkânı yoktur.
2) Bu tür testler ile hatırlama yeteneği ölçüldüğünden prensiplerin yeni durumlara uygulanması
sebep-sonuç iliĢkileri ve tanıma yeteneği gibi özellikler ölçülmez. Yani bu tür sınavlarda üst düzey
bilgileri ölçmek güçtür.
3) Bazı konularda bu tür test maddesi hazırlamak imkânsızdır.
4) Öğrencileri ezber yapmaya yöneltebilir.
5) Cevaplar kısa olup ayrıntı gerektirmediğinden öğrenciler yüksek not alabilirler.
KISA CEVAPLI TESTLERDE DĠKKAT EDĠLECEK NOKTALAR:
* BoĢluk doldurmalı türdeki sorularda boĢluklar mümkün olduğu kadar cümle sonuna bırakılmalıdır.
* BoĢluklar doğru cevabın sığacağı kadar olmalıdır.
* Her soruda mümkünse tek boĢluk olmalıdır.
* Sorudaki boĢluk bir yada iki kelimeyle cevaplanacak türde olmalıdır.
* Eğer boĢluğun birden çok kelime ile doğru cevaplanma ihtimali varsa bunların tümü doğru kabul
edilmelidir.
41
* Fazla uzun ifadeler kullanılmamalıdır.
* Sorular birbirine cevap verir nitelikte hazırlanmamalıdır.
* Sorular ayrıntıya değil konulardaki TEMEL NOKTALARA dayalı olmalıdır.
* Kitap ifadeleri aynen kullanılmamalıdır böyle bir hata öğrencileri ezber yapmaya yöneltir.
* Yorum sorusu sorulmamalıdır.
* Bir soruda birden fazla bilgi yoklanmamalıdır.
2003 KPSS: Okul öğrenmelerinin ölçülmesinde öğretmenler tamamlama veya boĢluk doldurma tipi
sorular hazırlarken genellikle kitaptaki bir ifadeyi aynen almakta bu ifadenin içinden bir sözcüğü
ya da sözcük grubunu çıkarmakta ve öğrenciden çıkarılan bu sözcüğü yada sözcük grubunu bulması
istenmektedir.
Bu tür soruları kullanmanın en temel dezavantajı aĢağıdakilerden hangisidir?
A) Puanlamanın çok zaman alması,
B) Kesin bir yanıt bulmanın çok zor olması,
C) Kopya çekmeyi kolaylaĢtırması,
D) Öğrencileri ezbere yöneltmesi,
*
E) Öğrenme farkını gösterme gücünün az olması,
2008 KPSS:
Bir sınav türünün özellikleri Ģunlardır;

Kısa sürede çok soru sorulmasına olanak tanır.

Puanlanması kolay ve nispeten nesneldir.

ġans baĢarısı yoktur.
Bu özellikleri taĢıyan sınav türü aĢağıdakilerden hangisidir?
A) Doğru- yanlıĢ
B) BoĢluk doldurma
C) Çoktan seçmeli
D) Açık uçlu
E) Sözlü
3) DOĞRU-YANLIġ TÜRÜ SINAVLAR
Öğrencinin belli konulardaki yanlıĢ veya doğruları ayırt edebilme gücünü ölçmek amacıyla
bir kısmı doğru bir kısmı yanlıĢ önermelerden oluĢan testlerdir. Öğrenciden hangi cümlenin doğru
ya da yanlıĢ olduğunu bulması istenir.
ÖZELLĠKLERĠ:
* Doğru yanlıĢ testlerindeki maddeleri cevaplama iĢi hem kolaydır hem de çok az zaman alır. Bu
özelliklerden dolayı bir sınav süresi içinde diğer bütün tekniklere kıyasla daha fazla soru sorma
imkanı ortaya çıkar. Bu durum, bu tür testleri kapsam geçerliği en yüksek teknik haline getirir.
* Puanlanması kolay, çabuk ve objektiftir.
* Doğru yanlıĢ türü maddelerin geliĢtirilmesi kolaydır ve çok zaman almaz.
* Yalnızca iki seçenek olduğu için Ģansla puan elde etme ihtimali yüksektir. (% 50)
42
* Bir doğru yanlıĢ testi öğrencilerin yanlıĢ öğrendikleri yerleri ortaya çıkarmaya elveriĢli değildir.
* Kullanılacak ifade mutlak anlamda doğru yada yanlıĢ olmak zorundadır.
* Bu sınav türü eğitimin alt ve üst basamaklarında kullanılabilir.
* Cevaplanması çok zaman gerektirmediğinden çok geniĢ bir bilgi alanı yoklanabilir.
* Doğru YanlıĢ sınavları bilgi basamağını en iyi ölçer.
DOĞRU-YANLIġ TESTĠNĠN KULLANILACAĞI DURUMLAR
Prensiplerin ve genellemelerin iyi anlaĢılıp anlaĢılmadığının yoklanacağı durumlarda ve belli
bir nokta ile ilgili yalnız iki ihtimal veya seçme olduğu durumlarda doğru-yanlıĢ maddeleri
kullanılabilir.
DOĞRU-YANLIġ MADDELERĠNĠN HAZIRLANMASINDA DĠKKAT EDĠLECEK NOKTALAR
→ Basit yapıda ve sadece belleğe dayalı soru hazırlamak yerine, açıklama, karĢılaĢtırma,
yorumlama, genelleme ve uygulama gücünü ölçebilecek doğru-yanlıĢ maddeleri geliĢtirmelidir.
→ Cümlelerin yarısı doğru yarısı yanlıĢ olarak hazırlanmalıdır.
→ Ders kitabından kalıp halinde ifade cümleler alınarak madde ve cümle yazılmamalıdır. Bu durum
öğrenciyi ezbere teĢvik eder.
→ Direkt ifadeler kullanılmalı çok geniĢ anlamlı kelimelerden kaçınılmalıdır.
→ Önermelerin uzunlukları birbirine yakın olmalıdır.
→ Olumsuz ifadelerden kaçınılmalıdır.
→ Sorular kolay anlaĢılır bir Ģekilde ifade edilmelidir.
→ Sorular birden fazla ana fikir taĢımamalıdır.
→ Doğru ve yanlıĢ cümleler belli bir sistemle dizilmemelidir.
→ Düzeltme formülünün kullanılıp kullanılmayacağı açıkça belirtilmelidir.
→ Ölçme oranında yalnızca D-Y türü soru kullanılacaksa cümle sayısı 50‘den az olmamalıdır.
DOĞRU-YANLIġ SINAVLARININ YARARLI YÖNLERĠ:
* Hazırlanması ve puanlanması kolaydır, objektiftir.
* Kapsam geçerliği yüksek olan bir test türüdür.
* Öğrencilerin istenen cevabı vermesi kolaydır.
DOĞRU-YANLIġ TÜRÜ SINAVLARIN SINIRLI YÖNLERĠ:
→ Üst düzey bilgiler yoklanamaz.
→ Bilgi ve kavrama basamağındaki bilgileri ölçer.
43
4) ÇOKTAN SEÇMELĠ SINAVLAR
Bir soru kökü ve muhtemel cevaplardan oluĢan sınav tipidir. Bu sınav tipinde öğrenci
verilen açıklama ve soru köküne göre en uygun veya doğru cevabı seçer. Çoktan seçmeli testler
madde kökü, seçenekler (cevap Ģıkları), anahtarlanmıĢ cevap (doğru cevap) ve çeldiriciler olmak
üzere madde formunu oluĢturan 4 öğeden oluĢmaktadır.
AĢağıda bir çoktan seçmeli test maddesinin yapısı vardır:
ÖRNEK: ―Hele sinemaya gitte göreyim seni‖ cümlesindeki ―göreyim seni‖} MADDE KÖKÜ sözü bu
cümleye nasıl bir anlam katmaktadır?
A)
Korkutma
DOĞRU CEVAP
B) Yönlendirme
C) Yüreklendirme
D) Özendirme
ÇELDĠRĠCĠLER
ġıkların bütünü de
SEÇENEKLERĠ
oluĢturur.
E) Paylama
HANGĠ DURUMLARDA ÇOKTAN SEÇMELĠ TESTLER ÜSTÜNDÜR?
1) Bilgi, kavrama, uygulama ve analiz düzeyindeki davranıĢlarla, değerlendirme düzeyindeki
davranıĢların bazılarının ölçülmesi gerektiği zaman bu tür testlerden yararlanılır. Değerlendirme
ve özellikle sentez düzeyindeki davranıĢları ölçmede yetersizdir.
2) Bu sınav geniĢ bir öğrenme alanı kapsayacaksa, çok sayıda soru kullanılması gerekiyorsa içeriği
iyi örnekleyebilme özelliğini taĢıdığı için bu tür testler tercih edilmelidir.
3) Yapılan sınavın sonuçlarına dayalı olarak öğrenci hakkında çok önemli kararlar verilecekse ve bu
yüzden sınavın yüksek bir puanlama güvenirliğine sahip olması isteniyorsa çoktan seçmeli test
tercih edilmelidir. (Örn: ÖSS)
ÇOKTAN SEÇMELĠ SINAVLARIN ÖZELLĠKLERĠ:
* Seçmeli testlerde cevap verilenler arasından seçilir.
* Çoktan seçmeli testler eğitimde en çok kullanılan testlerdir. Bunun sebebi objektif puanlama
yapabilmesi, çok sayıda sorunun tek oturumda kalabalık gruplara uygulanması, Ģans baĢarısına
daha az yer vermesi ve benzeri olabilir.
* Çoktan seçmeli testler hatırlama esasına dayalı testlerdir.
* Katılımın çok olduğu, ülke genelinde seçme amaçlı olarak yapılan sınavlarda çoktan seçmeli
testler kullanılır. KPSS, ÖSS gibi. Dereceleme yapılacaksa da bu sınav türü kullanılır.
* Bu tür sınavlarda en basit bilgi düzeyindeki bir tanımlamadan en karmaĢık uygulamaya kadar
HER TÜRLÜ YETENEĞĠ ölçmek mümkündür.
* Her kademe ve düzeyde kolayca uygulanabilir.
* Uygulama ve puanlama kolay, değerlendirme objektiftir.
* Çok sayıda soru sorulması mümkündür. Böylece güvenirlik ve kapsam geçerliği yükselir.
* Üzerinde iĢaretleme yapılmadığı zaman tekrar tekrar kullanılabilir.
44
* Cevaplaması kısa süre alır.
* ġans baĢarısı vardır, seçenek sayısı artırıldıkça Ģans baĢarısı azalır.
ÇOKTAN SEÇMELĠ TESTLERDE DĠKKAT EDĠLECEK NOKTALAR:
→ Bu tür sorularda kök cümle mümkün olduğu kadar soru cümlesi olmalıdır.
→ Kök belirsizlik taĢımamalı, açık ve öz olmalıdır.
→ Madde kökünde mümkün olduğunca olumsuz ifadelere yer verilmemelidir. Eğer olumsuz kök
yazılmak zorunda kalınırsa olumsuz ifadenin altı çizilmeli ya da koyu yazılmalıdır.
→ Muhtemel cevapların hepsi kısmen doğru ise en doğru cevabın seçilmesi gerektiği sorunun kök
kısmında belirtilmelidir.
→ Muhtemel cevapların hepsi birbirine yakın uzunlukta olmalıdır.
→ Muhtemel cevapların tümü dilbilgisi yönünden kök cümleye uymalıdır.
→ Doğru cevap ipucu verir nitelikte olmamalıdır.
→ Muhtemel cevaplar belirli bir düzende yazılmalıdır.
A) ------------------- KÖK
a)
A)---------------- KÖK
b)
c)
Cevap Ģıkları
a)
b)
d)
e)
c)
d)
e)
Muhtemel cevaplar bunlardan biri Ģeklinde hazırlanmalıdır.
→ Doğru cevap herhangi bir düzende yerleĢtirilmemelidir. (a.a.a.a.a. gibi)
→ Her sorudaki seçenek sayısı aynı olmalıdır.
→ Sayısal seçenek kullanılacaksa sıralı konmalıdır.
→ Yukarıdakilerden HEPSĠ ya da yukarıdakilerden HĠÇBĠRĠ seçeneği çok fazla kullanılmamalıdır.
→ Seçenekler birbirinin anlamını içermemeli, seçeneklerin biri diğeriyle eĢ anlamlı olmamalıdır.
→ Gereksiz kelime tekrarlarından kaçınılmalıdır.
→ Az bilinen kelimelere yer verilmemelidir.
→ Sorular güçlük derecesine göre hazırlanmalıdır.
→ Tesadüfü cevapları önlemek için DÜZELTME FORMÜLÜ uygulanmalıdır.
→ Testin mutlaka bir yönergesi olmalıdır.
45
→ Testin tekrar tekrar kullanılabilmesi için mutlaka bir cevap kâğıdı hazırlanmalıdır.
→ Öğrencilerin sıklıkla düĢtükleri hataların çeldirici olarak kullanılması öğretmene yanlıĢ
öğrenmeleri belirlemede yardımcı olur. Bu yüzden sıklıkla düĢülen hatalara çeldiricilerde yer
verilmelidir.
→ Soru kâğıtları a-b-c gibi gruplara ayrılarak öğrencilerin kopya çekmesi engellenmelidir.
ÇOKTAN SEÇMELĠ MADDE ÇEġĠTLERĠ
1) MADDE KÖKÜ SORU KĠPĠNDE OLANLAR: Adından da anlaĢıldığı gibi bu tür sorularda
madde kökü bir soru cümlesidir. Ġkiye ayrılır:
a) Olumlu soru kipindeki maddeler: AĢağıdakilerden hangisidir? Hangisi söylenebilir? Hangisi
doğrudur? Gibi olumlu soru kipleriyle cümle tamamlanır.
b) Olumsuz soru kipindeki maddeler: AĢağıdakilerden hangisi değildir? Hangisi söylenemez?
Hangisi yer almamalıdır? Gibi olumsuz soru kipleri ile cümle tamamlanır.
2) MADDE KÖKÜ EKSĠK CÜMLE OLANLAR: Belli bir maddenin bir kısmı madde kökünü, ikinci
kısımda seçenekleri oluĢturmaktadır.
ÖRNEK:
Genel anlamda geçerlik, bir testin;
A) Hatalardan arınıklık derecesidir.
B) Okuduğunu anlayabilme derecesidir.
C) KullanılıĢ amacına hizmet etmesidir.
D) Kullanımının kolay olması demektir.
E) Tutarlı ve kararlı sonuçlar vermesidir.
3) TEK BĠR DOĞRU CEVAP ĠSTEYENLER: Seçeneklerden yalnızca bir tanesi kesin doğru
cevaptır. Çeldiriciler kesinlikle yanlıĢtır.
ÖRNEK:
AĢağıdakilerden hangisi ölçme araçlarında bulunması gereken en önemli niteliktir?
A) Güvenirlik
B) Geçerlik
C) KullanıĢlılık
D) Kararlılık
E) Duyarlılık
4) EN DOĞRU CEVABI ĠSTEYENLER: Seçeneklerin hepsi kısmen doğru ama biri diğerlerine
oranla daha doğrudur.
ÖRNEK:
AĢağıdakilerden hangisi güvenirlikle ilgili verilenlerden en doğrusudur?
A) Hatalardan arınıklık derecesidir.
B) Ölçme araçlarının duyarlı ölçümler yapmasıdır.
C) Ölçme aracının tutarlılığıdır.
D) Ölçme araçlarının kararlılığıdır.
E) Ölçme aracının hassas ölçümler yapmasıdır.
46
5) ORTAK KÖKLÜ MADDELER: Bir paragraf, bir tablo, bir grafik verilir ve verilen bu materyal
üzerinden maddeler hazırlanır. KiĢinin öğrendiklerini hatırlama ve tanıma gücünün ötesinde, üst
düzeydeki zihinsel yetenekleri ve becerileri ölçmeye daha elveriĢlidir.
ÖRNEK:
Dersler
X
K
Fizik
60
110
Kimya
68
130
Biyoloji
36
80
Tarih
52
120
Matematik
52
100
Yukarıdaki tabloda 5 derse ait aritmetik ortalama ve soru sayıları verilmiĢtir. 1., 2.
ve 3. sorular bu tabloya göre cevaplanacaktır.
2008 KPSS: Bir ölçme uzmanı Fen ve Teknoloji dersi için hazırlanan baĢarı testini incelemiĢ ve
ortak köke dayalı soruların 5 – 6 civarında olduğunu saptamıĢtır. Bu durumu eleĢtiren uzman, bir
köke dayalı olarak sorulabilecek soru sayısının üçü geçmemesini önermiĢtir.
Ölçme uzmanının bu eleĢtirisinin en önemli gerekçesi aĢağıdakilerden hangisi olabilir?
A) Öğrencilere aynı kökle ilgili çok sayıda soru sormak motivasyonu düĢürür.
B) Sorular tek bir test yaprağına sığmayacağı için test düzeni bozulabilir.
C) Benzer davranıĢı ölçen soru sayısının artması güvenirliği düĢürür.
D) Soruların birbirinden bağımsız cevaplanabilme kuralı bozulabilir.
E) Okuduğunu anlama değiĢkeninin etkisi artarak geçerliği düĢürür.
6) ORTAK SEÇENEKLĠ MADDELER: Birkaç maddenin seçenekleri aynı olduğu zaman seçenekleri
her madde sonunda tekrarlamak yerine maddelerin ortak seçenekleri baĢa yazılır. Madde
köklerinin altına bir daha tekrarlanmaz. Teste ekonomiklik sağlar.
ÖRNEK:
A) Güvenirlik
B) Geçerlik
C) KullanıĢlılık
1) Hangisi ölçme araçlarında bulunması gereken en önemli niteliktir? ( )
2) Hangisi ölçme araçlarının kullanımının kolay olması demektir? ( )
3) Hangisi ölçme araçlarının hatalardan arınıklık derecesidir? ( )
ÇOKTAN SEÇMELĠ SINAVLARIN YARARLI YÖNLERĠ:
* Değerlendirilmesi en objektif sınav türüdür.
* Cevaplama ve puanlama süresi kısadır.
* Her türlü bilgi ölçülebilir.
47
* Çok sorudan oluĢtuğu için kapsamı geniĢ, geçerliği ve güvenirliği en yüksek sınav türüdür.
* Bu sınav türünde elde edilen verilerle birçok istatistikî iĢlem yapılabilir.
* Tüm öğretim kademelerinde kullanılabilir.
* YanlıĢ öğrenmelerin belirlenmesinde iyi bir tekniktir.
ÇOKTAN SEÇMELĠ SINAVLARIN SINIRLI YÖNLERĠ:
→ Hazırlanması zordur ve uzun zaman alır.
→ Soruların güçlük derecesini ayarlamak uzmanlık gerektirir.
→ Soruların farklı gruplar halinde hazırlanmaması durumunda kopya çekilmesi ihtimali vardır.
→ Azda olsa Ģans faktörü vardır.
2006 KPSS: Çoktan seçmeli bir test maddesini cevaplayan bir kiĢinin çeldiricileri eleyerek
doğru cevaba ulaĢmasında, aĢağıdakilerden hangisi belirleyici olmalıdır?
A) Ġfadelerin, kök ifadesiyle tutarlılığı
B) Seçeneklerin soyutluk-somutluk derecesi
C) Yoklanan davranıĢın öğrenilmiĢ olması
D) Seçeneklerin birbirini içerip içermemesi
E) Ġfadelerin kısalık ve uzunluğu
2006 KPSS: Test maddesinde, ders kitabından aynen alınan ifadelerin kullanılması eğitimsel
doğurguları açısından nasıl bir etki yaratır?
A) Maddeyle yoklanan davranıĢ hatırlama düzeyinde kalır.
B) Kitabı okumamıĢ öğrenci maddeyi kesinlikle cevaplayamaz.
C) Maddenin anahtarlanması kolaylaĢır.
D) Maddenin okunup anlaĢılması zorlaĢır.
E) Maddede gereksiz ipuçları bulunmaz.
2007 KPSS: Çoktan seçmeli bir testteki sorularda, çeldiricilerin doğru cevaba anlamca
yaklaĢtırılması bu testin hangi özelliğini doğrudan etkiler?
A) Güvenirliğini
D) KullanıĢlılığını
B) Geçerliğini
E) Objektifliğini
C) Güçlüğünü
2007 KPSS: Sosyal bilgiler sınavında sorulan bir soru Ģöyledir:
Türkiye‟nin pek çok sınır komĢusu vardır. En uzun sınırı paylaĢtığımız sınır komĢumuz
aĢağıdakilerden hangisidir?
A) Bulgaristan‘la sınırımız en uzundur.
B) Irak‘la sınırımız en uzundur.
C) Ġran‘la sınırımız en uzundur.
D) Suriye‘yle sınırımız en uzundur.
E) Yunanistan‘la sınırımız en uzundur.
Yukarıdaki sorunun kusurları arasında aĢağıdakilerden hangisi yoktur?
A) Kökte yazım hatasının olması
B) Kökte gereksiz sözcük kullanılması
C) Kök ile seçenekler arasında ifade uyumsuzluğu olması
D) Seçeneklerde aynı sözcüklerin tekrarlanması
E) Seçeneklerin uygun olmayan bir sırada verilmesi
48
2009 KPSS SORU: Bu yıl yükseköğretim programına alınan 120 öğrenci, çoktan seçmeli bir yabancı dil
testine alınacaktır. Bu testten en yüksek puanı alan 40 öğrenci öğrenimlerine birinci sınıftan baĢlayacak;
diğer 80 öğrenci ise hazırlık sınıflarında bir yıl yabancı dil eğitimi alacaklardır.
Bu süreçte, ölçme değerlendirme ilkelerine aykırı olan durum aĢağıdakilerden hangisidir?
A) Puanlamada objektifliğin sağlanamaması
B) Ölçme aracı olarak çoktan seçmeli testin kullanılması
C) Testin puanlanmasında Ģans baĢarısından arıtma yöntemi uygulanmaması
D) Birinci sınıfa seçilen öğrenci sayısının az olması
E) Ölçüt dayanaklı ölçme yapılması gerekirken norm dayanaklı ölçme yapılması
5) EġLEġTĠRMELĠ TESTLER
Bu tür sınavlarda iki bölümde verilen bilgiler, kelimeler, numaralar, semboller eĢleĢtirilir.
Öğrencilerin bilgiler, nesneler, olaylar hakkında iliĢki kurma güçleri ölçülür.
ÖZELLĠKLERĠ:
1) Bu tür testlerde maddeler iki sütun halinde sıralanır. Sol taraftaki sütuna ifadeler sağ
taraftaki sütuna cevaplar denir. Öğrencilerden ifadelerin cevaplarını bulmaları istenir.
2) Öğrencilerin değiĢik özelliklerini ölçme imkânı verir.
3) Puanlanması objektiftir,
4) Doğru cevabı vermede Ģans faktörü diğer test türlerine göre azalmıĢtır.
ELEġTĠRMELĠ TESTLER HAZIRLANIRKEN DĠKKAT EDĠLMESĠ GEREKENLER
→ EĢleĢtirmeli testlerin düzenleniĢ biçimi Ģöyle olmalıdır:
ÖRNEK:
Öncüllerde roman adları, seçeneklerde ise yazarların adları verilmiĢtir. Romanların kimler
tarafından yazıldığını belirledikten sonra, o yazarın önündeki harfi ilgili romanın solundaki
parantez içine yazınız.
ÖNCÜLLER
SEÇENEKLER
( ) Sofi‘nin Dünyası
A) Balzac
( ) Yaban
B) Dostyevski
( ) Bir AĢk Hikâyesi
C) Halide Edip Adıvar
( ) SavaĢ ve BarıĢ
D) J. Gaarder
( ) Suç ve Ceza
E) Tolstoy
F) Yakup Kadri
G) YaĢar Kemal
H) Zola
→ Bu tür sorularda kavram tanımlarla; olaylar kiĢilerle; sebepler sonuçlarla eĢleĢtirilir.
→ Uzun cümleler ifadelerin altında, kısa cümleler cevapların altında toplanmalıdır.
→ Ġfadelerin altında toplanacak cümle sayısı 6‘dan az 15‘den fazla olmamalıdır.
→ Cevaplar sütundaki madde sayısı ifadeler sütunundaki madde sayısından iki ya da üç madde
fazla olmalıdır.
49
→ Her eleĢtirmeli soru grubu mümkün olduğu kadar aynı konuda olmalıdır.
→ Ġfadelerin yanına boĢ parantez; cevapların yanına harf konmalıdır.
→ Testin baĢına açıklama konmalıdır.
→ Bir eĢleĢtirme takımını oluĢturan maddelerin hepsi aynı sayfada bulunmalıdır.
→ Ġfadelerin ve cevapların açık, anlaĢılır ve kesin bilgiyi yoklayıcı özellikte olması gerekir.
EġLEġTĠRME SINAVLARININ YARARLI YÖNLERĠ:
1) Ölçme ve puanlama iĢlemi kolaydır, objektiftir. Bu yüzden geçerliği ve güvenirliği yüksektir.
2) Puanlama fazla zaman almaz.
3) Seçenek sayısı (cevaplar) fazla olduğundan Ģans faktörü azdır.
4) Öğrencilerin BĠLGĠ, KAVRAMA, UYGULAMA VE ANALĠZ DÜZEYĠNDEKĠ davranıĢlarını ölçer.
EġLEġTĠRMELĠ SINAVLARIN SINIRLI YÖNLERĠ:
1) Deneyimsiz kiĢiler için soruların hazırlanması zordur ve zaman alır,
2) Bu testi her konuya uyarlamak mümkün değildir.
3) Soruların güçlük düzeyini belirlemek zordur.
6) SÖZLÜ SINAVLAR
Soruların genellikle sözlü sorulduğu ve cevaplarında sözlü verildiği sınav çeĢidine sözlü
yoklama denir. Eğitimde kullanılan ilk sınav türüdür.
Sözlü Yoklamanın Kullanılacağı Durumlar: Anadili ve yabancı dil konuĢma gücü gibi özellikler
ancak sözlü yoklama yolu ile ölçülebilir. Yani kelimeleri doğru telaffuz ederek, cümle içinde kurala
uygun Ģekilde yerine koyarak gereken hızda ve akıcılıkta, mantıksal, etkili konuĢma gücü ancak
sözlü yoklamalar ile ölçülebilir.
SÖZLÜ YOKLAMALARIN ÖZELLĠKLERĠ:
1) Sözlü sınavların diğer sınav türlerine üstünlüğü sözlü performansın vurgulandığı davranıĢların
baĢka bir teknikle ölçülememesidir. Bu yüzden Ġngilizce ve Türkçe gibi sözlü ifade becerisini
ölçmeyi ve geliĢtirmeyi amaçlayan derslerde kullanılabilir.
2) GeliĢtirilmesi çok uzun zaman isteyen bir yoklamadır. Bunun nedeni her bir öğrenciye ayrı
zaman ayrılması zorunluluğudur.
3) Her öğrenciye farklı sorular sorulması gerekmektedir.
4) Her sorunun güçlük düzeyi farklı olabilir.
5) Sorular üzerinde yeterince düĢünme imkânı verilmeyebilir.
6) Sözlü yoklama öğrencinin vereceği cevabı tasarlama, düzenleme ve değiĢtirme imkanını da
sınırlar.
7) Öğrencilerin kiĢilik özellikleri verilecek puanı etkiler.
8) Sözlü ifade yeteneği, etkili konuĢabilme gibi özellikler öğretmeni etkiler.
9) Puanlara çok miktarda hata karıĢtığı için GÜVENĠRLĠK ve GEÇERLĠĞĠN en düĢük olduğu sınav
türüdür.
10) Puanlama objektifliği en düĢük tekniktir.
50
SÖZLÜ SINAVLARIN UYGULANMASINDA DĠKKAT EDĠLECEK NOKTALAR:
→ Sözlü sınavlar mevzuat gereği öğretmenler tarafından kullanılmak zorundadır. Bunun için bu
sınavların kendi niteliklerinin elverdiği ölçüde geçerli ve güvenilir olması sağlanmalıdır.
→ Önce sınav planı hazırlanmalıdır.
→ Sorular sınavdan önce hazırlanmalı. Sınav esnasında akla gelen sorular öğrencilere
yöneltilmemelidir.
→ Her öğrenciye aynı soru sorulmamalıdır.
→ Sözlü sınava katılacak öğrenci sayısı birden fazla ise aynı düzeyde sorular hazırlanmalıdır.
→ Sınav yapacak öğretmenin sınava girecek öğrenci ile aynı ortamda olması gerekir.
→ Sınavda sorulacak soruların cevapları önceden listelenmeli, muhtemel tüm cevaplar çıkartılarak
kaç puan verileceği önceden tespit edilmelidir.
→ Öğrencilere kitaptaki ifadeleri ezbere söyleyeceği türden sorular sorulmamalıdır.
→ Daha çok ANALĠZ-SENTEZ-DEĞERLENDĠRME basamağında sorular sorulmalıdır.
SÖZLÜ YOKLAMALARIN YARARLI YÖNLERĠ:
→ Öğrencilerin kısa sürede cevap vermelerini gerektirdiğinden hazır cevaplılığı ve yaratıcılığı ön
plana çıkarır.
→ Öğretmen deneyimli ise soru hazırlamada ve puanlamada fazla zaman harcamaz.
→ Küçük yaĢtaki çocukların yazı yazma becerileri tam olarak geliĢmediğinden sözlü sınavlar
yapmak daha uygundur.
→ Öğrencilerin bilgi ve kavram yanlıĢlığının anında belirlenme imkânının olduğu tek sınavdır.
NOT: Ölçme araçlarının geçerlik ve güvenirlik açısından en yüksekten en düĢüğe doğru
sıralanması Ģu Ģekildedir:
→ ÇOKTAN SEÇMELĠ TESTLER → EġLEġTĠRMELĠ TESTLER→ BOġLUK DOLDURMA (Kısa
cevaplı) testleri→ DOĞRU-YANLIġ TESTLERĠ → YAZILI SINAVLAR → SÖZLÜ SINAVLAR
7) ÖDEV VE PROJELER
Bir konu hakkında derinlemesine inceleme yapılması amacıyla verilen soru veya sorulara
ödev ya da proje adı verilir. Ödev ve projeler bireysel olabileceği gibi birden çok öğrencinin
birlikte yapabileceği çalıĢmalar Ģeklinde de olabilir.
Bir ölçme yöntemi olmayan ödev ve projeler geleneksel olarak ilk ve orta öğretimde
kullanılmaktadır. Bu nedenle bu tür çalıĢmaların puanlanmasında da bazı niteliklere dikkat edilmesi
gerekir.
Ödev ve projelerle öğrencilerin birçok çalıĢma yapması, üst düzeyde beceriler göstermesi
beklenir. Bu becerilerin geliĢtirilmesi ve ölçülüp değerlendirilmesi ders saatlerinde mümkün
olmamaktadır. Çünkü öğrenci bu tür çalıĢmaları daha çok sınıf dıĢında yapar ve okul dıĢındaki
birçok kaynaktan yararlanır. Öğrencilerin birçok becerisinin geliĢtirilmesi açısından ödev ve
projeler hem yararlı hem de gereklidir.
Ödev ve projelerin öğrencilerin kendileri tarafından yapılıp yapılmadığının kontrol edilmesi
zordur. Bu nedenle ödev ve projelerin geçerliliği düĢüktür. Ödev ve projelerin puanlanmasında
öğretmenin takdir hakkı diğer ölçme araçlarına göre daha fazladır. Bu durum ödevlerin
51
puanlanmasında güvenirliğin düĢmesine neden olur. Bu nedenle ödev ve projeler bir ölçme aracı
olarak kullanılmaktan çok bir öğrenme aracı olarak kullanılmalıdır.
Ödev ve projelerin verilmesinde dikkat edilecek noktalar:
1) Her öğrenciye veya her gruba farklı ödevler verilmelidir.
2) Sorular veya konular öğrencilerin kendi baĢlarına yapabilecekleri tarzda olmalıdır.
3) Ödev ve projelerin içeriği çok iyi saptanmalı ve sınırları çok iyi çizilmelidir.
4) Ödev ve projelerin nasıl puanlanacağına iliĢkin bir puanlama anahtarı hazırlanmalı ve bu anahtar
öğrencilere de verilmelidir.
PORTFOLYO
(öğrenci geliĢim dosyaları – öğrenci etkinlik dosyaları) DEĞERLENDĠRMESĠ
GELENEKSEL DEĞERLENDĠRME
PORTFOLYO DEĞERLENDĠRME
Öğrencinin yeteneği tek bir zamanda ölçülür
Öğrencinin yeteneği süreç içinde ölçülür
Öğrenci ölçütlerden habersizdir
Öğrenci
ölçütlerden
haberdardır
değerlendirmeye öğrencide katılır
Öğrencilerin grup içinde bir grup tayin eder
Öğrencini
konusudur
Öğrencinin dil yeteneğinin ranjını yakalamaz
Dil öğrenme
yakalar
Öğrenciye çok fazla sorumluluk vermez
Öğrenciye sorumluluk verir
almaya öğreti
Amaç çoğu zaman sadece değerlendirmedir
Amaç
öğrenmeyi
birleĢtirmektir.
bireysel
değerlendirmesi
performansını
ve
çoğu
ve
ve
söz
yönüyle
sorumluluk
değerlendirmeyi
Öğrencinin öğrenme sürecindeki performansının ve baĢarısının kaydedildiği, öğrencinin yıl
içerisinde yaptığı tüm ödev ve çalıĢmalarının örneklerinin (ürünlerin) bulunduğu ve böylece
geliĢiminin izlendiği değerlendirme biçimidir. Portfolyonun en önemli iĢlevi; öğrencinin öğretmeöğrenme sürecindeki geliĢimini takip etmek ve öğrencinin çalıĢma örneklerini görmektir.
Öğrencinin öğrenme düzeyini ve geliĢimini içeren her Ģey öğrenci geliĢim dosyasında yer
alabilir. Öğrenci geliĢim dosyasında öğrencinin öğrenme düzeyi ve geliĢimi ile ilgili mümkün olduğu
kadar farklı türden belgelerin olması arzulanır. Öğrenci geliĢim dosyasında aĢağıdaki etkinliklerin
yer alması uygun görülmektedir:
1) Öğretmen, öğrenci, öğretmen ve öğrenci veya aileler tarafından seçilen bazı çalıĢmalar
Ģunlardır:
►Öğrencinin yazma becerisindeki geliĢimini yansıtan yazılı ödevler (yazdığı hikâyeler, kitap
raporları, araĢtırma raporları, günlük tutma vb…)
►KarmaĢık matematik hesaplamalarını içeren problem çözme becerilerini yansıtan çalıĢma
örnekleri,
52
►Öğrencinin ürettiği sanatsal iĢler,
►Öğrenci tarafından yapılan bazı iĢlerin fotoğrafları,
►Öğrenci tarafından okunan kitapların listesi,
2) Öğrencinin yaptığı çeĢitli çalıĢma örneklerine yönelik olarak yapılan eleĢtirilerin yer aldığı
yazılar,
3) Öğrencinin ilerleyiĢine yönelik olarak öğrenci ve öğretmen iĢbirliği ile hazırlanan geliĢim
raporları,
4) Öğretmenin gözlemlerine dayalı olarak tuttuğu notlar,
5) Aile öğretmen görüĢmeleri sonucunda tutulan notlar,
Eğitim – Öğretim Sürecinde Portfolyoların Kullanılma Amacı ve Temel Ġlkeleri ise Ģunlardır:
►Öğrencilerin geliĢim sürecini izlemek,
►Öğrencileri ilgi alanları ve yetenekleri açısından tanımak ve öğrencilerin etkinlikte bulunmalarını
sağlamak,
►Öğrencide öğrenme sorumluluğunu ve öz disiplinini geliĢtirmek,
►Öğrencinin öğretim programı dıĢındaki faaliyetlerini de kapsayan çok yönlü geliĢimi hakkında
bilgi vermek,
►Öğrencilerin ilgi alanlarını ve yeteneklerini belirleme, geliĢtirme
►Öğrencinin öğrenme sürecindeki performansını izleme,
►Gelecek eğitim kurumlarındaki öğretmenlerine öğrenciyi tanıtmak,
►Öğrencinin yaratıcı özelliklerini ve üst düzey zihinsel becerilerini geliĢtirir,
►Klasik ölçme araçları dıĢında ölçme sürecine yenilik getirmek,
►Değerlendirme sürecine öğrenci, öğretmen, aile ve arkadaĢ grubu da katılır.
►Öğrencilerin biliĢsel, psikomotor ve duyuĢsal davranıĢlarının birlikte geliĢmesini sağlar.
Öğretimi öğrenci merkezli duruma getirir.
►Öğrencide sorumluluk duygusu geliĢtirir.
Portfolyo değerlendirme sürecinde öğrenciden beklenilen etkinlikler ise Ģöyle sıralanabilir:
►Ġlgi ve yeteneklerine uygun görev ve sorumluluklar alma,
►Ġlgi ve yeteneklerine uygun ürün ve performans örnekleri ortaya koyma,
►Üst düzey zihinsel becerileri geliĢtirebilme,
►GeliĢime, iĢbirliğine ve iletiĢime açık olma,
►Süreç içerisinde geliĢimlerini yansıtacak günlükler oluĢturma,
►Öğretim düzeyine ve ders uygulamalarına iliĢkin beklentilerine iliĢkin beklentilerini ortaya
koyan değerlendirme raporları hazırlama,
►Bireysel değerlendirme (öz değerlendirme) raporları hazırlama,
53
ÖZ DEĞERLENDĠRME: Belli bir konuda bireyin kendi kendisini değerlendirmesine öz
değerlendirme denilmektedir.
ÖĞRENCĠ ÖZ–DEĞERLENDĠRME FORMU
Etkinlik Adı
Sınıf :
Cinsiyet
:
Tarih
…./…./…….
:
Dolduracağınız bu formun amacı; sınıfta uygulanan etkinliğe iliĢkin duygu ve
düĢüncelerinizi anlamaktır. Bu formun derslerdeki baĢarınız ya da sınıf geçme durumunuz ile
herhangi bir ilgisi yoktur. Forma isminizi yazmak zorunda değilsiniz. Sizden, duygu ve
düĢüncelerinizi samimi olarak bu forma yansıtmanız beklenmektedir. AĢağıdaki listede
okuduğunuz her bir ifadeye katılıyorsanız “Evet” seçeneğinin altına, kısmen katılıyorsanız
“Kısmen” seçeneğinin altına, katılmıyorsanız “Hayır” seçeneğinin altına (X) iĢareti koyunuz.
TeĢekkürler
Evet
Kısmen
Hayır
1 Etkinliğin amacını anladım.
2 Etkinlik yaĢanırken arkadaĢlarımın söz hakkına saygılı
davrandım.
3 Etkinlik yaĢanırken arkadaĢlarımın duygu ve
düĢüncelerine saygılı davrandım.
4 Etkinlik sürecine, duygu ve düĢüncelerimi belirterek
katkıda bulundum.
5 Etkinlik sürecine, günlük hayatımdan örnekler vererek
katkıda bulundum.
6 Etkinlik sonunda yapılan tartıĢmalara katkıda
bulundum.
7 Etkinlikte iĢlediklerimizin hayatımızdaki yerini
anladım.
8 Etkinlikte öğrendiklerimi günlük hayatımda kullanmayı
düĢünüyorum.
9 Benzer etkinlikler yaĢamak isterim.
2008 KPSS:
Öğrencilerin belli bir konuda kendileriyle ilgili bilgi, beceri, tutum ve davranıĢlarını
yorumlamalarına ………………; araç-gereç kullanma, deney yapma, ya da proje hazırlama vb.
becerilerinin puanlama kriteri kullanılarak değerlendirilmesi sürecine…………………. denir.
Bu parçadaki boĢluklara, aĢağıdakilerin hangisindeki sözcükler sırasıyla getirilmelidir?
A) öz değerlendirme – rubrik(puanlama yönergesi)
B) performans değerlendirme – grid
C) öz değerlendirme - performans değerlendirme
D) portfolyo( öğrenci ürün dosyası) – dallanmıĢ ağaç
E) performans değerlendirme – akran değerlendirme
54
►Öğrencilerin arkadaĢlarının geliĢimi ve onlarla ilgili duygu ve düĢüncelerini yansıttığı akran
değerlendirme formlarını doldurma,
Portfolyo da genel olarak Ģu incelemeler yapılır:
Öğrenci ne öğrendi? Öğrenme sürecinde izlediği yollar nasıl idi? Yeteneklerini kullanabildi mi?
Nasıl düĢündü? Hangi soruları sordu? Bilgiyi ne Ģekilde yapılandırdı? ĠĢbirlikçi çalıĢabildi mi?
ĠletiĢim becerilerini kullanabildi mi? KarĢılaĢtığı güçlüklere karĢı ne yaptı?
NOT: Portfolyo değerlendirmede öğrenci ne biliyor sorusuna cevap aranır. Diğer ölçme
araçlarının sorduğu hangi öğrenci daha çok biliyor sorusu portfolyoda kullanılmaz. Yani
portfolyoda öğrenciler arasında rekabet söz konusu değildir.
Portfolyonun Sınırlılıkları:
☻Kalabalık grup ve sınıflarda uygulanması güçtür.
☻Öğrenciler yardımlaĢma bahanesi ile birbirlerinin çalıĢmalarını kopya edebilirler.
☻Puanlandırılması ve değerlendirilmesi güçtür.
☻Öğretmenlere ek yük getirir.
☻Öğrencilerin her performansına uygun çalıĢma örneği bulmak çok güçtür.
☻Portfolyolara konulacak her bir çalıĢma için ölçüt geliĢtirilmesi ve bu ölçütlere göre
değerlendirme yapılması zaman alıcıdır.
2009 KPSS SORUSU. Fen ve teknoloji öğretmeni, öğrencilerin sınıf içi baĢarılarını yazılı ve
sözlü
yoklamalarla
değerlendirmekte,
öğrencilerin,
hazırladıkları
ürün
dosyalarıyla
değerlendirilmesine ise daha az yer vermektedir.
Bu öğretmen aĢağıdakilerden hangisine daha çok önem vermektedir?
A) Öğrencinin kendi öğrenmeleriyle ilgili güçlü ve zayıf yönlerini analiz etmesini sağlamaya
B) Öğrencilerin bireysel geliĢim aĢamalarını izlemeye
C) Öğrencileri baĢarılarına göre sıralamaya
D) Öğrencide sorumluluk bilincini geliĢtirmeye
E) Öğrencilere günlük hayata dair beceriler kazandırmaya
2009 KPSS SORUSU Mehmet Öğretmen hazırladığı bir Türkçe sorusunda bir sözcüğün cümlede
hangi anlamda kullanıldığını sormuĢtur.
Mehmet Öğretmen, bu sorusuyla aĢağıdaki süreçlerden hangisini ölçmek istemektedir?
A) Metin içerisinde açıkça verilmiĢ bilgiden doğrudan çıkarım yapma
B) Metinde kullanılan cümle yapısını irdeleme
C) Bilgi ve fikirleri yorumlama ve birleĢtirme
D) Metnin kapsamını ve dilini gözden geçirme ve değerlendirme
E) ĠliĢki kurma ve karar verip çözümleyebilme
55
AKRAN DEĞERLENDĠRME FORMU
Değerlendiren öğrencinin;
Grup no su:
1. ArkadaĢının Adı Soyadı:
Adı Soyadı:
2. ArkadaĢının Adı Soyadı:
Sınıfı :ArkadaĢlarını ve kendini değerlendirirken derecelendirme ölçeğindeki ifadeleri kullanınız.
Çok iyi: 4
Ġyi: 3
Orta: 2
Zayıf: 1
2. ArkadaĢım
1. ArkadaĢım
Ben
2. ArkadaĢım
1. ArkadaĢım
Ben
2. ArkadaĢım
1. ArkadaĢım
Ben
2. ArkadaĢım
1. ArkadaĢım
Ben
1. Grubumuzdaki Öğrenciler
Etkinliğe katılımda gönüllüdür.
Görevini zamanında yerine getirir.
Farklı kaynaklardan bilgi toplayıp
sunar.
Grup arkadaĢlarının görüĢlerine
saygılıdır.
ArkadaĢlarını uyarırken olumlu bir dil
kullanır.
Malzemeleri kullanırken israf etmez.
Temiz tertipli ve düzenli çalıĢır
(Kullandığı aletleri yerine koyar
kirlettiklerini temizler vb.)
ÖRNEK: Öğrencinin kendi çalıĢmalarının değerlendirilmesine katılmasını, her bir öğrencinin kendi
ilerleyiĢini izlemesini ve öğretmenlerin bireysel olarak öğrencilerinin geliĢimlerini
takip
etme
olanağı sağlar. Yukarıda açıklaması verilen değerlendirme türü aĢağıdakilerden hangisidir?
A) Portfolyo
*
B) Gözlem
C) Beceri Testi
D) Norma dayalı değerlendirme
E) Hedefe dayalı değerlendirme
56
2006 KPSS: Öğrencinin belirli bir süreçteki geliĢimini incelemek amacıyla geliĢtirilen bireysel
geliĢim dosyalarının değerlendirilmesine ―Portfolyo Değerlendirme‖ adı verilir.
Buna
göre,
portfolyo
değerlendirme
sürecinde
öğrencilerden
aĢağıdakilerin
hangisini
yapmaları beklenmez?
A) Süreç içerisindeki geliĢimlerini yansıtacak günlükler oluĢturmaları
B) Dersle ilgili beklentilerini ortaya koydukları bir değerlendirme raporu hazırlamaları
C) Kendi kendilerini değerlendirdikleri öz değerlendirme formunu doldurmaları
D) ArkadaĢlarıyla ilgili duygu ve düĢüncelerini yansıttıkları akran değerlendirme formunu
doldurmaları
E) Derste iĢlenen konularla ilgili sorular yazmaları
2007 KPSS: Öğrencilerinin öğretim süreci boyunca geliĢimlerini görmek ve değerlendirmeye
katılımlarını sağlamak isteyen bir öğretmen için en uygun ölçme ve değerlendirme yaklaĢımı
aĢağıdakilerden hangisidir?
A) Performans değerlendirme
B) Akran değerlendirme
C) Mutlak değerlendirme
D) Tümel (portfolyo) değerlendirme
E) Bağıl değerlendirme
2008 KPSS: Dönem boyunca az sayıda sınav yapıp, öğrencilerin öz değerlendirme ve akran
değerlendirme formlarını, performanslarını ve hazırladıkları ürün dosyalarını değerlendirmeye
daha çok zaman ayıran bir öğretmen bu uygulamasıyla aĢağıdakilerden hangisine en az hizmet
eder?
A) Değerlendirmenin öğrenmeye katkısını artırmaya
B) Özdenetim becerilerini geliĢtirmeye
C) Değerlendirme becerilerini kazandırmaya
D) Bireysel geliĢim düzeylerini belirlemeye
E) Öğrencilerin baĢarılarını karĢılaĢtır
2009 KPSS SORUSU: • Portfolyolardan elde edilen puanlarla aynı konulara iliĢkin hazırlanmıĢ objektif
testlerden elde edilen puanlar arasındaki iliĢkinin incelenmesi
• Portfolyolardan elde edilen puanlarla bu portfolyonun kapsamına iliĢkin daha sonradan ortaya çıkacak
performans ölçüleri arasındaki iliĢkinin incelenmesi
• Farklı öğretmenlerin aynı portfolyolara verdiği puanlar arasındaki iliĢkinin incelenmesi
Portfolyo değerlendirmesine iliĢkin yukarıda verilen yöntemler aĢağıdaki amaçlardan daha çok hangisini
gerçekleĢtirmek için kullanılmaktadır?
A) Portfolyo değerlendirmesinde kullanılacak puanlama yönergelerini hazırlamak
B) Portfolyolardan elde edilen verilerin güvenirliğini ve geçerliğini sağlamak
C) Öğrencilerin iĢlenen konulara iliĢkin öğrenme düzeylerini saptamak
D) Öğrencilerin sergileyebileceği en iyi çalıĢmaları belirlemek
E) Öğrencilerin önceki eğitim hayatında gösterdikleri performansı ortaya çıkarmak
57
PERFORMANS DEĞERLENDĠRME
Performans değerlendirme, öğrencilerin; zeka, öğrenme türleri gibi bireysel özellikleri
dikkate alınarak, bunları eyleme dönüĢtürmelerini sağlayacak (gerçek yaĢama aktaracak) durum ve
ödevler olarak tanımlanabilir. Bu değerlendirmeler süreç içerisine yayılmıĢtır, gözlenebilen bir
performans veya somut bir ürünle sonuçlanmaktadır.
Bu değerlendirme biçimi; analiz yapma, yorumlama, araç-gereç kullanma, deney yapma, proje
hazırlama gibi öğrencinin süreç içinde beceri geliĢimini izlemeye olanak tanıyan bir değerlendirme
yaklaĢımıdır.
Performans değerlendirmede öğrenci çalıĢmaları değerlendirilirken, DERECELĠ
PUANLAMA ANAHTARI, DERECELENDĠRME ÖLÇEKLERĠ, KONTROL LĠSTESĠ, ÖZ-AKRAN
DEĞERLENDĠRME FORMLARI KULLANILMAKTADIR.
Performans değerlendirme, gözlenebilen bir performans (müzik parçası çalma), ya da
somut bir ürünle (harita çizme) sonuçlanmalıdır. Performans değerlendirmenin geleneksel kağıt
kalem testlerinden üstün yanı, öğrencileri gerçek yaĢamla yüz yüze getirecek etkinlikler aracılığı
ile değerlendirmeye imkan sağlamasıdır.
Performansa dayalı durum belirlemenin yararları ve sınırlılıkları:
☻Öğrencilerin geliĢimini yani ne yaptığını değil, nasıl yaptığını gözlemek için ideal bir yaklaĢımdır.
☻Öğrenci merkeze alınır. Ġlgi, öz güven ve güdülenme düzeyi artar.
☻Etkili geribildirim olmazsa baĢarısız bir değerlendirmedir.
☻Uygulaması zaman alır.
☻Öğrencilerin bilgiyi kullanmasını ve gerçek yaĢam durumlarına yakın ürünler ortaya koymasını
sağlar.
2008 KPSS: AĢağıdakilerden hangisi performans değerlendirmesini gerektiren bir durumdur?
A) Bir elementin yerini periyodik tabloda gösterme
B) Mevsim normallerini gösteren bir tablodan yararlanarak belli bir tarihteki hava sıcaklığını
tahmin etme
C) Verilenler arasından bir romanın ana fikrini yansıtan tümceyi seçme
D) Verilen molekül formüllerinin açılımlarını yazma
E) IĢığın çukur ve tümsek aynada yansımasını gösterecek düzenek geliĢtirme
2008 KPSS: AĢağıdakilerden hangisi performans görevlerine dayalı ölçmelerin geleneksel
kâğıt - kalem testlerine göre üstün özelliklerinden biridir?
A) Öğrencilerin gerçek hayata yakın iĢlemler gerçekleĢtirmesi
B) Puanlamanın daha objektif olması
C) Uygulamanın daha az zaman alması
D) Velilerin öğrenci çalıĢmalarına yardım etmesi
E) Öğrencilerin hazır bulunuĢluk düzeyine uygun olması
58
2008 KPSS: Öğrencilerin belli bir konuda kendileriyle ilgili bilgi, beceri, tutum ve davranıĢlarını
yorumlamalarına ………………; araç-gereç kullanma, deney yapma, ya da proje hazırlama vb.
becerilerinin puanlama kriteri kullanılarak değerlendirilmesi sürecine…………………. denir.
Bu parçadaki boĢluklara, aĢağıdakilerin hangisindeki sözcükler sırasıyla getirilmelidir?
A) öz değerlendirme – rubrik(puanlama yönergesi)
B) performans değerlendirme – grid
C) öz değerlendirme - performans değerlendirme
D) portfolyo( öğrenci ürün dosyası) – dallanmıĢ ağaç
E) performans değerlendirme – akran değerlendirme
2009 KPSS SORUSU: Sınıf içi testlerin kullanım amacı, temelde eğitim öğretim etkinliklerinin
niteliğini artırmaktır. Test sonuçları öğretmene, sınıf içerisinde yapmıĢ olduğu etkinliklerin ne
ölçüde baĢarılı olduğuna dair geri bildirimde ulunmakta, aynı Ģekilde öğrencilere de sınıf içi
etkinlikler sonucunda neyi ne kadar öğrendikleri konusunda bilgi vermektedir.
Test sonuçlarına göre böyle bir geri bildirim alan öğretmenden beklenen aĢağıdakilerden
hangisi olamaz?
A) Eksik öğrenmeler varsa bunları tamamlaması
B) Kullandığı öğretim yöntem, teknik ve materyallerinin etkililiğini gözden geçirmesi
C) Öğretim etkinlikleri boyunca öğrencilerin geliĢimlerini izlemesi
D) Öğrenciler arasındaki öğrenme güçlüklerini belirlemesi
E) Öğrencileri yetenek düzeylerine göre gruplaması
2009 KPSS SORUSU: Fen ve teknoloji dersine ait bir kazanım Ģöyledir: ―Farklı yoğunluğa sahip
sıvıların cisimlere uyguladığı kaldırma kuvvetini karĢılaĢtırır ve sonuçları yorumlar.‖
Bu kazanımın ne ölçüde edinildiğini belirlemek isteyen bir öğretmen aĢağıdaki uygulamalardan
hangisini gerçekleĢtirmelidir?
A) Çoktan seçmeli test
B) YapılandırılmıĢ grid
C) Kavram haritası
D) Performans değerlendirme
E) Sözlü sınav
DUYUġSAL ALANDAKĠ DAVRANIġLARIN ÖLÇÜLMESĠ
1) Ġlgi Ölçekleri (Envanterleri)
Ġlgiler öğrencilerin ders baĢarılarını etkileyen en önemli duyuĢsal özelliklerden biridir.
Öğrencilerin ya da bireylerin ilgilerinin saptanmasında aĢağıdaki dört yöntem kullanılır:
a.
b.
c.
d.
Bireylerin hangi eylem ve etkinliklerden hoĢlanıp, hangilerinden hoĢlanmadığı konusunda
konuĢmalarından elde edilen, yani ifade edilen ilgi yöntemi,
Bireylerin hangi tür etkinlikleri tercih edip, hangilerini tercih etmediklerini gözleyerek elde
edilen, yani görünen ilgi yöntemi,
Ġlgi envanterlerinden elde edilen, yani ölçülen ilgi yöntemi,
Testlerden elde edilen, yani testle ölçülen ilgi yöntemi
59
2) Tutum Ölçekleri
Tutumlar da öğrenci baĢarısını etkileyen duyuĢsal özelliklerden biridir. Bir öğrenci bir derse, bir
öğretmene karĢı olumlu bir tutuma sahipse o derse daha çok çalıĢır, onu diğer derslerden ayrı
tutar ve o derste daha baĢarılı olur.
Öğrencilerin belli konulara karĢı tutumları, ilgili konuda belirttiği düĢüncelerinden, onları
gözleyerek, kompozisyon yazdırarak belirlenebilir.
3) Gözlem Tekniği
Planlı ve sistemli bir veri toplama tekniği olan gözlem; bir olay, bir durum, bir kiĢi vb. hakkında
bilgi toplamada izlenen yol olarak tanımlanabilir. Gözlem doğrudan duyu organlarıyla yapılabileceği
gibi çeĢitli araçlar yardımıyla da yapılabilir. Araç kullanılarak yapılan gözlemler, gözlemlerin daha
duyarlı yapılmasını, daha geçerli ve güvenilir sonuçlar elde edilmesini ve sonuçların birbirleriyle
karĢılaĢtırılmasında bir standart oluĢmasını sağlar.
Gözlemi kullanırken aĢağıdaki aĢamalara dikkat edilmesi gerekir.
a. Kimin gözleneceğinin belirlenmesi,
b. Gözlemin hangi koĢullar altında yapılacağı,
c. Gözlemi kimin yapacağı,
d. Hangi özelliklerin gözleneceğinin belirlenmesi gerekir.
DEVĠNĠġSEL(PSĠKOMOTOR) ALANDAKĠ DAVRANIġLARIN ÖLÇÜLMESĠ
1) Ġġ PERFORMANS TESTLERĠ
Özellikle psiko-motor düzeydeki hedeflerin (becerilerin) ölçülmesinde kullanılan bir test
türüdür. ĠĢ-performans testleri Ģu olanakları gerçekleĢtirme gücüne sahiptir:
→ Beceri eksikliklerini belirleme ve düzeltme,
→ Güçlü ve zayıf yönlerini analiz etme,
→ Ölçme iĢlemi çalıĢma ya da öğretim sırasında öğrencilerin ürün ya da performans ortaya
koyabilme güçleri doğrudan bu testlerle ölçülebilir.
PERFORMANS TESTLERĠNĠN ÖZELLĠKLERĠ (Güçlü Yönleri)
1) ĠĢ testleri ile anılan performans testleri öğrencilerin bazı becerileri yapma kabiliyeti hakkında
uygulanan diğer araçlardan daha objektif, güvenilir ve geçerli ölçüler sağlar.
2) Dikkatli bir Ģekilde hazırlanmıĢ iĢ testlerinden elde edilen sonuçlar öğrenimin ne derece etkili
olduğu ve hangi hususlar üzerinde daha fazla durulması gerektiği hakkında öğretmeni aydınlatır.
Yine aynı Ģekilde bir iĢ testi üzerinde çalıĢmak ve sonuçlarını tahlil etmek öğrenciye kendi
kuvvetli ve zayıf yanlarını tahlil etme imkânı verir.
3) ĠĢ testleri öğretim sonuçlarını doğrudan doğruya çalıĢma veya uygulama esnasında ölçerler.
60
PERFORMANS TESTLERĠNĠN SINIRLI YÖNLERĠ
1) Testin uygulanması fazla zaman gerektirir.
2) Testin uygulanması sırasında gerek test almayı bekleyen gerekse testi tamamlayan öğrenciler
ile ilgili olarak bazı disiplin sorunları ile karĢılaĢılabilir.
3) Testin hazırlanması güçtür.
NOT: ĠĢ-performans testleri üç bölümden oluĢur:
→ ĠĢin (becerinin) yapılmasında izlenen yol
→ ĠĢin (becerinin) yapılma hızı
→ ĠĢin (becerinin) kalitesi
2) ÇETELEME ARACI
Gözlenecek davranıĢların varlığını ‗x‘ , ‗evet‘ ,‘gözlendi‘ gibi iĢaret veya kelimelerle
gösterilmesine olanak sağlayan, fakat gözlenen davranıĢın derecesini belirtmeyen araç tipidir.
Çeteleme araçları bir beceriyi oluĢturan birimlerin öğrenci tarafından yapılma derecesi hakkında
bilgi vermez.
Ölçme aracı olarak çeteleme aracının hazırlanmasında aĢağıdaki aĢamalar izlenir.
1. ĠĢ analizi ve ürünü oluĢturan öğelerin ayrıntılı dökümü yapılır. Bir ürünün elde edilmesinde
öğrencinin hangi davranıĢları göstereceği (iĢlem basamakları) belirlenir.
2. Bu davranıĢlardan kritik olanlar seçilir ve bunlardan ölçülecek olanlar saptanır.
3. Bu davranıĢların gözlenmesini ve puanlamasını sağlayacak ya da kolaylaĢtıracak ölçme aracı
hazırlanır.
4. DavranıĢ gözlendiğinde ‗gözlendi‘ gözlenmediğinde ‗gözlenmedi‘ olarak kayıt edilir. Gözlenen
davranıĢa 1 gözlenmeyen davranıĢa da 0 puan verilir. Gözlenen davranıĢların sayısı öğrencinin
puanını oluĢturur.
5. ĠĢ yapılırken birey gözlenerek süreç puanlanmalı süreçten sonrada ürün incelenmelidir.
3) DERECELENDĠRME ÖLÇEKLERĠ
Gözlenen beceri veya davranıĢın karĢılanma derecesinin belirlenmesini sağlayan araçlardır.
Derecelendirme ölçeklerinin hazırlanmasında aĢağıda verilen basamakların izlenmesi uygun
olur.
1. Ürün bölünebildiği ölçüde alt bölümlere ayrılmalı, ürünü oluĢturan öğeler ayrıntılı olarak
belirlenmelidir.
2. Seçilen aĢamalar, puanlamayı kolaylaĢtırmak için derecelendirme ölçeği haline getirilir.
3. Her alt bölüm, kendi içinde ayrı ayrı puanlanır.
4. Puanlamada ürün özellikleri istenilen nitelikte taĢıyorsa 1;hiç taĢımıyorsa 0 puan verilir.
Belli oranlarda ise 3, 2 ve 1 puan verilir. Bu sayılar pekiyi,iyi,orta ve zayıf olarak sıfat
haline dönüĢtürülebilir.
5. Öğrencilerin aldıkları puanlar toplanarak öğrencilere puan verilir.
61
Hiç
Katılmıyorum(1)
Katılmıyorum(2)
Kararsızım(3)
Katılıyorum(4)
Tamamen
katılıyorum(5)
DERECELEME ÖLÇEĞĠ
Matematik çok sevdiğim dersler arasındadır
Matematik çalıĢmak beni dinlendirir.
Matematik derslerinde konu azaltılsa mutlu olurum
Matematik çalıĢırken canım sıkılır.
Matematikle uğraĢmak beni dinlendirir.
BoĢ zamanlarımda matematikle uğraĢmaktan zevk alırım
Matematik dersinden korkarım
Matematik problemi çözmek beni yorar.
DeviniĢsel alanda da öğretmenlerin hedef ve davranıĢları temel alarak belirtilen ölçme
araçlarını geliĢtirmeleri mümkündür. AĢağıdaki örnek gözlem formu „Hentbolle ilgili temel
becerileri edinebilme‟ hedefine dayalı olarak Demirhan‘dan tarafından geliĢtirilmiĢtir.
Puanlama anahtarı
Gözlenen hedef davranıĢlar böyle bir puanlama anahtarına göre puanlanır ve öğrencilere bu
puanların ortalaması alınarak bir not verilir.
Hareket gözlenmedi
0
Zayıf
1
Orta
2
Ġyi
3
RUBRĠK PUANLAMA
(Puanlama Yönergesi-Puanlama Anahtarı)
Rubrik bir öğrenci veya grubun yaptırılan bir etkinlikte kazandırılmak istenen
bilgi, beceri veya tutumda belirlenen kritere bağlı kalarak ne düzeyde kazanım elde ettiğini
belirlemek amacı ile hazırlanan not verme (derecelendirme) anahtarlarıdır. Rubrik, bir ölçme veya
etkinliğin tamamının ya da bölümlerinin nasıl puanlanacağının ana hatları ile gösterilmesidir. BaĢka
bir tanımla rubrik, kabul edilebilir ya da edilemez performans sınırlarının öğretmen ve öğrenciler
için açıkça belirtildiği kriter grubu ölçeğidir. Sınavlar için hazırlanan cevap anahtarının daha
geliĢmiĢi ve daha çok etkinlikleri değerlendirmede kullanılanlarıdır.
Öğrenci merkezli öğretim uygulamalarında kullanılan rubrik öğrenme standartlarını
yüksek tutmak için öğretmenin değerlendirmede kullanacağı ölçütleri geliĢtirerek öğrenciye
verdiği yönergelerdir. Bu yönergeler öğretim çalıĢmaları baĢlamadan önce öğrencilere verilerek
beklentiler netleĢtirilir ve öğrencinin çalıĢma süreci boyunca kendisini yönlendirmesi sağlanır.
62
Rubrik değerlendirmenin iĢlevleri Ģunlardır:
►Öğretmenin ne beklediği öğrenci tarafından bilindiğinden öğrenci kendisini programlayabilir.
►Her öğrencinin elinde rubrik önceden bulunduğundan öğrenci performansını geliĢtirir.
►Öğrenci eksik yönlerini görebilir, kendini baĢkaları ile karĢılaĢtırabilir.
►Öğrencilerin birbirlerini ve kendilerini değerlendirmelerini sağlar.
►Öğrenciye performansı ile ilgili dönüt verilir.
►Velilere öğrencinin geliĢimine ve değerlendirilmesine katkıda bulunma olanağı verir.
►Rubrikler öğretme-öğrenme yaklaĢımını etkili hale getirir.
Rubrik puanlamada;
►Öğrencinin kazanması gereken özellikler (hedef-davranıĢlar) belirlenerek uzmanlarında görüĢü
alınarak standart bir form üzerinden öğrencinin değerlendirilmesi yapılır.
►Öğrencilerin biliĢsel, duyuĢsal ve psikomotor geliĢim düzeyleri belirlenir.
►Her alan ve konu için standart bir form geliĢtirilerek değerlendirme yapılır.
►Öğrencilerin ortaya koyacakları etkinliklerin bölüm bölüm ya da tamamının nasıl puanlanacağını
ve öğrenci etkinliklerinin kabul edilip edilmeyeceğini gösteren kriterler ile öğrencinin her etkinlik
basamağının iyiden-kötüye doğru derecelendirilmesi ve her derece için uygun olan performans
kriterleri belirlenir.
Rubrik Puanlamanın Değerlendirme Sürecindeki Etkileri:
►Değerlendirmeye öğrenci ve öğretmen birlikte katılır.
►Öğretmenin değerlendirmede kullanacağı kriterler belirlidir.
►Öğrenci değerlendirme kriterlerini bilir ve etkinliklerini buna göre düzenler.
►Öğrenci nasıl değerlendirildiğini görür.
►Değerlendirmeyi sürece ve sonuca yayar.
►Rubrik aynı zamanda yazılı yoklamaların puanlanmasında
değerlendirme kriterlerinin belirlenmesinde de kullanılır.
ve
performans
testlerinin
Analitik ve holistik olmak üzere iki tür rubrik bulunmaktadır.
a-Holistik rubrik; Genel olrak yazma veya diğer yaratıcı, sanatsal çalıĢmalar için kullanılır.
Holistik rubrikler de ürün veya süreci bölümlere ayırmak her beceriyi ve kriteri bağımsız olarak
değerlendirmek yerine ürün ve sürecin bütünü değerlendirilir. Holistik rubrikler de öğrencinin
gösterdiği performansın bütününe tek bir puan verilmektedir. SONUCA ODAKLIDIR.
b- Analitik Rubrik: Analitik rubrikte ürün veya süreç bölümlere ayrılaraka her bölüm puanlanır ve
en sonunda puanlar toplanır. Bu rubrik türü çalıĢmanın yada ürünün faklı boyutlarına farklı puanlar
vermek mamacıyla yapılır. Analitik rubrikler, öğrenci performansının çeĢitli boyutlarındaki baĢarı
düzeyleri hakkında bilgi veren bir puanlama aracıdır. Bu tür puanlama ile öğrenciye yaptığı
çalıĢmadaki performansı hakkında ayrıntılı geri bildirim verir. SÜRECE ODAKLIDIR.
63
Puan Tanımlayıcı Ġfadeler
4
Canlılar
3
ile
Yuvalarını
2
EĢleĢtirme
1
Resimleri verilen tüm canlılarla yuvalarını doğru olarak eĢleĢtirmiĢ,
eĢleĢtirdiklerini istenilen yere yapıĢtırmıĢtır.
Resimleri verilen canlıların yarıdan fazlasının yuvalarını doğru olarak eĢleĢtirmiĢ,
eĢleĢtirdiklerini istenilen yere yapıĢtırmıĢtır.
Resimleri verilen tüm canlıların yarıdan azının yuvalarını doğru olarak eĢleĢtirmiĢ,
eĢleĢtirdiklerini istenilen yere yapıĢtırmıĢtır.
Resimleri verilen canlılardan birisinin yuvasını doğru olarak eĢleĢtirmiĢ.
Diğerlerini yanlıĢ eĢleĢtirmiĢtir.
Puan Tanımlayıcı Ġfadeler
4
3
Yuva
Ġhtiyacını
Açıklama
2
1
Canlıların yuvalarının olmasının gerekçelerini doğru olarak açıklamıĢ ve yuvaları
olmaması durumunda olabilecekleri örneklerle doğru olarak belirtmiĢtir.
Canlıların yuvasının olmasının gerekçelerini açıklamıĢ ve yuvaları olmaması
durumunda olabilecekleri belirtmiĢ fakat her ikisinde de çeliĢkili açıklamalar
yapmıĢtır.
Canlıların yuvasının olmasının gerekçelerini ya da yuvaları olmaması durumunda
olabileceklerden birisini açıklamıĢtır.
Canlıların yuvasının olmasının gerekçelerini ve yuvaları olmaması durumunda
olabileceklerle ilgisiz açıklamalar yapmıĢtır.
KONTROL LĠSTESĠ
Kontrol listeleri bir konuya ya da becerinin gerektirdiği performansı oluĢturan
etkinliklerin öğrenci tarafından ne kadarının gösterildiğinin belirlenmesi için uygulanır.
Kontrol listeleri performansın en önemli ve gözlenebilir yanlarını içerir. Böylece bir
aracın geliĢtirilmesi, ölçme konusu olan iĢin ya da performansın bütün kritik yanlarının tanınmasını
gerektirir. Bu gereğin karĢılanması ise iĢin yapılması sırasında göz önünde bulundurulacak
hususların ve çalıĢma sonunda ortaya çıkan üründe bulunması istenen özelliklerin belirlenmiĢ
olmasına bağlıdır. Bunun içinde daha temelde söz konusu iĢin analiz edilmesi gerekir. Kontrol
listesi bir ölçme aracı olarak kullanıldığı gibi bir öğretim aracı olarakta kullanılabilir. KiĢinin, belli
bir Ģeyi öğrenmesi evresinde neleri, hangi sıra ile ve nasıl yapacağını hatırlatmak maksadı ile
kullanılabilir.
Kontrol listeleri daha çok süreci ölçer ve belli kurallara uyulup uyulmadığını, belli iĢlem
yollarının izlenip izlenmediğini, bir davranıĢın gösterilip gösterilmediğini belirlemede kullanılır.
ĠĢin yapılıĢında gösterilmesi gereken davranıĢlar ve bitmiĢ üründe bulunması istenilen özellikler
var ya da yok iliĢkisinde ele alınır. Kontrol listeleri performansı oluĢturan davranıĢların her
birine ne düzeyde sahip olduğu hakkında bilgi veremez.
Kontrol listelerinin temel özellikleri:
☻Bir iĢin yapılması sırasında nelerin, hangi sırada ve nasıl yapılacağını gösterir.
☻Performansın en önemli ve gözlenebilir yanlarını gösterir.
☻Performansı oluĢturan davranıĢlardan ne kadarına sahip olunduğunu belirler.
☻DavranıĢın varlığını veya yokluğunu gösterme olanağı verir.
64
Araç kullanmaya iliĢkin bir kontrol listesi.
KONTROL LĠSTESĠ
GÖZLENECEK DAVRANIġLAR
Evet
Hayır
MarĢa basmadan önce vitesi boĢa alıyor mu?
MarĢa basarak motoru çalıĢtırıyor mu?
Arabayı birinci vitese alıyor mu?
KalkıĢ iĢaretini veriyor mu?
KalkıĢ yaparken el frenini bırakıyor mu?
Kontrol listesinde gözlenen davranıĢların varlığı veya yokluğu ‗yapar‘ ‗eder‘ Ģeklindeki
kelimelerle, ya da ‗evet‘ ‗hayır‘ Ģeklinde ifade edilir.
2007 KPSS: Bir ölçme aracının özelliklerinden bazıları Ģunlardır:
Bir iĢin yapılması sırasında nelerin, hangi sırada ve nasıl yapılacağını göstermesi nedeniyle
öğretim amaçlı da kullanılabilir.
 Gözlenecek davranıĢların varlığını veya yokluğu-nu gösterme olanağı tanır.
 Performansı oluĢturan davranıĢlardan ne kadarına sahip olunduğunu belirlemeyi
kolaylaĢtırır.
 Performansın en önemli ve gözlenebilir yanlarını kapsar.
 Performansı oluĢturan davranıĢların her birine ne düzeyde sahip olunduğu hakkında bilgi
veremez.
Bu ölçme aracı aĢağıdakilerden hangisidir?

A) Dereceleme ölçeği
D) Anket
B) Kontrol listesi
C) Tutum ölçeği
E) Puanlama yönergesi (rubrik)
ALTERNATĠF DEĞERLENDĠRME ARAÇLARI
1-TANILAYICI DALLANMIġ AĞAÇ (TDA): Geleneksel doğru yanlıĢ testlerinin
geliĢtirilmiĢ biçimidir. Geleneksel D/Y testlerinde her bir D/Y önermesi birbirinden bağımsızdır
ve tek baĢına ele alınıp değerlendirilir. Oysa TDA tekniğinde her bir D/Y kararı bir sonraki d/y
kararını etkileyen belirleyen sonuçlar içerir. TDA ile öğrencilerin biliĢsel yapılarındaki yanlıĢ
öğrenmeler ortaya çıkartılarak öğretme öğrenme süreci tekrar düzenlenebilir.
A ifadesi
D
Y
B Ġfadesi
D
Y
D Ġfadesi
D
1
C Ġfadesi
D
E Ġfadesi
Y
D
2
3
Y
F Ġfadesi
Y
D
4
5
65
G Ġfadesi
Y
D
6
Y
7
8
ġekilde görüldüğü gibi her öğrenciye A ifadesi sunulur. Bu ifadeye iliĢkin öğrencinin kararı yanlıĢ
olduğu yönünde ise (Y) c ifadesi ile; doğru(D) olduğu yönünde ise A ifadesi ile ilintili B Ġfadesi ile
karĢılaĢır.
TDA‟NIN Avantajları: a_Öğrencilerin yanlıĢ öğrenmelerini , zihinlerindeki yanlıĢ bağlantıları
ortaya çıkarmada oldukça etkilidir.
b- Öğrenciler yanlıĢ bir karar verdiğinde ve bunu farkına vardığında geri dönebilir. Böylece
soruyu tekrar cevaplayabilir.
,c- Kağıt kalem ile yapılabildiği gibi bilgisayar ortamında da eğlenceli bir Ģekilde ullanılabilir.
d- Öğretmen öğrenciler cevapları verirken hangi kararlardan vazgeçtiklerini , hangi sorulara
ne dediklerini tepsi edebilir.
TDA „NIN Sınırlılıkları:
-Hazırlanması tecrübe ister ve zaman alıcıdır.
-Kalsik doğru- yanlıĢ testleri gibi öğrencilerin tahminle cevap verme olasılığı vardır. Fakat
sorular birbiyleriyle iliĢkili olduğundan Ģans baĢarısı klasik doğru yanlıĢ testlerine göre
düĢüktür.
-Bu teknik ile üst düzey becerilerin ölçülmesi zordur.
2-YAPILANDIRILMIġ GRĠD: Öğrenci yeni aldığı bilgiyi anlamlandırmalı, var olan bilgilerle
iliĢkilendirmeli ve bu Ģekilde öğrenmeye yöneltilmelidir. YapılandırılmıĢ grid öğrencilerin bilgileri
ne Ģekilde iliĢkilendirdiğini yani öğrencilerin anlamlı öğrenmelerini ölçmeyi amaçlayan bir tekniktir.
Öğrencilerin kavram yanılgılarını, biliĢsel yapılarındaki eksikli ve aksaklıklarını ortay çıkarması
açısından yapılandırılmıĢ grid son zamanlarda öne çıkan bir yöntemdir.
Özellikleri: YapılandırılmıĢ Grid tekniğinde öğrencinin seviyesine ve yaĢına uygun olarak 9,12 veya
16 kurucuktan oluĢan bir tablo hazırlanır.
1
2
3
D/Y
4
TDA
5
YAZILI
7
ÇOKTAN SEÇMELĠ TEST
RUBRĠK
6
PORTFOLYO
8
SÖZLÜ
9
KELĠME ĠLĠġKĠLENDRĠME
TESTĠ
EġLEġTĠRME
YapılandırılmıĢ Grid Tekniğinin Avantajları:
Bu teknikle öğrencilerin hem görsel hem de sözel düĢünebilmesi sağlanır. YapılandırılmıĢ
gridler de kurucukların içine kelimeler resimler , tanımlar, formüller vb. konulabilir. Bu teknikte
Ģans baĢarısı veya tahminle cevaplama olasılığı hemen hemen yoktur.Öğrencilerin yanlıĢ
kutucukları seçmesi ; öğrencilerin yanlıĢ veya eksik öğrenmelerinin varlığını ortaya çıkararak
66
öğrencilerde var olan biliĢsel aksaklıkları gösterir.YapılandırılmıĢ grid tekniğinin uygulanması çok
az bir zamanda da mümkündür.
YapılandırılmıĢ Grid Tekniğinin Sınırlılıkları:
YapılandırılmıĢ Grid tekniği baĢlangıçta öğretmenlere hazırlanması açısından zor ve zahmetli
gelebilir. Ġyi bir yapılandırılmıĢ grid hazırlıklı ve alanında yeterli olan öğretmenler tarafından
hazırlanabilir. Bu nedenle öğretmenlerin bu tekniği iyi hazırlanmıĢ ve sıkı bir çalıĢma ile kullanması
gerekir.
3-VEE DĠYAGRAMI: Gowin ve Novak tarafından 1977 yılında anlamlı öğrenme teorisine dayalı
olarak geliĢtirilen vee diyagramı, kavramların oluĢumunda , kavramlar arası iliĢki kurmaya yardımcı
olur.
Vee diyagramı ile öğrenci problemi tanımlayabilir , bu problemin çözümünde ve
araĢtırmalarda gerekli olan kavramları bilir ve verileri toplayıp bu verileri kullanabilir. Vee
diyagramı gerekli bilgiyi elde etmeye , bilginin yapısını ve bilgiler arası iliĢkileri öğrenmeye
yardımcı olur.
Vee diyagramı fen alanındaki laboratuar çalıĢmalarında amacı netleĢtirmek ve öğrencilere
yol göstermek için kullanılır. Problemlerin çözümünde kullanıldığı için fen alanı dıĢındaki diğer tüm
alanlarda da kullanılabilir. Laboratuarda kullanıldığında, öğrencilerin deneylerindeki teorik bilgileri
ile uygulamadaki iliĢkileri kurmada oldukça etkilidir. Böylece uygulama ile öğrencinin psikomotor
davranıĢlarının geliĢmesinin yanında , öğrencinin aklında bilginin yapılandırılması da sağlanır.
Vee diyagramları, öğrenciye laboratuar çalıĢması öncesi hazırlık yapması, teorik bilgi ile
uygulama arasında iliĢki kurmasını sağladığı için ölçme ve değerlendirme için kullanımı oldukça
iyidir. Vee diyagramları da uygulamada öğrencinin ne gördüğünü ve bunun nasıl yorumlandığını
göstererek değerlendirme amaçlı kullanılır.
Hazırlanması:
1- Kalın çizgilerle ve büyük bir V Ģekli çizilir.
2- Çizilen Ģekli bir tarafına ―Kavramsal Kısım‖ diğer kısmına ―yöntemsel
Kısım‖ yazılır.
3- V Ģeklinin ortasındaki boĢ bölüme odak sorusu yazılır.
4- ġeklin uç kısmına araç gereçler yazılır.
5- Kavramsal kısma genelde teoriler , ilkeler, kavramlar yazılır.
6- Yöntemsel kısma ise deneysel iddialar , bilgi iddiaları , deney sonucu
elde edilen ölçümler, kayıtlar , veri dönüĢümleri yazılır.
- Teori
Odak sorusu
-Ġlkeler
-Bilgi iddiaları
-Deneysel Süreç
-Kavramlar
Araç Gereçler
67
Vee Diyagramının Bölümleri
Odak Sorusu: Kavramsal kısım ile yöntemsel kısım arasındaki iliĢkiyi sorgular. Odak sorusu kuram
ile uygulama arasındaki iliĢkiyi gösteren geçiĢtir. Odak sorusu bir yada iki tane olabilir. Odak
sorusu araĢtırmadaki olayları belirleyen , önemli ve yol gösterici kavramları içerir.
Araç ve Gereçler : Deneyde kullanılacak olan , sadece deneye ait olan araç ve gereçlerin liste
halinde yazıldığı bölümdür.
Kavramlar: deney ile ilgili gereken kavramların deneyden önce yazıldığı, öğrenciye uygulamada
yardımcı olan bölümdür.
Deneysel iddialar ve Bilgi iddiaları: Odak soruların cevabı olan bilgi iddiaları, araĢtırmaya yön
veren bölümdür. Bilgi iddiaları, kavramsal ve yöntemsel kısım ile tutarlı olmalıdır. Deneyle ilgili
olan yani uygulamaya yönelik olanlar ise deneysel iddialar oluĢturur.
Veri dönüĢümleri: Kullanılacak olan kayıtların, uygulamanın daha baĢarılı ve geçerli sonuçlar
vermesi için deneyden önce kendi aralarında dönüĢtürülmesidir. Böylece öğrenciler odak sorusunu
daha rahat ve kolay bir Ģekilde anlar ve bu soruya cevap verebilir.
Ölçümler ve Sonuçlar: Uygulama sınavında gözlenen sonuçların kaydedildiği bölümdür.
Vee diyagramının avantajları:
-
Bilginin nasıl kullanılıp nasıl yapılandırılacağını gösterir. Ve anlamlı
öğrenmeyi sağlar.
-
Deney öncesi hazırlık yapmayı sağlar ve zamandan kazandırır.
-
Ölçme ve değerlendirme amacıyla kullanılır.
-
Öğrencilerin bilgiler arası iliĢki kurmasını sağlayarak üst düzey
becerilerinin geliĢmesine katkıda bulunur.
-
Bilginin özümsenmesini ve bilgiyi anlamlandırmayı öğrenciye öğretir
Vee diyagramının Sınırlılıkları: YanlıĢ kullanımı, yanlıĢ yorumlara ve öğretimin sıkıcı hale
gelmesine sebep olur ve öğretimin ilk kademlerinde kullanımı zordur.
4-POSTERLER: Bir projeyi, bir konuyu, bir sistemi resimler ile zenginleĢtirilmiĢ Ģekilde daha
önceden o konu, proje yada sistem ile ilgisi olmayan bireylere ana hatlarıyla tanıtıcı nitelikte olan
grafiklere poster denir.
Posterler, bir araĢtırmanın sunulduğu araçlar olduğundan okuyucuların dikkatini çekecek
Ģekilde ve anlatılmak istenen konuyu net ve açık anlatabilecek Ģekilde hazırlanmalıdır.
Posterler hazırlanırken aĢağıdaki hususlara dikkat edilmelidir:
1.
Hazırlanacak posterlerin geniĢliği 60-70 cm , yüksekliği 90-100 cm olmalıdır.
2.
Poster; giriĢ, amaçlar, bulgular ve sonuçlar Ģeklinde kısımlara ayrılmalıdır ve
kısımlara arası iliĢkiler vurgulanmalıdır.
3.
Hazırlana posterin yazı büyüklüğü en az 1 metreden okunabilecek Ģekilde olmalıdır.
4.
Posterdeki yazılar, resimler, Ģekiller, grafikler hem posteri bir bütün olarak ifade
etmeli hem de aralarındaki renk uyumu doğru ve dikkat çekici olmalıdır.
5.
Poster, okuyucuya en iyi Ģekilde sunulmalıdır.
68
Posterler ölçme ve değerlendirme aracı olarak kullanılırsa bazı kriterlere göre
değerlendirildiğinde öğrencilerin araĢtırma yapma becerilerinin ve üst düzey davranıĢlarının
geliĢmesine yardımcı olur. Öğrencinin performansının değerlendirildiği posterin son hali yan
hazırlana son ürün öğrenci baĢarı düzeyini belirlemede çok etkilidir. Öğretmenler , hazırlanan
posteri dikkatlice inceleyerek her öğrenciye anında dönüt vermeli ve dikkatlice posterin en iyi
Ģekilde hazırlanmasını sağlamalıdır.
5-KELĠME ĠLĠġKĠLENDĠRME TESTĠ (KĠT): Öğrencinin biliĢsel yapısını ve bu yapıdaki
kavramlar arasındaki bağları, yani bilgi ağını gözler önüne serebilen , uzun dönemli hafızadaki
kavramlar arasındaki iliĢkilerin yeterli olup olmadığını tespit edebilmemize yarayan tekniklerden
birisi kelime iliĢkilendirme testidir.
Öğrenci bu teknikte belli bir süre içerisinde (çoğunlukla 30 Saniye) herhangi bir konu ile ilgili
verilen bir anahtar kavramın çağrıĢtırdığı kelimelere cevap olarak verir.öğrencinin uzun dönemli
hafızasından herhangi bir anahtar kavrama verdiği sıralı cevabın biliĢsel yapıdaki kavramlar
arasında bağlantıları ortaya koyduğu ve anlamsal yakınlığı gösterdiği farz edilir. Anlamsal yakınlık
ve anlamsal mesafe etkisine göre , anlamsal bellekte iki kavram birbirine mesafe açısından ne
kadar yakın ise o kadar sıkı iliĢkidedir ve hatırlama esnasında da zihinsel araĢtırma daha çabuk
olacağından her iki kavramla ilgili cevap daha hızlı olacaktır.
Avantajları: Hem ölçme ve değerlendirme hem de tanı amaçlı kullanılabilen KĠT‘in en büyük
avantajı hazırlanmasının kolay olması ve 5 dakikalık bir zaman diliminde uygulanabilir. Ayrıca
bireysel uygulanabileceği gibi büyük gruplara da kolaylıkla uygulanabilir. Tüm derslerde
kullanılabilme esnekliği de vardır.
Öğrencinin biliĢsel yapısındaki kavramlar arasında var olan iliĢkileri ortaya koymayı,
öğrencinin ne bildiği ve ne öğrendiği arasındaki farkı görmemizi sağlar.
Sınırlılıkları: Üst düzey düĢünme becerilerinin ölçülmesinde zayıf kalabilir.
69
ÖLÇME SONUÇLARI ÜZERĠNDE
ĠSTATĠSTĠKSEL ĠġLEMLER
Ölçme sonuçlarına bakarak, grup hakkında ya da eğitim sistemi hakkında bazı kararlar
verebilmek için ölçme sonuçları üzerinde istatistiksel iĢlemlerin yapılması gerekmektedir. Ancak
istatistiksel iĢlemlerin yapılabilmesi için öncelikle ön uygulamaların yapılması gerekir. Yani
bilgilerin istatistiksel yolla çözümleme aĢaması iki ana uygulamadan oluĢur.
A) ÖN UYGULAMALAR: Ölçme sonuçları ilk elde edildiklerinde ham
puan halinde düzensizdirler. Bu puanların düzenlenmesinde en basit yol öncelikle puanların
BÜYÜKLÜK SIRASINA konulmasıdır. Sıralama büyükten küçüğe veya küçükten büyüğe doğru
yapılabilir. Test puanları üzerinde yapılması gereken ön uygulamalar genel olarak üç temel nokta
üzerinde toplanmaktadır.
1. Puanların büyükten küçüğe doğru sıralanması,
2. Puanların frekanslarının belirlenmesi,
3. Puan grafiklerinin çizimi,
ÖRNEK: Bir sınavdan 12 öğrencinin aldığı notlar Ģöyle olsun :
82, 77, 95, 62, 68, 38, 62, 45, 100, 62, 100, 68
Bu Ģekliyle bu notlar hakkında yorum yapmak oldukça zordur. O nedenle bunları sıralamak gerekir.
SıralanmıĢ puanlar ise Ģöyledir:
38, 45, 62, 62, 62, 68, 68, 77, 82, 95, 100, 100
Bu haliyle bu sınavdan alınan en yüksek notun 100 en düĢük notun da 38 olduğu söylenebilir.
FREKANS DAĞILIMI: Frekans dağılımı test puanlarının nasıl bir dağılım gösterdiğini ve HER
PUANIN KAÇ KEZ TEKRARLANDIĞINI GÖSTERĠR. Frekans dağılımının en basit biçiminde
puanlar büyükten küçüğe doğru sıralanır ve her puanı alan öğrenci sayısı ( frekans: f) onun
karĢısına yazılır.
ÖRNEK: Yukarıda verilen puanların frekans tablosunu oluĢturacak olursak:
PUAN
FREKANS
.
38
1
.
45
1
.
62
3
.
68
2
.
77
1
.
82
1
.
95
1
.
100
2
70
ÖRNEK:
12
10
FREKANS
8
6
PUAN
4
2
0
2
4
6
8
10 12 14 16
TOPLAM FREKANS KAÇTIR?
PUAN
FREKANS
2
2
4
2
Bu grafiğe göre kiĢi sayısı kaçtır?
6
3
8
4
10
7
Frekans: Her puandan kaç tane
alındığını gösteren sayı. Öyleyse toplam
frekans kiĢi sayısına eĢittir
12
10
14
8
16
+ 2
TOPLAM FREKANS =
=
38
B) ĠSTATĠSTĠKSEL ĠġLEMLER:
Ön uygulamalar ile formatlanmıĢ
öğrenci puanları üzerinde bazı istatistiksel iĢlemlerin yapılması gerekir. Bunun için öğretmenlerin
kullanabileceği genel olarak iki istatistik yöntemi bulunmaktadır. Bu yöntemler:
1) MERKEZĠ EĞĠLĠM ÖLÇÜLERĠ (Vasat Ölçüleri, Merkeze Yığılma ölçüleri)
2) MERKEZĠ DAĞILIM ÖLÇÜLERĠ (Merkezi DeğiĢim Ölçüleri)
71
1) MERKEZĠ EĞĠLĠM ÖLÇÜLERĠ (Vasat Ölçüleri, Merkeze Yığılma Ölçüleri)
Merkeze yığılma ölçüleri puanların nerelerde toplandığını açık ve kesin olarak ortaya
çıkarmada kullanılır. Puan dağılımında verilerin hangi puan etrafında toplandığı hakkında bilgi
veren ve grubunu özetleyen değerlerdir. Merkeze YIĞILMA ÖLÇÜLERĠ MOD (Tepedeğer),
MEDYAN (Ortanca), ARĠTMETĠK ORTALAMALARDIR.
A) ARĠTMETĠK ORTALAMA: Bir testin aritmetik ortalaması, teste giren öğrencilerin
almıĢ oldukları puanların toplamının testi alan öğrenci sayısına bölünmesiyle bulunur.
Vasat ölçüleri arasında en istikrarlı alanı ARĠTMETĠK ortalamadır. ORTANCA ve
MOD üzerinde dağılımdaki herhangi bir puanın etkisi az iken, ARĠTMETĠK
ORTALAMADA her bir puan sonuç üzerinde etkilidir.
hesaplanır:
X
Ġle gösterilir. ġöyle
Teste giren öğrencilerin Puan Toplamı
x = —————————————————
Teste giren öğrenci sayısı
ÖRNEK: Bir sınıfta 10 öğrenci olsun. Öğrencilerin fizik dersinden aldıkları puan sırasıyla 55, 70,
75, 40, 50, 45, 80, 90, 35, 60 ise bu sınıfın aritmetik ortalaması kaçtır?
55+70+75+40+50+45+80+90+35+60
ARĠTMETĠK ORTALAMA= ———————————————— = 60
10
ÖNEMLĠ ***Bir dağılımda aritmetik ortalamanın büyük olması durumunda ORTALAMA
ÖĞRENME DÜZEYĠ ya da GRUBUN (Mutlak) BAġARI DÜZEYĠ YÜKSEKTĠR açıklaması yapılır.
Yani aritmetik ortalama arttıkça öğrenme artar.
ÖRNEK:
12
FREKANS
10
8
6
PUAN
4
2
0
2
4
6
8
10 12 14 16
Puan dağılımının aritmetik ortalaması kaçtır?
Aritmetik Ortalama=
2  2  4  2  6  3  8  4  10  7  12  10  14  8  16  2 396
 10,42
=
2  2  3  4  7  10  8  2
38
72
ÖRNEK:
Matematik dersinden 20 öğrencinin aldıkları puanlar aĢağıdaki gibidir.
X (puan)
f
100
90
80
70
60
50
40
30
20
1
2
3
2
4
3
2
2
1
Tablodaki bilgilere dayanarak bu puan dağılımının aritmetik ortalaması kaçtır?
ÖRNEK:
Fizik dersinden 20 öğrencinin aldıkları puanların dağılımı aĢağıdaki gibidir.
Puan Aralığı (x)
Frekans (f)
45 - 49
40 - 44
35 - 39
30 - 34
25 - 29
20 - 24
2
3
5
4
2
4
Yukarıdaki puan dağılımının aritmetik ortalaması kaçtır?
2008 KPSS: Mehmet öğretmen, öğrencilerine uyguladığı bir test sonucunda elde ettiği
puanlardan bazı istatistikleri hesaplamıĢtır. Daha sonra, öğrencilerden birinin puanını yanlıĢ
yazdığını fark etmiĢ ve gerekli düzeltmeyi yaparak istatistikleri tekrar hesaplamıĢtır.
Buna göre, Mehmet öğretmen‟in düzeltmesi sonucunda aĢağıdaki istatistiklerden hangisi kesin
olarak değiĢmiĢtir?
A) Ortalama
B) Ortanca
DĠKKAT 1 :
Ders
1
2
3
4
5
AO
50
60
75
55
90
ortalamaya
bakılır
C) Mod
MOD
70
40
65
80
95
ve
D) Ranj
MEDYAN
60
50
70
70
92
E) Yığmalı frekans
SS
5
7
4
3
2
aritmetik
Bu tür tablolar verildiği sorularda;
Grubun baĢarı düzeyinin,
Grubun mutlak baĢarı düzeyinin ,
Öğrencilerin ortalama baĢarı düzeyinin,
öğrencilerin öğrenme düzeyinin en düĢük
yada yüksek olduğu ders hangisidir.
ġeklinde ifadeler bulunursa aritmetik
ortalamaya
göre
yorum
yapılır.
DĠKKAT 2- Sınıftan bir öğrencinin puanının değiĢmesi aritmetik ortalamayı değiĢtir.
73
AĞIRLIKLI ORTALAMA: Bazı durumlarda puanların ortalamaya katkılarının farklı olması
gerekebilir. Farklı ağırlıklar verilerek hesaplanan ortalamaya ―ağırlıklı ortalama‖ denir. Örneğin:
lisede baĢarı notu hesaplama da ağırlıklı ortalama kullanılır. Her bir dersin notu, haftalık ders
saati ile çarpılarak bu çarpımların sonuçları toplanır ve ders saati toplamına bölünür.
Puan×Kredi
Ağırlıklı Ortalama =
Toplam kredi
ÖRNEK: Bir ilköğretim öğrencisinin aldığı notlar ve derslerin kredileri aĢağıdaki gibidir.
DERS
KREDĠ
Matematik
4
3
Türkçe
4
5
Fen Bilgisi
3
4
Beden Eğ.
2
5
Yabancı Dil
2
3
Ağırlıklı Ortalama=
Bu öğrencinin ağırlıklı
ortalaması kaçtır?
NOT
4  3  4  5  3  4  2  5  2  3 60
=
=4
15
15
B) ORTANCA (MEDYAN): Büyüklük sırasına göre düzenlenmiĢ puanlar dizisinin tam
ortasına düĢen puana ortanca (medyan) denir. Ölçümlerin yarısı bu değerin üstünde diğer yarısı da
altında yer alır. Ölçüm sonuçlarının sayısının tek olması, çift olması ortancanın hesaplanma
yöntemini değiĢtirir.
* Bir dizi ölçümde ölçüm sayısı (N) tek ise,
ÖRNEK: 10, 3, 12, 8, 18, 20, 9 sayılarının ORTANCA değerini bulunuz?
Öncelikle bu veri grubu sıraya konur.
3, 8, 9, 10,1012, 12, 18, 20
ORTANCA
Veya Ģöyle de bulabiliriz  n = 7 ise formül
n 1
7 1
ise =
= 4 sayı bize ortancayı verir.
2
2
* Bir dizi ölçüm sayısı (N) çift ise, ölçüm değerleri sağdan ve soldan eĢit oranda
ayrıldıktan sonra ortada kalan 2 değer toplanarak ikiye bölünür ve ORTANCA bulunur.
ÖRNEK: 40, 80, 45, 55, 65, 75 sayılarının ortanca değerini bulunuz?
Öncelikle bu veri grubu sıraya konur.
40, 45,
55, 65,
N=
75, 80
55  65
= 60 ORTANCA 60'TIR.
2
74
Ortancanın Bazı Özellikleri:
* Ortanca bir dağılımı ortadan ikiye böldüğüne göre, dağılımda % 50. noktayı gösterir.
* Ortanca ölçüm sayısına eklenecek herhangi bir değerden hemen etkilenir ve değiĢir.
* Ortanca, ölçüm sonuçları dizisindeki değerleri iki eĢit gruba böler.
C) MOD (Tepe Değer): Ölçme sonucu elde edilen ölçümlerden en çok tekrarlanan değere
MOD (tepe değer) denir. Yani frekansı en yüksek olan değerdir. Tepe değer verilerin en çok hangi
puan etrafında toplandığı hakkında bilgi verir. Bir dağılımda birden çok MOD olabilir.
ÖRNEK: 10 kiĢilik bir sınıfın Türkçe dersinin sınavından aldığı notlar Ģöyle olsun…
35, 60, 55, 100, 55, 90, 70, 55, 85, 80
Yukarıdaki puanları sıralarsak = 35, 55, 55, 55, 60, 70, 80, 85, 90, 100. Görüldüğü üzere bu
dağılımın MODU 55‘tir. Yani frekansı en yüksek olan puan 55‘tir.
Bir puan dağılımında ardıĢık iki değer en büyük ve eĢit frekansa sahipse, mod bu iki değerin
ortalamasına eĢittir.
ÖRNEK: 1, 2, 3, 4, 4, 4, 4, 6, 6, 6, 6, 7, 8, 8, 9 Ģeklinde olan bir puan dağılımının modu, en çok
tekrar eden ardıĢık iki değer olan 4 ve 6‘nın ortalamasına eĢittir.
Mod =
46
5 ‘tir.
2
Bir puan dağılımında ardıĢık olmayan iki değer en büyük ve eĢit frekansa sahipse, bu dağılımın iki
farklı modu olur.
ÖRNEK: 1, 2, 3, 5, 5, 5, 7, 8, 9, 9, 9 Ģeklinde olan bir puan dağılımının modu frekanslara en yüksek
ve eĢit olan ve ardıĢık olmayan 5 ve 9‘dur. Yani dağılım çift modludur.
NOT: Bir frekans dağılımında bütün değerlerin frekansı aynı ise bu frekans dağılımının MODU
yoktur.
ÖRNEK: 11, 11, 44, 44, 6, 6, 8, 8
NOT: MOD: merkezi yığılma ölçüsü olarak kaba bir istatistik olup ancak en büyük frekansın hangi
puanda olduğunu gösterir. Böyle olmakla birlikte tepe değer: ortanca ve aritmetik ortalama gibi
istatistiklerle karĢılaĢtırılarak frekans dağılımlarının yorumlanmasında kullanılır.
75
2003 KPSS: AĢağıda aynı değiĢkenle ilgili bir ölçümler dizisine iliĢkin dört tanım
verilmiĢtir.
I. En yüksek frekansa sahip olan değer,
II. Büyüklük sırasına konmuĢ ölçümler dizisinin tam ortasındaki değer,
III. Ölçümlerin toplamının ölçüm sayısına bölünmesiyle elde edilen değer,
IV. En büyük ölçüm ile en küçük ölçüm arasındaki fark.
AĢağıdakilerden hangisinde bu tanımlara karĢılık gelen kavramlar doğru olarak verilmiĢtir?
I
II
III
IV
A) MEDYAN
MOD
STANDART S.
RANJ
B) MEDYAN
RANJ
ARĠTMETĠK O.
MEDYAN
C) RANJ
STANDART S.
D) MOD
MEDYAN
ARĠTMETĠK O.
RANJ
E) MOD
MEDYAN
STANDART S.
ARĠTMETĠK O.
ARĠTMETĠK O.
MEDYAN
NOT: Vasat ölçülerine iliĢkin istatistiksel iĢlemlerde, sonucundan en iĢlevsel yararlanılanı
ARĠTMETĠK ORTALAMADIR. Sonra ORTANCA sonra da MOD‘tur.
ORTALAMA, ORTANCA VE MOD‟UN KARġILAġTIRILMASI
Ortalama, ortanca ve mod arasında benzerlikler olduğu gibi birçok farklılıkta söz
konusudur.
a) Ortalama; ortanca ve mod‘a göre daha çok bilgiye dayanır. Çünkü ortalama
hesaplanırken gözlenen ölçümlerin tümü iĢleme katılır. Ölçümlerin tümünün iĢleme katılması
ortalamayı diğer vasat ölçülerinden daha istikrarlı ve daha güvenilir yapar.
b) Ortalama, vasat ölçüsü olmanın dıĢında baĢka matematiksel iĢlemler içinde uygundur.
c) Ortalamanın değeri ölçümlerin değerine bağlıdır. Ayrıca ortanca bir puan dağılımındaki
uç değerlerden etkilenmez. Örneğin 2,5,7 olan bir dağılımda ortanca 5 tir. Eğer Bu dağılım
2,5,100 olsaydı ortanca yine 5 olurdu.
2007 / KPSS
5A sınıfındaki öğrencilerin 25 soruluk matematik testinden aldıkları puanlar gruplanarak
aĢağıdaki frekans grafiğinde gösterilmiĢtir.
Frekans
8
7
6
5
4
3
2
1
0
1-5
6-10
11-15 16-20 21-25
76
Puan
1. 5A sınıfının mevcudu kaçtır?
A) 5
B) 7
C) 8
D) 20
E) 25
2. 5A sınıfının matematik testi puanlarının aritmetik ortalaması kaçtır?
A) 5,7
B) 7,4
C) 14,5
D) 18,6
E) 20
3. 5A sınıfının matematik testi puanların tepe değeri (mod) kaçtır?
A) 5
B) 7
C) 8
D) 18
E) 25
2009 KPSS SORUSU: Bir coğrafya öğretmeni 100 soruluk bir baĢarı testi uygulamıĢ ve test
puanlarının ortalamasını 75, ortancasını 80, tepe değerini (mod) 90, standart sapmasını 8 ve
ranjını 90 bulmuĢtur. Öğrencilerin dersten geçebilmeleri
için en az 65 puan almaları
gerekmektedir.
Test puanlarına iliĢkin istatistiklere ve değerlendirme ölçütüne dayanarak bu dağılım için
aĢağıdakiyorumlardan hangisi yapılamaz?
A) Ölçümlerin yüzde elliden fazlası ortalamadan büyüktür.
B) Merkezî eğilim ölçüsü olarak ortancadan yararlanılmalıdır.
C) Sınıfın büyük çoğunluğu geçer not alır.
D) Tepe değeri, gözlenen en büyük değerdir.
E) Ortalamayı çarpıtan uç değer(ler) bulunmaktadır
2) MERKEZĠ DAĞILIM (DEĞĠġĠM) ÖLÇÜLERĠ
Merkezi dağılım ölüleri verilerin yığılma gösterilen noktadan ne kadar uzakta olduklarını,
nasıl bir dağılım gösterdiklerini belirten istatistikleridir. Bir grubu belirli bir özelliği yönünden
yeterince tanıyabilmek ve gruplar arasında çok yönlü karĢılaĢtırmalar yapabilmek için merkezi
eğilim ölçüleri yeterli değildir. Bu durumda merkezi dağılım ölçülerine gereksinim duyulur. BaĢlıca
dağılım ölçüleri Ģunlardır:
A) Ranj (Puan GeniĢliği)
B) Standart Sapma (Kayma)
C) Çeyrek sapma
A) RANJ (Puan GeniĢliği): Bir dağılımda en yüksek puan ile en düĢük puan arasındaki farktır.
Ranj; bir veri grubunun hangi aralıkta değiĢkenlik gösterdiğini belirten istatistiktir. Ranj, puan
dağılımları hakkında kaba bilgi verir.
ÖRNEK: Puanları 90, 85, 75, 70, 55, 40 olan bir dizi düĢünelim. Bu dizinin ranjı:
90 ─ 40 =
50 dir
Ranj değeri dikkate alınarak yapılabilecek yorumlar yüzeysel olmakla birlikte sadece ranj
değeri varsa Ģu yorumlar yapılabilir:
1) Ranj değeri büyük olan grupların test sonuçları ranj değeri küçük olan grupların test
sonuçlarından daha güvenilirdir.
77
2) Ranj değeri büyük olan grubun heterojen olduğu, bilenle bilmeyenin birbirinden ayrıldığı,
bireylerin ölçülen özellik bakımından farklılık gösterdiği söylenebilir.
3) Ranj değeri küçük olan bir grubun homojen olduğu, bilenle bilmeyenin birbirinden ayrılmadığı,
bireylerin ölçülen özellik bakımından benzer olduğu söylenebilir.
B) STANDART SAPMA (KAYMA) (SS): Standart sapma bireyin ya da grubun notlarının
aritmetik ortalamaya olan farkını (uzaklığını ya da yakınlığını) gösteren sayısal değerdir. Bir dizi
ölçümün gösterdiği değiĢimin en güvenilir ölçüsü standart sapmadır. Standart sapma istatistikte
en çok kullanılan ölçüdür.
GruplandırılmıĢ verilerde standart sapma Ģöyle hesaplanır:
→ Dağılımın aritmetik ortalaması bulunur = (
X)
→ Her ölçümün aritmetik ortalamadan farkı alınır = (Xi- X )
→ Farkların kareleri alınır ve toplanır = (
 X ²)
→ Bulduğumuz toplamı elaman sayısına yani ( N ─ 1 ) e böleriz
→ Çıkan sonucun karekökünü alırız.
Bu açıklamayı formülle Ģu Ģekilde gösteririz = S =
 ( xi  x)²
N 1
Standart kaymanın alması gereken değer her bir istatistiksel hesaplamada değiĢkenlik
göstermektedir. Kesin olarak standart kayma Ģu sayıda olmalıdır Ģeklinde bir Ģey söylenemez.
Standart sapma normal dağılım üzerinde aritmetik ortalamaya . ( X ) göre olan -3 ve +3 arasında
yer alan dağılıma göre Ģu Ģekilde gösterilir:
-3
-2
-1
X
+1
Bir dağılımda aritmetik ortalama (
+2
+3
X ) 60, standart sapma 3 ise dağılım doğrusu Ģu Ģekilde
gösterilir:
-3
51
-2
54
-1
0
57
60
+1
63
+2
+3
66
69
Standart Sapmaya Dayanarak ġu Yorumu Yapabiliriz:
Standart sapma KÜÇÜKSE;

Grup baĢarısı yüksektir.
78

Grup homojen bir yapıya sahiptir.

Öğrencilerin öğrenme düzeyleri birbirine yakındır.

Öğrenciler arasında farklılaĢma azdır.

Testin ayırt ediciliği düĢer.

Testin güvenirliği düĢer.

Standart sapma küçükse ranjda küçüktür.
Standart sapma BÜYÜKSE;

Grup baĢarısı düĢüktür.

Grup heterojen bir yapıya sahiptir.

Öğrencilerin öğrenme düzeyleri birbirinden uzaktır.

Öğrenciler arasında farklılaĢma fazladır.

Testin ayırt ediciliği yükselir.

Testin güvenirliği artar.

Standart sapma büyürse ranjda büyür.
Dikkat :Bu tür tabloların verildiği sorularda,
Ders
1
2
3
4
5
AO
50
60
75
55
90
MOD
70
40
65
80
95
MEDYAN
60
50
70
70
92
SS
12
3
5
10
7
Öğrenciler arasında farklılaĢmanın en fazla/en az,
Öğrencilerin
farklı,
öğrenme
düzeylerinin
benzer
Grubun homojen / heterojen olduğu ders
hangisidir Ģeklinde sorulursa standart sapmaya
bakılır.
ÖRNEK:
TESTLER
ARĠTMETĠK ORT.
MOD
ORTANCA
S. SAPMA
A)
I
65
75
70
7
B)
II
35
55
40
6
C)
III
40
40
40
8
D)
IV
40
25
30
9
E)
V
60
40
45
16
Yukarıdaki tabloya göre öğrenciler arasında farklılaĢma en çok hangi testtedir?
Çözüm: Standart sapması büyük olan dağılımda bireyler arası farklılaĢmada büyüktür. Standart
sapma büyüdükçe benzerlik azalır. Dolayısıyla farklılaĢmanın en çok olduğu test standart sapmanın
en yüksek olduğu 5. testtir. Doğru cevap E Ģıkkıdır.
79
ÖRNEK:
DERSLER
X
S.S
TÜRKÇE
70
3
MATEMATĠK
71
4
COĞRAFYA
70
4
FĠZĠK
80
5
KĠMYA
75
4
Hangi derste ortalama öğrenme düzeyi en yüksektir? Hangi derste ortalama öğrenme
düzeyi en düĢüktür?
ÇÖZÜM:
a) Ortalama öğrenme düzeyinin yüksek olmasını gösteren en önemli gösterge ARĠTMETĠK
ORTALAMANIN yüksek olmasıdır. Ancak aritmetik ortalamalar EġĠTSE o zaman standart
sapması en küçük olan derste ortalama öğrenme düzeyi en yüksektir. Buna göre aritmetik
ortalamanın en yüksek olduğu fizik dersinde ORTALAMA ÖĞRENME düzeyi en yüksektir.
b) Aritmetik ortalaması en düĢük olan derste ortalama öğrenme düzeyi en düĢüktür. Ancak
yukarıdaki gibi aritmetik ortalamalar birbirine eĢitse bu durumda standart sapması büyük olan
dersin ortalama öğrenme düzeyi en düĢüktür. Dolayısıyla COĞRAFYA dersinde ortalama öğrenme
düzeyi en düĢüktür.
2008 KPSS: Bir grup öğrenciye uygulanan dönem sonu sınavlarına iliĢkin istatistikler tablodaki
gibidir.
DERSLER
Aritmetik
ortalama
8
Medyan
Mod
Kimya
Soru
sayısı
20
6
4
Standart
sapma
4
Tarih
40
30
35
39
7
Türkçe
30
15
18
23
6
Fizik
50
30
30
30
11
Felsefe
40
14
10
7
9
Öğrencilerin en baĢarılı olduğu ders hangisidir?
A) Kimya
B) Tarih
C) Türkçe
D) Fizik
80
E) Felsefe
ÖĞRENCĠLER
2009 KPSS SORUSU:
58. – 60. SORULARI AġAĞIDAKĠ BĠLGĠLERE GÖRE CEVAPLAYINIZ.
10 soruluk bir sınava ait öğrenci yanıtları aĢağıdaki tabloda verilmiĢtir. Her soruda doğru yanıta ―1‖, yanlıĢ
yanıta ―0‖ puan verilmiĢtir. Yanıtlanmayan soru bulunmamaktadır.
SORULAR
A
B
C
D
E
F
G
H
I
J
1
1
1
0
1
0
1
1
1
1
0
2
1
1
1
1
0
1
1
1
1
0
3
1
0
0
1
1
0
0
0
1
0
4
0
0
0
0
0
0
0
0
0
0
5
0
1
1
1
0
1
1
1
0
0
6
1
1
1
0
0
1
1
1
0
1
2009 KPSS SORUSU:
Öğrencilerin bu sınavdan aldıkları puanların ranjı kaçtır?
A)3
B)5
C)6
D)9
7
1
1
1
1
1
1
1
1
1
1
8
0
0
1
1
1
1
0
0
0
1
9
1
0
1
1
1
1
0
0
0
0
10
0
1
1
0
0
1
0
1
1
0
E)10
2009 KPSS SORUSU:
Hangi sorular ölçülen özellikler açısından öğrencilerin bireysel farklılıklarını ortaya çıkarmada hiç
etkili olmamıĢtır?
A) Yalnız 4. soru
D) 4. ve 7. sorular
B) Yalnız 7. soru
E) 4., 7. ve 8. sorular
C) Yalnız 8. soru
2009 KPSS SORUSU:
Bu sınavdaki test puanlarının frekans dağılımı yaklaĢık olarak aĢağıdakilerden hangisinde verilmiĢtir?
A) Frekans
B) Frekans
C ) Frekans
Puan
D)
Frekans
Puan
Puan
E) Frekans
Puan
Puan
81
C) ÇEYREK SAPMA
Çeyrek sapma birinci ve üçüncü çeyreğin farkının yarısıdır ve q ile gösterilir.Bri yayılma
ölçüsü olan çeyrek sapma, merkezi eğilim ölçüsü olarak ortancanın kullanıldığı durumlarda
kullanılır.
Q=
Q3 -Q1
Y -Y
veya Q= 75 25
2
2
Q1
Y25
Q3
Y75
Q2
%25
%25
Örnek:
Birinci çeyreği 20, üçüncü çeyreği 40 olan bir dağılımın çeyrek sapması kaçtır?
Çözüm:
Q=
Q3 -Q1
2
Q=
40-20
 10 ‘dur.
2
Not:UygulanmıĢ olan bir sınavda puanlar aĢırı uçlara yayılmıĢsa yayılma ölçüsü olarak çeyrek sapma
kullanılır.
MADDE ĠSTATĠSTĠKLERĠ (MADDE ANALĠZĠ)
Madde analiziyle Ģu üç soru cevaplandırılmaya çalıĢılır:
1) Maddenin güçlük derecesi nedir?
2) Madde iyi öğrenci ile zayıf öğrenciyi birbirinden ayırt edebiliyor mu?
3) Maddelerin çeldiricileri iyi çalıĢıyor mu?
MADDE GÜÇLÜK ĠNDEKSĠ (DERECESĠ)
Bir testte herhangi her maddeye verilen doğru cevaplar sayısının o maddeyi
cevaplayanların tamamına oranı sorunun güçlük derecesini gösterir. Bunu Ģöyle gösteririz:
Maddenin Güçlük Ġndeksi (PJ) =
J maddesine doğru cevap veren öğrenci sayısı
————————————————————
Testi alan cevaplayıcıların tamamı
82
ÖRNEK: Bir testin 15. maddesine 40 öğrenci doğru 10 öğrencide yanlıĢ cevap vermiĢ ise bu
maddenin güçlük indeksi
40
 0,80 olur.
50
→ Madde güçlük indeksi maddeyi doğru cevaplayanların sayısına göre 0 ile 1 arasında değer alır.
→ Madde güçlük indeksi maddenin kolaylığının bir ölçüsüdür.
→ Maddeyi doğru cevaplayanların sayısı arttıkça madde kolaylaĢacağından PJ değeri 1‘e
yaklaĢacak ve madde zorlaĢtıkça da PJ değeri 0‘a yaklaĢacaktır.
MADDE GÜÇLÜK ĠNDEKSĠ özellikle büyük gruplarda (100-200 cevaplayıcının olduğu durumlarda)
öğretmenler tarafından karmaĢık istatistiksel hesaplamalar gerektirmeyen ―basit madde analizi‖
yöntemiyle de bulunabilir. Madde analizi yönteminde izlenecek yol Ģöyledir:
1) Öğrenci cevapları puanlandırılır.
2) Test puanlarına göre öğrenci cevap kâğıtları en yüksek puandan en düĢük puana doğru
sıralanır.
3) SıralanmıĢ kâğıtlardan en yüksek ve en düĢük puan alan % 27‘lik grupta yer alan kağıtlar
seçilerek üst ve alt gruplar oluĢturulur. Geride kalan diğer kâğıtlar (% 46) analiz dıĢında tutulur.
4) Testte bulunan bütün sorular için aĢağıdaki tablo hazırlanır:
SORU
SEÇENEKLER
NO
A
B
TOPLAM
C
D
ÜST GRUP
N (Aü)
n (Bü)
n (Cü)
n (Dü)
n (ü)
ALT GRUP
N (Aa)
n (Ba)
n (Ca)
n (Da)
n (a)
TOPLAM
N (A)
n (B)
n (C)
n (D)
N
5) Öğrencilerin verdikleri cevaplara göre madde
özelliklerinden güçlük indeksi aĢağıdaki formül ile hesaplanır.
özellikleri
hesaplanır.
Madde
n(dü)+n(da)
P.j ———————
N
FORMÜL =
PJ
= J maddesinin güçlük indeksi
n (dü) = Maddeyi üst grupta doğru cevaplayanların sayısı
n (da) = Maddeyi alt grupta doğru cevaplayanların sayısı
N
= Üst ve Alt gruptaki toplam öğrenci sayısı
Bulunan değer 0 ile 1 arasında bir değer olur. Çıkan sonuca göre madde güçlük indeksi ile
ilgili Ģu yorumlar yapılabilir:
0,00 ile 0,40 arasında bulunan maddeler  ZOR
0,41 ile 0,60 arasında bulunan maddeler  ORTA GÜÇLÜKTE MADDELER
0,61 ve 1,00 arasında bulunan maddeler  KOLAY MADDELER
83
Görüldüğü üzere indeksin 1‘e yakın çıkması kolay bir soru olduğunu; 0‘a yakın çıkması zor
bir soru olduğunu gösterir. Soruların ORTA güçlükte olması ise güvenirliği artırıcı rol oynar.
ÖRNEK: AĢağıdaki tabloda numaralanmıĢ 5 sorunun doğru cevaplanma yüzdeleri verilmiĢtir. (PJ)
Bu değerlere bakarak yapılan yorumlardan hangisi doğrudur?
SORU
PJ
A) En zor soru 5. sorudur
1
0,34
B) 4. soru öğrencilere en kolay gelen sorudur.
2
0,44
C) 3. Soru orta güçlükte bir sorudur.
3
0,82
D) 4. Soru çok zor bir sorudur ve öğrencilere zor gelmiĢtir.
4
0,23
E) Öğrencilere en kolay gelen soru 3. sorudur
5
0,85
ÖRNEK:
1. SORU
A
ÜST
20
11
*B
C
D
TOPLAM
59
11
10
100
12
39
38
100
GRUP
ALT
GRUP
Verilen sorunun güçlük indeksi kaçtır?
A) 0,36
B) 0,45
C) O,59
D) 0,68
E) 0,71
nü + na
59+12
71
P = ————— = ———— = ———— = 0,3555 ~ 0,36...
N
100+100
200
ZOR BĠR
SORUDUR.
ÖRNEK: 200 kiĢilik bir gruba uygulanan 10 maddelik bir genel yetenek testinde üst
grupta ve alt grupta 100‘er kiĢi bulunmaktadır. Test 5 seçeneklidir. Ve 1. madde için alt ve üst
gruplardaki seçenek dağılımları aĢağıda verilmiĢtir.
1. SORU
ÜST
A
%3
B
C
% 20
D
E
% 11
% 54
% 12
% 21
% 34
% 12
GRUP
ALT
% 13
% 20
DOĞRU SEÇENEK D dir. Yukarıdaki durumda madde güçlük indeksi ne olacaktır?
84
(PJ) MADDE GÜÇLÜK ĠNDEKSĠ =
n(dü)+ n(da)
——————— =
N
54+34
———— =
200
88
——— = 0,44
200
0,41 ve 0,60 arasında bulunan maddeler ORTA GÜÇLÜKTEKĠ MADDELER olduğu için
maddenin ORTA GÜÇLÜKTE BĠR MADDE OLDUĞU yorumu yapılır.
bu
MADDE AYIRICILIK GÜCÜ ĠNDEKSĠ (Ayırt Etme Gücü) (rj)
Bir sorunun ayırıcılık gücü bilen ile bilmeyeni veya baĢarılı öğrencilerle baĢarısız
öğrencileri ayırt etme kudretini ifade eder. Bir baĢka deyiĢle maddelerin ancak iyi öğrenciler
tarafından cevaplandırılabileceği, konuya hakim olmayanların bilemeyecekleri nitelikte olması
özelliğidir.
Maddelerin ayırıcı gücünü hesaplamada kullanılan formül Ģöyledir :
Üst Grupta Soruyu Doğru
Cevaplayan Öğrenci Sayısı
Alt Grupta Soruyu Doğru
─
Cevaplayan Öğrenci Sayısı
Maddenin Ayırıcı Gücü =
Alt ya da Üst Gruptan herhangi birisinin eleman sayısı
Madde yeteri kadar ayırıcı ise test puanı yüksek olanların maddeyi doğru cevaplamaları,
test puanı düĢük olanların ise yanlıĢ cevaplamaları beklenir. Öyleyse güvenilir bir test ayırıcılığı
yüksek maddelerden oluĢan bir testtir.
Maddenin ayırıcılık gücü değeri -1 ve +1 arasında değer alır. BaĢarı testlerinde maddelerin ayırıcı
gücü aĢağıdaki kriterlere göre değerlendirilir.
Maddenin Ayırıcı Gücü
Maddenin Değerlendirilmesi
0,19 ve daha küçük değerler
Amaca hizmet etmeyen çok zayıf
negatif değerler
madde, testten çıkarılmalı
0,20 ve 0,29 arasında
Düzeltilmeli ve geliĢtirilmeli.
0,30 ve 0,39 arasında bulunanlar
Oldukça iyi çalıĢan ama yine de geliĢtirilebilir.
0,40 ve 1.00 arasında bulunanlar
Çok iyi çalıĢan
Maddelerin ayırt etme gücü ile ilgili olarak Ģu yorumlar yapılabilir:
a) BaĢlıca amacı iyi öğrenciler ile zayıf öğrencileri birbirinden ayırt etmek olan bir baĢarı
testindeki her bir maddenin mümkün olduğunca yüksek ayırt etme gücüne sahip olması gerekir.
Yani 1‘e yakın olması gerekir.
b) Ayırt etme gücünün yüksek olması için, bir maddeyi üst grupta doğru cevaplayanların sayısı alt
grupta aynı maddeye doğru cevap verenlerin sayısından fazla olmalıdır. Bu anlamda bütün
öğrencilerin doğru yada yanlıĢ cevaplandırdığı bir maddenin ―ayırt etme‖ gücü yoktur.
85
c) Ayırıcılık gücünün büyüklüğü testin kullanılıĢ amacına, o testi alan grubun ölçülen değiĢken
bakımından homojen yada heterojen oluĢuna göre değiĢir.
ÖRNEK:
MADDE
A
B
C
D
CEVAPSIZ
TOPLAM
NO
*
ÜST GRUP
15
5
3
2
0
25
ALT GRUP
5
10
5
5
0
25
N
Yukarıdaki sorunun ayırıcılık gücü ile ilgili ne söylenebilir?
rj=
15  5 10
= 0,40 → SORU BĠLEN ÖĞRENCĠLER ile BĠLMEYEN ÖĞRENCĠYĠ

25
25
AYIRMADA YETERLĠDĠR... (ÇOK ĠYĠ ÇALIġAN)
2003 KPSS: AĢağıdaki tabloda numaralanmıĢ beĢ sorunun doğru cevaplanma yüzdeleri (pj)
değeri ile ayırt edicilik değerleri (rj) verilmiĢtir.
SORU
Pj
rj
1
0,35
0,60
2
0,40
-0,35
3
0,80
0,10
4
0,25
0,15
5
0,85
0,50
SORU 1: Eğer düzeltilemiyorsa yukarıdaki sorulardan hangisi, testten mutlaka çıkarılmalıdır?
A) 1
B) 2
C) 3
D) 4
E) 5
Çözüm: Bir maddenin ayırt ediciliği bilenle bilmeyeni birbirinden ayırt etmesidir. Yani zayıf
öğrenci ile iyi öğrenciyi ayırabilmesidir. Ayırt etme indeksi -1 ile +1 arasında değiĢir. Bir maddenin
ayırt etme indeksi 0,19 ve daha küçük ise, çok zayıf ve düzeltilemiyor ise testten çıkarılmalıdır.
Buna göre negatif bir ayırt ediciliğe sahip olan 2 . MADDE testten çıkarılmalıdır.
Soru 2: BaĢvuran kiĢinin çok, seçilecek kiĢinin az olduğu bir sınavda kullanılacak soruların çoğu
güçlük ve ayırt edicilik bakımından yukarıdaki sorulardan hangisine benzer olmalıdır?
A) 1
B) 2
C) 3
D) 4
86
E) 5
Çözüm: Böyle bir durumda ayırt ediciliği yüksek, güç sorular tercih edilmelidir. 1. Soru GÜÇ ve
AYIRT EDĠCĠ bir soru olduğu için o soru tercih edilmelidir.
Soru 3: Yukarıdaki sorulardan hangisi kolay ve ayırt edici bir sorudur?
A) 1
B) 2
C) 3
D) 4
E) 5
Çözüm: Kolay sorular güçlük indeksinin 0,50‘den büyük olduğu sorulardır. 3 ve 5. soruların güçlük
indeksleri 0,80 ve 0,85‘tir ve dolayısıyla kolay sorulardır. Ayırt edici sorular ise 1‘e yakın olan
sorulardır. Bu durumda testte hem kolay hem de ayırt edici olan 5. SORUDUR.
GÜÇLÜK ĠNDEKSĠ
0
0,40_0,60
ZORLAġIR
+1
ORTA GÜÇLÜK
KOLAYLAġIR
2008 KPSS: Bir testteki maddelere iliĢkin aĢağıdaki değerler elde edilmiĢtir.
Maddeler
I
II
III
IV
V
Madde güçlüğü
0,1
0,15
0,5
0,6
0,9
Madde ayırıcılık
gücü
0,08
-0,15
0,5
0,28
0,43
Tabloda verilen bilgilere göre hangi maddenin güvenirliğe katkısı en yüksektir?
A) I
B) II
C) III
D) IV
E) V
Yapılandırılacak bir testte bu maddeleri kullanma zorunluluğu olsaydı, en köklü değiĢikliğin
hangi maddede yapılması gerekirdi?
A) I
B) II
C) III
D) IV
E) V
2009 KPSS SORUSU 53 – 55. SORULARI AġAĞIDAKĠ BĠLGĠLERE GÖRE CEVAPLAYINIZ.
AĢağıdaki tabloda 10 soruya ait madde güçlüğü (p) ve ayırtedicilik (r) değerleri verilmiĢtir.
Soru
p
r
1
0,35
0,25
2
0,05
0,65
3
0,15
0,15
4
0,90
0,05
5
0,70
0,35
6
0,40
0,40
7
0,15
0,10
8
0,75
0,60
9
0,15
0,40
10
0,95
0,25
87
2009 KPSS SORUSU: Uygulama sonucunda yukarıdaki değerleri elde eden bir öğretmen,
ayırtediciliği düĢük olan maddeleri düzeltilemediği için testten çıkarmak istemektedir.
Bu maddelerin çıkarılması aĢağıdakilerden hangisine neden olur?
A) Testin ölçüt geçerliğinin düĢmesine
B) Kalan maddelerin güçlük indeksinin düĢmesine
C) Çeldiricilerin iyi çalıĢmamasına
D) Testin iç tutarlığının düĢmesine
E) Testin kapsam geçerliğinin düĢmesine
2009 KPSS SORUSU: Tablodaki maddelerden hangisi hem kolay hem
sorudur?
A) 3
B) 4
C)8
D) 9
E) 10
2009 KPSS SORUSU: Tablodaki maddelerden hangisi, testle ölçülen
oldukça üst düzey yeterliğe
sahip olan öğrencileri seçmek için kullanılabilir?
A) 1
B) 2
C) 5 D) 7
E) 10
de ayırtedici bir
özellikler açısından
MADDE VARYANSI (Sj2)
Madde varyansı bir maddeyi doğru cevaplayanların oranıyla yani madde güçlük indeksi ile
(pj), o maddeyi cevaplayamayanların oranının (qi) çarpımına eĢittir.
Maddeyi doğru cevaplayamayanların oranı 1‘den madde güçlük indeksinin çıkarılması ile elde edilir.
qj=1-pj‘dir.
qj: Maddeyi doğru cevaplayamayanların oranı
pj: Maddeyi doğru cevaplayanların
oranı
Örnek:
Bir maddenin güçlük indeksi 0,40 ise bu maddenin varyansı kaçtır?
Çözüm:
qj = 1 – pj
qj = 1 – 0,40
qj = 0,60



Sj2 = pj . qj
Sj2 = 0,40 . 0,60
Sj2 = 0,24‘tür.
Öğrencilerin çoğunun maddeyi doğru ya da yanlıĢ cevaplaması durumunda madde varyansı 0
(sıfır)‘a yaklaĢır. Yani madde varyansı küçük ise öğrencilerinin verdikleri cevaplar arasındaki
değiĢimde azdır.
Eğer tüm öğrenciler maddeyi doğru cevaplamıĢsa veya hiçbiri doğru cevaplayamamıĢsa madde
varyansı ―0‖ olur.
Madde varyansının en büyük değeri 0,25‘tir.
88
MADDENĠN STANDART SAPMASI(Sj)
Bir maddenin Standart sapması o maddenin varyan sının kareköküne eĢittir.Madde
varyansı madde standart sapmasının karesi olduğundan madde standart sapması için yapılan
yorumlar madde varyansı içinde geçerlidir.
MADDE GÜVENĠRLĠK ĠNDEKSĠ (rj)
Madde güvenirlik indeksi, madde ayırt edicilik gücü indeksi ile maddenin standart
sapmasının çarpımı sonucu elde edilir. rj ile gösterilen madde güvenirlik indeksi aĢağıdaki formül
ile hesaplanır.
rj=rjx . Sj
Sj: Maddenin standart sapması
rjx: Maddenin ayırt edicilik gücü indeksi
rj: Maddenin güvenirlik indeksi
Örnek:
Standart sapması 8, madde ayırt ediciliği 0,50 olan bir maddenin güvenirliliği kaçtır?
Çözüm:
rj = rjx . Sj
rj = 8 . 0,50
rj = 4‘tür.
Bir maddenin standart sapması ya da ayırt edicilik gücü arttıkça güvenirlik indeksi de artar.
TEST ĠSTATĠSTĠKLERĠ (TEST ANALĠZĠ)
TESTĠN ORTALAMA GÜÇLÜĞÜ
Bir testin aritmetik ortalaması kullanılarak hesaplanan güçlük derecesi de test hakkında
bazı yargılara ulaĢmamızda ipucu oluĢturur. Testin ortalama güçlük derecesi aĢağıdaki formülle
hesaplanır:
Testin Ortalama Güçlüğü (P) =
Puanların Aritmetik Ortalaması
———————————————
Testten Alınabilecek En Yüksek Puan
Hesaplanan değer hakkında Ģu yorumlar yapılabilir:
(P) = Testin Ortalama Güçlüğü 0,50‟den küçükse:
→ Test öğrencilere güç gelmiĢtir, sorular zor hazırlanmıĢ olabilir,
→ Sınıfta yapılan öğretim yetersiz olabilir,
→ Ġstenilen seviyeye çıkarılamamıĢ, zayıf öğrenciler çoğunlukta olabilir.
(P) = Testin Ortalama Güçlüğü 0,50‟den büyük ise:
→ Öğrencilerin çoğunluğu öğretilen konuları öğrenmiĢlerdir. Öğretim yeterlidir.
→ Test güçlük düzeyi bakımından kolay sorulardan oluĢmuĢtur.
89
NOT: TESTTEN alınabilecek en yüksek puan: her bir sorunun ağırlıklı puanının 1 olduğu bir sınav
için o sınavdaki soru sayısı kadardır. Yani 10 soruluk bir testten maksimum 10, 80 soruluk bir
testten maksimum 80 alınabilir.
2004 KPSS:
DERSLER
SORU SAYILARI
X (Aritmetik Ortalama)
BĠYOLOJĠ
10
5,2
MATEMATĠK
45
38,1
TARĠH
14
11,7
FĠZĠK
19
13,4
KĠMYA
12
6,9
Tabloda soru sayıları ve aritmetik ortalamaları verilmiĢ dersler bulunmaktadır. Yukarıda
verilen derslerin hangisinde baĢarı oranı en yüksektir?
ÇÖZÜM: Böyle bir soruyu cevaplayabilmek için testin ortalama güçlük derecesine bakarsak hangi
derste öğrencilerin daha baĢarılı olduğuna karar verebiliriz.
Testin ortalama güçlüğünü bulmak için her derse ait aritmetik ortalamayı, alınabilecek en
yüksek puana yani soru sayısına böleriz.
Yukarıdaki örnekteki her bir dersin ortalama güçlüğü Ģu Ģekilde hesaplanır:
5,2
BĠYOLOJĠ: ——= 0,52
10
13,4
FĠZĠK: ———= 0,70
19
38,1
——— = 0,85
45
Matematik:
11,7
TARĠH: ——— = 0,83
14
6,9
KĠMYA :——— = 0,58
12
Bu sonuçlara göre ortalama güçlüğü en yüksek olan ders yani en kolay ders
MATEMATĠKTĠR. Bu yüzdende öğrencilerin en baĢarılı olduğu ders MATEMATĠKTĠR.
90
ÖRNEK:
SINIFLAR
DEĞERLENDĠRME ARALIĞI
SINIF ORTALAMASI
1
0 ─ 100
72
2
0 ─ 20
13,5
3
1─5
4,20
4
0 ─ 50
16
5
0 ─ 40
16
ÇÖZÜM: Tabloda 5 sınıfa ait yapılan ölçme sonuçlarının değerlendirme aralığı ve sınıf
ortalamaları verilmiĢtir. Yukarıda verilen sınıflardan hangisi öğrenmeler bakımından diğerlerine
göre daha baĢarısızdır?
Sınıfın baĢarısız olması demek testin ortalama güçlük düzeyi bakımından öğrencilere güç
gelmiĢ olması demektir. Öyleyse her sınıf için testlerin ortalama güçlük düzeylerini bulup ona göre
sınıfların baĢarı durumları hakkında yorum yapabiliriz.
1 . SINIF ĠÇĠN ORTALAMA GÜÇLÜK =
72
 0,72
100
2. SINIF ĠÇĠN ORTALAMA GÜÇLÜK=
13,5
 0,67
20
3. SINIF ĠÇĠN ORTALAMA GÜÇLÜK=
4.20
 0,84
5
4. SINIF ĠÇĠN ORTALAMA GÜÇLÜK=
16
0,32
50
5. SINIF ĠÇĠN ORTALAMA GÜÇLÜK=
16
 0,40
40
Bu sınıflarda
(P)→Güçlük düzeyi
0,50'den büyük olduğu
için öğrencilerin çoğu
konuyu öğrenmiĢlerdir
ve baĢarı yüksektir
yorumu yapılır.
Bu sınıflarda ise (P) → Güçlük
düzeyi 0,50 den küçük olduğu için
öğrenciler konuyu öğrenmemiĢ ve
öğrencilerin baĢarı düzeyleri de
düĢüktür. Ancak en baĢarısız olan
SINIF 4. SINIFTIR =0,32
2008 KPSS: Bir grup öğrenciye uygulanan dönem sonu sınavlarına iliĢkin istatistikler tablodaki
gibidir.
DERSLER
Aritmetik
ortalama
8
Medyan
Mod
Kimya
Soru
sayısı
20
6
4
Standart
sapma
4
Tarih
40
30
35
39
7
Türkçe
30
15
18
23
6
Fizik
50
30
30
30
11
Felsefe
40
14
10
7
9
Öğrencilerin en baĢarılı olduğu ders hangisidir?
A) Kimya
B) Tarih
C) Türkçe
D) Fizik
91
E) Felsefe
NOT: Bir test bütün olarak analiz edilirken öğrencilerin boĢ bıraktıkları ve cevaplamadan
kaçındıkları madde sayılarına ve bu maddelerin içeriklerine de bakmak gerekir. Testteki soruların
öğrenciler tarafından boĢ bırakılarak cevaplandırılmaması testin güvenirlik ve geçerliğini büyük
ölçüde düĢürür. Üstelik testteki maddelerin programın hedefleri ile ilgili olacağı düĢünülürse boĢ
bırakılan sorular ile ölçülmesi amaçlanan hedef davranıĢlarda ölçülmemiĢ olur.
Testte yer alan herhangi bir madde öğrencilerin üçte biri veya dörtte biri tarafından boĢ
bırakılmıĢ ise aĢağıdaki ihtimallerden biri ya da bir kaçı söz konusu olabilir:
→ Testin açıklaması (yönergesi) öğrencinin cevaplama iĢlemini nasıl yapacağını anlaĢılır bir
Ģekilde ifade etmekten uzaktır.
→ Madde kökü, ne sorulduğunu, sorudan ne istendiğini anlatacak yeterlilikte değildir.
→ Seçenekler arasında kesin ve tek bir doğru cevap yoktur.
TESTĠN AYIRTEDĠCĠLĠĞĠ
A) Ranja Göre Ayırtedicilik:
Uygulanan testin maksadı baĢarı düzeyleri bakımından öğrencileri birbirinden AYIRTETMEK ise
baĢka bir deyiĢle programın hedeflerini gerçekleĢtirmiĢ öğrenci ile gerçekleĢtirmemiĢ öğrenciyi
teĢhis etmekse TESTĠN PUANLARINDAN HESAPLANAN DĠZĠ GENĠġLĠĞĠ BÜYÜK
OLMALIDIR.
Dizi GeniĢliği: En yüksek puan ile en düĢük puan arasındaki farktır yani RANJ…
KURAL: Ayırt edici, dolayısıyla geçerliği ve güvenirliği yüksek bir testte hesaplanan dizi geniĢliği
o testten elde edilmesi, mümkün en yüksek puanın yarısına yakın olmalıdır.
ÖRNEK:
Dersler
Ranj
K
Fizik
50
110
Kimya
72
130
Biyoloji
38
80
Tarih
75
120
Matematik
58
100
Yukarıdaki tabloda 5 derse ait ranj değerleri ve soru sayıları verilmiĢtir. Sınıfın
hangi dersteki ayırt ediciliği en yüksektir?
A) Fizik
D) Tarih
B) Kimya
E) Matematik
C) Biyoloji
ÖRNEK: 80 maddeden oluĢan birçoktan seçmeli testte en yüksek puan 65 en düĢük puan 45
olarak gözlenmiĢtir. Bu test hakkında öğrendiğimiz kurala göre ne söylenebilir?
Beklenen dizi geniĢliği (RANJ) =
80
 40 civarında olmalıdır.
2
Test puanlarının dizi geniĢliği = 65 ─ 45 = 20
92
Hesaplanan dizi geniĢliği beklenenden oldukça düĢük olduğu için TESTĠN
AYIRTEDĠCĠLĠK GÜCÜ ZAYIFTIR yani iyi öğrenmiĢ öğrenci ile iyi öğrenmemiĢ öğrenciyi ayırt
etme gücü ZAYIFTIR.
YORUM:
B) Aritmetik Ortalamaya Göre Ayırtedicilik:
Testten elde edilen puanların aritmetik ortalamasından yararlanılarak da özellikle testin ayırt
edicilik gücü hakkında bilgi sahibi olunabilir. BaĢlıca, kullanılıĢ amacı: farklı baĢarı düzeylerine
göre öğrencileri ayırt etmek ve öğrenme derecelerine göre öğrencileri sıralamak olan bir testin
ORTALAMA PUANI; O TESTEN ELDE EDĠLECEK EN YÜKSEK PUANIN YARISINA yakın
olmalıdır.
ÖRNEK:
Dersler
X
K
Fizik
60
110
Kimya
68
130
Biyoloji
36
80
Tarih
52
120
Matematik
52
100
Yukarıdaki tabloda 5 derse ait aritmetik ortalama ve soru sayıları verilmiĢtir. Sınıfın
hangi dersteki ayırt ediciliği en yüksektir?
A) Fizik
D) Tarih
B) Kimya
E) Matematik
C) Biyoloji
TESTĠN GÜVENĠRLĠĞĠ
Dağılımın standart kayması ile dizi geniĢliği birlikte de düĢünülebilir. Dizi geniĢliğinin (R) standart
kaymaya (S) oranı bu konuda bir fikir verebilir.
KURAL: Geçerliği ve güvenirliği yüksek bir testin puanlarından hesaplanan dizi geniĢliği (R)
değeri, Standart Sapma (S) değerine bölündüğünde 4 ile 6 arasında bir değer elde edilmelidir.
( R / S: 4–6)
Örnek: 80 maddeden oluĢan bir çoktan seçmeli testte en yüksek puan 65 en düĢük puan 45 ve
testin standart sapması 2,5 olarak hesaplanmıĢtır. Bu öğrendiğimiz kurala göre bu test hakkında
ne söylenebilir?
(R) Test puanlarının dizi geniĢliği = 65 – 45 = 20
(S) Standart sapma
= 2,5
R / S = 20 / 2,5 = 8
YORUM: Dizi geniĢliğinin standart sapmaya oranı 4 ile 6 arasında bir sayı olmadığı için bu testin
güvenirliği ve geçerliği düĢüktür.
93
DAĞILIMIN YORUMLANMASI
Frekans dağılımlarına bağlı olarak bir grup hakkında iki türlü yorum yapılabilir: Bunlar
ÇARPIKLIK (KayıĢıklık) veya Bağıl DeğiĢkenlik yorumlarıdır.
ÇARPIKLIK KayıĢıklık): Bir frekans dağılımının Ģekline bakarak onu oluĢturan puanların dağılımı
hakkında bazı yorumlar yapılabilir. Bu yorumlar aritmetik ortalama, ortanca ve modun birbirlerine
olan büyüklük, küçüklük ve eĢitlik durumlarına göre üç farklı biçimde yapılır.
ÇARPIKLIK ÖLÇÜSÜ =
3.
(ORTALAMA-ORTANCA)
————————————
S. SAPMA
Bu formülün uygulanması sonunda elde edilen değerlere göre testin güçlüğüne iliĢkin
olarak Ģunlar söylenebilir:
ÇARPIKLIK ÖLÇÜSÜ
GRUP ĠÇĠN TESTĠN GÜÇLÜK DÜZEYĠ
NEGATĠF ĠSE
→
KOLAY
POZĠTĠF ĠSE
→
ZOR
0,10 dan KÜÇÜKSE
→
0,10-0,25 arası ĠSE
→
0,25 den BÜYÜK ĠSE
→
HAFĠF ZOR
ORTA GÜÇLÜKTE
ÇOK ZOR
NOT: Verilen formül uygulandığında elde edilen sonuç sıfır veya sıfır civarında çıkarsa normal
dağılım eğrisine uyuyor demektir.
ÖRNEK: Aritmetik ortalaması 68, ortancası 65 ve standart sapması 13 olan bir testin çarpıklık
değeri kaçtır? Bu test nasıl bir testtir?
ÇÖZÜM:
ÇARPIKLIK = 3.
(68–65)
————— =
13
3,3
—— = 0,69
13
Bu test zor sorulardan oluĢan, oldukça zor bir testtir. Yorumu yapılabilir.
a) Normal Dağılım ( Simetrik Dağılım): Aritmetik ortalama, ortanca ( medyan) ve
modun (tepe değer) birbirine eĢit olduğu dağılımdır. KayıĢıklığın 0 (sıfır) çıkması
durumudur. BaĢarı açısından normal bir sınıf dağılımını gösterir.
94
BÖYLE BĠR GRAFĠK SĠMETRĠK BĠR DAĞILIM
OLDUĞUNU GÖSTERĠR
Not: Simetriklik aritmetik ortalama, ortanca ve mod'un
eĢit olması durumudur. Ancak cevaplar arasında üçünün
birbirine eĢit olmayıp ikisinin eĢit olduğu bir dağılım var ise
bu dağılımda
SĠMETRĠK kabul edilebilir.
X
MOD
MEDYAN
b) Sağa Çarpık Dağılım (Pozitif KayıĢlı): Mod < Ortanca < x (Aritmetik Ortalama)
Ģeklinde olduğu yani aritmetik ortalamanın ortancadan, ortancanın moddan büyük olduğu dağılım
sağa çarpık yani pozitif kayıĢlı bir dağılımdır. Grafikle gösterecek olursak:
MOD
MEDYAN
X
puan
Grafikte puanların çoğu dağılımın sol tarafında yığılmıĢtır. Böyle bir dağılımda Ģu yorumlar yapılır:
►Pozitif kayıĢlıdır.
►Öğretim yetersizdir.
►Öğrencilerin öğrenme düzeyi düĢüktür.
►Öğrenciler hedef davranıĢları kazanamamıĢlardır.
►BaĢarı düĢüktür.
►Sorular ve Test zordur.
c) Sola Çarpık Dağılım (Negatif KayıĢlı): X < ORTANCA < MOD Ģeklinde olduğu yani
aritmetik ortalamanın ortancadan küçük, ortancanın da moddan küçük olduğu dağılım SOLA
ÇARPIK yani NEGATĠF KAYIġLI bir dağılımdır. Puanların yarıdan fazlasının aritmetik
ortalamanın üstünde toplandığı söylenir. Grafikle gösterecek olursak;
95
frekans
x
MEDYAN
MOD
puan
Grafikte puanların çoğu sağ tarafta yığılmıĢtır. Böyle bir dağılımda Ģu yorumlar yapılır:
►Negatif kayıĢlıdır.
►Öğretim yeterlidir.
►Öğrencilerin öğrenme düzeyi yüksektir.
►BaĢarı yüksektir.
►Sorular ve test kolaydır.
►Program ve öğretimin hedefleri gerçekleĢmiĢtir.
d) Ġki ya da Çok Modlu Dağılım: BaĢarı düzeyleri çok farklılık gösteren bir sınıfın
dağılımı bu Ģekildedir. Öğretim dönemi baĢında öğrencilerin önbilgi düzeyleri çok farklılık
gösteriyorsa öğretim sonunda bu tür bir dağılım elde edilebilir.
MOD
X
MOD
ORTANCA
96
BAĞIL DEĞĠġKENLĠK KATSAYISI (V)
Hem aritmetik ortalamayı hem de standart sapmayı içeren ve daha çok bilgi, veren değiĢkenlik
katsayısı ―bağıl değiĢkenlik‖ katsayısıdır. Bağıl değiĢkenlik katsayısı standart sapmanın aritmetik
ortalamaya bölünüp, yüzle çarpılması sonucunda elde edilen bir yüzdedir. Bağıl değiĢkenlik
katsayısı aĢağıdaki formül ile hesaplanır.
V =
Sx
.100
X
V : Bağıl değiĢkenlik katsayısı
Sx : Standart sapma
X : Aritmetik ortalama
Normal dağılım gösteren bir veri grubunda bağıl değiĢkenlik katsayısı 20 ile 25 arasında
değiĢir.
Bağıl değiĢkenlik katsayısının 20‘en daha küçük olması standart sapmanın aritmetik
ortalamaya göre küçük olması demektir. Standart sapmanın küçük olması ise, puanların birbirine
yakın olduğu, yani puan dağılımının sivri olduğunu gösterir.
Bağıl değiĢkenlik katsayısının 25‘ten daha büyük olması standart sapmanın aritmetik
ortalamaya göre büyük olduğu anlamına gelir. Standart sapmanın büyük olması ise, puanların
birbirinden uzak olduğu, yani puan dağılımının basık olduğunu gösterir.
Bağıl
DeğiĢkenlik
Katsayısı
Puan
Dağılımı
Dağılım Özelliği
26 ve yukarısı
Heterojen
Basık
20-25
Normal
Normal Dağılım
19 ve aĢağısı
Homojen
Sivri
97
STANDART PUANLAR
Standart puan; gözlenen puanların ortalamadan olan farklarının standart sapma cinsinden
belirtilmesidir. Ġki farklı dersten alınan puanların veya farklı kategorilerden elde edilen
ölçümlerin birbirleriyle karĢılaĢtırılması hatalı olur. KarĢılaĢtırmanın yapılabilmesi için Z ve T
puanlarının hesaplanması gerekir. Bu puanlar; araĢtırmalarda sıkça karĢılaĢılan Ģu tür soruları
cevaplandırma imkânı sağlar:
→ Üzerinde birden çok gözlem yapılan bir öğrenci (birden çok test alan bir öğrenci) aldığı
puana göre hangi testte daha baĢarılıdır?
→ Birden çok gözlemden aldıkları puanlara göre, birçok kiĢiden hangisi daha baĢarılıdır?
→ Birden çok gözlemden aldıkları puanlara göre birçok kiĢinin baĢarı sırası nedir?
A) Z PUANI = Z puanlarının ortalaması sıfır ( X =0) Standart sapması (S = 1,00) kabul edilir.
Herhangi bir kiĢinin testten almıĢ olduğu puanı Z puanına dönüĢtürerek verilen bir puanın
ortalamanın ne kadar altında veya üstünde kaldığını belirleyebiliriz. Z puanını hesaplayabilmek için
Ģu formülden yararlanırız:
FORMÜL =
Z =
XX
S
Z: Z Puanı
X: Herhangi bir kiĢinin puanı
X : Puanlar dağılımının ortalaması
S: Dağılımın standart sapması
98
ÖRNEK:
DERSĠN ADI
ÖĞR. ALMIġ OLDUĞU PUAN
STANDART SAPMA
X
GELĠġĠM
75
60
12
ÖĞRENME
80
65
10
ÖLÇME
65
65
5
YÖNTEM
90
80
4
PROG. GEL.
60
50
6
REHBERLĠK
85
60
8
Öğrencinin en baĢarılı ve en baĢarısız olduğu dersler hangileridir?
Çözüm: Böyle bir yorum yapabilmek için Z puanının hesaplanması gerekir:
Z=
XX
S
75  60
 1,25
12
* GELĠġĠM ĠÇĠN =
* ÖĞRENME ĠÇĠN =
* ÖLÇME ĠÇĠN =
80  65
 1,5
10
BULUNAN Z
DEĞERLERĠNDEN EN
BÜYÜK DEĞER
ÖĞRENCĠNĠN EN BAġARILI
OLDUĞU DERSĠ
GÖSTERĠRKEN EN KÜÇÜK
DEĞER ÖĞRENCĠNĠN EN
BAġARISIZ OLDUĞU DERSĠ
GÖSTERĠR.
65  65
 0  EN DÜġÜK Z PUANI
5
* YÖNTEM ĠÇĠN =
90  80
 2,5
4
* PROG. GEL. ĠÇĠN =
60  50
 1,6
6
* REHBERLĠK ĠÇĠN =
85  60
 3,13  EN BÜYÜK Z PUANI
8
ÖRNEK: AĢağıdaki tabloda bir öğrencinin dört farklı baĢarı testinden aldığı puanlar ile testlerin
ortalaması ve standart sapması verilmiĢtir.
1. TEST
2. TEST
3. TEST
4. TEST
Öğrencinin puanı
=
60
63
67
90
Testin Ortalaması
=
50
60
55
50
Testin Standart Sapması
=
10
1
12
Bu öğrencinin baĢarı düzeyinin en yüksek olduğu test hangisidir?
99
40
2007 / KPSS
AĢağıdaki tabloda beĢ dersin sınavlarının puan dağılımlarına iliĢkin aritmetik ortalama ile
standart sapmalar ve Ali‟nin bu sınavlardan elde ettiği puanlar verilmiĢtir.
Matemati
Aritmetik
Ortalama
50
Standart
Sapma
5
Ali'nin
Puanı
65
Türkçe
50
8
65
Fizik
50
10
65
Kimya
50
15
65
Biyoloji
50
20
65
Ders
Ali‟nin sınıfına göre, en baĢarılı ve en baĢarısız olduğu dersler hangileridir?
A)
B)
C)
D)
E)
En baĢarılı
Matematik
Matematik
Fizik
Fizik
Kimya
En baĢarısız
Türkçe
Biyoloji
Kimya
Biyoloji
Biyoloji
B) T PUANI = T standart puanlarının aritmetik ortalaması ( X ) 50, standart sapması 10 kabul
edilir. T standart puanlarının formülü Ģöyledir.
T= 50+
(X  X )
.10
S
Eğer önceden Z puanları hesaplanmıĢ ise Z puanlarını T puanına dönüĢtürmek daha kolaydır. Bu
durumda Ģu formül kullanılır =
T = 50 + 10. Z
NOT: Z puanlarının NEGATĠF (-) çıkması, sıfır (0) değerini alması gibi olumsuzluklardan dolayı Z
puanı T puanına dönüĢtürülür. Sonuç olarak aynı olmasına karĢın T puanları pozitif değerler
aldığından anlaĢılması ve yorumlanması daha kolaydır.
NOT: Bir öğrencinin birden fazla ders içerisindeki veya birden fazla öğrenci içerisindeki baĢarı
derecesi sorulduğu zaman mutlaka Z ve T puanı hesaplamalarından birisi yapılmalıdır.
ÖRNEK:
MAT.
FĠZĠK
KĠMYA
ÖĞR. PUANI
60
70
80
X
50
60
40
S
10
20
10
A) Matematik dersinin Z ve T puanları kaçtır?
ZMAT =
60  50
 1.00 T= 50+10.Z= TMAT= 50+10.1 = 60
10
100
B) Fizik dersinin Z ve T puanları kaçtır?
ZFĠZĠK =
70  60 10
=0,50 T= 50+10.Z= TFĠZĠK= 50+10.0,50= 55

20
20
C) Kimya dersinin Z ve T puanları kaçtır?
ZKĠMYA =
80  60 40

 4 T= 50+10.Z = TFĠZĠK= 50+10.4= 90
10
10
D) EN BAġARILI OLUNAN DERS HANGĠSĠDĠR?
Z ve T puanının en yüksek olduğu ders olan KĠMYA dersi en baĢarılı olunan derstir.
2008 KPSS: Aynı öğrencilere uygulanan ve bağıl değerlendirme yapılan iki sınavla ilgili aritmetik
ortalama ve standart sapma değerleri aĢağıda verilmiĢtir.
SINAV
Aritmetik
Standart
Ali‘nin
AyĢe‘nin
ortalama
sapma
puanı
puanı
I
55
15
70
?
II
60
5
?
68
Buna göre, aĢağıdaki yorumlardan hangisi kesinlikle doğrudur?
A) Ali birinci sınavdaki soruların hepsini doğru yanıtlamıĢtır.
B) Ali ikinci sınavdan da 70 alırsa ilk sınava göre daha baĢarısız olmuĢ olur.
C) Birinci ve ikinci sınav sonuçları arasındaki korelasyon yüksektir.
D) AyĢe‘nin ikinci sınavdaki baĢarısı Ali‘nin ilk sınavındaki baĢarısından daha iyidir.
E) Ġkinci sınavda puanların ranjı ilk sınava göre daha büyüktür.
NORMAL DAĞILIM EĞRĠSĠ
Normal dağılım eğrisi, ölçme değerlendirme sürecinde kullanılan istatistiksel iĢlemlerin
daha net anlaĢılması için kullanılan ve ölçümlerin normal dağıldığı varsayımı doğrultusunda değiĢik
analizleryapılmasınısağlar.
%68
%95
%99
101
→ -1 ile +1 standart sapma bölgesinde yer alan notlar, sınava giren öğrencilerin % 68‘inin notlarını
gösterir.
→ -2 ile +2 standart sapma bölgesinde yer alan notlar, sınava giren öğrencilerin % 95‘inin notlarını
gösterir.
→ -3 ile +3 standart sapma bölgesinde yer alan notlar, sınava giren öğrencilerin % 99‘unun
notlarını gösterir.
SORU: Standart sapması 4 olan bir çoktan seçmeli testten 60 puan alan bir öğrencinin % 99
olasılıkla gerçek puanı hangi aralıkta yer alır?
-3
48
-2
52
-1
56
0
60
1
64
2
68
3
72
Öğrencinin gerçek puanı 48–72
aralığında yer alır.
SORU: Standart sapması 3 olan çoktan seçmeli bir testten 70 puan alan bir öğrencinin % 95
olasılıkla gerçek puanı hangi aralıkta yer alır?
-3
-2
64
-1
67
0
70
1
73
2
76
3
Öğrencinin gerçek puanı 64–76
aralığında yer alır.
SORU: Standart sapması 10 olan bir çoktan seçmeli testin güvenirlik katsayısı 0,75 tir. Bu
testten 60 puan alan bir öğrencinin gerçek puanı % 68 olasılıkla hangi güven aralığında yer alır?
NOT: Böyle bir durumda yani hem standart sapma hem de güvenirlik katsayısı veriliyor
ise bizim standart hatayı bulduktan sonra öğrencinin gerçek puanının hangi aralıklarda yer aldığını
belirlememiz gerekir.
Ölçmenin Standart Hatası Se ile gösterilir. Ve Ģu Ģekilde formüle edilir
Se = SS.
1  rx
Se = 10.
1 0,75
-3
-2
-1
55
Se = 10.0,5
Se = 5
0
60
1
65
2
Öğrencinin gerçek puanı 55–65 güven aralığındadır.
102
3
ÖRNEK SORULAR
2001 KPSS: Bir sınıftaki öğrencilerin beĢ farklı testteki yanıtları 100 üzerinden puanlanmıĢ ve
bu puanlardan aĢağıdaki tabloda gösterilen istatistikler hesaplanmıĢtır.
ARĠTMETĠK ORTALAMA
MOD
ORTANCA
STANDART S
1. TEST:
60
70
65
8
2. TEST:
30
40
35
6
3. TEST:
40
40
40
10
4. TEST:
40
20
25
10
5. TEST:
50
30
40
15
SORU 1 ) Bu bilgilere göre hangi testten elde edilen puanların dağılımı ―tek modlu ve
simetriktir‖?
A) 1
B) 2
C) 3
D) 4
E) 5
Çözüm: Simetrik dağılımlar normal dağılımlardır. Normal dağılımlarda aritmetik ortalama, mod
(tepe değer) ve medyan (ortanca) aynı değerdir. 3. testin MOD, MEDYAN ve ARĠTMETĠK
ORTALAMASI birbirine eĢit olduğu için SĠMETRĠK olan dağılım 3. TESTTĠR…
SORU 2) Sınıfın ortalama öğrenme düzeyi
EN YÜKSEK
EN DÜġÜK
Hangi test ile yoklanan öğrenmeler
A)
1. TEST
4. TEST
Ġçin ortalamadan en çok sapmayı
B)
1. TEST
2. TEST
Gösterir ve hangi test ile yoklanan
C)
2. TEST
5. TEST
Öğrenmeler için ortalamadan en az
D)
3. TEST
4. TEST
Sapmayı gösterir?
E)
5. TEST
2. TEST
Çözüm: Soruda sorulan ortalamadan sapma miktarını belirlemek için standart sapma değerine
bakılır. Ortalamadan sapmanın en yüksek olduğu test yani standart sapması en yüksek olan test 5.
TESTTĠR. Standart sapması en düĢük yani ortalamadan sapmanın en az olduğu test 2 . TESTTĠR.
CEVAP E ġıkkıdır.
SORU 3) Hangi testte: yoklanan öğrenmeler açısından, sınıftaki öğrenciler arasındaki farklılaĢma
en büyüktür?
A) 1
B) 2
C) 3
D) 4
E) 5
Çözüm: Öğrenciler arasındaki farklılaĢma hakkında bize standart sapma bilgi verir. Standart
sapma değeri küçükse grup homojendir yani öğrenciler arası farklılaĢma azdır. Standart sapma
değeri büyüdükçe gruptaki öğrenciler arası farklılaĢma artar. Yani grup HETEROJENDĠR…
103
2002 KPSS: Her biri 0 veya 1 Ģeklinde puanlanan 100 soruluk genel baĢarı sınavında eĢit sayıda
öğrencisi olan 5 sınıfın puan dağılımlarının genel Ģekilleri ile aritmetik ortalama ve standart sapma
değeri aĢağıdaki grafiklerde gösterilmiĢtir:
I
II
x  50
x =65
S= 10
S 7
III
IV
V
x = 50
S=10
x =60
S=5
x =70
S= 5
Buna göre testte grup olarak en baĢarılı olan sınıf hangisidir?
A) I
B) II
C) III
D) IV
E) V
Çözüm: Grubun testten baĢarılı olduğu grafikler sola çarpık grafiklerdir. Hatırlanacağı üzere sola
çarpık grafiklerde sorular kolay, grup baĢarılı idi. Buna göre II ve V grafikler sola çarpık
grafiklerdir. II. De ortalama 65, SS = 10‘dur. V. te ortalama 70, standart sapma 5‘tir. Buna göre
V.dağılımının ortalaması daha yüksek ve standart sapması da daha küçük olduğu için en baĢarılı
grup V. dağılımının olduğu gruptur.
2004 KPSS:
Bu grafiğe göre mod kaçtır?
A) 14
B) 25
C) 48
D) 28
E) 54
Çözüm: Bir puan dağılımında en çok tekrar eden (frekansı en çok olan) puan ya da ölçüme tepe
değer (mod) denir. Doğru cevap E seçeneği.
X
MEDYAN
MOD
SS
ÖĞR. NOTU
MATEMATĠK
70
60
65
10
60
FĠZĠK
65
70
75
4
72
TÜRKÇE
68
75
70
5
55
TARĠH
80
80
80
7
73
COĞRAFYA
60
65
70
3
69
104
SORU) Hangi derste dağılım normaldir? (KayıĢıklık O ya da simetriktir)
Çözüm: ARĠTMETĠK ORTALAMA = ORTANCA = MOD Ģeklinde olan dağılıma NORMAL
DAĞILIM denir. CEVAP TARĠH‘tir
SORU) Hangi derste grup homojendir ya da farklılaĢma en düĢük veya öğrencilerin öğrenme
düzeyleri birbirine en yakındır?
Çözüm:
HOMOJEN GRUP
FARKLILAġMA AZ
Standart Sapmanın küçük olduğunu gösterir.
Öyleyse COĞRAFYA dersinde farklılaĢma en
düĢüktür, grup homojendir ve öğrenme düzeyleri
birbirine yakındır.
ÖĞRENME DÜZEYLERĠNĠN
BĠRBĠRĠNE YAKINLIĞI
SORU) Hangi derste grup heterojendir ya da farklılaĢma en yüksek veya öğrencilerin öğrenme
düzeyleri birbirine uzaktır?
Çözüm:
HETEROJEN GRUP
Standart Sapmanın Büyük olduğunu
gösterir. Öyleyse MATEMATĠK
dersinde farklılaĢma yüksektir, grup
heterojendir ve öğrenme düzeyleri
birbirinden uzaktır.
FARKLILAġMA FAZLA
ÖĞRENME DÜZEYLERĠNĠN
BĠRBĠRĠNE UZAK OLMASI
SORU) Ortalama öğrenme düzeyi en yüksek ve en düĢük olan dersler hangileridir?
Çözüm: Ortalama öğrenme düzeyi için aritmetik ortalamaya bakılır. Aritmetik ortalamanın en
yüksek olduğu TARĠH dersinde ortalama öğrenme düzeyi en YÜKSEK; aritmetik ortalamanın en
düĢük olduğu COĞRAFYA dersinde ortalama öğrenme düzeyi en düĢüktür…
SORU ) Öğrencinin en baĢarılı ve en baĢarısız olduğu ders hangisidir?
Çözüm: Bu tür sorular iki yolla çözülür:
→ Öğrencinin Z puanı hesaplanır.
→ Öğrencinin notunun hangi standart sapma bölgesinde olduğuna bakılır.
1. YOL = ZMAT =
60  70
 1
10
Z PUANININ en yüksek olduğu
72  65
 1,75
ZFĠZ =
4
ZTÜRKÇE=
ZTARĠH=
ZCOĞ=
COĞRAFYA dersi öğrencinin en
baĢarılı olduğu derstir. Z PUANININ
55  68
 2,6
5
en düĢük olduğu TÜRKÇE dersi de
73  80
 1
7
öğrencinin en baĢarısız olduğu derstir.
69  60
3
3
105
BĠLĠMSEL ARAġTIRMANIN TEMEL KAVRAMLARI
EVREN: AraĢtırmanın yapılacağı, araĢtırma süresinde elde edilen verilerin analizi ve sonuçlarının
geçerli olacağı grubu ifade eder.
ÖRNEKLEM: Evrende seçilen, üzerinde çalıĢılacak grubu ifade eder.
DEĞĠġKEN: Gözlemden gözleme değiĢik değerler alabilen objelere değiĢken denir.
NĠCEL DEĞĠġKEN: Gözlenen değiĢkenlerden elde edilen veriler sayı ve miktar olarak
belirleniyor ve açıklanıyor ise bu tür değiĢkene NĠCEL DEĞĠġKEN adı verilir. Örn: YaĢ, Ağırlık,
Boy, Sıcaklık, Zaman
NĠTEL DEĞĠġKEN: Gözlenen değiĢken kalite, özellik ve tür olarak kategorilere ayrılıyorsa
bunlara nitel değiĢken adı verilir. Örn: BaĢarılı-baĢarısız, bayan-erkek gibi.
SÜREKLĠ DEĞĠġKEN: Ġki ölçüm arasında sayıda değer alabilen ve bu değerleri sayısal olarak
ifade edebilen değiĢkenlerdir. Örn: Boy, kilo vb…
SÜREKSĠZ DEĞĠġKEN: Cinsiyet, medeni durum, sürücü belgesine sahip olup olmama gibi iki
değer alabilen ve kesirli değerler kabul etmeyen değiĢkenlere denir.
BAĞIMSIZ DEĞĠġKEN:
değiĢkendir.
Bir araĢtırmada etkisi incelenen yani SEBEP durumunda olan
BAĞIMLI DEĞĠġKEN: Bir araĢtırmada olayın SONUCU durumunda olan yani bağımsız değiĢkene
bağlı olarak değiĢiklik gösteren değiĢkendir.
ÖRN:
Sigara içenler kansere yakalanırlar.
BAĞIMSIZ
DEĞĠġKEN
ÖRN:
BAĞIMLI
DEĞĠġKEN
Beslenme düzeyinin okul baĢarısına etkisi…
BAĞIMSIZ
DEĞĠġKEN
BAĞIMLI
DEĞĠġKEN
106
2006 KPSS: Bir öğretmen fen bilgisi öğretiminde performans değerlendirme yaklaĢımını
kullanmanın öğrencilerin bilimsel yöntem süreç becerilerine etkisini incelemektedir.
Bu araĢtırmadaki bağımlı değiĢken aĢağıdakilerden hangisidir?
A) Bilimsel yöntem süreç becerileri
B) Fen bilgisi dersi
C) Öğretmen
D) Öğrenciler
E) Performans değerlendirme
2008
KPSS:
Matematik dersinde bilgisayar programlarından yararlanmanın öğrencilerin
matematik baĢarısına etkisini ölçmeyi planlayan bir öğretmen, bir sınıfında geleneksel öğretim
yöntemini kullanırken diğer bir sınıfında ise iĢlenen her konudan sonra bilgisayar programıyla
alıĢtırmalar yaptırmaktadır.
Bu araĢtırmadaki bağımsız değiĢken aĢağıdakilerden hangisidir?
A) Öğretmen özellikleri
B) Matematik notları
D) Sınıf mevcutları
E) Öğrenci nitelikleri
C) Öğretim yöntemleri
KORELÂSYON: DeğiĢkenler arasındaki iliĢkiyi sayısal olarak gösteren istatistiksel bir tekniktir.
Korelâsyon katsayısı -1.00 ile +1.00 arasında değer alır. DeğiĢkenler birlikte azalıp birlikte
çoğalıyorsa iliĢki (+) yönde; biri artarken diğeri azalıyorsa veya biri azalırken diğeri artıyorsa
iliĢki (-) yönde çıkar. Korelasyon katsayısının +1‘e veya -1‘e yaklaĢması iliĢkinin mükemmelliğini
SIFIRA yaklaĢması ise zayıflığını ya da yokluğunu gösterir.
Pozitif (Doğrusal) ĠliĢki:
Örn:
Beslenme
Zekâ
→ Ağırlık
→ Derslerdeki BaĢarı
Negatif (Ters Yönde) ĠliĢki:
Örn: Derslere çalıĢtıkça baĢarısızlık oranının azalması.
Nötr Kolerasyon:
Örn: Yemek Yeme
Futbol Oynama
→ Hayvan Sevgisi
→ Kitap Okuma
107
2006 KPSS: Bir grup öğrencinin tarih, coğrafya, felsefe ve yabancı dil testlerinden aldıkları
puanlar arasındaki korelâsyonlar aĢağıdaki tabloda gösterilmiĢtir.
DERSLER
Tarih
Coğrafya
Felsefe
Yabancı
dil
Tarih
1,00
0,60
0,85
-0,35
Coğrafya
0,60
1,00
0,40
-0,25
Felsefe
0,85
0,40
1,00
0,30
Yabancı
-0,35
-0,25
0,30
1,00
dil
Bu tablodaki bilgilere dayanarak aĢağıdaki sonuçlardan hangisine varılabilir?
A) Yabancı dil testi en düĢük ortalamaya sahiptir.
B) Öğrenciler tarih ve coğrafya derslerinde çok baĢarısızdırlar.
C) Felsefe ve yabancı dil testleri çok farklı özellikleri ölçmektedir.
D) En yüksek iliĢki felsefe ile tarih puanları arasındadır.
E) En düĢük iliĢki tarih ile yabancı dil puanları arasındadır
2008 KPSS: Bir araĢtırmada X ve Y değiĢkenleri arasında sıfıra yakın bir iliĢki bulunmuĢtur.
Bu değiĢkenler aĢağıdakilerin hangisinde verilenler olabilir?
X
Y
A)
Doğum yeri
Doğum yılı
B)
Boy
Kütle
C)
YaĢ
Eğitim düzeyi
D)
Kaygı düzeyi
BaĢarı
E)
Spor yapma
Sağlık
108
ÖLÇME VE DEĞERLENDĠRME SORULARI
ORTANCA
X
STANDART
SAPMA
1
30
50
20
2
40
40
8
3
50
60
10
4
70
50
4
5
90
70
5
Uygulanan 5 sınava ait ortalama, ortanca ve standart sapmalar tablodadır.
SORU 1. Öğrencilerin öğrenme açısından birbirine en yakın olduğu grup hangisidir?
A) 1
B) 2
C) 3
ÇÖZÜM
Öğrencilerin öğrenme açısından birbirine yakın ya da uzak oluĢu STANDART
SAPMA ile belirlenir. Öyleyse standart sapmanın EN DÜġÜK olduğu 4. sınav da
öğrenciler öğrenme açısından birbirine en yakındır. (Cevap D)
SORU 2.
Hangi testin grafiği sağa çarpık bir grafiktir?
A) 1
B) 2
ÇÖZÜM.
Sağa çarpık dağılımlar çarpıklık değeri pozitif olan dağılımlardır.
C) 3
Çarpıklık =
D) 4
D) 4
E) 5
E) 5
3.( x  or tan ca )
formülünden dağılımların çarpıklık
S tan dartsapma
değeri hesaplandığında 4. testin çarpıklığı 15 bulunur ve en yüksek
bu olduğu için sağa çarpıktır
yorumu yapılır.
SORU 3.
A) 2,5
ÇÖZÜM.
Bir testin güvenirliği 0,75 ve test puanlarının standart kayması 5 ise yapılan
ölçmenin standart hatası kaçtır?
B) 3,5
C) 5
D) 6,2
Standart Hata = Standart Sapma .
Se = 5x.
1  rx
Se = 5.
1 0,75
Se = 5.
0,25
Se = 5.05
Se = 2,5 (CEVAP A)
109
E) 8
SORU 4.
Güvenirliği 0,75 standart sapması 10 olan bir testten 45 puan alan bir öğrencinin
% 99 olasılıkla puanının güven aralığı kaçtır?
A) 40-50
B) 30-60
ÇÖZÜM.
Se = Sx .
Se 10.
C) 35-55
D) 45-60
E) 35-60
1  rx formülünden önce ölçmenin standart hatası hesaplanır.
1 0,75
Se = 10.
0,25
Se = 10.0,5
Se = 5
Öğrencinin % 99 olasılıkla puanının güven aralığını normal dağılım eğrisinde Ģöyle
gösteririz.
-3
30
-2
35
-1
40
0
45
1
50
2
55
3
60
Öyleyse öğrencinin % 99 olasılıkla puanının güven aralığı 30-60‘tır.
CEVAP B
SORU 5.
Yapılan bir sınavda Aritmetik Ortalama = 60, Ortanca = 55, Standart sapma =5
bulunmuĢtur. Bu dağılım için aĢağıdakilerden hangisi söylenemez.
A) Grubun öğrenmeleri yetersizdir.
B) Zor bir testtir.
C) Sağa çarpık bir dağılımdır.
D) Normal bir dağılımdır.
E) Sola yığılı bir dağılımdır.
ÇÖZÜM .
Aritmetik Ortalama ( X ) = 60
Ortanca = 55
Yani
X > Ortanca
Standart Sapma = 5
Aritmetik ortalamanın ortancadan büyük olduğu dağılımlar SAĞA ÇARPIK dağılımlardır. Böyle
dağılımlarda puanların çoğu sola yığılmıĢtır. Bu dağılımın olduğu sınıflarda test öğrencilere ZOR
gelmiĢtir ve BAġARI DÜZEYĠ düĢüktür. Dolayısıyla grup öğrenmeleri de yetersiz gelmiĢtir
yorumları yapılır.(CEVAP D)
110
Tepe
Ortanca
Standart
AyĢe‘nin
X
Değer (Mod)
(Medyan)
Sapma
notu
TÜRKÇE
65
70
70
6
50
MATEMATĠK
36
55
40
5
46
FĠZĠK
40
40
40
8
45
KĠMYA
35
20
30
9
50
COĞRAFYA
80
40
45
12
90
SORU 6. Bu bilgilere göre AyĢe‘nin sırasıyla en baĢarılı ve en baĢarısız olduğu dersler
hangileridir?
A) Matematik ─ Türkçe
B) Matematik ─ Kimya
C) Coğrafya ─ Matematik
D) Coğrafya ─ Fizik
E) Coğrafya ─ Türkçe
ÇÖZÜM:
AyĢe‘nin en baĢarılı ve en baĢarısız olduğu dersleri bulabilmek için onun her bir
ders için Z puanını hesaplarız. Z puanının en büyük olduğu ders en baĢarılı olduğu derstir. En
küçük olduğu derste en baĢarısız olduğu derstir.
Z puanı =
Z=
Öğrencinin puanı-Aritmetik Ortalama
—————————————————
Standart Sapma
xx
SS
Z Türkçe =
Z Mat =
50  65
= -2,5
6
Öyleyse en baĢarılı olduğu der Z
puanının 2 olduğu MATEMATĠK
dersidir.
En baĢarısız olduğu derste Z puanın
-2,5 olduğu TÜRKÇE dersidir.
46  36
=2
5
Z Fiz =
45  40
= 0,625
8
Z Kim =
50  35
= 1,66
9
Z Coğ =
90  80
= 0,83
12
111
SORU 7.
En yüksek ve en düĢük ortalama öğrenme düzeyleri sırasıyla hangi derslerdir.
A) Coğrafya ─ Kimya
B) Matematik ─ Coğrafya
C) Türkçe ─ Kimya
D) Fizik ─ Kimya
E) Kimya ─ Matematik
ÇÖZÜM:
En yüksek ve en düĢük ortalama öğrenme düzeyleri hakkında bize ARĠTMETĠK
ORTALAMA bilgi verir. Aritmetik ortalamanın en yüksek olduğu derste ortalama
öğrenme düzeyi en yüksektir. Soruda da aritmetik ortalamanın en yüksek olduğu
ders COĞRAFYA dır.
Aritmetik ortalamanın en düĢük olduğu derste ise ortalama öğrenme düzeyi en
düĢüktür. Soruda aritmetik ortalamanın en düĢük olduğu ders KĠMYA dır.
SORU 8.
Öğrenciler arasında heterojen özelliğin (farklılaĢmanın) en fazla olduğu ders
hangisidir.
A) Matematik
B) Kimya
C) Coğrafya
D) Fizik
E) Türkçe
ÇÖZÜM
-
Heterojen / Homojen yapı
-
Öğrenciler arası FarklılaĢma
-
Öğrencilerin öğrenme düzeylerinin yakın ya da uzak oluĢu
Bir dağılımda STANDART SAPMA BÜYÜKSE
Bu konuda bize bilgi
verecek değer
STANDART SAPMA
dır.
─ Öğrenciler arası farklılaĢma FAZLA
─ Öğrencilerin öğrenme düzeyleri birbirinden UZAK ve
─ Heterojen yapı vardır yorumları yapılır.
Öyleyse standart sapmanın en büyük olduğu COĞRAFYA dersinde farklılaĢma en
fazladır deriz.
SORU 9.
Madde ayırt edicilik indeksi 0,84 olan bir maddenin güçlük indeksi 0,24‘dür bu
durumda aĢağıdaki açıklamaların hangisi doğrudur.
A) Madde kolay bir madde ancak testte kullanılabilir bir madde değildir.
B) Madde kolay ve testte kullanılabilir bir maddedir.
C) Madde testte kullanılabilir ve zor bir maddedir.
D) Madde testte kullanılabilir ve normal güçlükte bir maddedir.
E) Madde testte kullanılamaz ve çok kolay bir maddedir.
112
12
10
8
6
4
2
0
2
4
6
8
10
12
14
16
Puan
SORU 10.
Puan dağılımının ranjı kaçtır?
A) 18
B) 14
C) 10
D) 6
E) 2
ÇÖZÜM.
Ranj (Dizi GeniĢliği) Bir dağılımda en yüksek puan ile en düĢük puan arasındaki
farktır.
Bu dağılımda RANJ = 16 – 2 = 14‘tür
SORU 11.
Puan dağılımının modu kaçtır?
A) 12
B) 8
ÇÖZÜM .
Mod (tepe değer): Bir puan dağılımında en çok tekrarlanan puandır, ya da frekansı
en çok olan değerdir.
C) 10
D) 16
E) 14
Bu dağılımın modu 12‘dir. Çünkü frekansı en çok olan puandır.
SORU 12.
Puan dağılımı için aĢağıdakilerden hangisi söylenebilir.
A) Normal dağılıma sahiptir.
B) Sola çarpıktır.
C) Sağa çarpıktır.
D) Basık bir dağılıma sahiptir.
E) Sivri bir dağılıma sahiptir.
ÇÖZÜM.
Görüldüğü üzere puanların çoğu sağ tarafa yığıldığı için sola çarpık bir dağılımdır.
DÜNYADA EN KÖTÜ ĠFLAS; BĠR KĠġĠNĠN ARZU VE ĠSTEKLERĠNĠ
KAYBETMESĠDĠR.
BĠR ĠNSAN;
ARZU VE ĠSTEKLERĠ HARĠÇ NEYĠNĠ
KAYBETSĠN, MUTLAKA BAġARIYA ULAġACAKTIR.
KAYBEDERSE
ARZU VE ĠSTEKLERĠNĠZĠ KAYBETMEMENĠZ DĠLEĞĠYLE…
113

Benzer belgeler