ÿþM icrosoft W ord - evren _ kasap _ tez

Transkript

ÿþM icrosoft W ord - evren _ kasap _ tez
T.C.
MARMARA ÜNİ
VERSİ
TESİ
BANKACILIK VE Sİ
GORTACILIK ENSTİ
TÜSÜ
Sİ
GORTACILIK BÖLÜMÜ
Sİ
GORTACILIK SEKTÖRÜNDE MÜŞTERİ
İ
Lİ
ŞKİ
LERİYÖNETİ
MİYAKLAŞIMIYLA
VERİMADENCİ
Lİ
ĞİTEKNİ
KLERİ
VE
Bİ
R UYGULAMA
YÜKSEK Lİ
SANS TEZİ
Evren KASAP
Danı
ş
man
Prof.Dr. Münevver ÇETİ
N
İ
STANBUL 2007
1
ÖZET
Sİ
GORTACILIK SEKTÖRÜNDE MÜŞTERİİ
Lİ
ŞKİ
LERİ
YÖNETİ
MİYAKLAŞIMIYLA VERİMADENCİ
Lİ
Ğİ
TEKNİ
KLERİ
Sigortacı
lı
k sektöründe müş
teri iliş
kileri yönetimi (CRM) ve veri madenciliği çok
yeni bir
alan
karş
ı
n bankacı
lı
k sektöründe ve büyük
olması
na
uygulanmasıdaha önceki
belirlemekte kullanı
lan
bu
yı
llara
dayanmaktadı
r.Bir ürünün
iş
letmelerde
hedef
kitlesini
yöntemler iki ana bilim dalı
nı
n birleş
tirilmesinden
oluş
maktadı
r.
Müş
teri iliş
kileri yönetimi (CRM) iş
letmelerde müş
terilerin memnuniyeti
esas
alı
narak yapı
lan bir grup stratejiden oluş
maktadı
r.Bu stratejilerin esas amacı
maliyeti azaltarak daha fazla satı
şyapabilmektir.Bu düş
ünce üzerine kurulan müş
teri
iliş
kileri , teknik analiz desteğini ise
almı
ş
lardı
r.Verilerin
istatistik biliminden
içerisinde istenen amaca uygun verilerin tespiti ve verilerin analizini istatistiksel
analizler
yardı
mı
yla yapmaktadı
rlar.Bu teknik
kı
sma
veri madenciliğ
i adı
verilmiş
tir.
Özellikle bankacı
lı
k sektöründe
(CRM)
ve
veri
baş
arı
yla uygulanan müş
teri iliş
kileri yönetimi
madenciliği
baş
lanmı
ş
tı
r.Sektörün
sigortacı
lı
k sektöründe
ihtiyaçları doğrultusunda
müş
terilerin tercih ve daha önce
birçok
de
sigorta
uygulamaya
poliçesinin
,
satı
n aldı
klarıpoliçeler dikkate alı
narak müş
teri
memnuniyetini artı
racak,müş
teri bağlı
lı
ğı
nıgüçlendirecek uygun poliçeler önerilerek
baş
arısağlanmaya çalı
ş
ı
lmaktadı
r.Bu teknik analiz kı
sı
mları
nı
n elde edilebilmesi için
yüksek teknolojiye ihtiyaç duymaktadı
r.
Bu çalı
ş
ma üç bölümden oluş
maktadı
r.İ
lk bölümde müş
teri iliş
kileri yönetimi (CRM)
hakkı
nda
gerekli
bilgiler
verilerek
yapı
lan
teknik
analizlerin
amaçları
vurgulanacaktı
r.Ayrı
ca müş
teri mennuniyeti,müş
teri sadakati vb. tanı
mlarıdetaylı
bir ş
ekilde açı
klanacaktı
r.
2
ikinci bölümde ise
kullanı
lan analiz
istatistiksel
veri madenciliği hakkı
nda gerekli bilgileri verirken ,burada
yöntemleri hakkı
nda
kapsamlıbir bilgi verilecektir.Temelinde
analizlerden oluş
an veri madenciliği,verilerin
gruplanmasıya da
ayı
klanmasıiçin kullanı
lmaktadı
r.
Üçüncü ve son bölümde ise belirli bir veri setine , veri madenciliği teknikleri
uygulanacaktı
r.Uygulanan
veri
madenciliği teknikleri
sonucunda , veri seti
sı
nı
flandı
rı
lacak , kümelelere ayrı
lacak , belirli iliş
ki modelleri
kurulacaktı
r.Bu
bölümde ayrı
ca bir iş
letmenin müş
terileri hakkı
nda detaylı bilgiyi elde edilerek ,
satı
şkampanyalarıiçin hedef kitleler oluş
turulacaktı
r.
3
İ
Çİ
NDEKİ
LER
ÖZET………………………………………………………………………………………………………..
İ
Çİ
NDEKİ
LER……………………………………………………………………………………………..
ŞEKİ
L Lİ
STESİ…..………………………………………………………………………………………..
TABLO Lİ
STESİ
..………………………………………………………………………………………….
Gİ
Rİ
Ş.……………………………………………………………………………………………………….
i
iii
v
vii
viii
BÖLÜM 1 MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ(CRM )..…………………………………………….
1
1.1.Müş
teri İ
liş
kileri Yönetiminin Tanı
mı…………………………………………...…………………
1
1.2. Müş
teri İ
liş
kileri Yönetiminin Temel Kavramları
…………………………………………………... 4
1.2.1.Müş
teri İ
liş
kileri Yönetimi Süreci…………………………………………………………...
1.2.2.Müş
teri İ
liş
kileri Yönetiminin Bileş
enleri…………………………………………………...
1.2.3.Müş
teri İ
liş
kileri Yönetiminin Yapı
taş
ları
…………………………………………………..
1.2.4.Müş
teri İ
liş
kileri Yönetiminin Mimarisi ..…………………………………………………..
1.2.5.Müş
teri İ
liş
kileri Yönetiminin Teknolojileri ………………………………………………..
4
7
7
9
10
1.3.Müş
teri Yöntemi İ
le İ
lgili Diğer Kavramlar ………………………………………………………… 12
1.3.1.Müş
teri Tanı
mı………………………………………………………………………………..
1.3.2.Müş
teri Sadakati Kavramı
……………………………………………………………………..
1.3.3.Müş
teri Tatmini Kavramı
……………………………………………………………………...
1.4. Müş
teri İ
liş
kileri Yönetiminin Amaçlarıve Sağladı
ğıAvantajlar………...………………………
1.5. Müş
teri İ
liş
kileri Yönetimi Projelerinin Baş
arı
lıve Baş
arı
sı
z Olma Nedenleri…………………….
1.6. Müş
teri İ
liş
kileri Yönetimininde Kampanya Yönetimi…………………………………………….
1.6.1.Kampanyanı
n Planlanması
…………………………………………………………………….
1.6.2.Kampanyanı
n Hayata Geçirilmesi …………………………………………………………….
1.6.3.Kampanya Analizi ve Kontrolü ……………………………………………………………….
12
12
14
15
17
18
20
22
23
BÖLÜM 2 VERİMADENCİ
Lİ
Ğİ( DATA MINING )………………………………………………….
24
2.1.Veri Madenciliği Tanı
mı…………………………………………………………………………….
2.2.Veri Madencilğ
i Sürecinde Ortaya Çı
kabilecek Sorunlar …………………………………………..
2.3.Veri AmbarıKavramı………………………………………………………………………………..
2.4.Veri Madenciliği Teknikleri …………………………………………………………………………
2.4.1.Tanı
mlama ve ayrı
mlama ……………………………………………………………………..
2.4.2.Birlikteli Kuralları…………………………………………………………………………….
24
27
29
35
36
39
4
2.4.3.Sı
nı
flama ve Öngörü ………………………………………………………………………….
2.4.3.1.Karar Ağaçları…………………………………………………………………………….
2.4.3.2.Yapay Sinir Ağları………………………………………………………………………...
2.4.3.3. K-Ortalamalar Yöntemi …………………………………………………………………..
2.4.3.4.Genetik Algoritmalar………………………………………………………………………
2.4.3.5.Regresyon Analizi ………………………………………………………………………..
2.4.3.6.Zaman Serileri Analizi ……………………………………………………………………
2.4.4.Kümeleme Analizi ……………………………………………………………………………
2.4.4.1.Kümeleme Methodları
…………………………………………………………………….
2.4.5.Sı
radı
ş
ı
lı
k Analizi……………………………………………………………………………..
2.5.Veri Madenciliğinde Kullanı
lan Diğer Analiz Teknikleri …………………………………………
2.5.1.Faktör Analizi………………………………………………………………………………….
2.5.2.Kanonik Kolerasyon Analizi ………………………………………………………………….
2.5.3. Lojistik Regresyon Analizi…………………………………………………………………...
2.5.4.Çok Boyutlu Ölçekleme……………………………………………………………………….
41
41
43
46
46
47
53
66
70
72
73
73
82
85
98
BÖLÜM 3 Sİ
GORTACILIK SEKTÖRÜNDE MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ
YAKLAŞIMIYLA Bİ
R VERİMADENCİ
Lİ
ĞİUYGULAMASI …………………………………….. 101
3.1.Araş
tı
rmanı
n Amacı
...………………………………………………………………………………. 101
3.2.Araş
tı
rmanı
n Kapsamı……………………………………………………………………….……… 101
3.3.Araş
tı
rma İ
le İ
lgili Uygulama ...…………………………………………………………………….. 105
3.3.1. Birliktelik KurallarıAnalizi ………………………………………………………………… 105
3.3.2. Sı
nı
flandı
rma Analizleri …..………………………………………………………………… 109
3.3.3.Kümeleme Analizleri ………………………………………………………………………… 114
SONUÇ……….……………………………………………………………………………………………... 122
KAYNAKÇA ……………………………………………………………………………………………… 125
5
ŞEKİ
L Lİ
STESİ
Şekil 1.1. Müş
teri iliş
kileri yönetimi süreci…………………………………………………………..
5
Şekil 1.2. Müş
teri iliş
kileri yönetimi mimarisi………………………………………………………
9
Şekil 1.3. CRM kampanya yönetim süreci…………………………………………………………….
19
Şekil 2.1.Veri tabanları
nda bilgi keş
fi aş
amaları
……………………………………………………
25
Şekil 2.2 .Veri madenciliğinin tarihsel geliş
imi……………………………………………………..
29
Şekil 2.3.Veri ambarımimarisi………………………………………………………………………
32
Şekil 2.4. veri ambarıbileş
enleri…………………………………………………………………….
33
Şekil 2.5. Metadata ‘nı
n veri madenciliğindeki yeri ………………………………………………...
34
Şekil 2.6.Karar ağacış
ekli…………………………………………………………………………….
42
Şekil 2.7.Yapay ağsüreci……………………………………………………………………………
44
Şekil 2.8.Yapay sinir ağları
nı
n katmanları
……………………………………………………………
45
Şekil 2.9.Doğrusal regresyon grafiği…………………………………………………………………
48
Şekil 2.10.Eğrisel iliş
kiyi gösteren serpilme diyagramı…………………………………………….
51
Şekil 2.11.Doğrusal iliş
kiyi gösteren serpilme diyagramı
……………………………………………
51
Şekil 2.12.Zaman serisi trendleri……………………………………………………………………..
54
Şekil 2.13.Konjonktürel dalgalanma grafiği…………………………………………………………
55
Şekil 2.14.Mevsimsel dalgalanma…………………………………………………………………….
56
Şekil 2.15.Hareketli ortalama yöntemiyle oluş
turulan trend…………………………………………
58
Şekil 2.16.Sı
nı
flandı
rma ağacı
………………………………………………………………………..
66
Şekil 2.17.Benzerlik matrisi…………………………………………………………………………...
Şekil 2.18.Veri ölçeleri sı
nı
flandı
rması
………………………………………………………………
Şekil 2.19.Kümeleme metodlarıhiyerarş
isi ………………………………………………………….
Şekil 2.20.Konanik kolerasyon grafiği………………………………………………………………..
67
68
71
83
Şekil 2.21. S ve ters S fonksiyonu……………………………………………………………………..
87
Şekil 3.1. C 4.5 analizi uygulama süreci ……………………………………………………………..
112
Şekil 3.2. C 4.5 analizi sonucu elde edilen karar ağ
acıdiyagramı
………………………………...
112
6
Şekil 3.3. K-ortalamalar analizi uygulama süreci …………………………………………………..
114
Şekil 3.4. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü………………...
115
Şekil 3.5. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü………………...
116
Şekil 3.6. Elde edilen vektörlerle arası
ndaki iliş
kiyi gösteren grafik………………………………..
119
Şekil 3.7.
Z1
vektörü ile satı
n alma miktarıarası
ndaki iliş
kiyi gösteren grafik……………………...
120
Şekil 3.8.
Z2
vektörü ile satı
n alma miktarıarası
ndaki iliş
kiyi gösteren grafik……………………...
121
7
TABLO Lİ
STESİ
Tablo 2.1.Anova testi hesap tablosu………………………………………………………………….
48
Tablo 2.2. Hareketli ortalamaları
n hesaplanma yöntemi ……………………………………………
58
Tablo 2.3.Skorlama katsayı
sımatrisi hesaplanması
………………………………………………….
78
Tablo 2.4. Değ
iş
kenlerin faktöre katkıoranlarıhesaplanması
………………………………………..
78
Tablo 2.5.Değ
iş
ken etki puanları
nı
n hesaplanması
…………...……………………………………….
79
Tablo 3.1. Veri seti tablosu……………………………………………………………………………
101
Tablo 3.2.Cinsiyet değiş
keninin özet bilgileri………………………………………………………...
102
Tablo 3.3.Sigorta bedeli değiş
keninin özet bilgileri…………………………………………………...
102
Tablo 3.4.Primler değiş
keninin özet bilgileri………………………………………………………….
103
Tablo 3.5.Sigorta cinsi değiş
keninin özet bilgileri……………………………………………………
103
Tablo 3.6.Semt değ
iş
keninin özet bilgileri…………………………………………………………….
104
Tablo 3.7.Yangı
n sigortasıiçindeki kadı
n-erkek oranıtablosu……………………………………...
106
Tablo 3.8.Kaza sigortasıiçindeki kadı
n-erkek oranıtablosu………………………………………..
107
Tablo 3.9.Konut sigortasıiçindeki kadı
n-erkek oranıtablosu………………………………………
108
Tablo 3.10. C&RT analizi sonuç matrisi ve hata oranları
…………………………………………….
109
Tablo 3.11. C&RT analizinin yaprak analiz sonuçları
………………………………………………..
110
Tablo 3.12. C&RT analizi sonucunda elde edilen karar ağacıdiyagramı
………………………….
110
Tablo 3.13. K-ortalamalar analizi sonucu elde edilen kümeler……………………………………...
114
Tablo3.14. K-ortalamalar analizi sonucu elde edilen kümelerin veri listesi………………………...
117
Tablo 3.15. Kanonikel diskriminant analizi sonuçları……………………………………………...
117
Tablo 3.16. Kanonikel diskriminant analizi sonuçcu elde edilen vektörler………………………..
118
Tablo 3.17. Elde edilen vektörlerle değiş
kenler arası
ndaki iliş
ki…………………………………..
118
8
Gİ
Rİ
Ş
Veri
madenciliği ve
müş
teri
bağlı
dı
rlar.Veri olmaması
iliş
kileri
yönetimi
durumunda
bu
temel
olarak
tekniklerin
veri setine
geçerliliği
ve
uygulanabilirliği söz konusu değildir.Ancak günümüz ş
artları
nda çok yoğun bir
veri akı
ş
ısöz konusudur. Veri
çı
kmaktadı
r.Çünkü veri
madenciliği kavramı
da
madenciliği , çok
sayı
da
tam
veriden
olarak
buradan
amacı
na
uygun
verilerinin elde edilme sürecidir.Günümüz ş
artları
nda ş
irketlerin , doğru hedefe
yönelmesinin baş
arı
yıgetireceği bilinmektedir.
Bu çalı
ş
manı
n amacıson yı
llarda
yönetimi
ve
veri
yaygı
n olarak kullanı
lan müş
teri iliş
kileri
madenciliği teknikleri
hakkı
nda
bilgi
vermeyi
amaçlamaktadı
r.Bu amaçla ilk iki bölümde teorik bilgi verildikten sonra üçüncü
bölümde sigortacı
lı
k sektörü verileri kullanı
larak bir örnek uygulma yapı
lmı
ş
tı
r.
Teknolojik geliş
melerin özellikle iş hayatı
na yansı
ması sonucunda satı
şve
pazarlama bölümlerindeki geliş
melerin bir sonucu olarak ortaya çı
kan müş
teri
iliş
kileri ve veri madenciliği yöntemleri , çok sayı
da müş
teri verilerini analiz
ederek satı
ş
larıartması
na olanak sağlamı
ş
tı
r.
Yoğun rekabet ş
artları altı
nda daha baş
arı
lı olmanı
n müş
terilerini daha iyi
tanı
makdan geçtiğ
i bir dönemde müş
teri iliş
kileri yönetiminde veri madenciliğ
i
buna olanak sağlamaktadı
r.
Ayrı
ca veri madenciliği teknikleri sağlı
k , bankacı
lı
k , astroloji gibi bir çok
alanda da kullanı
lmaktadı
r.
Ülkemizde veri madenciliği ve müş
teri iliş
kileri yönetimi hakkı
nda yeterli kaynak
bulunmamaktadı
r. Bu nedenle yapı
lan çalı
ş
ma özellikle sigortacı
lı
k sektörüne
yapı
cağıkatkıaçı
sı
ndan önem arz etmektedir.
9
BÖLÜM 1 MÜŞTERİİ
Lİ
Ş
Kİ
LERİYÖNETİ
Mİ(CRM)
1.1.MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ(CRM)’İ
N TANIMI
Müş
teri iliş
kileri yönetimi (CRM)’in tek bir tanı
mıolmaktan ziyade birden fazla
tanı
mıvardı
r.Bunlar ş
öyle ifade edilebilir .
 Müş
teri iliş
kileri yönetimi (CRM)’in satı
ş
, pazarlama ve hizmet süreçlerinin
müş
teri odaklıbir felsefe etrafı
nda yeniden tanı
mlanması
nıgerektiren bir
süreçtir.1
 Müş
teri
iliş
kileri
yönetimi (CRM)’in , müş
teri memnuniyetini kar
maksimizasyonuna dönüş
türmek amacıtaş
ı
yan, istediği müş
teriye istediğ
i
deneyimi yaş
atabilecek kabiliyette bir kurum felsefesi ve bu hedefe ulaş
mak için ;
gerekli insan, süreç , teknoloji yapı
lanması
dı
r. 2
 Müş
teri iliş
kileri yönetimi (CRM), tüketiciyi ve onları
n ihtiyaçlarini doğru analiz
ederek, eğilimleri ve ilgileri konusunda doğru sonuçlarıçı
karabilmek ve tüm
bunları ortaya
koyduktan
sonra
onları
n
isteklerine
uygun
ürünlere
ulaş
tı
rabilmektir.
 Müş
teri iliş
kileri yönetimi (CRM), müş
terileri belli gruplara ayı
rarak , onları
n
davranı
şmodellerini oluş
turan ve
müş
terilerin ihtiyaçları
nı tesbit ederek bu
ihtiyaçları
n karş
ı
laması
nıamaçlayan bir süreçtir. 3
 Müş
teri iliş
kileri yönetimi (CRM), hem ön ofis (pazarlama, satı
şve müş
teri
servisi) hem arka ofis (muhasebe, üretim ve lojistik) uygulamasıolmakla
kalmayı
p aynızamanda hem de diğer tüm bölümler, müş
teriler ve işortaklarıile
koordinasyonu ve iş
birliğini sağlayan müş
teri merkezli bir iliş
ki yönetimi
felsefesidir.4
1
Y.ODABAŞ, Satı
ş
ta ve Pazarlamada Müş
teri İ
liş
ki Yönetimi , Sistem Yayı
nları2005 s3.
2
http://www.biymed.com/pages/makaleler/makale49.htm 2004.
http://www.apluspost.com/bilgi_teknoloji.php 2005.
3
10
 Müş
teri iliş
kileri yönetimi (CRM) , yeni müş
teri edinmek, var olan müş
teriyi
elde tutmak, müş
teri sadakatini kazanmak ve karlı
lı
ğı
nıartı
rmak için anlamlı
iletiş
imler yoluyla iş
letme çapı
nda müş
teri davranı
ş
ları
nıanlama ve etkileme
yaklaş
ı
mı
dı
r. 5
 Müş
teri
iliş
kileri
yönetimi (CRM) , genel anlamda insanları
n satı
nalma
alı
ş
kanlı
klarıhakkı
nda geçmiş
ten elde edilen verilere dayanak ilerideki davranı
ş
ve ihtiyaçları
nı yüksek teknolojida kullanarak tahmin etme ve bu ihtiyaçları
karş
ı
lama sürecidir.
 Müş
teri iliş
kileri yönetimi (CRM) , ş
irketlerin rekabet avantajı
nıartı
ran, müş
teri
odaklıbir işgeliş
tirme stratejisi olarak algı
lanmaktadı
r.6
 Müş
teri iliş
kileri yönetimi (CRM) , en değerli “işiliş
kilerini” seçmeye ve
yönetmeye yönelik işstratejisidir.
 Müş
teri
iliş
kileri
yaratmak
için
yönetimi (CRM), karş
ı
lı
klı
, uzun vadeli bir değer iliş
kisi
müş
teriler
ile
gerçekleş
tirilen
iliş
kilerin
etkin
biçimde
yönetilmesidir. Müş
teri iliş
kileri yönetimi (CRM) ; satı
ş
, pazarlama ve hizmet
süreçlerinin müş
teri odaklı bir felsefe etrafı
nda yeniden tanı
mlanması
nı
gerektirir.7
Müş
teri iliş
kileri yönetimi (CRM)’nin tanı
mı
nı
n ihtiyaç duyulan durumlara ve
uygulamalara göre değiş
tiği yukarı
daki tanı
mlamalardan da anlaş
ı
lmaktadı
r.
Müş
teri iliş
kileri yönetimi (CRM)’in tarihi geliş
imine bakı
ldı
ğ
ı
nda , ş
irketlerin
müş
terilerine ürettikleri hizmet ya da ürünlerin nası
l bir bakı
ş
la üretildiği net bir
ş
ekilde ortaya koymaktadı
r.1970’lerde üretelim satarı
z anlayı
ş
ı
nı
n yaygı
n olduğu
ve müş
terilerden ziyade karlımal üretiminin ön planda olduğu bir dönem
yaş
anmı
ş
tı
r.Karlımal üretimi , 1970’lerde esas olarak seri ve hı
zlı üretimle
bağdaş
tı
rı
lmaktaydı
.
4
http://www.kobifinans.com.tr/bilgi_merkezi/020305/14318 2007.
Ronald S. Swift ,Accelerating Customer Relationships ,Prentice Hall , 2001 s12.
6
www.tepum.com.tr/Etkinlikler/crm_nedir.pps 2003.
5
11
1980’lere gelindiğ
inde , ürettiğimizi satarı
z anlayı
ş
ı
ndan ürünün nası
l üretileceği ,
müş
teriye uygun olup olmadı
ğıtartı
ş
maları
nı
n ardı
ndan yaş
anan uzun bir süreçten
sonra gerek rekabet , gerekse çeş
it sayı
sı
nı
n çok olması
ndan dolayı müş
teri
odaklı
bir
bakı
ş açı
sı ş
irketlere yerleş
meye baş
lamı
ş
tı
r.Müş
teri
iliş
kileri
yönetimi’nin ortaya çı
kı
ş
ı
yla beraber , bazıyeni kavramlar ortaya çı
kmı
ş
tı
r.Bu
kavramlar
temel olarak
sadı
k müş
teri, müş
teri tatmini , cüzdan payı,müş
teri
karlı
lı
ğıgibi
kavramlardı
r. Bu
kavramlara bakı
ldı
ğı
nda
stratejilerinin
üretip satarı
z , anlayı
ş
ı
ndan
pazarlama satı
ş
müş
teri odaklı bir hale geldiğ
i
görülebilmektedir.
Müş
teri iliş
kileri yönetimi (CRM) , kabul edilen temel alt kavramları
n bir disiplin
çerçevesinde ele alı
nmasıdünyada son 10 yı
lda , ülkemizde ise son 5 yı
lda
gerçekleş
miş
tir. 8
80’li yı
llarda insanları
n yaş
am alı
ş
kanlı
kları
nda baş
layan , değ
iş
im rüzgarıbilgi ve
teknoloji sistemlerinin de hı
zla geliş
mesiyle, 90’lıyı
llarda firmalarıürün ve hizmet
konusunda , seçici, marka sadakati düş
ük, talepkar müş
teriler ile karş
ıkarş
ı
ya
bı
rakmı
ş
tı
r.
Şirketler, yoğ
un rekabet koş
ulları
nda, hem müş
terisini elinde tutmak, onu memnun
etmek, yeni müş
teriler kazanmak için çabalarken, hem de kar ve zarar hesabı
nıdoğru
yapabilmek için yeniden yapı
lanmaktaydı
lar.Geliş
en bilgi teknolojileri sayesinde,
insan gücüne destek olacak yeni uygulamalar yaygı
nlaş
tı
. Önceleri sadece veri
bankasıolarak kullanı
lan sistemlerin fonksiyonları
nı
, iş
lem güçlerini arttı
rması
yla
ş
irketler tüm süreçlerde daha kontrollu, daha verimli çalı
ş
abilme yeteneğine kavuş
tu. 9
Müş
teri
iliş
kileri
yönetimi
(CRM)
felsefesinin
dünyada
tanı
nması
nı
n,
benimsenmesinin ve hayata geçirilmesinin 1989 yı
lı
ndan bu zamana kadar uzun bir
7
O.C.Gel , CRM Yolculuğ
u ,Sistem Yayı
ncı
lı
k 2004 s28.
http://blog.inspark.com/blog/2006/10/mteri_liklileri.html 2006.
9
A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management , Butterworth 8
Heinemann Publishers 2005 s 10.
12
süreç alması
, bu kavramı
n sadece bir veri tabanısistemi olmadı
ğı
nı
n en güzel
göstergesidir.
Tüm süreçleri ve tüm fonksiyonlarıkapsayan bu felsefenin yönetilmesi için; tüm
müş
teri iliş
kilerini her yönüyle görebilecek, ihtiyaçlarıve davranı
ş
larıölçebilecek,
çift yönlü iletiş
im sağ
layabilecek akı
llıbütünleş
ik sistemlere ihtiyaç vardı
r. Bilgi
teknolojilerinin ihtiyaçlara paralel geliş
mesiyle birlikte, analiz yapabilen, ihtiyaca
uygun özelleş
tirilebilen, esnek, türlü iletiş
im araçları
yla entegre olabilen uygulamalar
da hayata geçirilmeye baş
lamı
ş
tı
r.Böylece bir felsefe ve bu felsefeyi desteklemek
üzere hizmet eden teknoloji bütünü olarak Müş
teri iliş
kileri yönetimi ( CRM ) ‘ni
oluş
turmuş
tur.10
Müş
teri iliş
kileri
yönetimi (CRM), henüz geliş
imini tam olarak tamamlamamı
ş
olmakla birlikte, uygulama alanları
nı
n yaygı
nlaş
masıve teknoloji ile bütünleş
mişbir
felsefe olduğ
unun bilincine varı
lması
yla Müş
teri iliş
kileri yönetimi (CRM), yeni
yüzyı
lda firmaları
n hayatları
nısürdürebilmeleri için benimsenmesi ve uygulanması
gereken bir anlayı
şolarak ortaya çı
kmı
ş
tı
r.11
1.2. MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ(CRM)’İ
N TEMEL KAVRAMLARI
Müş
teri iliş
kileri yönetiminin temel kavramlarış
öyle sı
ralanabilir ;
 Müş
teri İ
liş
kileri Yönetimi (CRM) ‘in Süreçleri ,
 Müş
teri İ
liş
kileri Yönetimi (CRM) ‘in Bileş
enleri ,
 Müş
teri İ
liş
kileri Yönetimi (CRM) ‘in Yapıtaş
ları,
 Müş
teri İ
liş
kileri Yönetimi (CRM) ‘in Mimarisi ,
 Müş
teri İ
liş
kileri Yönetimi (CRM) ‘in Teknolojileridir.
1.2.1.Müş
teri İ
liş
kileri Yönetimi (CRM) ‘nin Süreci
Müş
teri iliş
kileri yönetiminde süreç , ilk olarak müş
teriler hakkı
nda olabildiğince
bilgi toplamaya dayanı
r. Bu anlamda daha önce belirtildiği gibi bu sistem (CRM),
10
11
O.C.Gel , CRM Yolculuğu ,Sistem Yayı
ncı
lı
k 2004 s9.
http://blog.inspark.com/blog/2006/10/mteri_liklileri.html 2006.
13
yaratı
lan
edilen
felsefenin arkası
nda yüksek bir teknolojiye ihtiyaç duymaktadı
r.Elde
verilerin ı
ş
ı
ğı altı
nda müş
terilerin
özelliklerinin çı
karı
lması ve
son
gruplandı
rı
lması, karakteristlik
olarak doğru ürünün
doğru
müş
teriye
yönlendirilmesine olanak sağlar.12Bu süreç aş
ağ
ı
daki ş
ekilde açı
klanmı
ş
tı
r.
Müş
teri Seçimi
CRM sürecinde bu aş
aması
nda özellikle
müş
terilerin
sı
nı
flandı
rı
lması
hedef
, kampanya
kitlelerin
belirlenmesi ,
yapı
ldı
ğ
ı
planları
nı
n
aş
amadı
r.Özellikle CRM kampanyası
nı
n , temel planı
nı
n oluş
turulduğ
u
aş
ama
olmasıaçı
sı
ndan
çok önemlidir.Müş
terileri sı
nı
flandı
rma süreçlerinde
amaç en karlımüş
teri grubunun tespiti ve bu gruba yönelik
kampanyaları
n
planlandı
ğıaş
amadı
r.Bu aş
amada yapı
lan iş
lemler aş
ağı
da özetlenmiş
tir.
 Sı
nı
flandı
rma ,
 Kampanya modelleme ,
 Marka yönetimidir.
Şekil 1.1. Müş
teri iliş
kileri yönetimi süreci
Kaynak :http://www.manas.kg/pdf/sbdpdf9/Hamsioglu.pdf 2004.
12
ilk
A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı
ncı
lı
k ,s49 2007.
14
Müş
teriyi elde tutma
Müş
terileri elde
sonra
net
tutma aş
aması
nda
bir
ş
ekilde
özellikle müş
terileri
bu
grupları
n
gruplara ayı
rdı
ktan
ihtiyaçları
nı
n
gerekmektedir.Doğ
ru bir ihtiyaç analizinin yapı
lmasıhem
belirtilmesi
müş
teri sadakatini
hem de firmanı
n karı
na doğrudan bir etkide bulunacağıgörülmektedir.
Müş
teri elde tutmanı
n bir diğer boyutu ise müş
teri memnuniyetini en üst
noktada tutabilmektir.Özellikle ürün ve servis memnuniyeti müş
terilerde güven
yaratmakta ve firmada daha uzun bir süre müş
teri olarak kalmaktadı
r.
Müş
teri kazanma
Yeni müş
teri kazanma aş
aması
nda özellikle talep analizi ve ş
ikayet yönetimi
alanları
nda baş
arı
lı
yla uygulanmasıgerekmektedir.Her memnun müş
teri ş
irketin
sözcüsü
gibi
davranarak , yeni
müş
teri
kazanı
mı
nda
firmaya
yardı
mcı
olmaktadı
r.13
Müş
terinin ürünle ilgili yaş
adı
ğıbir sorunu , en kı
sa bir ş
ekilde sistemli olarak
çözmek müş
terilerin kazanı
lması
nda en önemli etkenlerden birisidir.
Müş
teriyi büyütme ve derinleş
tirme
Bu süreçte var olan müş
terilere , ürün
satı
ş
ı
nı arttı
rmak için çapraz satı
ş
kampanyalarıkullanı
lı
r.Bu kampanyalar , müş
terilerin
veri tabanı
ndaki bilgileri
kullanı
larak müş
teri ihtiyaçları
nıtespit edip , ona uygun ürünü müş
teriye sunma
sürecidir.
Bu çapraz satı
şkampanyaları
na en iyi örnek “amazon.com” dur.Bu firma ,
kitap ya da ürünü alan müş
terisine ürünün en yakı
n alternatiflerini
sunarak
müş
terilerine , çapraz satı
şyapmaktadı
r.
13
Y.ODABAŞ, Satı
ş
ta ve Pazarlamada Müş
teri İ
liş
ki Yönetimi , Sistem Yayı
nları2005 s113.
15
1.2.2.Müş
teri İ
liş
kileri Yönetimi (CRM) ‘in Bileş
enleri
Müş
teri iliş
kileri yönetimi (CRM) , üç temel bileş
enden oluş
maktadı
r.Bunlar ,
insan, proses ve teknoloji yapı
sı
dı
r. İ
nsan (çalı
ş
anlar), müş
terinin beklentilerini
anlayı
p, standart prosedürlerin ötesinde çözümler üretmektedirler.Proses, çalı
ş
anları
n
ilettiğ
i müş
teri taleplerini hı
zlısüreç revizyonlarıile müş
teri odaklıyapı
lanmaya
dönüş
türmektedirler. Teknoloji ise müş
teri bilgilerinin tüm temas noktaları
ndan takip
edilmesine ve farklımüş
teri isteklerine hı
zlıçözüm üretilmesine imkan tanı
yacak
ş
irket içi otomasyonu sağlamaktadı
rlar.Böylece bu koordinasyon Müş
teri iliş
kileri
yönetimi (CRM) ‘i oluş
turmaktadı
r. 14
1.2.3.Müş
teri İ
liş
kileri Yönetimi (CRM) ‘in Yapı
taş
ları
Müş
teri iliş
kileri yönetimi (CRM) sekiz temel yapı
taş
ı
ndan oluş
maktadı
r.Bu sekiz
yapı
taş
ış
unlardı
r.
CRM Vizyonu
CRM'in kurumsal anlamda benimsenmesi için yapı
lanlar, kurumsal CRM tarifi, pazar
pozisyonu, müş
terilere önerilmesi planlanan nihai değerler , iş hedeflerinden
oluş
maktadı
r.
Müş
teri Stratejisi
Müş
teri
hedefleri,
pazar
değerinin
yönetimi,
CRM'in
kurumsal
anlamda
benimsenmesi için yapı
lanlar, segmentasyon anlayı
ş
ları
, segment hedeflerinin
yönetimi, kurumsal değiş
im planları
, müş
teri tabanlıpazarlama planı
, CRM esas
planları
ndan oluş
maktadı
r.
14
http://www.biymed.com/pages/makaleler/makale49.htm 2004.
16
Müş
teri Bakı
ş
ı
Müş
teri ile iletiş
im, ş
ikayet yönetim sistemi, eskalasyon sistemi, müş
teri temas
noktaları
ndan oluş
maktadı
r.
Müş
teri Merkezliliği
Değ
iş
im dinamikleri, müş
teri merkezli süreç yapı
lanması
, bireysel yetkinlik ve
uzmanlı
kları
n geliş
tirilmesi, kariyer planları
na müş
teri baş
arı
ları
nı
n yansı
ması
ndan
oluş
ur.Bu kavram , çoğ
u zaman müş
teri odaklı
lı
kla
karı
ş
tı
rı
lmaktadı
r.Müş
teri
odaklı
lı
k toplam kalite yönetiminde kullanı
lan bir kavramdı
r.Müş
teri odaklı
lı
k ,
üretilen malıkitlelere satı
ş
ı ön görürken , müş
teri merkezli bir
yaklaş
ı
m her
müş
teriye ihtiyaçlarıdoğrultusunda bir ürün ya da bir hizmet verilmektedir. 15
CRM Otomasyonu
Müş
teri yönetimine dönük uygulamalar, yazı
lı
m, network ve telefon entegrasyonları
,
sistem altyapı
sıve sistem yönetimlerinden oluş
maktadı
r.
Müş
teri Bilgi Sistemi
Tekil müş
teri tanı
mları
, veri entegrasyonu, veri toplama yöntemleri, veri sözlüğü,
müş
teri verilerinin yönetiminden oluş
maktadı
r.
CRM Taktik Modelleri
Müş
teri performans yönetimi, müş
teri mülkiyeti çalı
ş
maları
, sadakat programları
,
iliş
ki modelleri, mikro pazarlama çalı
ş
maları
, hedef odaklıkampanyaları
ndan
oluş
maktadı
r.
15
A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı
ncı
lı
k , s51 , 2007.
17
CRM Ölçümleri
Yönetim performans göstergeleri, müş
teri stratejisi göstergeleri, operasyonel
göstergeler, verimlilik göstergelerinden oluş
maktadı
r.
1.2.4.Müş
teri İ
liş
kileri Yönetimi (CRM) ‘nin Mimarisi
CRM çözümleri olarak nitelendirilen uygulamalar ile geçmiş
teki uygulamalar
arası
nda birçok yapı
sal benzerlik ve farklı
lı
klar vardı
r.Farklı
lı
klar, Müş
teri iliş
kileri
yönetimi (CRM) ’in geçirdiği evreleri de ortaya koymasıaçı
sı
ndan önemlidir.Bu
anlamda Müş
teri iliş
kileri yönetimi (CRM) üç temel aş
amadan oluş
maktadı
r.Bunlar
Operasyonel CRM , Analitik CRM , İ
ş
birliğine yönelik CRM dir.CRM ‘in mimarisi
aş
ağı
da belirtilmiş
tir.
Operasyonel CRM
Arka
Ofis
ERP
RP /ERM
TTe daarikk Zinncciiri
Yntm
m.
Sippar
arişYnt m.
Sip
ipar
arişP
şPrrom
om..
Analitik CRM
Mir
irass
S isttem
mller
Kappaalı
Dööng
ngü
İ
ş
le
lemee
Verri
Deeposu
Mü
Müş
te
terri
Et
Etki
kinlikk
Verri
Ön Ofis
S
Serrvvis
Oto
tomasy
syonu
P
Pazzaarlam
ma
Ot omasy
syonu
Saatı
ı
ş
Ot omaassyyoonu
Mü
Müş
te
terrii
Ver
eri
am
ambarrı
ı
Moobbil
il Sat
atı
ı
ş
P
Pazzaarlam
ma
Oto
tomasy
syon
u
Sa
Sahhaa Ser
ervis
isi
Kat ego
gori
Ynt
nt m.
Müş
teri
Etkileş
imi
aambaarı
ı
am
mbarrı
Diike y
uyyggulama
malar
Seyyar
Ofis
Ü
Ürrüünn
V
Ver
erii
K
Koonf
nf erran
ans
E- post a
AğK
Kon
onf .
Yan
anı
t Ynntm
tm.
Sess
Weeb
Kaamp
mpaany
nya
Ynntm
tm.
Do
Doğrudann
Et kile
leş
im
im
İ
şbirliksel CRM
Şekil 1.2. Müş
teri iliş
kileri yönetimi mimarisi
Kaynak : http://www.erpcrm.com/crm_anasf/crm_mimarisi.htm 2003.
18
Operasyonel CRM
Müş
teri iliş
kileri yönetimi (CRM)’in bu biçimi aslı
nda tipik işfonksiyonları
nı
n
kapsandı
ğıCRM çözümlerinden oluş
ur. Bu fonksiyonlara örnek olarak müş
teri
hizmetleri, siparişyönetimi, faturalama, satı
şve pazarlama otomasyonu gibi süreçleri
verebilir. Bu çözümler daha çok kurumsal sistem içerisindeki finans, insan kaynakları
gibi farklıişfonksiyonları
nı
n entegre bir yapı
ya kavuş
turulmasıiçin kullanı
lmaktadı
r.
Analitik CRM
Analitik CRM , kullanı
cı
lara ait verilerin elde edilmesi, depolanması
, iş
lenmesi,
analiz ve tahminlere dönüş
türülerek raporlanmasıiş
lemlerini gerçekleş
tirmektedir.
Böylelikle CRM’in operasyonel ve entegrasyon özellikleri üzerine analiz ve
raporlama özellikleri eklenmektedir.
İ
ş
birliğine yönelik CRM
İ
ş
birliğine yönelik CRM , aslı
nda diğerlerinin en uygun birleş
iminden oluş
maktadı
r.
Müş
teriler ile ş
irketler arası
nda tam anlamı
yla bir etkileş
im ve koordinasyon ağı
nı
n
oluş
ması
na imkân veren , farklıiletiş
im kanalları
ndan (web, telefon, e-posta vb) gelen
bilgilerin , değere dönüş
türülmesini sağlayan bir süreçtir. İ
ş
birliğine yönelik CRM
çözümleri müş
teri ile etkileş
ime imkân veren tüm fonksiyonlarıiçermektedir. 16
1.2.5.Müş
teri İ
liş
kileri Yönetimi (CRM) ‘nin Teknolojileri
Müş
teri iliş
kileri yönetiminde teknoloji olmazsa olmazı
dı
r.Müş
teri verilerini analiz
edecek gerek ve yeter bir teknoloji , tüm firmalar için
ş
arttı
r. Müş
teri iliş
kileri
yönetimi (CRM) için kullanı
lan teknoloji , Müş
teri iliş
kileri yönetimi (CRM) ‘in
aş
amaları
na göre sı
nı
flandı
rı
lmı
ş
tı
r.Bunlar operasyonel (sales management..), analitik
(data warehousing..) ve iş
birlikçi (call center...)
gibi ürünler
kullanı
lmaktadı
r.
Kullanı
lan ürünler detaylıolarak aş
ağı
da belirtilmiş
tir.
17
16
17
http://www.microsoft.com/turkiye/dynamics/crm/crm_nedir.mspx 2007.
A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management , Butterworth-
Heinemann Publishers 2005 s226- 236.
19
 İ
şzekası( Business Intelligence) ,
 Bilgi yönetimi ( Knowledge Management ) ,
 İ
letş
im yönetimi (Contact Management) ,
 Müş
teri etkileş
im merkezi (Customer Interaction Center ) ,
 Çağrımerkezi ( Call Center ) ,
 Bilgi sistemleri ( Information Systems ) ,
 Veritabanıraporlama sistemi ( Database Management Report Writing ) ,
 Dijital belge yönetimi ( Digital Document Management ) ,
 Elertronik ticaret ( Electronic Commerce ) ,
 E-Pazarlama ( Emarketing ) ,
 E-servis ( eService ) ,
 İ
nternet tabanlıçözümler ( Web-Based Solutions ),
 İ
nternet analizi ( Web Analysis ) ,
 Pazarlama otomasyonu ( Marketing Automation ),
 Tahmin etme ( Forecasting ) ,
 Satı
şotomasyonu ( Sales Automation ) ,
 Kablosuz veya hareketli veri iş
leme ( Mobile Computing/ Wireless ) ,
 Bağlantıyönetimi servisleri ( Contact Management Services ) ,
 Siparişyönetimi ( Order Management/ Distribution ) ,
 Saha gücü otomasyonu ( Field Force Automation ) ,
 Saha servisi ( Field Service ) ,
 Ortaklı
k iliş
kisi yönetimi ( Partner Relationship Management ) ,
 Kiş
iselleş
tirme ( Personalisation ),
 Telefonda pazarlama ve satı
ş( Telemarketing/ Telesales ).
Bu teknolojilere
rağ
men
bir
kurum , müş
teri iliş
kileri
yönetimi (CRM) ‘i
uygulayabilmek için ş
u temel teknolojilere sahip olmak zorundadı
r. 18
 Veri tabanıteknolojisi ,
 Call center teknolojisi ,
18
A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı
ncı
lı
k ,s95- 96 2007.
20
 Ismarlama seri üretim teknolojisidir.
Analitik
1.3.MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİİ
LE İ
LGİ
LİDİ
ĞER KAVRAMLAR
1.3.1.Müş
teri Tanı
mı
Müş
teri , belirli bir mağaza ya da kuruluş
tan düzenli alı
ş
verişyapan kiş
i ya da
bakı
ldı
ğı
nda ,
kurumdur.Müş
teri iliş
kileri yönetimine
müş
teri üç
gruba
ayrı
lmaktadı
r.Bunlar sı
rası
yla , Mevcut müş
teri, Yeni müş
teri ve de Şirketi terk
etmişmüş
teridir.Bu müş
teri çeş
itleri Müş
teri iliş
kileri yönetiminin bir anlamda
amaçları
nı
da ortaya koymaktadı
r. Müş
teri iliş
kileri yönetimi (CRM) , yeni müş
teri
kazanmaktansa , var olan müş
terilere yapı
lan satı
ş
ı arttı
rarak , satı
ş karlı
lı
ğı
nı
Analitik
19
artı
rmayıamaçlamaktadı
r.
1.3.2.Müş
teri Sadakati Kavramı
bir ş
irkete
Müş
teri sadakati kavramı
nı, müş
terilerin
tanı
mlayabiliriz.Müş
terilerin
neden
ş
irket
olan bağlı
lıolarak
değiş
tirdiğiyle
ilgili
yapı
lan
araş
tı
rmalarda , müş
terilerin % 68 ‘inin kayı
tsı
z bir tavı
r hissettikleri için ş
irket
değiş
tirdiğini ortaya koymaktadı
r.Bu araş
tı
rmanı
n sonuçları
nda sadece müş
terilerin
% 14 ‘nün üründen memnun kalmadı
ğıiçin ş
irket değiş
tirdiğini ,% 9 ‘unun rakip
ş
irketleri tercih ettiği , % 9‘unun ise diğer sebeplerden ş
irket değiş
tirdiğini ortaya
koymuş
tur. 20
Bu
kavram
doğrudan sadı
k müş
teri
ile
tanı
mlanabilir. Düzenli olarak bir iş
letmeden
birden fazla ürün ya da hizmet
iliş
kilidir.Sadı
k
müş
teri , ş
öyle
alı
ş
veriş yapan , aynış
irketten
alan , alı
ş
verişyaptı
ğıyeri baş
kaları
na tavsiye
eden ve rakip firmalara kaçmayan müş
teri olarak tanı
mlanabilir.21
Y.ZENGİ
N, Değer Yaratan Müş
teri İ
liş
kileri Yönetimi ,Yüksek Lisans Tezi, Marmara Ünv. , s 24
2006
20
65.110.73.19/UploadsNew/Gallery/Seminars/ICT3/III_CRM_Awareness-Handouts.pdf 2006.
21
Y.ODABAŞ, Satı
ş
ta ve Pazarlamada Müş
teri İ
liş
ki Yönetimi , Sistem Yayı
nları20005 s11-12.
19
21
Günümüzde yoğun rekabet
ortamı
ndan dolayı, iş
letmler müş
teri kavaramları
nı
yeniden tanı
mlayarak , bir üründen alı
nan kardan ziyade , müş
terileri sadı
k hala
getirerek
müş
terilerden bir ömür boyu kar elde etmeyi amaçlamaktadı
r.Bu
anlamda müş
teri tanı
mlarış
öyle sı
ralanabilmektedir.22
 İ
lk kez alan müş
teri
 Tekrar alan müş
teri
 Sürekli müş
teri
 Sözcü
İ
lk kez alan müş
teri
Müş
teri sadakatinde
yeni müş
teriye verilen ilk izlenim müş
terinin aldı
ğıürün
ya da hizmetten nekadar memnun olup olmadı
ğı
yla alakalı
dı
r.Genellikle alı
nan
üründen memnuniyetin yüksek olması, müş
teri sadakatini
arttı
rmaktadı
r.
Tekrar alan müş
teri
Müş
teri sadakatinin ası
l amaçları
ndan biri olan müş
terinin tekrar satı
n alması,
iş
letmelere
yüksek
kar
sağlamaktadı
rlar.Müş
terilerin
ürün
anlamı
nda
,
memnuniyetinin yüksek olması, tekrar satı
n alan müş
teriyi yaratmaktadı
r.
Sürekli müş
teri
Bu müş
teri türü , genellikle ş
irketin bir baş
ka ş
irkete sürekli olarak bir hizmeti
vermesinin sonucudur.
Sözcü
Müş
terinin
sözcü olarak tanı
mlanmasıtamamiyle ş
irketle ürün ya da
aldı
ğ
ı
nda , meydana gelen
hizmet
yüksek memnuniyetin ürünüdür. Müş
teriler , sözcü
Y.ZENGİ
N, Değer Yaratan Müş
teri İ
liş
kileri Yönetimi ,Yüksek Lisans Tezi, Marmara Ünv.s32 ,
2006
22
22
oldukları
nda
çevrelerine , arkadaş
ları
na ve ailesine
düş
üncelerini yayarak
ş
irket hakkı
nda olumlu
ş
irketin reklamı
nı yapmakta ve ş
irketin güvenirliğini
arttı
rmaktadı
r.
Bu müş
teri zinciri ve yaratı
lmak istenen müş
teri sadakati
gereken
uzun ve yönetilmesi
zorlu bir iş
tir.Müş
terilerin aldı
ğıbir ürün ya da hizmetin kusurlu
çı
kmasıveya aldı
kları üründen
memnun
kalmamaları, müş
teri
sadakatini
doğ
rudan etkilemektedir.Bu gibi durumlarda , ş
irketin çabuk ve kalı
cıçözümleri
müş
terilerine ulaş
tı
rması, müş
teride
olumlu bir ifade bı
rakacağıgibi aynı
zaman da müş
teri sadakatinede olumlu bir katkı
sı olmaktadı
r. 23
Müş
teri sadakatini etkileyen faktörlere bakı
ldı
ğı
nda
güven , vazgeçilmezlik ve de
önemsenmek gibi kavramlar ön plana çı
kmaktadı
r.Bunun gibi kavramları
n müş
teri
sadakatine olumlu ya da olumsuz bir etkide bulunacağ
ıkesindir. 24
1.3.3.Müş
teri Tatmini Kavramı
İ
ş
letmeler ayakta kalabilmek için müş
terilerin beklenti ve isteklerini dikkate
almak zorundadı
rlar.Müş
teri tatmini , iş
letmelerin performans ve müş
teri değerleri
yaratmak açı
sı
ndan en önemli kriterlerden birisi olarak kabul edilmektedir.Müş
teri
tatmini , genel olarak , müş
terilerin gerek üründen gerekse kurumdan beklentilerin
karş
ı
lanması
dı
r.
Müş
teri tatminin yüksek tutulması, müş
teri sadakatini doğrudan etkileyen en
önemli faktörlerden birisidir.Müş
teri tatminin sonucu olarak , müş
teri sadakatinin
artması, müş
teriden ömür boyu faydalanı
lması
na olanak sağ
lamaktadı
r.Müş
teri ,
satı
n aldı
ktan sonra aş
ağı
daki beşmemnuniyet düzeyinden biri yaş
anacaktı
r. 25
 Çok hoş
nut
23
A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management , Butterworth-
Heinemann Publishers 2005 s102-110.
24
O.C.Gel , CRM Yolculuğu ,Sistem Yayı
ncı
lı
k 2004 s50.
Y.ZENGİ
N, Değer Yaratan Müş
teri İ
liş
kileri Yönetimi ,Yüksek Lisans Tezi, Marmara Ünv. s27
28,2006
25
23
 Hoş
nut
 Kayı
tsı
z
 Hoş
nutsuz
 Çok hoş
nutsuz
Bu düzeylerden Hoş
nut - Çok hoş
nut olarak memnun ayrı
lan müş
terilerin doğal
olarak müş
teri tatmini ve sadakati
yüksek olacaktı
r.Bu kavramları
n karlı
lı
k
oranı
na etkisinin olumlu olacağıgörülebilmektedir.
Müş
terilerin tatminsizliğinin sonucunda oluş
abilen davranı
ş
lar ş
unlardı
r.
 Ürünü boykot etme ve ikame malara yönelme ,
 Markayıboykot etme ve yeni markaya yönelme ,
 Satı
cı
yıboykot etme , baş
ka satı
cı
lara yönelme ,
 Aile ve yakı
n çevresine ş
ikayetini iletme ,
 Ürünü iade etme ,
 Bası
n yayı
n
yoluyla ürün
hakkı
ndaki
fikirlerini
beyan
etme, olarak
sı
ralanabilmektedir.
1.4.MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ(CRM)’İ
N AMAÇLARI VE SAĞLADIĞI
AVANTAJLAR
 Müş
terilerin tam istediği ürün ve hizmetleri sağlamak ,
 Müş
teriye daha iyi hizmet sunmak ,
 Daha efektif çapraz satı
ş,
 Satı
şekibinin daha hı
zlısatı
şkapatması,
 Eski ve değ
erli müş
terileri tutmak ve yenilerini kazanmaktı
r. 26
Müş
teri iliş
kileri yönetimi (CRM)’ in ş
irketlere olan faydalarış
öyle sı
ralanabilir . 27
26
27
65.110.73.19/UploadsNew/Gallery/Presentations/CRM/CRM-distribution.pps 2004.
http://www.sauemk.com/makale.html 1999.
24
 Müş
terileri sı
nı
flandı
rmamı
zısağlar ,
 En uygun zamanda en uygun pazarlama programıile en uygun müş
teriye
yaklaş
ma olası
lı
ğıhesaplar ,
 Müş
terinin firmaya daha çabuk ulaş
ması
nısağlar ,
 Müş
terinin daha çabuk karar vermesine olanak tanı
r,
 Müş
teri sadakatini artı
rı
r,
 Baş
ka firmalarla iş
birliği yaparak yeni gelir olanaklarıyaratı
r,
 Müş
teri tatmin değerinin yükselmesini sağlar ,
 Birim müş
teri gelirinin artması
nısağlar ,
 Müş
teri sayı
sı
nıarttı
rı
r,
 Satı
şgiderlerinin azalması
nısağlar ,
 Süreç verimliliklerini arttı
rı
r,
 Stok yatı
rı
mları
nı
n optimize edilmesini sağ
lar ,
 Rekabetten önce değiş
imleri yakalayarak pazar payı
nı
n arttı
rı
lması
nısağlar .
Müş
teri iliş
kileri yönetimi (CRM)’ in ş
irketlere sağladı
ğıfaydalarırakamsal olarak
ifade etmek gerekirse, CSO Insights ş
irketinin dünya çapı
nda bin iki yüz elli’nin
üzerinde ş
irketi kapsayan araş
tı
rması
nda , yüz
yirmi'nin üzerinde parametre
kullanı
larak satı
şyapı
ları
nı
n ne derece verimli çalı
ş
tı
ğıdeğerlendirilmiş
tir.
Şirketlerin CRM uygulamaları
yla elde ettikleri rakamsal sonuçlar ş
unlardı
r. 28
• Müş
terilerle %61.9 oranı
nda daha iyi iletiş
im sağ
landı
ğ
ı,
• Müş
terilerin ihtiyaçları
nı%50.3 oranı
nda daha iyi tahmin edildiği,
• Yönetim yükünün %41.7 oranı
nda azaldı
ğı,
•
Gelirlerinin ise %30.1 arttı
ğıgörülmüş
tür.
Bu veriler değerlendirildiğinde işyükünün azalmasıyani zaman kavramı
nı
n etkin
kullanı
mı, müş
teri memnuniyeti ve
sadakati üzerinde
etkinliğinin
görebilmekteyiz.
28
Ronald S. Swift ,Accelerating Customer Relationships ,Prentice Hall , 2001 s28.
25
artı
ğı
nı
Müş
teri
iliş
kileri
yönetimi uygulamaları
nı
n rekabetçi bir
ortamda ş
irketlere
sağladı
ğıavantajlar düş
ünüldüğünde müş
teri iliş
kileri yönetimi (CRM)’in neden bu
kadar önemli ve vazgerçilemez olduğu daha iyi anlaş
ı
lmaktadı
r.
1.5.MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ(CRM) PROJELERİ
Nİ
N BAŞARILI VE
BAŞARISIZ OLMA NEDENLERİ
Müş
teri iliş
kileri yönetimi (CRM) projelerinin baş
arı
sı
z olması
nı
n bir çok nedeni
bulunmaktadı
r.Bunları
n en önemlilerini ş
öyle sı
ralayabiliriz . 29
 Projenin tek baş
ı
na IT personeline bı
rakı
lması
,
 Vizyon oluş
turmadan, hedefler belirlenmeden projeye baş
lanması
,
 Pahallıteknolojilerin tek baş
ı
na yeterli olduğunun düş
ünülmesi ,
 CRM’in sadece bir programdan ibaret olduğ
unun düş
ünülmesi,
 İ
nsandan çok teknolojiye yatı
rı
m yapı
lması
, insana gereken önemin
verilmemesi,
 CRM projesini çok kı
sa zamanda tamamlanmaya çalı
ş
ı
lması
,
 Tecrübesi olmayan kiş
ilerin, projeyi profesyonel destek almadan yürütmeye
çalı
ş
ması
,
 Üst yönetimin destek olmaması
,
 Ayrı
ş
tı
rma tekniklerinin uygulanmaması
,
 Projenin baş
ı
na getirilen kiş
inin bilgisiz ve tecrübesiz olması
,
 Yeterince araş
tı
rma yapmadan projeye baş
lanması
,
 Müş
teri odaklıdüş
ünememe,
 Eksik müş
teri bilgileri ile CRM çalı
ş
maları
nıyürütmeye çalı
ş
ma,
 Veri ambarı
nı
n güncel olmaması ve eksik verilere dayanarak CRM
çalı
ş
maları
nıyürütmeye çalı
ş
ma,
 Projeyi ucuza mal etmeye çalı
ş
madı
r.30
29
30
P. Bligh, D. Turk , CRM Unplugged Releasing CRM’s Strategic Value , Wiley Publishers 2004 s 33.
http://www.herkesmusteri.com/scrm/crmbasarisiz.aspx 2007.
26
Müş
teri
iliş
kileri
yönetimi (CRM)
projelerinin baş
arı
lıolma nedenleri ise
ş
unlardı
r.31
 Satı
şsürecinin iyi tanı
mlanması,
 Üst yönetimin, satı
şyönetiminin ve satı
ştemsilcilerinin CRM’e bağlı
lı
ğıve
kararlı
lı
ğ
ıolması,
 Etkinliklerin otomasyonuyla daha fazla satı
ş yapı
lmasıve engellerin
kaldı
rı
lması,
 Doğru tedarikçilerin veya diğer hizmet sağlayı
cı
ları
n doğru seçilmesi ,
 Yönetimin değil, satı
şelemanları
nı
n ve müş
terilerin önemi vurgulanmalı
,
 Tüm zaman dilimlerinin, kullanı
cı
ları
n ve iş tarzları
nı
n ihtiyaçları
nı
n
karş
ı
lanmasıiçin artı
rı
lmı
şdestek sağlanmalı,
 Saha satı
ş
larıiçin uzaktan iletiş
im kurulmalı,
 Satı
şsenaryolarıüzerine kurulu bir eğ
itim programıplanlanmalı,
 Sürdürülebilir ve geliş
tirilebilir teknolojiye yatı
rı
m yapı
lmalı
dı
r.32
1.6. MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ
NDE (CRM) KAMPANYA YÖNETİ
Mİ
Bir CRM kampanyası
nda esas amaç
yeni müş
teriyi
elde elmek ve mevcut
müş
teriyi korumaktı
r.Bu kampanya sürecide pazarlama kanalları
nı
n doğru bir
ş
ekilde kullanı
lması
nı
n yanısı
ra
müş
teriler
hakkı
nda detaylıbilgi edinmeyi
amaçlamaktadı
r.
Uygulanan bir kampanyanı
n baş
arı
lıolmasıiçin ş
u dört özelliği taş
ı
malı
dı
r.33
 Elde edilen veriler saklanmalı,
 Verilere uygun
analizler
uygulanarak parametreler
arası
nda
bir
bağ
kurulmalı
,
 Değ
iş
kenler tahmin edilebilir olması,
 Kampanya
sonucunda
elde
edilen
bilgilerin
yapı
lacak olan
bir diğer
kampanyada kullanı
labilir olmasıgerekmektedir.
31
32
P. Bligh, D. Turk , CRM Unplugged Releasing CRM’s Strategic Value , Wiley Publishers 2004 s165
www.srdc.metu.edu.tr/webpage/documents/Kosgeb/CRM_KOSGEB.ppt 2005.
27
Ayrı
ca yapı
lan analiz ve değerlendirmelere
dikkat edilerek , hazı
rlanan
kampanyanı
n baş
arıihtimali daha fazladı
r.Bu kampanyanı
n müş
terilere
bir
ulaş
ma
yöntemleri olarak e-posta , telefon , doğrudan satı
ş, broş
ür gibi seçenekler
uygulanmaktadı
r.Kampanya yönetim süreci aş
ağı
daki ş
ekilde belirtilmektedir.
MÜŞTERİİ
Lİ
ŞKİ
LERİYÖNETİ
Mİ
NDE (CRM) KAMPANYA YÖNETİ
Mİ
Kampanya Planlama
ve Geliş
tirme
Kampanyanı
n Hayata
Geçirilmesi
Hedeflerin ve
Yürütme ve
Koordinasyon
Kampanya
Sonuçları
nı
n Ölçümü
izleme ve Düzeltme
Tepki Analizleri
Stratejilerin
Analiz ve Kontrol
Belirlenmesi
Müş
teri Grupları
nı
n
Tespit Edilmesi
Profil Analizleri
İ
letiş
im Stratejilerinin
Belirtilmesi
Kampanya
Bütçesi
Tekliflerin
Geliş
tirlmesi
Test Aş
aması
Şekil 1.3. CRM kampanya yönetim süreci
Kaynak : http://www.teamworkcrm.com/Web/Istanbul/TeamWork.nsf/KeyMetin/CRM!OpenDocument&Click
2004.
Yukardaki ş
ekildede görüldüğü gibi baş
arı
lıbir kampanya yönetim sürecinin üç
temel aş
amasıvardı
r.Bunlar planlama , uygulama ve analizdir.
33
http://www.bendevar.com/v3/makale_326.html 2004.
28
1.6.1.Kampanyanı
n Planlanması
bakı
ldı
ğı
nda , kampanyanı
n
Kampanya planlaması
na
yönetilmesi için stratijk kararlar
hedeflerine
uygun
alı
rlar.Hedef tanı
mıise , genellikle ulaş
ı
lmak
istenen müş
teri sayı
sıolarak tanı
mlanmaktadı
r.
Yapı
lan analizler sonucunda hangi müş
teriye hangi
ürünün uygun olduğunun
tespit edilerek , berlirlenen ürünler için kampanya yürütülür.Bu kampanyalar , bir
grup müş
teri hedeflerinden çok , birkaç grup müş
teriyi kampanyaya dahil
edebilmektedir.34
Kampanyaları
n çok sayı
da
grubu içine alacak ş
ekilde organize olunması
nda
teknolojinin sağladı
ğıfayda yadsı
namaz .Çok sayı
da müş
terilerin aynı anda
analizi ya da
veri
kayı
tları
nı
n
yapı
lması
na
olanak
sağlayan
teknoloji ,
kampanyanı
n daha baş
arı
lıolması
na yardı
mcıolmaktadı
r.
Kampanyalara
hedef
belirlernirken
ş
u
dört
grup
için
hedefler
belirlenmelidir.35
 Pazara girmek ,
 Pazarda büyümek ,
 Ürün geliş
tirmek ,
 Çeş
itlendirmek içindir.
Kampanyanı
n hedefleri
tespitidir.Müş
teri
belirlendikten
sonraki
aş
ama , müş
teri
grupları oluş
turulması için , çok
grupları
nı
n
sayı
da gruplama
analizi
verilere uygulanmak zorundadı
r.Müş
teri grupları
nıtespit etmek için , iki veri
kullanı
lmaktadı
r.Bunlar , satı
nalma
davranı
ş
ları ve
müş
teri
bilgisinin
tanı
mlanması
dı
r.
34
N. WOODCOCK , The Customer Management Scorecard: Managing CRM for Profit, Kogan Page
Publisherss 2003.
35
http://www.kobifinans.com.tr/yazici.php?Article=8652&Where=bilgi_merkezi&Category=020305
2005.
29
Satı
nalma
davranı
ş
ları, müş
teri iliş
ikileri yönetiminden
elde edilen müş
teri
ihtiyaçları
nıön plana alarak müş
teri grupları
nıoluş
turmaktadı
r.Müş
teri bilgisinin
tanı
mlanması
nıgruplama olarak kullanmak içinse , sadece
müş
terilerin
geçmiş
kampanyadaki verileri gözönüne alarak gruplarıoluş
turmaktadı
r.
Kampanyanı
n baş
arı
ya ulaş
abilmesi için , en kritik aş
ama müş
teri grupları
nı
n
oluş
turulma sürecidir.Bu süreçte oluş
an
bir hatanı
n , kampanyanı
n baş
arı
sı
nda
direk etkisi olacağıgörülmektedir.Verilerine göre , farklımüş
teriler kampanyaya
dahil edilebilir.Müş
teri çeş
itleri , mevcut müş
teri , potansiyel müş
teri , kaybedilen
müş
terilerdir.
Kampnaya
kullanı
larak
yönetiminde gerek gruplama , gerekse
grupları
n oluş
tuma sürecinin
diğer
gerekli
analizlerin
iyi sonuçlar vermesi , tamamiyle
eldeki veri setinin kalitesine bağlı
dı
r.
İ
letiş
im stratejilerinin geliş
tirilemsine bakı
ldı
ğı
nda ise esas konu , kamapanya
için
hedef
kitle
olarak
belirnenen
müş
teri
grupları
na
nası
l
ulaş
ı
lacağ
ı
dı
r.Müş
terlere ulaş
mak için kullanı
lan araçlar , dergi , gazete, televizyon
, internet ve radyolardı
r. İ
letiş
im planı
nı
n uygulamadaki amaç hedef kitleye çabuk
ve etkili bir ş
ekilde ulaş
mayıgerçekleş
tirmekdir.
Kampanya teklifinin oluş
turulmasıise , müş
terilerin ilgisini daha fazla çekmek
için
yapı
lan
çalı
ş
madı
r.Bu
bir
çalı
ş
manı
n amacı var
devamlı
lı
ğı
nısağlmak , yeni müş
terileri ürünü almaları
na
dayanı
r.Tekliflere
örnek
olarak
kullanı
lan
 Fiyat ,
 Taahhüdün uzunluğu ,
 Ödeme koş
ulları,
 Risk azaltma mekanizmaları
dı
r.
30
müş
terinin
ikna etmek esası
na
promosyonlar , kuponlar
verilebilir.Teklif planı
nıoluş
turuken ş
unlara dikkat edilmelidir.
 Ürün konumlandı
rma ,
olan
vb.
Kampanya bütçesi , yapı
lan harcamaları
n ve aktivitelerin maliyetlerine bakı
larak
belirlenir.Kampanyaya
etkilenmektedir.Bütçe
ayrı
lan
kesin
bir
bütçe
ş
ekilde
kampanya
baş
arı
sı
nı
belirlenmekten
doğrudan
ziyade , yürütülen
kampanya sürecinde belirlenmelidir.Bütçe değerlendirmesinden sonra , dikkate
alı
nmasıgereken aş
ama test aş
aması
dı
r.
1.6.2.Kampanyanı
n Hayata Geçirilmesi
Kampanyayıhayata geçirme süreci tamamiyle operasyonel bir süreçtir.Bu süreç
değerlendirme ve izleme olarak ikiye ayrı
lı
r.
Yürütme
sürecinde
kullanı
lmak üzere , üç tane
program
hazı
rlanı
r.Bunlar ,
kampanya programı, kampanya cetveli ve aktivite cetvelidir.
Kampanya programı, kampanyanı
n hayata geçirilmesi sürecinde yapı
lacak olan
herş
eyi özet bir ş
ekilde içerir.Bu program , kampanyanı
n yönetilmesinde bir
faaliyeti olan her kiş
iye verilir.Ayrı
ca program özellikle yapı
lacak iş
lerin
bitiş
tarihlerinide içermektedir.
Kampanya cetveli , kampanya bileş
enlerinin ve de planlanan olayları
n listelendiğ
i
bir cetveldir.Kaynak , zaman , müş
teri hedefleri gibi konularda koordinasyonu
sağlamak amacı
yla kullanı
lmaktadı
r.
Aktivite cetveli ise , tamamiyle kendi operasyonel aktivitelerini planlamak ve de
koordinasyonunu sağlamak için kullanı
lan
bir
listedir.Amaç herhangi bir
faaliyetin zamanı
nda ve etkin bir ş
ekilde yapı
lması
nısağlamaktı
r.
Kampanyanı
n izleme aş
aması
, kampanyanı
n uygulanma sı
rası
nda ortaya çı
kan
sorunları
nıçözmek ve ilk ön bilgiyi elde etmek amacı
yla kullanı
lmaktadı
r.Bu
aş
amada ön bilgi almak için özet raporlar hazı
rlanarak durum değerlendirilmesi
yapı
lmaktadı
r.36
36
O.C.Gel , CRM Yolculuğu ,Sistem Yayı
ncı
lı
k 2004 s184.
31
1.6.3.Kampanya Analizi ve Kontrolü
Kampanya yönetiminin son aş
amasıolan kampanya analizi , elde edilen
müş
teriler hakkı
nda daha
derin bilgi edinmenin
kampanyaları geliş
tirmek için
yanı
sı
ra ilerideki yapı
lacak
kullanı
lı
r.Yapı
lmı
şiyi bir kampanya diger
bir
kampanya için örnek teş
kil etmektedir.
Kampanya analizlerinde kullanı
lan teknikler ş
uş
ekilde sı
ralanabilir.37
 Performans ölçümleri
 Tepki analizleri
 Profil analizleridir.
Performans ölçümleri , uygulanan kampanyanı
n sonuçları
nıdeğerlendirmek üzere
kullanı
lan parametrelerdir.Kamapanya sonuçlarıölçülebilir
olması
ndan dolayı
yorumlanmasıve de kampanyada değiş
ikliklere gidilmesine olanak sağlamaktadı
r.
Tepki analizleri , kampanya sürecinde ortaya çı
kan sonuçlarıdeğ
erlendirmek için
kullanı
lan yöntemlerdir.Tepki ,ş
ikayet vb gibi kampanya sonrası elde edilen
değerler kullanı
larak kampanya ile ilgili tepkilerin tahmini değerleri heaplanmaya
çalı
ş
ı
lı
r.Kullanı
lan
istatistik
tekniği
olarak
özellikle
Lojistik
regresyon
kullanı
lmaktadı
r.
Profil analizi , kampanyaya katı
lan müş
terilerler
iş
letmenin mevcut müş
terileri
arası
ndaki karakteristik farkları
nıortaya koymak için kullanı
lan bir analizdir. Bu
analiz kampanyaya
katı
lan müş
terilerin
profilini belirleyerek
kampanyanı
n
hedeflenen gruba nekadar baş
arı
yla ulaş
tı
ğı
nı
n tespitinde de kullanı
lmaktadı
r.
32
BÖLÜM 2 VERİMADENCİ
Lİ
Ğİ(DATA MINING)
2.1.VERİMADENCİ
Lİ
ĞİTANIMI
Zaman
içerisinde
teknolojinin hı
zla
miktarlarda verilerin
geliş
mesine
bağlı olarak
çok
büyük
elde edilmesine ve de depolanması
na olanak sağlamı
ş
tı
r.
Bu veri yoğunluğu içerisinden istenen ya da
gizli
kalmı
ş yararlıverilerin
elde edilme sürecine veri madenciliği olarak tanı
mlanmaktadı
r.
Veri madenciliği, veri ambarları
nda tutulan verilerden otomatikleş
mişmodeller
sayesinde anlamlıbilgileri, iliş
kileri ve davranı
ş
larıortaya çı
karma süreci olarak
da
tanı
mlanmaktadı
r. Bu süreçte, veri içinde önceden pek fazla bilinmeyen veya
görülemeyen desenler (pattern) öncelikle ortaya çı
karı
lmaktadı
r.Bu desenler
genellikle
bilgiler
arası
ndaki
iliş
kilerin,
sı
ralamanı
n,
birlikteliğinin ve tahminlemenin sonucunda elde edilmektedir.
Veri madenciliği
sı
nı
flandı
rmanı
n,
veri
38
uygulama alanları düş
ünüldüğünde , en
çok
kullanı
lan
sektörler ş
unlardı
r. 39
 Pazarlama ,
 Bankacı
lı
k ve sigortacı
lı
k,
 Biyoloji,tı
p ve genetik ,
 Kimya ,
 Yüzey analiz ve coğrafi bilgiler ,
 Görüntü tanı
ma ve robot görüşsistemleri ,
 Uzay bilimleri ve teknolojileri ,
 Meteoroloji ve atmosfer bilgileri ,
 Sosyal bilimler ve davranı
şbilimleri ,
37
http://www.init.com.tr/news_articles_tr.asp?haber_id=12 2006.
S.MITRA,T.ACHARYA,Data Mining : Multimedia, Soft Computimg , and Bioinformatics ,John
Wiley & Sons Publisher 2003
39
T.T.Bİ
LGİ
N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans
Tezi, Marmara Ünv. ,2003
38
33
 Metin madenciliği ,
 Web madenciliğidir.
Veri madenciliğinin
kullanı
m
alanları
ndan
yönetiminin teknik
alt yapı
sı
nda uygulanması
dı
r.Bu süreç gerek pazarlama
gerekse bankacı
lı
k ve sigortacı
lı
k sektörlerini
en
önemlisi
Müş
eri iliş
kileri
kapsamaktadı
r. Müş
teri iliş
kileri
yönetimi için müş
terileri sı
nı
flandı
rma , grup oluş
turma , en değ
erli müş
teri
grubunu oluş
turma süreçlerinde Veri madenciliğinden yararlanı
lmaktadı
r.40
Veri madenciliğinde bilgi elde etme süreçleri aş
ağı
daki
ş
ekilde belirtilmiş
tir.
Aş
ağı
daki ş
ekilde belirtilen süreçlerin baş
langı
ç noktası veri tabanı
ndaki elde
bulunan veriden , veri ambarı
na , oradan veri madenciliğine , son aş
ama olaraksa
gerekli bilginin elde edilmesi aş
aması
na gelmektedir.
Veri
Madenciliği
Veri
Ambarı
Sunum
Keş
fedilen
Bilgi
Veri
Tabanı
Şekil 2.1 Veri tabanları
nda bilgi keş
fi aş
amaları
Kaynak : http://www.isletme.istanbul.edu.tr/surekli_yayinlar/dergiler/nisan2000/1.htm
Veri madenciliğinin geliş
imine bakı
ldı
ğı
nda
veri madenciliğinin geliş
mesindeki
en önemli nedenin , veri tabanları
ndaki büyük teknolojik geliş
me olduğu
görülebilmektedir. Veri tabanları
nı
n çok büyük miktarlarda veriyi
özelliğinin artması
yla , veri kümelerinden
34
saklı
yabilme
özet ve yararlıverileri ortaya çı
karma
gereksinimine
bir
cevap olarak
Veri
madenciliği ortaya
çı
kmı
ş
tı
r.41 Veri
madenciliği sürecinde en önemli konu , her aş
amanı
n dikkatli ve eksiksiz bir ş
ekilde
uygulanmasıgereğidir.Çünkü bir aş
ama , diğer bir aş
amanı
n girdisi olduğ
undan
dolayı, bir aş
amanı
n eksik yapı
lmasıtüm veri madenciliği sürecini etkiler .Veri
madenciliği süreci ş
u aş
amalardan oluş
maktadı
r.42
 Problemin tanı
mlanması,
 Verinin hazı
rlanması,
 Model kurulumu ,
 Modelin kullanı
lması
dı
r.
Bu aş
amalar veri madenciliği sürecini oluş
turmaktadı
r.
Problemin tanı
mlanması
Veri madenciğilinin en önemli aş
amaları
ndan
biridir.Problemin ne olduğunu ,
gerek iş
letme gerekse müş
teri tarafı
ndan problemin tanı
mlandı
ğı; elde edilmek
istenen verinin ne için kullanı
lacağ
ı
nıtanı
mlayan bir aş
amadı
r.
Veri madenciliği süreçlerinde amaçlar özellikle iş
letmeler için , müş
teri değerini
arttı
rma , müş
teri sadakati yaratma , karıarttı
rmak , pazar payı
nı artı
rmak vb.
olabilmektedir.
Verinin hazı
rlanması
Verinin hazı
rlanmasıaş
amasıdört temel aş
amadan oluş
maktadı
r.Bu aş
amalar ;
 Verinin toplanması,
 Verinin birleş
tirilmesi ,
 Verinin temizlenmesi ,
40
T.T.Bİ
LGİ
N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans
Tezi, Marmara Ünv. ,2003
41
M. DEMİ
RALAY ,Hiyerarş
ik Kümeleme Metotlarıİ
le Veri Madencili ğ
i , Yüksek Lisans Tezi,
Marmara Ünv. s 4,2005
42
M .BERRY , Data Mining Techniques , Wiley Publishers 2004 s7.
35
 Verinin dönüş
türülmesidir.
Veri hazı
rlanmasısürecinde , veri toplanması en önemli adı
mlardan birisidir.Bu
aş
amada verilerin belirlenen amaçlara uygun elde edilmesi , gerek veri hazı
rlama
aş
aması
nıgerekse tüm veri madenciliği sürecini doğ
rudan etkilemektedir.
Veri birleş
tirme sürecinde , farklıkaynaklardan toplanan verilerin aynıformatta
çevrilmesi gerekmektedir.Böylece farklı kaynaklardan alı
nan verilerin hepsine
aynıanalizler uygulanabilmektedir.
Veri temizleme sürecinde , verilere uygulanan yöntem esas olarak analizi yanlı
ş
yönlere sürükleyebilecek olan eksik ya da aykı
rıverilerin
veri topluluğ
undan
çı
karı
lması
yla veri madenciliği sürecine etkisi ortadan kaldı
rı
lmaktadı
r.
Veri dönüş
türme sürecinde ise , verilerin farklıformları
nıanalize uygun olacak
ş
ekilde dönüş
türülmesi sürecidir.
Model kurulumu
Veri madenciliği sürecinde modele dahil edilecek verilerin amaçlara uygun ve
de doğru bir ş
ekilde seçilmesi , modelin doğru kurulma olası
lı
ğı
nıarttı
rmaktadı
r.
Doğru kurulan bir model , bilmek istenilen özet bilgiyide doğru yansı
tacağ
ı
kesindir.
Modelin kullanı
lması
Veri madenciliğinin son aş
amasıolan bu süreç , ortaya çı
karı
lan modelin benzer
amaçlara iş
letmeler için bir gösterge olacağıkesindir.
2.2.VERİ MADENCİ
Lİ
Ğİ
SÜRECİ
NDE
ORTAYA
ÇIKABİ
LECEK
SORUNLAR
Veri
madenciliğinde
ortaya
yatmaktadı
r.Bunlar ilk olarak
çı
kan
sorunları
n
temelinde
iki
unsur
iş
letmenin hangi amaçla veri madenciliğ
i yaptı
ğı,
36
diğeri ise elde bulunan verilerden kaynaklanmaktadı
r.Karş
ı
laş
ı
lan bazıproblemler
ş
unlardı
r.43
 Veri tabanı
nı
n boyutları,
 Dinamik veri yapı
sı,
 Eksik veri ,
 Gürültü ,
 Eksik değerlerdir.
Veri tabanı
nı
n boyutları
Veri tabanı
n boyutları
nı
n veriler için yeterli olmamasıdurumunda , yaptı
ğı
mı
z
analizlerin
örnekleme
uygulanabilirliği
tekniklerinin
ve
yoktur.Bu
örnek
problemin çözümünde
miktarı
nı
n azaltı
lması
yla
ise , yapı
lan
bu
problem
aş
ı
labilmektedir.
Dinamik veri yapı
sı
Veri tabanları
nı
n verileri güncellemesi , ya da yeni müş
teri verilerini veri
tabanı
na
eklenmesi , veri
madenciliğ
i sürecinde
olumsuz
etkilere
yol
açabilmektedir.
Eksik veri
Veri madenciliğ
inde en çok rastlanan problemlerden biri olan eksik veri , analizi
ya da yaratı
lamak istenen modeli yanlı
şyönlere çekebilmektedir.
Gürültü
Nitelik
değerlerindeki
ya da
sı
nı
f bilgilerindeki
hatalar ,
gürültü
tanı
mlanı
r.Ayrı
ca yanlı
şgirilen veriler de bu tanı
ma girmektedirler.
43
http://www.isletme.istanbul.edu.tr/surekli_yayinlar/dergiler/nisan2000/1.htm 2000.
37
olarak
Eksik değerler
Yapı
lan her analiz için büyük bir sorun olan veri değerlerinin hatalı olması,
tüm analizi iş
levsiz kı
labilecek büyük bir sorundur.Genellikle veri toplama ya
da girilme aş
aması
nda oluş
an bu hata analizi doğrudan etkilemektedir.
Geçmiş
ten günümüze gelen süreçte , veri madenciliğinin geliş
imi ş
u ş
ekilde
oluş
muş
tur.
Veri Toplama
(1970)
Veri Giriş
i
(1980)
Veri Ambarı
Geliş
imi (1990)
Veri Madenciliği
(2000)
Şekil 2.2 Veri madenciliğinin tarihsel geliş
imi
Kaynak : S.SMITH ,Building Data Mining Applications for CRM ,McGraw Hill Publisher 1999,s16 19
2.3.VERİAMBARI KAVRAMI
Veri ambarı, operasyonel, kalı
cı
, entegre ve tarihsel derinliği olan verilerin, karar
destek sisteminin iş
levlerini desteklemek, verilerden anlamlıiliş
kiler kurarak sonuçlar
çı
karmak üzere modellenmişsüreçlerin toplamı
dı
r. Amaç , verileri organizasyondaki
karar vericilerin faydalanmalarıiçin saklanarak, veriye hı
zlıve tek kaynaktan
ulaş
malarıimkanı
nısağlamaktadı
r.44
44
S.MITRA,T.ACHARYA,Data Mining : Multimedia, Soft Computimg , and Bioinformatics ,John
Wiley & Sons Publisher 2003 s24.
38
Veri ambarıayrı
ca
diğer analiz programları
nıkullanarak , var
olan veriyi
sorgulama , analiz etme ve yorumlama imkanı
da tanı
maktadı
r.
Veri ambarı
nı
n en önemli amacı
na
dönüş
türülmesi ve
toplanması
ndan
bakı
ldı
ğı
nda , bunlar bilginin
saklanması olarak
ön plana
toplanması,
çı
kmaktadı
r.Verilerin
sonra , veriler hataları
nı
n giderilmesine çalı
ş
ı
lı
r.Böylece daha
doğ
ru verilerle daha doğru analizler yapma imkanısağlanmı
şolunur.
Firmaları
n
yoğun rekabet ortamıiçinde müş
terilerini ve de pazar payları
nı
ellerinde tutmak ya da geniş
letmek için veri ambarı
nı
n sağladı
ğıanaliz imkanı
ve de
raporlama
oluş
turulacak veri
iş
lemlerinden
yararlanmalarıgerekmektedir.Firmalar
ambarları
nı
n miktarı, kapasitesi
firma ihtiyaçları
na
için
göre
farklı
lı
k göstermektedirler.
Veri
ambarı
nı
n
firmaları
n
operasyon
kı
smı
na sağladı
ğı faydalar
ş
öyle
sı
ralanabilir.45
 Kolay bir ş
ekilde veriye ulaş
ma imkanısağlar,
 Geçmiş
ten ders alı
nması
nısağlar,
 Operasyon kı
smı
nda verimliliği arttı
rı
r,
 Zaman ve de paradan tasarruf sağlar.
Veri toplamanı
n öneminin arttı
ğıgünümüzde , kurumsal ş
irketler büyük bir veri
ambarı
oluş
turmak
büyük
meblağlar
ayı
rmaktadı
r.Müş
terilerini daha iyi tanı
maları
na olanak sağlayan
veri ambarı,
gerek ürün yapı
lması
nda
için
bütçelerinden
ya da hangi müş
teriye hangi ürünün
sunulması
gerektiği konusundaki uygulamaları
n yapı
lması
na olanak sağlamaktadı
r.
Veri ambarı
nı
n taş
ı
masıgereken özellikler ş
öyle sı
ralanabilir. 46
45
46
http://www.breuer.com/benefits.asp 2007.
http://www.breuer.com/features.asp 2007.
39
 Zamana bağlıolması,
 Kalı
cıolması,
 Konuya yönelik olması,
 Birleş
trilmişolmasıgerekmektedir.
Zamana bağlıolması
Veri ambarı
ndaki veriler , tarihlere bağlı olarak kaydedilmektedir.Verilerin
zamana bağlıolarak kaydedilmesi bazıistatistiksel
analizlerin uygulanması
nı
kolaylaş
tı
rmaktadı
r.Verilerin veri ambarı içerisinde
zamana bağlı olmayan
verilerin kullanı
lmaya çalı
ş
ı
lması o verilerin güvenirliliğini
ve geçerliliğini
kaybetmesine sebep olacaktı
r.
Kalı
cıolması
Veri ambarı
ndaki
verilerin
güncellenmesi
tabanları aracı
lı
ğ
ı
yla mümkündür.Esasen
değiş
tirilemez.Güncelleme , düzeltme
aş
aması, sadece
operasyonel veri
veri
veri , sabit
ya da
ambarı
ndaki
veri
silme
iş
lemleri
ve
ancak
operasyonel veri tabanları
nda mümkündür.Veri ambarı
na verileri aktarmak ya da
herhangi bir iş
lemi yapabilmek için , operasyonel veri tabanları
na ihtiyacı
mı
z
vardı
r.
Konuya yönelik olması
Veri ambarları
nı
n kullanı
m amaçları uzun ya da orta vadeli kararlar alabilmek
için , yararlanı
lan bir araçtı
r.Bu amaca uygun bir ş
ekilde gerek analizlerin
gerekse kayı
tları
n yapı
lmasıgerekmektedir.
Birleş
trilmişolması
Veri ambarları
na
kaydedilen
veriler , belirli bir
kaydedilirler.Bu dönüş
üm verilerin
formata
dönüş
türülerek
birleş
tirilmesi ve farklıverilerin aynıanalizin
uygulanması
na olanak sağlar.
40
Veri ambarı, bir karar destek sistemi olup veri tabanı
ndan farklıolarak sadece
verilerin günlük olarak değerlendirilmesine olanak sağlayan biir teknolojidir. Veri
ambarı
nı
n karar destek sistemi olarak OLAP ( Online analytical Processing ) ,
Müş
teri iliş
kileri yönetimi (CRM) , istatistiksel analizler ve raporlama süreçlerinde
kullanı
lmaktadı
r.47
Veri ambarımimarisi aş
ağı
daki ş
ekilde görülmektedir.
Kaynaklar
METADATA
Kaynakları
Birleş
tirme
VERİAMBARI
Sorgulama
Ve İ
nceleme
İ
stemciler
Şekil 2.3. Veri ambarımimarisi
Kaynak : http://web.cs.hacettepe.edu.tr/~fatih/RESEARCH/doc/tez.pdf 2003.
Veri ambarı, mimarisine bakı
ldı
ğı
nda alt – orta – üst katman olarak üç esas
katmandan
oluş
maktadı
r.Alt katman , operasyonel
verinin iş
lendiği ve verinin
temizlenmesine olanak sağlayan iliş
kisel bir veri tabanı
dı
r.Alt katmanı
n en öne
çı
kan özellik olarak , veri tabanı
na bağlanı
p verilere uluş
mayısağlamasıolduğu
söylenebilir.Alt katman , kaynaklarıbirleş
tirme aş
aması
ndan oluş
maktadı
r.
47
T.T.Bİ
LGİ
N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans
Tezi, Marmara Ünv. ,2003
41
Orta katmana
katmanı
n esas
bakı
ldı
ğı
nda ise , veri ambarı bu katmanı oluş
turmaktadı
r.Bu
görevi , veri madenciliği için
verileri
anlaş
ı
lı
r bir
hale
getirmektir.Özellikle raporlama , analiz gibi iş
lemler bu katmanda yapı
lmaktadı
r.
Son
katman
olarak
üst katman
ise , karar
oluş
maktadı
r.Analizlerin sonuç kı
sı
mları
nı
n ve özet
destek sisteminden
verinin değerlendirildiği bir
katmandı
r.Bu katman sorgulama ve inceleme aş
aması
ndan oluş
maktadı
r.48
Veri ambarı
nı
n bileş
enleri aş
ağı
daki ş
ekilde gösterilmektedir.
Şekil 2.4. veri ambarıbileş
enleri
Kaynak : http://web.cs.hacettepe.edu.tr/~fatih/RESEARCH/doc/tez.pdf 2003.
Veri ambarı
nı
n oluş
turulma amacıiki tanedir.Bunlar ;49
 Veri depolamak ve analiz yapmak ,
 Karar destek sistemini
Operasyonel
oluş
turmak ve hı
zlıbir ş
ekilde bilgiye ulaş
maktı
r.
veri tabanları ,
veri
tabanı
na
günlük
verileri iş
lenen
verilerdir.Operasyonel veriler , çoğu kez kı
sa vadeli olarak saklanan verilerdir.
Metadata ise , hem operasyonel veri hem de veri ambarı
ndaki verilerin yapı
ları
nı
gösteren bir veridir.Gösterdiğ
i veriden ziyade , veri setinin karakteristik bilgilerini
taş
ı
yan bir veridir.Metadata , veri biçimi , veri kullanı
mı, veri kaynakları
nı,
48
C .TODMAN , Designing a Data Warehouse: Supporting Customer Relationship Management ,
Prentice Hall PTR Publisherss 2000 s220.
49
http://en.wikipedia.org/wiki/Data_warehouse 2007.
42
verilerin
nerede
bulunduğu gibi
bilgileri
saklayan
bir
yapı
ya
sahiptir.Metadata’nı
n veri ambarı
yla olan iliş
kisi ş
u ş
ekilde açı
klanabilir.
Dı
şkaynak
Veri seti
Veri ambarı
Metadata
Şekil 2.5. Metadata ‘nı
n veri madenciliğindeki yeri
Kaynak : S.SMITH ,Building Data Mining Applications for CRM ,McGraw Hill Publisher 1999,s30
Veri
ambarı, stratejik
kararları
n alı
nması anlamı
nda
kullanı
lmaktadı
r.Bu
nedenden dolayı, çok miktarda verileri saklamaktadı
r.Veri ambarı, alı
ş
ı
lmı
şveri
tabanları
nı
n amaç ve çalı
ş
ma biçimi bakı
mı
ndan farklı
lı
k göstermektedir.Veri
ambarları, veri tabanları
ndan daha fazla veri saklama kapasitesine sahiptir.OLTP
( online transaction process) uygulamaları
na olanak sağlamı
ş
tı
r.
OLTP uygulamalarıveri tabanı
ndan veri silme , değiş
tirme ya da
gibi
iş
lemleri içermektedir.Bu iş
lemler
SQL
veri ekleme
(structured query
language)
sorgulama dili ile gerçekleş
mektedir.
OLTP bakı
ldı
ğı
nda , operasyonel verinin veri tabanı
na aktarı
lması
na
yardı
mcı
olan bir iş
lem sürecidir.Bu süreç verilerin kayı
t edilmesinden güncellenmesine
kadar
uzanan
gerçekleş
en
bir
süreçtir.Veri
iş
lemler , genel
ambarı
ndan
olarak
veri
kullanı
lmaktadı
r.OLTP ‘nin amacısadece veri
tabanı
na aktarı
lması
nıamaçlamaktadı
r.
43
ziyade
veri
tabanı üzerinde
yüklenmesi
aş
aması
nda
setinin en az hata ile veri
Veri ambarları daha
çok
karar
destek
sistemlerine yönelik
veri saklama
araçları
dı
r.Veri madenciliği, OLAP (online analytical process) gibi uygulamalara
olanak sağ
lamaktadı
rlar.
OLAP ise verilere analiz yapı
lması
na , raporlanması
na olanak sağlayan bir
iş
lemler
sürecidir.Bu süreç
gerçekleş
ir.Bütün
analizler
tamamiyle
veri
tabanı
ndan
veri ambarıüzerinde
bağı
msı
z olarak
yapı
larak
on-line iş
lem
sürecini oluş
turur.Bu süreç sadece karar vericiye daha sağlı
klıkarar vermesine
olanak sağ
layan tüm analizleri veri setine uygulama imkanıvermektedir.50
2.4. VERİMADENCİ
Lİ
ĞİTEKNİ
KLERİ
Veri madenciliği teknikleri , verilerin kullanı
lma amaçlarıve de veri yapı
sı
na
göre
farklı
laş
maktadı
r.Temel
olarak
iki
ana
grupta
bu
teknikleri
toplayabiliriz.Bunlar ;
 Öngörüsel
 Tanı
mlayı
cı
Tanı
mlayı
cı veri madenciliği teknikleri ,
daha
çok
verinin
karakteristik
özelliklerini ön plana çı
karmak için kullanı
lı
rken , öngörüsel teknikler daha çok
ileriki yı
llarda
bir parametreyi
tahmin etmek için kullanı
lmaktadı
r.Kategorik
olarak gruplanan veri madenciliği teknikleri ile , farklıgruplamalar da yapmak
mümkündür.Bu gruplamaları
n en bilineni J.Han kategorileri olarak bilinir. 51
 Tanı
mlama ve ayrı
mlama ,
 Birliktelik Kuralları,
 Sı
nı
flandı
rma ve öngörü ,
 Kümeleme analizi ,
 Sı
radı
ş
ı
lı
k analizidir.
50
http://www.olapreport.com/fasmi.htm 2005.
T.T.Bİ
LGİ
N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları, Yüksek Lisans
Tezi, Marmara Ünv. ,2003 .
51
44
2.4.1.Tanı
mlama Ve Ayrı
mlama
Veri setini tanı
mlama sürecinde amaç
, veri hakkı
nda özet bir bilgi elde
etmektedir.Ayrı
mlama ise , veri setindeki farklı
lı
klarıortaya koymak için yapı
lan
bir iş
lemden ibarettir.
Ayrı
mlama iş
leminde kullanı
lan
en
önemli yöntemlerden birisi Diskiriminant
analizidir.Bu analiz , veri kümesini belirli gruplara atı
yarak verileri ayrı
ş
tı
rı
r.Bu
yöntemde
kullanı
lan
model , esas
olarak
veri
ayrı
ş
tı
rma
iş
leminde
kullanı
lmaktadı
r.Veri Ayrı
ş
tı
rma modeli ş
u ş
ekildedir.
Zi b0 b1 x1i b2 x 2i ... bn x ni
Zi : i’ninci bireyin ayı
rma değeri
b i : i’ninci değiş
kenin katsayı
sı
X1i : i ‘ninci bireyin i’ninci değ
iş
ken üzerindeki etkisidir.
Diskriminant analizi ; örneğin bir iş
letmede marka alan ile marka almayan
müş
teri
arası
nda
kullanı
labilmektedir.
anlamlı bir
fark
olup
olmadı
ğı
nı belirlemek
için
52
Diskriminant analizi, hatalısı
nı
flandı
rma olası
lı
ğı
nıen aza indirgeyerek birimleri ait
olduklarıgruplara ayı
rmak amacı
na yönelik olan, istatistiksel bir
karar verme
yöntemidir . Diskriminant analizi, X veri setindeki değiş
kenlerin iki veya daha fazla
gerçek gruplara ayrı
lması
nıbelirlemek amacı
yla yararlanı
lan bir yöntemdir.
Diskriminant analizi, genel anlamda ayı
rma olup, bireylere ait p tane özellikten
yararlanarak ait olduklarıgrupları(yı
ğı
n) belirlemede veya mevcut grupları
birbirinden ayı
racak en iyi fonksiyonu bulmada kullanı
lan , çok değiş
kenli istatistik
tekniklerinden birisidir. Bu analiz , gruplar arası
nda çeş
itli değiş
kenlere bağlıolarak
farklı
lı
kları
nıortaya koyması
na olanak sağlamakktadı
r.
52
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. s 258-264 1996.
45
Diskriminant analizinde , birimler en az hata ile ait olduklarıbirimlere ayrı
lmaktadı
r.
Bu
analizin temelinde incelenen bireyin kitlesinin belirlenmesini sağlayacak bir
fonksiyon bulunmaktadı
r. Disriminant analizi iki veya daha fazla gruptaki birimlerin
etkileş
im seviyelerinin hangi düzeyde olduğu, diğer değiş
kenler arası
nda ne gibi
farklı
lı
klar bulduğunu ortaya koymaktadı
r.
Diskriminant analizi, farklı
lı
ğ
ı
n en fazla hangi değiş
kenlerde yoğunlaş
tı
ğı
nı
n
belirlenmesi ve böylece grupları
n farklı
laş
ması
na etkin olan faktörlerin saptanması
nı
da sağlar. Analiz sonucunda yapı
lan sı
nı
flama ile orijinal grup üyeliklerinin
karş
ı
laş
tı
rı
lması, belirlenen fonksiyonun yeterli olup olmadı
ğı
nıtest etmeye olanak
sağlar .
Diskriminant analizi, birbirleriyle yakı
ndan iliş
kili birkaç istatistiksel yaklaş
ı
mı
kapsayan genişbir kavramdı
r . Bu yaklaş
ı
mlar iki ana kategoride ele alı
nabilir. Birinci
kategoriyi oluş
turan yaklaş
ı
mlardan , gruplar arası farklı
lı
klarıyorumlamada
faydalanı
lı
rken, ikinci kategori yaklaş
ı
mlar birimleri gruplara ayı
rmak amacı
yla
kullanı
lmaktadı
r. Diskriminant analizi eğer bir ayı
rma fonksiyonu belirlemeye
yönelik olarak uygulanmı
şise , tanı
mlayı
cıdiskriminant analizi, eğer sı
nı
flama
amacı
yla uygulanmı
şise ,
tahmin edici diskriminant analizi olarak adlandı
rı
lı
r.
Tahmin edici diskriminant analizi, davranı
şdeğerleri içinde bulunan temel bilgilerin
gruplar için , verilerin nası
l belirleneceği sorusuna iş
aret eder. Bir girdi eğ
er tahmini
grubun üyesi değilse , yanlı
şsı
nı
flandı
rı
lmı
şolarak nitelendirilir. Genellikle yanlı
ş
sı
nı
flandı
rma olası
lı
ğı
nıve bedelini düş
ürmek oldukça önemlidir
Bazı yazarlar
diskriminant
analizinde
ayı
rma
fonksiyonu
katsayı
ları
nı
n
hesaplanması
nda baş
vurulan yöntemlere göre diskriminant analizini, kanonik
diskriminant analizi, en çok olabilirlik diskriminant analizi ve bayes diskriminant
analizi ş
eklinde adlandı
rı
rlar.
Genel olarak birimlerin gruplaması
nda bazımatematiksel eş
itliklerden faydalanı
lı
r.
Diskriminant fonksiyonu olarak adlandı
rı
lan bu eş
itlikler birbirine en çok benzeyen
gruplarıbelirlemeye olanak sağlayacak ş
ekilde grupları
n ortak özelliklerini belirlemek
amacı
yla kullanı
lmaktadı
r. Gruplarıayı
rmak amacı
yla kullanı
lan karakteristikler ise
diskriminant değiş
kenleri olarak adlandı
rı
lmaktadı
r. Kı
saca diskriminant analizi, iki
46
veya daha fazla sayı
daki grubun farklı
lı
kları
nı
n diskriminant değiş
kenleri vası
tası
yla
ortaya konmasıiş
lemidir .
Araş
tı
rı
cı
nı
n, p tane özelliği bilinen gözlemleri belli özelliklerine göre bazıgruplara
ayı
rmak istemesi, elde edilecek somut ve özetleyici bilgiler açı
sı
ndan istatistiksel
değerlendirmede önemli bir konudur.
Araş
tı
rı
cı
, hatalısı
nı
flandı
rma olası
lı
ğı
nıen aza indirgeyerek gözlemleri ait oldukları
gruplara ayı
rmak veya bu gözlemlerin çekilmiş olduklarıyı
ğı
nlarıbelirlemek
isteyecektir.
Diskriminant analizinin amaçları
nıdört grupta toplanabilir.53
 Analiz öncesi tanı
mlanmı
şiki ya da daha fazla grubun (örneğin, mali açı
dan
baş
arı
lıve baş
arı
sı
z iş
letmeler) ortalama özellikleri arası
nda önemli farklar olup
olmadı
ğı
nı
n, bağı
msı
z değiş
kenlere (açı
klayı
cıdeğiş
ken) bağlıolarak istatistiksel
olarak test edilmesi,
 Her bir değiş
kenin, gruplar arası
ndaki farka katkı
sı
nı
n saptanması
,
 Grup içi değiş
ime oranla, gruplar arası
ndaki ayı
rı
mımaksimize eden tahmin
değiş
kenleri kombinasyonunun belirlenmesi ve bu sayede baş
langı
çtaki açı
klayı
cı
değiş
ken sayı
sı
ndan daha az sayı
da değiş
ken ile gruplar arası
ndaki önemli
farklı
lı
kları
n açı
klanması
,
 Analiz öncesi tanı
mlanmı
şgrupları
n atanmasıile ilgili yöntemlerin geliş
tirilmesi,
yeni bireylerin hangi gruba ait oldukları
nı
n saptanması
dı
r.
Tüm istatistiksel ve matematiksel modellerde olduğu gibi, diskriminant analizi de bazı
varsayı
mlara dayanmaktadı
r. Analizin ayı
rı
m gücü, dayandı
ğı varsayı
mları
n
sağlanması
na ya da bu varsayı
mlar karş
ı
sı
nda sağlam olması
na bağlı
dı
r. Özellikle
modelin baş
arı
sı
nı
n, beklenenden düş
ük çı
ktı
ğıdurumlarda, doğru yorumda
53
http://people.revoledu.com/kardi/tutorial/LDA/LDA.html 2006.
47
bulunabilmek için , bu varsayı
mları
n test edilmesi gerekmektedir. Diskriminant
analizinin varsayı
mlarış
unlardı
r. 54
 Anakütle belli özelliklere göre gruplanabilir.Birbirinden farklıiki veya daha fazla
grup söz konusu olmalı
dı
r.
 Veriler anakütleden rassal olarak seçilmiş
tir.
 Bağı
msı
z değiş
kenler çok boyutlu normal dağı
lı
ma sahiptirler.
 Gruplara ait ortalamalar ve kovaryans matrisi önceden bilinir. Grupları
n
kovaryans (sapma) matrisleri eş
ittir.Bu varsayı
mı
n sağlanamadı
ğıdurumlarda,
diskriminant analizinin karesel formu kullanı
labilir.
 Grupları
n eş
it sayı
da birimden
oluş
madı
ğ
ı durumlarda,
üyelerin
önsel
olası
lı
kları
nı
n bilindiği varsayı
lı
r.

Herhangi bir birimin yanlı
ş sı
nı
flandı
rmanı
n maliyeti önceden bellidir.Bu
varsayı
mlardan bir ya da daha fazlası
nı
n sağlanamadı
ğıdurumda, diskriminant
analizi optimum bir sı
nı
flama ortaya koyamayacaktı
r. Yazı
nda, diskriminant
analizinin bu varsayı
mlar karş
ı
sı
nda sağlamlı
ğ
ıtartı
ş
malıbir konudur. Üçüncü
varsayı
mda , bağı
msı
z değiş
kenler normal dağı
lı
ma sahip olduğu belirtilmiş
tir.
Ancak yapı
lan araş
tı
rmalar , mali oranlar kullanı
larak yapı
lan çalı
ş
malarda mali
oranları
n normal dağı
lı
ma uygunluk göstermemesi sebebiyle dağ
ı
lı
mları
n
normalden ziyade sağa çarpı
k olduğu göstermektedir. Bu durumda mali oranlar
kullanı
larak yapı
lan çalı
ş
malar , değiş
kenlerin dağı
lı
mı
nınormal dağı
lı
ma
yaklaş
tı
rmayıhedeflemektedirler.
2.4.2.Birliktelik Kuralları
Veri kümesinde birliktelik
analizi eş zamanlıoluş
um , olay vb durumları
n
tesbiti için kullanı
lan bir analizdir. Veri madenciliğ
i sürecinde en olasımodeli
54
http://www.statsoft.com/textbook/stdiscan.html#assumptions 2003.
48
ortaya çı
karmasıaçı
sı
ndan önemli analizlerden birisidir.Bu analizler genel olarak
çı
kardı
kları kurallardan
dolayı, müş
teri davranı
ş
ları
nı tanı
mlama
sağlamaktadı
r.Birliktelik kuralları
n örnek uygulamalarış
öyledir.
imkanı
55
 Sepet analizi ,
 Direk satı
ş
ta baş
ka bir ürün önermek ,
 Kredi kartısahtekarlı
kları
nıortaya çı
karmak ,
 Sağ
lı
k sigortaları
ndaki sahtekarlı
ğıortaya çı
karmak ,
 Standları
n dükkanda nası
l dizilmesi gerektiğini ortaya koymaktadı
r. 56
Bu uygulamalardan
en
yaygı
n olarak
kullanı
lan
analiz
yöntemi , sepet
analizidir.Bir ürünü alan müş
terinin onun yanı
nda baş
ka ne aldı
ğı
nı
n tespiti için
kullanı
lan bir analizdir.Sepet analizinde
Bunlar;
iki
önemli
kriter
kullanı
lmaktadı
r.
57
 Destek kriteri ,
 Güven kriteridir.
Bu kriterler ş
ekilde hesaplanmaktadı
rlar.Burada X ve Y malları
nı
n arası
ndaki iliş
ki
incelenmektedir.
P(X Y) X ve Y malları
nıalmı
şmüş
teri sayı
sı/ toplam müş
teri sayı
sı
P(X Y) , destek
kriteri
adı verilmektedir.Destek kriteri X malı
nı alan bir
müş
terinin Y malı
nıalma olası
lı
ğı
nıyani X malı
nıalı
p sonra Y malı
nıalma
olası
lı
ğı
nıgösteren bir değerdir.Bu değer bire yaklaş
tı
kça güçlenmektedir.
P(X Y)
P(X / Y) 
P(Y)
55
M.KANTARDZIC,Data Mining : Concept,Models,Methods , and Algorithms,John Wiley & Sons
Publisher s 82 ,2003
56
S.MITRA,T.ACHARYA,Data Mining : Multimedia, Soft Computimg , and Bioinformatics ,John
Wiley & Sons Publisher s 268 ,2003
49
P(X / Y) , güven kriteri olarak tanı
mlanmaktadı
r.Bu kriyer Y malı
nıalan bir
müş
terinin X malı
nıalma olası
lı
ğı
nı göstermektedir.Aynıdestek kriteri gibi ,
güven kriteri de bire yaklaş
tı
kça güçlenmektedir. 58
Birliktelik kurallanı
rı
na örnek vermek gerekirse , tatil için uçak bileti
alan bir
kimsenin , belli bir olası
lı
kla araba kiralamasıverilebilir.
2.4.3. Sı
nı
flandı
rma Ve Öngörü
Veri madenciliğinde sı
nı
flandı
rma , belirli bir özelliğe göre veri kümesini
sı
nı
flara ayı
rmaya ve yeni elde edilen verilerin
hangi sı
nı
fa ait olduğunu
gösteren bir analiz tekniğidir.
Öngörü ise
, bir parametrenin
geçmiş
teki
değerlerine
alabileceği değerleri tespit etme çabası
dı
r.Gerek sı
nı
flandı
rma
bakı
larak gelecekte
gerekse
öngörü
iş
lemleri için kullanı
lan analizler ş
unlardı
r.
59
 Karar Ağ
açları( Decision Tree) ,
 Yapay Sinir Ağları( Neural Networks) ,
 K-Ortalamalar Yöntemi ( K-Means) ,
 Genetik Algoritmalar ,
 Regresyon Analizi ,
 Zaman Serileri Analizidir.
2.4.3.1. Karar ağaçları
Karar ağacı, karar vericinin en iyi karara ulaş
ı
labilmesi için yapı
lan gerek
olası
lı
k gerekse maksimum fayda
esas alı
narak düzenlenen bir tekniktir.Karar
ağacıanalizi , genellikle seçenekler üzerinde yapı
lan bir analiz türüdür.Bu
analizin veri madenciliğinde kullanı
lma sebepleri ş
unlardı
r.60
57
M .BERRY , Data Mining Techniques , Wiley Publishers 2004 s289.
S.MITRA , Data Mining Multimedia , Soft Computing and Bioinformatics , Wiley Publishers
2003 s71.
59
J. BIGUS , Data Mining With Neural Networks ,McGraw Hill Publishers , 1996 s12.
60
W.CHU, Foundations and Advances in Data Mining ,Springer Publisherss 2005 s25 , s100.
58
50
 Maliyeti azdı
r.
 Anlaş
ı
lmasıve yorumlanmasıkolaydı
r.
 Veri tabanı
na kolay entegre edilebilmektedir.
 Güvenirliliği yüksektir.
Bu analizin uygulaması
nda veri seti iki kı
sma ayrı
lrı
r.İ
lk veri seti karar ağacı
nı
oluş
turmak , ikinci
kı
sı
m ise
karar
ağacı
nı
kontrol
etmek
amaçlı
kullanı
lmaktadı
r.Karar ağacış
u ş
ekildedir.
Karar 1
evet
hayı
r
Karar 2
Karar 3
evet
evet
hayı
r
hayı
r
Karar 4
evet
Karar 5
hayı
r
evet
hayı
r
Şekil 2.6.Karar ağacış
ekli
Kaynak : M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons Publishers
2003 .
Karar ağacıanalizinde kullanı
lan algoritmalar ş
unlardı
r.61
 C&RT ,
 CHAID ,
 C4.5 ,
 Quest .
61
M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons
Publishers 2003 s142.
51
C&RT , ikili ağ
aç analizi olarakta bilinmektedir.Bu analiz doğru homojen yapı
ya
ulaş
ı
lı
ncaya kadar , veriyi ikili alt kümelere ayı
rmaktadı
r.1984 yı
lı
nda bulunan
bu yöntem kullanı
ş
lı
lı
k açı
sı
ndan , büyük verilerde
çok uzun zaman aldı
ğı
ndan
dolayıpek tercih edilmemektedir.
CHAID , bu karar ağacıtekniği gruplarıoluş
turmak için Ki-Kare analizinden
yararlanmaktadı
r.Bu algoritma esasen benzer verileri birleş
tirerek farklıolanlarla
analize devam eder.Böylece ulaş
ı
lmak istenen değerler kesin ve kolay bir ş
ekilde
elde edilir. Karar ağ
acı
nı
n ilk dalları
nı oluş
turmak için en iyi tahmin edici
değiş
kenler seçilir.Bu algoritmada
değiş
kenler sürekli
ise F-Testi değerleri ,
nominal ya da ordinal bir değiş
kense Ki-Kare Test değerleri kullanı
lı
r. CHAID
algoritmasıikili bir algoritma değildir.Kullanı
m açı
sı
ndan yaygı
n ve popüler bir
uygulamadı
r.
C4.5 algoritması en iyi karar ağacıalgoritması
dı
r. Karar
ağacı
nı oluş
tururken
kayı
p verileri hesaba katmaz .Özellikle hasas ve anlamlıveriler elde etmek için
kullanı
lmaktadı
r. 62
Quest algoritması, ikili bir algoritmadı
r.En önemli özelliği
gerek değiş
ken
gerekse ayı
rı
m noktaları
nı
n belirtilebilmesidir.1997 yı
lı
nda bulunan bu yöntem
yaygı
n bir karar ağacıalgoritması
dı
r.63
2.4.3.2.Yapay sinir ağları
Yapay sinir ağları, öğrenme yolu ile yeni bilgi elde edebilmeyi sağlayan bir
tekniktir.Tarihi geliş
imine bakı
ldı
ğı
nda , 1950 ‘lilerden
geliş
meler
olduğ
u
görülebilmektedir. Yapay
sinir
günümüze uzanan hı
zlı
ağ
ları
nı
n
yapı
sı
na
bakı
ldı
ğı
nda;
Wi : kendi ağarlı
k değeri ,
I i : n adet girdi değeri ,
62
M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons
Publishers 2003 s154.
63
N.YE , The Handbook Of Data Mining , Lawrence Erlbaum Associates Publisherss 2003 s3.
52

n
I Wi : Toplama fonksiyonu ,
i1 i
F( i1 Ii Wi ) : Aksiyon fonksiyonu bu ş
eklinde hesaplanı
r.64
n
Yapay sinir ağları
n süreci ş
u ş
ekildedir.
Girdi
Toplama fonksiyonu
Aksiyon fonksiyonu
Çı
ktı
Şekil 2.7. Yapay ağsüreci
Kaynak : http://tr.wikipedia.org/wiki/Yapay_sinir_a%C4%9Flar%C4%B1 2007.
Bir yapay sinirin öğrenme yeteneği , kullanı
lan ağı
rlı
k oranı
yla doğrudan
alakalı
dı
r.Süreçte kullanı
lan girdiler , dı
ş
arı
dan elde edilen bilgilerdir.Toplama
fonksiyonu bir hücreye gelen net girdi miktarıolarak tanı
mlanabilir.Aktivasyon
fonksiyonu , bu fonksiyon öğrenilme sonucu oluş
an değerlerin ortaya çı
karı
lması
için kullanı
lan bir fonksiyondur.Son olarak çı
ktıise , aktivason fonksiyonundan
elde edilen değer olarak tanı
mlanabilir. 65Yapay sinir ağaçları
nı
n katman olarak
iş
leyiş
i aş
ağı
daki ş
ekilde gösterilmektedir.
64
M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons
Publishers 2003 s222.
65
W.CHU, Foundations and Advances in Data Mining ,Springer Publisherss 2005 s23.
53
Şekil 2.8.Yapay sinir ağları
nı
n katmanları
Kaynak : http://tr.wikipedia.org/wiki/Yapay_sinir_a%C4%9Flar%C4%B1 2007.
Yapay sinir
ağ
ları , ağı
n yapı
sı
na göre sı
nı
flandı
rı
ldı
ğı
nda
iki gruba
ayrı
lmaktadı
r.Bunlar ; 66
 İ
leri beslemeli ağlar ,
 Geri beslemeli ağlardı
r.
Yapay sinir ağ
larıöğrenme türüne göre sı
nı
flandı
rı
ldı
ğı
nda ise , denetimli ve
denetimsiz öğ
renme olarak iki gruptan oluş
maktadı
r.
Yapay sinir ağ
ları
nı
n kullanı
ldı
ğıyerlere bakı
ldı
ğı
nda ilk olarak akla genel veri
madenciliği
olması
na
karş
ı
n , birçok
alanda
yapay sinir
ağları
kullanı
lmaktadı
r.Bunlar ; 67
 Kredi kartısahtekarlı
ğ
ı
nı
n tespiti ,
 Kalite kontrol ,
 Üretim planlama ve çizergeleme ,
 Ürünlerin performans tahmini gibi konularda kullanı
lmaktadı
r.
66
N.YE , The Handbook Of Data Mining , Lawrence Erlbaum Associates Publisherss 2003 s71.
67
http://www.backpropagation.netfirms.com/ysauygulama.htm 2005.
54
2.4.3.3. K-ortalamalar yöntemi ( K-Means)
K-en yakı
n komş
u yöntemi 1967
yı
lı
nda
Mac QUEEN tarafı
ndan
bulunmuş
tur.Kümeleme algoritması olan k-ortalamaları, k sayı
da veriden küme
oluş
turmaktadı
r.Verilen
ağ
ı
rlı
klı ortalamalara bakı
larak
en
yakı
n değerleri
birbirine atayarak kümeler oluş
turmaktadı
r.
Bu yöntem ilk olarak veri setini k tane
küme olucak ş
ekilde ayı
rı
r.K değeri
analizi yapan kiş
i tarafı
ndan belirtilmektedir.Daha sonra
noktalara
en yakı
n olduğu
kümeye
dahil
edilerek
her veri , merkez
kümeleme
iş
lemi
yapı
lı
r.Oluş
turulan kümelerin tekrar ağı
rlı
klıortalaması hesaplanarak merkez
değerleri yeniden oluş
turulur.Böylece elde edilen kümeler homojen bir ş
ekilde
oluş
turulmuşolurlar.68
2.4.3.4.Genetik algoritmalar
Genetik alagoritmalar , çok değiş
kenli fonsiyonlarıoptimize etmeyi amaçlayan
sayı
sal bir araçtı
r.Bu algoritma parametre yerine
onları
n kodlanmı
şbiçimlerini
kullanarak en iyiye ulaş
maya çalı
ş
ı
r.Yapay zekanı
n bir uygulamasıolan genetik
algoritma , kı
sa sürede çözümleri ortaya çı
karması bakı
mı
ndan önemli bir
tekniktir.69
Genetik algoritmaları
nı
n uygulama alanları
na bakı
ldı
ğı
nda ise , kromozon ve gen
hesaplamaları, havuz problemi çözümü , uygunluk fonksiyonunun hesaplanması
gibi genel problemlerde uygulanabildiğini görmekteyiz.70
Bu uygulama alanları
nı sı
nı
flandı
rmamı
z gerekirse ;
 Deneysel çalı
ş
maları
n optimizasyonu ,
68
M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons
Publishers 2003 s134.
69
M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley & Sons
Publishers 2003 s222.
70
M .BERRY , Data Mining Techniques , Wiley Publishers 2004 s421.
55
 Pratik endüstriyel uygulamalar ,
 Sı
nı
flandı
rma çalı
ş
maları
dı
r.
Genetik algoritmaları
n veri madenciliğinde uygulamaları
na bakı
ldı
ğı
nda ise ;
 Kümeleme ,
 Model tahmini ,
 İ
liş
ki kurallarıoluş
turma ,
 Müş
teri gruplarıoluş
turma ,
 Sı
nı
flandı
rma çalı
ş
maları
nda kullanı
lmaktadı
r.
2.4.3.5.Regreyon analizi
Tahmin yöntemlerinden biri olan regresyon analizi bir
birden
fazla
bağı
msı
z
değiş
kenle
olan
iliş
kisini
bağı
mlıdeğiş
kenin
gösteren
basit
bir
fonksiyondur.Bu analizde amaç geçmiş
te iliş
kisi olduğu varsayı
lan bağı
mlıve
bağı
msı
z değiş
kenler arası
nda bir iliş
ki
fonksiyonu
oluş
turarak
gelecekte
alabilicekleri değerleri tahmin etme esası
na dayanmaktadı
r.Regresyon fonksiyonu
ş
uş
ekildedir.71
Örneklem içinse formül ş
u ş
ekli almaktadı
r.
Doğrusal regresyon modeli grafikle ş
u ş
ekilde gösterilir.
71
N.ORHUNBİ
LGE , UygulamalıRegresyon ve Kolerasyon Analiz , İ
Ü. Yayı
nları1996 s14.
56
Şekil 2.9.Doğrusal regresyon grafiği
Kaynak : Ö.SERPER,Uygulamalıİ
statistik 2 , Ezgi Yayı
nevi 2000 s220
Y a bx e olan
örneklem
için doğrusal modelde
a sabit katsayı, b
bağı
msı
z değiş
kenin modeldeki ağı
rlı, e hata terimleri olarak tanı
mlanmaktadı
r.Bu
modelin katsayı
larış
u ş
ekilde tahmin edilmektedir. 72
Tahmin edilen Y a bx e modelinin gövenirliliği
F-testi olan ANOVA ile
araş
tı
rı
lı
r.Araş
tı
rı
lan hipotez aş
ağı
daki gibidir.73
H0 : X ve Y değ
iş
keni doğrusal arası
nda iliş
ki yoktur.
H1 : X ve Y değiş
keni doğrusal arası
nda iliş
ki vardı
r.
Bu hipotez ş
u formülle test edilir.
Tablo 2.1.Anova testi hesap tablosu
Kaynak : K.ÖZDAMAR , Paket Programlar ile İ
statiksel Veri Analizi , Kaan Kitabevi 1999 s274
72
73
M.SPIEGEL, İ
statistik , Bilim Tekik Yayı
nevi 1995 s143.
K.ÖZDAMAR , SPSS ile Bioistatistik , Kaan Kitabevi 2001 s313.
57
Hesaplanan F değeri F-test
değeriden
büyük ise H0 hipotezi red edilir H1
hipotezi kabul edilir.Yani değiş
kenler arası
nda doğrusal bir iliş
kinin var olduğu
söylenebilmektedir.
Eğer bağı
msı
z değ
iş
kenlerin sayı
sıbirden fazla olduğu durumlarda
regresyon
modeli ş
u ş
ekli almaktadı
r.74
Yukarı
daki modelin değiş
kenlerinin tanı
mış
uş
ekildedir.
 Y Bağı
mlıdeğ
iş
ken ,
 X 1 Birinci bağı
msı
z değiş
ken ,
 X2 İ
kinci
bağı
msı
z değiş
ken ,
 0 Modelin sabit katsayı
sı,
 1 X 1 ‘in modediki ağı
rlı
ğı
nıgösteren katsayı,
 2 X 2 ‘nin modediki ağ
ı
rlı
ğ
ı
nıgösteren katsayı,
  Hata terimlerini göstermektedir.
Çoklu regresyon modelinin uygulanabilmesi için bazıvarsayı
mlar
değiş
kenlerin uymasıgerekmektedir.Aksi
takdirde
değiş
kenler ile
modeldeki
regresyon
modeli kurulamamaktadı
r.Bunlar ; 75
 ~ (0, ) , hata terimleri normal dağı
lı
ma uygun olmalı
,
 Cov ( X i , X j ) 0 , bağı
msı
z değiş
kenler arası
nda
hiçbir iliş
ki olmaması
gerekmektedir.
Örnekten hesaplanan regresyon denkleminin verilere uyum düzeyini, dolaysı
yla
denklemin baş
arı
sı
nıölçmede belirleme katsayı
sı R 2 istatistiği kullanı
lmaktadı
r.
Belirleme katsayı
sı
, regresyon denkleminin basarı
sı
nıölçme yanı
nda, denklemin
tahmin gücünü de yansı
tan bir parametre olmasıbakı
mı
ndan modelin , anlamlı
lı
k
74
K.KURTULUŞ,Pazarlama Alı
ş
tı
rmaları,Avcı
ol Yayı
nı,1998 s390.
58
testinden
sonra
gelen en
önemli paremetredir. R 2 istatistiği
ş
u
ş
ekilde
hesaplanmaktadı
r.
rx y rx 2 y 2rx1y rx 2 y rx1x 2
R2  1
2
1 rx2 y
2
2
2
Çoklu regresyon modelinin testide , aynı doğrusal regresyon
modelindeki
gibidir.Hipotezlerin kullanı
mıaynı
dı
r.
H0 : Bağı
msı
z değiş
kenlerle bağı
mlıdeğiş
ken arası
nda iliş
ki yoktur.
H1 : Bağı
msı
z değiş
kenlerle bağı
mlıdeğiş
ken arası
nda iliş
ki vardı
r.
Bu hipotez aş
ağı
da belirtilen F değeri ile test edilmektedir.
k değ
iş
ken sayı
sı, n
istatistiği ile
gözlem sayı
sı olarak
karş
ı
laş
tı
rı
lan
F değeri
durumunda H 0 hiporezi red edilirken
, test
tanı
mlanmı
ş
tı
r . Fk 1,n k 1
istatistiğinden
büyük
F-test
olması
H1 hipotezi kabul edilerek modelin
anlamlı
ğ
ı
na karar verilmektedir.
Regresyon
analizinin
bir
diğer
önemli konusu
ise , regresyon
modelinin
belirlenmesi sürecidir.Bu süreç verilerin bir x-y eksenli bir grafikte dağı
lı
mı
nı
n
ne olduğuna bakı
larak hangi regresyon modelinin uygulanacağı
na karar verilen
bir
süreçtir.Bu
süreçte
kullanı
lan
grafiğe , serpilme
diyagramı
denmektedir.Doğrusal model ve eğrisel model için serpilme diyagramı ş
u
ş
ekildedir.
75
D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s34 .
59
Şekil 2.10.Eğ
risel iliş
kiyi gösteren serpilme diyagramı
Kaynak : D.GUJARATI , Temel Ekonometri , Literatür Yayı
nevi 1999 s17-18
Şekil 2.11.Doğrusal iliş
kiyi gösteren serpilme diyagramı
Kaynak : D.GUJARATI , Temel Ekonometri , Literatür Yayı
nevi 1999 s17-18
Serpilme diyagramı
nda noktaları
n durumu ve genel seyri, iki değiş
ken arası
nda iliş
ki
olup olmadı
ğı
nı ; varsa iliş
kinin ne tür bir fonksiyon tipine uyduğunun
belirlenmesinde yardı
mcıolur.
Serpilme diyagramı, yalnı
z iliş
kinin olup olmadı
ğı
nıve fonksiyonel ş
eklini
göstermekle kalmaz, iliş
kinin derecesi hakkı
nda da bilgi verir. Bunun için, noktaları
n
60
en dı
ş
ta kalanlarıbirleş
tirilerek, bir ş
ekil elde edilir. Söz konusu ş
eklin durumuna göre
iliş
kinin derecesi hakkı
nda tahminde bulunulur. Eğer ş
ekil, oldukça dar bir elipse
benziyorsa, iliş
ki kuvvetlidir. Elips geniş
ledikçe iliş
ki zayı
flamaktadı
r.
Regresyon analizinde tahmin edilen parametrelerin güven aralı
kları
nıheasaplamak
için
ilk
aş
ağı
daki formüllerden
olarak
parametrelerin
standart
hataları
nı
n
hesaplanmasıgerekmektedir.76
(Y Yˆ)
2
i
Sb1 
i
n k
( X
Sb1 , 
erinin standart hatası
dı
r.
1 ‘in tahmini değ
X )
2
i
(Y Yˆ)
2
H
Sb0 H *
i
i
n k
X2
1

n
t örnekleme
( X
i
X )
dağı
lı
mı
na
2
, S b0 ise 0 ’ı
n standart hatası
dı
r.
göre 0 , 1 ’in
güven
aralı
kları ş
u
ş
ekilde
hesaplanmaktadı
r.77
0 Sb0 * tn 2
1 Sb1 * tn 2
76
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s381.
77
M.AYTAÇ , Matematiksel İ
statistik , Ezgi Kitabevi 1999 s345 .
61
0 , 1 ’in güven aralı
kları0.95 güvenle hesaplanmaktadı
r.
2.4.3.6.Zaman serileri analizi
Zaman
serileri
paremetrelerin
analizi , zamana
gelecekteki
bağlı olarak
değerlerini
tahmin
verileri
etmeye
analiz
yarayan
bir
ederek
analiz
tekniğ
idir.Bu analizin regresyon analizinden temel farkı, zaman esası
na göre
verilerin değerlendirmesidir.
Bu zaman serileri , yı
llara göre milli gelirin, istihdamı
n veya ihracatı
n kaydettiğ
i
geliş
me gibi iktisadi zaman serileri olabileceği gibi, bir mağazanı
n aylı
k satı
ş
ları
nı
,
mevsimlere göre sı
caklı
k değ
erlerini veya tı
p veya meteoroloji konularıile ilgili
serilerde olabilmektedirler. İ
ş
letme ve iktisat alanları
nda zaman serilerinin büyük
önem taş
ı
maları
nı
n sebebi, önceki dönemlere ait gözlemlerin incelenmesi ve ileriye
dönük tahmin yapabilmenin mümkün olması
dı
r. 78
Zaman serileri, bir yı
ldan fazla genelde 5, 10 , 15, ve 20 yı
la dayanan uzun dönem
planlama ve tahminleme için kullanı
lmaktadı
r.
Zaman seriler analizi uygulayabilmek için , seriyi oluş
turan bileş
enlerin ayrı
ş
tı
rı
lması
gerekmektedir. Bir seriyi bileş
enlerine ayı
rmak için , kapsadı
ğıdört bileş
en arası
nda
belli bir iliş
ki bulunduğu varsayı
lmalı
dı
r. Bunun için kullanı
lan yöntem , zaman
serisinin birkaç bileş
enini toplamıya da çarpı
mı
ndan meydana geldiği varsayı
mı
dı
r.
Zaman serisi ş
u dört etkiye maruz kalmaktadı
r.79
 Uzun dönemli genel trend (T) ,
 Konjonktür dalgalanmaları(C ) ,
 Mevsimsel dalgalanmalar (S) ,
 Varyasyon ve düzensiz rastgele hareketlerdir. (I)
78
R.S.TSAY ,Analysis Of Financial Time Series ,Wiley publishers 2005 s24.
79
M.SPIEGEL, İ
statistik , Bilim Tekik Yayı
nevi 1995 s225.
62
Bu etki bileş
enleri kullanı
larak elde edilen denklem ş
u ş
ekildedir.
Y = T*C*S*I
Zaman serilerinin amacı, bu dört elemanı
n her birinin aldı
ğ
ıdeğerlerin model
üzerinde ne ölçüde etkili olduğunu araş
tı
rmaktı
r.
Uzun dönemli genel trend (T)
Uzun
dönemli genel trend , olayı
n bağlıolduğu temel ve taş
ı
dı
ğıözellikler
bakı
mı
ndan uzun dönemde çok fazla değiş
mediği için , bu trendlere uzun dönem
genel trendleri denmektedir.
Trend , belirli bir zaman aralı
ğı
nda serinin uzun dönemde belirli bir yöne doğru
gösterdiği geliş
me veya ilerlemedir. Trend analizi bir uzun dönem analizi olduğundan
verilerin
aylı
k veya
mevsimlik
olarak
verilmiş olması tahlilin
sonucunu
etkilemeyecektir.Trendin yön ve ş
iddeti her zaman sabit kalmaz. Trend doğrusal ya da
eğrisel olabilir.Bu tendler ş
uş
ekildedir.80
Artan Doğrusal Trend
Azalan Doğrusal Trend
Azalan Oranda Eğrisel
Artı
ş
Artan Oranda Eğrisel
Azalı
ş
Azalan Oranda Eğrisel
Azalı
ş
Artan Oranda E ğrisel
Artı
ş
Şekil 2.12.Zaman serisi trendleri
Kaynak : http://img92.imageshack.us/img92/2669/zamanserileri1fv0.png 2005.
63
Konjonktür dalgalanmaları(C)
Konjonktür dalgalanmalar , genel
sapmalara
konjonktürel
trend doğrusundan verilerin yapmı
ş olduğu
dalgalanmalar
denmektedir.Bu hareketler mevsim
dalgalanmaları
na benzer ş
ekilde periyodik olarak tekrar etmekte iseler de periyotları
n
uzunluğu ve sürelerin belirsizliği ile dikkati çekmektedir.Konjonktürel dalgalanmalar
aş
ağı
daki grafikte gösterilmektedir. 81
Durgunluk
Gelişme
Tekrar Yükselme
Uzun Dönem Trendi
Kriz
Şekil 2.13.Konjonktürel dalgalanma grafiği
Kaynak : Ö.SERPER,Uygulamalıİ
statistik 2 , Ezgi Yayı
nevi 2000 s329
Mevsimsel dalgalanmalar (S)
Mevsimsel dalgalanmalar ise , ekonomiksel olayları
n zaman içinde izlendiğ
i doğal ve
sosyal nedenlerden dolayı , mevsime göre oluş
an değ
iş
meler mevsimsel
dalgalanmalar olarak adlandı
rı
lı
r. Mevsimsel dalgalanmaları
n dalga uzunluğu 12 ay
olmaktadı
r.Mevsimsel dalgalanmaya
örnek
verilmesi
gerekirse , ekonominin
okulları
n açı
ldı
ğı zamanki hareketliliği gösterilebilir.Mevsimsel dalgalanma
ş
ekildedir.
80
81
82
82
M.SPIEGEL, İ
statistik , Bilim Tekik Yayı
nevi 1995 s474- 483.
Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s331.
D.GUJARATI , Temel Ekonometri , Literatür Yayı
nevi 1999 s709 .
64
ş
u
Dalga Uzunluğu
Dalga Şiddeti
Şekil 2.14.Mevsimsel dalgalanma
Kaynak : Ö.SERPER,Uygulamalıİ
statistik 2 , Ezgi Yayı
nevi 2000 s333
Trendin hesaplanması
nda kullanı
lan yöntemler ş
unlardı
r.83
 Basit grafik yöntemi ,
 Hareketli ortalamalar yöntemi ,
 En küçük kareler yöntemidir.
Basit grafik yöntemi
Bu metoda göre , inceleme konusu olan zaman serisi gözlem sayı
sıitibariyle iki eş
it
kı
sma bölünür ve her kı
sı
mdaki gözlemler için birer aritmetik ortalama hesaplanı
r. Bu
ortalama değerleri grafiğe iş
aretlendikten sonar aralarıbir doğru ile birleş
tirilerek bir
trend doğrusu elde edilir. Tek ve çift sayı
daki örneklemler için , ayrı
m ş
uş
ekilde
olmaktadı
r.
 Seri çift sayı
lıise , seri eş
it olarak tam ortadan iki parçaya ayrı
lı
r.
 Seri tek sayı
lıise , tam ortadaki eleman dikkate alı
nmadan seri iki eş
it parçaya
ayrı
lı
r.
83
M.SPIEGEL, İ
statistik , Bilim Tekik Yayı
nevi 1995 s232- 247.
65
Bu yöntemin uygulanabildiği veriler , doğrusal bir trende sahip olmalarıve her
iki kı
sı
mı
nda da konjonktürel etkilerinin aynıolmasıgerekmektedir.
Hareketli ortalamalar yöntemi
Hareketli ortalamalar yöntemi , konjonktürel ve mevsimsel dalgalanmalarıyok etmek
amacı
yla kullanı
lmaktadı
r.
Hareketli ortalamalar bir zaman serisine ait her değerin yerine, o değ
er ve daha önce
ve sonra gelen birkaç değerin ortalaması
nı
n bu değer yerine yazı
lmasısuretiyle elde
edilen bir zaman serisidir. Örneğin yı
llı
k verilerde üçer yı
llı
k hareketli ortalamalar
hesaplamak istiyorsak, her yı
lı
n değeri bir önceki ve bir sonraki değerlerle toplanarak
üçe bölünür ve bulunan değer fiili değerin yerine konulur. Benzer ş
ekilde daha çok
yı
lıveya aylarıiçine alan hareketli ortalamalar hesaplanabilmektedir.
Hareketli ortalamalar trend hesabı
nı
n sağlı
klıolabilmesi için gerekli koş
ullar
ş
unlardı
r.
 Olayı
n trendi doğrusal olması,
 Serideki dalgaları
n uzunluğu aynıolması,
 Serideki dalgaları
nş
iddeti aynıolmalı,
 Hareketli ortalamalar yönteminin aş
amalarış
unlardı
r.
İ
lk olarak , hareketli ortalama yönteminin uygulama sürecinde dalga uzunlukları
bulunur.Dalga uzunluklarıminimumdan minimuma ya da maksimumdan maksimuma
olan uzaklı
k olarak hesaplanı
r.Daha
sonra
kaçarlı
hareketli
ortalama
hesaplanacağıbulunur.Bunun için kullanı
lan formül aş
ağı
da verilmiş
tir.
KHO = ( Dalga UzunluklarıToplamı
) / (Dalga Sayı
sı
)
Hareketli ortalama sayı
sıtek sayıbulunursa yapı
lan hesaba (n-1) / 2 eleman az alı
nı
r.
Örneğ
in üçerli hareketli ortalama hesaplandı
ğı
nda (3 – 1) / 2 =1 bulunur . Bunun
anlamı
, baş
tan ve sondan birer trend değerinin hesaplanmayacağı
dı
r.
66
Hareketli ortalama sayı
sıçift sayıbulunursa yapı
lan hesaba (n) / 2 eleman az alı
nı
r.
Dörderli hareketli ortalama bulunduğunu varsayarsak 4/2 = 2 elde edilir. Bu sayı
,
baş
tan ve sondan ikiş
er trendin hesaplanmayacağ
ı
nıgösterir.Üçerli hareketli
ortalamalar ile trend değerleri ş
u ş
ekilde hesaplanı
r.
Tablo 2.2. Hareketli ortalamaları
n hesaplanma yöntemi
Yı
llar
Değerler
1990
Üçerli hareketli ortalamalarla trend değerleri
Y1
Y2 = (Y1+ Y2+Y 3) / 3
1991
Y2
Y3 = (Y2+ Y3+Y 4) / 3
1992
Y3
...
....
1995
Y6
1996
Y7
.
Y7 = (Y 6+ Y7+Y 8) / 3
.
Hareketli
ortalamalar
…
yöntemiyle
hesaplayarak
trend
aş
ağ
ı
daki
gösterilmektedir.
25
20
TREND
15
10
5
0
84
86
88
90
92
94
Şekil 2.15.Hareketli ortalama yöntemiyle oluş
turulan trend
Kaynak : M.SPIEGEL , İ
statistik , Bilim Teknik Yayı
nevi 1995 , s473
67
96
98
ş
ekilde
Hareketli ortalamalar için gerekli ş
artlar sağlanamazsa, doğru sonuçlar elde
edilmez.Hareketli ortalamalar tekniği ile
elde edilen sonuçlar serideki uzun ve
ş
iddetli dalgaları
n etkisi altı
ndadı
r. Serinin baş
ı
ndaki ve sonundaki bazıelemanları
n
hareketli ortalamasıbulunamaz.
En küçük kareler yöntemi
Bu yöntem , zaman ile sonuçlar arası
ndaki fonksiyonel iliş
kiyi ortaya çı
karmaktadı
r.84
Trendi en iyi tanı
mlayacak fonksiyon tipinin seçilmesi için veriler X ekseni zaman
olmak üzere
bir diyagrama
fonksiyonu
aktarı
lı
r.Oluş
turulan
diyagrama bakı
larak trendin
çalı
ş
ı
lı
r.Trend
fonksiyonları ş
u ş
ekillerde
belirlenmeye
85
olabilmektedir.
 Doğrusal Denklem ( Y = a + bX ), bu eş
itlik genelde artma ve azalmalarısabitlik
gösteren seriler için kullanı
lı
r.
 Parabol Denklemi (Y = a + bX + cX2) , bu eş
itlik, yükselmeyi alçalmanı
n takip
ettiği yön değ
iş
tirmeyi veren veriler için kullanı
lı
r.
 Üstel Denklem (Y = a.bX) , bu denklem, artma yada azalma oranısabit olan
serileri hesaplamayısağlar.
 Hiperbol Denklemi ( 1 / Y = a + bX)
 Kübik Denklem (Y = a + bX + cX2 + dX3) , serinin grafiğinde alçalma ve
yükselmeleri içeren iki bükülme varsa kullanı
lı
r.
 Geometrik Denklem( Y = a . Xb)
Yukarı
daki denklemlerde kullanı
lan parametreler ş
unlardı
r.
84
Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s340.
68
Y : Değ
erler ,
X : Yı
llar ,
a, b, c : Modelin katsayı
ları
nıtemsil etmektedir.
Doğrusal denklem yöntemi kullanı
larak trend ş
u ş
ekilde hesaplanı
r.
Y na bX
XY a X bX
2
Seri tek sayı
da ise , zaman bloğunda, tam ortadaki değer orijin olarak alı
narak, sı
fı
r
değeri konur. Bundan öncekilere -1,-2,-3, vb; sonrakilere ise +1, +2, +3 değeri verilir.
Seri çift sayı
da ise , zaman sütununda tam ortadaki iki değerden büyük olana +1,
küçük olana – 1 değeri verilerek +3, +5 , ... ve -3, -5, ... konularak iş
leme devam
edilir.Doğrusal denklem yöntemi kullanı
larak standart hataş
u ş
ekilde hesaplanı
r.86
n ≥30 ise
n < 30 ise
Formül;
Y Y 2
S yx 
Y Y 
' 2
S yx 
n 2
n
Formül ;
S yx 
85
Y
2
a Y bXY
S yx 
n 2
Y
2
a Y b XY
n
B,KEDEM ,Regression Models For Time Series Analysis , Wiley Publishers 2002 s1-4.
69
Syx : Tahminin standart hatası
nı,
Y : Bağı
mlıdeğ
iş
kenin gözlenen değerini ,
Y’ : Bağı
mlıdeğ
iş
kenin modelden hesaplanan değerini ,
n : Gözlem sayı
sı
nı,
a ve b : model katsayı
larıolarak
ifade etmektedir.
Parabol denklem için (Y = a + bX + cX2 ) a, b, c katsayı
larış
u yöntemle hesaplanı
r.
Y na b X c X
XY aX b X c X
X Y aX b X c X
2
2
2
2
3
3
4
n : Trend periyodundaki zaman öğesinin sayı
sı
nı
,
Y : Zamana göre serinin değerini ,
X : Zamanıtemsil eder.
Parabol denklem yöntemi kullanı
larak standart hatanı
n hesabı
n ≥30 ise
n < 30 ise
Formül ;
Y Y 
2
S yx 
Y Y 

' 2
S yx 
n 3
n
Formül ;
S yx 
Y
2
aY bXY
S yx 
n 3
Y
Syx : Tahminin standart hatası
nı,
86
Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s348-349.
70
2
aY bXY
n
Y : Bağı
mlıdeğ
iş
kenin gözlenen değerini ,
Y’ : Bağı
mlıdeğ
iş
kenin regresyondan hesaplanan değerini ,
n : Gözlem sayı
sı
nı,
a ve b : Regresyon katsayı
ları
nı ifade etmektedir.
Üstel denklem için (Y = a.bX ) , bağı
mlıdeğiş
kene iliş
kin veriler, logaritmik duruma
getirilirse doğrusal iliş
ki ş
u ş
ekilde olur. 87
log Y’ = log a + X log b
log Y’ : Bağı
msı
z değiş
ken için trend değerinin logaritması
nı
,
log a : X = 0 durumunda log Y’ nin değerini,
log b : Trend doğrusu eğrisinin logaritması
nı,
X
: Bağı
msı
z değiş
keni ifade eder.
a ve b katsayı
larış
u formüllerden hesaplanı
r.
logY nloga
XlogY X .log
log Y n log a X log b
XlogY X log a X
2
2
log b
log a 
logY / n
log b 
X log Y / X 2
Mevsim dalgalanmalara bakı
ldı
ğı
nda , mevsimsellik ş
u ş
ekilde ölçülmektedir.Bir
seride iklim ve sosyal sebeplerden dolayı
, her yı
l düzenli olarak tekrar eden periyodik
değiş
meler
“mevsim
dalgalanmaları
” olarak
adlandı
rı
lmaktadı
r.Mevsimselliğ
i
hesaplamak için ilk önce ş
u düzeltme yapı
lmalı
dı
r.Aylı
k verilerin gün sayı
sı
na göre
ayarlanmasıgerekmektedir.
Düzeltme Faktörü = (Ort.Bir Aydaki Gün Say.)/ (O Aydaki Gerçek Gün S.)
Ortalama bir aydaki gün sayı
sı;
87
B,KEDEM ,Regression Models For Time Series Analysis , Wiley Publishers 2002 s62.
71
Normal Yı
llarda : (365)/12=30,41667
Artı
k Yı
llarda
: (366)/12=30,5
Normal Bir yı
l için Düzeltme Faktörü Hesaplanması
Şubat Ayıiçin:
D.F. = (30,41667)/28=1,08631
30 günlük Ay için:
D.F. = (30,41667)/30=1,013889
31 günlük aylar için: D.F. = (30,41667)/31=1,981183
Mevsim dalgalanmaları
nı
n ölçülmesinde kullanı
lan yöntemler aş
ağı
da belirtilmiş
tir.88
 Genel ortalamayıoranlama yöntemi ,
 Trende oranlama yöntemi ,
 Hareketli ortalamalar yöntemidir.
Genel ortalamayıoranlama yöntemi
Bu yöntemde her ayı
n aritmetik ortalamasıbulunur. Daha sonra bu aritmetik
ortalamalardan
genel
aritmetik
ortalama
hesaplanı
r.
Bu
yöntem
ş
öyle
formüllenmektedir.
GOOY = ( Ŷaylık/Ŷgenel).100
(GOOY ) Genel ortalamayıoranlama yöntemi ,
Ŷgenel :ΣŶaylı
k/12 dir.
Bu yöntemde trendin durgun olduğu varsayı
lmaktadı
r. Halbuki ekonomik zaman
serilerinin çoğunlukla bir hareketli bir trendi vardı
r.Bu yöntemle elde edilen sonuçlar,
hem mevsimin hem de trendin ortak ölçüsünü vermektedir.
88
Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s363-372.
72
Trende oranlama yöntemi
Trende oranlama yöntemiyle mevsimin indeksi bulunarak seride ilk olarak trendin
etkisi giderilir.En küçük kareler yöntemiyle elde edilen trend denklemiyle trend
değerleri Ŷaylık hesaplanı
r.
Trendin etkisi ş
uş
ekilde ortadan kaldı
rı
lı
r.
[ (Ŷaylı
k)/ (Ŷ’aylı
k )] . 100
n yı
lı
nı
n ayları
na iliş
kin oranları
n aritmetik ortalamasıhesaplanı
r.Mevsim indeksi
değerini veren S’ lerin toplamı
n 1200 olmasıistenir. 1200 olmadı
ğı
nda düzeltme
faktörü kullanı
lı
r.Trende oranlama yöntemi dezavantajlarıise , mevsim ineksinin
belirlendiği aylı
k değerlerde, ekonomiksel zaman serilerine etki eden dört faktöründe
etkisi mevcuttur. Trende oranlama yönteminde, gerçek değerleri trende oranlamakla,
trendin etkisi giderilir.
(Yaylı
k/Yaylı
k) – ( T )( C )( S )( I ) / ( T ) = ( C ) ( S ) ( I )
Hareketli ortalamalar yöntemi
Mevsim indeksinin hesaplanması
nda en iyi yöntem hareketli ortalamalar yöntemidir.
Mevsimsel dalgalanmaları
n dalga boyu 12 olmasınedeniyle 12 ş
erli hareketli
ortalamalarla trend değerleri bulunulur.89
[ (Ŷaylı
erlerin mevsimin etkisiyle hangi
k)/ (Ŷ’aylı
k )] . 100 formülü ile gerçek değ
oranda değiş
tiği hesaplanabilmektedir.
Değ
iş
ik yı
llara ait aynıay oranları
nı
n aritmetik ortalamasıhesaplanı
r.
ΣS’ ≠1200 ise düzletme faktörüyle S’lerin ayarlanmasıgereklidir.
89
D.GUJARATI , Temel Ekonometri , Literatür Yayı
nevi 1999 s737.
73
12
D.F 
1200
/ S
i
1
S 
S

D.F .
Konjonktürel dalgalanmaları
n ölçülmesinde ise iki hesaplama yöntemi kullanı
lı
r.
 Yı
llı
k serilerde konjonktürün ölçülmesi ,
 Aylı
k serilerde konjonktürün ölçülmesidir.
Yı
llı
k serilerde konjonktürün ölçülmesi
Yı
llı
k seriler üzerinde mevsimin etkisi söz konusu değildir. Bundan dolayıüç
faktörün sonucu olan gerçek değerler trend değerlerine bölündüğünde, trendin etkisi
giderilecektir. Kalan kı
sı
m, konjonktürel ve düzensiz hareketler faktörlerinin etkisini
verir.
( Y / Y’ ) = [( T )( C )( I ) / ( T ) ] = ( K ) ( I )
( K ) ( I ) = [ ( Y ) / ( Y’ ) ] . 100
Bu eş
itlikte konjonktürün önceki periyotlardaki etkisi hesaplanabilir. Ancak
konjonktürün gelecekteki etkisini tahminlemek mümkün değildir.
Aylı
k serilerde konjonktürün ölçülmesi
Aylı
k serilerde konjonktürün ölçülmesi iki aş
amada gerçekleş
tirilir.
İ
lk aş
amada , aylı
k serilerde konjonktür dalgalanmaları
nı
n etkisini belirleyebilmek
için , ilk olarak aylı
k trend değerleri ilgili ayları
n mevsim indeksleri ile çarpı
larak her
ay için konjonktürün etkisini içermeyen normal değerleri hesaplanı
r.90
(Y’aylı
k)(S)
90
Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000 s373.
74
İ
kinci aş
amada ise , gerçek değerler, normal değerlere bölünerek oran ş
eklinde ifade
edilir.
K. I = [ ( Y aylık ) / ( Y’aylık ) ( S ) ] . 100
Böylelikle her ay gerçek değerlerin konjonktürel etki nedeniyle normalden ne kadar
saptı
ğıbelirlenmişolur.
2.4.4. Kümeleme Analizi
Kümeleme
analizinde , sı
nı
flandı
rma iş
lemini önceden belirten sı
nı
flar ya da
kriterler yoktur.Analiz
sonucunda ortaya çı
kan kümeler benzerliklerine
göre
oluş
turulmuş
tur.Veri kümesinin sı
nı
flandı
rma iş
lemleri ş
unlardı
r.
Sı
nı
flandı
rma
Özel Olmayan
Özel
Gözetimli
Gözetimsiz
Hiyerarş
ik
Kümeleme
Bölümleyici
Kümeleme
Şekil 2.16.Sı
nı
flandı
rma ağ
acı
Kaynakça : H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. s 330-38, 1996
Sı
nı
flandı
rma yapı
sı
ndaki ilk
ayrı
m , özel (Exclusive)
- özel
olmayan
(Nonexclusive) olarak ayrı
lmaktadı
r.Özel sı
nı
flandı
rmada , her veri yalnı
zca bir
gruba aittir.Özel olmayan sı
nı
flandı
rmada ise , bir veri birden fazla gruba ait
olabilmektedir.İ
kinci sı
nı
flandı
rmada
ise , gözetimli (Supervised) – gözetimsiz
75
(Unsupervised) olarak yapı
lmaktadı
r.Gözetimli sı
nı
flandı
rmada
veriler önceden
tanı
mlı ve etiketlenmişolarak yapı
lı
rken ; gözetimsiz sı
nı
flandı
rmada herhangi
bir
etiket
olmaksı
zı
n
verilerin
yakı
nlı
k
matrisine
göre
sı
nı
flandı
rmaktadı
r.Kümeleme analizi bu sı
nı
flandı
rma ağacı
na göre , Özel –
Gözetimsiz bir sı
nı
flandı
rma analizidir.91
Kümeleme analizinde , kümleri gruplamamı
za yardı
mcıolan
en önemli
araç
Benzerlik matrisidir (Proximity Matrix). Benzerlik matrisi, matris ekseni sı
fı
r
değerinden oluş
an d ij değerleri kümlerin birbiriyle olan iliş
kilerini gösteren bir
matristir. dij değerleri , sı
fı
ra
benzerlikleride
yakı
n pozitif
değer aldı
ğı
nda
bir
o kadar artmaktadı
r. Benzerlik
kümelerin
matrisi aş
ağı
daki
ş
ekilde
gösterilmektedir.92
Şekil 2.17.Benzerlik matrisi
Benzerlik matrisinin elde edilme sürecine bakı
ldı
ğı
nda , veri ölçeklerine göre
farklı
lı
k gösterdiği görülmektedir.Veri ölçeklerine
bakı
ldı
ğı
nda
ise iki ana
baş
lı
kta toplanmaktadı
rlar.Veri Ölçekleri ş
ekil 2.18 ‘de gösterilmektedir.
91
M. DEMİ
RALAY ,Hiyerarş
ik Kümeleme Metotlarıİ
le Veri Madencili ğ
i , Yüksek Lisans Tezi,
Marmara Ünv. ,2005
76
Veri Ölçekleri
Nicel
Niteleyici Ölçekler
Ölçekler
Nominal Ölçekler
Ordinal Ölçekler
Aralı
k
Oran
Ölçekler
Ölçekler
Şekil 2.18.Veri ölçeleri sı
nı
flandı
rması
Kaynak : M.SPIEGEL, İ
statistik , Bilim Tekik Yayı
nevi 1995 s14
Veri ölçekleri ş
öyle sı
ralanabilir.93
Nominal Ölçekler
En az kı
sı
tlıancak en güçsüz ölçeklerdir.Bu ölçeklerde matematiksel iş
lemler
yapı
lamazlar.Ölçek
yalnı
zca
bir
kategori
göstergesi
kullanı
lmaktadı
r.Ayrı
ca nominal ölçeklere uygulanan istatistiksel
olarak
analizlerde
oldukça kı
sı
tlı
dı
r.
Ordinal (Sı
ralı
) Ölçekler
Nominal ölçeklerden daha güçlü ölçeklerdir.Bu ölçeklerin esas niteliği sı
ralayı
cı
bir ölçek olması
dı
r.Ordinal ölçeklerin en çok kullanı
ldı
kları durumlar
insan
davranı
ş
ları, eğilimleri , tercihleri gibi subjektif konulardı
r.Ayrı
ca bu ölçekteki
verilere kı
sı
tlıbir istatistiksel analiz uygulanabilmektedir.
92
93
K.KURTULUŞ,Pazarlama Alı
ş
tı
rmaları,Avcı
ol Yayı
nı,1998 s495.
H.ARICI , İ
statiksel Yöntemler ve Uygulamaları, Hacettepe ünv. Yayı
nları1998 s14-19.
77
Aralı
k Ölçekler
En önemli ölçekler arası
ndadı
r.Bu ölçekler
rağmen , ölçü biriminin
baş
langı
ç noktasıkeyfi seçilmesine
sabit olmasıen önemli özelliğidir.Ayrı
ca ölçeklenen
verilerin aralı
kları
nı
n bir birinin katıolmasıdiğ
er önemli bir özelliğidir.
Oransal Ölçekler
En güçlü ölçeklerdir.En önemli özellikleri baş
langı
ç noktası
nı
n ve ölçü biriminin
değiş
memesidir.Bu ölçekle ölçeklenen veriler birbirlerinin katıolabilmektedir.94
Benzerlik matrisini elde etme yöntemini seçerken , veri kümesinin hangi
ölçekle ölçeklendirildiğinin önemli olduğu bilinmektedir.Bu anlamda nicel ölçekler
ve nitel ölçekler için benzerik matrisi ş
uş
ekilde hesaplanmaktadı
r.95
Nicel Ölçek için Minkowski Uzaklı
ğıolarak bilinen bir yöntem kullanı
lmaktadı
r.
1/ 
d (x i x j ) 
; 1
k1|x ik x jk |


p
formülünden
elde edilmektedir. 1 için bu formül Manhattan City –Block
Uzaklı
ğ
ıolarak bilinen formule dönüş
mektedir.Bu formul ş
uş
ekildedir.
p

d1 (x i x j ) 

 k 1|x ik x jk | ; 1
Nitel Ölçekli veriler için dij ‘leri hesaplamakta Bhattacharyya uzaklı
ğıformulü
kullanı
lmaktadı
r.Bu formül ;
1
p
d (x i x j )  
w |x x jk | 


p  k 1 k ik
94
95
K.KURTULUŞ,Pazarlama Alı
ş
tı
rmaları,Avcı
ol Yayı
nı, s 338-346 ,1998
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996.
78
1
wk 
m
m k’nı
ncıdeğiş
kenin dağı
lı
m aralı
ğ
ı
dı
r.
Bu yöntemin kullanı
lmasıiçin bazıkoş
ulları
n sağlanmasıgerekmektedir.Bunlar ;
 d (x i x j ) d (x j x i ) simetri özelliği ,
 d (x i x j ) 0 negatif olmama özelliği ,
 d (x i x j ) 0 ise i j tanı
m özelliği,
 d (x i x j ) d (x i x l ) d (x l x j ) üçgen eş
itsizliği özelliği bulunmalı
dı
r.96
Kümeleme
bakı
ldı
ğı
nda ise , ş
u
analizinin metadolojisine
aş
amalarda
97
gerçekleş
mektedir.
 Örgütsel sunum özellik seçme ,
 Örgütsel yakı
nlı
k ölçüsü tanı
mlama ,
 Kümeleme ,
 Veri soyutlama ,
 Sonuçlarıdeğelendirme süreçleridir.
2.4.4.1.Kümeleme Metodları
Kümeleme analizinde kullanı
lan kümeleme metotlarıiki ana baş
lı
k altı
nda
toplanmaktadı
r.Bunlar ;
 Hiyerarş
ik metodlar ,
 Bölümeyici metodlardı
r.
96
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. s 330-342, 1996.
79
Kümeleme Metodları
Hiyerarş
ik Metodları
Tek Bağlantı
lı
Hataları
n Karesi
Bölümleyici Metodları
Tam bağlantı
lı
Karı
ş
ı
m Çözücü
Grafik Teorik
K-Means
Yön Arayı
cı
Beklenti Arttı
rı
mı
Şekil 2.19.Kümeleme metodlarıhiyerarş
isi
Kaynak : H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. s 336-339 ,1996
Hiyerarş
ik Metodlar
Bu metotta , baş
langı
çta herbir veri bir kümeyken analizin sonunda tüm veriler
bir küme oluş
tururlar.Hiyerarş
ik metodları
n süreçleri ş
u ş
ekilde açı
klanabilir. 98
 n tane birey n tane küme ile iş
e baş
lanı
r.
 En yakı
n iki küme ( d ij değeri en küçük olanlar ) birleş
tirilir.
 Küme sayı
sıbir indirgenerek yinelenmişuzaklı
klar matrisi bulunur.
 İ
lk iki adı
n n-1 kez tekrarlanı
r.
97
98
W.Hardle , Multivariate Statistics:Exercises And Solutions , Springer Publishers 2007 s210.
N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s523-530.
80
Bölümleyici Metodlar
Bu metodlar
hiyerarş
ik metodlardan daha güçlü tekniklerdir.Bu tekniker n tane
veriden oluş
an
veri
kümesini
k tane kümelere
ayı
ran metodlardı
r.Benzerlik
matrisindeki değerlere göre benzerliklerine göre gruplarlanı
rlar.
Kümeleme analizinin
son
aş
aması olarak ,
küme
sayı
sı
nı
n belirlenmesi
gerekmektedir.Bunun için kullanı
lan formul pek güvenilir olmamakla beraber
pratikte
çok sı
k kullanı
lmaktadı
r.Küme
sayı
sı
nı
n hesaplanacağ
ı formül
ş
u
ş
ekildedir.
k (n / 2) 1/ 2
k : küme sayı
sı,
n : veri kümesindeki veri sayı
sı
dı
r.
2.4.5. Sı
radı
ş
ı
lı
k Analizi
Sı
radı
ş
ı
lı
k analizi , veri kümesinde oluş
an aykı
rı gözlemi tespit etmek için
kullanı
lan
konularda
bir
en
analiz
baş
ta
türüdür.Özellikle
kullanı
lan
analiz
sahtekarlı
k ve
yöntemidir.Bu
dolandı
rı
cı
lı
k gibi
analiz
iki
teknikten
oluş
maktadı
r.99
 İ
statistiksel tabanlıyöntem ,
 Yoğunluk tabanlıyöntemdir.
İ
statistiksel yöntem , temel istatistik parametrelerindeki aykı
rı
lı
ğıgözönüne alarak
aykı
rıgözlemi tespit etmeye çalı
ş
ı
rken , yoğ
unluk tabanlıyöntemde ise
ekseni üzerinde dağı
lan bir grafik ş
eklinde analiz yapı
lmaktadı
r.
99
http://www.togaware.com/datamining/survivor/Outlier_Analysis.html 2007.
81
x-y
2.5.VERİMADENCİ
Lİ
Ğİ
NDE KULLANILAN Dİ
ĞER ANALİ
Z TEKNİ
KLERİ
Veri madenciliği sürecinde uygulanan bir çok
teknik
olması
na
karş
ı
n veri
madenciliğinde kullanı
lan istatistiksel teknikler ş
unlardı
r.100
 Faktör analizi ,
 Kanonik korelasyon analizi ,
 Lojistik regresyon analizi ,
 Çok boyutlu ölçekleme olarak tanı
mlayabiliriz.
2.5.1. Faktör Analizi
Çok değiş
kenli bir istatistik analizi olan faktör analizi , verileri özetleyen ve
daha
anlamlı bir
halde
yorumlamamı
za
olanak
tanı
yan
analizdir.Değiş
kenlerin arası
ndaki iliş
kileri araş
tı
rarak özet bilgiye
bir
ulaş
ma
imkanıvermektedir.
Değ
iş
kenlerin ya da verilerin birbirleriyle
olan bağlı
lı
kları
nıortadan kaldı
rmak
için kullanı
lan en yaygı
n analizlerden biridir.Değiş
ken bağı
mlı
lı
kları
nı ortadan
kaldı
rarak daha sağlı
klıbir veri seti oluş
turulması
na imkan vermektedir.101
Faktör analizi kullanı
m amaçları
na
bakı
ldı
ğı
nda , iki temel amaç
ön plana
çı
kmaktadı
r.Bunlar ;
 Değ
iş
ken sayı
sı
nıazaltmak ,
 Değ
iş
kenler arası
ndaki iliş
kiden yararlanarak bazıözel yapı
lar ortaya çı
karmaktı
r.
100
M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley &
Sons Publishers 2003 s82.
101
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s167.
82
Kullanı
ldı
ğıyerlere bakı
ldı
ğı
nda ise esas olarak , tüketici eğilimleri, davranı
ş
ları
,
tüketici karakteristiklerinin ortaya çı
karı
lmasıiçin kullanı
ldı
ğıbilinmektedir.
Faktör analizinde faktörlerin belirlenmesi için birçok yöntem kullanı
lmaktadı
r. Bunlar
kullanı
m sı
klı
kları
na göre ş
uş
ekilde sı
ralanabilir;102
 Temel Bileş
enler Yöntemi ,
 En Çok Olabilirlik Yöntemi ,
 Ağı
rlı
ksı
z En Küçük Karaler Yöntemi ,
 Genelleş
tirilmişEn Küçük Kareler Yöntemi ,
 Ana Eksen Faktörizasyonu Yöntemi ,
 Alfa Faktörizasyon Yöntemi ,
 İ
mge Faktörizasyonu Yöntemidir.
Bu yöntemler içinde en yaygı
n kullanı
lan yöntemler ise , temel bileş
enler analizi
ve en çok olabilirlik yöntemidir.
Faktör analizi kullanı
lma koş
ulları
na bakı
ldı
ğı
nda ise , gerek maliyet
gerekse
iş
lem zorluklarınedeniyle profesyonel uygulamalara ihtiyaç duymaktadı
r.
Yöntemin ana amacı
, fazla sayı
daki değ
iş
kenlerin gruplanarak faktör değiş
kenler
olarak ifade edilip edilemeyeceğinin belirlenmesi ve bu mümkün ise hangi
değiş
kenlerin hangi faktör içinde yer alacağı
nı
n bulunması
dı
r.
Bu sayede araş
tı
rmacıfaktörler içine dahil edilen değiş
kenleri inceleyerek ilgili
faktörün ne anlam ifade ettiğini yorumlayabilecektir. Faktör analizinin algoritması
kı
saca aş
ağı
daki ş
ekliyle ifade edilebilir.103
102
103
N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s496.
W.Hardle , Multivariate Statistics:Exercises And Solutions ,Springer Publishers 2007 s185-188.
83
Denklem 1’de verilen çoklu doğrusal regresyon denkleminde x1x 2 x3 ...xn ile ifade
edilen değiş
ken sayı
sı
nı
n fazla olması
, bağı
ntı
nı
n karmaş
ı
klı
ğı
nıarttı
rmakta ve
kullanı
mı
nıçoklu doğrusallı
k nedeniyle güçleş
tirmektedir. Faktör analizi sonucunda
belirlenen k sayı
da faktör, F1F2 F3 ...Fk kullanı
larak ifade edilen çoklu doğ
rusal
regresyon iliş
kisi denklem 2’de verilmektedir. Burada her faktör denklem 1’de verilen
x1 x2 x3 ... xn değiş
kenlerinin bir fonksiyonu olarak faktör katsayı
ları( Wk 1Wk 2Wk 3...Wkn )
yardı
mı
yla denklem 3’de verildiği ş
ekliyle ifade edilmektedir.
Faktör analizinin etkin olabilmesi için ‘k’ faktör sayı
sı
nı
n mümkün olduğunca ‘n’
parametre sayı
sı
ndan küçük olmasıgerekmektedir (k<n). Aksi takdirde faktör analizi
değiş
ken sayı
sı
nıazaltamayacağ
ıiçin faktör analizi uygulanamaz.Faktör analizi iki
aş
amada uygulanmaktadı
r.104
 Değ
iş
kenlerin faktör grupları
nıoluş
turmaya uygun olup olmadı
kları
nı
n tayini,
 Faktörlerin belirlenmesi ve faktör skor katsayı
ları
nı
n ( Wk 1Wk 2Wk 3...Wkn ) hesabı
dı
r.
Değ
iş
kenler faktör gruplarıiçine dahil edilemiyorsa, faktör analizinin kullanı
mıda
mümkün değ
ildir. Bu durum, ilk aş
amada faktör analizi için uygunluk kriterleri ile
araş
tı
rı
lmaktadı
r.
Faktör analizinin ikinci aş
aması
nda değiş
kenlerin ait olduğu faktör grupları
na karar
verilmektedir. Faktör sayı
sıAsal Bileş
en Analizi ile belirlenmektedir. Bu yöntemde
bağı
msı
z değiş
kenlerin varyanslarıayrıayrıbelirlendikten sonra, toplam varyansı
büyük oranda (>%70) temsil eden değiş
ken sayı
sıkadar faktör seçilmektedir.
Asal Bileş
en Analizi faktör analizinden bağı
msı
z bir teknik olup, ana kullanı
lı
ş
amacı
, regresyona dahil edilecek ve çoklu doğrusallı
ğa yol açabilecek bağı
msı
z
değiş
kenlerin teş
his edilmesidir. Bu teknik , özellikle iş
lem verimliliği açı
sı
ndan diğ
er
benzer tekniklere göre üstünlük arz ettiğinden bilgisayar uygulamaları
nda hesap
süresini azaltmaktadı
r.
104
L.L.HARLOW , The Essence Of Multivariate Thinking : Basic Themes And Methods, LEA
Publishers 2005 s222-223.
84
Ayrı
ca k faktör sayı
sı
nıbelirlemek için varyans analizine dayalış
u yöntemler
kullanı
lmaktadı
r.105
 Temel Eksen faktörü ,
 En Çok Olabilirlik Tekniği ,
 Ağı
rlı
ksı
z En Küçük Kareler ,
 Genelleş
tirilmişEn Küçük Kareler ,
 image faktörü,
 alpha faktörüdür.
Her bağı
msı
z değ
iş
kenin seçilen faktörler cinsinden aş
ağı
daki denklemde verilen
doğ
rusal regresyon denklemleri kurulmaktadı
r.
Seçilen faktörlere karş
ı
lı
k gelen bağı
msı
z değiş
kenler ise ,
faktör ağı
rlı
kları
nıifade etmektedir.
Denklem 4’te her faktörün  katsayı
sı
, aynızamanda faktör ile xi değiş
keni
arası
ndaki korelasyon katsayı
sı
nıvermektedir. Korelasyon katsayı
sıya da faktör
ağı
rlı
kları
nı
n karelerinin toplamı xi değiş
keninin kullanı
lan faktörlerle
edilebilen toplam varyans yüzdesini ya da katkıdeğ
erini ifade etmektedir.
105
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv.
1996 s171.
85
temsil
Aş
ağı
daki formül katkıdeğeri hesaplamak için kullanı
lı
r.
Katkıdeğ
erleri , 0 ile 1 arası
nda bir değer almaktadı
r. Katkıdeğeri düş
ük olan
değiş
kenlerin, belirlenen faktörlerle bir iliş
kilerinin olmadı
ğıkabul edilerek, faktör
analizinde kullanı
lmamalarıve regresyon denklemine bağı
msı
z değiş
kenler olarak
dahil edilmeleri gerekmektedir. Her bir bağı
msı
z değiş
kenin x1x 2 x3 ...xn hangi faktör
altı
nda yer aldı
ğıkorelasyon katsayı
ları
na ya da faktör ağı
rlı
kları
na bakı
larak karar
verilmektedir.İ
deal olarak her değiş
kenin en fazla bir faktör ile yüksek bir korelasyon
katsayı
sıvermesi istenir. Ancak korelasyon matrisine bakı
ldı
ğ
ı
nda , kimi değiş
ken
birden fazla faktöre dahilmişgibi algı
lanabilmektedir. Bu gibi durumlarda ortogonal
döndürme tekniği kullanı
larak döndürülmüş korelasyon matrisi elde edilir.
Döndürülmüşkorelasyon matrisi sayesinde , her değiş
kenin kesin olarak hangi faktör
altı
nda yer aldı
ğıkolayca
döndürme
algı
lanabilmektedir. Döndürme teknikleri ortogonal
ve eğimli açıile döndürme olmak üzere iki farklıteknik ile ele
alı
nabilmektedir. Bu çalı
ş
mada ortogonal döndürme tekniği , birbirinden tamamen
bağı
msı
z faktör gruplarıoluş
turmasınedeniyle tercih edilmiş
, ileride lineer regresyon
analizine giren bu faktörler arası
nda çoklu doğ
rusallı
k olmasıengellenmiş
tir. Bu
durumda, eğimli açıile döndürme tekniğinin parametreler arası
nda kı
smi bir iliş
ki
olduğunun varsayı
labildigi durumlarda kullanı
lmasıdaha uygundur. 106
Faktör analizinde son aş
ama, denklem 3’te verilen Wk1Wk 2 Wk 3 ...Wkn faktör skor
katsayı
ları
nı
n hesaplanmasıve böylece faktör değerlerinin belirli hale getirilmesi
gerekmektedir.Faktör analizinden elde edilen faktörler ve bu
bulunmayan
bağı
msı
z
değiş
kenler
tahminleme
faktörlerle iliş
kisi
modelinin
kurulması
nda
kullanı
lmaktadı
r.Kurulan tahminleme modeli ,
Ytah min 1 F1 2 F2 ... k 1 Fk 1 ... k n Fk n U dir.
106
W.Hardle , Multivariate Statistics:Exercises And Solutions ,Springer Publishers 2007 s186-188.
86
Burada F1 , F2 , F3 ,..., Fk faktör analizinden hesaplanan faktör değerlerini,
xk 1 , xk 2 , xk 3 ,..., xk n
ise faktör analizinde iliş
kisi bulunamamı
ş bağı
msı
z
değiş
kenleri ifade etmektedir. Faktörlerin etki değerleri, 1 , 2 , 3 ,..., k 1 katsayı
ları
ile, bağı
msı
z parametrelerin etki değerleri ise k 1 , k 2 , k 3 ,..., k n katsayı
larıile
temsil edilmektedir.
Faktörler içinde yer alan değ
iş
kenlerin etkinlik düzeyleri aş
ağı
daki adı
mlar dahilinde
belirlenebilmektedir.
İ
lk olarak , faktör skor matrisi kullanı
larak her bir değ
iş
kenin faktör skor katsayı
ları
toplanmaktadı
r.Aş
ağı
daki ş
ekil skorlamanı
n nası
l yapı
ldı
ğıgöstemektedir.
Tablo 2.3.Skorlama katsayı
sımatrisi hesaplanması
Kaynak : H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s199
İ
kinci olarak , incelenen değiş
kenin her faktöre katkı
sı
, Wij/.Wnj oranı
ndan
hesaplanmaktadı
r.
Tablo 2.4. Değiş
kenlerin faktöre katkıoranlarıhesaplanması
Kaynak : H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s199
87
Son aş
ama olarak denklem 6’dan elde edilen her faktör için beta katsayı
ları
, ‘ß1, ß2,
ß3,......, ßk’, ile Wij/.Wnj oranları
nı
n çarpı
mları
nı
n toplamı değiş
kenin etki puanı
olarak hesaplanmaktadı
r.
Tablo 2.5.Değiş
ken etki puanları
nı
n hesaplanması
Kaynak : H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s199
Değ
iş
ken etki puanlarıx1etki , x 2etki , x 3etki , ..., x netki ‘çok etkili’, ‘etkili’, ‘az etkili’ ve
etkisiz’ olmak üzere dört ayrıkategoride değerlendirilmektedir. Bu sı
nı
flamada
‘etkili’-‘az etkili’ sı
nı
rıt-dağı
lı
m testinden belirlenmektedir. ‘çok etkili’-‘etkili’ ve ‘az
etkili’-‘etkisiz’ sı
nı
rlarıise t testinden elde edilen sı
nı
r değerinin altı
nda ve üzerinde
kalan değerlerin ortanca değerleri hesaplanarak elde edilmektedir.
Kullanı
lan parametrelerin tanı
mlarıaş
ağı
da belirtilmiş
tir.
88
Faktör analizi, birbirleriyle iliş
kili veri yapı
ları
nıbirbirinden bağı
msı
z daha az sayı
da
yeni veri yapı
ları
na dönüş
türmek, bir oluş
umun nedenini açı
kladı
klarıvarsayı
lan
değiş
kenleri gruplamak ve ortak faktörleri ortaya koymak, majör ve minör faktörleri
tanı
mlamak amacı
yla baş
vurulan bir çok değiş
kenli istatistiksel analiz türüdür .
Yani faktör analizi, veriler arası
ndaki iliş
kilere dayanarak verilerin daha anlamlıve
özel bir biçimde sunulması
nısağlayan bir yöntemdir. Faktör analizinin temel amacı
boyut indirgeme ve bağı
mlı
lı
k yapı
sı
nı yok etmektir. Faktör analizinin diğer
amaçları
nış
u ş
ekilde sı
ralamak mümkündür. Değiş
kenler arası
ndaki karş
ı
lı
klı
bağı
mlı
lı
ğı
n kökenini araş
tı
rmaktı
r. Faktör, gözlenen değ
iş
kenlerin doğrusal bir
bileş
imidir.107
Faktör analizinde , kovaryans veya korelasyon matrisinden hareket ederek bilgi kaybı
olmadan daha az sayı
da faktör adı
nıverdiğimiz yeni değiş
kenlere ulaş
ı
lmaya
çalı
ş
ı
lı
r.Karş
ı
lı
klıolarak araları
nda iliş
ki olan değiş
kenleri bir araya toplamak ve
böylece veri grubunu daha az sayı
da değiş
ken ile temsil edilebilecek duruma
dönüş
türebilmektir .
107
http://www.statistics.com/resources/glossary/f/factoran.php 2007.
89
Faktör analizi, gruplandı
rdı
ğıdeğiş
kenler arası
ndaki ortaklaş
a iliş
kileri inceleyerek
birbirleriyle yüksek iliş
ki kuran değiş
kenleri bir grupta; daha az iliş
ki içinde bulunan
değiş
kenleri diğ
er bir grupta toplayabilir.
Faktör analizinin baş
lı
ca varsayı
mları
, veri matrisinin analiz öncesi kriter ve tahmin
değiş
kenleri alt matrislerine bölüş
türülmemesi ve değiş
kenler arası
ndaki ilginin
doğ
rusal olduğudur .
Bu açı
klamaları
n ı
ş
ı
ğı
nda faktör analizinin, değiş
kenler arası
ndaki tüm iliş
kilerin
gücünün ve bu arada bu iliş
kiyi temsil edecek değiş
kenlerin saptanması
nıamaçlayan,
esas olarak değ
iş
kenlerle ilgilenen, veri matrisinin kriter ve tahmin değiş
enlerinin alt
matrislerine bölüş
türülmediği ; değiş
kenler arası
ndaki iliş
kinin doğrusal olduğunun
varsayı
ldı
ğıve genel kural olarak aralı
klıölçekle ölçülmüşverilere gereksinme
gösteren bir çok değiş
kenli istatistiksel analiz olduğu söylenebilir.
Örneklem büyüklüğü faktör analizi için önemlidir. Gözlem sayı
sıdeğiş
ken sayı
sı
ndan
fazla olmalı
dı
r. Baş
arı
lıbir faktöranalizi uygulaması
nda, elde edilen faktör sayı
sı
değiş
ken sayı
sı
na göre çok daha az olmalı
dı
r. Ayrı
ca faktörlerin yorumlanabilir
olmasıaranı
lan diğ
er bir özelliktir.108
Faktör analizinde faktörlerin ortaya çı
karı
lmasıiçin yapı
lan faktörleş
me iş
leminde
farklıyöntemler kullanmaktadı
r. Bu yöntemlerden bazı
ları
; temel bileş
enler, en büyük
benzerlik, ağı
rlı
ksı
z en küçük kareler, genelleş
tirilmişen küçük kareler, ana eksen
faktörizasyonu, alfa faktörizasyon, imge faktörizasyonu, çoklu gruplandı
rma ve
maksimum olabilirlik yöntemleridir.
Temel Bileş
enler Yöntemi, bütün değ
iş
kenlerdeki maksimum varyansıaçı
klayacak
faktörü hesaplar. Kalan maksimum miktardaki varyansıaçı
klamak için, ikinci faktör
hesaplanı
r. Ancak, birinci faktörün ikinci faktör ile iliş
ki göstermemesi için sı
nı
rlama
vardı
r. Söz konusu süreç, değiş
kenlerdeki bütün varyansı
n açı
klanması
na kadar
devam eder. Normal olarak bu noktaya faktör sayı
sıdeğ
iş
ken sayı
sı
na eş
it olunca
ulaş
ı
lı
r. Ancak değ
iş
ken sayı
sıkadar faktör olmasıhiçbir ş
eyi basitleş
tirmeyeceğ
i
108
K.KURTULUŞ,Pazarlama Alı
ş
tı
rmaları,Avcı
ol Yayı
nı,1998 s482.
90
için;
özdeğ
er istatistiği kullanı
larak analize kaç faktörün dahil edileceğine karar
verilir.
2.5.2. Kanonik Korelasyon Analizi
Kanonik kolerasyon
analizi ,
birden
çok bağı
mlı ve
bağı
msı
z değiş
ken
arası
ndaki iliş
kiyi ortaya koymak için kullanı
lan bir analizdir.Çok değiş
kenli
istatistiksel analiz tekniği olan kanonik kolerasyon analizi , ş
u amaçlar için
kullanı
lmaktadı
r.109
 İ
ki değiş
kenin birbirinden bağı
msı
z olup olmadı
ğı
nı
n tespit edilmesi,
 Kümeler arası
nda en büyük iliş
kilere sahip kümelerin ortaya çı
karı
lması,
 Kolerasyonu maksimum yapacak modelin belirtilmesi için kullanı
lmaktadı
r.
Kanonik kolerasyon analizine örnek vermek gerekirse , bir firmanı
n ürününü
alan müş
terinin cinsiyeti , medeni hali, yaş
ıve de satı
n aldı
klarıürünler arası
ndaki
iliş
kiyi ortaya koyan bir analizdir.
İ
ki değisken arası
ndaki iliş
ki hakkı
nda genel bir bilgi edinmek için kullanı
lan
grafiklere saçı
lı
m grafiği denir.Ancak, iliş
kinin miktarıkonusunda yorum yapabilmek
için korelasyon katsayı
sı
nı
n hesaplanmasıgerekmektedir.110
Korelasyon katsayı
sı(r), iki değiş
ken arası
ndaki iliş
kinin ölçüsüdür ve -1 ve +1
arası
nda değiş
im gösterir.Aş
ağı
daki
ş
ekilde değiş
kenler arası
ndaki
grafiklerle gösterilmektedir.
109
110
N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s477.
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv.
1996 s216.
91
kolerasyon
Şekil 2.20.Konanik kolerasyon grafiği
Kaynak : H.TATLIDİ
L , UygulamalıÇok Değ
iş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s216
r = -1 olan grafikte değiş
kenlerden birisinin artı
ş
ı
na bağlıolarak diğerinde azalması
yönünde bir iliş
ki olduğ
unu göstermektedir.
r = 0 olan grafikte iki değiş
ken arası
nda iliş
ki olmadı
ğı
nıgöstermektedir.
r = 1 degiskenlerden birisindeki artı
ş
a bağlıolarak diğerinde de artı
şolacağı
nı
göstermektedir.
Korelasyonun katsayı
sı
nı
n gücü ile ilgili olarak aş
ağı
daki tanı
mlamalar yapı
lmı
ş
tı
r.
 0 - 0.25 Çok zayı
f iliş
ki ,
 0.26 - 0.49 Zayı
f iliş
ki ,
 0.50 - 0.69 Orta iliş
ki ,
 0.70 - 0.89 Yüksek iliş
ki ,
 0.90 - 1.0 Çok yüksek iliş
kidir.
Korelasyon katsayı
sı
, örneklem büyüklüğünden etkilenmektedir. Küçük hacimli
örneklerde, elde edilen korelasyon katsayı
sıbüyük bile olsa istatistiksel olarak önemli
bir değer olmayabilir.Dolayı
sı
yla, elde edilen değerin hipotez testinin yapı
lması
gerekmektedir.111
111
K.KURTULUŞ,Pazarlama Alı
ş
tı
rmaları,Avcı
ol Yayı
nı,1998 s453.
92
Değ
iş
kenlerin türlerine göre korelasyon katsayı
ları sı
nı
flanabilir.İ
ki nitel değiş
ken
arası
ndaki iliş
kinin belirlenmesi
için
kullanı
lan korelasyon
katsayı
ları ; Phi
katsayı
sı,Cramer V katsayı
sı,Olaganlı
k katsayı
sı,Lambda katsayı
sı
dı
r.
Kesikli/sürekli nicel değiş
kenler arası
ndaki iliş
kinin belirlenmesinde kullanı
lan
korelasyon katsayı
larıise Pearson korelasyon katsayı
sı , Spearman korelasyon
katsayı
sı
dı
r.
Kı
smi korelasyon
katsayı
ları, iki değiş
ken arası
ndaki iliş
kiyi gösterirken diğer
değiskenlerin etkilerini dikkate alı
nmadan ya da diğer
değ
iş
kenlerin
arı
ndı
rı
ldı
ktan sonra iki değiş
kenin biribiri ile olan iliş
kilerini ortaya koyan
kolerasyon katsayı
sı
dı
r.
93
etkisi
bir
2.5.3.Lojistik Regresyon Analizi
Lojistik regresyon analizi , geleceğe dönük tahmin yapmak için
kullanı
lan ve
son yı
llarda popüler olan bir analizdir.Bu analiz değiş
kenlerin kesikli değerler
alması
na ve de esnek modeller kurulması
na olanak sağladı
ğıiçin günümüzde
tercih edilmektedir.Kesikli değ
iş
kenlere örnek olarak medeni hal , cinsiyet vb.
örnek olarak verilerbilir.112
Lojistik regresyon modellerinin yaygı
n bir ş
ekilde kullanı
lı
r hale gelmesi, katsayı
tahmin yöntemlerinin geliş
tirilmesi ve lojistik regresyon modellerinin daha ayrı
ntı
lı
incelenmesine sebep olmuş
tur. Cornfield (1962), lojistik regresyondaki katsayıtahmin
iş
lemlerinde diskriminant fonksiyonu yaklaş
ı
mı
nıilk kez kullanarak popüler hale
getirmiş
tir. Lee (1984) basit dönüş
ümlü deneme planlarıiçin linear lojistik modeller
üzerinde durmuş
tur. Bonney (1987) lojistik regresyon modelinin kullanı
mıve
geliş
tirilmesi üzerinde çalı
ş
mı
ş
tı
r. Robert ve ark. (1987) lojistik regresyonda standart
ki-kare, olabilirlik oran, en çok olabilirlik tahminleri, uyum mükemmelligi ve hipotez
testleri üzerine çalı
ş
malar yapmı
ş
lardı
r.
Duffy (1990) lojistik regresyonda hata terimlerinin dağı
lı
ş
ıve parametre değerlerinin
gerçek değerlere yaklaş
ı
mı
nıincelemiş
tir. Hsu ve Leonard (1995) lojistik regresyon
fonksiyonları
nda Bayes tahminlerinin elde edilmesi iş
lemleri üzerine çalı
ş
mı
ş
lar ve
lojistik regresyonda Monte Carlo dönüş
ümünün kullanı
labilecegini göstermiş
lerdir.
Akkaya ve Pazarlı
oğlu (1998) lojistik regresyon modellerinin ekonomi alı
nı
nda
kullanı
mı
nıörneklerle incelemiş
lerdir.
Çeş
itli varsayı
m bozulmalarıolduğunda Lojistik regresyon analizi, diskriminant
analizi ve çapraz tablo uygulamaları
na alternatif olarak uygulanmaktadı
r. Kullanı
m
nedeni olarak en temel yaklaş
ı
m doğrusal regresyon analizinde yapı
labilir; bağ
ı
mlı
değiş
ken 0 ve 1 gibi ikili (binary) ya da ikiden çok kategori içeren kesikli değiş
ken
112
L.L.HARLOW , The Essence Of Multivariate Thinking : Basic Themes And Methods, LEA
Publishers 2005 s152.
94
olduğunda normallik varsayı
mı bozulmakta ve doğrusal regresyon analizi
uygulanamamaktadı
r.113
Lojistik regresyonu doğrusal regresyondan ayı
ran en belirgin özellik ise lojistik
regresyonda sonuç değ
iş
kenin ikili veya çoklu olması
dı
r. Lojistik regresyon ve
doğ
rusal regresyon arası
ndaki bu fark hem parametrik model seçimine, hem de
varsayı
mlara yansı
maktadı
r.
Lojistik regresyonda da, doğrusal regresyon analizinde oldugu gibi bazıdeğiş
ken
değerlerine dayanarak tahmin yapı
lmaya çalı
ş
ı
lı
r. Ancak bu iki yöntem arası
nda
önemli fark bulunmaktadı
r.
 Doğrusal regresyon analizinde tahmin edilecek olan bağı
mlıdeğiş
ken sürekli iken,
lojistik regresyon analizinde bağı
mlıdeğiş
ken kesikli bir değer almaktadı
r.
 Doğrusal regresyon analizinde bağı
mlıdeğiş
kenin değeri, lojistik regresyon
analizinde ise bağı
mlıdeğiş
kenin alabileceği değerlerden birinin gerçekleş
me
olası
lı
ğıtahmin edilir.
 Doğrusal regresyon analizinde bağı
msı
z değiş
kenin çoklu normal dağ
ı
lı
m
göstermesi ş
artıaranı
rken, lojistik regresyon analizinde böyle bir ş
art yoktur.
Lojistik regresyon modelleri zayı
f ölçekle ölçülmüşdeğ
iş
kenler arası
ndaki iliş
kinin
ş
eklini ortaya koyan modellerdir. Yapı
lan bir çok çalı
ş
mada bağ
ı
mlıdeğiş
ken sadece
iki
sonuca
sahiptir.
Genellikle
üzerinde
durulan
olayı
n gerçekleş
mesi
1
gerçekleş
memesi ise 0 ile gösterilir.Hem teorik hem de deneysel incelemeler bağ
ı
mlı
değiş
ken iki sonuçlu iken cevap fonksiyonunun ş
eklinin S veya ters S ş
eklinde
olacağı
nıbilinmektedir.Bağı
mlıdeğiş
ken, aş
ağ
ı
daki ş
ekilde de görüldüğü gibi bitiş
noktalarıdı
ş
ı
nda yaklaş
ı
k olarak doğrusaldı
r.
113
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s289.
95
Bu cevap fonksiyonları0 ile 1 değerlerinde X ve Y eksenlerine asimptottur.
Şekil 2.21. S ve ters S fonksiyonu
X
X
Kaynak : M.AYTAÇ , Matematiksel İ
statistik ,Ezgi Yayı
nevi 1999 s309
Yukarı
daki ş
ekilde gösterilen cevap fonksiyonları
, lojistik cevap fonksiyonlarıolarak
bilinmektedir.Lojistik fonksiyonun 0 ile 1 arası
nda bir değiş
im aralı
ğı
na sahip olması
lojistik fonksiyonun tercih edilmesindeki ilk önemli nedenidir. Lojistik model, ortaya
çı
kacak riski 0 ile 1 arası
nda herhangi bir değer olarak tahmin etmeye yarar. Baş
ka bir
deyiş
le 1’in üstünde veya 0’ı
n altı
nda bir risk olmaz. Bu durum her model için her
zaman doğru olmamaktadı
r. 114
Araş
tı
rmacıbazen bağı
msı
z değiş
kenler üzerinde denetime sahiptir. Böyle bir imkan
söz konusu oldugunda Xi değerlerine karş
ı
lı
k gelen hücrelerdeki birim sayı
sı
nı
n
asgari 30 olmasıregresyonun verilere uygunlugunu önemli ölçüde yükseltir.
Lojistik regresyon fonksiyonu,
114
K.ÖZDAMAR , Paket Programlar ile İ
statiksel Veri Analizi , Kaan Kitabevi 1999 s475.
96
ş
eklindedir. Bu ifadenin bir diğer ş
ekli ise,
olarak
yazı
labilir. π(x) = E(Y/x)
değeri
ş
artlı ortalama
olarak
bilinir.Şartlı
ortalamanı
n, modelde yer alan parametrelerle (βo+β1) doğrusal hale dönüş
türülmesi
için, transformasyona olduğu
gibi tutulmasıgerekir.Bu transformasyona Logit
transformasyon adıverilir.Bu formül aş
ağı
da gösterilmektedir.
Transformasyon değiş
keni g(x), modeldeki parametrelerle doğrusaldı
r, süreklidir
ve 
,  aralığında değişen değerler alı
r. π(x) arttı
kça g(x)’te artar ve eğer
π(x)<0.5 ise g(x) negatif, π(x)>0.5 ise g(x) pozitif değerler alı
r.
Modelin
sonuç
değiş
keninin
sı
nı
rları
nı geniş
letmek
için
uygulanan
Logit
transformasyonunun bazıözellikleri ş
öyle sı
ralanabilir.115
 p arttı
kça logit(p) de artmaktadı
r.
 p, 0 ile 1 arası
nda iken logit(p) reel sayı
lar doğrusu üzerinde değerler almaktadı
r.
 p < 0.5 olduğ
unda logit(p) < 0 ve p > 0.5 olduğunda logit(p) > 0 olur.
Doğrusal regresyon modelinde bağı
mlıdeğiş
kene ait bir gözlem y = E(Y/x) + ε
115
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s293.
97
ş
eklinde gösterilebilir. εhata terimi olarak isimlendirilir ve gözlemin koş
ullu
olası
lı
ktan ne kadar saptı
ğı
nıgösterir. ε
’nin ortalaması
nı
n sı
fı
r ve varyansı
nı
n ise
bağı
msı
z değiş
kenin her düzeyinde sabit olacak ş
ekilde normal dağı
lı
m göstereceğ
i
genel bir varsayı
mdı
r. Bu varsayı
m bağı
mlıdeğiş
ken iki düzey içerdiği zaman geçerli
değildir.
Bu tür durumlarda x verildiğinde sonuç değiş
keninin değeri y = π(x) + εile gösterilir.
Ve ε
’nin mümkün olan iki değerden baş
ka değer alamayacağıvarsayı
lı
r. Eğer y = 1
ise, π(x) olası
lı
kla ε= 1 - π(x) değerini alı
r ve eğer y = 0 ise, 1 - π(x) olası
lı
kla ε= π(x) değerini almaktadı
r. Böylece ε
, sı
fı
r ortalamalıve π(x)[1 - π(x)]’a eş
it varyanslı
binomiyal bir dağı
lı
m göstermişolur.
Lojistik modelde parametrelerin tahminine bakı
ldı
ğı
nda , parametre tahmin etmek
için çeş
itli yöntemler ortaya atı
lmı
ş
tı
r.Bu çalı
ş
mada parametrelerin tahmin
edilmesinde en çok olabilirlik (maximum likelihood) tahmin yöntemi kullanı
lacaktı
r.
Genel olarak en çok olabilirlik yöntemi, gözlenen veri kümesini elde etmenin
olası
lı
ğı
nımaksimum yapan bilinmeyen parametrelerin değerlerini verir. Bu metodu
uygulamak için öncelikle,
gerekmektedir.Bu
fonksiyon
en
çok
olabilirlik
gözlenen
verilerin
fonksiyonunun
oluş
turulması
olası
lı
kları
nı
, bilinmeyen
parametrelerin bir fonksiyonu olarak açı
klar. Bu parametrelerin en çok olabilirlik
tahmin edicileri, fonksiyonu maksimum yapan değerleri bulacak ş
ekilde seçilir.
Böylece sonuçta elde edilen tahminleyiciler, gözlenen verilerle çok yakı
n değerlere
sahiptir. Eğer y, 0 ve 1 olarak kodlandı
ysa, bu durumda 1 numaralıeş
itlikte verilen
π(x) ifadesi, verilen x değeri için y’nin 1’e eş
it olma koş
ullu olası
lı
ğı
nıvermektedir.
Bu olası
lı
k π(x) = P(y = 1/x) sembolüyle gösterilir. Buradan hareketle, [1-π(x)]
ifadesi de, y’nin 0 degerini alma koş
ullu olası
lı
gı
nıgöstermektedir. 116
Bu olası
lı
k da [1-π(x)] = P(y = 0/x) ş
eklinde gösterilir. ( x , y ) çifti için y = 1
i i
i
116
D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s155 .
98
olduğunda olabilirlik (likelihood) fonksiyonuna katkı
sıπ( x ) iken y = 0 olduğ
unda
i
i
olabilirlik fonksiyonuna katkı
sı1- π( x ) kadar olmaktadı
r. ( x , y ) çiftinin olabilirlik
i
i i
foksiyonuna katkı
sı
nıhesaplama formülü aş
ağı
da verilmiş
tir.
Gözlemlerin birbirinden bağ
ı
msı
z olduklarıvarsayı
ldı
ğıiçin, olabilirlik fonksiyonu
yukarı
da buulunan formül terimlerin çarpı
lması
yla elde edilir.
En çok olabilirliğin temel ilkesinde βkestiriminin yukarı
daki ifadeyi maksimum
yaptı
ğ
ıvurgulanmaktadı
r. Matematiksel olarak bu formülün logaritması
yla çalı
ş
mak
daha kolay olacağı
ndan log-olabilirlik fonksiyonu aş
ağı
daki gibi elde edilir.
L(β)’yi maksimum yapan βdeğerlerini bulmak için, L(β)’nin  ve ’e göre türevi
o
1
alı
narak sı
fı
ra eş
itlenir. Elde edilecek eş
itlikler aş
ağı
da belirtilmiş
tir.
ş
eklindedir. Bu eş
itlikler olabilirlik eş
itlikleri (likelihood equations) olarak
adlandı
rı
lı
r.
99
Lineer regresyon analizinde β’ya göre türevinden elde edilen olabilirlik eş
itlikleri,
bilinmeyen
parametreleri
içeren
doğrusal
ifadelerdir,
bu
nedenle
kolayca
çözümlenebilmektedir.
Lojistik regresyon için
yukarı
da elde edilen
eş
itlikler  ve ’de lineer
o
1
değildirler.Bundan dolayıbu eş
itliklerin çözümlenmesi için özel yöntemlere ihtiyaç
vardı
r.Bu denklemlerin çözümleri genelleş
tirilmişağı
rlı
klıen küçük kareler yöntemi
ile elde edildiği gösterilmiş
tir.
Lojistik regresyonda gözlenen ve beklenen değerlerin karş
ı
laş
tı
rı
lmasılog olabilirlik
fonksiyonu ile yapı
lmaktadı
r.Bu test Önem testi olarak adlandı
rı
lı
r.117
Yukarı
daki formülde parantez içerisinde verilen ifade olabilirlik oranı“likelihood
ratio”olarak adlandı
rı
lı
r. (–2ln) katı
nı
n alı
nması
, matematiksel olduğu kadar dagı
lı
mı
bilinen bir değer elde etmektir. Bu değer hipotez testi amacı
yla kullanı
lmaktadı
r.
Böyle bir teste olabilirlik oran testi adıverilmektedir. Formüller
yerine
konulduğunda eş
itlik aş
ağı
daki ş
eklini almaktadı
r.
Bağı
msı
z bir değiş
kenin önemine karar vermek için , denklemde bağı
msı
z değiş
kenin
olduğu ve olmadı
ğ
ıdurumlardaki D değerleri karş
ı
laş
tı
rı
lı
r. Bağı
msı
z değiş
keni
kapsaması
ndan dolayıortaya çı
kan D’deki değ
iş
im aş
ağı
daki gibidir.
117
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s299.
100
Hesaplanan bu istatistikde, doğrusal regresyonda kullanı
lan F testindeki pay kı
smıile
aynırolü üstlenir. G’yi hesaplamak için farkıalı
nacak D değerlerinin her ikisi için de
doymuşmodelin olabilirlikleri ortak olduğundan G istatistiği aş
ağı
daki ş
ekli
almaktadı
r.118
Tek bağı
msı
z değiş
kenli özel durumlarda, değ
iş
kenin modelde olmadı
ğızamanda ki
βo’ı
n en çok olabilirlik tahmini ln( n / n )’dı
r. ( n = Σy ve n = Σ(1- y )). Tahmin
1
o
1
o
i
i
değeri n / n sabittir.G istatistiğ
iş
u ş
ekilde hesaplanı
r.
1
o
ya da
dı
r. β1 = 0 hipotezi altı
nda, G istatistiği 1 serbestlik derecesiyle χ2 dağı
lı
mı
göstermektedir.
Tüm değiş
kenleri içeren model ile kestirilen modele iliş
kin olabilirlik oran
değerlerinin farkı
na dayanan ölçütlerin ki-kare dağı
lacağ
ıdüş
üncesinden hareketle
kurulan modelin geçerliliği sı
nanmaktadı
r.
118
D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s160.
101
Çoklu lojistik regresyon analizine bakı
ldı
ğ
ı
nda , bağı
msı
z değiş
kenler değiş
ik ölçüm
biçimlerinde olabilmektedir.Kesikli ve nominal ölçekli bağı
msı
z değiş
kenleri modele
dahil etmek için dizayn değiş
kenleri kullanı
lmasıgerekir. Öncelikle modeldeki tüm
bağı
msı
z değiş
kenlerin her birinin en az aralı
k ölçekli olduğu varsayı
lmaktadı
r.
X ' ( x1x2 x3 ...x p ) vektörü ile gösterilsin. Sonuç değ
iş
keninin mevcut olduğu (Y=1)
zaman ki koş
ullu olası
lı
k, P(Y = 1/x) = π(x)’e eş
it olacaktı
r. Çoklu lojistik regresyon
modelinin logiti aş
ağı
daki denklem ile gösterilir. 119
Buradanda ,
Formülü elde edilir.
Bağı
msı
z değiş
kenler kesikli, nominal ölçekli ise, o zaman bu değiş
kenler yerine
dizayn (kukla) değiş
kenlerinin bu değiş
kenleri temsil etmesi için kullanı
lmasıgerekir.
Genel olarak nominal değiş
ken k kategoriye sahipse, o zaman k-1 dizayn değiş
kenine
ihtiyaç vardı
r. J. Bağı
msı
z değiş
ken (xj), kj kateğoriye sahip olsun. Kj –1 dizayn
değiş
keni Dju olarak ve katsayı
larıda βju, u = 1,2,.....,kj – 1 olarak belirtilirse, j.
değiş
ken kesikli olan p değiş
kenli model için logit aş
ağı
daki gibi olur.120
Birbirinden bağı
msı
z n tane (xi, y i), i=1,2,....,n gözlem çiftinin olduğu olduğunu
düş
ündüğümüzde tek değiş
kenli modelde olduğu gibi modelin kurulmasıiçin tahmin
vektörünün ' ( 
elde edilmesi gerekir. Çok değiş
kenli durumda,
1, 
2, 
3 ,..., 
p)
119
M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms , John Wiley &
Sons Publishers 2003 s106.
120
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s304.
102
tek değiş
kenli durumda olduğu gibi tahmin metodu en çok olabilirlik metodu
olacaktı
r.
̂ en çok olabilirlik tahmin teorisi, log olabilirlik fonksiyonunun ikinci dereceden
türevlerinden oluş
an matristen tahmin değerlerinin elde edilmektedir.Logaritmik
olabilirlilik fonksiyonunun β0, β1, ...., βp-1 parametrelerine göre ikinci dereceden kı
smi
türevlerinin matrisini G ile gösterilir.G matrisi,
ş
eklinde gösterilir.
değerleri elde edilir. Bu matris, Hessiyan matrisi olarak adlandı
rı
lı
r. Hessiyan
matrisdeki ikinci derece kı
smi türevleri, b = ίolarak; yani, en çok olabilirlilik
tahmincileri olarak görmek gerekir. En yüksek ihtimal tahmini için kullanı
ldı
ğı
nda
Lojistik regresyondan tahmin edilen regresyon katsayı
ları
nı
n tahmini yaklaş
ı
k varyans
kovaryans matrisi ş
u eş
itlikten elde edilir.
Örnek hacmi yeterince büyük olduğunda , basit veya çoklu lojistik regresyon
modellerindeki regresyon katsayı
ları
nı
n anlamlıolup olmadı
ğı
nıtest ederken
aş
ağı
daki değere bağlıolarak karar verilir.
Yukarı
daki formüldeki Z değeri standart normal değerdir. S{b k} değeri ise bk’nı
n
tahmini standart sapması
dı
r. Çoğu kez çoklu lojistik regresyon modelindeki X
değiş
kenlerinin alt gruplarıile iliş
kili regresyon katsayı
ları
nı
n önemli olup olmadı
ğ
ı
araş
tı
rı
lı
r. Kullanı
lacak test prosedürü en çok olabilirlilik tahmininin genelleş
tirilmiş
103
bir ş
eklidir. Büyük örnekler durumunda uygulanabilen bu test olabilirlilik oranıtesti
olarak adlandı
rı
lı
r. Genel model olarak aş
ağı
daki model kullanı
lı
r.
Bu modelde ,
olurlar. Model için bulunacak en çok olabilirlilik tahminlerini bF ile gösterilir.
Olabilirlilik fonksiyonunu L( β) ile gösterdiğimizde β= bF olmaktadı
r. Genel modelde
olabilirlilik fonksiyonunun bu değerini L(F) ile gösterilir.Test edilecek hipotezler
ş
unlardı
r.
En son p-q katsayı
ları
nıtest etmek için model düzeltilir. Kı
saltı
lmı
şmodel,
ş
eklindedir. Bu modelde
olarak yazı
lı
r.Şimdi kı
saltı
lmı
şmodel için maksimum olabilirlilik tahminlerinin elde
ediliş
i ş
u ş
ekildedir.Maksimum olabilirlilik tahminleri b R ile gösterilir. βR = b R
olduğunda q adet parametre ihtiva eden kı
saltı
lmı
şmodel için olabilirlilik tahmini
tarif edebiliriz. Olabilirlilik fonksiyonunun bu değeri L® ile gösterilir. L® değ
eri L(F)
değerini hiçbir zaman geçemez. Bu sebeple L® değeri L(F) değerine yaklaş
tı
ğı
nda
ilave parametreler olabilirliligi fazlaca artı
rmayacaklarıiçin H0 hipotezinin doğru
104
olduğuna karar verilir. L® değeri L(F) degerinden yeterince küçük olursa H 1
hipotezinin doğru olduğuna karar verilir.
Test istatistiği
X
2
gösterildiğinde,121
olur. Örnek hacmi yeterince büyük olduğ
unda H0 hipotezi doğru ise
yaklaş
ı
k olarak
2

(1; p q )
X
2
istatistiği
ş
eklinde dağı
lı
m gösterir. Serbestlik derecesi,
v = (n – q)–(n–p) ş
eklindedir.
Böylece
X
2
X
2
(1; p q )
olduğunda H0 kabul edilirken
X
2
X
2
(1; p q )
olduğunda
H1 kabul edilir.
Regresyon katsayı
ları
nı
n önemli olup olmadı
ğı
nıtest etmede kullanı
labilecek ikinci
test Wald testidir. Wald testine ait test istatistiginin dağı
lı
mıstandart normal dağı
lı
ma
yaklaş
ı
r. Her değiş
ken için listedeki standart hatalar kullanı
larak Z testi yapı
lı
r. Wald
testi, örnek hacminin büyük olmasıdurumunda anlam kazanmaktadı
r.
Eğim parametresinin en yüksek ihtimal tahmincisi standart hatası
nı
n tahmini değeri
ile mukayese edilir. 1 = ίiken test istatistiğinin dağ
ı
lı
mıstandart normal dağı
lı
ma
uygundur. Bu teste ait test istatistik formulü ş
u ş
ekildedir.
Kurulan modelin uyum iyiliği testi Hosmer-Lemeshow’un hem onlu risk gruplarıhem
de sabit kesim noktasıyöntemine göre hesaplanmaktadı
r.Uyum iyiliğine karar vermek
için onlu risk gruplarıyöntemine göre hesaplanmak ş
uş
ekildedir.
121
D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 s172-173.
105
Hosmer-Lemeshow
*
Cˆ
istatistiği,
g
t-2
serbestlik
dereceli
ki-kare
dağı
lı
mı
göstermektedir.
Kestirilen modelin uyum iyiliği testi sabit kesim noktasıyöntemiyle hesaplanmak
istendiğ
inde ise, Hosmer-Lemeshow istatistigi kullanı
lmaktadı
r.
Hosmer-Lemeshow
Hˆ*g istatistiği, t-2 serbestlik dereceli ki-kare dağı
lı
mı
göstermektedir.
Lojistik regresyonda paremetreler ş
unlardı
r.
 n:İ
ncelenen birey sayı
sı
,
 Y (Y1 , Y2 , Y3 ,..., Yn ) ' : açı
klayı
cıdeğiş
ken vektörü,
 (1 , 2 , 3 ,..., p )' : parametre vektörü,
'
 (1 , 2 , 
3 ,..., 
n ) : hata terimleri vektörü,
 p : değiş
ken sayı
sı
,
 X :açı
klayı
cıdeğiş
ken matrisidir.
Açı
klayı
cıdeğiş
kenler matrisi X ş
uş
ekilde tanı
mlanı
r.
106
Lojistik regresyon analizinin uygulamadaki adı
mları
na bakı
ldı
ğı
nda ş
u aş
amalardan
geçmektedir.122
 Önsel grup üyelikleri belirlenir.
 Modele girecek değ
iş
kenler belirlenir. Bu amaçla önsel bilgiden ya da istatistiksel
tekniklerden yararlanı
labilir.
 Modelin parametreleri Newton-Raphson yöntemi ile tahmin edilir. Ardı
ndan
modelin tümünün anlamlı
lı
ğıolabilirlik oranıile test edilir. Model anlamlıdeğilse
analize son verilir. Eğer model anlamlıbulunursa diğer aş
amaya geçilir.
 Tahmin edilen model parametrelerinin tek tek anlamlı
lı
ğıincelenir. Bu amaçla
olabilirlik oranıya da Wald istatistiği kullanı
labilir. Her katsayı
nı
n anlamlı
lı
ğı
incelendikten sonra, teklik oranlarıincelenerek, açı
klayı
cıdeğiş
kenlerin bağı
mlı
değiş
ken üzerindeki etkileri yorumlanabilir.
 Tahmin edilen model parametreleri kullanı
larak, her bir gözlemin hangi gruptan
geldiğ
i tahmin edilir.
 Modelin uyum iyiliğini incelemek amacı
yla doğru sı
nı
flandı
rma yüzdesi ve yapay
R 2 ölçütleri kullanı
lı
r. Modelin uyum iyiliği kabul edilebilir düzeyde ise 5.
aş
amadaki grup tahminleri kullanı
labilir. Aksi halde 2. aş
amaya geçilerek modele
girecek değiş
kenler yeniden gözden geçirilir ve iş
lemler tekrar edilir.
122
K.ÖZDAMAR , Paket Programlar ile İ
statiksel Veri Analizi , Kaan Kitabevi 1999 s475-479.
107
2.5.4.Çok Boyutlu Ölçekleme
Çok boyutlu ölçekleme , veri
tekniktir.Faktör
analizinin
boyutunu indirgeme amaçlı kullanı
lan bir
alternatifi
ölçülemeyen ölçekleme yöntemleri
olduğu
olarak
söylenebilir.Ölçülebilen
ve
iki ayrı
lmaktadı
r.Veri değerlerinin
birbirine olan uzaklı
kları
na bakı
larak indirgeme yapı
lan yöntem psikoloji ve sosyal
bilimlerde yaygı
n olarak kullanı
lmaktadı
r.
Çok boyutlu ölçekleme analizi, n tane nesne ya da birim arası
ndaki p değiş
kene göre
belirlenen uzaklı
klara dayalıolarak nesnelerin k boyutlu (k < p) bir uzayda
gösterimini elde etmeyi amaçlayan, böylece nesneler arası
ndaki iliş
kileri belirlemeye
yarayan bir yöntemdir.123
Çok boyutlu ölçekleme analizi, hem görsel bir haritalama imkanıvermekte hem de
gözlemler ile değiş
kenler arası
ndaki iliş
kileri görsel olarak ortaya çı
karmaktadı
r.
Çok boyutlu ölçekleme, n tane nesne arası
ndaki uzaklı
k değerlerini kullanarak bu
nesnelerin çok boyutlu uzaydaki konumları
nı
, iliş
ki yapı
sı
nıveren resmini ortaya
koymayıamaçlamaktadı
r. Bu analizde X veri matrisi yerine n tane bireyin
uzaklı
klardan elde edilen nxn boyutlu D uzaklı
klar matrisi kullanı
lmaktadı
r.
Uzaklı
klar matrisinin simetrikliği nedeniyle, iş
lemler
n ( n 1 )
2
tane uzaklı
k değeri
kullanı
larak sürdürülmektedir .
Çok boyutlu ölçekleme, nesneler arası
ndaki iliş
kilerin bilinmediğ
i, fakat araları
ndaki
uzaklı
kları
n hesaplanabildiği durumlarda uzaklı
klardan
yararlanarak nesneler
arası
ndaki iliş
kileri ortaya koymaya yardı
mcıolan bir istatistiksel tekniktir. Uzaklı
klar
veya farklı
lı
klar yardı
mı
yla nesnelerin geometrik konumları
nı
n belirlenmesi,
ş
ekillendirilmeleri önemli bir konudur. Bu amaçla yapı
lan çalı
ş
malarda genellikle
elde edilen ş
ekillerin çok boyut içermesi sebebiyle bu ölçeklemelere çok boyutlu
ölçekleme adıverilmiş
tir.
123
K.KURTULUŞ,Pazarlama Alı
ş
tı
rmaları,Avcı
ol Yayı
nı,1998 s436-445.
108
Genellikle metrik ve metrik olmayan olarak iki çeş
it çok boyutlu ölçekleme vardı
r.
Metrik ölçmede veri en az mesafeli seviyede olmalı
dı
r. Metrik olmayan modelde
veriler en azı
ndan sı
ralama biçiminde olmalı
dı
r.124
Çok boyutlu ölçekleme analizi boyut indirgeme amacı
yla da kullanı
lmaktadı
r. Aynı
zamanda n tane nesne ya da birim arası
ndaki faklı
lı
klarısubjektif bir sı
ralamaya
sokmak amacı
yla da kullanı
labilir. Çok boyutlu ölçekleme yöntemi uzaklı
klar
matrisinden faydalanarak çözüm yapar.
Bu nedenle analizde kullanı
lacak veri türüne uygun olarak uzaklı
k matrisi hesaplamak
gereklidir. Çok boyutlu ölçekleme yönteminde hesaplanan uzaklı
k matrisine farklı
lı
k
matrisi denir.
Çok boyutlu ölçekleme analizi belli bir dağı
lı
m varsayı
mıgerektirmeyen bir
yöntemdir. Fakat buna karş
ı
n bu yöntemin sağlamasıgereken bazıvarsayı
mlar vardı
r.
Bunlar; 125
 Çok boyutlu ölçekleme, n tane nesne yada birim arası
ndaki uzaklı
klarıkullanı
r.
Bu uzaklı
klar simetrik ve yansı
malı
dı
r.
 Veriler sı
nı
flama veya sı
ralama düzeyinde ölçülerek nesneler arasıuzaklı
klar
hesaplanmı
şise , değerlerin sı
raya dizilmesi ve monotonik regresyona göre
konfigürasyon uzaklı
kları
nı
n belirlenmesi gerekir.
 Çok boyutlu ölçekleme içinde yer alan yöntemlerin uygulanabilmesi için
yöntemin gerektirdiği veri tipini doğru olarak belirlemek gerekir. Örneğin;
sı
nı
flamalı
, sı
ralı
, eş
it aralı
klıveya orantı
lı
dı
r
124
H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv. 1996 s353.
125
N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002 s541-544.
109
 Çok boyutlu ölçekleme ile analiz edilecek veriler farklı
lı
klar belirtiyor ise,
farklı
lı
klar matrisi nicel değerler içermeli ve tüm farklı
lı
k ölçüleri aynıölçümleme
ile hesaplanmı
şolmalı
dı
r.
110
BÖLÜM 3 Sİ
GORTACILIK SEKTÖRÜNDE MÜŞTERİ
İ
Lİ
ŞKİ
LERİYÖNETİ
MİYAKLAŞIMIYLA Bİ
R VERİ
MADENCİ
Lİ
ĞİUYGULAMASI
3.1.ARAŞTIRMANIN AMACI
Bu uygulamada
x sigorta ş
irketinin veri tabanı
ndan alı
nan , yangı
n sigortası,
konut sigortası ve de kaza sigortası verileri
kullanı
lmaktadı
r.Sigorta satı
n alan
müş
terilerin
veri madenciliği analizi için
davranı
ş kalı
pları
nı ortaya
çı
kartarak müş
terileri gruplamak ve bu müş
terilere uygun bir satı
ş kampanyası
hazı
rlanmasıiçin bu veri seti kullanı
lmaktadı
r.
3.2.ARAŞTIRMANIN KAPSAMI
Bu araş
tı
rmada kullanı
lan veri seti 111 adet veriden oluş
urken değiş
enleri ise
müş
teri numarası, müş
teri cinsiyeti , sigorta bedeli , primler , sigorta cinsi ve de
semt değiş
kenidir. Uygulamada kullanı
lan veri seti ş
uş
ekildedir.
Tablo 3.1.Veri seti tablosu
Veri setindeki değiş
kenlerin tanı
mlarış
öyledir.
111
Müş
teri numarasıdeğiş
keni
Bu değiş
ken sürekli bir değ
iş
ken olup müş
teri sı
ralaması
nıbelirtmetedir.
Müş
teri cinsiyeti değiş
keni
Bu değiş
ken sigorta satı
n alan müş
terilerin cinsiyetlerini göstermektedir.Kesikli
verilerden oluş
an bu değiş
ken kadı
n-erkek değerlerini alabilmektedir.Bu değiş
kenin
özet bilgileri ş
u ş
ekildedir.
Tablo 3.2.Cinsiyet değiş
keninin özet bilgileri
Yukarı
daki tabloya göre sigorta satı
n alan müş
terilerin % 65,77 ‘si erkek müş
teri
iken % 34,23 ’ü kadı
n müş
terdir.
Sigorta bedeli (YTL) değiş
keni
Bu değ
iş
ken
sigortalanacak
olan malı
n belirlenmiş olan
bedel değerlerini
içermektedir.Bu değiş
kenin dağ
ı
lı
mış
u ş
ekildedir.
Tablo 3.3.Sigorta bedeli değiş
keninin özet bilgileri
Yukarı
daki tabloya göre bu değiş
ken en az 624 YTL en fazla 400000 YTL değer
alabilmektedir.Ortalama değeri 40689,90 YTL iken
dür.
112
standart sapması50355,64 ‘
Primler (YTL) değiş
keni
Bu değiş
ken sigorta satı
n alan
müş
terilerin tomlam
ödeyecek olduklarıprim
değerlerini göstermektedir.Bu değiş
kenin özet bilgileri ş
öyledir.
Tablo 3.4.Primler değiş
keninin özet bilgileri
Yukarı
daki tabloya göre bu değiş
ken en az 25 YTL en fazla 4751 YTL değer
alabilmektedir.Ortalama değeri 790 ,81 YTL iken standart sapması801,08 ‘ dir.
Sigorta cinsi değiş
keni
Bu
değ
iş
ken sigorta
satı
n alan
müş
terilerin hangi sigortayıtercih ettiklerini
göstermektedir.Kesikli verilerden oluş
an bu değiş
ken yangı
n-kaza-konut değerlerini
alabilmektedir.Bu değiş
kenin özet bilgileri ş
u ş
ekildedir.
Tablo 3.5.Sigorta cinsi değiş
keninin özet bilgileri
semt değiş
kenidir.
Yukarı
daki tabloya göre bu değiş
kenin % 36,04 ‘ü kaza sigortaları
ndan , % 36,94
’ü konut sigortaları
ndan % 27,03 ‘ü ise yangı
n sigortaları
ndan oluş
maktadı
r.
Semt değiş
keni
113
Bu değ
iş
ken sigortalayıalan müş
terinin hangi semtte oturduğunu gösteren bir
değiş
kendir. Kesikli verilerden oluş
an bu değiş
ken Şiş
li-Beş
iktaş
-Levent değerlerini
alabilmektedir.Bu değiş
kenin
özet bilgileri
ş
u
ş
ekildedir. Bu değiş
kenin özet
bilgileri ş
uş
ekildedir.
Tablo 3.6.Semt değiş
keninin özet bilgileri
Yukarı
daki tabloya göre müş
terilerin % 33,33 ‘ü Şiş
li , % 39,64 ’ü Beş
iktaş
%27,03 ‘ü ise Levent semtlerinde oturmaktadı
rlar.
Bu veri setine uygulanacak olan analizler ş
unlardı
r.
 Birliktelik kurallarıanalizi
 Sepet analizi ,
 Sı
nı
flandı
rma analizleri
 C&RT analizi ,
 C4.5 analizi ,
 Kümeleme analizleri
 K-ortalamalar(k-means) analizi ,
 Kanonikel diskriminant analizi ,
Yapı
lacak olan analizlerin ilki
satı
n
aldı
ktan sonra
koymaktadı
r.Bu analiz
olan sepet analizi , bir müş
terinin
bir baş
ka
sigortayı satı
n
alma
bir sigortayı
olası
lı
ğı
nı ortaya
belirli müş
teri grupları
na belli bir poliçenin yanı
nda
114
baş
ka bir poliçeninde
tektif edilmesine olanak sağlayarak karlı
lı
ğıarttı
rmaya
yardı
mcıolmaktadı
r.
İ
kinci olarak uygulanacak olan analizler
C&RT analizi ve C4.5 analizidir.Bu
analizler müş
terileri belirli kriterlere göre ayrı
ş
tı
rarak müş
teri gruplarıoluş
turmak
için kullanı
lmaktadı
r.
Üçüncü
olarak uygulanacak
olan
analizler K-ortalamalar(k-means) analizi ve
Kanonikel diskriminant analizidir.Bu analizler , benzerliklerine göre müş
terileri
gruplayarak
müş
teri
kümeler
oluş
turmaktadı
r.Bu kümeleme
grupları
na ortak
bir pazarlama
yöntemleri
kullanı
larak
kampanyası yürütülmesine
olanak
Birliktelik kurallarıanalizinden en yaygı
n olarak kullanı
lan analiz
yöntemi
sağlamaktadı
r.
3.3.ARAŞTIRMA İ
LE İ
LGİ
LİUYGULAMA
3.3.1.Birliktelik KurallarıAnalizi
Sepet
analizidir.Bu
analizin temeli
koş
ullu
olası
lı
k
varsayı
mları
na
formüller P(X Y) destek
dayanmaktadı
r.Bu analizde kullanı
lan
kriteri
P(X / Y) güven kriteridir.Güven kriterini hesaplamak için ş
u formül kullanı
lı
r.
P(X Y)
P(X / Y) 
P(Y)
Kullanı
lacak olan değiş
kenler aş
ağı
da açı
klanmı
ş
tı
r.
E : Sigorta satı
n alan erkek müş
teri sayı
sı,
K : Sigorta satı
n alan kadı
n müş
teri sayı
sı,
Y : Yangı
n sigortasısatı
n alan müş
teri sayı
sı,
Ka : Kaza sigortasısatı
n alan müş
teri sayı
sı,
Ko : Konut sigortası
satı
n alan müş
teri sayı
sı,
S : Şiş
li semtindeki müş
teri sayı
sı,
115
ve
L : Levent semtindeki müş
teri sayı
sı,
B : Beş
iktaşsemtindeki müş
teri sayı
sı
dı
r.
Bu analizde ilk olarak kadı
n ve erkek müş
terilerin yangı
n sigortasısatı
n alma
olası
lı
ğı
nıhesaplamak için kullanı
lacaktı
r.Bunun için kullanı
lacak olan tablo
aş
ağı
da verilmiş
tir.
Tablo 3.7.Yangı
n sigortasıiçindeki kadı
n-erkek oranıtablosu
Yukarı
daki tablo kullanı
larak elde edilen formül ş
uş
ekildedir.
P(Y E)
P(Y / E) 
P(E)
Bu formül sigorta satı
n alan bir erkek müş
terinin
olası
lı
ğı
nıgösterir.
P(Y E) %73,3*30 21,99
P(E) %65,8*111 73, 038
21,99
P(Y / E) 
0,3010
73, 038
116
yangı
n sigortası alma
Sigorta satı
n alan bir erkek müş
terinin yangı
n sigortasıalmasıolası
lı
ğı % 30,10
‘dur.Aynıanalizi sigorta satı
n alan bir kadı
n müş
teri için yaparsak ş
u sonuç elde
edilir.
P(Y K) %26, 7 *30 8, 01
P(K) %34, 2*111 37, 962
8, 01
P(Y / K) 
0, 211
37,962
Sigorta satı
n alan bir kadı
n müş
terinin yangı
n sigortasıalmasıolası
lı
ğı% 21,1‘dir.
Bu analizde ikinci olarak kadı
n ve erkek müş
terilerin kaza sigortasısatı
n alma
olası
lı
ğıhesaplanacaktı
r.Bunun için kullanı
lacak olan tablo aş
ağı
da verilmiş
tir.
Tablo 3.8.Kaza sigortasıiçindeki kadı
n-erkek oranıtablosu
Sigorta satı
n alan bir erkek müş
terinin kaza sigortası alma olası
lı
ğı
nış
uş
ekilde
hesaplanı
r.
P(Ka E) %75* 40 30
P(E) %65,8*111 73, 038
30
P(Ka / E) 
0, 4107
73, 038
117
Sigorta satı
n alan bir erkek müş
terinin
kaza sigortasıalmasıolası
lı
ğı % 41,07
‘dir.Aynıanalizi sigorta satı
n alan bir kadı
n müş
teri için yaparsak ş
u sonuç elde
edilir.
P(Ka K) %25* 40 10
P(K) %34, 2*111 37, 962
10
P(Ka / K) 
0, 2634
37,962
Sigorta satı
n alan bir kadı
n müş
terinin kaza sigortasıalmasıolası
lı
ğı% 26,34‘dür.
Bu analizde üçüncü olarak kadı
n ve erkek müş
terilerin konut sigortasısatı
n alma
olası
lı
ğıhesaplanacaktı
r.Bunun için kullanı
lacak olan tablo aş
ağı
da verilmiş
tir.
Tablo 3.9.Konut sigortasıiçindeki kadı
n-erkek oranıtablosu
Sigorta satı
n alan bir erkek müş
terinin konut sigortasıalma olası
lı
ğı
nış
uş
ekilde
hesaplanı
r.
P(Ko E) %48,8* 41 20
P(E) %65,8*111 73, 038
20
P(Ko / E) 
0, 2739
73,038
118
Sigorta satı
n alan bir erkek müş
terinin
kaza sigortasıalmasıolası
lı
ğı % 27,39
‘dir.Aynıanalizi sigorta satı
n alan bir kadı
n müş
teri için yaparsak ş
u sonuç elde
edilir.
P(Ko K) %51, 2* 41 20, 992
P(K) %34, 2*111 37, 962
20,992
P(Ko / K) 
0,5530
37,962
Sigorta satı
n alan bir kadı
n müş
terinin konut sigortasıalmasıolası
lı
ğı% 55,30‘dur.
3.3.2. Sı
nı
flandı
rma Analizleri
Sı
nı
flandı
rma analizi veri setini belirli kriterlere göre ayrı
ş
tı
rarak veri setini
doğ
ru yorumlamamaza yarı
dı
mcıolmaktadı
r.Burada uygulanacak olan analizler
C&RT analizi
ve C4.5 analizidir.Bu analizlerin
sonuç
değerleri karar
ağacı
ş
eklinde belirtilmektedir.Bu analizler aş
ağı
da veri setine uygulanmaktadı
r.
C&RT Analizi
Veri setine , müş
terilerin yerleş
im yerleri esas alı
narak yapı
lan C&RT analizi ş
u
ş
ekildedir.
Tablo 3.10. C&RT analizi sonuç matrisi ve hata oranları
Yukarı
daki tablo C&RT analizinin oluş
turduğu matris değerleridir.Bu analizin
yaprak sayı
sı
nıbelirlemek için kullanı
lan tablo aş
ağı
da verilmiş
tir.
119
Tablo 3.11. C&RT analizinin yaprak analiz sonuçları
Burada oluş
an hata değerlerinden , C&RT analizi için kullanı
lacak olan yaprak
sayı
sıbelirlenmektedir.Bunun için genel hata oranıile üretilen veri setinin (growing
set ) hata değeri karş
ı
laş
tı
rı
lı
r. Analiz sonucunda elde edilen karar ağacış
u
ş
ekildedir.
Tablo 3.12. C&RT analizi sonucunda elde edilen karar ağacıdiyagramı
Yapı
lan analize göre veri seti iki ana gruba
ayrı
lmı
ş
tı
r.ilk grup sigorta bedeli
1410 YTL ‘den küçük müş
teriler , ikinci grup ise sigorta bedeli 1410 YTL’den
büyük olanlar olarak ayrı
lmı
ş
tı
r.Buna göre ;
 Sigorta bedeli 1410 YTL ‘den küçük olan bir müş
terinin tamamı Levent
semtinde oturmaktadı
r.
 Sigorta bedeli 1410 YTL ve de büyük olan bir müş
terinin için ;
120
 Sigorta bedeli 1410 YTL ile 2525 YTL arası
nda ve sigorta primleri 1373
YTL ‘den
küçük
olan
müş
terilerin
% 100
Beş
iktaş semtinde
oturmaktadı
r.
 Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 101 YTL ‘den
küçük olan müş
terilerin % 100 Şiş
ili semtinde oturmaktadı
r.
 Sigorta bedeli 2525 YTL ile 10270 YTL arası
nda ve sigorta primleri 101
YTL ile 963 YTL arası
nda
olan
müş
terilerin
% 66,67 ’si
Şiş
li
semtinde oturmaktadı
r.
 Sigorta bedeli 10270 YTL ve daha büyük değerler için ve sigorta primleri
101 YTL ile 963 YTL arası
nda olan müş
terilerin % 47,62 ’si Beş
iktaş
semtinde oturmaktadı
r.
 Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 963 YTL ile
1111 YTL arası
nda olan
müş
terilerin
% 57,14 Şiş
ili
semtinde
oturmaktadı
r.
 Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 1111 YTL ile
1190 YTL arası
nda olan
müş
terilerin
% 100 Beş
iktaş semtinde
oturmaktadı
r.
 Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 1190 YTL ile
1373 YTL arası
nda olan
müş
terilerin
% 100 Şiş
ili
semtinde
oturmaktadı
r.
 Sigorta bedeli 2525 YTL ‘den büyük ve sigorta primleri 1373 YTL ve
daha büyük
olan
müş
terilerin
oturmaktadı
r.
121
%
83,33 Beş
iktaş semtinde
C4.5 Analizi
Bu
analiz , en iyi karar ağacı analizidir.Özellikle
oluş
turmak için
kullanı
lı
r.Veri
setine
uygulanan
veri setinde belirli kurallar
analiz
süreci
aş
ağı
da
belirtilmiş
tir.
Şekil 3.1. C 4.5 analizi uygulama süreci
Uygulanan
C4.5 analiz sonucu elde edilen karar ağacı elde aş
ağı
daki ş
ekilde
gösterilmektedir.
Şekil 3.2. C 4.5 analizi sonucu elde edilen karar ağacıdiyagramı
122
Elde edilen karar
ağacı
nı
n
belirlenmesinde
sigorta cinsi
değiş
keni
esas
alı
nmı
ş
tı
r.Buna göre ;
 Prim değ
erleri 341 YTL ‘den az olan müş
terilerin % 30,6’sıkonut sigortaları
nı
tercih etmiş
tir.
 Prim değerleri 341 YTL ve daha fazla olan müş
terilerin %51,9 ‘u kaza
sigortaları
nı, %39,0 ‘ıyangı
n sigortaları
nıve % 9,1’i konut sigortaları
nıtercih
etmiş
tir.
 Prim değerleri 341 YTL ve daha fazlasıve sigorta bedeli 82650 YTL
‘den daha fazla olan müş
terilerin % 83,3 ‘ü konut sigortaları
nı, %16,7’
si kaza sigortaları
nıtercih etmiş
tir.
 Prim değerleri 341 YTL ve daha fazlasıve sigorta bedeli 82650 YTL
‘den daha az olan müş
terilerin % 2,8 ‘i konut sigortaları
nı, %54,9’u
kaza sigortaları
nıve % 42,3 ‘ü ise yangı
n sigortaları
nıtercih etmiş
tir.
 Prim değerleri 341 YTL ile 728 YTL arası
ndaki değerler ve sigorta
bedeli 82650 YTL ‘den daha az olan müş
terilerin % 8 ‘i konut
sigortaları
nı, % 32 ‘si kaza sigortaları
nı ve % 60 ‘ıise yangı
n
sigortaları
nıtercih etmiş
tir.
 Prim değ
erleri 728 YTL ‘den daha büyük değerler için
ve sigorta
bedeli 82650 YTL ‘den daha az olan müş
terilerin % 67,4 ‘ü kaza
sigortaları
nıve % 32,6 ‘sıise yangı
n sigortaları
nıtercih etmiş
tir.
Müş
terilerin tanı
mlarıçerçevesinde hangi ürünü daha çok aldı
kları
nıgösteren
C4.5 analizi , özellikle satı
ş kampanyaları
nı
n belirlenmesinde
oynamaktadı
r.
123
önemli bir rol
3.3.2. Kümeleme Analizleri
Kümeleme analizleri , veri setindeki
belirli
gruplara
tekniğ
idir.Burada
atamamı
za
olanak
kullanı
lacak olan
benzerliklerini dikkate alarak
sağlayan
önemli
bir
veri
verileri
madenciliğ
i
kümeleme analizleri , K-Ortalamalar ( K-
MEANS) analizi ve Kanonikel diskriminant analizidir.
K-Ortalamalar ( K-MEANS) Analizi
Veri setinin bu yöntemler kümelere ayrı
lmasısüreci ş
u ş
ekildedir.
Şekil 3.3. K-ortalamalar analizi uygulama süreci
Bu analiz
sürecinin sonucunda , oluş
an kümelerin yapı
larıaş
ağı
daki tabloda
belirtilmiş
tir.
Tablo 3.13. K-ortalamalar analizi sonucu elde edilen kümeler
124
Oluş
turulan
kümelerin uygunluk derecesine bakı
ldı
ğı
nda uygunluğu en iyi olan
küme 0.686 ile 3.kümedir.İ
kinci en iyi uygunluğa sahip olan küme ise 0.579 ile
1.kümedir. Oluş
turulan kümelerin grafiksel olarak görüntüsü ş
u ş
ekildedir.
Şekil 3.4. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü
125
Yukarı
da belirtilen
grafikler , değiş
kenlere
göre kümelerin oluş
turdukları
dağı
lı
mlarıgöstermektedir.
Şekil 3.5. K-ortalamalar analizi sonucu elde edilen kümelerin grafiksel görüntüsü
Yukarı
da
belirtilen
grafikler
, değiş
kenlere
dağı
lı
mları
nıgöstermektedir.
126
göre
oluş
turulan kümelerin
Kümeleri oluş
turulan verilerin liste biçimi ş
u ş
ekildedir.
Tablo3.14. K-ortalamalar analizi sonucu elde edilen kümelerin veri listesi
Görüldüğü gibi K-ortalamalar analizi veri setinde belirli gruplar
oluş
turulan
gruplara
aynı
oluş
turarak
satı
ş kampanyası
nıuygulamamı
za
olanak
sağlamaktadı
r.
Kanonikel Diskriminant Analizi
Veri setine bu analiz sigorta cinsi esas alı
rak uygulanmı
ş
tı
r.Buradan elde edilen
vektörlerin tablosu ş
u ş
ekildedir.
Tablo 3.15. Kanonikel diskriminant analizi sonuçları
127
Buradan elde edilen vektörler ş
unlardı
r.
Z1 4,8 0.09 M 0 S 0, 0003 P
Z2 0,915 0, 0114 M 0 S 0, 0017 P
Bu vektörlerin güvenirlilik tablosu aş
ağı
daki belirtilmiş
tir.
Tablo 3.16. Kanonikel diskriminant analizi sonuçcu elde edilen vektörler
P test istatistiğine bakı
ldı
ğı
nda Z1 ve Z 2 vektörlerinin anlamlıbir vektör olduğu
söylenebilmektedir.
Tablo 3.17. Elde edilen vektörlerle değiş
kenler arası
ndaki iliş
ki
Z1 vektörü , müş
teri numarasıdeğiş
keni ile pozitif yönde 0.996 oranı
nda , sigorta
bedeli
değiş
keni ile pozitif yönde 0,006 oranı
nda ve primler değiş
keni ile ters
yönde 0,269 oranı
nda bir iliş
ki vardı
r.
128
Z2 vektörü , müş
teri numarasıdeğiş
keni ile ters yönde 0.043 oranı
nda , sigorta
bedeli
değiş
keni ile pozitif yönde 0,542 oranı
nda ve primler değiş
keni ile ters
yönde 0,553 oranı
nda bir iliş
ki vardı
r.
Burdan elde edilen vektörlerin grafiksel görüntüsü ş
u ş
ekildedir.
Şekil 3.6. Elde edilen vektörlerle arası
ndaki iliş
kiyi gösteren grafik
Bu grafikteki
X ekseni , veri setinin
gruplanması
na
yardı
mcı olmaktadı
r.X-
ekseninde , -1 ile –3 değerleri arası
ndaki veriler iyi , -1 ile 1 değerler arası
ndaki
veriler normal
ve
1 ve 3 değerleri arası
ndaki veriler kötü
olarak
tanı
mlanmaktadı
r.Buna göre kaza sigortasıdeğerleri normal gruba girerken yangı
n
sigortasıiyi ve de konut sigortasıkötü gruba girmektedirler.
Yukarı
daki grafikteki y ekseninde sigorta bedeli değiş
keni ve x eksenine de Z1
vektörü yerleş
tirildiğ
inde grafik aş
ağı
daki ş
eklini almaktadı
r.
129
Bu grafikte görüldüğü gibi , drama ve aksiyon filmleri satı
n alan müş
terilerin
Şekil 3.7. Z1 vektörü ile satı
n alma miktarıarası
ndaki iliş
kiyi gösteren grafik
Z1
vektörü üzerindeki dağı
lı
mı
na bakı
ldı
ğı
nda kaza sigortaları
nı
n iyi , konut
sigortaları
nı
n normal ve de yangı
n sigortalarıkötü gruba girmektedir.
Yukarı
daki grafikteki y ekseninde sigorta bedeli değiş
keni ve x eksenine de Z2
vektörü yerleş
tirildiğ
inde grafik aş
ağı
daki ş
eklini almaktadı
r.
130
Şekil 3.8. Z 2 vektörü ile satı
n alma miktarıarası
ndaki iliş
kiyi gösteren grafik
Z2 vektörü üzerindeki dağı
lı
mı
na bakı
ldı
ğı
nda kaza ve yangı
n sigortalarınormale
yaklaş
mı
şiken konut sigortaları
nda ise bir değiş
iklik olmamı
ş
tı
r.
111 adet x sigorta ş
irketinin verilerine yapı
lan sepet analizinin kadı
n müş
terilerin
çoğunluğunun konut sigortaları
nı tercih ederken erkek müş
teriler ise kaza
sigortaları
nıağı
rlı
klıolarak tercih ettikleri görülmektedir.Türkiye genelinde erkek
ve
kadı
n statülerinin
yukarı
da
yapı
lan
analiz
sonuçları
nı etkilediği yani
cinsiyetin tercih edilen sigorta poliçesinin üzerinde yüksek bir etkiye sahip
olduğu söylenebilmektedir.Yapı
lan karar ağacı analiz sonuçları
na bakı
ldı
ğı
nda
341 YTL primden daha az prim ödeyen müş
terilerin konut sigortası
nıtercih
ettikleri ortaya çı
kmı
ş
tı
r.K-ortalamalar analizinin
131
sonucunda
oluş
turulan veri
kümelerinin tamamı
na yakı
nı % 40 anlamlı
lı
k
düzeyini
aş
mı
ş
tı
r.Kanonikel
diskiriminant analizi sonucunda ise özellikle konut sigortasıverilerini azaltarak
veriyi daha anlamlıbir hale getirebileceği ortaya çı
kmı
ş
tı
r.
SONUÇ
Bu çalı
ş
mada , son yı
llarda
yaygı
nlaş
an veri madenciliği ve müş
teri iliş
kileri
yönetimi detaylıbir ş
ekilde incelenmiş
tir.Müş
teri iliş
kileri yönetimi aslı
nda bir
iş
letme felsefesi olup daha çok satı
ş kampanyaları
nı
n baş
arı
lı olması için
kullanı
lan bir tekniktir.Veri madenciliğ
i ise satı
ş kampanyaları
nda kullanı
lacak
olan hedef ya da hedef grupları
nı
n tespit edilmesinde kullanı
lmaktadı
r.
Sigorta ş
irketlerinin gerek müş
teri portföylerini arttı
rmak ve de varolan müş
teri
portföyünü korumak için müş
teri iliş
kileri yönetimine ihtiyaç duymaktadı
r.Yoğun
rekabet ortamı
nda poliçe satı
n alan müş
terilerin devamlı
lı
ğı
nısağlamak , kar
marjı
nıarttı
rmak için , özetle ş
irketlerin hayatta
kalabilmesi için uygulanması
gerek ve ş
art bir sistemdir.Özellikle verilen poliçelerin müş
teriye özel bir hale
dönüş
türülmesinin
faydaları ve de sağladı
ğı kar marjı
nı
n yüksek olacağ
ı
görülebilmektedir.Mal , eş
ya satan bir firmadan hizmet satan sigorta ş
irketleri
müş
teri iliş
kileri yönetiminin uygulamaları
na çok daha müsaittir.
Veri madenciliğ
i özellikle mevcut müş
teri bilgilerini özetleyerek veya verileri
arı
ndı
rarak verileri daha kullanı
ş
lıhale
getirilmesine
olanak
sağ
lamaktadı
r.
İ
ş
letmelerin bilgi bombardı
manı
ndan kurtularak verileri amaçları
na uygun kullanma
imkanıvermektedir.
Sigortacı
lı
k sektörüne bakı
ldı
ğı
nda ise gerek veri madenciliği gerekse müş
teri
iliş
kileri yönetimi yeni yeni yaygı
nlaş
maya baş
lamı
ş
tı
r.Özellikle banka bağlantı
lı
olan
sigorta ş
irketleri , müş
teri iliş
kileri yönetimi için pazarlama departmanı
na
bağlıbölümler oluş
turmaktadı
rlar.Bu oluş
turulan bölümlerin amacısatı
şve satı
ş
sonrası destekte müş
teri
iliş
kileri
yönetimini ve de veri
kullanmaktı
r.
132
madenciliğini
Gerek müş
teri iliş
kileri yönetimi (CRM ) gerekse veri madenciliği uygulanabilmesi
için belirli bir düzeyde teknoloji desteğine ihtiyaç duymaktadı
rlar.Veri değerleri
ne kadar fazla olursa teknolojiye olan ihtiyaç da o kadar artmaktadı
r.
Veri madenciliğinden elde edilen sonuçları
n ş
irketlerin
müş
terilerini
daha iyi
tanı
maları
na olanak sağladı
ğıiçin müş
teri ihtiyaçlarıdaha kesin bir ş
ekilde tespit
edilebilmektedir.
Bu çalı
ş
manı
n incelenen müş
teri iliş
kileri yönetimi (CRM) sonucunda müş
teri
iliş
kileri yönetiminin bir felsefe olduğu , veri tabanıve veri analizine bağlıolarak
belirli bir uygulama süreci sonucunda elde edildiği , elde edilen değerler
kullanarak müş
terilere özel ürün oluş
turma süreci olduğu ortaya çı
kmı
ş
tı
r.
Bu çalı
ş
manı
n ayrı
ca veri madenciliği incelenmiş
tir.Veri madenciliğinin çok teknik
bir konu olduğu , uygulamanı
n yapı
labilmesi için teknoloji desteğe ihtiyaç
duyulduğu ortaya çı
kmı
ş
tı
r.Veri madenciliği , genel olarak istatistik analiz
yönetemlerinin
çok sayı
da veri kümesine
uygulanmasısonucunda
müş
teri
iliş
kileri yönetimi için hedef gruplar oluş
turmayıamaçladı
ğıgörülebilmektdir.
Bu çalı
ş
manı
n uygulaması
nda ise x sigortaş
irketinin müş
teri verileri kullanı
larak
sigorta sektöründe veri madenciliğ
i kullanı
mı
nı
n sonuçlarıdeğ
erlendirilmiş
tir.Veri
setine uygulanan analizlerin ana baş
lı
kları
na
bakı
ldı
ğı
nda bunlar ; birliktelik
kurallarıanalizi , sı
nı
flandı
rma analizleri ve de kümeleme analizleridir.
Birliktelik
kuralları analizi
sonucunda
erkek müş
terilerin çoğunluğun kaza
sigortaları
nı tercih ederken kadı
n müş
teriler ise konut sigortası
nıtercih ettikleri
görülmüş
tür.
Yapı
lan sı
nı
flandı
rma analizi sonucunda ise , 341 YTL değerinden
küçük prim
ödeyenlerin kaza sigortaları
nı tercih ettikleri , 341 YTL prim değerinden fazla
ödeme
yapan
ve sigorta bedelleri 82 650 YTL’den
büyük
olan
bir
malı
sigortalayan müş
terilerin çoğunlu konut sigortası
nıtercih etmiş
tir.Ayrı
ca 341 ila
133
728 YTL arası
nda prim ödeyip sigorta bedeli 82 650 YTL’den az olan bir malı
sigortalayan müş
teri ise yangı
n sigortası
nıtercih etmektedir.
Kümeleme analizi sonucunda 5 adet küme oluş
turulmuş
tur.En çok veriye sahip
olan küme % 51 anlamlı
lı
k derecesiyle 46 veriye sahiptir.En anlamlıküme ise %
69 ile 18 veriye sahiptir.
Bu çalı
ş
mada
görüldüğü üzere
veri madenciliği
teknikleri
müş
terileri
sı
nı
flandı
rmak , kümelemek ve de davranı
şolası
lı
kları
nı tahmin etmekte oldukça
güçlü analizleri içermektedir.Yapı
lan çalı
ş
mada özellikle bankacı
lı
k sektöründe
yaygı
n olarak kullanı
lan müş
teri iliş
kileri yönetimi ve veri madenciliği teknikleri
sigortacı
lı
k sektöründe de uygulanmaya çalı
ş
ı
lmı
ş
tı
r.Ürün-müş
teri , ş
irket-müş
teri
arası
ndaki iliş
kileri ortaya konularak müş
terilerin tercihlerine göre poliçe satı
ş
ı
nda
artı
şsağlanmaya çalı
ş
ı
lmı
ş
tı
r.
134
KAYNAKÇA
1. http://www.microsoft.com/turkiye/dynamics/crm/crm_nedir.mspx
2. http://www.biymed.com/pages/makaleler/makale49.htm
3. http://www.apluspost.com/bilgi_teknoloji.php
4. http://www.kobifinans.com.tr/bilgi_merkezi/020305/14318
5. www.tepum.com.tr/Etkinlikler/crm_nedir.pps
6. 65.110.73.19/UploadsNew/Gallery/Presentations/CRM/CRM-distribution.pps
7. http://www.ixirteknoloji.com.tr/crm_nedir.html
8. 65.110.73.19/UploadsNew/Gallery/Seminars/ICT3/III_CRM_AwarenessHandouts.pdf
9. www.srdc.metu.edu.tr/webpage/documents/Kosgeb/CRM_KOSGEB.ppt
10. http://www.sauemk.com/makale.html
11. http://www.erpcrm.com/crm_anasf/crm_nedir.htm
12. http://blog.inspark.com/blog/2006/10/mteri_liklileri.html
13. http://www.herkesmusteri.com/scrm/crmbasarisiz.aspx
14. A. PAYNE , Handbook Of CRM: Achieving Excellence in Customer Management
, Butterworth-Heinemann Publishers 2005.
15. P. Bligh, D. Turk , CRM Unplugged Releasing CRM’s Strategic Value , Wiley
Publishers 2004.
16. O.C.Gel , CRM Yolculuğu ,Sistem Yayı
ncı
lı
k 2004.
17. A.KIRIM ,Strateji Ve Birebir Pazarlama CRM , Sistem Yayı
ncı
lı
k , 2007.
18. Y.ZENGİ
N, Değer Yaratan Müş
teri
İ
liş
kileri Yönetimi ,Yüksek Lisans Tezi,
Marmara Ünv. ,2006
19. R.S. SWIFT ,Accelerating Customer Relationships ,Prentice Hall , 2001.
20. T.T.Bİ
LGİ
N , Veri Madenciliğinde KavramıVe Analiz Yöntemi Uygulamaları,
Yüksek Lisans Tezi, Marmara Ünv. ,2003 .
135
21. M. DEMİ
RALAY ,Hiyerarş
ik
Kümeleme Metotları İ
le
Veri Madenciliği ,
Yüksek Lisans Tezi, Marmara Ünv. ,2005.
22. H.TATLIDİ
L , UygulamalıÇok Değiş
kenli İ
statistiksel Analiz , Hacettepe ünv.
1996.
23. K.KURTULUŞ,Pazarlama Alı
ş
tı
rmaları,Avcı
ol Yayı
nı,1998.
24. H.ARICI , İ
statiksel Yöntemler ve Uygulamaları, Hacettepe ünv. Yayı
nları1998.
25. Ö.SERPER ,Uygulamalıistatistik 1 , Filiz Kitapbevi 1996.
26. K.ÖZDAMAR , SPSS ile Bioistatistik , Kaan Kitabevi 2001.
27. D.GUJARATI , Temel Ekonometri , Literatür Yayı
nevi 1999.
28. K.ÖZDAMAR , Paket Programlar ile İ
statiksel Veri Analizi , Kaan Kitabevi
1999.
29. N.ORHUNBİ
LGE , UygulamalıRegresyon ve Kolerasyon Analiz , İ
Ü. Yayı
nları
1996.
30. N.ÇÖMLEKÇİ, Deney Tasarı
mı ve Çözümlemesi , Anadolu ünv. Yayı
nları
1988.
31. M.AYTAÇ , Matematiksel İ
statistik , Ezgi Kitabevi 1999.
32. M.SPIEGEL, İ
statistik , Bilim Tekik Yayı
nevi 1995.
33. Ö.SERPER ,Uygulamalıistatistik 2 , Ezgi Kitapbevi 2000.
34. F.NEWELL , CRM Neden Baş
arı
lıOlmuyor, Sistem Yayı
nları2004.
35. E.TAŞKIN , Müş
teri İ
liş
kileri Eğitimi ,Papatya Yayı
nları2005.
36. Y.ODABAŞ, Satı
ş
ta
ve
Pazarlamada
Müş
teri
İ
liş
ki
Yönetimi
, Sistem
Yayı
nları2005.
37. O.GEL , Büyük Müş
teri Yönetimi , Sistem Yayı
nları2004.
38. W.CHU, Foundations and Advances in Data Mining ,Springer Publisherss
2005.
39. D.RUAN , Intelligent Data Mining Techniques and
Applications ,Springer
Publisherss 2005.
40. K.ANDERSON , Customer Relationship Management , McGRaw-Hill Publisherss
2002.
41. F. TOURNIAIRE , Just Enough CRM , Prentice Hall PTR Publisherss 2003.
42. C .TODMAN , Designing a Data Warehouse: Supporting Customer Relationship
Management , Prentice Hall PTR Publisherss 2000.
43. N. WOODCOCK , The Customer Management Scorecard: Managing CRM for
Profit, Kogan Page Publisherss 2003.
136
44. M. KANTARDZIC ,Data Mining Concepts, Models, Methods, and Algorithms ,
John Wiley & Sons Publishers 2003 .
45. O.RUD , Data Mining Cookbook , Wiley Computer Publishers 2001.
46. S.MITRA , Data Mining Multimedia , Soft Computing and Bioinformatics ,
Wiley Publishers 2003 .
47. N.YE , The
Handbook
Of
Data Mining , Lawrence Erlbaum Associates
Publisherss 2003 .
48. D . HAND , Principles Of Data Mining , The MIT Press 2001.
49. J.WANG , Data Mining Opportunities and Challenges , IDEA GROUP Publishers
2003 .
50. M .BERRY , Data Mining Techniques , Wiley Publishers 2004 .
51. T. JOHNSON , Exploratory Data
Mining
And
Data
Cleaning ,Wiley
Publishers 2003
52. J. BIGUS , Data Mining With Neural Networks ,McGraw Hill Publishers , 1996 .
53. D.PYLE , Business Modeling And Data Mining , Morgan Kaufmann Publisherss
2003.
54. F.GUILLET , Quality Measures in Data Mining , Springer Publisherss 2007.
55. D.LAROSE , Data Mining Methods and Models , Wiley Publisherss 2006 .
56. L.LOFTIS, Building The Customer-Centric Enterprise , Wiley Publishers 2001.
57. A.Berson , Building Data Mining Application For CRM ,McGraw Hill Publishers
1999.
58. http://www.bendevar.com/v3/makale_326.html
59. http://www.kobifinans.com.tr/yazici.php?Article=8652&Where=bilgi_merkezi&Ca
tegory=020305
60. http://www.init.com.tr/news_articles_tr.asp?haber_id=12
61. R.S.TSAY ,Analysis Of Financial Time Series ,Wiley publishers 2005.
62. B.KEDEM ,Regression Models For Time Series Analysis , Wiley Publishers 2002.
63. W.Hardle , Multivariate Statistics:Exercises And Solutions ,Springer Publishers
2007.
64. N.H.TIMM ,Applied Multivariate Analysis,Springer Publishers 2002.
65. L.L.HARLOW , The Essence Of Multivariate Thinking : Basic Themes And
Methods, LEA Publishers 2005 .
137

Benzer belgeler