Neden Veri Madenciliği? - Veri Madenciliği Araştırma Merkezi

Transkript

Neden Veri Madenciliği? - Veri Madenciliği Araştırma Merkezi
VERİ MADENCİLİĞİNE
BAKIŞ
İçerik
•
•
•
•
•
Veri Madenciliği
Neden Veri Madenciliği?
Veri ve Veri Madenciliğinin Önemi
Günümüzde Kullanılan Veri Madenciliğinin
Çeşitli İsimleri
Veri Madenciliği Nedir?
Neden Veri Madenciliği?
Karar verici için verilen kararın doğruluğu, onun
yeteneklerine, deneyimine ve bilgi birikimine olduğu
kadar sahip olduğu veri kümesinin yeterliliğine de
bağlıdır. Doğru karar vermede, verilerin toplanması,
tasnif edilmesi, hazırlanması, analiz edilmesi ve doğru
yorumlanması çok önemlidir. Ayrıca verilerin
incelenmesi ile birlikte ilişkilerin ortaya çıkarılması da
doğru karar verme için önemli bir rol oynar.
Neden Veri Madenciliği?
 Günümüzde
karar
süreçlerinin
karmaşıklaşması ve sayısal olarak daha
fazla veriye gereksiniminin ortaya çıkması
ile büyük veri tabanlarındaki bilginin
işlenmesi oldukça zor olmaya başlamıştır.
Neden Veri Madenciliği?
Kurumlar ve işletmeler her kayıtlarını elektronik olarak
biriktirmeye başlamış ve sayısal teknolojilerin
gelişmesiyle birlikte akıl almaz derecede veri birikimi
meydana gelmiştir. Veri tabanlarında ve veri
ambarlarında depolanan veri yığınları arasından
anlamlı ilişkilerin, kalıpların ve eğilimlerin ortaya
çıkartılması ihtiyacı doğmuş, gelecek adına doğru
tahminlerin yapılması önem kazanmıştır.
Neden Veri Madenciliği?
Veri madenciliği (data mining) uygulamaları işte bu noktada,
istatistiksel analiz ve modellemeler ile Makine öğrenimi
“artificial intelligence” tekniklerinin kullanılması ile devreye
girmiştir. Karmaşık örüntüleri algılama ve veriye dayalı akılcı
kararlar verebilme becerisi kazandırmada, veri madenciliği;
istatistik, makine öğrenimi, optimizasyon, veri ambarcılığı,
uzman sistemler, örüntü tanıma, yapay zekâ, uyarlamalı
denetim ve kuramsal bilgisayar bilimi ile ilişkilidir.
Verinin içindeki bilginin ortaya çıkarılması için gelişmiş
teknolojiler ve iş deneyimi birlikte kullanılmalıdır.
Veri Madenciliği İle İlişkili Alanlar
Neden Veri Madenciliği?
Bilimsel veritabanlarının ve ağ sistemlerinin
geliştirilmesiyle birlikte bankacılık, finans, ekonomi,
sağlık, adli suçlar, güvenlik ve savunma gibi pek çok
alanda veri madenciliği teknikleri geliştirilmeye
başlanmış, tahmin analizleri, modellemeler ve yapay
zekâ
teknikleri
alanlarında
ciddi
ilerleme
kaydedilmiştir.
Veri ve Veri Madenciliğinin Önemi
Günümüzde ekonomik sistemde veri ya da bilgi, mal ya
da hizmet üretiminin faktörlerinden birisi olarak
algılanmaktadır. Bu ise karar vericileri yanlış karar riskinden
uzaklaşabilmek için, mümkün olduğunca fazla veriyi
depolamaya zorlamaktadır. Ayrıca internetin yaygınlaşması,
rekabetin önemli olması, kar marjlarının düşmesi ve müşteri
memnuniyetinin zorlaşması, bu endişeyi daha da
artırmaktadır. Bu durum ise doğru veriyi toplama ya da doğru
veriye ulaşma zorunluluğunu ortaya çıkarmıştır. Artık veriye
erişmek en az verinin kendisi kadar önemli bir faktör olarak
karşımıza çıkmıştır.
Veri ve Veri Madenciliğinin Önemi
Bilgisayarın yaşamımızda daha çok rol almasıyla, yapılan
her işlem sayısal ortamda kayıt altına alınmaya başladı.
Hastanelerde, belediyelerde veya ticarette yapılan her işlem
artık veritabanlarında yerini almıştır. Hatta bir mağazaya,
alışveriş merkezine girerken ya da çıkarken, bazen de yolda
yürürken kameraya çekilen görüntüler bile bir veritabanı
oluşturmaktadır. Bütün bunlar bir yığın halinde depolanırken
içlerinde nasıl gizli bilgiler taşıdığı bilinmemektedir. Tüm bu
veriler, veritabanlarında çıkarılmayı bekleyen değerli bir
maden gibi durmaktadır. Bir bakıma çevremizde bir sürü veri
varken, bu veriler bilgiye dönüşmeyi beklemektedir.
Veri ve Veri Madenciliğinin Önemi
Günümüzde şirketlerin müşteri ile ilişkileri büyük
ölçüde değişmiştir. İşletmelerde başarılı bir müşteri
ilişkileri yönetimiyle, küresel bir dünyada ve giderek
artan rekabetçi piyasalarda, işletmeler için yaşamsal
önem taşıyan, müşteri için değer yaratmak, müşteri
sadakati sağlamak ve bu konularda kurumsallaşmayı
gerçekleştirmek mümkün olabilecektir.
Günümüzde Kullanılan Veri Madenciliğinin
Çeşitli İsimleri
• Veri Madenciliği (Data mining)
• Veritabanlarında bilgi madenciliği (knowledge mining
from databases),
• Bilgi çıkarımı (knowledge extraction),
• Veri ve örüntü analizi (data/pattern analysis),
• Veri arkeolojisi gibi,
• İş analitikleri (Business analytics)
Veri Madenciliği Nedir?
•
•
•
Literatürde veri madenciliğine ilişkin bir çok tanım
yapılmıştır. Bunlardan bazıları aşağıda verilmiştir.
Veri madenciliği, veri ambarlarında tutulan çok çeşitli
verilere dayanarak daha önce keşfedilmemiş verileri
ortaya çıkarmak, bunlara karar vermek ve gerçekleştirmek
için kullanma sürecidir.
Anlamsız görünen veri yığını üzerinde birçok işlem
yapılarak önemli ve anlamlı bilgilerin çıkarımına olanak
sağlama sürecidir.
Mevcut veri yığınları arasından anlamlı ilişkilerin, kalıpların
ve eğilimlerin ortaya çıkartılmasıdır.
Veri Madenciliği Nedir?
•
•
•
Veri madenciliği, önceden bilinmeyen ilişki ve eğilimlerin
bulunması için bugünün endüstrisinde yaratılan büyük
miktarlardaki veriyi analiz eden bir yoldur.
Veri madenciliği büyük ve karmaşık verilerde
beklenmeyen patikaların, değerli yapıların ve ilginç
ilişkilerin keşfedilmesi bilimidir.
Veri madenciliği, eldeki verilerden üstü kapalı, çok net
olmayan, önceden bilinmeyen ancak potansiyel olarak
kullanışlı bilginin çıkarılmasıdır.
Veri Tabanlarında Bilgi Keşfi Süreci
HAN, J., KAMBER, M., PEI, J., “Data Mining Consepts And
Techniques”, Morgan Kaufmann, USA, 2012, s.7.
Veri Madenciliğinde
Kullanılan Yöntemler
Veri madenciliği yöntemleri işlevlerine göre aşağıdaki
gibi üç temel grupta tanımlanmaktadır.
 Sınıflama (Classification),
 Kümeleme (Clustering),
 Birliktelik kuralları ve sıralı örüntülerdir (Association
rules and sequential patterns).
Referanslar
Berry M, Linoff G., “Data Mining Techniques For Marketing,
Sales And Customer Support”, John Wiley & Sons , New
Jersey, U.S.A, 1997.
Dasu, T. ve Johnson, T. (2003) Explarotary Data Mining and
Data Cleaning.
Ganesh, S. (2002) “Data Mining: Should it be included in the
‘Statistics’ cirriculum?”, The Sixt International Conference
on Teaching Statistics, Cape Town, South Africa, 7–12 July.
Gürsakal N., (2006), Sözcük ve Sayı, SPSS Kamu Günü, 14 Nisan,
2006. SPSS Veri Madenciliği Çözümleri.
Han J., Kamber M., Pei J. (2012), Data Mining, Concept and
Techniques, Elsevier.

Benzer belgeler

Yazılım Kalitesi ve Modelleme

Yazılım Kalitesi ve Modelleme Veri ve Veri Madenciliğinin Önemi Günümüzde şirketlerin müşteri ile ilişkileri büyük ölçüde değişmiştir. İşletmelerde başarılı bir müşteri ilişkileri yönetimiyle, küresel bir dünyada ve giderek ar...

Detaylı

Veri Madenciliğine Giriş - Dokuz Eylül Üniversitesi

Veri Madenciliğine Giriş - Dokuz Eylül Üniversitesi Ders İçin Önerilen Kaynaklar Ana kaynak: Han, J. & Kamber, M., Data Mining: Concepts and Techniques, Morgan Kaufmann Publishers, San Francisco, Second Edition, 2006. Yardımcı kaynaklar: 1. Roiger, ...

Detaylı

01-Giriş

01-Giriş Veri madenciliği büyük ve karmaşık verilerde beklenmeyen patikaların, değerli yapıların ve ilginç ilişkilerin keşfedilmesi bilimidir. Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmaya...

Detaylı