Çalışma Grubu Raporu - TBD Kamu-BİB Kamu Bilişim Platformu-18

Transkript

Çalışma Grubu Raporu - TBD Kamu-BİB Kamu Bilişim Platformu-18
TÜRKİYE BİLİŞİM DERNEĞİ
Kamu Bilişim Merkezleri Yöneticileri Birliği
Kamu Bilişim Platformu
BÜYÜK VERİ UYGULAMALARI
Çalışma Grubu 4
RAPORU
Sürüm 1.0
http://www.tbd.org.tr
11 Mayıs 2016
TBD Kamu-BİB
Kamu Bilişim Platformu XVIII
Hedef Kitle
Bu raporun hedef kitlesi, tüm kamu kurum ve kuruluşları, sivil toplum
kuruluşları, özel sektör ve uluslar arası kuruluşlardır.
Belge No
:
TBD/Kamu-BİB/2016-BG4
Tarihi
:
11 Mayıs 2016
Durumu
:
Taslak Rapor – sürüm 1.0
i
Yayını Hazırlayanlar
Başkan
Prof. Dr. Erdoğan Doğdu
TOBB Ekonomi ve Teknoloji Üniversitesi
Başkan Yardımcısı
Yrd.Doç.Dr. Ziya Karakaya Atılım Üniversitesi
Kamu-BİB YK Temsilcileri
Mesut KÜÇÜKİBA
TCDD
Sadettin KAYA
T.C. Başbakanlık
Grup Üyeleri
A. Esad Berktaş
Sağlık Bakanlığı
Ayşe Gül İbrişim
TSE
Barış Tamer Akyılmaz
İŞKUR
İrem Soya
İŞKUR
Lütfi Özbilen
Fokus Akademi
Özlem Gürel
Sağlık Bakanlığı
Refia Karaca
İDE Danışmanlık
Semih ÇELİK
Adalet Bakanlığı
Serhan Kars
Başbakanlık
Umut Elmas
Sağlık Bakanlığı
Veysel Uğur Kızmaz
İŞKUR
ii
TEŞEKKÜR
Bu kılavuzu hazırlanmasında yorumlarıyla ve önerileriyle yardımlarını
esirgemeyen Onsekizinci Dönem TBD Kamu-BİB Yönetim Kurulu üyelerine
teşekkürlerimizi sunarız.
iii
İÇİNDEKİLER
TEŞEKKÜR .................................................................................................. iii
İÇİNDEKİLER ............................................................................................... iv
TANIMLAR VE KISALTMALAR ..................................................................viii
ŞEKİLLER .................................................................................................... ix
TABLOLAR .................................................................................................. ix
ÖNSÖZ .......................................................................................................... x
BÖLÜM 1 ....................................................................................................... 1
Büyük Veri .................................................................................................... 1
1.1 Tanım.......................................................................................................................... 1
1.2 Araçlar ........................................................................................................................ 2
MapReduce................................................................................................................... 2
Hadoop .......................................................................................................................... 3
Spark ............................................................................................................................. 4
Storm ............................................................................................................................. 5
FLink.............................................................................................................................. 6
Apache Ranger ............................................................................................................. 7
Knox Gateway .............................................................................................................. 7
Kafka ............................................................................................................................. 7
R .................................................................................................................................... 8
Cascading ..................................................................................................................... 8
Elasticsearch ................................................................................................................ 8
HBase ............................................................................................................................ 9
Hive ............................................................................................................................... 9
Pig................................................................................................................................ 10
Cassandra ................................................................................................................... 10
iv
MongoDB .................................................................................................................... 10
Dağıtık Dosya Depolama Sistemleri ......................................................................... 11
BÖLÜM 2 ..................................................................................................... 12
Kamuda Büyük Veri ................................................................................... 12
2.1 Kamuda büyük veri kullanım alanları ................................................................. 12
Sağlık .......................................................................................................................... 13
Eğitim .......................................................................................................................... 13
Enerji ........................................................................................................................... 13
Vergi toplama, bütçe ve harcamalar ......................................................................... 13
Güvenlik ...................................................................................................................... 13
2.2 Veri güvenliği, veri mahremiyeti ve gizliliği....................................................... 14
2.3 Açık veri (Open Data)............................................................................................. 15
2.4 Sosyal medya, IoT, Endüstri 4.0, Akıllı şehirler ................................................ 15
BÖLÜM 3 ..................................................................................................... 17
Türkiye’de Kamuda Büyük Veri ................................................................ 17
3.1 Türkiye’de Kamuda Veri İşlemenin Geçmişi ..................................................... 17
3.1.2 Türkiye’de Kamuda Bilişimin Gelişimi ............................................................. 17
3.2 Türkiye’de Kamuda Büyük Veri İçerikli Projeler ............................................... 19
3.2.1 Sosyal Güvenlik Kurumu (SGK) Projeleri........................................................ 20
3.2.2 Milli Eğitim Bakanlığı (MEB) Projeleri .............................................................. 21
3.2.3 Sağlık Bakanlığı Projeleri ................................................................................. 22
3.3 Kamu Kurumlarının Büyük Veri Uygulamaları .................................................. 23
3.3.1 Kamu Kurumlarında Gerçekleştirilen Uygulamalar ........................................ 23
3.3.2 Kamu Kurumlarında Gerçekleştirilebilecek Projeler ....................................... 24
3.4 Mevzuat ve Strateji ................................................................................................. 30
Açık Veri ve Veri Güvenliği ........................................................................................ 30
Kişisel verilerin kullanımı yasasına büyük veri süreçlerinin dâhil edilmesi............. 31
Yasal Dayanaklar ve Strateji ..................................................................................... 32
3.5 Kamu Kurumlarında Büyük Veri Kullanımı ve Büyük Veri Algısı .................. 33
v
Soru 1. Kurumunuzun çalışma alanı nedir? ............................................................. 34
Soru 2. Verilerinizi nerede tutuyorsunuz?................................................................. 34
Soru 3. Kurum olarak “büyük veri” konusuna ilginiz var mı?................................... 34
Soru 4. Kurum olarak “büyük veri” stratejiniz var mı?.............................................. 35
Soru 5. Kurumunuzdaki verinin büyüklüğü nedir? ................................................... 36
Soru 6. Kurumunuzda yapısal ve yapısal olmayan veri büyüklüğü oranları nedir?
.................................................................................................................................................. 36
Soru 7. Kurumunuzda veri işlemede aşağıdaki hangi yaklaşımı uyguluyorsunuz?
.................................................................................................................................................. 37
Soru 8. Büyük ölçekli veri işlemede hangi yöntemleri kullanıyorsunuz? ................ 38
Soru 9. Büyük veri konusunda kurumunuzda hangi yatırımlar yapıldı? ................. 38
Soru 10. Büyük veri yatırımlarınızın yaklaşık değeri nedir? .................................... 39
Soru 10. Büyük veri projeniz var mı? ........................................................................ 39
Soru 11. Büyük veri projeniz yoksa kurumun büyük veri konusunda gelecek
planları nelerdir? ...................................................................................................................... 40
Soru 12. Büyük veri projelerinde çalışan sayınız kaçtır?......................................... 41
Soru 13. Büyük veri işlemede hangi teknolojileri kullanıyorsunuz ya da
inceliyorsunuz? ........................................................................................................................ 41
Soru 14. Kurumunuzda “Büyük Veri Analitiği” konusunda aşağıdaki konularda
yetkin çalışan sayısını belirtiniz. ............................................................................................. 41
BÖLÜM 4 ..................................................................................................... 43
Dünya’da Kamuda Büyük Veri Uygulamaları........................................... 43
4.1 ABD’de Kamuda Büyük Veri ................................................................................ 43
4.2 AB’de Kamuda Büyük Veri ................................................................................... 45
4.3 Asya Ülkelerinde Kamuda Büyük Veri................................................................ 46
Güney Kore ................................................................................................................. 46
Singapur ...................................................................................................................... 47
Japonya ....................................................................................................................... 47
Çin Halk Cumhuriyeti ................................................................................................. 48
4.4 Avustralya'da Kamuda Büyük Veri ..................................................................... 48
BÖLÜM 5 ..................................................................................................... 49
vi
Kamu için öneriler ...................................................................................... 49
5.1 Ulusal öncelikler ..................................................................................................... 49
Savunma ve güvenlik ................................................................................................. 49
Ekomomi, Üretim, Büyüme, ve İstihdam .................................................................. 50
Eğitim ve Sağlık .......................................................................................................... 50
Şeffaflık ....................................................................................................................... 51
5.2 Analitik kurumu ...................................................................................................... 51
5.3 Gerçek-zamanlı analiz ........................................................................................... 51
5.4 Küresel işbirliği ...................................................................................................... 52
5.5 Özel sektör işbirliği ................................................................................................ 52
KAYNAKÇA ................................................................................................ 53
vii
TANIMLAR VE KISALTMALAR
MapReduce
Büyük veri uygulamalarında kullanılan temel
algoritma, Google tarafında önerilmiştir
Hadoop
MapReduce algoritmasını açık yazılım olarak
gerçekleştiren çerçeve yazılım, ilk defa Yahoo
tarafından geliştirildi, şimdi Apache tarafından
geliştiriliyor
Spark
Hadoop’a alternatif olarak Berkeley Üniversitesi’nde
geliştirildi, şimdi Apache tarafından açık yazılım
olarak geliştiriliyor. Bellek tabanlı veri yönetimi ile çok
daha hızlı.
Büyük Veri
Geleneksel veri işleme yöntemlerinin yetersiz kaldığı,
çok büyük ve karmaşık, yapılı ve yapısız veriler.
Açık Veri
Erişimi herkese açık, genelde Web üzerinden
paylaşılan veriler.
IoT
Internet of Things, veya Nesnelerin İnterneti. Veri
toplayan, İnternet’e ve birbirlerine bağlı, haberleşen
cihazlar, araçlar, telefonlar, binalar, taşıtlar, vb.
Endüstri 4.0
Endüstriyel üretimde yeni dönem. Akıllı sistemler,
otomasyon, IoT ve algılayıcıların kullanılması ile
üretim süreçlerinin daha akıllı ve etkin bir şekilde
yapılması.
Akıllı
Smart cities. Yerel yönetimlerin ve belediyelerin
Şehirler
şehir hayatını kolaylaştıracak akıllı sistemlerle, IoT
ve verilerle, şehri yönetmesi, güvenlik ve refahı
artırması.
viii
ŞEKİLLER
Şekil 1. Hadoop 2.0 Ekosistemi ....................................................................4
Şekil 2. Spark genel modülleri ......................................................................5
Şekil 3. Flink ekosistemi ...............................................................................6
Şekil 4. Kafka’nın çalışma biçimi ...................................................................8
Şekil 5. ElasticSearch ile Hadoop yapılanmasının entegrasyonu ..................9
TABLOLAR
Tablo 1. Türkiye'de kamuda önemli bilişim gelişmeleri.................................17
ix
ÖNSÖZ
İnternet ve Web’in hayatımıza girmesi, her alanda sayısallaşma, veri saklama
teknolojilerinde ucuzlama ve kapasite artışı gibi gelişmelerle birlikte çok büyük veri
kaynakları oluşmuş bulunmaktadır. Büyük veri şu üç temel nitelikle klasik veriden
ayrılmaktadır: veri hacmi (volume), veri hızı (velocity), veri çeşitliliği (variety). Veriler
büyüdükçe bu verileri geleneksel yöntemlerle işlemek zorlaşmış ve “büyük veri”
işleme yöntem ve teknolojileri ortaya çıkmıştır. Son yıllarda tüm dünyada ve
ülkemizde “büyük veri”ye ilgi artmaktadır. “Büyük veri” işleme yöntemleri kullanılarak
sanayi, ticaret, bilim, sağlık, eğitim, kamu ve sosyal bilimler gibi hemen her alanda
toplanan büyük verilerden bilgi üretilebilmekte ve bu bilgi kullanılarak karar destek
sistemleri daha etkin çalışmakta ve sonuçta insan hayatı daha kolay yaşanır hale
gelmektedir.
Çalışma grubunun odak noktası kamu alanında büyük veri uygulamalarıdır. Kamu
kurumları, büyük veri konusunda en önemli veri kaynağı ve uygulama alanlarından
birisidir. Kamu kurumları hemen her alanda (büyük) veri toplamaktadır. Bu büyük
verilere dayalı yürütülecek çalışmalarla toplumu ve ülkeyi etkileyecek önemli
kararların alınması ve uygulamaya konması mümkün olabilmektedir.
Bu çalışma çerçevesinde, Türkiye’de kamu kurumlarındaki “büyük veri resminin
çekilmesi,
kurumlarda
mevcut
ve
potansiyel
“büyük
veri”
uygulamalarının
incelenmesi ve nihai olarak kamu kurumlarına “büyük veri” konusunda bir strateji yol
haritasının sunulması hedeflenmiştir.
x
BÖLÜM 1
Büyük Ver
1.1 Tanım
Büyük verinin farklı tanımlarına geçmeden önce tüm tanımlar için geçerli olan
ve Büyük Veri kavramını diğerlerinden ayrıştırmamızda yardımcı olacak önemli ve
kısa bir cümle ile başlayalım: “ilişkisel veritabanı, veri ambarı, veri siloları ve bu
ortamlar için hazırlanmış olan geleneksel yöntem ve arçlarlar ile işlenemeyen veriler
(boyut, hız, kompleksite, çeşitlilik, vb. unsurlar nedeniyle) büyük veri olarak
algılanabilir”.
En temel ve basit anlatımı ile; büyük hacimli (volume), yüksek hızlı (velocity),
çok çeşitlikte (variety) veri kaynakları “büyük veri” olarak tanımlanır. Bu tanıma 3V
kuralı da
denilir.
Günümüzde
bu
V’lerin
sayısı artırılarak zenginleştirilen
tanımlamalara sıkça rastlanabilmektedir. Örneğin, veracity (doğruluk), value
(değerli), validity (geçerlilik), visible (görülebilir) gibi özellikler de büyük verinin
tanımına eklenebilmektedir.
Teknolojinin gelişimi ile veri üretim hızının artması ve toplanan verilerin
işlenebilmesi gittikçe güçleşmiştir. Günümüzde veri üretmeyen ürünün kalmadığı bir
çağa doğru ilerlerken RFID, akıllı sensörler, akıllı evler, akıllı şehirler, akıllı arabalar
ve akıllı telefonların ürettiği verilerin dahi geleneksel yöntemlerle işlenemeyeceği
gerçeği ile yüzleşilmesi sonucunda Büyük Veri kavramı ortaya çıkmış ve her geçen
gün popüleritesi daha da artmaktadır. Özellikle internet’in yaygınlaşması, sosyal
medya kavramlarının ortaya çıkışı ile toplanan veri miktarlarında ve çeşitliliğinde
büyük oranda artışlar gerçekleşmiştir. Bu verilerin anlamlı bir şekilde kullanılması
yönünde Google’in attığı adımlar önemli yer tutmaktadır. Buna ilaveten FacebookTM,
TwitterTM
gibi
sosyal
medya
şirketlerinin
yanısıra,
AmazonTM,
büyük
telekomunikasyon şirketleri, sağlık kuruluşları ve bankaların verileri hızlı bir şekilde
işleyerek kişisel bazda anlamsal bilgiler üretme çalışmaları bu teknolojinin hızlı bir
şekilde gelişmesini sağlamıştır. Günümüzde artık alışveriş sitelerinden, sağlık
sigorta kuruluşlarına kadar her yerde büyük veriden bahsetmek mümkün
olabilmektedir.
1
Yukarıda anlatılan boyut ve çeşitlilikte verilerin bir arada gerçek zamanlı
yada gerçek zamana yakın bir hızda toplanması, depolanması, işlenebilmesi ve
anlamlı bilgiler üretilmesinin en önemli gereksinimleri büyük oranda veri depolama
olanağı ve yüksek hızlarda işlem gücüdür. Bu iki teknoloji aslında büyük veriyi var
eden anahtar teknolojiler olarak görülmektedir. Son yıllara kadar veri depolama ve
yüksek başarımlı hesaplama gücü çözümleri çok pahalı ve büyük teknolojileri
gerektirmekte iken, dağıtık ve paralel hesaplama tekniklerinin gelişiminin yanı sıra,
dağıtık depolama ünitelerinin oluşturulabileceği dosya sistemlerinin gelişmesi ile
sıradan bilgisayarlar ile büyük veri işleyebilecek yapıların düşük maliyetlerle
oluşturulabilmesi mümkün hale gelmiştir.
1.2 Araçlar
Büyük veriyi alıp işleyecek olan programlama tekniklerinin ve yazılım
çözümlerinin üretilmesi ihtiyacı ortadadır. Bu yönde en önemli ivmeyi kazandıran
gelişme Google
TM
tarafından üretilmiş olan GFS dosya sistemi ve MapReduce
programlama tekniği olmuştur. Aşağıda bu araçlarla ilgili özet bilgilere yer
verilmektedir.
MapReduce
MapReduce programlama metodu Google tarafından geliştirilen ve çok
sayıda sıradan bilgisayardan oluşan küme üzerinde dağıtık/eş zamanlı olarak işlem
yapmak için kullanılan bir tekniktir. Google bu metodu kamuoyu ile paylaştıktan
sonra çok sayıda MapReduce metodu kullanan yazılım çözümleri üretilmeye
başlandı ve büyük veri üzerinde kullanımı ile yaygınlaşmaya başladı. Bu tekniğin en
önemli özelliği iki farklı işlem türü kullanarak sonuca ulaşmasıdır. MapReduce
işleminin nasıl çalıştığını anlamak için bir örnek üzerinden açıklamakta fayda var.
Diyelim ki elinizde çok büyük boyutlarda (örneğin Petabyte boyutlarında) düz
metin yazıları bulunmakta ve siz bu yazılarının tamamı üzerinde kullanılan tüm
kelimelerin her birinin toplam sayısına ihtiyaç duymaktasınız. Bu işlem için tek bir
bilgisayar üzerinde çalışan bir tarama çözümü üretebilirsiniz ancak çok uzun
sürelerde bu işlemin sonuçlarını alabilirsiniz. Bu durumda yapılacak olan çözümün
eş zamanlı (paralel) programlama tekniğini kullanması akıllıca olabilir. Şu halde
algoritmanızın eş zamanlı çalışır hale getirilmesi gerekecektir. Elinizdeki en büyük
bilgisayarın 32 adet işlemci çekirdeği olduğunu varsayarsak, bu durumda gerçek
2
anlamda eş zamanlı çalışacak olan iş sayısı bu kadarla sınırlı olacaktır. Verileriniz
de tek bir depolama ünitesinde tutuluyor olduğuna göre her bir eş zamanlı çalışan iş
sürecinin veri erişim hızı paylaşımlı olduğundan yine istenilen sonucu almak zor
olacaktır. Bir adım daha ileriye gidelim ve diyelim ki siz dağıtık programlama
yöntemini de biliyorsunuz ve bu yöntemi uygulayacaksınız. Bu durumda işlerin
dağıtılması işlemini, bunların herhangi birisinde hata çıkması durumunda (fault)
bunu algılayıp hemen gerekli tedbirleri almak zorundasınız, tüm verileri doğru
şekilde iş yapan bilgisayarlara gönderebilmeniz gerekir. Peki ya bu eş zamanlı
işlerden hangisine, verilerinizin hangi bölümünü gönderdiniz? Onlarda herhangi bir
sorun olması durumunda aynı verileri tekrar vermeniz ve yeniden hesap yaptırmanız
gerekir. Hadi bunları da yaptığınızı düşünelim, iyi ama verileriniz tek bir disk
üzerinde duruyor ise bu verileri o kadar sayıdaki eş zamanlı iş parçacıklarına hızla
nasıl aktarabileceksiniz?
Gördüğünüz gibi çok sayıda sorun ile baş etmek zorundayız. İşte bu kadar
çok sorunla boğuşmamak için gelin MapReduce tekniğini eş zamanlı dosya
sistemleri ile birleştirerek kullanmayı düşünelim. Google’ın bu işi nasıl çözerdi? Tabii
ki öncelikle kullandığı GFS (Google File System) tekniği ile verileri çok sayıdaki
bilgisayara küçük bloklar halinde dağıtarak tutmayı, sonra o veri’ler üzerinde iş
yapacak kod parçalarını da aynı bilgisayarlar üzerinde çalıştırmak sureti ile yukarıda
bahsettiğimiz sorunların bir çoğunu bertaraf edecektir. Bunu yaparken elbette ki hata
yakalama ve gerekli düzenlemeleri yapma yeteneği de yine MapReduce kod
kütüphanesi içerisinde bulunacaktır.
Şu halde tek yapmamız gereken önce MAP fonksiyonu ile her bir bilgisayar
kendisinde mevcut olan küçük bloklar üzerinde tarama işlemi çok hızlı bir şekilde
tamamlayabilir, daha sonra da REDUCE işlemi ile bu sonuçlar bir merkezde
toplanabilir. İşte MapReduce programlama metodu bu şekilde çalışmaktadır.
Google’in geliştirdiği GFS yerine genellikle açık kaynak kodlu olan Apache HDFS
(Apache Hadoop Distributed File System) kullanılmaktadır.
MapReduce hakkında : https://en.wikipedia.org/wiki/MapReduce
Hadoop
Yukarıdaki anlatımımızda MapReduce programlama metodunun sonunda
HDFS’den bahsettik. Ve öncesinde de bu yapılanma için birçok kütüphaneden
oluşan bir ekosistemin var olması gerekliliğini ortaya koymuş olduk. Bu noktada
3
yardımımıza
Hadoop
koşmaktadır.
Hadoop bir
ekosistemdir
ve
içerisinde
MapReduce gibi programlama metodlarını kolaylıkla gerçekleştirebileceğimiz
bileşenler bulunmaktadır. Temel yapı taşlarını ise iş parçacığı yönetimi, dağıtık
dosya sistemi ve MapReduce kütüphanesi oluşturmaktadır. Elbette ki bu
ekosistemin iyi bir biçimde çalışabilmesi için gerekli olan diğer bileşenler de
bulunmaktadır. Aşağıda Hadoop 2.0 ekosistemini gösteren şekil bulunmaktadır
(Şekil 1).
Hadoop Web Sayfası : http://hadoop.apache.org/
Şekil 1. Hadoop 2.0 Ekosistemi 1
Spark
Hadoop’un MapReduce motoruna alternatif olarak geliştirilmiş olan genel
amaçlı bir işlem motorunu hadoop’un diğer ekosistemi ile birleştirmek sureti ile,
işlemleri hafızada yapmak sureti ile çok daha hızlı sonuçlar elde edilmesini sağlayan
bir kümeleme yapısıdır. Spark’ın en önemli avantajı hafıza-içi (in-memory)
çalışmasıdır. Böylelikle bazı uygulamalarda Hadoop Mapreduce’a göre 100 katı
1
Apache Hadoop web sayfasından alınmıştır
4
daha hızlı çalışabildiği gösterilmiştir. Bu noktada dikkat edilmesi gereken unsur
çözüm için büyük miktarda hafızaya ihtiyaç olmasıdır. Spark’ın bir diğer önemli
özelliği ise akan veri (streaming data) üzerinde çalışabilmesidir ve çok güçlü bir
Makine Öğrenmesi desteğidir. Bünyesinde barındırdığı Spark SQL kütüphanesi ile
kullanıcıya hem temel SQL işlemleri konusunda destek vermekte, hem de Hadoop
Ekosisteminde bulunan HiveQL gibi özelliklerle entegre çalışabilmektedir. Spark’ın 4
önemli modülü (Hata! Başvuru kaynağı bulunamadı.) şunlardır;
●
●
●
●
MLlib Makine Öğrenmesi kütüphanesi,
Spark SQL kütüphanesi
GraphX kütüphanesi
Spark Streaming kütüphanesi
Spark Web Sayfası : https://spark.apache.org/
Şekil 2. Spark genel modülleri 2
Storm
Twitter tarafından açık kaynak olarak sunulan Apache Storm akan veri
işleme konusunda dağıtık hesaplama mantığını kullanan önemli bir framework
olarak karşımıza çıkmaktadır. Özellikle farklı kaynaklardan gelen verilerin entegre
edilmesi, bunlar üzerinde filitreler çalıştırılması gibi bir işlem bandı mantığının
uygulandığı Storm içerisinde uygulamalar kendi deyimleri ile “topoloji” mantığında ve
üretim bandı tekniği ile çalışması sağlanmaktadır. Spark’da bu işlem DAG (Directed
Asyclic Graph) mantığı ile yapılarak gerektiğinde döngüsel iş akışlarının yaratılması
sağlanırken Storm daha basit bir mantık kullanmıştır. Her ikisinin de akan veri
2
Apache Spark web sayfalarından alınmıştır
5
üzerinde Makine Öğrenmesi, event processing gibi işlemleri kolaylaştırdığını
söyleyebiliriz.
Storm Web Sayfası : https://storm.apache.org/
FLink
FLink de Spark ve Storm gibi akan veri üzerinde işlem yaparken aynı
zamanda tasarımı gereği Hadoop gibi yığın veriler üzerinde de dağıtık küme işleme
tekniğini kullanabilmektedir. Dolayısı ile FLink hem yığın veriler üzerinde hem de
akan veriler üzerinde işlem yapabilmek için geliştirilmiş bir platformdur. Öte yandan
yerel olarak çalışabildiği gibi, YARN, Amazon EC2 yada Google Cloud gibi
ortamlara da rahatlıkla entegre olabilecek şekilde tasarlanmıştır. Diğer platformlarda
olduğu gibi, burada da Makine Öğrenmesi, Graph İşleme, İlişkisel yapılar üzerinde
çalışabilme ve olay işleme (event processing) gibi yetenekleri de barındırmaktadır.
Aşağıda temel yapı taşlarını gösteren bir resim bulunmaktadır (Şekil 3).
FLink Web Sayfası : https://flink.apache.org/
Şekil 3. Flink ekosistemi 3
3
Flink web sayfasından alınmıştır
6
Apache Ranger
Hadoop platformu için merkezi bir güvenlik mekanizması oluşturan bir
framework olan Ranger, özellikle birden çok kişinin (multi-tenant) veri erişimi
yapması gereken yerlerde Hadoop Ekosistemi’nin boydan boya güvenli erişim, yetki
kontrolü gibi işlemlerini üstlenebilmektedir. Hadoop’un son yapılanmasında bulunan
YARN desteği ile daha geniş kapsamlı özellikleri barındırabilmektedir. Proje kuluçka
(incubator) aşamasında olduğundan dikkatle izlenmesi ve çok sık güncelleme ve
düzeltmelerin var olduğunun bilinmesinde fayda var.
Ranger Web Sayfası : http://ranger.incubator.apache.org/
Knox Gateway
REST servislerinin tek noktadan ve güvenli bir şekilde verilmesini sağlayan
bir yapılanma sağlamaktadır. Özellikle Hadoop ortamlarının güvenli şekilde
yönetimini sağlamak üzere bu araç kullanılabilir. Bu proje de henüz kuluçka
aşamasında bulunmaktadır.
Knox Web Sayfası : https://knox.apache.org/
Kafka
LinkedIn tarafından geliştirilen ve bir Apache projesi olarak açık kaynaklı
olarak kullanıma sunulan Kafka akan verinin toplanması ve akan veri işleme
yazılımlarına gönderilmesi için kullanılan hata-toleranslı (fault-tolerant) publishsuscribe (yayınla-abone) modelinde çalışan bir mesaj taşıyıcı aracıdır. En büyük
özelliği Spark, Storm, FLink ve benzeri yapılarla entegre olabilmesi ve çok hızlı
şekilde verileri aktarabilmesidir. Aşağıdaki resimde (Hata! Başvuru kaynağı
bulunamadı.) görüldüğü gibi çok sayıda veri üreticisinin bir merkeze bu verileri
göndermesi, ve aynı verileri çok sayıda tüketici (işlem yapacak olan küme
elemanları) o merkezden verileri çekerek üzerinde yapacakları gerekli işlemleri
yapmalarını sağlayan bir mekanizmadır. Örneğin bir tır filosundan devamlı olarak
coğrafi bilgilerin ve aynı zamanda bu araçta bulunan birçok sensör tarafından
üretilen verilerin tek merkezde toplanmasını, ve bu merkezi noktada toplanan
verilerin gerçek zamanlı olarak yüzlerce bilgisayardan oluşan bir küme tarafından
büyük veri analizine tabi tutulmasını istiyorsanız Kafka tam aradığınız araçtır.
Kafka Web Sayfası : https://kafka.apache.org/
7
Şekil 4. Kafka’nın çalışma biçimi 4
R
R dili açık kaynak olarak geliştirilmiş olan ve özellikle istatistiksel
hesaplamaya yönelik tasarlanmış bir dildir. Bu dilin Büyük Veri ortamında kullanımı
gittikçe yaygınlaşmakta ve yukarıda anlatılmış olan platformların çoğu tarafından
kullanımı desteklenmektedir. Bu dil ile verilerin görsel hale getirilmesi de kolaylıkla
yapılabilmektedir.
R Web Sayfası : https://www.r-project.org/
Cascading
Hadoop ve Spark ortamlarının desteklendiği bir yazılım geliştirme platformu
olarak geliştirilmiş olan Cascading ve diğer destek yazılımları ile çok kolaylıkla ve
güçlü yapılarda veri işleme yazılımı geliştirmek mümkündür. Büyük veri için çözüm
geliştirecek olan kişilerin mutlaka incelemesi gereken bir uygulama platformudur.
Özellikle verilerin alınması, işlenmesi ve yüklenmesi (ETL) işlemlerini çok kolaylıkla
yapmamızı sağlayacak bu platform aynı zamanda diğer veri analizi tekniklerinin
kullanımı da kolaylaştırırken, hızlı çözüm üretebilmeyi sağlamaktadır. Java yada
Scala ile çözüm üretenlerin mutlaka bu projeyi takip etmesi gerektiğine inanıyoruz.
Cascading Web Sayfası : http://www.cascading.org/
Elasticsearch
REST
tabanlı
çalışan
Arama
motoru
sunucusu
olarak
geliştirilen
Elasticsearch, büyük veri çözümleri ile kolaylıkla entegre olabilmektedir. Örneğin
4
Apache Kafta web sayfasından alınmıştır
8
hadoop ortamı ile entegre olmasını sağlayan es-hadoop yapısı sayesinde
elasticsearch uygulamasının YARN ve HDFS özelliklerini kullanarak entegre olması
sağlanabilmektedir. Hadoop’a gerçek zamanlı arama yapma yeteneği konusunda
oldukça büyük katkılar sağlayan bu çözümün de kurumlarımızda ihtiyaç olması
halinde kullanımı mümkündür.
Elasticsearch Web Sayfası : https://www.elastic.co/
Şekil 5. ElasticSearch ile Hadoop yapılanmasının entegrasyonu 5
HBase
Google’nin BigTable yapısını örnekleyen ve açık kaynak olarak Java ile
geliştirilmiş, colon bazlı, HDFS üzerinde dağıtık depolama yapabilen bir veri tabanı
yönetim sistemi olan HBase, Şekil 1’de Hadoop ekosisteminde gösterildiği üzere bu
ekosistemin bir parçası olarak çalışmaktadır. Son yıllarda yaygınlaşan ve özellikle
büyük veri uygulamalarında kullanılmakta olan NoSQL veri tabanı sistemlerinden bir
tanesi olan HBase, yüksek hızla çalışan ve ilişkisel olmayan verileri depolama ve
işlemede önemli avantajlar sağlamaktadır. Facebook bu veritabanı sistemini
kendisinin mesaj bölümünü oluşturmak üzere kullanıma başlamıştır.
HBase Web Sayfası : http://hbase.apache.org/
Hive
Hadoop ekosisteminin diğer üyelerinden birisi olan Hive, kendisini veriambarı
yazılımı olarak nitelendirmektedir. Kullanıcısına sağladığı fonksinoletiler aracılığı ile
5
Kaynak: ElasticSearch web sayfas
9
veriambarı işlemlerini saypmasın ve ETL gibi işlemleri kolaylıkla Büyük Veri
uygulamalarına entegre edebilmeyi sağlamaktadır. Hadoop ekosistemi içerisinde
verilere SQL cümleleri ile erişim konusunda büyük kolaylıklar sağlamaktadır. Bu
veriler dosya bazlı olarak HDFS üzerinde duruyor da olabilir, HBase gibi bir
veritabanı yapısında barındırılıyor da olabilir. Hive’in en önemli özelliklerinden birisi
ise kullanıcı tarafından genişletilebilir bir yapıya sahip olmasıdır. Temel SQL
cümlelerinin neredeyse tamamını kapsamaktadır ve bu dile Hive SQL adı
verilmektedir.
Hive Web sayfası : http://hive.apache.org/
Pig
Pig, Hadoop ekosistem ile bütünleşik olarak kullanılabilecek dağıtık
hesaplama yapmayı kolaylaştıran bir programlama dilidir. Bu dilin tam adı Pig Latin
dilidir. Özellikle MapReduce yapısında derlenmiş kod üretme yeteneği olan bu dil
kullanılarak Hadoop ile kod geliştirmeyi ve bu kodların sağlıklı bir şekilde
MapReduce yapısında çalıştırılması sağlanabilmektedir.
Pig Web Sayfası : http://pig.apache.org/
Cassandra
Facebook tarafından geliştirilmiş ve gelen kutusu mesajlarında kullanılmakta
olan bir NoSQL veritabanı yapısı iken 2010 yılında HBase ile yer değiştirilmiş olan
bir veritabanı sistemidir. Her ne kadar Facebook bu sistemin kullanımını bırakıp
yerine HBase kullanmaya başlamışsada sistemin gelişimi devam ettirilmiş ve bugün
Büyük Veri yapılanmalarında kullanım alanı bulmaya devam etmektedir.
Casandra Web Sayfası : http://cassandra.apache.org/
MongoDB
DoubleClick firması tarafından geliştirilmiş ve günümüzde kullanılan en
popüler NoSQL Veri Tabanı yönetim sistemlerinin başlarında gelmektedir. Yapısal
verileri JSON dökümanı tarzında ve dinamik bir şema yapısı olan BSON (Binary
JSON) ile tutmaktadır. Günümüzde bu sistemi kullanmakta olan çok büyük ölçekli
şirketler bulunmaktadır. Bunların en başında MTV Networks, Disney Interatvie
Media Group ve The New York Times gazetesi bulunmaktadır. Açık kaynak kodlu ve
10
ücretsiz sürümünün yanı sıra, ücretli olan sürümü de bulunan bu veritabanı sistemi
kurumlarımızın bu alandaki birçok ihtiyacı giderebilecek nitelik ve gelişmişliktedir.
MongoDB Web Sayfası : https://www.mongodb.com/
Dağıtık Dosya Depolama Sistemleri
Büyük
Veri
işleminde
kullanılabilecek
olan
dağıtık
dosya
yönetimi
sistemlerinin en başında HDFS (Hadoop Distributed File System) gelmektedir. Buna
ek olarak kurumlarımızın bilmesinde ve kullanımında faydalı olabilecek sistemlere
örnek olarak IBM tarafından geliştirilmiş olan Lustre File System ve açık kaynak
kodlu olarak alınıp kurulabilecek olan Ceph Depolama Küme sistemi verilebilir.
Özellikle Ceph Küme sistemi yalnızca Büyük Veri konusunda değil, aynı zamanda
kurumlarımızın dağıtık, güçlü ve büyük çaplı Depolama Alanı oluşturmasını
sağlayabilecek olan bir Depolama Küme Sistemi olarak karşımıza çıkmaktadır.
Sistemin kurulumu konusunda Türkçe kaynaklara Internet üzerinden ulaşmak
mümkündür.
Web Sayfaları:
http://ceph.com/ceph-storage/file-system/
http://lustre.org/
https://hadoop.apache.org/docs/r1.2.1/hdfs_design.html
11
BÖLÜM 2
Kamuda Büyük Ver
Büyük veri kullanımı her alanda olduğu gibi kamuda ve devletlerin
yönetiminde önemli avantajlar sunmaktadır. Bu sebeple son yıllarda tüm dünyada
devletler ve kamu kurumları büyük veri kullanımına yönelmişlerdir. Bu alanda hızlı
ilerleyen ülkeler bu avantajları daha kısa sürede kullanıyor olacak ve diğer ülkelerle
yarışta arayı açacaklardır. Kamuda ve devlette büyük veri kullanımı ile devletin
sunduğu tüm hizmetlerde (sağlık, eğitim, güvenlik, savunma, ulaşım, haberleşme,
enerji, refah, istihdam, vb.) iyileştirme yapılabilir ve hizmetler çok daha iyi sunulabilir.
Buna bağlı olarak kamu harcamalarında iyileştirmeler sağlanabilir, böylece ülkenin
ve bireylerin refahı ve mutluluğu artırılabilir. Bu iyileştirmeler doğrudan devletin
sunduğu hizmetlerde olduğu gibi, kamunun denetleme ve düzenleme yaptığı
alanlarda da “büyük veri” ile değişiklikler ve iyileştirmeler yapılabilir (enerji piyasası,
finans, vb.). Bu bölümde kamuda ve devlette “büyük veri” kullanımına genel bir
bakış yapılacaktır. Tüm alanlara girilmeyecektir, sadece önemli görülen bir kaç
alanda “büyük veri” kullanımına örnekler verilecektir.
2.1 Kamuda büyük veri kullanım alanları
Devletler ve devletin kamu kurumları “büyük veri”yi hemen her alanda
kullanabilir. Çünkü devlet kurumları hemen her alanda “büyük veri”ye sahiptir.
Sağlık, eğitim, savunma, istihdam, ekonomi, enerji, ulaştırma, sosyal güvenlik, vergi,
bütçe gibi her alan devletin ilgi alanındadır. Kamu kurumları doğrudan bu alanlarda
hizmet sundukları gibi, bazen de bu alanlarda düzenlemeler yaparak kanuni ve
hukuki çerçeveyi çizerler (yasama yolu ile) ve çoğu zaman denetlerler ve gerek
duyulduğunda düzenlemeleri güncellerler veya yeni düzenlemeler yaparlar.
Dolayısıyla bu alanlarda veri toplamak da devletin ve kamu kurumlarının görev
alanında yer alır. Toplanan veriler genelde büyük veri olup, bu veri ile yapılacak
analizlerle hizmetlerde ve düzenlemelerde iyileştirmeler yapılabilir. Bunların bir kısmı
aşağıdaki örneklendirilmiştir.
12
Sağlık
Sunulan sağlık hizmetleri toplanan büyük veriler incelenerek ve analiz
edilerek iyileştirilebilir. Örneğin kanser hastalıkları verileri incelenerek kansere sebep
olan etkenler ortaya çıkarılabilir, veya kanser tedavisinde uygulanan yöntemlerin
etkinliği ölçülebilir ve bu sonuçlara göre politika değişikliklerine gidilebilir. Böylece
elde edilen iyileştirmelerle sağlık harcamaları düşürülebilir, toplumun ve bireylerin
sağlığı korunabilir.
Eğitim
Eğitim verileri analiz edilerek eğitim politikalarının etkinliği ölçülebilir ve
iyileştirmeler yapılabilir. Örneğin merkezi sınav sonuçları incelenerek hangi
konularda öğrencilerin eksik oldukları tespit edilip, buna sebep olan nedenler
araştırılabilir ve politika değişiklikleri geliştirilebilir.
Enerji
Enerji ülke harcamalarında en büyük paya sahip kalemlerden birisidir. Enerji
verileri ile yapılacak araştırmalarla örneğin elektrik şebekelerinin daha etkin
çalışması, dengeli kullanımın sağlanması ve sonuç olarak enerji israfının ve
harcamaların azaltılması ve bütçelerin iyileştirilmesi mümkün olabilir.
Vergi toplama, bütçe ve harcamalar
Devlet harcamalarını topladığı vergilerle yapar. Vergi toplamada adaletli
olmak, vergi kaçaklarını önlemek devletin görevidir. Bu alanda toplanan veriler
üzerinden yapılacak analizlerle pekçok iyileştirme yapılabilir. Devlet harcamaları da
aynı şekilde yıllara göre incelenip, bu harcamaların ortaya çıkardığı sonuçlarla ilgili
verilerle korelasyon yapılarak bütçe iyileştirmeleri sağlanabilir.
Güvenlik
Devletin en görevlerinden birisi ülke ve bireylerin güvenliğini sağlamaktır. Bu
ise iç ve dış tehditler konusunda bilgi toplamak, önlem almak, ve savunma
geliştirmektir. Toplanan veriler yapısal bilgiler olabildiği gibi (örneğin telefon arama
kayıtları), yapısız veriler de olabilir (sosyal medya paylaşımları gibi). Günümüzde en
önemli güvenlik tehditlerinden birisi de siber saldırılardır. Bu tür saldırılar doğrudan
ülkelerin ekonomisini, ticaretini, ulaştırmasını, enerji dağıtımını ve günlük hayatını
13
tehdit etmektedir. Bu tehditler “büyük veri” ile önceden tahmin edilebilir, tespit
edilebilir ve önlenebilir. Bu alanda hemen her ülke yeni stratejiler geliştirmektedir,
“büyük veri” analizi de bu stratejilerin bir parçası olmak zorundadır.
Bu örnekler daha da çoğaltılabilir. Yukarıda da belirttiğimiz gibi günlük
hayatın hemen alanında büyük veri vardır ve bu verileri toplamak ve analiz etmek
kamu kurumlarının da görev alanına girmektedir. Şu anda yoğun olarak olmasa da
kamu kurumları eninde sonunda “büyük veri” ile bir şekilde muhatap olmak
durumunda
kalacaklardır
ve
en
uygun
şekilde
bu
veriden
faydalanmak
zorundadırlar. Bu verinin kullanımı ve paylaşımı bazı hukuki sorunları da
beraberinde getirmektedir. Bunlara da aşağıda değinilmiştir.
2.2 Veri güvenliği, veri mahremiyeti ve gizliliği
Kamu kurumları kişisel verileri toplamaktadır ve bu giderek artarak devam
edecektir. Bugün hemen her alanda bireylerin verileri toplanmakta, analiz edilmekte
ve gerektiğinde paylaşılmaktadır. Örneğin gittiğimiz yerleri cep telefonlarımız ve
telefon operatörleri sürekli izlemekte ve kaydetmektedir, girip çıktığımız yerler
kameralar tarafından kaydedilmektedir, okul/hastane/çalışma/alışveriş bilgileri vb.
sürekli kayıt altına alınmaktadır. Bu verilerin gizliliği ve mahremiyeti bireyler
açısından önemlidir. Kişisel verilerin korunması, özellikle tüm dünyada sayısallaşma
ile birlikte, günümüzdeki çok önem kazanan bir konu olmuştur. Verilerin kullanımı,
paylaşılması sırasında anonimleştirilmesi, bireysel verilerin korunması çok önemlidir.
Bu alan ortaya çıkan anlaşmazlıklar sebebiyle hukukun da gündemine girmiştir ve
tüm ülkeler bireysel verilerin korunması ve gizliliğinin sağlanması için kanuni
düzenlemelere gitmektedirler. Türkiye’de bu tür düzenlemelere gidilmektedir, ve 3.4
bölümünde bunlara değinilecektir.
Kamu kurumları topladıkları bireysel verileri gizlemek yanında, korumak da
zorundadırlar. Toplanan verilere erişim kısıtlı ve yine kayıt altında olmak zorundadır.
Yakın zamanda Türkiye’deki milyonlarca seçmenin kişisel verileri (adres, nüfuz
cüzdani bilgileri gibi) çalınmış ve internette yayınlanmıştır. Kamu kurumları verileri
toplamak ve gizlemek yanında güvenliğini de sağlamak zorundadırlar. Çünkü veri
artık en kıymetli metalardan birisi haline gelmiştir, kötü niyetli kişiler bu verileri
kullanarak pek çok zarara ve kötülüğe sebep olmaktadırlar.
14
2.3 Açık veri (Open Data)
Verilerin açık olarak yayınlanması (açık veri) kamu kurumlarının yine
öncelikleri arasında yer almaktadır. Toplanan kamu verilerinin (hatta büyük verilerin)
vatandaşlara, şirketlere, girişimcilere açık olarak erişime açılması ile pek çok
faydalar elde edileceği görülmektedir. Bunun demokrasiyi geliştireceği, ekonomik
fırsatları artıracağı, ve sonuç olarak vatandaşların refahını geliştirdiği görülmektedir.
Öncelikle Amerika’da Obama başkanlığında 2009’da başlayan bu hareket şu anda
tüm dünyada ülkelerin ve kamunun öncelikleri arasına girmiş bulunmaktadır.
Amerika’da data.gov sitesinde federal hükümete ait pek çok veri açık olarak ve
giderek büyüyerek yayınlanmaktadır. Bu verilere, indirilerek kullanılabileceği gibi,
servisler aracılığı ile yazılımlar kullanılarak gerçek-zamanlı da erişilebilmektedir.
2.4 Sosyal medya, IoT, Endüstri 4.0, Akıllı şehirler
Bu bölümde kamu ve toplumu yakından ilgilendiren, son yıllarda ortaya
çıkmış önemli gelişmelere de değinmek istiyoruz. İnternetin hızlı bir şekilde
gelişmesi ile birlikte günümüzde tüm dünyada internet kullanan nüfus sürekli
artmaktadır. Günümüzde dünya nüfusunun %40’ı civarında kısmı internete
erişmektedir6 ve mobil cihazlardan internete erişim sayısı bilgisayarlardan internete
erişim sayısını 2014’te geçmiştir7 ve bu eğilim artarak devam etmektedir. Artık
hemen hemen tüm internet kullanıcıları, sosyal medya uygulamalarını kullanarak
internet ve Web’e katkı vermektedir. FacebookTM kullanıcı sayısı 1.5 milyarı,
WhatsappTM kullanıcıları 1 milyarı, ve TwitterTM kullancıları 320 milyonu aşmış
bulunmaktadır8. Bu sebeple sosyal web’deki veriler sürekli ve katlanarak
artmaktadır. Bu verilerin anlaşılması ile toplumun nabzını tutmak ve anlamak
mümkün olabilir. Kamu kurumları bu konuda aktif olarak sosyal medyayı anlamak
için çaba göstermektedirler ve bu eğilim artarak devam edecektir.
Başka bir paralel gelişme ise tüm dünyada sensörlerin hızlı bir iekilde
artmasıdır. Kullandığımız cep telefonlarında yer alan GPS yer algılayıcılardan,
evlerimizdeki akıllı elektrik sayaçlarına, arabalarımızdaki yer ve araç sensörlerine,
sokaklardaki trafik ve mobese kameralarına kadar algılayıcılar (sensörler) sürekli
veri toplamakta ve bu veriler sunucularda toplanmaktadır. Bu veriler hem özel sektör
6
http://www.internetlivestats.com/internet-users/
7
http://www.smartinsights.com/mobile-marketing/mobile-marketing-analytics/mobile-marketing-statistics/
8
http://www.statista.com/statistics/272014/global-social-networks-ranked-by-number-of-users/
15
hem
kamu
kurumları
dönüştürülmeye
tarafından
çalışılmaktadır.
kullanılmakta
Bu
ve
algılayıcılar
toplum
artık
için
internet
faydaya
ortamında
haberleşmekte ve kendi aralarında da birbirlerine bağlanabilmektedirler. Buna genel
olarak “Nesnelerin Interneti” ve “Internet of Things” (IoT) denmektedir. Gelecekte
tüm insan hayatı, üretim, tüketim ve tüm faaliyetler bu cihazlarla etkileşim içinde
olacak ve farklı bir düzlemde hayat devam edecektir. Farklı araştırmalar, IoT’deki
cihaz sayısını günümüzde 20 milyarlar civarında tahmin etmektedir ve 2020’lerde
sayının 50 milyarlara varacağı öngörülmektedir9. Kamu kurumlarının bu konuda hem
IoT’nin insan ve toplum hayatına olumlu etki etmesini sağlayacak gelişmeleri
desteklemesi, tetiklemesi, geliştirmesi, hem de ortaya çıkacak problemleri (veri
güvenliği gibi) önlemek için gerekli hukuki ve idari düzenlemeleri yapması
gerekmektedir.
IoT, büyük veri, akıllı sistemlerle birlikte ortaya çıkan bir başka önemli
gelişme de üretim alanında Endüstri 4.0 kavramıdır. Bu ilk defa Almanya tarafından
ortaya çıkarılmış bir kavramdır. Günümüzde artık üretim süreçleri sürekli veri ve bilgi
teknolojileri ile iç içe yapılmaktadır. Üretim sistemleri ve endüstriler tüm üretim
süreçlerinde (sensörler kullanarak) veri toplamakta ve üretim süreçlerini mümkün
olduğunca
otomatik,
hatasız,
ve
maliyet/süre
etkin
bir
şekilde
yapmaya
çalışmaktadırlar. Endüstri 4.0 bu endüstriyel geçişi ve yeni dönemi ifade etmektedir.
Kamu kurumlarının bu alanda da aktif bir şekilde bu geçişi kolaylaştıracak,
geliştirecek, teşvik edecek düzenlemeleri yapması gerekmektedir.
Yukarıdaki gelişmelere bağlı olarak son yıllarda “akıllı şehirler” kavramı
ortaya konmuştur. Burada amaçlanan yerel yönetimlerin ve belediyelerin şehirleri,
IoT, akıllı sistemler ve büyük veri kullanarak daha yaşanır hale getirmeleridir. Bu
hedefe ulaşmak için, yerel yönetimlerin şehirle ilgili hemen her alanda veri
toplaması, bu verileri büyük veri teknolojileri ve akıllı sistemler kullanarak
değerlendirmeleri
ve
şehirde
insan
hayatını
kolaylaştırarak
yapmalarını ve sürekli iyileştirme yapmalarını gerektirmektedir.
9
http://www.statista.com/statistics/471264/iot-number-of-connected-devices-worldwide/
16
düzenlemeleri
BÖLÜM 3
Türk ye’de Kamuda Büyük Ver
3.1 Türkiye’de Kamuda Veri İşlemenin Geçmişi
Türkiye’de bilişimin ve veri işlemenin geçmişi, esas itibariyle ilk bilgisayarın
girdiği 1960 yılına kadar dayanmaktadır. Dünya’daki gelişmelere paralel olarak
ülkemiz kamusal alanında bilgi işlem altyapısı veriye dayalı otomasyon projeleri ile
birlikte son 20 yılda büyük bir hız kazanmıştır. İnternet çağına giriş ile birlikte
ilerleme hızı yeni bir boyuta da sahip olmuştur. Dağıtık verinin yaygınlaşmasıyla da
beraber veriyi işleme süreci iki alanda gelişmeye başlamıştır. Bunlardan ilki çok
boyutlu yapısal veri temelli İş Zekası ve Karar-Destek sistemleri olup, ikincisi ise
henüz yeni gelişmekte olan Büyük Veri sistemlerdir.
3.1.2 Türkiye’de Kamuda Bilişimin Gelişimi
Dünya’da bilişimin, elektronik bilgi işlem delikli kart makineleri adı verilen
yığın verileri ayrık işlemlerle işlemeyi insana oranla yüz kat daha hızlı işleyen "unit
record" birim kayıt makineleri ile başlandığı görüşü yaygındır. Buna göre de
ülkemizdeki bilişimsel gelişmenin kısa tarihini aşağıdaki gibi zaman dizinsel
(kronoloji) olarak verebiliriz.
Tablo 1. Türkiye'de kamuda önemli bilişim gelişmeleri
Yıl
1890
ABD İstatistik Bürosunda H. Hollerith, nüfus sayımı işlemlerini hızlandırma amacı
ile sayma, sıralama, ayırma, listeleme, hesaplama makineleri geliştirdi. Bu
makineler 1970’lere kadar istatistik,
muhasebe, bankacılık, sigortacılık
alanlarında yaygın olarak kullanıldı.
1923
Hollerith Muhasebe Makineleri Türkiye’de Tekel İdaresi’nde kullanılmaya
başlandı.
1960
30 Ekim 1960 tarihi ülkemizin bilgi işlem tarihinde önemli bir başlangıç noktası
17
olmuştur. Türkiye’ye bilgisayar ilk olarak Karayolları Genel Müdürlüğü’ne, yolköprü muhasebe, stok denetimi süreçlerini yönetmek için getirtilmiş olan IBM-650
sistemidir.
1963
Türkiye’deki ikinci bilgisayar IBM-1620 sistemi İstanbul Teknik Üniversitesi’nde
kurulmuştur. Yine aynı yıl bankacılık ve finans sektöründeki ilk bilgisayar IBM1401 sistemi Başak Sigorta'da hizmete girmiştir.
1966
Orta Doğu Teknik Üniversitesi’nde ilk bilgisayar hizmete girmiştir.
1967
Devlet Su İşleri Genel Müdürlüğü ve Türkiye İş Bankası’nda kurumsal
bilgisayarlar ilk defa kullanılmaya başlanmıştır.
1969
Bu yıldan itibaren kurumsal tip mainframe (anaçatı) tip bilgisayar sistemleri Türk
Ticaret Bankası ve sonra başta Hacettepe Üniversitesi olmak üzere diğer kamu
ve endüstri kesiminde şirket ve kuruluşlara yayılmaya başlamıştır.
1971
Türkiye kamu genelinde kurumsal bilgisayar sayısı 76’ya ulaşmıştır. Ayrıca bu yıl
içerisinde ülkemizde örgütsel anlamda çok önemli bir adım atılmış ve 22 Nisan
1971 yılında Türkiye Bilişim Derneği (TBD) kurulmuştur. Kuruluş dilekçesinin
altında imzası bulunan bilişimciler Aydın Köksal, Önal Örs, Tamer Uykal, Bülent
Dikman, Ersay Gürsoy, Coşkun Arslan, Atalay Yunusoğlu ve Ünal Yarımağan’dır.
1973
Türkiye kamu genelinde kurumsal bilgisayar sayısı 82 olmuştur. Ayrıca ülkenin
hava savunmasını NATO savunma sistemi içinde sağlamak üzere kullanılmakta
olan 12 büyük bilgisayarla bu sayı 94’tür. 1973 yılında kurulan bilgisayarlarla bu
sayı 100’ü aşmıştır.
1974
PTT Genel Müdürlüğü otomasyona geçme kararı doğrultusunda UNIVAC-9030
sisteminin kuruluş ve ön hazırlık çalışmalarına başlamıştır.
1980
Bu yıllardan itibaren tüm dünyada olduğu gibi ülkemizde de kişisel bilgisayarlar
(PC) hızlı bir biçimde hayatın her alanına girmeye başlamış ve bilgisayar eğitimi
veren dershaneler kurulmuştur. Bilgisayarların daha küçülerek ofislere girmesiyle
gelişmeler hızlandı ve her sektöre yönelik yazılımlar geliştirilmeye başlandı.
Böylelikle yazılım sektörünün temelleri bu yıllarda atılmış oldu.
1986
Türkiye, Geniş Alan Ağları (WAN) ile tanıştı ve bu bağlamda Ege Denizi-İtalya
hattı ile EARN/BITNET sistemine entegre olmuştur.
1991
ODTÜ-TÜBİTAK’tan bir ekip ile bir DPT projesi olan TR-NET projesine
başlanılmış oldu.
1993
12 Nisan 1993 tarihinde ise Ankara-Washington 64K’lık bağlantısı ile Türkiye,
İnternet’le tanıştı.
1994
Kamu ve üniversitelerde büyüme/tanışma yılı olmuş, halka yönelik internet ile
tanıtıcı toplantılar yapılmış ve Dialup ve X.25 üzerinden TR-NET’e bağlantı
oluşturulmuştur.
18
3.2 Türkiye’de Kamuda Büyük Veri İçerikli Projeler
Kamu sektörü büyük veri konusunda araştırmalara başlamıştır. Öncü bir
kısım bakanlık ve kamu kurumları şu anda büyük verinin sağladığı imkânlar ile neler
yapılabileceğini görmeye çalışmaktadır. Şu an için aktif olarak büyük veri üzerine
kurgulanmış bir kamu projesi bulunmamaktadır. Ancak Kalkınma Bakanlığı 20142018 Onuncu Kalkınma Planı 412. maddesinde “Açık kaynak kodlu yazılımlar,
büyük veri, bulut bilişim, yeşil bilişim, mobil platform, nesnelerin interneti gibi ürün,
hizmet ve yönelimler değerlendirilerek kamu için uygun olabilecek çözümler hayata
geçirilecektir.” hedefi yazılmıştır.
Aynı hedefe yönelik olarak B3LAB adı altında Tubitak-Bilgem tarafından
yürütülmekte olan aktif bir proje bulunmaktadır ve bu projenin tanımı şu şekilde
yapılmıştır :
“Bulut Bilişim alanında dünyadaki gelişmeler ışığında ve ülkemizin ihtiyaçları
doğrultusunda 2013 yılında TÜBİTAK BİLGEM Bilişim Teknolojileri enstitüsü
öncülüğünde ve T.C. Kalkınma Bakanlığı Yatırım Programı desteğiyle yürütülen
"Bulut Bilişim ve Büyük Veri Araştırma Laboratuvarı"10 (B3LAB) projesi ile Bulut
Bilişim ve Büyük Veri konularında altyapıların kurulacağı bir araştırma laboratuvarı
oluşturulmaktadır. Bulut Bilişim ve Büyük Veri teknolojileri giderek yaygınlaşan
çevrim içi hizmetlerin merkezileştirilerek iş gücü ve maliyet verimliliğini sağlamakta,
çoklu kaynaklardan üretilen ve devasa boyutlara ulaşan veri miktarlarının üstesinden
gelmektedir.
Bu laboratuvar kapsamında Bulut Bilişim ve Büyük Veri alanında ileri
düzeyde araştırmaların yapılması, ihtiyaç duyulan ürünlerin yerli kaynaklarla
geliştirilmesine öncülük edilmesi, bu alanda çalışacak paydaşlar için araştırma
yapma ve danışmanlık alma olanaklarının sağlanması hedeflenmektedir. Kamu
ihtiyaçlarına yönelik olarak; elde edilen bilgi birikimi, kurulan altyapılar ve kamu
kurumlarına verilen danışmanlık hizmetleri ile Kamu Bulutu’na geçiş için bir model
oluşturulması ve kurumsal büyük veri analizlerinin yapılması planlanlanmaktadır. Ek
olarak, Mahremiyet ve Güvenlik gibi kritik alanlarda milli çözümlerin oluşturulması,
yetişmiş insan gücünün artması, akademik yayınların artması, ekosistemin ve
potansiyel pazarların genişlemesi hedeflenmektedir.”
10
B3LAB: www.b3lab.org
19
Ayrıca Kalkınma Bakanlığı 2014-2018 Bilgi Toplumu Stratejisi ve Eylem
Planı Taslağı 50. Eylemi “Kamuda Büyük Veri Pilot Uygulaması Gerçekleştirilmesi”
2014-2016 yıllarında tamamlanması planlanmıştır. Bu eylem ile büyük verinin
ekonomik değere dönüşmesi sağlanması ve sosyal güvenlik, sağlık, vergi, güvenlik
gibi alanlar başta olmak üzere kamuda büyük veri uygulamalarının geliştirilmesi
hedeflenmiştir. Ayrıca bu eylemin hayata geçirilmesiyle kamu kurum ve kuruluşları
tarafından büyük veri alanında pilot uygulamalar hayata geçirilecek ve kamu verisi
kullanılarak sosyal güvenlik alanında büyük veri pilot uygulamasının geliştirilmesi ve
başarı örneklerinin oluşturulması bu teknolojilerin Türkiye’de yaygınlaştırılmasına
öncülük edecektir. Sosyal Güvenlik Kurumu (SGK) sorumlu kurum olarak tespit
edilmiş olup TUBİTAK ve TÜRKSAT işbirliği yapılacak kuruluşlar olarak yazılmıştır.
SGK, toplamış olduğu büyük miktardaki yapılandırılmış ve yapılandırılmamış veriler
üzerinde çeşitli analizler yaparak verimliliği artırmak, kayıp-kaçak oranlarını
düşürmek ve hizmet kalitesini yükseltmek için büyük veri konusunda çalışmalara
başlamıştır. 50. Eylemin uygulama adımları aşağıdaki şekilde belirlenmiştir:
- Sosyal güvenlik alanında büyük veri uygulamaları belirlenecektir.
- Büyük veri uygulama alanları ile ilgili fayda ve maliyet analizleri yapılacaktır.
- Fayda ve maliyet analizine göre öncelikli alanlar ve gereksinimler
belirlenecektir.
Büyük verinin kamudaki kullanım alanları hakkında ilgili kamu
çalışanlarının eğitilmesi ve büyük veri alanındaki bilinç artırılacaktır.
Ülkemizde, büyük veri çalışmalarına girdi sağlayabilecek belli başlı kamu
kurum projeleri bulunmaktadır. Bunlar şöyle sıralanabilir:
3.2.1 Sosyal Güvenlik Kurumu (SGK) Projeleri
Hizmet Sunumu Genel Müdürlüğü bünyesinde yürütülmekte olan projeler
aşağıdaki başlıklarda sıralanmaktadır.
e-Bildirge Sistemi
Tüm sigorta prim tahsillerinin
ve işyeri tescil kayıtlarının
takibinin
gerçekleştirildiği en büyük sosyal güvenlik projesidir.
MEDULA
Vatandaşlarımıza
ait
tüm
sağlık
ödemelerinin
belirlenen
çerçevesinde yürütülmesine yönelik olarak uygulamaya alınmış bir projedir.
20
kurallar
Aylık Tahsis ve Diğer Uygulamalar
Emeklilere yönelik Aylık Tahsis Uygulaması başta olmak üzere 1500 adet
olgunlaşmış eski (legacy) uygulamadan oluşan bir uygulama grubu bulunmaktadır.
ALO 170 Projesi
Çalışma ve Sosyal Güvenlik İletişim Merkezi, 15 Kasım 2010 tarihinde
hizmete girdi. İletişim merkezi, Çalışma ve Sosyal Güvenlik Bakanlığı ile Sosyal
Güvenlik Kurumu ve Türkiye İş Kurumu Genel Müdürlüğü tarafından sunulan tüm
hizmetlerle ilgili olarak bilgilendirme yapmakta ve çözüm üretmektedir.
Veri Ambarı Projesi
Sağlık, Sigortalama, Tahsis (Emeklilik) rapor grupları ile ortalama 500
standart rapordan on binlerce farklı tertipte (kombinasyonda) sorgu yapılarak rapor
üretilebilen bir veri ambarı oluşturulmuştur. Tüm Türkiye genelinde hizmet veren
500’e yakın uygulamaya ait verileri raporlayabilmek ve analiz etmek için kurulan veri
ambarı 150 TB büyüklüğe ulaşmıştır.
3.2.2 Milli Eğitim Bakanlığı (MEB) Projeleri
Bakanlığın çeşitli zamanlarda başlatmış olduğu büyük kapsamlı projeler
şunlardır.
MEBBİS
Milli Eğitim Bakanlığı Bilişim Sistemleri (MEBBİS) Milli Eğitim Bakanlığı'na
bağlı olan Bilgi İşlem Grup Başkanlığı bünyesinde faaliyet gösteren bir modüller
bütünüdür. Bu modüllere öğretmenler, okul yöneticileri vb. Milli Eğitim Bakanlığı'na
bağlı olarak görev yapan kullanıcı grupları giriş yapabilmektedir.
e-Okul
e-Okul, Milli Eğitim Bakanlığı tarafından Milli Eğitim Bakanlığı Bilişim
Sistemleri (MEBBİS) projesi kapsamında 2007 yılının Ocak ayında kullanıma
açılmış olan bir okul yönetim bilgi sistemi web yazılımıdır. Bir öğrencinin okula
kaydından başlayıp, mezuniyetine kadar olan tüm süreci içeren bir sistemdir. Bilgi
İşlem Dairesi Başkanlığı tarafından geliştirilmektedir.
FATİH Projesi
FATİH (Fırsatları Arttırma ve Teknolojiyi İyileştirme Hareketi) Projesi, Milli
Eğitim Bakanlığı ve Ulaştırma, Denizcilik ve Haberleşme Bakanlığı işbirliği ile
21
Türkiye'deki tüm dersliklere birer adet dizüstü bilgisayar, projeksiyon cihazı ve akıllı
tahta koymaktır. Projenin ön kısımlarında her öğrenciye tablet bilgisayar verilmesi
öngörülmektedir. Projenin amacı, bilgi toplumu yaratmak ve eğitimde teknolojiyi
yararlı kılmaktır.
e-YAYGIN
e-YAYGIN Otomasyon Sistemi; Milli Eğitim Bakanlığı, Hayat Boyu Öğrenme
Genel Müdürlüğüne bağlı yaygın eğitim kurumları (halk eğitimi merkezi, mesleki
eğitim merkezi, olgunlaşma enstitüsü ve turizm eğitim merkezi) tarafından
sürdürülen seminer, faaliyet ve kurslara ilişkin tüm iş ve işlemlerin internet ortamında
yürütüldüğü otomasyon sistemidir.
ALO 147 Projesi
1 Mart 2012 tarihinde Van-Erciş’te hizmete giren ve MEB İletişim Merkezi
kapsamında sürdürülen bir proje olup, Bakanlığın görev ve sorumluluklarıyla ilgili her
türlü talep, şikayet, görüş ve öneri, ihbar, bilgi edinme soruları ile bakanlığın vermiş
olduğu tüm hizmetler hakkında bilgiyi etkin ve hızlı bir biçimde sunabilmek ve
sorunların çözüme kavuşturulabilmesi amacıyla kurulmuştur.
3.2.3 Sağlık Bakanlığı Projeleri
Sağlık Bakanlığı, son yıllarda gerçekleştirmiş olduğu, birbiri ile bütünleşik
çalışan büyük kapsamlı veri merkezli uygulamaları kamu hayatına kazandırmıştır.
e-Nabız Projesi
e-Nabız Projesi muayene, tetkik ve tedavi bilgileri başta olmak üzere tüm
sağlık verilerinin yönetebildiği, tıbbi özgeçmişe tek bir yerden ulaşabilen bir kişisel
sağlık kaydı sistemidir.
UBYS Projesi (Sağlık.NET)
USBS, (Ulusal Sağlık Bilgi Sistemi) tüm vatandaşları kapsayan, her bireyin
kendi bilgilerine erişebildiği, bireyin doğumundan önce başlayıp tüm yaşamı
boyunca sağlığıyla ilgili verilerden oluşan işlevsel bir veri tabanının, yüksek bant
genişlikli ve tüm ülkeyi kapsayan bir iletişim omurgasında paylaşılması ve tele-tıp
uygulamalarına varan teknolojilerin mesleki pratikte kullanılmasını temel alan
elektronik kayıt sistemidir. Bu sistem ayrıca sağlık hizmeti sunan tüm kurum ve
kuruluşların insan gücü, taşınır, taşınmaz, idari ve mali verilerini de kayıt altına
alacak şekilde tasarlanmıştır.
22
MHRS Projesi
Merkezi Hekim Randevu Sistemi; vatandaşların Sağlık Bakanlığı'na bağlı 2.
ve 3. basamak hastaneler ile ağız ve diş sağlığı merkezleri için Alo182 hattından
Merkezi Hekim Randevu Sistemi'ni arayarak canlı operatörlerden veya web
üzerinden kendilerine istedikleri hastane ve hekimden randevu alabilecekleri bir
uygulamadır.
Aşı Takip Sistemi
Tüm ülke genelindeki aşıların stok kontrolünden, taşımasının yapıldığı ve
barındırıldığı her noktadaki ısı maruziyetine, uygulanan kişi ve yerine kadar her türlü
bilgi bu sistem içerisinde tutulmakta ve bu sistem aynı zamanda tüm AHBS (Aile
Hekimleri Bilgi Sistemi) ve HBYS (Hastane Bilgi Yönetim Sistemi) sistemlerinden
bilgi alabilmekte ve Sağlık Bakanlığının diğer veri merkezlerine bu bilgileri
aktarabilmektedir. Bu sistem ile Türkiye’nin 10 bin noktasındaki aşı barındırma
dolaplarının anlık ısı bilgileri merkezde tutulmakta ve gerçek zamanlı takip sistemi
olarak çalışmaktadır.
3.3 Kamu Kurumlarının Büyük Veri Uygulamaları
3.3.1 Kamu Kurumlarında Gerçekleştirilen Uygulamalar
Kamu kurumlarına uygulanan anket sonucunda kurumlarda geliştirilen veya
geliştirilmesi planlanan Büyük Veri uygulamaları bu bölümde anlatılmaktadır.
Elektronik Kamu Bilgi Yönetim Sistemi (KAYSİS)
Elektronik Kamu Bilgi Yönetim Sistemi (KAYSİS), T.C. Başbakanlık İdareyi
Geliştirme Başkanlığı tarafından hazırlanan, kamu kurumlarının teşkilat yapısından,
sunulan hizmetlere, hizmetlerde kullanılan belgelerden, belgelerde bulunan bilgilere
kadar kamu yönetiminde yer alan unsurların mevzuat dayanaklarıyla birlikte tespit
edilerek elektronik ortamda tanımlandığı, geliştirilen e-Devlet uygulamalarının
birbirine tek merkezden entegre edilerek a-Devlete (Akıllı Devlet) geçilmesini
sağlayacak temel bir bilgi sistemidir.
KAYSİS projesi kapsamında şu an veri işçiliği yürütülmektedir. Proje
kapsamında kamu yönetimindeki tüm unsurlar (devlet teşkilatı, sunulan hizmetler,
kullanılan/üretilen belgeler, kullanılan üretilen verilere ilişkin metaveriler vb.)
tanımlanmaktadır. Yapılan tanımlamalar üzerinden Ulusal Süreç Haritaları ve Kamu
23
Veri Akış Şemaları oluşturulmaktadır. Harita ve şemaların tamamlanmasıyla tüm
kamusal uygulamaların merkezi olarak entegrasyonunun sağlanacağı Ulusal Veri
Santrali hayata geçirilecektir. Ulusal Veri Santrali, yapay zekâya dayalı olarak tüm
kamusal verilerin işleneceği ve transferinin sağlanacağı bir yapıda olacaktır.
Enerji Tahmin Projesi
Türkiye kıyıları için rüzgar ve dalga enerji tahmininin yapılabilmesi için bir
Türkiye Rüzgar ve Dalga Atlası projesi geliştirilmiştir.
Bu proje ile bağımsız olarak T.C. Enerji ve Tabii Kaynaklar Bakanlığı
Yenilenebilir Enerji Genel Müdürlüğü tarafından 2014 Aralık ayında “Türkiye Ulusal
Yenilenebilir
Enerji
Eylem
Planı”
yayınlanmıştır
(http://www.eie.gov.tr/duyurular_haberler/document/Turkiye_Ulusal_Yenilenebilir_E
nerji_Eylem_Plani.PDF). Bu eylem planında 2023 hedefleri kapsamında yenilenebilir
enerji için yapılması planlanan yurtiçi ve yurtdışı projeler, teşvik planları anlatılmıştır.
3.3.2 Kamu Kurumlarında Gerçekleştirilebilecek Projeler
Ülkemizde
kamu
kurumlarında
gerçekleştirilen
ve
gerçekleştirilmesi
planlanan Büyük Veri projeleri ile birlikte gerçekleştirilebilecek uygulamalar da
olacaktır. Tüm kamu kurumlarının kendi iş süreçleri kapsamında elde ettikleri verileri
kullanarak planlayacakları projelere örnek olması açısından birkaç örnek proje
uygulaması bu başlık altında belirtilmiştir.
Çalışma ve Sosyal Güvenlik Bakanlığı – Türkiye İş Kurumu
Çalışma ve Sosyal Güvenlik Bakanlığı Türkiye İş Kurumu (İŞKUR)’da
yapılabilecek Büyük Veri uygulamaları ile kişilerin eğitim seviyesi, yaş aralığı,
cinsiyet gibi kıstasları göz önüne alınarak iş arayanlar için birçok proje geliştirilebilir.
İŞKUR için Büyük Veri projeleri, İŞKUR, SGK ve sosyal medya verilerinin işlenmesi
sonucu elde edilecek veriler ile İş Veri Bankası oluşturularak hayata geçirilebilir.
Bu kapsamda “Sosyal Medya Aracılığı ile İş Öneri Sistemi” ve “Sosyal Medya
Aracılığı ile Profil Yapılandırma Sistemi” projeleri örnek projeler olarak düşünülebilir.
Projelerle ilgili bilgiler alt başlıklar halinde rapora eklenmiştir.
Sosyal Medya Aracılığı ile İş Öneri Sistemi
Sosyal medya üzerinden işsizlik ile ilgili paylaşımda bulunanlara SMS – Eposta ile ilgi alanlarına uygun iş imkânı sunulabilir. İş arayanın İŞKUR hesabına
sosyal medya hesaplarını (Facebook, Twitter, Instagram vb.) ilişkilendirmesi ile
24
sosyal medyada yaptığı paylaşımlardan ve profilinden kişinin iş arama durumunda
değişiklik var ise SGK hizmet dökümünden bu durum teyit edilebilir ve kişinin iş
arama profiline, sosyal medyadaki ilgi alanlarına ve sosyal medyada paylaştığı iş
ilanlarına uygun ilanlar İŞKUR tarafından iş arayana önerilebilir.
Sosyal Medya Aracılığı ile Profil Yapılandırma Sistemi
Kişilerin sosyal medya hareketlerinin (profil, paylaşımlar, beğeniler vb.)
kişilerin izni ile takibe alınabilir. Kişi mesai saatlerinde ortalama paylaşım adedinden
fazla paylaşım yapmaya başladıysa veya farklı kontroller yapılarak kişinin işten
ayrılma sürecine girmiş olabileceği anlaşıldı ise kişinin profiline ve paylaşımlarına
uygun işler kişiye önerilebilir. Bu projede kişinin işten ayrılmadan iş arama sürecine
girdiğinin tespiti ve kişi işten ayrıldıktan sonra daha kısa sürede yeni bir işe
başvurmasının sağlanmasıdır.
Paylaşımlarına uygun işler: Kişinin sosyal medyada paylaştığı resimleri,
videoları, yazılı metinleri analiz ederek kişinin ilgi alanına uygun işler bulunabilir.
Örnek olarak bir kişi Kimya bölümünden mezundur ama sürekli bilişim konularında
paylaşım yapıyor, o konuda sayfaları ve grupları beğeniyor ve profilinde çalışma
bilgilerinde bilişim sektöründe çalıştığını belirtiyor ise o kişiye Kimya ile ilgili işlerin
değil, bilişim sektöründe çalıştığı pozisyonlara benzer pozisyonlarda iş önerileri
sunulabilir. Bu bilgiler hem iş önerilerinde hem de profilindeki “bana uygun işler”
bölümüne çalışacak bir sistem olarak tasarlanabilir.
Sağlık Bakanlığı
Teknolojik ilerlemelerin ivme kazanması ile birlikte veri üreten ve paylaşan
nesne sayısında ciddi bir artış yaşanmaktadır. Bununla birlikte internetin hızlanması
ve herkes tarafından erişilebilir hale gelmesi sonucunda çok büyük miktarda veri
üretilmektedir. Devletler ve şirketler büyük veriyi gerçek zamanlı analiz ederek anlık,
uzun vadeli ve anlamlı bilgilere ulaşmayı hedeflemektedir. Ancak bu büyüklükteki
veriler geleneksel yöntemler ve
bu
yöntemlere
uygun üretilmiş araçlarla
yönetilememekte; bu nedenle araştırmacılar daha verimli model ve algoritmalar
kullanarak uygun araçlar geliştirmektedir.
Teknolojik imkânların gelişmesi ve artan yaşam kalitesine bağlı olarak uzun
dönemde sağlıkta sürekli daha iyiye giden bir eğilim beklenmektedir. Bu durumda
büyük veri kavramı, mevcut durumda var olan ve büyüyen sağlık verisi kullanılarak
elde edilecek faydalar açısından büyük önem taşımaktadır. Yapılandırılmış ve
25
yapılandırılmamış sağlık verilerinin toplanarak analiz edilmesi ile hastalıkların tanı ve
tedavi süreçleri geliştirilebilmekte ve kronik hastalıklar gibi ciddi sağlık sorunlarına
sahip risk altında olan bireyler tespit edilebilmektedir.
Sağlık hizmetlerinin sunumunda parçalanmış ve kayıt edilmeyen bilgi, hem
maliyeti yükseltir hem de sağlık bakım kalitesini olumsuz etkiler. Bu bağlamda hasta
odaklı, bilgisayara dayalı, gerek duyulduğunda kolaylıkla ulaşılabilecek ve bakımın
devamlılığının sağlanması için ilişkilendirilebilecek kayıtlar olarak tanımlanan
Elektronik Sağlık Kayıtları halk sağlığına yönelik raporlamaların yerini alarak uzak
hasta takibine olanak sağlaması açısından sağlık alanında büyük veri kullanımına
bir örnek oluşturmaktadır.
Google Grip Trendleri ve Google Dang Humması Trendleri sağlık alanında
büyük veri uygulamalarına örnek oluşturan diğer uygulamalardır. Bu uygulamalar ile
Google arama sorgusuna dayanarak grip ve dang humması hakkında yapılan arama
faaliyetleri sonucunda oluşan veriler bölgeler arasında karşılaştırılabilir ve analiz
edilebilir
hale
gelmektedir.
belirlenebilmektedir.
Bunlara
Böylece
ek
hangi
olarak
bölgelerde
Stanford
salgın
Üniversitesinde
olduğu
tıp
ve
biyomühendislik alanlarında profesör olan Dr. Russ Altman ve ekibi çok büyük veri
setleri içinden istatistik, analiz ve veri madenciliği tekniklerini kullanarak Paxil ve
Pravachol ilaçlarının birlikte kullanıldıkları zaman hastalar üzerinde ürkütücü bir yan
etki meydana getirdiğini ortaya çıkarmışlardır. Analizler, karşıt vaka raporlama
sistemi (AERS) ve Amerika Gıda ve İlaç Yönetimi Kuruluşu FDA tarafından klinikler,
hastalar ve ilaç şirketlerinin 30 yıldan fazla bir süredir bilgilerinin toplandığı
veritabanı kullanılarak yapılmıştır.
Başka bir araştırmada da Kanada merkezli bir şirket olan Kaiser Permanente
ve FDA’nın gerçekleştirdiği bir araştırma sonucunda COX-2 inhibitörü Vioxx isimli
ilacı yüksek dozlarda kullanan kardiyovasküler rahatsızlıkları olan hastalarda yüksek
risk faktörü olduğunu ortaya koymuştur. Bunun üzerine ilaç piyasadan geri
çekilmiştir.
Türkiye’de sağlık alanında yapılan büyük veri çalışmalarına bakıldığında
Sağlık Bakanlığı’nın özellikle Sağlık.NET Online ve e-Nabız uygulamaları dikkat
çekmektedir. Sağlık Bakanlığı büyük veri çalışmalarını altyapı, kurumsal uygulama
ve vatandaş boyutu olarak ele almaktadır.
Çalışmaların sağlam temeller üzerine oturtulması için en önemli ayak olan
altyapı boyutu, sağlık kurumlarında elektronik ortamda üretilen verileri, doğrudan
üretildikleri yerden, standartlara uygun şekilde toplamayı, toplanan verilerden tüm
26
paydaşlar için uygun bilgiler üreterek birinci, ikinci ve üçüncü basamak sağlık
hizmetlerinde verim ve kaliteyi arttırmayı hedefleyen, entegre, güvenli, hızlı ve
genişleyebilen
bir bilgi ve
iletişim platformu
olan
Sağlık.NET Online
ile
geliştirilmektedir. Sağlık Yönetim Sistemi (Karar Destek Sistemleri, Coğrafi Bilgi
Sistemleri) kullanılarak Sağlık.NET Online ile toplanan veriler anlamlı bilgiye
dönüştürülerek hizmet sunumuna ve projelere entegre edilmekte ve yöneticilere
sağlık politikaları için karar desteği sunulmaktadır. Büyük veri çalışmalarının
vatandaş boyutu olan e-Nabız Sistemi ile büyük veri, toplum sağlığını korumaya
yönelik olarak vatandaşların hizmetine ve yönetimine sunulmakta ve böylece
vatandaşlara tüm sağlık geçmişlerine her platformdan erişme ve sağlığını yönetme
imkanı tanınmaktadır.
Sağlık.Net Online, sağlık hizmeti sunan tüm tesislerden çevrimiçi (online)
olarak alınan ve anonimleştirilerek korunan sağlık verilerini kullanarak karar destek
uygulamaları ve büyük veri analizleri sonucunda elde edilen bilgilerle sağlık
politikaları oluşturulması ve sağlık hizmet kalitesinin, alınan raporlar doğrultusunda
artırılması amacıyla geliştirilmiş bir sistemdir. Sağlık.Net Online ile ortak bir veri
tabanı üzerinde, kimlik bilgilerinden arındırılmış olarak toplanan veriler ile hazırlanan
Karar Destek Sistemi (KDS) raporları, Sağlık Bakanlığı’nın sağlık politikaları
oluşturmasında önemli bir rol oynamakla birlikte, hastane, hekim ve hizmet bazlı
değerlendirme yapılmasına imkan sağlamaktadır. Sağlık.NET Online sağlık
sektöründe sorunların ve önceliklerin belirlenmesinde, önlemlerin alınmasında,
sektör kaynaklarının, çalışma ve yatırımların planlanmasında, sunulan sağlık
hizmetlerinin kalitesinin değerlendirilmesinde aldığı rolün yanı sıra bilimsel araştırma
ve çalışmalarda kullanılmak üzere yeterli düzeyde veri toplayacak ve işleyecek bir
fonksiyon üstlenmiştir. Ayrıca, e-Nabız uygulamasının alt yapısını oluşturan sistem
sayesinde vatandaşa kendi sağlık verilerine ulaşabilme imkânı sağlanmıştır.
Büyük veriyi vatandaşın hizmetine ve yönetimine sunan e-Nabız Kişisel
Sağlık Sistemi sağlığı kişiselleştirmek, kişilerin kendi sağlıklarının yönetimini bizzat
kendilerine teslim etmek ve zaman/mekandan bağımsız olarak sağlık verilerine
erişimlerini sağlamak için hayata geçirilmiştir. Dünyada trend haline gelen kişisel
sağlık kaydı sistemlerinden biri olan e-Nabız ile tüm vatandaşlar laboratuvar
tahlilleri, radyolojik görüntüleri, kullandığı reçete ve ilaç bilgileri, acil durum bilgileri,
konulmuş teşhis, verilmiş her türlü rapor, kısaca muayenelerine ait her tür detay
bilgileri
içeren
sağlık
kayıtlarına
cep
telefonlarından,
tabletlerinden,
bilgisayarlarından 7 gün 24 saat erişebilmekte, dilerse belirlediği kurallar
çerçevesinde tümünü ya da bir kısmını istediği süre kadar hekimleri ya da
27
yakınlarıyla paylaşabilmektedir. Vatandaşın sağlığını kesintisiz olarak kontrol altında
tutmasını sağlayan, ilacını içme zamanı geldiğinde ilacını hatırlatan e-Nabız,
kapsamının genişliği itibariyle dünyadaki en gelişmiş kişisel sağlık kaydı
uygulamalarından bir tanesidir. e-Nabız bu özellikleri ile tüm dünyadaki en iyi mobil
sağlık uygulamalarının seçildiği yarışmada (Global Mobile Awards 2016) finale
kalarak başarısını uluslararası alanda göstermiştir. Ayrıca TÜSİAD tarafından e-TR
ödülleri kapsamında, “Kamudan Vatandaşa En iyi Uygulama” seçilmiş ve Sağlık
Bakanlığına “En İyi Dijitalleşen Kurum” ödülünü getirmiştir.
Sağlık Bakanlığı 2016-2017 planları içerisinde de büyük veri uygulamaları ile
ilgili çalışmalar bulunmaktadır. Öncelikle kullanıcı sayısı 3 milyon 480 bini bulan eNabız’a her geçen gün yeni özellikler eklenmekte ve sistem geliştirilmektedir.
Sporcu Sağlığı Bilgi Sistemi ile sporcuların ilaç-gıda etkileşimleri ve doping etkisine
yol açacak çapraz etkileşim bilgilerine erişmeleri sağlanarak bilinçsiz ilaç kullanımı
ve doping vakalarının öngörülmesi sağlanacaktır. Diyanet İşleri Başkanlığına bağlı
sağlık ekipleri hac ve umreye giden vatandaşların sağlık bilgilerine kullanıcıların izni
ile erişebilecek ve orada yapılan işlemler e-Nabız’a gönderilebilecektir. Milli Eğitim
Bakanlığı ile koordinasyon sağlanarak bulaşıcı hastalığa yakalanmış öğrenciler
tespit edilebilecektir. Bunların yanında, Milli Savunma Bakanlığı ile birlikte askeri
raporların elektronik ortamda gönderilmesini,
askerlik hizmeti öncesi kişilerin e-
Devlet üzerinden girdikleri bilgilerin aile hekimleri tarafından görülmesini ve kişilerin
Askerlik Olur Raporlarının ASAL ile paylaşılmasını sağlayan Asker Alma Sistemi ile
ASAL Sağlık Entegrasyonu kurulacaktır. Ayrıca, e-Nabız ile gebelik takibi, hekim
randevuları, aşı takip bilgileri ve büyüme eğrilerine ilişkin bilgilendirme mesajları gibi
özelliklerin geliştirilmesi planlanmaktadır.
e-Nabız ile geliştirilmesi planlanan özelliklerin yanı sıra evrensel olarak artış
gösteren kronik hastalıkların mobil ortamda takibine yönelik Kronik Hasta Yönetim
Sistemi ve doktor-hasta sürecini takip edebilecek yapay zeka tabanlı RoboDoktor
sistemlerinin geliştirilmesi planlanmaktadır. Avrupa Birliği’nin önem verdiği konuların
başında gelen kronik hastalıklara ilişkin etkin yönetim araçlarının araştırılması
konusunda geliştirilmesi planlanan Kronik Hasta Yönetim Sistemi ile kronik
hastalıklara sahip bireylerin hastane ziyaretleri minimize edilecek, gereksiz hastane
ziyaretlerine ilişkin doğrudan ve dolaylı maliyetlerin önüne geçilecek, sistemin
kullanıcılara
göndereceği
okuryazarlığının
günlük
geliştirilmesine
ve
bilgilendirme
kronik
mesajları
hastalıklara
sayesinde
yönelik
sağlık
izleme
ve
değerlendirme çalışmalarının daha hızlı ve efektif bir şekilde yapılmasına katkı
sağlanacaktır.
28
Adalet Bakanlığı
Adalet Bakanlığı için gündemde olan ve çalışmalarına başlanan Büyük Veri
uygulamaları veri ambarı ve veri madenciliği çalışmaları, Adli Veri Bankası
oluşturularak hayata geçirilebilir. Adli Veri Bankası’nı kullanacak akıllı sistemler
sayesinde birçok hastalığın tespiti kolaylaşacak, tedavi süreci hızlanabilecektir.
Suç Takip Sistemi
Adli Veri Bankası projesinin hayata geçirilmesi sayesinde adli davalarda elde
edilen sonuçların analizi ile aynı dava türleri için farklı cezaların verilmesi
engellenecektir. Ayrıca suçların yaş grubu ve bölgesel olarak analizi ile suçlar daha
işlenmeden alınacak tedbirleri hakkında gerek bölgesel gerek de bireysel olarak
çalışmalar değerlendirilebilecektir. Ayrıca bu bilgilerin analizi sonucu Türk ceza
kanununda yapılacak değişikliklerde bu analizler incelenerek cezalardaki caydırıcılık
oranları belirlenebilecektir.
İçişleri Bakanlığı
İçişleri Bakanlığı, bünyesinde bulunan müdürlükler ile beraber çok büyük
miktarda işlenebilir veriye sahiptir. Bu verilerin işlenerek oluşturulacak projeler,
özellikle güvenlik ve göç idaresi konularında ülkemize çok büyük katkı sağlayacaktır.
Aranan-Şüpheli Araç ve Kişi Tespit Sistemi
Emniyet Genel Müdürlüğü (EGM) tarafından gerçekleştirilebilecek Şüpheli
Araç ve Kişi Takip Sistemi, trafikteki tüm araçların aktif paydaş olacağı bir projedir.
Projenin amacı, araç içi kameralar ile plaka sorgulama ve anlık olarak emniyet
birimlerine iletmek, böylelikle aranan araçların bulunmasını kolaylaştırmaktır.
Otoyollara yerleştirilecek sürekli EGM kablosuz ağları ile uyumlu çalışan araç
içi kameraların kullanımının zorunlu hale getirilmesi ile aranan araçların bulunması
büyük ölçüde kolaylaştırılabilir. Kameralarda kaydedilen görüntülerin kameranın
EGM kablosuz ağına bağlandığı andan itibaren sürekli olarak alınması, işlenmesi ve
kameranın çektiği yollardaki araçların plakalarının tespiti yapılabilir. Araçların hangi
saatte hangi yönde ilerlediğinin anlık olarak bulunabileceği bu sistem sayesinde
kayıp ve farklı suçlara karışmış / karışabilecek araçlar kolaylıkla yakalanabilir. Bu
projedeki görüntü işleme sisteminin sonraki aşamaları:
1. Trafikte tehlikeli araç kullanan kişilerin anlık olarak EGM’ye şikayeti ve
kamera kayıtlarının şikayetle ilişkili senkron aktarımı (Büyük Veri değil ama bu
sisteme entegre çalışabilecek bir otomasyon sistemi),
29
2. Trafik cezalarının kameralardan tespit edilerek otomatik olarak kesilmesi,
3. Suçlu / aranan kişilerin kameralardan yüz tanıma sistemi ile otomatik
olarak tespiti ve yerinin bulunması işlemleri gerçekleştirilebilir.
Gıda Tarım ve Hayvancılık Bakanlığı
Gıda Tarım ve Hayvancılık Bakanlığı bünyesinde oluşturulacak Büyük Veri
işleme süreçleri kullanılarak elde edilecek veriler sayesinde gıda ve tarım
sektörlerinde üretim ve kalitenin artması sağlanabilecektir. Üretim ve kalitenin
artması dolaylı yoldan insan sağlığını da olumlu etkileyecek bir sonuç ortaya
çıkartacaktır.
Yetiştiricilik ve Ürün Denetim Sistemi
Gıda Tarım ve Hayvancılık Bakanlığı bünyesinde oluşturulacak Büyük Veri
işleme süreçleri sonucunda elde edilecek veriler sayesinde; gıda sektöründeki
ürünlerin içeriklerinin kıyaslanması sonucu ürünlerin hem kalite hem de sağlık
açısından uygunluklarının denetlenmesi sağlanabilecekken, tarım sektöründe
Türkiye’nin günümüzdeki en önemli sorunlarının başında gelen genetiği ile
oynanmış ürünlerin sayısında azalma yaşanacağı gibi bu üretim sektöründe çalışan
çiftçilerin ürün yetiştirme döneminde faydalanacakları metot ve yan ürünler
sayesinde hem sağlıklı hem kaliteli ürünleri üreterek piyasaya sunmalarına zemin
hazırlayacaktır. Hayvancılık sektöründe ise ilaçlı tarımın azaltılması, genetiği ile
oynanmış tohumların
kullanımının
engellenmesi gibi çalışmalar sonucunda
hayvanlara verilen besin kalitesinin artması ile birlikte yapılacak bölgesel ve
zamansal analizler sonucu hayvanların sağlığı ve onlardan elde edilen ürünlerde de
kalite artmış olacaktır.
3.4 Mevzuat ve Strateji
Açık Veri ve Veri Güvenliği
Açık veri konusunda mevzuat değişiklikleri ile verilerin güvenliği ve bu
verilerin kullanımının daha güvenilir hale getirilmesi ile ilgili mevzuat değişiklikleri
Bilgi teknolojilerinin yaygınlaşması ile beraber bilgi üretimi de ciddi
boyutlarda artış göstermiştir. Bilgi teknolojileri yaygınlaşmadan önce, bilginin büyük
bir çoğunluğu basılı dokümanlarda iken, günümüzde bilgi teknolojileri tarafından
işlenir duruma gelmiştir. Bu nedenle günümüzde bilgiye erişme imkânları geçmiş ile
karşılaştırılamayacak seviyede artmıştır. Bu durum, birçok dezavantajı beraberinde
30
getirmektedir. Bilgi teknolojileri üzerinde bilinçli veya bilinçsiz yapılan hataların çok
ciddi sonuçlar doğurması olasıdır. Bilgi teknolojilerindeki açıklıklar ve dikkatsiz
yapılandırmalar bilgiye yetkisiz erişime yol açabilir. Geçmişte sadece fiziksel
güvenliğin tesis edilmesi ile sağlanan bilgi güvenliği, günümüzde kurumların en çok
zorlandıkları ihtiyaçların başında gelmektedir.
Birçok akademik kaynakta, bilgi güvenliğinin teknik ve teknolojik bir kavram
olmadığı vurgulanmakta, bilgi güvenliğinin sağlanması için kurum kültürünün
değiştirilmesi, kurum üst yöneticilerinin bilgi güvenliği ile ilgili süreçlerde rol alması
gibi sosyal çalışmalara değinilmektedir.
5651 sayılı Internet ortamında yapılan yayınların düzenlenmesi ve bu
yayınlar yoluyla işlenen suçlarla mücadele edilmesi hakkında kanun ile içerik
sağlayıcı, yer sağlayıcı, erişim sağlayıcı ve toplu kullanım sağlayıcıların yükümlülük
ve sorumlulukları ile internet ortamında işlenen belirli suçlarla içerik, yer ve erişim
sağlayıcıları üzerinden mücadeleye ilişkin esas ve usulleri düzenlenmiştir.
Ülkemizde,
daha
önce
düzenleyici
mevzuat
konusunda
çalışmalar
yapılmaktaydı ancak genel kapsamlı bir çalışma olmamakla beraber kurumların
kendi bünyesinde uyguladıkları yönetmelikler düzeyindeydi. Kullanılan genel
mevzuat ise 5651 sayılı Internet ortamında yapılan yayınların düzenlenmesi ve bu
yayınlar yoluyla işlenen suçlarla mücadele edilmesi hakkında kanundu ancak bu
kanun işlenen verilerden ziyade internet ortamındaki içerik sağlayıcı, yer sağlayıcı,
erişim sağlayıcı ve toplu kullanım sağlayıcıların yükümlülük ve sorumlulukları ile
internet ortamında işlenen belirli suçlarla içerik, yer ve erişim sağlayıcıları üzerinden
mücadeleye ilişkin esas ve usulleri düzenlenmiştir. Ancak 24.03.2016 tarihinde
yasalaşan ve 07.04.2016 tarihinde resmi gazetede yayımlanan kişisel verilerin
korunması kanunu ile işlenen verilerin ne gibi şartlarda işlenebileceği ve kimlerle
hangi şartlarda paylaşılacağı konularını genel olarak ele almaktadır.
Kişisel verilerin kullanımı yasasına büyük veri süreçlerinin dâhil
edilmesi
Kişisel verilerin kullanımı yasasında özellikle büyük verilere ve büyük veri
tabanlarına sahip olan firma ya da kurumların bu verileri işlerken uyulması gereken
esaslardan bahsedildiği için bu yasa kapsamında büyük veri süreçlerinden
bahsedilmemektedir. Bu süreçlerin yasaya dâhil edilmemesinin sebebi bilgi
miktarının büyüklüğü ya da küçüklüğünden ziyade bilgilerin kişisel veri kapsamına
girip girmemesidir.
31
Kişisel verilerin işlenmesi ile ilgili kişi onaylarının zorunlu tutulması hatta ıslak
imza ya da e-imza ile onaylanmasının zorunlu tutulması faydalı olacaktır. Ancak
kişisel verileri işleyen büyük firmalar arasında bankalar gibi bir müşterisinden hesap
açmak için bile yaklaşık 15 sayfalık bir şartnameyi imzalamasını talep eden firmalar
bulunmaktadır. Bu nedenle özellikle bu gibi durumların önüne geçebilmek için bu
onayın ayrı bir metin olarak kişilere onaylatılması zorunlu tutulursa hem insanlar
açısından bu verilerin işlenmesinin ve saklı tutulmasının önemi daha iyi anlaşılır
hem de firmalar bu verileri işlemek için onay almanın önemi daha iyi anlaşılabilir.
Bununla beraber kişilerin imzaladığı metinlere kurumların kişisel verileri izinsiz
kullandıkları takdirde karşılaşacakları yasal müeyyidenin bir özetinin konulmasının
zorunlu tutulması da yine bu verilerin öneminin hem firmalar hem de kişiler
tarafından anlaşılmasında pozitif bir etki yapabilir.
Yürürlükte bulunan kişisel verilerin korunması kanunu için ülke çapında kamu
spotu şeklindeki reklamlar yayınlanarak, ilan panolarına bilgilendirme notları asılarak
ve önemli noktalara mobil standartlar kurularak tüm vatandaşların bu kanun
hakkında daha fazla bilgi sahibi olması, kişisel verilerin korunmasındaki önemin
vatandaşın daha iyi kavraması noktasında yine pozitif bir etki yaratacaktır.
Yasal Dayanaklar ve Strateji
Kamu kurumlarının bünyesinde geliştirilen ve geliştirilmesine devam edilen
büyük veri odaklı çözümler, yasaların kendisine verdiği yetkiler çerçevesinde
geliştirilmesi gerekmektedir.
17 Mart 2016 tarih ve 29656 sayılı Resmi Gazete'de yayımlanan “Kişisel
Verilerin Otomatik İşleme Tabi Tutulması Karşısında Bireylerin Korunması
Sözleşmesi (108 sayılı Sözleşme)”ne göre:
- Otomatik işleme konu olan kişisel veriler; belli ve meşru amaçlar için
kaydedilir ve bu amaçlara aykırı şekilde kullanılamaz, kaydedilme amaçlarına göre
uygun ve yerinde olur ve aşırı olmaz (m. 5).
- Yukarıdaki madde de dâhil olmak üzere Sözleşme’nin bazı maddelerine (5,
6 ve 8), Sözleşme’de yer verilen hâllerde istisna getirilebilir (m. 9/2). Bu hâller
arasında, “devlet güvenliğinin korunması, kamu güvenliği, devletin mâli menfaatleri
veya suçların önlenmesi” hususları da yer almaktadır.
Ayrıca, Anayasa’da, kişisel verilerin korunmasına ilişkin esas ve usullerin
kanunla düzenleneceği hükmü yer almaktadır (Anayasa, m. 20). 7 Nisan 2016 tarih
32
ve 29677 sayılı Resmî Gazete’de yayımlanan “Kişisel Verilerin Korunması Kanunu
(KVKK)”na göre:
●
●
●
●
●
●
Kişisel verilerin işlenmesi uyulması gereken genel ilkeler arasında,
“işlendikleri amaçla bağlantılı, sınırlı ve ölçülü olma” ilkesi bulunmaktadır
(KVKK m.4/2/ç).
İşlenmesini gerektiren sebepler ortadan kalktıktan sonra kişisel veriler, resen
veya ilgili kişinin talebi üzerine veri sorumlusu tarafından silinir, yok edilir
veya anonim hâle getirilir (KVKK, m. 7/1). Bu sorumluluğu yerine
getirilmeyenler hakkında, KVKK m. 17/2’de de belirtildiği üzere ilgili cezâi
hükümler uygulanacaktır (TCK, m. 138).
Kişisel veriler, kural olarak ilgilisinin açık rızası olmaksızın aktarılamaz. Bu
kuralın bazı istisnaları bulunmaktadır (KVKK, m. 8/2).
Veri sorumlusunun görevleri (KVKK, m. 10), veri sorumlusunun veri
güvenliğine ilişkin yükümlülükleri (KVKK, m. 12) ve verileri işlenen ilgili kişinin
hakları (KVKK, m. 11) Kanun’da düzenlenmiştir. Buna göre ilgili kişi;
verilerinin işlenip işlenmediğini, ne amaçla işlendiğini, amaca uygun işlenip
işlenmediğini, yurtiçi/yurtdışına aktarılıp aktarılmadığını öğrenme hakkına
sahiptir. Bunların dışında ilgili kişinin, “işlenen verilerin münhasıran otomatik
sistemler vasıtasıyla analiz edilmesi suretiyle kişinin kendisi aleyhine bir
sonucun ortaya çıkmasına itiraz etme” hakkı da bulunmaktadır.
Kanun’da, Veri Sorumluları Sicili öngörülmüştür (KVKK, m. 16). Buna göre
kişisel veri işleyen gerçek ve tüzel kişiler, bu sicile detaylı bilgi göndermek
zorundadır (m. 16/3). Kurul tarafından bu Sicile kayıt zorunluluğuna; işlenen
kişisel verinin niteliği, sayısı, veri işlemenin kanundan kaynaklanması vb.
hâllerde istisna getirilebilecektir (m. 16/2).
KVKK’da yer alan hükümlerin uygulanmayacağı istisnâi hâller düzenlenmiştir
(KVKK, m. 28). Bu maddenin her iki fıkrasında yer alan hükümler, kamu
açısından önemlidir. Nitekim, “Kişisel verilerin millî savunmayı, millî
güvenliği, kamu güvenliğini, kamu düzenini veya ekonomik güvenliği
sağlamaya yönelik olarak kanunla görev ve yetki verilmiş kamu kurum ve
kuruluşları tarafından yürütülen önleyici, koruyucu ve istihbari faaliyetler
kapsamında işlenmesi” hâli, kapsam dışında bırakılmıştır.
Yukarıdaki değinilenler haricinde konuya ilişkin hükümlere; başta Anayasa
(m. 20), Türk Medeni Kanunu (m. 24) ve Türk Ceza Kanunu (m. 135 vd.) olmak
üzere farklı mevzuatlarda yer verilmiştir. Kişisel verilerin silinmesi, yok edilmesi ve
anonim hâle getirilmesi konusu, bir (1) yıl içerisinde çıkarılacak (KVKK, gm. 1/4) bir
yönetmelikle düzenlenecektir (KVKK, m. 7/3).
3.5 Kamu Kurumlarında Büyük Veri Kullanımı ve Büyük Veri
Algısı
Bu çalışma kapsamında büyük veri konusunda “Kamu Kurumlarında Büyük
Veri Anketi” hazırlandı ve birçok kamu kurumları ankete katkı sağladılar. Yapılan
33
anketin sonuçlarına göre büyük veri konusunda oluşan sayısal veriler ile sonuçların
değerlendirilmesi bu bölümde yapılacaktır.
Soru 1. Kurumunuzun çalışma alanı nedir?
Ankete katılan kurumların dağılımı aşağıdaki şekilde gösterilmiştir. Ankete,
Ulaştırma, Belediye, Eğitim, Ekonomi ve Sağlık kurumları başta olmak üzere 18
kamu kurumu katılmıştır.
Soru 2. Verilerinizi nerede tutuyorsunuz?
Kamu kurumlarında uygulama verilerinin nerede tutulduğu ve çoktan seçmeli çok
seçimli soruna alınan cevaplarda, kamu kurumlarının
● %86,8’i rack sunucularında,
● %24,1’inin tekil sunucularda,
● %24,1’inin ise bulut sunucularında
barındırıldığı sonucu ortaya çıkmıştır.
Soru 3. Kurum olarak “büyük veri” konusuna ilginiz var mı?
Kamu kurumlarının büyük verilerin işlenmesi ve büyük veri projelerinin gereksinim
oluşturması noktasında kurumlardan aldığımız geri dönüşler sonucunda kurumların:
● %13.8’inin büyük veri konusuna ilgi duymadıkları,
34
●
●
%10.3’ünün araştırma seviyesinde ilgi duydukları,
%27,6’sının araştırma seviyesinin ilerisine gidip proje fikirlerini değerlendirme
seviyesinde ilgi duydukları,
● %31’inin büyük veri konusunda proje planlaması yapacak seviyede ilgi
duydukları,
● %17,2’sinin proje gerçekleştirme veya büyük veri yatırımı yapacak seviyede
ilgi duydukları
sonucu ortaya çıkmıştır.
Soru 4. Kurum olarak “büyük veri” stratejiniz var mı?
Kamu kurumlarının büyük verilerin işlenmesi ve büyük veri projelerinin kurum iş
süreçlerine etkisini ölçerek uzun vadeli bir strateji oluşturması noktasında
kurumlardan aldığımız geri dönüşler sonucunda kurumların;
● %24.1’inin büyük veri konusunda stratejik bir çalışma yapmadığı,
● %34,5’inin büyük veri konusunda stratejik çalışma yapılmasının gerekliliği
üzerinde durduğu,
● %20,7’sinin büyük veri konusunda stratejik çalışma yapılmasını uzun vadede
planladığı,
● %17,2’sinin büyük veri konusunda stratejik çalışma yapılmasını kısa vadede
planladığı,
● %3,4’ünün büyük veri konusunda stratejik çalışmasının bulunduğu
sonucu ortaya çıkmıştır.
35
Soru 5. Kurumunuzdaki verinin büyüklüğü nedir?
Kamu kurum uygulamalarında oluşan ve her geçen gün büyüyen verilerin
anketin
yapıldığı
tarihi
itibariyle
büyüklüğünün
tanımlanması
istenmiştir.
Kurumlardan alınan cevaplara göre kamu kurumların;
%44,8’inin verileri 10 TB’ın üzerinde,
%24,1’inin verileri 1 TB ile 10 TB arasında,
%13,4’ünün verileri 100 GB ile 1 TB arasında,
%17,2’sinin verileri 10 ile 100 GB arasında,
%0’ının verileri 10 GB’ın altında
olduğu sonucu ortaya çıkmıştır. Kurumların verilerinin her geçen gün
katlanarak büyümesi ve veri kaynaklarının çeşitlenmesi ile büyük veri projelerine
ihtiyacı artacaktır.
Soru 6. Kurumunuzda yapısal ve yapısal olmayan veri büyüklüğü
oranları nedir?
Kamu kurumlarında veri büyüklüğünün yanı sıra verilerin yapısal olup olmadığı da
büyük veri uygulamaları için önemli bir faktördür. Yapısal verilerin işlenmesi
noktasında birçok kolaylık var iken yapısal veriler ile yapısal olmayan verilerin
birlikte işlenmesinin gerektiği durumlarda devreye giren büyük veri uygulamalarının
verileri anlık ve daha az maliyetle daha hızlı işleyebilme noktasındaki avantajları göz
önünde bulundurulduğunda, kurumlar için daha fazla işlevsel uygulamaların
geliştirilmesine olanak sağlayabilir.
Kamu kurumlarından alınan cevaplara göre;
● %3.4’ünün verilerinin tamamının yapısal olduğu,
36
● %34,5’inin verilerinin %80 yapısal olduğu,
● %17,2’sinin verilerinin %60 yapısal olduğu,
● %27,6’sının verilerinin %40 yapısal olduğu
● %17,2’sinin %20 yapısal olduğu,
● %0’ının %0 yapısal olduğu
sonucu ortaya çıkmıştır.
Kurum verilerinin yapısallık oranları incelendiğinde kamu kurum verilerinin büyük bir
yüzdesinin yapısal olmadığı ve işlenmesinde zorluklar yaşandığı tespit edilmiştir.
Yapısal ve yapısal olmayan verilerin uzun vadeli planlamalar ile büyük veri yapıları
ile kullanılması, kurumların işleyişlerini daha etkin hale getirecektir.
Soru 7. Kurumunuzda veri işlemede aşağıdaki hangi yaklaşımı
uyguluyorsunuz?
Kamu kurumlarının verileri işleme yaklaşımların araştırılırken tüm proje verilerin
ortak (merkezi) bir sistemde mi barındırdıklarını yoksa bulundukları sistemlerden
gerektiğinde bütünleştirme ile mi alınarak işlem yapıldığı sorusundan alınan
cevaplara göre kurumların;
● %69’u verileri ortak bir sistemde (warehouse, veritabanı gibi) toplayıp işliyor
● %51,7’si verileri bulundukları sistemlerde işleyip gerektiğinde bütünleştirme
(entegrasyon) yapıyor
sonuçları ortaya çıkmıştır.
37
Soru
8.
Büyük
ölçekli
veri
işlemede
hangi
yöntemleri
kullanıyorsunuz?
Kamu kurumlarının büyük miktardaki verilerini işleme yöntemlerine bakıldığında her
ne kadar iş zekası çözümlerinin oranı artmış olsa da klasik yazılım geliştirme
yöntemleri ile işleme en sık kullanılan yöntem olmaya devam etmektedir.
Kurumlardan alınan cevaplara göre kurumların;
● %55,2’si klasik yazılım geliştirme yöntemleri ile
● %31’i iş zekası çözümleri ile
● %6,9’u büyük veri çözümleri ile
● %6,9’u bu üç yöntemin dışında farklı çözümler ile verilerin işler iken
● %31’i henüz büyük ölçekli veri işlemediğini
belirtmiştir.
Bu istatistik incelendiğinde büyük veri kullanan kurum sayısının çok düşük bir
oranda kaldığı, klasik yazılım geliştirme yöntemlerine olan alışkanlığın bir süre daha
devam edeceği gözlemlenebilir.
Soru 9. Büyük veri konusunda kurumunuzda hangi yatırımlar
yapıldı?
Kamu kurumlarının büyük veri konusundaki yatırımları gelecek planlamaları için
önemli bir yer tutmaktadır. Kurumların bu konudaki yatırımlarının sorulduğu soruya
gelen cevaplara göre kurumların;
● %37,9’u yazılım yatırımı,
● %34,5’i donanım yatırımı,
● %20,7’si eğitim yatırımı,
● %13,8’i insan kaynağı yatırımı yaparken
● %29,9’u henüz hiçbir yatırım yapmadığını
belirtmiştir.
38
Soru 10. Büyük veri yatırımlarınızın yaklaşık değeri nedir?
Büyük veri konusunda yapılan yatırımların değeri sorulduğunda gelen cevaplara
göre kurumların;
● %41.4’ü 500.000’in üzerinde,
● %13,8’i 100.000 ile 500.000 arasında,
● %3.4’ü 50.000 ile 99.000 arasında
● %6,9’u 50.000’den az yatırım yaparken
● %34.5’u hiç yatırım yapmadığını
belirtmiştir.
Soru 10. Büyük veri projeniz var mı?
Kamu kurumlarının büyük veri projelerinin sayılarını sorduğumuz soruya gelen
cevaplara göre kurumların;
● %6,9’unun 5’in üzerinde,
● %17,2’sinin 2-5 arasında,
● %10,3’ünün 1 projesi var iken
● Kalan %65,5’inin ise hiç projesinin olmadığı
belirtilmiştir.
Bu sorunun cevapları önceki sorularla karşılaştırıldığında kamu kurumlarının
veri madenciliği, iş zekası, yüksek boyuttaki yapısal verilerden alınan raporların
39
büyük veri projeleri kapsamın alındığı sonucu ortaya çıkabilir. Bu noktada büyük veri
tanımının net bir şekilde yapılması ihtiyacı oluşabilir.
Soru 11. Büyük veri projeniz yoksa kurumun büyük veri
konusunda gelecek planları nelerdir?
Büyük veri projesi bulunmayan %69 oranındaki kamu kurumlarının kısa ve uzun
vadede büyük veri planları sorulduğunda alınan cevaplara göre kurumların;
●
●
●
%18,2’si önümüzdeki 2 yıl içinde en az bir büyük veri projesine
başlayacağını,
%36,4’ü gelecekte geliştirmeyi planladığı ama zamanı belirsiz olan en az bir
büyük veri projesinin olduğunu belirtirken
Kalan % 45,4’lük dilimin hiçbiri büyük veri konusunda proje geliştirmeyi
düşünmediklerini belirtmiştir.
Genel oranı aldığımızda kurumların %29,7’si büyük veri konusunda proje planlaması
yapmaz iken önümüzdeki 2 yıl içinde büyük veri projesine başlamayı planlayan
kurumların oranı %11,9, süre belirtmeksizin gelecekte bir büyük veri projesine
başlamayı planlayan kurumların oranı ise 23,8’dir.
40
Soru 12. Büyük veri projelerinde çalışan sayınız kaçtır?
Büyük veri konusuna yapılan insan kaynağı yatırımının ölçüldüğü bu soruya verilen
cevaplara göre kurumların büyük veri projeleri için gerçekleştirdiği istihdam sayıları:
● %10,3’ü 10’un üzerinde çalışan ile,
● %6,9’u 6-10 arası çalışan ile,
● %34,5’i 1-5 arası çalışan ile büyük veri projelerini geliştirirken
● %48,3’ü büyük veri konusunda henüz personel istihdamı yapmamıştır.
Soru 13. Büyük veri işlemede hangi teknolojileri kullanıyorsunuz
ya da inceliyorsunuz?
Soru
14. Kurumunuzda
“Büyük
Veri
Analitiği” konusunda
aşağıdaki konularda yetkin çalışan sayısını belirtiniz.
41
Ankete katılan kurumlarında yarısında veya biraz daha fazlasında büyük veri
analitiği konusunda yetkin çalışan olmadığı görülmektedir (mavi çubuklar - 0
çalışan). Ancak önemli bir kısmında (%40-50) en az 1 analitik konusunda çalışan
bulunabilmektedir. Belirgin teknolojilerde, örneğin Hadoop’ta, 31 kurum içinde
9’unda bilen en az bir kişi bulunmaktadır (%33). Bu da büyük veri teknolojilerinden
tamamen uzak olmadığımızı göstermektedir.
42
BÖLÜM 4
Dünya’da Kamuda Büyük Ver
Uygulamaları
4.1 ABD’de Kamuda Büyük Veri
Amerika Birleşik Devletleri’nde (ABD) 11 Eylül saldırılarından sonra çıkartılan
Vatanseverlik Yasası (PATRIOT Act),
Elektronik İletişim Mahremiyeti Yasası
(Electronic Communication Privacy Act) ve tasarı halinde bekleyen Siber İstihbarat
Paylaşımı ve Korunması Yasası (Cyber Intelligence Sharing and Protection ActCISPA) gibi yasalar, farklı biçimlerdeki (yapısal veya yapısal olmayan) büyük
boyutlu verilerin devlet tarafından işlenmesine ve herhangi bir izne tabii tutulmadan
e-posta hesaplarına erişimine izin vermektedir. Buna karşın mevzu hukuk, finans ve
sağlık hizmetleri gibi kanunlar tarafından detaylıca belirlenmiş bazı sektörler için,
kamuyla ilgili büyük veri uygulamalarının veriye erişiminde engel oluşturabiliyor.
ABD’de sağlıkla verileriyle büyük veri çalışması yapmak için bu çalışmaların sağlık
hizmetleriyle ilgili mevzuata dayandırılarak yapılması gerekiyor. Sağlık hizmetleri ile
ilgili en önemli iki yasa Sağlık Sigortası Taşınabilirlik ve Hesap Sorulabilirlik Yasası
(Health Insurance Portability and Accountability Act-HIPAA) ve 2009 yılında bu
yasanın kapsamını genişleterek çıkarılan Ekonomik ve Klinik Sağlık için Sağlık Bilgi
Teknolojileri yasasıdır (Health Information Technology for Economic and Clinical
Health Act-HITECH). Bu iki yasa, kişinin sağlık verilerindeki kimlik bilgilerinin
gizliliğinin korunmasını sağlamak için kurallar koymakta, kişisel sağlık verilerinin
büyük veri analizlerinde kullanımına miktar ve tipi bakımından sınır çizmektedir.
2014 yılı şubat ayında yapılan bir büyük veri çalışması için sağlık hizmeti bilgileri
ancak kendi verilerini paylaşmaya gönüllülerin verilerinden toplanabilmiştir (G.-H.
Kim et al, 2014).
Yüksek hacimli veri akışının analizini yönetmek amaçlı ölçeklenebilir ve
kümelenmiş bir altyapı oluşturmak için 2002 yılında ABD ile IBM arasında bir iş
birliği başladı ve bu işbirliğinin sonucunda devlet kurumları ve iş dünyası tarafından
yaygın olarak kullanılan IBM Infosphere Stream ve IBM Büyük Veri adında iki
platform ortaya çıktı. Binlerce kaynaktan, gerçek zamanlı olarak gelen verinin
43
gösterimi ve işlenmesini sağlayan bu platformlar Hadoop kullanılarak geliştirilmiştir
(Jain P et al, 2013).
2009 yılında, şeffaf ve hesap verebilir bir devlet için bir adım olan ve
günümüzde ulaştırma, ekonomi, sağlık hizmetleri, eğitim, çevre,
tarım, kamu
güvenliği ve yerel yönetimler vb. alanlarda 199,792 veri kümesini yayınlayan
data.gov internet sitesini kullanıma sunmuştur (“About Data.gov”, 2013).
2010 yılında Bilim ve Teknoloji Başkan Danışmanları Konseyi (Devletin ağ ve
bilgi teknolojileri hakkındaki araştırmalara yapacağı yatırımların koordine edilmesini
sağlayan ana mekanizma), Designing a Digital Future: Federally Funded Research
and Development in Networking and Information Technology isimli raporunda bir
büyük veri stratejisini ayrıntılarıyla belirtti.
2012 yılında Obama Yönetimi, bilim, sağlık, enerji ve savunma ile alakalı
birden çok kuruma 200 milyon dolarlık bir yatırımı öngören Büyük Veri Arge
Girişimi’ni (Big Data Research and Development Initiative) duyurdu.
2014 Şubat ayında Milli Sağlık Enstitüsü (National Intitute of Health-NIH)
yüzlerce terabaytlık genetik veriyi kendi süper bilgisayar geliştirme gereksinimini
ortadan kaldırarak, Amazon’un bulut ortamına yükledi.
2012 yılında Milli Bilim Vakfı (National Science Foundation-NSF) Milli Sağlık
Enstitüsü’nü büyük veriyle ilgili bilimsel ve teknolojik gelişimi amaçlayan programınadâhil etti (Core Techniques and Technologies for Advancing Big Data Science &
Engineering Program). Birçok devlet kurumu kendi büyük veri programını başlattı.
ABD’nin vergileri toplamaktan sorumlu kurumu Devlet Gelirleri Dairesi (The Internal
Revenue Service) vergi kaçırma ve dolandırıcılıkla başa çıkmak için büyük veri
analiz yetenekleri kazandı. ABD Savunma Bakanlığı (Department of Defense-DOD),
hedeflerinden
biri
olarak
büyük
veriyi
kullanarak
makine
öğrenimi
gerçekleştirebilmek için milyonlarca dolar harcıyor.
ABD’de yerel yönetimler de büyük veri projeleri başlattı. Örneğin 2011 yılında
New York eyaletinin Syracuse şehri yönetimi terkedilmiş konutların önüne
geçebilmek için IBM ile bir akıllı şehir projesi yaptı. (IBM, 2011) Michigan Bilgi
Teknolojileri Departmanı diğer devlet kurumları ve organizasyonlara tek kaynaktan
hizmet sağlayabilmek için Michigan vatandaşlarının bilgilerini veri ambarında
tutuyor.
ABD Gelişmiş Savunma Araştırma Projeleri Kuruluşu (DARPA), Nexus 7 adlı
program kapsamında veri bilimcilerini Afganistan’da taktiksel kararlara yardımcı
olması amacıyla cephede kullanmıştır. Uydulardan elde edilen yolların kullanım
44
durumu verileri işleyerek patlayıcı tuzakların yerinin daha kolay tespit edilmesi
sağlanmıştır. DARPA’nın bir diğer büyük veri uygulaması olan Memex isimli
programı, internet sitelerinin taranarak, insan kaçakçılığı ağlarının saptanmasına
katkıda bulunmuştur.
2014 yılında Obama’ya sunulan Büyük Veri: Fırsatları Yakalamak, Değerleri
Korumak adlı raporda büyük veri uygulamalarının ekonomi ve diğer alanlarda olumlu
yönlendirici etkisinin yanında bireyle devlet arasındaki güç dengesini bozması
açısından, büyük veri uygulamalarının özgürlüklere olan potansiyel tehdidine dikkat
çekilmiştir. Raporda öngörücü tıp uygulamalarının büyük verinin sağlık hizmetleri
konusunda geldiği en ileri nokta olduğu belirtilmiştir. Hayat standardı ve sağlık
arasındaki güçlü ilişkinin diğer kişisel verilerle sağlık verisi arasındaki ayrımı gittikçe
zorlaştırdığından, mevcut düzenlemelerde değişiklikler yapılması ve veriye kontrollü
erişim için evrensel standartların ve altyapının oluşturulması gerektiği yorumu
yapılmıştır (Podesta, J. et al, 2014).
ABD’de eğitimle alakalı veriler ve çocuklara ait kişisel veriler kanun ile
korunmaktadır. Çevrimiçi eğitim platformlarının yaygınlaşması ve bu platformlardan
elde edilebilecek verilerin kritik olması bu tür tedbirleri gerektirmektedir. Çocukların
Çevrimiçi Mahremiyetini Koruma Yasası (Children’s Online Privacy Protection Act),
internet sitesi operatörleri veya uygulama geliştiricilerini 13 yaş altı çocukların kişisel
verilerini toplamadan önce velinin iznini almaya zorunlu kılmıştır. Eğer bir okul,
başka kurumdan çevrimiçi eğitim hizmeti almak isterse, mevzuatta belirtilen şartlar
sağlanmalı, öğrenci verileri sadece eğitim amaçlı ve doğrudan kontrol edebilecek
şekilde paylaşılmalıdır.
ABD Yurt Güvenliği Departmanı (Department of Homeland Security), 2012
yılında, 22 alt kurumunun verilerinin tek bir noktada toplanması için büyük veri
işleme kabiliyetine sahip Neptune ve Cerberus isimli iki pilot projeyi başlatmıştır. Bu
projeler kapsamında kişisel veriler sınıflandırılmış, kullanıcıların özelliklerine göre
veri sınıflarına erişiminin kontrolü sağlanmıştır.
4.2 AB’de Kamuda Büyük Veri
Avrupa Birliği Komisyonu 2010 yılında hızlı ve ultra hızlı çalışabilen internet
uygulamaları ile tek bir dijital pazardan AB vatandaşlarına sürdürülebilir ekonomik ve
sosyal faydalar sağlamak için neler yapılması gerektiğini belirten bir doküman olan
Avrupa için Dijital Gündem’i yayınladı (European Commission,2010).
45
2012 yılında yayınlanan benzer bir gündem dökümanında (Digital Agenda for
Europe and Challenges for 2012) verinin korunması, IoT’nin geliştirilmesi, makineler
arası iletişim, internet güvenliğinin sağlanması gibi konuların önemi ve elde bulunan
kamu verilerinin potansiyel ekonomik değeri vurgulandı (European Commission,
2012).
Birleşik Krallık, 2004 yılında birden çok akademik disiplini ilgilendiren
problemler hakkında devletin yeteneğini geliştirebilmek amacıyla HSC’yi (UK
Horizon Scanning Center) kurarak AB’de büyük veri uygulamaları konusunda ilk
adım atan ülkelerden biri oldu. 2011 yılında bu merkezin iklim değişikliğiyle ilgili
birçok
kanaldan
gelen
verileri
işleyerek
gerçekleştirdiği
çalışmaları,
iklim
değişikliğinin, besin ve suya olan erişime, bölgesel gerilimler ve uluslararası istikrara
olan etkisine işaret etti. 2009 yılında, günümüzde 30.000 üzeri veri kümesi
barındıran data.gov.uk sitesi açıldı (Habegger B, 2009).
20 ülkenin işbirliği ve IBM ile gerçekleştirilen DOME projesi kapsamında,
SKA radyo teleskoplarının günlük ürettiği boyut olarak 1 exabyte’ı geçen veriyi
işleyebilen bir süper bilgisayar geliştirilmektedir ve evrenle alakalı birçok bilimsel
soruya cevap bulabilmeyi amaçlamaktadır (DOME project, 2012) .
4.3 Asya Ülkelerinde Kamuda Büyük Veri
Birleşmiş Milletler 2012 e-devlet araştırması, başta Güney Kore, Singapur ve
Japonya olmak üzere birçok Asya ülkesine yüksek not verdi. Bu ülkeler büyük veri
konusunda çeşitli girişimlerde bulundular ve pek çok proje gerçekleştirdiler:
Güney Kore
Güney Kore’de 2011 yılında, başkana bağlı Bilgi ve İletişim Teknolojileri
konseyi tarafından, bilgiyi tahlil ederek yönetimsel kararlar alabilmek amacıyla bir
büyük veri programı başlatıldı.
Bu girişim kapsamında gerekli altyapının
sağlanmasına liderlik etmek için bir büyük veri çalışma kolu (Big Data Task Force)
oluşturuldu. Bu girişim, kamu ve özel sektör arasındaki veri paylaşımını iyileştirmeyi,
kamusal bir veri tahlil sistemi kurmayı, yetenekli ve profesyonel topluluk oluşturmayı
ve eğitmeyi, kişisel verilerin gizliliği ve güvenliğini garanti etmeyi ve ilgili mevzuatı
geliştirmeyi, büyük veri altyapı teknolojileri geliştirmeyi ve böylece bütün devleti
kapsayan bir büyük veri ağı ve analiz sistemi kurmayı amaçlıyor.
Sağlık ve Refah Bakanlığı (Ministry of Health and Welfare) 35 kurumdan
385 kamusal veri kümesini analiz etmek, merkezi ve yerel yönetimlerin yaptığı
46
çalışmaları kapsamlı bir şekilde yönetebilmek için Sosyal Refah Birleşik Yönetim
Ağını (Social Welfare Integrated Management Network) başlattı.
Gıda Tarım Orman ve Balıkçılık Bakanlığı (MOPAS) el ayak ağız sendromu
ile savaşta, yurt dışındaki hayvansal hastalıklar, gümrük ve mülteci bilgileri, besi
hayvancılığı sektöründeki hayvanlar ve bu sektörde çalışan işçilerle alakalı büyük
veri kümelerininden faydalanan bir büyük veri sistemi kullanmayı planlıyor.
Bakanlığın planları arasında eski hasar kayıtlarına ve anlık hava durumu verileri ve
anlık sismik verilere dayanan, doğal felaket önleme sistemi de bulunuyor. Ayrıca
Güney Kore Biyoinformatik Merkezinin, genetik ve sağlık verilerini birleştirecek ve
kişiye özel teşhis ve ilaç tedavisi sunulmasına imkan sağlayacak bir Milli DNA
Yönetim Sistemi üzerinde çalışmaları bulunmaktadır.
Singapur
2004 yılında Singapur, bulaşıcı hastalıklar ve milli güvenlik gibi konularda
çalışmak için Milli Güvenlik Koordinasyon Merkezi aracılığıyla Risk Değerlendirme
ve Ufuk Taraması (Risk Assessment and Horizon Scanning Program-RAHS) isimli
programı başlattı. Bu programla, geniş kapsamlı bir büyük veri kümesi oluşturulup
çözümlemesi yapılarak, terörist saldırılar, bulaşıcı hastalıklar ve ekonomik krizler
gibi tehditlerin yönetilmesinde pro aktif bir çözüm sunulmuştur. 2007 yılında, bu
program kapsamında kararlar almak, programı iyileştirerek sürdürmek amacıyla bir
merkez (RAHS Experimentaion Center-REC) açılmıştır. Bu merkez, programın
büyük
veri
altyapısının
sistematik
olarak
geliştirilmesini
sağlamaktadır
ve
gerçekleştirdiği dikkate değer bir uygulama da kuş gribinin ülkeye tehdidinin ve olası
senaryoları
değerlendirmesidir.
Ayrıca
büyük
veri
araştırmaları
analizi
ve
uygulamaları ile değer yaratabilmek amacıyla 50 kurumdan 5000 ve üzeri veri
kümesinin yayınlandığı http://data.gov.sg adlı internet sitesini açmıştır.
Japonya
Japonya devleti, büyük çaplı verileri incelemek için çeşitli programlar
başlatmıştır. 2005-2011 yılları arasında Eğitim Kültür Spor Bilim ve Teknoloji
Bakanlığı (MEXT), üniversiteler ve araştırma ensitüleri işbirliğiyle Bilgi Patlaması
Devri için Yeni Bilgi Teknolojileri Altyapısı projesini yürütmüştür. 2011 yılından beri
Fukuşima depremi, tsunami ve nükleer santral faciasının ve bu faciadan etkilenmiş
alanların iyileştirilmesi, facianın ekonomik ve sosyal sonuçları öncelikli konulardan
biri olmuştur. Eğitim Kültür Spor Bilim ve Teknoloji Bakanlığı, Milli Bilim Vakfı ile
47
beraber doğal felaketlerden korunma amaçlı araştırmaları büyütmek ve büyük veri
teknolojilerinden sağlanan faydaları arttırmak için çalışmalar yapmaktadır.
İçişleri Bakanlığının altındaki Bilgi ve İletişim Konseyi ve Bilgi ve İletişim
Stratejisi Komitesi büyük veri uygulamalarının 2020 hedefleri için önemini
vurgulamıştır.
Teknik
çözümler
sağlaması
ve
büyük
veri
uygulamalarının
yayılmasında kurumsal kararlar vermek amaçlı ve bir büyük veri uzman grubu
kurulmuştur.
Çin Halk Cumhuriyeti
Çin Halk Cumhuriyeti’nin uzun vadeli plan ve açık veri kaynaklarının
eksikliğine ek olarak büyük veri konusundaki özel sektör temellerinin zayıf
olmasından dolayı kamu sektöründeki büyük veri uygulamalarında geri kaldığı
söylenebilir fakat yeni bir yönetim anlayışı benimsenerek 2017 sonu itibariyle
verilerin ilgili kurumlar tarafından paylaşmaya başlaması planlanmaktadır. 2018 yılı
sonlarına doğru da ulaşım, sağlık hizmetleri, iş bulma gibi konulara öncelik verilen
bir açık platform oluşturulması hedeflenmektedir (The State Council, The People’s
Republic of China, 2015).
Devletin siyasi danışma organı olan CPPCC’nin (Chinese People's Political
Consultative Conference) 2014 yılında Beijing’te gerçekleştirdiği ve kamuda büyük
veri çalışmalarında yetenek kazandırılması için neler yapılması gerektiğinin
tartışıldığı toplantı ve yerel yönetimlerin de büyük veri uygulamaları için altyapı
çalışmalarına başlaması, Çin’in büyük veri uygulamaları konusunda gelişmeye
istekli olduğunun göstergeleridir (UNDP, 2014).
4.4 Avustralya'da Kamuda Büyük Veri
Avusturalya'da kamu kurumlarının büyük veri uygulamaları, kurumların
ellerinde bulunan verileri, mevzuat izin verdiğince, başka kurumlardaki verilerle
ilişkilendirip açık veri olarak sunulması şeklindedir. İstihbarat kurumları, güvenlik
kurumlarıyla, diğer sosyal hizmet kurumları da kendi aralarında düzenlemeler ve veri
paylaşımları yaparak daha zengin analizler yapmayı hedeflemektedir (Australian
Government Department of the Prime Minister and Cabinet , 2015).
Avustralya Devleti Bilgi Yönetimi Ofisi (AGIMO) Devlet 2.0 programı
kapsamında, kamu verisine erişimi sağlamak amaçlı http://data.gov.au internet
sitesini açmıştır (“About Data.gov.au”, 2013).
48
BÖLÜM 5
Kamu ç n öner ler
Sonuç olarak kamu kurumları özel sektöre göre yola sonra çıkmakla birlikte,
“büyük veri” konusunda daha büyük problemlerle karşı karşıyadır, ve burada hem
fırsatlar hem de tehditler mevcuttur. Bu bölümde Türkiye’de kamu sektörü için
“büyük
veri”
konusunda
yapılması
gerekenler
konusunda
belli
noktalara
değinilecektir. Bu önerilerin bir kısmı (1) çalışmasından alınmıştır ve ülkemize de
uymaktadır.
5.1 Ulusal öncelikler
Önde gelen ülkelerin büyük veri projelerine bakıldığında ortak hedefler
görülmektedir. Bunlar, (1) kamu hizmetlerine kolay ve eşit erişim, (2) kamu işlerinde
vatandaşların daha kolay katılımının sağlanması, ve (3) şeffaflık olarak sıralanabilir.
Kamuda büyük veri uygulamaları alanında ise özellikle güvenlik, hız, birlikte
çalışırlılık, analitik kapasitesi, ve yeterli uzman bulma problemleri konusunda
endişeler olduğu görülmektedir. Her devletin kendi öncelikleri, fırsatları, ve tehditleri
bulunmaktadır, ve bunlar ülkelerin bulundukları çevreye, jeopolitik ortama göre
değişmektedir. Kimi ülkelerde güvenlik (Avrupa), bazılarında savunma (Türkiye),
bazılarında sağlık (ABD), ve diğer bazılarında çevre (Japonya) öne çıkmaktadır (Kim
et al 2014).
Dolayısıyla ülkeler önceliklerini belirlemeli ve kamuda büyük veri stratejilerini
buna göre oluşturmalıdırlar. Türkiye konumu ve durumu itibariyle pek çok alanda
“büyük veri”den faydalanmak ve etkin kamu politikaları oluşturmak zorundadır.
Aşağıdaki alanların ülkemiz açısından öncelikli olduğunu düşünüyoruz:
Savunma ve güvenlik
Türkiye son yıllarda çevresinde oluşan savaş ve güvenlik tehditleri, ayrıca
jeopolitik konumu itibariyle bu alanda büyük veriyi etkin yönetmek zorundadır.
Savaşlardan ve çatışmalardan kaçan milyonlarca mülteci bir kaç yıl için ülkenin her
yerine dağılmış bulunmaktadır. Bu hem ülke için fırsat hem de ciddi tehditler
içermektedir. Bu insanlarla ilgili veri toplamak ilgili pek çok kurumun (AFAD,
49
Emniyet, İçişleri Bakanlığı, Dışişleri Bakanlığı, Sağlık Bakanlığı, Gümrük Bakanlığı
gibi) etkin stratejiler geliştirmesine ve bu verileri koordineli bir şekilde kullanarak
gerekli politikaların üretilmesine yardımcı olmasına bağlıdır.
Ekomomi, Üretim, Büyüme, ve İstihdam
Türkiye son yıllarda ekonomik olarak yüksek büyüme göstermiş bir ülkedir.
Ancak son birkaç yılda oluşan ülke içi ve küresel problemlere bağlı olarak ekonomik
olarak durağanlığa kayma tehlikesi göstermektedir. Kişi başı milli gelir 10 bin dolar
sınırında kalmış ve yukarı çıkarmak için daha teknolojik ve katma değerli üretime
geçmek zorundadır. Bu ise sanayide, üretimde, tarımda daha yenilikçi yaklaşımların
benimsenmesine ve atılım yapmaya bağlıdır. Endüstri 4.0 gelişmesi bu anlamda
ülkemiz için fırsatlar sunmaktadır. Üretimin (sanayi ve tarım) daha otomatik ve
verimli yapılması bu alanda yapılacak yatırımlara bağlıdır. İlgili kamu kurumları acil
eylem planları ile ileri ülkelerden geri kalmamak ve üretimini daha verimli
yapabilmek için bu alanda stratejiler geliştirmek zorundadır. Bu alanda pekçok veri
halen toplanmaktadır (Tarım Bakanlığı, Bilim, Sanayi ve Teknoloji Bakanlığı, TOBB,
vb.). Bu “büyük veri”nin stratejik kullanımı oldukça önemlidir ve ilgili kurumlar
koordineli bir şekilde bu veriyi etkin politikalar geliştirmek için kullanmaya
başlamalıdır. Üretim ve sanayide veriye ve otomasyona bağlı değişikliklerin
istihdama etkisi iyi incelenmeli (yine İŞKUR, Çalışma Bakanlığı gibi ilgili kurumların
büyük verileri ile) ve etkin istihdam, iş eğitimi vb. programlar geliştirilmelidir.
Eğitim ve Sağlık
Ülkemiz genç nüfusu ile önemli bir potansiyele sahiptir. Fakat aynı zamanda
eğitim politikalarındaki sık değişiklikler sebebiyle ileri ülkelerle istenen seviyede
yarışamamaktadır (Pisa 2012). Eğitim konusunda ilgili kurumlar (MEB, YÖK, ÖSYM,
vb.) pek çok kapsamlı büyük veriye sahiptir. Yine bu verilerin etkin kullanımı ve
analizi ile etkin eğitim politikaları geliştirilmeli ve genç nüfusun iyi eğitilmesi için acil
önlemler alınmalıdır. Genç ve yaşlı nüfusun sağlığının korunması ve ülke
kaynaklarının etkin kullanımı ve israf edilmemesi, sağlık alanında yapılan
iyileştirmelere, bunun için de ilgili kurumlarda (Sağlık Bakanlığı, SGK, vb.) toplanan
“büyük veri”nin etkin kullanımı ve analizine bağlıdır.
50
Şeffaflık
Büyük verinin kamuda en önemli kullanım alanlarından birisi şeffaflık, hesap
verilebilirlik, ve ülke bütçelerinin israf edilmeden etkin kullanımıdır. Vergi gelirlerinin,
bütçe harcamalarının, yatırımların ve bütün kamu harcamalarının “büyük veri” analizi
ile incelenmesi ve “açık veri” olarak yayınlanması ve denetime açılması ile birlikte
ülke bütçesinin çok daha az kayıpla ve çok daha etkin harcanması mümkün olacak,
ülke refahında iyileşme sağlanacak, gelir adaletinin sağlanmasında pek çok
iyileştirmeler yapılabilecektir. Burada Maliye Bakanlığı, Gelir İdaresi, Kamu İhale
Kurumu gibi kamu kuruluşlarının verilerinin etkin kullanımı oldukça önemlidir.
5.2 Analitik kurumu
Kim et al 2014 çalışmasında kamuda bir analitik kurumu kurulması
önerilmiştir. Bu kurumun amacı kamudaki verileri yukarıdan aşağıya toplu bir şekilde
bütünleştirecek, ilişkilendirecek ve değerlendirecek, analiz edecek bir kurum olarak
yapılandırılması önerilmiştir. Mevcut durumda genelde kamuda veriler kurumların
kendi veri silolarında bulunmakta, paylaşmada problemler bulunmakta ve toplu
değerlendirilmesi çok zor olmaktadır. Analitik kurumu bu engelleri aşabilecek ve
verileri merkezi bir şekilde değerlendirebilecek ve kurumlar üstü daha etkin çözümler
sunabilecektir. Ülkemizde de kamu kurumları arasında veri paylaşımının genelde
çok zor olduğu ve veri siloları probleminin büyük veri uygulamaları önünde en
önemli engellerden biri olduğu bilinmektedir. Bu alanda merkezi ve kurumlar üstü bir
üst kurumun bu görevi üstlenmesi veya yeni bir kurum oluşturulması uygun
olacaktır.
5.3 Gerçek-zamanlı analiz
Pek çok büyük veri uygulaması genelde durağan (statik) veri üzerinde analiz
yapmayı öngörmektedir. Gelecekte daha fazla ağ bağlantısı, nesnelerin interneti
uygulamalarının devreye girmesi ile birlikte akan veri (streaming data) ve gerçek
zamanlı analiz giderek daha fazla önem kazanacak ve bu konuda kamu
kurumlarının da gelecek öngörüsüne dayalı stratejiler geliştirmesi gerekmektedir.
Örneğin sağlık alanında, salgın hastalıkların anlık verilerle takip edilmesi ve acil
önlemlerin alınması, felaketlerin (deprem) gibi veri analizi ile tahmin edilmesi, çevre
ve doğa olaylarının izlenmesi, finansal krizlerin, borsa hareketlerinin anlık takibi gibi
birçok konu kamu kurumlarının gündeminde olması gerekmektedir.
51
5.4 Küresel işbirliği
Son yıllarda hızlanan hemen her alanda küreselleşme ile birlikte ülkelerin ve
ülkemizin de birbirinden tamamen bağımsız politikalar geliştirmesi artık imkansızdır.
Alınan her karar diğer ülkeleri etkilemekte, diğer ülkelerde alınan kararlar ve politika
değişiklikleri de anında bizleri etkilemektedir. Bu sebeple büyük veri uygulamaları
küresel kurumlarla uyumlu, birlikte çalışabilir olarak tasarlanmalı ve geliştirilmelidir.
Ülkeye özel olarak geliştirilecek büyük veri uygulamaları kısa vadeli çözümler sunsa
da ilerde küresel çerçevede uygulamada zorluklara sebep olabilecektir. Bu sebeple
bu tür uygulamalar geliştirirken kamu kurumlarının küresel çerçevede gelişmeleri iyi
okumaları ve uygulamaları dünyadan kopuk olarak geliştirmemeleri gerekmektedir.
5.5 Özel sektör işbirliği
Büyük veri uygulamaları alanında yukarıda da belirtildiği gibi özel sektör
çalışmalara kamu kurumlarından çok daha önce başlamış ve bu alanda pekçok
uygulama ve çerçeve geliştirmiş bulunmaktadır. Bu sebeple kamu kurumlarının yeni
baştan dünyayı keşfetmek yerine özel sektör kurumları ile işbirliği içinde ve edinilen
tecrübelerden faydalanarak gelecek stratejilerini geliştirmeleri oldukça önemlidir.
52
KAYNAKÇA
1. About Data.gov. (2013). Retrieved from https://www.data.gov/about
2. About Data.gov.au. (2013). Retrieved from http://data.gov.au/about
3. Aslı Ayşe Bilir (2003), “Devlet İstatistik Enstitüsünde elektronik veri
güvenliği”, TÜİK Uzmanlık Tezi.
4. Australian Government Department of the Prime Minister and Cabinet.
(2015). Public Sector Data Management
5. Big-Data Applications in the Government Sector By Gang-Hoon Kim, Silvana
Trimi, Ji-Hyong Chung
6. CSI/FBI Computer Crime and Security Survey,.
7. Data Portals, http://dataportals.org
8. Demet Kabasakal, Şeref Sağıroğlu, Mustafa Alkan (2007), “Mobil Elektronik
İmza: Senaryolar, Uygulamalar, Standartlar ve Ülkeler”, Uluslararası Katılımlı
Bilgi Güvenliği ve Kriptoloji Konferansı.
9. DOME project. (2012). Retrieved from
https://www.research.ibm.com/labs/zurich/sto/bigdata_dome.html
10. Emrah Tomur (2004), “Kablosuz yerel alan ağlarının BDDK’da kullanımı için
bir uygulama önerisi”, BDDK Uzmanlık tezi.
11. European Commission. (2010). Communication From The Commission To
The European Parliament, The Council, The European Economic And Social
Committee And The Commıttee Of The Regions A Digital Agenda for Europe
12. European Commission. (2012). Digital Agenda for Europe and Challenges
for 2012. https://ec.europa.eu/digital-single-market/en/digital-agendaassembly-2012
13. G.-H. Kim, S. Trimi, and J.-H. Chung. (2014). Big-Data Applications in the
Government Sector. Commun. ACM 57,3 (Mar.2014), 78-85.
DOI=http://doi.acm.org/10.1145/2500873
14. Habegger B. (2009) Horizon Scanning in Government: Concept, Country
Experiences, and Models for Switzerland
15. IBM. (2011). IBM’Ss Smarter Cities Challenge: Syracuse
16. IEEE 802.11, http://en.wikipedia.org/wiki/IEEE_802.11. Son erişim: 27 Aralık
2009.
17. Jain P., Tate S. (2013). Big Data and Network Storage For Hadoop
18. Mark van Rijmenam Think Bigger - Developing a Successful Big Data
Strategy for Your Business.
53
19. Monica Paolini (2007), “The Emerging WIMAX Ecosystem”. WIMAX
Business and Technology Strategies, p. 14-16.
20. Morabito, V. (2015) Big Data and Analytics Strategic and Organizational
Impacts, 16, 23-44
21. Open Data, https://en.wikipedia.org/wiki/Open_data
22. Open Government Partnership, http://www.opengovpartnership.org
23. Pisa Results (2012), Country Note for Turkey, Problem Soving.
24. Podesta, J., Pritzer, P., Moniz, E.J., Holdren, J., Zients, J. (2014). Big data:
Seizing Opportunities, Preserving Values. Executive Office of the President
25. TCG Mobile Phone Working Group (2005), “Use Case Senarios, v 2.7”.
26. The State Council, The People’s Republic of China. (2015).
http://english.gov.cn/policies/latest_releases/2015/09/05/content_281475183
253390.htm
27. The Trusted Computing Group (2006), “Mobile Specification: Securing
Mobile Devices on Converged Networks”, White paper.
28. Trusted Computing Group (2007), “TPM Main Part 1 Design Principles, Specification
version 1.2 Revision 103”
29. Trusted Computing Group (2007), “TPM Main Part 2 TPM Structures,
Specification Version 1.2 Revision 103”.
30. Unibusiness Dergisi
31. United Nations Development Programme. (2014). Big Data Development in
China
32. Wayne Jansen and Karen Scarfone (2008), “Guidelines on Cell Phonand
PDA Security, Recommendations of NIST”. NIST Special Publication 800124.
54

Benzer belgeler

muh 402 bitirme çalışması

muh 402 bitirme çalışması Apache Flume: Çok büyük verileri (mesela ve özellikle log verileri) HDFS e yüklemek için ortaya çıkmış bir ptoje. Hadoop un dosyaları işleyebilmesi için dosyaların HDFS de olması gerekiyor. Bu fram...

Detaylı

proje çalışma konuları

proje çalışma konuları uygulama gerçeklemeye dayalı çalışma. Mesela zaman kısıtlı (herhangi bir zamanda herhangi bir noktada bulunma) ve sıralama (sequence) kısıtı (a noktasındaysan daha sonra sadece b ye git) gibi kısıt...

Detaylı