Yüz Örüntülerinden Cinsiyet Tespitinde Hibrit

Transkript

EEB 2016 Elektrik-Elektronik ve Bilgisayar Sempozyumu, 11-13 Mayıs 2016, Tokat TÜRKİYE
Yüz Örüntülerinden Cinsiyet Tespitinde Hibrit Özniteliklerle Performans
Geliştirme
Uğur TURHAL1
1
Ahmet AKBAŞ2
Uğur TURHAL, 1Yalova Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü
2
Ahmet AKBAŞ, 2Yalova Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü
1
2
[email protected]
[email protected]
birlikte hali hazırda var olan yaya tanıma teknolojisine sahip
araçlarda, sürücünün görüş açısını inceleyen bir kamera
yardımıyla yol izlenir ve uygulanan örüntü tanıma yöntemi
ile güzergâh üzerindeki nesnelerin yaya olma ihtimali
değerlendirilerek, sürücü temelli olası kazaların önüne
geçilmeye çalışılır.
Özet
Bir örüntüden yüz bölgesinin tespit edilmesi ve bu bölgede
bulunan bireyin cinsiyetinin tahmini, özellikle yaş tahmini ile
birleştirildiğinde, güvenlik sistemlerinde oldukça önemli bir
yer tutmaktadır. Bununla birlikte, firmaların müşterilerini
takip ederek, hangi yaş grubunun hangi tür ürünler ile
ilgilendiğini tespit etmede ve buna bağlı olarak marka reklam
maliyetlerini azaltmada etkili bir yöntem olacağı
düşünülmektedir. Bu çalışmada FERET veri setine ait yüz
örüntüleri Viola-Jones algoritması kullanılarak tespit edilmiş
ve örüntüdeki bireyin cinsiyeti, çeşitli makine öğrenmesi
yöntemleri ile tahmin edilmiştir. Cinsiyet tahmini için örüntü
tanımada güçlü bir yöntem olan yerel ikili örüntü (Local
Binary Pattern - LBP) histogramları ile yönlü gradyanların
histogramı (Histogram of Oriented Gradients - HOG)
yöntemleri bir arada kullanılarak hibrit bir veri kümesi
oluşturulmuştur. Sınıflandırıcı sonuçları çeşitli performans
analiz yöntemleri kullanılarak değerlendirilmiş ve sonuç
kısmında problemin çözümüne yönelik en iyi yöntem
önerilmiştir.
Örüntü tanıma sistemlerinde, giriş örüntüsünden elde edilen
öznitelikler yardımıyla tanımlanan veriler sınıflandırma
işlemine tabi tutulur ve ait oldukları grupların tahmini
sağlanır. Böyle bir sistem geliştirilirken kullanılacak
öznitelik çıkartma algoritmalarının iyi tayini, sınıflandırma
sonucunu doğrudan etkileyen parametrelerden biridir.
Yüz örüntülerinden öznitelik elde etme işlemlerinde
genellikle iki tür öznitelikten faydalanılır. Bunlar geometrik
öznitelikler ve dokusal özniteliklerdir [4]. Geometrik
öznitelikler, yüz üzerinde önceden tanımlanmış noktalar
arasındaki Öklid uzaklık değerlerinin kullanılmasıyla elde
edilir. Daha önceki çalışmalarda bu özniteliklere ait 10 temel
oran belirlenmiştir [5]. Bu oranlar yardımıyla bir yüz
örüntüsünün sınıflandırılması ve ait olduğu cinsiyet
grubunun belirlenmesi mümkündür. Aydınlanmadan
meydana gelebilecek değişimlere karşı dayanıklı olan bu
öznitelikler, kamera, duruş açısı ve kafa pozisyonu gibi
parametrelerden etkilenirler ve tespit edilmeleri güçtür.
1. Giriş
Örüntü tanıma, veriler içerisindeki dokuları tanımlamak için
kullanılan makine öğrenmesi sistemlerinin bir dalıdır [1]. Bir
örüntüden elde edilen öznitelikler, makine öğrenmesi
yöntemleri tarafından kullanılır ve örüntü hakkında
sınıflandırıcı modelinin bilgi sahibi olması sağlanır. Bununla
birlikte, örüntülerden elde edilen yüksek boyutlu veri
kümeleri, sınıflandırıcıların performanslarını etkileyen en
önemli unsurlardan biridir [2]. Kullanılacak bir takım
yeniden tanımlayıcılar yardımıyla veri kümeleri daha düşük
boyutlu alt uzaylara dönüştürülebilir. Burada temel amaç,
minimum sınıflandırma maliyeti ve maksimum doğruluk
elde etmektir [3].
Dokusal öznitelikler ise örüntünün tamamı ele alınarak elde
edilir. Diğer yöntemlere nazaran aydınlanma, poz ve kamera
açısı gibi örneğe özgü problemlerden daha az etkilenmeleri,
bu özniteliklerin yüz tanıma sistemlerinde verimliliği
arttırmasındaki en önemli nedenlerdendir [4].
2. Materyal ve Metod
Bu çalışmada FERET veri setinde bulunan 14,051 yüz
örüntüsünden algoritma tarafından seçilen 304’ ü erkek
bireylere, 196’ sı kadın bireylere ait toplamda 500 örüntü
kullanılmıştır [6-8]. Kullanılan örüntülerde yüz bölgelerinin
tespiti Viola-Jones algoritması tarafından sağlanmıştır. Elde
edilen örüntüden Yerel İkili Örüntü (LBP) algoritması ve
Yönlü
Gradyanların
Histogramı
algoritmaları
ile
histogramları çıkartılmıştır. Ardından veri kümesinin boyutu
Kamera sistemlerin gittikçe yaygınlaştığı günümüzde
bilgisayarlı görme ve örüntü tanıma konuları oldukça önem
kazanmıştır. Dünyaca ünlü otomobil üreticilerinin
geliştirmeye çalıştığı sürücüsüz otomobil teknolojisi, bu
alanlara verilebilecek en güncel örneklerden biridir. Bununla
361
İlişki Temelli Öznitelik Seçme (CFS) algoritması kullanılarak
küçültülmüştür. Elde edilen yeni veri kümesi k-En Yakın
Komşu (kNN) ve Naive Bayes sınıflandırıcıları kullanılarak
sınıflandırılmış
ve
sonuçlar
tablolar
yardımıyla
kıyaslanmıştır.
2.1. Viola-Jones Algoritması
Viola-Jones algoritması; örüntülerden yüz, göz, burun ve ağız
bölgelerini tespit etmek amacıyla 2001 yılında Viola. P ve
Jones. M. tarafından ortaya çıkarılmış bir yöntemdir [9].
Kullandığı Haar öznitelikleri ile yüz bölgesi içeren ve
içermeyen veriler kullanılarak, önceden eğitilen bir
sınıflandırıcı yardımıyla bu bölgelerin tespitini yapar. 1
saniyenin altındaki cevap süresiyle oldukça kullanışlı bir
algoritmadır. Bununla birlikte, örüntü üzerinde tespit edilen
hatalı alanlar algoritmanın bir dezavantajı olarak görülebilir.
Şekil 1: Yüz tespit algoritması çalışma diyagramı
Resim 1: Viola-Jones algoritması ile hatalı tespit edilen
göz bölgeleri.
2.2. Öznitelik Çıkartma
Öznitelik; makine öğrenmesi ve örüntü tanımada bir olgu için
tespit edilen bireysel ölçülebilir özelliktir [1]. Örüntü
tanımada
birçok
öznitelik
çıkartma
algoritması
kullanılmaktadır. Bu çalışmada, örüntülerden dokusal
öznitelikleri çıkartan Yerel İkili Örüntü (LBP) ve Yönlü
Gradyanların Histogramı (HOG) algoritmaları kullanılmıştır.
Ayrıca algoritma, düşey ile 15 dereceden fazla açı yapan bir
yüz örüntüsünü tanımada yine başarılı olamamaktadır.
2.2.1.
Yerel İkili Örüntü (LBP)
LBP dokusal öznitelik çıkartma algoritması; resmin yerel
yapısını özetleyen, gri seviyeden bağımsız bir doku ölçü
yöntemidir [10]. Orijinal LBP algoritması merkez ve komşu
pikseller arasında sıralı ikilik kod sistemi karşılaştırmalarına
dayalı ayrımsama gücü yüksek bir analiz tekniğidir [11]. Her
bir resim pikseli, kendisini çevreleyen 3x3 lük komşu
bölgeleriyle arasındaki farkın u(x) basamak fonksiyonu
kullanılarak ikilileştirilmesiyle etiketlenir [12]. Bir örüntüye
ait LBP histogramı aşağıdaki eşitlikle elde edilir;
Resim 2: Düşeyle sırasıyla 0, 15 ve 30 derece rotasyon
açısına
sahip
yüz
örüntülerinde
Viola-Jones
algoritmasının başarımı.
Bu problemlerin önüne geçebilmek için tasarlanan
algoritmanın çalışma diyagramı Şekil 1’ de verilmiştir.
P 1
LBPP , R ( xc , y c )   s( g p  g c )2 p
(1)
1, t  0
s(t )  
0, t  0
(2)
p 0
ise,
ise.
Eşitlikte (xc,yc) merkez pikselin LBP algoritmasına göre
değerini, gp merkez pikselin komşularını, gc merkez pikselin
gri değerini, R komşuların merkez piksele olan uzaklığını, P
ise işleme sokulan komşu sayısını ifade etmektedir [13].
362
Bu çalışmada öznitelik seçme işlemi için İlişki Tabanlı
Öznitelik Seçme (Correlation-based Feature Selection – CFS)
algoritması kullanılmıştır.
2.3.1.
Resim 3:
üretilmesi.
Giriş
örüntüsünden
LBP
CFS ilişki bazlı bir filtreleme algoritmasıdır. Özniteliklere ait
alt kümeler oluşturup bunların sınıflandırma ile olan ilişkisini
inceler. Alt kümeleri oluştururken şu hipoteze göre çalışır: İyi
öznitelik alt kümeleri, sınıflandırma ile ilişkisi olmayanlardan
ziyade yakından ilişkili olan öznitelikleri barındırır [15]. Bir
veri kümesinde CFS algoritması aşağıdaki eşitlik ile
uygulanır;
histogramının
Bu çalışmada kullanılan 100x100 piksel boyutlarındaki yüz
örüntüleri LBP algoritması tarafından 24x24 piksellik
alanlara bölünmüştür.
2.2.2.
I x  I * Dx
ve
G  I x2  I y2
q  tan 1
Ix
Iy
Dy  DxT
I y  I * Dy
(7)
k  k (k  1)rii
Eşitlikte rzc; Bir araya getirilen bileşenler ile diğer
değişkenlerin ilişkisini, k; Bileşen sayısını, rzi; Bir araya
getirilen bileşenler ile diğer değişkenlerin ortalama ilişkisini,
rii; Bir araya getirilen bileşenler arası ortalama iç ilişkisini
temsil etmektedir.
HOG yöntemindeki temel amaç imgeyi bir grup lokal
histogramlar olarak tanımlamaktır. Bu gruplar, imgenin yerel
bir bölgesindeki gradyanların yönelimlerinde, gradyanların
büyüklüklerinin toplandığı histogramlardır. Bir imgenin
HOG değerlerinin çıkartılması için gerekli olan hesaplamalar
aşağıda verilen eşitlikler ile sağlanır [14]:
ve
k rzi
rzc 
Yönlü Gradyanların Histogramı (HOG)
Dx   1 0 1
İlişki Tabanlı Öznitelik Seçme (CFS)
2.4. Sınıflandırma Sonuçları ve Performans Analizi
Giriş örüntüleri için LBP algoritması tarafından üretilen 944
öznitelik ile HOG algoritması tarafından üretilen 4356
öznitelik Naïve Bayes ve k-En Yakın Komşu (kNN)
sınıflandırıcıları kullanılarak, 10-Kat Çapraz Doğrulama (Ten
Fold Cross Validation) – Birini Dışarıda Bırak (Leave One
Out, LOO) yöntemleri ile sınıflandırılmıştır. Ardından aynı
veri setleri, öznitelik seçme algoritmasından geçirilmiş ve
boyutları küçültülmüştür. Yeni veri setleri kullanılarak
sınıflandırma işlemleri tekrar edilmiştir. Son olarak öznitelik
seçme algoritması ile boyutları küçültülen bu iki veri setinin
birleştirilmesiyle elde edilen yeni veri kümesi ile
sınıflandırma işlemleri tekrar edilmiştir. Elde edilen sonuçlar
Tablo 1’de gösterilmiştir.
(3)
(4)
(5)
(6)
Eşitlik 3’ te yatay ve dikey Sobel filtreleri tanımlanmıştır. Bu
filtreler giriş örüntüsüne uygulanarak, örüntünün yatay ve
dikey kenarları Ix ve Iy olmak üzere tespit edilir (Eşitlik 4).
Sobel filtresi uygulanan Ix ve Iy örüntüleri kullanılarak,
Eşitlik 5’ e göre bu örüntülerin gradyanları, ardından Eşitlik
7’ ye göre bu gradyanların yönelim açıları ( G ve θ )
hesaplanır. Bu çalışmada kullanılan 100x100 piksel
boyutlarındaki yüz örüntüleri HOG algoritması tarafından bir
bütün olarak ele alınmış ve örüntü üzerinde herhangi bir
bölümlendirme işlemi yapılmamıştır.
Tablo 8: Sınıflandırma sonuçları
SINIFLANDIRICILAR
YÖNTEM
ÖZNİTELİK
SAYISI
- Naïve Bayes
k-NN (k=1)
Doğr.
(%)
ROC
Süre
(sn)
Doğr.
(%)
ROC
Süre
(sn)
LBP - 944
88.80
0.923
2.5
96.60
0.961
~4
HOG - 4356
88.20
0.914
~8
94.40
0.938
~15
LBP - 98
91.00
0.950
~1
96.40
0.957
~1
HOG - 182
92.20
0.971
~2
95.60
0.952
1.5
(LBP + HOG) - 280
93.20
0.968
~1
97.60
0.970
~2
2.3. Öznitelik Seçme
Öznitelik seçme yöntemleri; temel ya da bağımsız bileşenlere
en az katkı yapan özniteliklerin düşük ayırt edici özelliğe
sahip olduğu fikrini esas alarak, daha anlamlı olan
özniteliklerin yeni bir sınıflandırma uzayı altında
toplanmaları esasına dayanır [5]. Yüksek öznitelik
vektörlerine sahip veri setlerinde sınıflandırma süresi ve
maliyetlerinin azaltılması, sınıflandırıcı performansının
arttırılması ve çok boyutluluk problemininin (curse of
dimensionality) önüne geçilmesi adına bu algoritmalar
geliştirilmiştir [15].
Tablo 1’ de bulunan ilk iki satır; ham veri setlerine ait
sonuçları, üçüncü ve dördüncü satır; öznitelik seçme
algoritması uygulanan veri setlerine ait sonuçları, son satır
363
ise; önerilen yönteme ait sonuçları göstermektedir. Tabloda
verilen doğruluk değeri, doğru sınıflandırılmış verilerin tüm
doğru verilere ait oranını, ROC değeri ise sınıflandırma
sonucunun şans ile olan ilişkisini belirtir. Performans analizi
yapılırken bu iki kriter birlikte değerlendirilir. Doğruluk
değerinin 100’e, ROC değerinin ise 1’e yakınlığı,
sınıflandırmanın kalitesini gösterir. Verilen hesaplama
süreleri, sınıflandırıcıların; model oluşturma ve 10 kat çapraz
doğrulama işlemlerinin tümünü tamamlayıncaya kadar geçen
zamandır.
arttırılması sağlanabilir. Bununla birlikte, en iyi sonuçları
üretecek maksimum örnek sayısının belirlenmesi gibi bir
optimizasyon problemi konusu üzerinde de durulabilir.
4. Kaynaklar
[1] Bishop, C. M. “Pattern Recognition and Machine
Learning”. Springer. pp. vii., 2006.
[2] Babur S., et al., “DVM Tabanlı Kalın Bağırsak Kanseri
Tanısı İçin Performans Geliştirme”, ELECO, 2012.
[3] Biricik, G., Diri, B. ve Sönmez, A. C. “Abstract feature
extraction for text classification.” Turkish Journal of
Electrical Engineering and Computer Sciences, 11371159, 2012.
[4] Kılınç, M., “Yüz Resimlerinden Yaş Tahmini”, Yüksek
Lisans Tezi, 2012.
[5] Chellappa R. ve Ramanathan N., “Face Recognition
across Age Progression”. Proc. Face Recognition Grand
Challenge and ICE Workshop, 2006.
[6] Phillips, P. J., Wechsler, H., Huang J. ve Rauss, P. “The
FERET database and evaluation procedure for facerecognition algorithms.”, Image and Vision Computing
16, 295-306, 1998.
[7] Phillips, P. J., Moon, H., Rizvi, S.A. ve Rauss, P. J.
“The FERET evaluation methodology for facerecognition algorithms”, IEEE Transactions on Pattern
Analysis and Machine Intelligence, 22, 1090-1104,
2000.
[8] FERET Color Veri Seti (Versiyon: 1),
http://www.nist.gov/itl/iad/ig/colorferet.cfm, E.T: 2016.
[9] Viola P. ve Jones M., “Robust real time object
detection”. In IEEE ICCV Workshop on Statistical and
Computational Theories of Vision, 2001.
[10] Ojala, T., Pietikäinen M. ve Harwood, D., "A
Comparative Study of Texture Measures with
Classification Based on Feature Distributions," Pattern
Recognition, vol. 29, 51-59, 1996.
[11] Marcel S., Rodriguez Y. ve Heusch G., “On the recent
use of local binary patterns for face authentication”.
International Journal on Image and Video Processing
Special Issue on Facial Image Processing. IDIAP-RR,
06-34, 2007.
[12] Ojala, T., Pietikainen M. ve Maenpaa T.,
"Multiresolution Gray-Scale and Rotation Invariant
Texture Classification with Local Binary Patterns,"
IEEE Trans. Pattern Analysis and Machine Intelligence,
24, 971-987, 2002.
[13] Kimmel, R., Klette, R. ve Sugimoto A., Computer
Vision - ACCV 2010, Springer, New Zealand, 2012.
[14] Kobayashi, T., Hidaka, Akinori. ve Kurita, T.,
"Selection of Histograms of Oriented Gradients Features
for Pedestrian Detection.", ICONIP, 4985, 598-607,
2008.
[15] Bellman, R.E., Dynamic programming. Princeton
University Press. ISBN 978-0-691-07951-6, 1957.
[16] Hall, M. A. Correlation-based Feature Subset Selection
for Machine Learning. Hamilton, New Zealand., 1998.
[17] Guo, J.M., Lin, C.C., Nguyen, H.S., “Face gender
classification using improved appearance-based average
face difference and support vector machine.”
International Conference on System Science and
Engineering, 637–640, 2010.
Tablo 2’de aynı veri seti kullanılarak farklı yöntemlerle elde
edilmiş sonuçlar bulunmaktadır.
Tablo 9: Geçmiş çalışmalarda elde edilen sonuçlar
Sonuç
Çalışma
Ref
% 88,89 Doğruluk
Guo, J.M. et al.,
[17]
% 92,50 Doğruluk
Mayo, M. ve Zhang, E.
[18]
% 93,00 Doğruluk
O. Ozbudak et al.
[19]
% 95,05 Doğruluk
Jabid, T.H.K. ve Oksam Chae, .M.
[20]
3. Sonuçlar
Sonuçlar incelendiğinde en yüksek doğruluk ve ROC
değerlerinin kNN sınıflandırıcısında, önerilen yöntem ile
oluşturulan veri setinden elde edildiği gözlemlenmektedir.
Bununla birlikte önerilen yöntemin hesaplama süresindeki
başarısı, özellikle gerçek zamanlı bir sistem tasarlanırken,
gerek işlem süresi, gerekse sağladığı yüksek doğruluk ve
ROC
değerleri
göz
önünde
bulundurulduğunda,
kullanılabilirliğinin artmasında etkili bir parametredir. Ayrıca
kNN sınıflandırıcısının Naive Bayes sınıflandırıcısına oranla
daha yüksek sonuçlar vermesi, tasarlanan yüz tanıma
modelinde, mesafe fonksiyonunun olasılık fonksiyonuna
nazaran daha performanslı çalıştığını ortaya koymaktadır.
Çalışmada elde edilen değerler Tablo 2’ deki veriler ile
karşılaştırıldığında, hem doğruluk hem de hesaplama süresi
alanlarında
algoritmaların
oldukça
etkin
çalıştığı
gözlemlenmektedir. Yüz örüntülerinin hazırlanmasında
kullanılan normalizasyon tekniği ile öznitelik çıkartma
işleminde kullanılan LBP ve HOG algoritmalarının uyumlu
çalışması, sonuç değerlerini yükseltmede etkili olmuştur.
Bununla birlikte, kullanılan öznitelik seçme algoritmasının
veri seti ile uyumu, daha düşük veri uzayında
sınıflandırıcıların daha yüksek sonuçlara ulaşmasını
sağlamıştır.
Bundan
sonraki
çalışmalarda
hibrit
sınıflandırıcı
yöntemlerinin bir arada kullanılmasıyla oluşturulacak yeni
modeller belirlenerek sınıflandırma sonuçlarında kalitenin
364
[18] Mayo, M. ve Zhang, E., “Improving face gender
classification by adding deliberately misaligned faces to
the training data”. IVCNZ08, 1–5, 2008.
[19] Ozbudak, O., Tukel, M., Seker, S.: “Fast gender
classification.”,
Computational intelligence and
computing research (ICCIC). IEEE International
Conference, 1–5, 2010
[20] Jabid, T.H.K. ve Oksam Chae, M.: “Gender
classification using local directional pattern (LDP).”,
20th International Conference on Pattern Classification
(ICPR), 2162–2165, 2010.
365

Yüz Örüntülerinden Cinsiyet Tespitinde Hibrit

Transkript

Benzer belgeler

BİLGİSAYARA GİRİŞ (MEH109)

sınıf bilgisini kullanan boyut indirgeme yöntemlerinin metin

BEL OMURLARI ARASI DİSKLERİN YERLERİNİN

İnsan Mikro-Dopplerinden Çıkarılan Özniteliklerin Karşılıklı Bilgisi

JCI İSTANBUL CROSSROADS 5. Uluslararası Kısa Film Festivali 2010

Sıkıştırılmış Algılama Kullanarak Yeni Bir Yüz Gösterimi

Türk İşaret Dili Yüz İfadesi ve Baş Hareketi Veritabanı A Database of

YÜZ RESİMLERİNDEN YA BİLGİSİNİN TESPİT EDİLMESİ

Knn, Nn, Bayes, Dt Ve Svm Kullanılarak Ekg Vurularının

ORMANCILIKTA COĞRAFİ BİLGİ SİSTEMLERİNİN TASARIMI VE

Separating nut-shell pieces from hazelnuts and pistachio kernels

milletvekili seçiminde partilere, bağımsız adaylara verilmek ve ilan

CBS Analiz Fonksiyonları

elman ağının sımulated annealıng algoritması kullanarak sistem

ARAŞTIRMA MAKALESİ / RESEARCH ARTICLE

TOBB EKONOMİ VE TEKNOLOJİ ÜNİVERSİTESİ