k˙ı¸s˙ıl˙ık ˙ızlen˙ımler˙ın˙ın sürekl˙ı kest˙ır˙ım˙ı contınuous predıctıon

Yorumlar

Transkript

k˙ı¸s˙ıl˙ık ˙ızlen˙ımler˙ın˙ın sürekl˙ı kest˙ır˙ım˙ı contınuous predıctıon
KİŞİLİK İZLENİMLERİNİN SÜREKLİ KESTİRİMİ
CONTINUOUS PREDICTION OF TRAIT IMPRESSIONS
Oya Çeliktutan ve Hatice Gunes
School of Electronic Engineering and Computer Science
Queen Mary University of London, United Kingdom
{o.celiktutandikici,h.gunes}@qmul.ac.uk
Özetçe —Bu bildiride, kişilik izlenimlerinin kestirimi problemi
yeni bir bakış açısıyla ele alınmıştır. İlkin, referans değeri
oluşturulurken, harici gözlemciler sürekli olarak, 0-100 arası
puan vererek değerlendirme yapmışlar, böylece uzam ve zamanda
sürekli değerleme grafikleri elde edilmiştir. İkinci olarak, Beş
Faktör Kişilik Kuramına ilaveten değerleyicilerin güvenirliliğini
ölçmek amacıyla dört özellik daha göz önünde bulundurulmuştur.
Öncül deneysel sonuçlar insan-sanal karakter etkileşimi kapsamında önerilen yaklaşımların başarımını göstermektedir.
Anahtar Kelimeler—Kişilik, Beş Faktör Kişilik Kuramı, veri
değerleme, sürekli kestirim
Abstract—In this paper, we address perceived personality
trait prediction problem from a novel perspective. First, in the
course of generating ground-truth, we ask external observers to
continuously provide ratings along multiple dimensions ranging
from 0 to 100 along time, and we generate continuous annotations
in space and time. Secondly, in addition to the widely used Big
Five personality dimensions, we introduce four more dimensions
which has the potential to gauge the reliability of the perceived
social and trait judgements. Preliminary results demonstrate the
viability of the proposed approach in the context of interactions
between a human subject and virtual characters.
Keywords—Personality, Big Five Factor Model of Personality,
data annotation, continuous prediction
I. G İR İ Ş
Kişilik özelliklerinin analizi üzerine psikoloji alanında
yıllardır çalışılmaktadır. Yapılan araştırmalar insanın kişilik
özelliklerinin arkadaşlık ilişkileri, akademik kariyerde başarı,
ilaç kullanımına eğilim gibi günlük hayattaki davranışları,
yetenekleri ve tercihlerine büyük etkisi olduğunu göstermiştir.
Bu öneminden ötürü, son yıllarda video görüntülerinden kişilik özelliklerini kestirme bilgisayarla görü ve psikolojinin
kesiştiği, kritik uygulama alanları bakımından önemli bir
araştırma konusu olmuştur. Örneğin, insan-makine etkileşimi
bağlamında, insanların ihtiyaçlarına daha iyi karşılık veren
akıllı sistemler geliştirmek için kişilik özelliklerini kestirmek
şarttır. Bu tür akıllı sistemler sanal gerçeklik, robotik, çevresel
zeka alanında ve eğlence-oyun sektöründe gittikçe yaygınlaşmaktadır.
En sık kullanılan Beş Faktör Kişilik Kuramı insan kişiliğinin beş ana özellikte kendini gösterdiğini savunmaktadır.
Bu beş özellik şöyle sıralanabilir: (i) Sorumluluk (öz disiplin,
düzenli, dikkatli, itaatkar); (ii) Uyumluluk (güvenilir, yumuşak
başlı, fedakar, alçak gönüllü); (iii) Duygusal Dengesizlik (kendisine güvenmeyen, olumsuz duygulanımlara yatkın, endişeli,
gergin, sinirli); (iv) Yeniliklere açıklık (hayal kuran, maceracı,
c
978-1-4799-4874-1/14/$31.00 2014
IEEE
yaratıcı, meraklı); (v) Dışadönüklülük (arkadaş canlısı, sosyal,
pozitif, enerjik, neşeli).
Bu beş özelliği kestirmek amacıyla, Batrinca ve ark.
[1] deneklerin kendilerini tanıttıkları kısa sunumları ele
almışlardır. Her denek aynı zamanda bir anket doldurarak
kişiliğini özdeğerlendirmiş, her özelliğin derecesi örneğin 17 arası bir puan ile ölçülmüştür. Deneklerin hal ve tavırları
perde, akustik yeğinlik, devinim genliği, bakış yönü, mimikler,
vücut duruşu, el-baş hareketleri gibi hem işitsel hem de görselveriye dayalı öznitelikler ile betimlenmiştir. Elde edilen çokkipli öznitelikler ile anket sonuçları arasındaki ilişki destek
vektör makinaları kullanılarak modellenmiştir. Bunu takiben,
önerilen yöntem [2]’de farklı bir senaryoya uygulanmıştır. Her
denek uyumludan uyumsuza değişen karakterlere sahip sanal
etmenlerle işbirliği yaparak bilgisayar ekranında bir görevi
yerine getirmeyi amaçlamaktadır.
Bazı çalışmalar ise özdeğerlendirme yerine harici gözlemciler tarafından yapılan kişilik değerlendirmelerini kullanmışlardır. Bir başka deyişle harici gözlemcilerin denek
ile ilgili izlenimleri baz alınmış ve kitle kaynaklı çalışma
yoluyla (örneğin, Amazon Mechanical Turk) referans değeri
oluşturulmuştur. Bu çalışmalar arasında, Biel ve ark. [3]
Youtube sosyal paylaşım sitesine yüklenen videolar üzerine
yoğunlaşmış, çerçeve başına duygulanımı (mutluluk, üzüntü,
kızgınlık vb.) saptamış ve buradan çıkardıkları özniteliklere
destek vektör bağlanım (support vector regression) analizi
uygulamışlardır. Aran ve Gaticia-Perez [4] ise grup toplantısı
senaryolarını göz önüne almış ve devinim enerji imgeleri
(motion energy images), baş-vücut hareketleri, konuşma etkinliği, deneğin konuşurken ne kadar ilgi topladığı, diğerlerine
ne kadar ilgi gösterdiği, kameraya uzaklığı gibi zengin bir
öznitelik kümesini hesaba katmışlardır. Aynı doğrultuda, Subramanian ve ark. [5] denek ile diğerleri arasındaki mesafe,
belirli bir zaman aralığında deneğin hızı, baş pozuna dayalı bir
takım öznitelikleri kokteyl partisi kapsamında ele almışlardır.
Bu çalışmanın amacı benzer şekilde video görüntüsünden
bir insanla ilgili izlenimlerin kestirilmesidir; gradyan ve optik
akış histogramları doğrusal bağlanım analizi ile birlikte insansanal etmen etkileşimi kapsamında kullanılmıştır. Bu çalışma
ancak izlenimlerin tanımlanması, elde edilmesi ve kestirilmesi
problemine farklı bir açıdan bakmaktadır. Yapılan çalışmanın
katkısı iki madde altında özetlenebilir:
Önceki çalışmalarda [3], [4], değerleyiciler (harici gözlemciler) bütün klibi izledikten sonra her özellik için genel
bir puan vermişlerdir. Aksine, bu çalışmanın odak noktası
değerleyicilerin izlenimlerinin zamanda değişimini gözlemlemek, hangi kişilik özelliğinin dinamik ya da statik olarak
algılandığını irdelemek ve bu izlenimleri uzam ve zamanda
Tablo I: Her bir klip toplamda 9 özellik bakımından iki farklı
düzenekte değerlendirilmiştir.
Kod adı
SO
UY
DE
AÇ
DI
IL
YÇ
SÇ
BE
Şekil 1: SEMAINE veritabanından örnek çerçeveler [8].
sürekli olarak kestirmektir. Bilgisayarla görü camiasında,
duygulanımın sürekli kestirimi [6] oldukça araştırılan bir problem olmasına rağmen, bildiğimiz kadarı ile kişilik izlenimlerinin sürekli kestirimi şu ana kadar ele alınmamıştır. Bu
amaçla, değerleyiciler klibi izlerken aynı zamanda bir arayüz
aracılığıyla sürekli olarak, örneğin, bir dakika boyunca sürekli,
0-100 arası puan vermişlerdir.
Çalışmanın diğer bir katkısı ise izlenimleri betimlemek
amacıyla ilave dört özelliğin daha dikkate alınmış olmasıdır.
Bu sosyal özellikler şöyle sıralanabilir: (i) İlgili olma (deneğin
sanal-etmen ile konuşurken ne kadar hevesli olduğu); (ii)
Yüzün çekiciliği (yüzün çekici olarak algılanıp algılanmaması); (iii) Sesin çekiciliği (sesin çekici olarak algılanıp
algılanmaması); (iv) Beğenilebilirlik (deneğin genel olarak
sevilip sevilmediği). Biz insanlar doğamız gereği bir kişiyi
güzel ya da çekici bulmamız, sevmemiz o kişi hakkındaki genel görüşümüzü veya diğer özellikleri hakkındaki
yargılarımızı yönlendirir (bkz. Halo etkisi [7]). Bu nedenle,
bu özellikler ile Beş Faktör Kişilik Kuramı arasındaki ilişkiyi incelemek bireysel yargıların ne kadar güvenilir olduğu
konusunda ipucu verecektir.
İzlenimlerin yukarıda tanımlanan dokuz özellik bakımından (Beş Faktör Kişilik Kuramı ve 4 sosyal özellik) kestirilmesi amacıyla uzamda ve zamanda sürekli olarak elde
edilen değerlendirmeler iki farklı yaklaşımda kullanılmıştır: (i)
Uzamda sürekli kestirim (USK) ve (ii) Uzam-zamanda sürekli
kestirim (UZSK). Önerilen yaklaşımların başarımı insan-sanal
etmen etkileşimi kapsamında test edilmiştir.
II. VER İ VE DE ĞERLEME
Veri. SEMAINE veritabanı [8] bir insan ile farklı sanal
karakterler arasındaki etkileşimi içeren doğal video kayıtlarından oluşmaktadır. Bu çalışmada SEMAINE veritabanından her
biri 3 farklı yarı-otomatik karakter (Poppy, Obadiah, Spike) ile
sohbet eden 10 denek, toplamda 30 video kaydı kullanılmıştır.
Değerleyicilerin iş yükünü hafifletmek amacıyla sanal karakterlerden biri (Prudence) göz ardı edilmiştir ve her bir video kaydı
kırpılarak 60 sn.’lik klipler oluşturulmuştur. Örnek çerçeveler
Şekil 1’de gösterilmiştir.
Değerleme. Klipler yaşları 23 ile 53 arasında değişen,
çoğunlukla doktora öğrencilerinden oluşan 21 ücretli katılımcı
tarafından değerlendirilmiştir. Katılımcılar her bir klibi 4 ya da
5 özellik bakımından değerlemiştir ve her bir seans ortalama
olarak 4.5 saat sürmüştür.
Değerleme işlemi iki haftada iki ayrı düzenekte tamamlanmıştır: (i) görsel ve (ii) işitsel-görsel. Görsel değerleyiciler
klibi izlerken herhangi bir ses duymamışlar, sadece görsel
ipuçlarına (deneğin mimikleri, el-baş hareketleri, duruşu vb.)
dayanarak karara varmışlardır. Toplamda 16 değerleyici (9
kadın, 7 erkek) 8 özellikten (Beş Faktör Kişilik Kuramı ve
ilgili olma, yüz çekiciliği, beğenilebilirlik) 4 ya da 5’i bakımından puan vermiş, böylece her bir klip için toplamda 32-40
Özellik
Sorumluluk
Uyumluluk
Duygusal dengesizlik
Yeniliklere açıklık
Dışadönüklülük
İlgili olma
Yüzün çekiciliği
Sesin çekiçiliği
Beğenilebilirlik
100
100
90
90
80
80
70
70
60
60
50
50
40
40
30
30
20
20
10
Görsel
√
√
√
√
√
√
√
İşitsel-görsel
√
√
√
√
√
√
10
0
0
100
200
300
400
500
600
700
800
900
100
200
300
400
500
600
700
800
900 1000 1100 1200
Şekil 2: İlgili olma için farklı katılımcılar tarafından sağlanan
örnek değerleme verisi. Sağdaki şekil görsel-değerlemeye, soldaki ise işitsel-görsel-değerlemeye karşılık gelmektedir. Kırmızı tireli çizgi ortalama değerleme grafiğini temsil etmektedir.
değerleme elde edilmiştir. İşitsel-görsel değerleyiciler ise aynı
zamanda deneğin sanal karakter ile sohbetini de dinlemişlerdir.
Görsel değerleyicilere hangi özelliği ses olmadan ölçmenin zor
olduğunu sorduk, aldığımız geri bildirime göre sorumluluk,
uyumluluk, açıklık ve ilgili olma özelliklerini işitsel-görsel
değerleme için seçtik, ayrıca yüz çekiciliğinin karşılığı olarak
ses çekiciliğini de hesaba kattık. İlk katılımcılardan farklı 5
değerleyici (2 kadın, 3 erkek) seçilen 5 özellik bakımından
izlenimlerini sağlamışlardır, böylece her bir klip için toplamda
25 değerleme elde edilmiştir. Değerlenen özellikler Tablo I’de
özetlenmiştir.
Değerleme sırasında katılımcılar bir arayüz [9] kullanarak
hem klibi izlemişler, hem de aynı zamanda bir çubuğu sağa
sola kaydırarak bir dakika boyunca sürekli 0-100 arası puan
vermişlerdir. Arayüz çubuğun durduğu yeri (puanı) belli zaman aralıklarında, örneğin her 50 msn.’de, kaydetmiştir. İlgili
olma için örnek görsel ve işitsel-görsel değerleme grafikleri
Şekil 2’de sunulmuştur. Görüldüğü gibi değerleyiciler çeşitli
ölçeklerde puan vermiş olmakla birlikte puan verme tarzları
benzerdir. Mesela bu durum işitsel-görsel değerlemede daha
belirgindir, biri hariç bütün değerleyiciler gittikçe artan puan
vermişlerdir. Aynı şekilde benzer davranışlar görsel değerlemede de görülebilir.
Değerlemelerin analizi. Akıllı arayüzler geliştirirken en
büyük zorluklardan biri farklı değerleyiciler tarafından verilen
puanlardan güvenilir referans değeri elde etmekdir. Özellikle,
sürekli kestirim söz konusu olduğunda değerleyicilerin stili,
zaman gecikmesi gibi faktörlerle problem daha karmaşık
bir hal almaktadır. Ayrıca her bir değerleyicinin öznel puan
ölçeklendirmesi birbirinden çok farklı olabilir. Bu nedenle
literatürdeki genel yaklaşım [6] değerleme grafiklerini mutlak
değerler yerine bağıl değerler (grafikte artış, düşüş ya da düzlük) cinsinden karşılaştırmaktır. Biz de aynı amaçla herhangi
bir analizden önce her bir değerleme grafiğini ortalaması 0 ve
standart sapması 1 olacak şekilde normalize ettik.
Tablo II: Seçilen değerleyiciler arasındaki uyuşma Pearson’un
ilinti katsayısı ve Cronbach’ın alfa katsayısı ile ölçülmüştür.
Parantez içindeki değerler bütün değerleyiciler arasındaki
uyuşma derecesini vermektedir.
Pearson
SO
UY
DE
AÇ
DI
IL
YÇ
SÇ
BE
0.42
0.47
0.46
0.44
0.47
0.51
0.44
Görsel
Cronbach
(0.16)
(0.40)
(0.34)
(0.27)
(0.38)
(0.40)
(0.27)
0.47 (0.36)
0.80
0.84
0.88
0.82
0.85
0.87
0.80
(0.61)
(0.80)
(0.82)
(0.69)
(0.80)
(0.81)
(0.70)
0.84 (0.78)
İşitsel-görsel
Pearson
Cronbach
0.58 (0.35)
0.53 (0.29)
0.59 (0.21)
0.58 (0.41)
0.64 (0.36)
-
0.82 (0.47)
0.75 (0.47)
0.81 (0.09)
0.82 (0.58)
0.86 (0.55)
-
Literatürde değerleyici güvenebilirliğini ya da değerleyiciler arasındaki uyuşmayı ölçmek için ilintiye dayalı yöntemler
oldukça yaygındır. Zamanla değişen veriler göz önünde bulundurulduğunda bu tür yöntemlerin doğrudan uygulanması iyi
sonuç vermemektedir. Diğer taraftan, dinamik zaman bükmesi
(dynamic time warping) bu tür zamanla değişen verilerin
hizalanması için oldukça etkin bir yöntemdir. Kısaca, dinamik
zaman bükmesi iki dizi arasındaki, örneğin, s ile t, en iyi
hizalamayı birikimli uzaklık toplamını minimize ederek bulur.
Deneylerimizde zamanda eşleştirme kısıtı 2 sn. olarak belirlenmiştir, bir başka deyişle, s[i] ile t[j]’yi eşleştirirken, |i − j|
2 sn.’den büyük olamaz.
Her değerleme çifti dinamik zaman bükmesi ile hizalandıktan sonra, değerleyiciler arasındaki uyuşmayı Pearson’un
ilinti katsayısı ve Cronbach’ın alfa katsayısı ile ölçtük. İlinti
değerleri aynı zamanda aykırı değerleyicileri elemek için de
kullanılmıştır. Bir klip için N tane değerleyici olduğunu
varsayalım. Her bir değerleyicinin geri kalan N − 1 değerleyici ile ilintisini hesapladık. Eğer değerleyicinin geri kalanlar
ile ortalama ilintisi belli bir eşik değerinden yüksek ise,
söz konusu değerleyici referans değeri oluştururken hesaba
katılmıştır, aksi takdirde göz ardı edilmiştir. Tablo II’de verildiği gibi aykırı değerleyicilerin elenmesinden sonra değerleyicilerin güvenebilirliği her iki durumda da artmıştır.
III. İZLEN İMLER İN SÜREKL İ KEST İR İM İ
Önerilen yöntem iki farklı yaklaşım ile test edilmiştir:
(i) Uzamda Sürekli Kestirim (USK) ve (ii) Uzam-Zamanda
Sürekli Kestirim (UZSK). Amacımız USK’da bütün klip için
genel bir puan elde etmek iken, UZSK yaklaşımıyla zamanda
sürekli değişen puanlamaları kestirmektir.
A. Uzamda Sürekli Kestirim (USK)
Bütün klip için toplam bir puan 60 sn. üzerinden değerleme grafiğinin ortalaması alınarak belirlenmiştir. Bölüm II’de
önerilen yöntem kullanılarak seçilen değerleyicilerin toplam
puanlarının ortalaması alınmış ve referans değeri oluşturulmuştur. Böylece her klip için 0-100 arası toplam bir puan elde
edilmiştir.
Öznitelik çıkarmak amacıyla ilk önce uzam-zaman ilgi
noktalarını 3B Harris köşe dedektörü ile tespit ettik ve bu noktaların yerel komşuluklarını gradyan ve optik akış histogramları [10] ile betimledik. İlgi noktalarının yerel komşuluğu
M ×M ×N (örneğin, 3×3×2) uzam-zamansal bloklara bölünmüş ve her blok için sırasıyla 4-seleli ve 5-seleli gradyan ve
optik akış histogramları hesaplanmıştır. Bu histogramlar ucuca
eklenerek ilgi noktası başına 162-uzunluğunda bir öznitelik
vektörü elde edilmiştir. Bir klipteki deneğin hal ve tavırları
yerel betimleyicilerin (öznitelik vektörlerinin) birleşimi şeklinde ifade edilmiş ve bu bağlamda yaygın olarak kullanılan
Görsel Kelime Torbası (Bag of Visual Words) modellerine
[11] başvurulmuştur. Görsel Kelime Torbası (GKT) modelleri temel olarak K-ortalamalar topaklandırması ile bir kod
tablosu oluşturur, ve her klibi yerel betimleyicilere rastlama
olasılığı cinsinden sayısal bir gösterime dönüştürür. Deneylerimizde topak sayısı K = 32 olarak belirlenmiş, ve klip
zaman boyunca 4 sn.’lik dilimlere bölünmüş ve her bir zaman
dilimi için ayrı GKT histogramı hesaplanmıştır. Tüm klibi
betimlemek için zamana-bağlı histogramlar üzerinden ortalama
alınmıştır.
İzlenimleri kestirmek amacıyla histogramlar ile değerlemeler arasındaki ilişki doğrusal bağlanım analizi, özellikle
Lasso ve Ridge bağlanım analizi kullanılarak, modellenmiştir. Bağlanım katsayıları her defasında bir denek eğitim
kümesinden harici tutularak (leave-one-subject-out) öğrenilmiş
ve hedef denek üzerinde test edilmiştir.
B. Uzam-Zamanda Sürekli Kestirim (UZSK)
UZSK durumunda her bir klip için referans değerini iki
farklı strateji ile oluşturduk: (i) Seçilen değerleme grafiklerinin
uzam boyunca ortalamasını aldık; (ii) Aslında var olmayan bir
değerleme grafiği yaratmak yerine diğerleri ile ilintisi en fazla
olan değerleme grafiğini referans değeri olarak kabul ettik.
UZSK yaklaşımında her bir çerçeveyi zamanda bağımsız
olarak ele aldık ve çerçeve başına çıkarılan öznitelik vektöründen çerçeveye ilişkin zaman anında örneklenen puan değerini
kestirmeye çalıştık. USK’dan farklı olarak, ilk önce [12]’deki
yüz nirengileme algoritmasını kullanarak her bir çerçeve başına
49 yüz nirengi noktası saptadık. Daha sonra bu nirengi noktalarının yerel komşuluklarında gradyan ve optik akış histogramlarını hesapladık, böylece 49 × 162 = 7938 boyutunda bir
öznitelik vektörü elde ettik. Son olarak Temel Bileşenler Analizi kullanarak öznitelik uzayının boyutunu 100’e indirgedik.
Çerçeve öznitelikleri ve zamana-bağlı puanlamalar arasındaki
ilişki USK’da olduğu gibi Lasso ve Ridge bağlanım analizi
yöntemleri ile modellenmiştir.
IV. DENEYSEL SONUÇLAR VE TARTI ŞMA
USK ve UZSK yaklaşımları Tablo I’de verilen 9 kişiliksosyal özelliğine ilişkin izlenimleri kestirmek amacıyla kullanılmış, hem görsel değerleme, hem de işitsel-görsel değerleme verileri ile eğitilerek başarımları karşılaştırılmıştır. Tablo
III kestirim sonuçlarını özetlemektedir. Referans değeri ile kestirilen değerler arasında en küçük kareler hatası (MSE: Meansquare Error) ve Pearson’s ilinti katsayısı (COR) hesaplanarak
önerilen yaklaşımların başarımları ölçülmüştür. Değerleme
grafikleri normalize edildiğinden (ortalaması 0 ve standart
sapması 1) olabilecek en büyük MSE değeri 4’dür.
Tablo III-a USK durumunda en iyi sonuçların yüz çekiciliği ve beğenilebilirlik için elde edildiğini göstermektedir
(COR>0.7). Bu sonuç beklentilerimiz ile de aynı doğrultudadır,
çünkü değerleyiciler bu boyutları değerlendirmede en kolay
bulmuşlardır. Önerilen yaklaşım ile aynı zamanda uyumluluk,
dışadönüklülük ve duygusal dengesizlik için de iyi başarım
elde edilmiş (COR>0.55), bu özellikleri ilgili olma ve açıklık
takip etmiştir. Bunun nedeni şöyle açıklanabilir: Bu boyutlar,
özellikle ilgili olma, diğer boyutlara nispeten daha dinamik
olarak algılanmaktadır, bu nedenle zamanda değişen değerleme
grafiğinin ortalaması alınarak elde edilen toplam bir puan
iyi sonuç vermemektedir. İşitsel-görsel değerlemelerle eğitmek
en çok sorumluluk özelliğinin kestirim başarımını artırmıştır.
Diğer taraftan, diğer bütün özellikler için başarım oldukça
düşüktür. İşitsel-görsel değerleyiciler görsel ipuçlarından daha
çok sözel içeriğe göre deneği yargılamış olabilirler. Bu nedenle
önerilen yaklaşımın sadece görsel öznitelikler ile işitsel-görsel
değerlemeler arasında bir ilişki kuramadığı sonucuna vardık.
Aynı zamanda sözel içerikten de öznitelikler çıkarılarak bu
problem giderilebilir. Aynı şekilde önerilen yaklaşım görsel
öznitelikler ile ses çekiciliği arasında da bir ilişki bulamamıştır.
Literatürde kişilik özelliklerinin kestirilmesi üzerine birçok
yöntem olmakla birlikte kullanılan veritabanlarının içeriği,
değerleme yöntemi ve başarım hesaplama ölçütleri birbirinden
çok farklıdır. Biz yine de en yakın yöntemler [2]–[4] ile
önerilen yaklaşımı karşılaştırdık. Dışadönüklülük sıklıkla en
kolay kestirilebilen özellik olarak rapor edilmiştir. Örneğin,
Aran ve Gaticia-Perez [4] görsel değerleme verilerini grup
toplantısı senaryosunda kullanmıştır. En iyi sonucu devinim
enerji imgeleri ile dışadönüklülük için elde etmişler (R2 =
0.31), buna karşın diğer özellikler için R2 değeri 0.1’den düşük
bulunmuştur. Benzer sonuçlar duygulanım ve işitsel-görsel
öznitelikler ile [3]’de de rapor edilmiştir. Batrinca ve ark.
[2] ise kestirim problemini bir sınıflandırma problemi olarak
formüle etmiş ve işitsel-görsel öznitelikler ile dışadönüklülük
ve duygusal dengesizlik için yüksek başarım elde etmişlerdir.
Aynı doğrultuda, biz de dışadönüklülük ve duygusal dengesizlik için yüksek başarım elde ettik, sırasıyla R2 = 0.311
ve R2 = 0.43. Aynı zamanda önerilen yaklaşım uyumluluk
(R2 = 0.31) ve açıklık (R2 = 0.26) özelliklerini de başarılı
bir şekilde kestirmektedir.
Tablo III-b UZSK yaklaşımı için daha iyi sonuçlar verdiği
gerekçesiyle sadece birinci strateji ile elde edilen kestirim
sonuçlarını sunmaktadır, yani referans değeri seçilen değerlemelerin uzamda ortalaması alınarak oluşturulmuştur. İlk
bakışta COR değerlerinin USK’ya kıyasla daha düşük olduğu
şaşırtıcı gelebilir, ancak bu tür sonuçlar sürekli kestirim
alanında yaygındır. Örneğin, duygulanım alanında benzer bir
yaklaşım [13] en iyi COR = 0.22 elde etmiştir. Önerilen
yöntem bütün özellikler için kabul edilebilir başarım verirken
(COR>0.1), USK yaklaşımında olduğu gibi ses çekiciliği için
herhangi bir ilişki bulamamıştır. Genel olarak, yine en iyi
sonuçlar algoritma görsel değerlemeler ile eğitildiğinde elde
edilmiştir.
V. VARGILAR
Bu bildiride diğer insanlarla ilgili izlenimlerin kestirimi
problemine yeni bir bakış açısından baktık, yani algılanan
kişilik-sosyal özelliklerin uzam ve zamanda sürekli kestirimini
ele aldık. USK yaklaşımı görsel değerlemeler referans olarak
alındığında dışadönüklülük, duysusal dengesizlik, uyumluluk
ve açıklık için yüksek başarım vermektedir. Öncül deneysel
sonuçlar aynı zamanda UZSK yaklaşımını kavram olarak
kanıtlamıştır. UZSK yöntemi iki yönden geliştirilecektir: (i)
Çok kipli zengin bir öznitelik kümesi hesaba katılacaktır;
(ii) Her çerçeçeveyi birbirinden bağımsız olarak ele almak
yerine çevçevelerin zamandaki ilişkisi ardışıl yöntemler ile
modellenecektir.
1 R2
Pearson ilinti katsayısının karesi alınarak hesaplanmıştır.
Tablo III: MSE ve COR cinsinden kestirim sonuçları. MSE
değerleri parantez içinde verilmiştir. En iyi COR sonuçları her
satır (özellik) için koyu yazı karakteri ile belirtilmiştir. İhmal
edilebilir COR değerleri * ile gösterilmiştir, yani p > 0.05.
SO
UY
DE
AÇ
DI
IL
YÇ
SÇ
BE
(a) USK
Lasso
Ridge
İşit.İşit.Gör.
Gör.
Gör.
Gör.
0.43
0.45
*
*
(0.03)
(0.02)
0.56
*
*
*
(0.03)
0.66
0.52
(0.07)
(0.05)
0.51
0.36
*
*
(0.03) (0.05)
0.56
*
(0.04)
0.42
*
*
(0.04)
0.77
0.85
(0.07)
(0.04)
*
0.53
0.75
(0.18)
(0.03)
(b) UZSK
Lasso
Ridge
İşit.İşit.Gör.
Gör.
Gör.
Gör.
0.11
0.10
*
*
(0.42)
(0.37)
0.16
0.24
*
*
(0.55)
(0.44)
0.13
0.18
(0.49)
(0.38)
0.10
0.14
*
(0.56)
(0.41)
0.17
0.19
(0.47)
(0.39)
0.15
0.12
0.19
0.12
(0.47) (0.80) (0.41) (0.65)
0.11
0.13
(0.55)
(0.40)
*
*
0.17
0.21
(0.54)
(0.41)
ACKNOWLEDGMENT
This work is supported by the EPSRC MAPTRAITS
Project (Grant Ref: EP/K017500/1).
K AYNAKÇA
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
L. M. Batrinca, N. Mana, B. Lepri, F. Pianesi, and N. Sebe, “Please,
tell me about yourself: Automatic personality assessment using short
self-presentations,” in Proc. of ICMI, 2011.
L. Batrinca, B. Lepri, N. Mana, and F. Pianesi, “Multimodal recognition
of personality traits in human-computer collaborative tasks,” in Proc.
of ACM ICMI, 2012.
J. I. Biel, V. Tsiminaki, J. Dines, and D. Gatica-Perez, “Hi youtube!:
Personality impressions and verbal content in social video,” in Proc. of
ACM ICMI, 2013.
O. Aran and D. Gatica-Perez, “One of a kind: Inferring personality
impressions in meetings,” in Proc. of ACM ICMI, 2013.
R. Subramanian, Y. Yan, J. Staiano, O. Lanz, and N. Sebe, “On
the relationship between head pose, social attention and personality
prediction for unstructured and dynamic group interactions,” in Proc.
of ACM ICMI, 2013.
A. Metallinou and S. S. Narayanan, “Annotation and processing of
continuous emotional attributes: Challenges and opportunities,” in Proc.
of Int. Workshop on Emotion Representation, Analysis and Synthesis in
Continuous Time and Space, 2013.
Wikipedia, “Halo effect,” http://en.wikipedia.org/wiki/Halo_effect, accessed at January 2014.
G. McKeown, M. Valstar, R. Cowie, M. Pantic, and M. Schroder, “The
semaine database: Annotated multimodal records of emotionally colored
conversations between a person and a limited agent,” IEEE TAC, vol.
3, no. 1, pp. 5–17, 2012.
B. P. Motichande, “A graphical user interface for continuous annotation
of non-verbal signals,” Final Project, BSc FT Computer Science, Queen
Mary University of London, UK, 2013.
I. Laptev, M. Marszalek, C. Schmid, and B. Rozenfeld, “Learning
realistic human actions from movies,” in Proc. of IEEE CVPR, 2008.
J. Sivic and A. Zisserman, “Video google: a text retrieval approach to
object matching in videos,” in Proc. of IEEE ICCV, 2003, pp. 1470–
1477 vol.2.
X. Xiong and F. De la Torre, “Supervised descent method and its
application to face alignment,” in Proc. of IEEE CVPR, 2013.
E. Sariyanidi, H. Gunes, M. Gökmen, and A. Cavallaro, “Local Zernike
moment representations for facial affect recognition,” in Proc. of BMVC,
2013.

Benzer belgeler