k˙ı¸s˙ıl˙ık ˙ızlen˙ımler˙ın˙ın sürekl˙ı kest˙ır˙ım˙ı contınuous predıctıon

Transkript

KİŞİLİK İZLENİMLERİNİN SÜREKLİ KESTİRİMİ
CONTINUOUS PREDICTION OF TRAIT IMPRESSIONS
Oya Çeliktutan ve Hatice Gunes
School of Electronic Engineering and Computer Science
Queen Mary University of London, United Kingdom
{o.celiktutandikici,h.gunes}@qmul.ac.uk
Özetçe —Bu bildiride, kişilik izlenimlerinin kestirimi problemi
yeni bir bakış açısıyla ele alınmıştır. İlkin, referans değeri
oluşturulurken, harici gözlemciler sürekli olarak, 0-100 arası
puan vererek değerlendirme yapmışlar, böylece uzam ve zamanda
sürekli değerleme grafikleri elde edilmiştir. İkinci olarak, Beş
Faktör Kişilik Kuramına ilaveten değerleyicilerin güvenirliliğini
ölçmek amacıyla dört özellik daha göz önünde bulundurulmuştur.
Öncül deneysel sonuçlar insan-sanal karakter etkileşimi kapsamında önerilen yaklaşımların başarımını göstermektedir.
Anahtar Kelimeler—Kişilik, Beş Faktör Kişilik Kuramı, veri
değerleme, sürekli kestirim
Abstract—In this paper, we address perceived personality
trait prediction problem from a novel perspective. First, in the
course of generating ground-truth, we ask external observers to
continuously provide ratings along multiple dimensions ranging
from 0 to 100 along time, and we generate continuous annotations
in space and time. Secondly, in addition to the widely used Big
Five personality dimensions, we introduce four more dimensions
which has the potential to gauge the reliability of the perceived
social and trait judgements. Preliminary results demonstrate the
viability of the proposed approach in the context of interactions
between a human subject and virtual characters.
Keywords—Personality, Big Five Factor Model of Personality,
data annotation, continuous prediction
I. G İR İ Ş
Kişilik özelliklerinin analizi üzerine psikoloji alanında
yıllardır çalışılmaktadır. Yapılan araştırmalar insanın kişilik
özelliklerinin arkadaşlık ilişkileri, akademik kariyerde başarı,
ilaç kullanımına eğilim gibi günlük hayattaki davranışları,
yetenekleri ve tercihlerine büyük etkisi olduğunu göstermiştir.
Bu öneminden ötürü, son yıllarda video görüntülerinden kişilik özelliklerini kestirme bilgisayarla görü ve psikolojinin
kesiştiği, kritik uygulama alanları bakımından önemli bir
araştırma konusu olmuştur. Örneğin, insan-makine etkileşimi
bağlamında, insanların ihtiyaçlarına daha iyi karşılık veren
akıllı sistemler geliştirmek için kişilik özelliklerini kestirmek
şarttır. Bu tür akıllı sistemler sanal gerçeklik, robotik, çevresel
zeka alanında ve eğlence-oyun sektöründe gittikçe yaygınlaşmaktadır.
En sık kullanılan Beş Faktör Kişilik Kuramı insan kişiliğinin beş ana özellikte kendini gösterdiğini savunmaktadır.
Bu beş özellik şöyle sıralanabilir: (i) Sorumluluk (öz disiplin,
düzenli, dikkatli, itaatkar); (ii) Uyumluluk (güvenilir, yumuşak
başlı, fedakar, alçak gönüllü); (iii) Duygusal Dengesizlik (kendisine güvenmeyen, olumsuz duygulanımlara yatkın, endişeli,
gergin, sinirli); (iv) Yeniliklere açıklık (hayal kuran, maceracı,
c
978-1-4799-4874-1/14/$31.00 2014
IEEE
yaratıcı, meraklı); (v) Dışadönüklülük (arkadaş canlısı, sosyal,
pozitif, enerjik, neşeli).
Bu beş özelliği kestirmek amacıyla, Batrinca ve ark.
[1] deneklerin kendilerini tanıttıkları kısa sunumları ele
almışlardır. Her denek aynı zamanda bir anket doldurarak
kişiliğini özdeğerlendirmiş, her özelliğin derecesi örneğin 17 arası bir puan ile ölçülmüştür. Deneklerin hal ve tavırları
perde, akustik yeğinlik, devinim genliği, bakış yönü, mimikler,
vücut duruşu, el-baş hareketleri gibi hem işitsel hem de görselveriye dayalı öznitelikler ile betimlenmiştir. Elde edilen çokkipli öznitelikler ile anket sonuçları arasındaki ilişki destek
vektör makinaları kullanılarak modellenmiştir. Bunu takiben,
önerilen yöntem [2]’de farklı bir senaryoya uygulanmıştır. Her
denek uyumludan uyumsuza değişen karakterlere sahip sanal
etmenlerle işbirliği yaparak bilgisayar ekranında bir görevi
yerine getirmeyi amaçlamaktadır.
Bazı çalışmalar ise özdeğerlendirme yerine harici gözlemciler tarafından yapılan kişilik değerlendirmelerini kullanmışlardır. Bir başka deyişle harici gözlemcilerin denek
ile ilgili izlenimleri baz alınmış ve kitle kaynaklı çalışma
yoluyla (örneğin, Amazon Mechanical Turk) referans değeri
oluşturulmuştur. Bu çalışmalar arasında, Biel ve ark. [3]
Youtube sosyal paylaşım sitesine yüklenen videolar üzerine
yoğunlaşmış, çerçeve başına duygulanımı (mutluluk, üzüntü,
kızgınlık vb.) saptamış ve buradan çıkardıkları özniteliklere
destek vektör bağlanım (support vector regression) analizi
uygulamışlardır. Aran ve Gaticia-Perez [4] ise grup toplantısı
senaryolarını göz önüne almış ve devinim enerji imgeleri
(motion energy images), baş-vücut hareketleri, konuşma etkinliği, deneğin konuşurken ne kadar ilgi topladığı, diğerlerine
ne kadar ilgi gösterdiği, kameraya uzaklığı gibi zengin bir
öznitelik kümesini hesaba katmışlardır. Aynı doğrultuda, Subramanian ve ark. [5] denek ile diğerleri arasındaki mesafe,
belirli bir zaman aralığında deneğin hızı, baş pozuna dayalı bir
takım öznitelikleri kokteyl partisi kapsamında ele almışlardır.
Bu çalışmanın amacı benzer şekilde video görüntüsünden
bir insanla ilgili izlenimlerin kestirilmesidir; gradyan ve optik
akış histogramları doğrusal bağlanım analizi ile birlikte insansanal etmen etkileşimi kapsamında kullanılmıştır. Bu çalışma
ancak izlenimlerin tanımlanması, elde edilmesi ve kestirilmesi
problemine farklı bir açıdan bakmaktadır. Yapılan çalışmanın
katkısı iki madde altında özetlenebilir:
Önceki çalışmalarda [3], [4], değerleyiciler (harici gözlemciler) bütün klibi izledikten sonra her özellik için genel
bir puan vermişlerdir. Aksine, bu çalışmanın odak noktası
değerleyicilerin izlenimlerinin zamanda değişimini gözlemlemek, hangi kişilik özelliğinin dinamik ya da statik olarak
algılandığını irdelemek ve bu izlenimleri uzam ve zamanda
Tablo I: Her bir klip toplamda 9 özellik bakımından iki farklı
düzenekte değerlendirilmiştir.
Kod adı
SO
UY
DE
AÇ
DI
IL
YÇ
SÇ
BE
Şekil 1: SEMAINE veritabanından örnek çerçeveler [8].
sürekli olarak kestirmektir. Bilgisayarla görü camiasında,
duygulanımın sürekli kestirimi [6] oldukça araştırılan bir problem olmasına rağmen, bildiğimiz kadarı ile kişilik izlenimlerinin sürekli kestirimi şu ana kadar ele alınmamıştır. Bu
amaçla, değerleyiciler klibi izlerken aynı zamanda bir arayüz
aracılığıyla sürekli olarak, örneğin, bir dakika boyunca sürekli,
0-100 arası puan vermişlerdir.
Çalışmanın diğer bir katkısı ise izlenimleri betimlemek
amacıyla ilave dört özelliğin daha dikkate alınmış olmasıdır.
Bu sosyal özellikler şöyle sıralanabilir: (i) İlgili olma (deneğin
sanal-etmen ile konuşurken ne kadar hevesli olduğu); (ii)
Yüzün çekiciliği (yüzün çekici olarak algılanıp algılanmaması); (iii) Sesin çekiciliği (sesin çekici olarak algılanıp
algılanmaması); (iv) Beğenilebilirlik (deneğin genel olarak
sevilip sevilmediği). Biz insanlar doğamız gereği bir kişiyi
güzel ya da çekici bulmamız, sevmemiz o kişi hakkındaki genel görüşümüzü veya diğer özellikleri hakkındaki
yargılarımızı yönlendirir (bkz. Halo etkisi [7]). Bu nedenle,
bu özellikler ile Beş Faktör Kişilik Kuramı arasındaki ilişkiyi incelemek bireysel yargıların ne kadar güvenilir olduğu
konusunda ipucu verecektir.
İzlenimlerin yukarıda tanımlanan dokuz özellik bakımından (Beş Faktör Kişilik Kuramı ve 4 sosyal özellik) kestirilmesi amacıyla uzamda ve zamanda sürekli olarak elde
edilen değerlendirmeler iki farklı yaklaşımda kullanılmıştır: (i)
Uzamda sürekli kestirim (USK) ve (ii) Uzam-zamanda sürekli
kestirim (UZSK). Önerilen yaklaşımların başarımı insan-sanal
etmen etkileşimi kapsamında test edilmiştir.
II. VER İ VE DE ĞERLEME
Veri. SEMAINE veritabanı [8] bir insan ile farklı sanal
karakterler arasındaki etkileşimi içeren doğal video kayıtlarından oluşmaktadır. Bu çalışmada SEMAINE veritabanından her
biri 3 farklı yarı-otomatik karakter (Poppy, Obadiah, Spike) ile
sohbet eden 10 denek, toplamda 30 video kaydı kullanılmıştır.
Değerleyicilerin iş yükünü hafifletmek amacıyla sanal karakterlerden biri (Prudence) göz ardı edilmiştir ve her bir video kaydı
kırpılarak 60 sn.’lik klipler oluşturulmuştur. Örnek çerçeveler
Şekil 1’de gösterilmiştir.
Değerleme. Klipler yaşları 23 ile 53 arasında değişen,
çoğunlukla doktora öğrencilerinden oluşan 21 ücretli katılımcı
tarafından değerlendirilmiştir. Katılımcılar her bir klibi 4 ya da
5 özellik bakımından değerlemiştir ve her bir seans ortalama
olarak 4.5 saat sürmüştür.
Değerleme işlemi iki haftada iki ayrı düzenekte tamamlanmıştır: (i) görsel ve (ii) işitsel-görsel. Görsel değerleyiciler
klibi izlerken herhangi bir ses duymamışlar, sadece görsel
ipuçlarına (deneğin mimikleri, el-baş hareketleri, duruşu vb.)
dayanarak karara varmışlardır. Toplamda 16 değerleyici (9
kadın, 7 erkek) 8 özellikten (Beş Faktör Kişilik Kuramı ve
ilgili olma, yüz çekiciliği, beğenilebilirlik) 4 ya da 5’i bakımından puan vermiş, böylece her bir klip için toplamda 32-40
Özellik
Sorumluluk
Uyumluluk
Duygusal dengesizlik
Yeniliklere açıklık
Dışadönüklülük
İlgili olma
Yüzün çekiciliği
Sesin çekiçiliği
Beğenilebilirlik
100
100
90
90
80
80
70
70
60
60
50
50
40
40
30
30
20
20
10
Görsel
√
√
√
√
√
√
√
İşitsel-görsel
√
√
√
√
√
√
10
0
0
100
200
300
400
500
600
700
800
900
100
200
300
400
500
600
700
800
900 1000 1100 1200
Şekil 2: İlgili olma için farklı katılımcılar tarafından sağlanan
örnek değerleme verisi. Sağdaki şekil görsel-değerlemeye, soldaki ise işitsel-görsel-değerlemeye karşılık gelmektedir. Kırmızı tireli çizgi ortalama değerleme grafiğini temsil etmektedir.
değerleme elde edilmiştir. İşitsel-görsel değerleyiciler ise aynı
zamanda deneğin sanal karakter ile sohbetini de dinlemişlerdir.
Görsel değerleyicilere hangi özelliği ses olmadan ölçmenin zor
olduğunu sorduk, aldığımız geri bildirime göre sorumluluk,
uyumluluk, açıklık ve ilgili olma özelliklerini işitsel-görsel
değerleme için seçtik, ayrıca yüz çekiciliğinin karşılığı olarak
ses çekiciliğini de hesaba kattık. İlk katılımcılardan farklı 5
değerleyici (2 kadın, 3 erkek) seçilen 5 özellik bakımından
izlenimlerini sağlamışlardır, böylece her bir klip için toplamda
25 değerleme elde edilmiştir. Değerlenen özellikler Tablo I’de
özetlenmiştir.
Değerleme sırasında katılımcılar bir arayüz [9] kullanarak
hem klibi izlemişler, hem de aynı zamanda bir çubuğu sağa
sola kaydırarak bir dakika boyunca sürekli 0-100 arası puan
vermişlerdir. Arayüz çubuğun durduğu yeri (puanı) belli zaman aralıklarında, örneğin her 50 msn.’de, kaydetmiştir. İlgili
olma için örnek görsel ve işitsel-görsel değerleme grafikleri
Şekil 2’de sunulmuştur. Görüldüğü gibi değerleyiciler çeşitli
ölçeklerde puan vermiş olmakla birlikte puan verme tarzları
benzerdir. Mesela bu durum işitsel-görsel değerlemede daha
belirgindir, biri hariç bütün değerleyiciler gittikçe artan puan
vermişlerdir. Aynı şekilde benzer davranışlar görsel değerlemede de görülebilir.
Değerlemelerin analizi. Akıllı arayüzler geliştirirken en
büyük zorluklardan biri farklı değerleyiciler tarafından verilen
puanlardan güvenilir referans değeri elde etmekdir. Özellikle,
sürekli kestirim söz konusu olduğunda değerleyicilerin stili,
zaman gecikmesi gibi faktörlerle problem daha karmaşık
bir hal almaktadır. Ayrıca her bir değerleyicinin öznel puan
ölçeklendirmesi birbirinden çok farklı olabilir. Bu nedenle
literatürdeki genel yaklaşım [6] değerleme grafiklerini mutlak
değerler yerine bağıl değerler (grafikte artış, düşüş ya da düzlük) cinsinden karşılaştırmaktır. Biz de aynı amaçla herhangi
bir analizden önce her bir değerleme grafiğini ortalaması 0 ve
standart sapması 1 olacak şekilde normalize ettik.
Tablo II: Seçilen değerleyiciler arasındaki uyuşma Pearson’un
ilinti katsayısı ve Cronbach’ın alfa katsayısı ile ölçülmüştür.
Parantez içindeki değerler bütün değerleyiciler arasındaki
uyuşma derecesini vermektedir.
Pearson
SO
UY
DE
AÇ
DI
IL
YÇ
SÇ
BE
0.42
0.47
0.46
0.44
0.47
0.51
0.44
Görsel
Cronbach
(0.16)
(0.40)
(0.34)
(0.27)
(0.38)
(0.40)
(0.27)
0.47 (0.36)
0.80
0.84
0.88
0.82
0.85
0.87
0.80
(0.61)
(0.80)
(0.82)
(0.69)
(0.80)
(0.81)
(0.70)
0.84 (0.78)
İşitsel-görsel
Pearson
Cronbach
0.58 (0.35)
0.53 (0.29)
0.59 (0.21)
0.58 (0.41)
0.64 (0.36)
-
0.82 (0.47)
0.75 (0.47)
0.81 (0.09)
0.82 (0.58)
0.86 (0.55)
-
Literatürde değerleyici güvenebilirliğini ya da değerleyiciler arasındaki uyuşmayı ölçmek için ilintiye dayalı yöntemler
oldukça yaygındır. Zamanla değişen veriler göz önünde bulundurulduğunda bu tür yöntemlerin doğrudan uygulanması iyi
sonuç vermemektedir. Diğer taraftan, dinamik zaman bükmesi
(dynamic time warping) bu tür zamanla değişen verilerin
hizalanması için oldukça etkin bir yöntemdir. Kısaca, dinamik
zaman bükmesi iki dizi arasındaki, örneğin, s ile t, en iyi
hizalamayı birikimli uzaklık toplamını minimize ederek bulur.
Deneylerimizde zamanda eşleştirme kısıtı 2 sn. olarak belirlenmiştir, bir başka deyişle, s[i] ile t[j]’yi eşleştirirken, |i − j|
2 sn.’den büyük olamaz.
Her değerleme çifti dinamik zaman bükmesi ile hizalandıktan sonra, değerleyiciler arasındaki uyuşmayı Pearson’un
ilinti katsayısı ve Cronbach’ın alfa katsayısı ile ölçtük. İlinti
değerleri aynı zamanda aykırı değerleyicileri elemek için de
kullanılmıştır. Bir klip için N tane değerleyici olduğunu
varsayalım. Her bir değerleyicinin geri kalan N − 1 değerleyici ile ilintisini hesapladık. Eğer değerleyicinin geri kalanlar
ile ortalama ilintisi belli bir eşik değerinden yüksek ise,
söz konusu değerleyici referans değeri oluştururken hesaba
katılmıştır, aksi takdirde göz ardı edilmiştir. Tablo II’de verildiği gibi aykırı değerleyicilerin elenmesinden sonra değerleyicilerin güvenebilirliği her iki durumda da artmıştır.
III. İZLEN İMLER İN SÜREKL İ KEST İR İM İ
Önerilen yöntem iki farklı yaklaşım ile test edilmiştir:
(i) Uzamda Sürekli Kestirim (USK) ve (ii) Uzam-Zamanda
Sürekli Kestirim (UZSK). Amacımız USK’da bütün klip için
genel bir puan elde etmek iken, UZSK yaklaşımıyla zamanda
sürekli değişen puanlamaları kestirmektir.
A. Uzamda Sürekli Kestirim (USK)
Bütün klip için toplam bir puan 60 sn. üzerinden değerleme grafiğinin ortalaması alınarak belirlenmiştir. Bölüm II’de
önerilen yöntem kullanılarak seçilen değerleyicilerin toplam
puanlarının ortalaması alınmış ve referans değeri oluşturulmuştur. Böylece her klip için 0-100 arası toplam bir puan elde
edilmiştir.
Öznitelik çıkarmak amacıyla ilk önce uzam-zaman ilgi
noktalarını 3B Harris köşe dedektörü ile tespit ettik ve bu noktaların yerel komşuluklarını gradyan ve optik akış histogramları [10] ile betimledik. İlgi noktalarının yerel komşuluğu
M ×M ×N (örneğin, 3×3×2) uzam-zamansal bloklara bölünmüş ve her blok için sırasıyla 4-seleli ve 5-seleli gradyan ve
optik akış histogramları hesaplanmıştır. Bu histogramlar ucuca
eklenerek ilgi noktası başına 162-uzunluğunda bir öznitelik
vektörü elde edilmiştir. Bir klipteki deneğin hal ve tavırları
yerel betimleyicilerin (öznitelik vektörlerinin) birleşimi şeklinde ifade edilmiş ve bu bağlamda yaygın olarak kullanılan
Görsel Kelime Torbası (Bag of Visual Words) modellerine
[11] başvurulmuştur. Görsel Kelime Torbası (GKT) modelleri temel olarak K-ortalamalar topaklandırması ile bir kod
tablosu oluşturur, ve her klibi yerel betimleyicilere rastlama
olasılığı cinsinden sayısal bir gösterime dönüştürür. Deneylerimizde topak sayısı K = 32 olarak belirlenmiş, ve klip
zaman boyunca 4 sn.’lik dilimlere bölünmüş ve her bir zaman
dilimi için ayrı GKT histogramı hesaplanmıştır. Tüm klibi
betimlemek için zamana-bağlı histogramlar üzerinden ortalama
alınmıştır.
İzlenimleri kestirmek amacıyla histogramlar ile değerlemeler arasındaki ilişki doğrusal bağlanım analizi, özellikle
Lasso ve Ridge bağlanım analizi kullanılarak, modellenmiştir. Bağlanım katsayıları her defasında bir denek eğitim
kümesinden harici tutularak (leave-one-subject-out) öğrenilmiş
ve hedef denek üzerinde test edilmiştir.
B. Uzam-Zamanda Sürekli Kestirim (UZSK)
UZSK durumunda her bir klip için referans değerini iki
farklı strateji ile oluşturduk: (i) Seçilen değerleme grafiklerinin
uzam boyunca ortalamasını aldık; (ii) Aslında var olmayan bir
değerleme grafiği yaratmak yerine diğerleri ile ilintisi en fazla
olan değerleme grafiğini referans değeri olarak kabul ettik.
UZSK yaklaşımında her bir çerçeveyi zamanda bağımsız
olarak ele aldık ve çerçeve başına çıkarılan öznitelik vektöründen çerçeveye ilişkin zaman anında örneklenen puan değerini
kestirmeye çalıştık. USK’dan farklı olarak, ilk önce [12]’deki
yüz nirengileme algoritmasını kullanarak her bir çerçeve başına
49 yüz nirengi noktası saptadık. Daha sonra bu nirengi noktalarının yerel komşuluklarında gradyan ve optik akış histogramlarını hesapladık, böylece 49 × 162 = 7938 boyutunda bir
öznitelik vektörü elde ettik. Son olarak Temel Bileşenler Analizi kullanarak öznitelik uzayının boyutunu 100’e indirgedik.
Çerçeve öznitelikleri ve zamana-bağlı puanlamalar arasındaki
ilişki USK’da olduğu gibi Lasso ve Ridge bağlanım analizi
yöntemleri ile modellenmiştir.
IV. DENEYSEL SONUÇLAR VE TARTI ŞMA
USK ve UZSK yaklaşımları Tablo I’de verilen 9 kişiliksosyal özelliğine ilişkin izlenimleri kestirmek amacıyla kullanılmış, hem görsel değerleme, hem de işitsel-görsel değerleme verileri ile eğitilerek başarımları karşılaştırılmıştır. Tablo
III kestirim sonuçlarını özetlemektedir. Referans değeri ile kestirilen değerler arasında en küçük kareler hatası (MSE: Meansquare Error) ve Pearson’s ilinti katsayısı (COR) hesaplanarak
önerilen yaklaşımların başarımları ölçülmüştür. Değerleme
grafikleri normalize edildiğinden (ortalaması 0 ve standart
sapması 1) olabilecek en büyük MSE değeri 4’dür.
Tablo III-a USK durumunda en iyi sonuçların yüz çekiciliği ve beğenilebilirlik için elde edildiğini göstermektedir
(COR>0.7). Bu sonuç beklentilerimiz ile de aynı doğrultudadır,
çünkü değerleyiciler bu boyutları değerlendirmede en kolay
bulmuşlardır. Önerilen yaklaşım ile aynı zamanda uyumluluk,
dışadönüklülük ve duygusal dengesizlik için de iyi başarım
elde edilmiş (COR>0.55), bu özellikleri ilgili olma ve açıklık
takip etmiştir. Bunun nedeni şöyle açıklanabilir: Bu boyutlar,
özellikle ilgili olma, diğer boyutlara nispeten daha dinamik
olarak algılanmaktadır, bu nedenle zamanda değişen değerleme
grafiğinin ortalaması alınarak elde edilen toplam bir puan
iyi sonuç vermemektedir. İşitsel-görsel değerlemelerle eğitmek
en çok sorumluluk özelliğinin kestirim başarımını artırmıştır.
Diğer taraftan, diğer bütün özellikler için başarım oldukça
düşüktür. İşitsel-görsel değerleyiciler görsel ipuçlarından daha
çok sözel içeriğe göre deneği yargılamış olabilirler. Bu nedenle
önerilen yaklaşımın sadece görsel öznitelikler ile işitsel-görsel
değerlemeler arasında bir ilişki kuramadığı sonucuna vardık.
Aynı zamanda sözel içerikten de öznitelikler çıkarılarak bu
problem giderilebilir. Aynı şekilde önerilen yaklaşım görsel
öznitelikler ile ses çekiciliği arasında da bir ilişki bulamamıştır.
Literatürde kişilik özelliklerinin kestirilmesi üzerine birçok
yöntem olmakla birlikte kullanılan veritabanlarının içeriği,
değerleme yöntemi ve başarım hesaplama ölçütleri birbirinden
çok farklıdır. Biz yine de en yakın yöntemler [2]–[4] ile
önerilen yaklaşımı karşılaştırdık. Dışadönüklülük sıklıkla en
kolay kestirilebilen özellik olarak rapor edilmiştir. Örneğin,
Aran ve Gaticia-Perez [4] görsel değerleme verilerini grup
toplantısı senaryosunda kullanmıştır. En iyi sonucu devinim
enerji imgeleri ile dışadönüklülük için elde etmişler (R2 =
0.31), buna karşın diğer özellikler için R2 değeri 0.1’den düşük
bulunmuştur. Benzer sonuçlar duygulanım ve işitsel-görsel
öznitelikler ile [3]’de de rapor edilmiştir. Batrinca ve ark.
[2] ise kestirim problemini bir sınıflandırma problemi olarak
formüle etmiş ve işitsel-görsel öznitelikler ile dışadönüklülük
ve duygusal dengesizlik için yüksek başarım elde etmişlerdir.
Aynı doğrultuda, biz de dışadönüklülük ve duygusal dengesizlik için yüksek başarım elde ettik, sırasıyla R2 = 0.311
ve R2 = 0.43. Aynı zamanda önerilen yaklaşım uyumluluk
(R2 = 0.31) ve açıklık (R2 = 0.26) özelliklerini de başarılı
bir şekilde kestirmektedir.
Tablo III-b UZSK yaklaşımı için daha iyi sonuçlar verdiği
gerekçesiyle sadece birinci strateji ile elde edilen kestirim
sonuçlarını sunmaktadır, yani referans değeri seçilen değerlemelerin uzamda ortalaması alınarak oluşturulmuştur. İlk
bakışta COR değerlerinin USK’ya kıyasla daha düşük olduğu
şaşırtıcı gelebilir, ancak bu tür sonuçlar sürekli kestirim
alanında yaygındır. Örneğin, duygulanım alanında benzer bir
yaklaşım [13] en iyi COR = 0.22 elde etmiştir. Önerilen
yöntem bütün özellikler için kabul edilebilir başarım verirken
(COR>0.1), USK yaklaşımında olduğu gibi ses çekiciliği için
herhangi bir ilişki bulamamıştır. Genel olarak, yine en iyi
sonuçlar algoritma görsel değerlemeler ile eğitildiğinde elde
edilmiştir.
V. VARGILAR
Bu bildiride diğer insanlarla ilgili izlenimlerin kestirimi
problemine yeni bir bakış açısından baktık, yani algılanan
kişilik-sosyal özelliklerin uzam ve zamanda sürekli kestirimini
ele aldık. USK yaklaşımı görsel değerlemeler referans olarak
alındığında dışadönüklülük, duysusal dengesizlik, uyumluluk
ve açıklık için yüksek başarım vermektedir. Öncül deneysel
sonuçlar aynı zamanda UZSK yaklaşımını kavram olarak
kanıtlamıştır. UZSK yöntemi iki yönden geliştirilecektir: (i)
Çok kipli zengin bir öznitelik kümesi hesaba katılacaktır;
(ii) Her çerçeçeveyi birbirinden bağımsız olarak ele almak
yerine çevçevelerin zamandaki ilişkisi ardışıl yöntemler ile
modellenecektir.
1 R2
Pearson ilinti katsayısının karesi alınarak hesaplanmıştır.
Tablo III: MSE ve COR cinsinden kestirim sonuçları. MSE
değerleri parantez içinde verilmiştir. En iyi COR sonuçları her
satır (özellik) için koyu yazı karakteri ile belirtilmiştir. İhmal
edilebilir COR değerleri * ile gösterilmiştir, yani p > 0.05.
SO
UY
DE
AÇ
DI
IL
YÇ
SÇ
BE
(a) USK
Lasso
Ridge
İşit.İşit.Gör.
Gör.
Gör.
Gör.
0.43
0.45
*
*
(0.03)
(0.02)
0.56
*
*
*
(0.03)
0.66
0.52
(0.07)
(0.05)
0.51
0.36
*
*
(0.03) (0.05)
0.56
*
(0.04)
0.42
*
*
(0.04)
0.77
0.85
(0.07)
(0.04)
*
0.53
0.75
(0.18)
(0.03)
(b) UZSK
Lasso
Ridge
İşit.İşit.Gör.
Gör.
Gör.
Gör.
0.11
0.10
*
*
(0.42)
(0.37)
0.16
0.24
*
*
(0.55)
(0.44)
0.13
0.18
(0.49)
(0.38)
0.10
0.14
*
(0.56)
(0.41)
0.17
0.19
(0.47)
(0.39)
0.15
0.12
0.19
0.12
(0.47) (0.80) (0.41) (0.65)
0.11
0.13
(0.55)
(0.40)
*
*
0.17
0.21
(0.54)
(0.41)
ACKNOWLEDGMENT
This work is supported by the EPSRC MAPTRAITS
Project (Grant Ref: EP/K017500/1).
K AYNAKÇA
[1]
[2]
[3]
[4]
[5]
[6]
[7]
[8]
[9]
[10]
[11]
[12]
[13]
L. M. Batrinca, N. Mana, B. Lepri, F. Pianesi, and N. Sebe, “Please,
tell me about yourself: Automatic personality assessment using short
self-presentations,” in Proc. of ICMI, 2011.
L. Batrinca, B. Lepri, N. Mana, and F. Pianesi, “Multimodal recognition
of personality traits in human-computer collaborative tasks,” in Proc.
of ACM ICMI, 2012.
J. I. Biel, V. Tsiminaki, J. Dines, and D. Gatica-Perez, “Hi youtube!:
Personality impressions and verbal content in social video,” in Proc. of
ACM ICMI, 2013.
O. Aran and D. Gatica-Perez, “One of a kind: Inferring personality
impressions in meetings,” in Proc. of ACM ICMI, 2013.
R. Subramanian, Y. Yan, J. Staiano, O. Lanz, and N. Sebe, “On
the relationship between head pose, social attention and personality
prediction for unstructured and dynamic group interactions,” in Proc.
of ACM ICMI, 2013.
A. Metallinou and S. S. Narayanan, “Annotation and processing of
continuous emotional attributes: Challenges and opportunities,” in Proc.
of Int. Workshop on Emotion Representation, Analysis and Synthesis in
Continuous Time and Space, 2013.
Wikipedia, “Halo effect,” http://en.wikipedia.org/wiki/Halo_effect, accessed at January 2014.
G. McKeown, M. Valstar, R. Cowie, M. Pantic, and M. Schroder, “The
semaine database: Annotated multimodal records of emotionally colored
conversations between a person and a limited agent,” IEEE TAC, vol.
3, no. 1, pp. 5–17, 2012.
B. P. Motichande, “A graphical user interface for continuous annotation
of non-verbal signals,” Final Project, BSc FT Computer Science, Queen
Mary University of London, UK, 2013.
I. Laptev, M. Marszalek, C. Schmid, and B. Rozenfeld, “Learning
realistic human actions from movies,” in Proc. of IEEE CVPR, 2008.
J. Sivic and A. Zisserman, “Video google: a text retrieval approach to
object matching in videos,” in Proc. of IEEE ICCV, 2003, pp. 1470–
1477 vol.2.
X. Xiong and F. De la Torre, “Supervised descent method and its
application to face alignment,” in Proc. of IEEE CVPR, 2013.
E. Sariyanidi, H. Gunes, M. Gökmen, and A. Cavallaro, “Local Zernike
moment representations for facial affect recognition,” in Proc. of BMVC,
2013.

k˙ı¸s˙ıl˙ık ˙ızlen˙ımler˙ın˙ın sürekl˙ı kest˙ır˙ım˙ı contınuous predıctıon

Transkript

Benzer belgeler

Kimyasal tepkimeler için göstergeler

Uyuz Scabiës - Gent Gezonde Stad

UNIVERSITY OF CAMBRIDGE INTERNATIONAL

ORTADO ĞU RULMAN

Egzersiz E˘gitmeni Robotu˙Için Hareket Takliti Gesture