Video Film Üzerinde Sorgulama Algoritması

Transkript

Video Film Üzerinde Sorgulama Algoritması
ISTANBUL UNIVERSITY ENGINEERING FACULTY
JOURNAL OF ELECTRICAL & ELECTRONICS
YEAR
VOLUME
NUMBER
: 2001
:1
:2
(307-316)
VÝDEO FÝLM ÜZERÝNDE SORGULAMA ALGORÝTMASI
Oðuzhan ÖZTAÞ
Ýstanbul Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliði Bölümü,
34850, Avcýlar, Ýstanbul
e-posta: [email protected]
ABSTRACT
In this study, the objects which are on any video frames are defined by their pozitions and types, then
a new query system was developed from constituted system. For this purpose, firstly objects which are
recorded on a video film were determined and classified according to their types. Then taking these
types into account all data knowledge of objects were entered to system on video object data base.
After these processes, constituted system can easily find objects and give all knowledge that are about
the wanted objects to users. This knowledge can be both the objects which are on video film and also
visual and audio data of multimedia knowledge. Color, type, model or audio of any objects can be
easily found by this system stated in our study.
Key Words: Multimedia, Database, Index methods, Search
ÖZET
Yapýlan çalýþmada herhangi bir video filmi üzerinde yer alan nesneler, konumlarýna ve özelliklerine
göre tanýmlanarak oluþturulan sistem üzerinden yeni bir sorgulama yöntemi geliþtirilmiþtir. Bunu
gerçekleþtirmek için öncelikle bir video bandý üzerine kayýtlý olan bir filmdeki nesneler belirlenerek
özelliklerine göre sýnýflandýrýlmýþ ve video nesnesel veri tabaný üzerinde bu özelliklere dayanarak tüm
nesnelerin gerekli bilgileri sisteme girilmiþtir. Bu iþlemlerin sonucunda oluþturulan sistem, içerdiði
nesneleri tek tek tanýmakta ve kendisinden istenen nesneyle ilgili tüm bilgileri kullanýcýya
sunmaktadýr. Bu bilgiler video bandý üzerinde bulunan her türlü nesne olabileceði gibi, bunlarýn
görüntüsel ve ses bilgisini de içeren çoklu ortam bilgileri de olabilme ktedir. Çalýþmada oluþturulan
program ile bu sistemdeki herhangi bir nesnenin rengi, tipi, modeli veya sesi kolaylýkla
bulunabilmektedir.
Anahtar Kelimeler: Çokluortam, Veri Tabaný, Ýndeks yapýlarý, Arama
1. Video Bilgi Sistemi (VBS)
Video bilgi sistemi, videolarda saklanan görüntü
üzerindeki nesnesel bilgilerin içeriklerinin elde
edilebileceði bir bilgi sistemi olarak düþünülür.
Bu bilgi sisteminde nesneden görüntüye ve
görüntüden nesneye eriºmek mümkündür.
Sorgulama nesne bazlý ve görüntü bazlý olarak
yapýlabilmektedir. Nesnelerin tam olarak özelliði
belli deðilse bu durumda bulanýk sorgulama
modülü kullanýlarak iliþkili kayýtlara eriþilebilir.
Video Film Üzerinde Sorgulama Algoritmasý
308
1.1. Çoklu ortam video sistemleri
Bant üzerinden arama zaman açýsýndan uygun
olmayacaðýndan, bu çalýþma CD-ROM üzerinden
arama göz önüne alýnarak yapýlmýþtýr. Video
kartlarý beraberinde gelen yazýlýmla birlikte
verildiklerinden kartýn kendi fonksiyonlarýný
bulmak oldukça zordur. Bu yazýlýmlar açýk halde
verilmemektedirler. Bu çalýþmada ham video
verisini iþleyen fonksiyonun hazýr olacaðý
varsayýlmýþtýr, çünkü mevcut video kartý
yazýlýmlarý
üzerinde
bu
fonksiyon
bulunmaktadýr.
Linux
iþletim
sisteminde
videokart sürücüsü ile birlikte yazýlýmýn bu
fonksiyonlarýna
eriþilebilmektedir.
Fakat
Windows95 ortamýnda açýk halde fonksiyonlar
bulunmamaktadýr.
Bu sistemle kastedilen, bir bilgisayara baðlý olan
Video ortamýnýn kontrolüdür. Bu kontrol iºlemi
yazýlacak yazýlým vasýtasýyla yapýlacaktýr.
Bilgisayara baðlý olarak iki deðiþik video ortamý
düºünülebilir. Bunlardan birincisi bant üzerinden
görüntü aktarýmý yapan bir video cihazýnýn
bilgisayara bir video kartý aracýlýðýyla
baðlanmasýdýr. Ýkincisi ise bir CD-ROM
üzerinden ham video filminin buna uygun bir
yazýlým kullanýlarak iþlenmesidir. Her iki
yöntemde de amaç, bilgisayar ortamýnda yapýlan
sorgulamanýn sonucunda bulunan adrese ya da
diðer bir deðiþle sayaca (counter) bant ya da film
üzerinden eriºip bulunan sahne tam olarak
istenen sonuç ise bunu oynatmaya geçmektir.
1GB
1000
900
800
kapladýðý yer
700
600
550MB
500MB
500
400
300
200
100MB
1 sa. video (sýkýþma
200:1)
10 dk. video (sýkýþma
30:1)
10 dk. animasyon
(sýkýþma 15:1)
6,4MB
100 renkli resim
(sýkýþma 15:1)
1MB
100 faks
sayfasý(sýkýþmamýþ)
0
500 sayfalýk metin
100
ªekil 1. Çoklu ortam uygulamarýndaki görüntü ve video verisi için yer gereksinimi.
Mevcut çoklu ortam sistemleri üç nedenden
ötürü veri sýkýþtýrmasýna ihtiyaç duyar. Bunlar,
çoklu ortam verilerinin çok fazla yer
kaplamalarý, depolama birimlerinin çoklu ortam
verilerinin eþ zamanlý iþlenmesinde yavaþ
kalmasý ve son olarak da að bant geniþliðinin
video verilerinin eþ zamanlý iletimine izin
vermemesidir.
Örnek olarak, 620*560 nokta yoðunluklu ve her
noktasý 24 bit olan renkli bir video resmi
yaklaþýk olarak 1Mb yer kaplar. Eþ zamanlý
oynatýmda saniyede 30 resim gösterilmesi
gerekmektedir. Bu da bir saniyelik video filmi
için 30Mb’lýk yer anlamýna gelir. Yeterli yer
bulunsa bile depolama birimlerinin bilgi aktarýmý
saniyede
30Mb
olmalýdýr.
Bunun
saðlanamamasýndan dolayý tek çözüm verilerin
depolanmadan önce sýkýþtýrýlmasý ve oynatýlýrken
açýlmasýdýr.
Ýleri
sýkýþtýrma
teknikleri
kullanýlarak bir saatlik video filmi için gerekli
olan 1Gb’lýk yer, 200Gb’dan çok daha uygundur.
Þekil 1’de çoklu ortam verileri için sýkýþtýrma
oranlarý grafik üzerinde verilmiþtir. Video
Oðuzhan ÖZTAª
Video Film Üzerinde Sorgulama Algoritmasý
verileri üzerinde deðiþik sýkýþtýrma algoritmalarý
vardýr. Bunlardan en çok kullanýlanlarý MPEG,
AVI ve MOV dosyalarýdýr. Bu dosyalar sadece
görüntü üzerinde bir kareden diðerine deðiþen
noktalarý(pixel) tutarlar. Sadece deðiþen noktalarý
ekrana çýkardýklarý için hýzlý çalýþýrlar.
309
Tablo 3. Çoklu ortam konum sabitleri.
(Orientation)
Sabit ismi
Deðeri
Tanýmý
mciOrientHorz
0
mciOrientVert
1
1.1.1. Windows altýnda çoklu ortam
fonksiyonlarý
Windows altýnda program geliþtirmenin en
büyük avantajý windows ile birlikte gelen her
türlü iç ve dýþ birimi ortak olarak kullanýlma
imkanýnýn bulunmasýdýr. Bu yüzden daha
önceden yazýlmýþ olan fonksiyonlarý tekrar
tanýmlamaya gerek yoktur. Çoklu ortam ile ilgili
fonksiyonlar MCI ön eki ile baºlar. Çoklu ortam
MCI kontrolü, media kontrol arayüzündeki
media dosyalarýnýn kayýt ve oynatma (çalma)
iþlevlerini yapmaktadýr. Bu fonksiyonlarýn kabul
ettiði media cihazlarý arasýnda CD-video
oynatýcýlar, MIDI dosyalarý, CD müzik çalýcýlar
ve AVI video dosyalarý bulunmaktadýr.
MCI fonksiyonlarý bir grup çok fonksiyonlu iþlev
olarak çalýþmaktadýr. Bu fonksiyonlar içinde yer
alan iºlevler þunlardýr : önceki, sonraki, çal,
beklet, geri, adým adým, dur ve kayýt iþlevleridir.
Bu iþlevleri gerçekleþtiren MCI fonksiyonlarý:
Tablo 1. Çoklu ortam kontrol sabitleri.(Mode)
Sabit ismi
Deðer Tanýmý
i
MciModeOpen
MciModeStop
524
525
Aygýt açýk deðil
Durdur
mciModePlay
mciModeRecord
mciModeSeek
526
527
528
Çal, oynat
Kayýt
Arama.
MciModePause
mciModeReady
529
530
Durdurma
Hazýr
Butonlarý
yatay
düzenle
Butonlarý
düºey
düzenle
Tablo 4. Çoklu ortam kayýt sabitleri.(Record)
Sabit ismi
Deðeri
Tanýmý
mciRecordInsert
mciRecordOverwrite
0
1
Ek kayýt
Üstüne kayýt
Tablo 5. Çoklu ortam biçim sabitleri.(Format)
Sabit ismi
Deðeri
Tanýmý
mciFormatMillisecon
ds
mciFormatHms
0
mciFormatMsf
2
mciFormatFrames
3
mciFormatSmpte24
mciFormatSmpte25
mciFormatSmpte30
mciFormatSmpte30Dr
op
mciFormatBytes
MciFormatSamples
MciFormatTmsf
4
5
6
7
1
8
9
10
Milisaniye
biçimi
Saat,
dakika,
saniye
Saniye ve
çerçeve
biçimi
Çerçeve
biçimi
24 çerçeve
25 çerçeve
30 çerçeve
30 kalan
çerçeve
Byte
Örnekler
Truck
saniye ve
çerçeve
1.2.Video üzerinden bir bilgi tarama
sistemi
Tablo 2. Çoklu ortam bildiri sabitleri.(Notify)
Sabit ismi
Deðer Tanýmý
i
mciNotifySuccessful
mciNotifySupersede
d
1
2
Komut baþarýlý
Komut çakýþmasý
mciAborted
4
Kullanýcý
sonlandýrmasý
mciFailure
8
Komut baþarýsýz
Video ortamýndaki bilgilerin iþlenmesi ve bunlar
üzerinde sorgulama ve tarama yapýlabilmesi için
bir sistem geliºtirilmesi gerekir. Bu sistemi üç
aºamada inceliyebiliriz.
Birinci aºama video görüntülerinin bilgisayar
ortamýnda saklanmasýdýr. Ama asýl amaç
düþünüldüðünde bunun etkin olmadýðý görülür.
Çünkü resimlerin saklanmasý ve iþlenmesi
oldukça zaman alýcý bir iþlemdir. Ayný zamanda
etkin de deðildir. Burada düþünülebilecek
optimum çözüm video filminin CD ortamýnda
saklanmasý ve uygun sahne kayýt adreslerinin bir
dosyada tutulmasýdýr. Bu da bize eriþim hýzý
saðlar.
Ýkinci
aþama
uygun
veri
tabanýnýn
tasarlanmasýdýr. Burada nesneye yönelik
Oðuzhan ÖZTAª
Video Film Üzerinde Sorgulama Algoritmasý
310
yaklaþým en uygun seçim olarak görülmektedir.
resim
üzerindeki
nesnelerin
yerleºtiriliºi
Doðal sorgulama ve SQL yapýsý da buna gösterilmiþtir. Burada nesne ismi verildiðinde
uygundur.
Ýnsan
aklýnýn
hatýrlama sistem, hiyerarºi içindeki nesne kodunu kod
mekanizmasýna
benzer
bir
yaklaþým kýsmýnda gösterir.
kullanýlmalýdýr. Konu, Ortam, Amaç, Nesneler
Adým 7- Kod çýkarým yönüne göre kod
ve bunlar arasýndaki iliþki hiyerarþisini içeren bir oluºturulur.
veri tabaný düþünülmüþtür.
Adým 8- Veri tabanýndan bu kod ile iliþkili
Üçüncü aºama görüntü ve kavram üzerinden kayýtlar taranýr.
sorgulama
mekanizmasýnýn
geliþtirilmesi Adým 9- Ýlgili kayýt bulunamaz ise ekrana mesaj
aþamasýdýr. Burada bir algoritma önerilmektedir. yazýlýr.
Bu algoritmaya göre görüntü, döküman, belge,
Adým 10- Bulunan kayýtlar içindeki Video sayaç
kavram, nesne üzerinden arama yapýlabilmekte bilgileri bir diziye atanýr.
ve gerekli kayýtlara ulaþýlarak tüm bilgiler elde
Adým 11- Bu dizi elemanlarý sýra ile ekrandaki
edilebilmektedir.
resim kutusu içine getirilir. Önceki, sonraki
butonlarý ile ileri - geri taranýr. Uygun görülen
kayýtlar oynatýlýr.
1.3.VBS için önerilen bir algoritma
Adým 12- Seçilen bir kayýt oynarken ya da
Bu algoritmada adým adým yapýlacak olan
seçildiðinde o kayýt ile ilgili açýklama ve nesne
iþlemler tanýmlanmýþtýr. Þimdi bu adýmlarý sýra
bilgileri bir pencere içinde yazýlýr.
ile görelim :
Adým 1- Ortamlarýn(olayýn içinde geçtiði yerin)
belirlenmesi.
Þekil 2. Video akýþ yönünde ortamlarýn
belirlenmesi.
Adým 2- Her ortam için nesne hiyerarºisi
oluºturulur.
Adým 3- Her nesne sýra ile numaralanýr.
Adým 4- Numara sýrasýna göre nesnelerin isimleri
ve özellikleri bilgisayara girilir.
Adým 5- Görüntü penceresi seçilir.
Þekil 3. Nesnesel kod çýkarýmý.
Adým 6- Nesneler özelliklerine göre yerleºtirilir.
Þekil 3’de konuma baðlý sorgulama ekranýnda
görülen nesnesel gösterilim kýsmýnda aranan
1.4. VBS algoritmasýnýn incelenmesi
1.3'de verilen algoritma adýmlarýný sýra ile
inceliyecek olursak. Baþlangýçta ortamlar
belirlenerek her ortam için nesne hiyerarºileri
çýkarýlmýþtýr. Bazý ortamlarýn ayný nesneleri
içermesi de mümkündür. Bu durumda nesneleri
tekrar tanýmlamaya gerek yoktur. Sadece yer ve
nesne bilgilerini vermek yeterli olacaktýr.
Ortamlarýn belirlenmesinden sonra nesneler sýra
ile ekrandan girilerek bir dosyaya iºlenir. Tüm
nesneler dosyaya iºlendikten sonra bu nesnelerle
resim bilgilerinin eºleºtirilmesi iºlemine geçilir.
Video'dan belli aralýklarla alýnan resimler
üzerindeki nesne bilgileri sýra ile dosyaya iþlenir.
Nesneler, film üzerinden belirlenmiþ olan deðiþik
yönlerden bakýldýklarýnda sahip olduklarý
özellikler düºünülerek girilir. Nesneler girilirken
konum bilgisi de verildiðinden, veri tabaný
üzerinden nesne konumlarýna göre de arama
yapýlabilir.
Daha sonra kod çýkarým yönüne göre aranacak
görüntünün nesne konum bilgilerini içeren kodu
çýkarýlýr ve bu kodlarý içeren dosya üzerinden bu
kodu içeren görüntü bilgisi taranýr. Birden fazla
görüntü bulunmasý durumunda sýra ile
kullanýcýya gösterilir. Bu esnada her görüntü için
açýklama penceresi açýlarak o anki görüntüyle
ilgili açýklamalar yapýlýr.
Video görüntüsü üzerinden sahneler çýkarýldýktan
sonra her sahnedeki nesnelerin belirlenmesi
iþlemi burada yapýlmamýþtýr. Videodan alýnan her
sahne kendi içinde deðiþik sayýda ve
Oðuzhan ÖZTAª
Video Film Üzerinde Sorgulama Algoritmasý
karmaþýklýkta nesne içerdiðinden, bunlarýn
ayrýþtýrýlmasý ve tanýnmasý iþlemi matematik
hesaplama gerektirir. Ele alýnan her bir sahne
üzerindeki resimde birbirine benzer nesneler
olabilmektedir. Þekil olarak eðer sadece kenarlarý
gözönüne alýrsak ayný formda deðiþik nesneler
görüldüðünde bilgisayar bunlarý tanýmýyacaktýr,
duruº pozis yonu ve yakýnlýk, uzaklýk durumuna
göre nesnelerin belirsizliði artmaktadýr. Nesneyi
oluþturan bileþenler her açýdan görülmiyebilir.
Eðer arama bu bileþenlere göre yapýlýyorsa sonuç
baþarýsýz olacaktýr. Çoðu durumda istenen
sonucu vermemektedir. Nesneler kolayca
birbirine karýþtýrýlabilir. Tanýma iþlemi için açýk
bir algoritma yoktur. Bu konu hala üzerinde
çalýþýlmakta olan ve çözülememiþ bir problemdir.
2. Yeni bir Sorgulama Sistemi
Bu çalýþma kapsamýnda gerçekleþtirilen,
videodan elde edilen resimler üzerinden nesnesel
bilgilerin sorgulanmasý ve bu iþ için ortaya
konulan algoritmada konuma göre sorgulama ve
fuzzy(bulanýk) sorgulama birimlerini örnekler
üzerinde gösterecek olursak :
Aþaðýda ele alýnacak resimlerde tanýmlanmýþ
nesnelerin listesi verilmiºtir:
Sembol
A
S
Ç
M
B
Ar
U
K
Nesne Kod
Anahtar 01
Saat
02
Çekiç
03
Mikroskop 04
Büyüteç 05
Araba
06
Uçak
07
Kuº
08
311
ssk : 00011,00001,00010,00100
yak : 00100,00001,00010,00011
Þimdi yukarýdaki sekiz resimde geçen nesnelerin
özelliklerini listeliyelim:
R1 : Çekiç( Sivri uçlu, kýsa saplý)
Anahtar( Bilyalý, Çelik kapý, Ev)
Saat( Duvar, pilli, beyaz renkte)
Mikroskop( 3uçlu)
R2 : Çekiç( küt uçlu, kýsa saplý)
Büyüteç( 5cm çaplý)
Saat( Duvar, kurmalý, mavi renkte)
Mikroskop( 4uçlu)
R3 : Çekiç( Sivri uçlu, uzun saplý)
Anahtar( Bilyalý, Çelik kapý, iþyeri)
Saat( kol saati, pilli, beyaz renkte)
Mikroskop( 5uçlu)
R4 : Büyüteç(3cm çaplý)
Saat(Duvar, kurmalý, beyaz renkte)
Mikroskop(3 uçlu)
Çekiç(Sivri uçlu, uzun saplý)
R5 : Anahtar(Normal, çelik kapý, ev)
Saat(Masa, kurmalý, yeþil renkte)
Büyüteç(2 cm çaplý)
Çekiç(Sivri uçlu, kýsa saplý)
R6 : Çekiç(Küt uçlu, kýsa saplý)
Büyüteç(4 cm çaplý)
Saat(Masa, pilli, mavi renkte)
Anahtar(Çivi, çelik kapý, iþyeri)
R7 : Anahtar(Normal, tahta kapý, iþyeri)
Çekiç(Küt uçlu, uzun saplý)
Büyüteç(3 cm çaplý)
Mikroskop(5 uçlu)
R8 : Mikroskop(4 uçlu)
Saat(Duvar,pilli, sarý renkte)
Çekiç(Küt uçlu, plastik saplý)
Anahtar(Bilyalý, tahta kapý, ev)
Sýrayla þu sorgulamalarý yapalým :
Aþaðýda verilen konumdaki resimleri bulalým:
ªekil 5. Örnek sorgu nesneleri
ªekil 4. Resim üzerindeki nesnelerin gösterilimi
Elimizde maksimum 31 nesne olsun, bu durumda
her nesneyi ikili sitemde 5 bit ile
numaralandýrdýðýmýzda R1 resmi için soldan
saða kod(ssk) ve yukarýdan aþaðý kod(yak) þöyle
oluºur:
Bu verilerden yararlanarak iki nesnenin
birbirlerine
göre
konumlarýný
belirlemiþ
oluyoruz. Yani iki kod deðeri bulunmuþ olur.
ssk : 00100,00011
yak : 00011,00100
Oðuzhan ÖZTAª
312
Video Film Üzerinde Sorgulama Algoritmasý
Bunlarý tüm kayýtlar içinde taradýðýmýzda R2 ve
R3’ün bunu içerdiði görülmektedir yani aranan
kayýtlardýr. Burada özellik belirtilmemiþtir
sadece nesne adý verilmiþtir. Þimdi özellik
bilgisini de verdiðimizi düþünürsek sonuçta
bulunan resim kümesi daha da azalacaktýr. Yani
eldeki bilgiler somutlaþtýkça arama alaný daralýr.
Kýsa saplý çekiç arandýðýnda ayný konumda
bulunan R2 ve R3’den sadece R3 bu durumu
saðladýðýndan sonuç R3 olarak bulunur.
Aþaðýda verilen konumdaki resimler bulunmak
istenmekte ve burada konum yanýnda saat
nesnesi için renk bilgisi de bulanýk(fuzzy) olarak
verilmektedir. (Açýk renk gibi) Bu kümelerin
önceden tanýmlanmýþ olmasý gerekmektedir.
c’de
(MU )
ile verilmiºtir. M ve K nesneleri
tanýmlý fakat bunlardan birini içeren resimler var
ve diðerini içeren hiç bir resim yoksa bu durum
da ªekil 7-d’de (MK) ile gösterilmiºtir.
3.6.Trafik Eðitiminde Önerilen
Sorgulama Yönteminin Kullanýlmasý
ªekil 6. Örnek sorgu nesneleri
Bu duruma uyan resimler R2,R3,R4 ve R5 dir.
Bunlar içinden yalnýz R3 ve R5 açýk renkte saat
olan resimlerdir. Normal sorgulama ile bunu iki
adýmda ayrý ayrý yapmamýz gerekecekti ve
sonuçta ikisi ayný cevap içinde bulunamayacaktý.
Belirtilen nesneler için hepsini içeren ortak
özelliklere göre arama. Bunu iki ºekilde
yapabiliriz. 1) Nesne
belirterek 2) Nesne
belirtmeden.
Birinci duruma örnek olarak: kýrmýzý renkli
birþey
vardý
ama
tam
olarak
nesne
hatýrlanamýyor. Hatýrlananlar belirtilir ve ortak
özellik olarak da kýrmýzý renk verilir.
Ýkinci duruma örnek : içinde kýrmýzý renkte bir
nesne olan resim bulunmak isteniyor. Baºka
birþey hatýrlanmadýðý için bu ortak özellik tüm
nesneler üzerinde aranýr.
M, Ç, B, K, U nesneleri üzerinden sorgulama
yapýldýðýnda dört farklý durum ortaya
çýkmaktadýr. Bunlar Þekil 7’de notasyonel olarak
gösterilmiºtir.
ªekil 7. Matematiksel gösterilim.
Bu dört durumda ele alýnan örnek veri tabaný
düþünüldüðünde þu ortaya çýkar: Nesneler ve
konumlarý bizim için önemlidir. Sorgulama bu
bilgilere göre yapýlmaktadýr. M ve Ç nesneleri
içerildikleri tüm resimlerde hep ayný konumda
iseler bu durumda tek bir sorguda bu kayýtlara
ulaþýlýr. Bu durum Þekil 7-a’da (MÇ) notasyonu
ile verilmiþtir. Eðer M ve B nesneleri içerildikleri
tüm resimlerde hep ayný konumda deðillerse bu
durumda tek bir sorgulama ile bu kayýtlara
ulaþýlamaz ve Þekil 7-b’de (MB) notasyonu ile
gösterilir. Bazý resimlerde M nesnesi, bazý
resimlerde de U nesnesi var ise fakat ikisini bir
arada içeren bir resim yoksa bu durum ªekil 7-
Trafik eðitiminde taþýt araçlarý ve bu araçlarýn
kullanýldýðý yollar düþünülmektedir. Bu yollarda
yolun durumuna göre çeºitli trafik iºaretleri
kullanýlmaktadýr. Örnek nesne grubu olarak
aþaðýdaki nesneleri gözönüne alalým:
Sembol Nesne
Kod
O
Otomobil
01
M
Minibüs
02
Ot
Otobüs
03
K
Kamyon
04
T
Traktör
05
A
Ambülans
06
G
Geçit
07
Ka
Kavºak
08
Y
Yaya Geçidi
09
L
Trafik Lambasý 10
Ya
Yasaklamalar 11
Ý
Ýlkyardým
12
D
Dönüºler
13
S
Sollama
14
B
Bisiklet
15
Yukarýdaki nesneler daha da arttýrýlabilir. Detaya
inildikçe istenen bilgilere ulaþýlmasý kolaylaþýr.
Bu uygulamada konum bilgisi isteðe göre
eklenebilir. Çünkü yukarýdaki nesneleri içeren
sahneler bizim için aranan sahnelerdir. Bu
sahneler üzerinde nesne konumlarý deðiþik
olabilir. Deðiþik yönlerden ayný durum
yansýtýlmýþ olabilir. Tüm bu durumlarý
görebilmek için konum bilgisi verilmeden sadece
nesneler verilerek bu nesneleri içeren kayýtlara
Oðuzhan ÖZTAª
Video Film Üzerinde Sorgulama Algoritmasý
ulaþýlýr. Þimdi Þekil
sorgulamalara bakalým :
8
üzeride
örnek
Ýþte bu bahsettiðimiz baðýmlýlýktan doðan her bir
özellik sonuçta ulaþýlacak olan resmi tanýmlar.
“Otobanda, kamyonun arkasýndaki araba”
dediðimizde bunu “Anayolda, kamyonun
arkasýndaki araba” dan ayýrmýþ oluyoruz. Çünkü
her ikisinde de ortak yanlar olmasýna raðmen
içinde bulunduklarý yer açýsýndan farklýlýk
göstermiºlerdir. ªekil 10’da verilen bu örnek
ayný resim üzerindeki nesnelerin birbirlerine
baðlý olduklarýný götermesi açýsýndan önemlidir.
ªekil 8. Resim üzerindeki nesnelerin gösterilimi
Örnek sorgulama olarak “Sollama” ile ilgili tüm
kayýtlar sorulduðunda cevap “R1, R2 ve R8”
olacaktýr. “Geçit” ile ilgili kayýtlar sorulduðunda
“R6 ve R7” bulunacaktýr. “Kamyon” ve
“Yayageçidi” içeren kayýt sorulduðunda “R3”
cevap olarak çýkar.
3.7. OO Modeli
Bu oluþturulan çalýþma içindeki sistemde her bir
resim kendi içinde birtakým nesneler içerir, bu
nesneler baþka nesnelere baðýmlý olabilir veya
tamamen baðýmsýz da olabilirler ama resim
üzerindeki her bir nesne kendi baþýna o resime
ulaþýlmasýný saðlayan bir anahtar görevi taþýr.
Modelimizin ºematik yapýsý Þekil 9’da
gösterilmiºtir.
Resim
Baðýmlý
313
Burada ele alýnan nesnelerden bazýlarýnýn
özellikleri bulanýk olarak da verilmiþ olabilir. Bu
durumda verilmiº olan bulanýk özellik de
niteleyici olarak kullanýlabilir. “Otobanda, aþýrý
yüklü kamyon” burada “aþýrý yüklü” bulanýk bir
deyimdir. Diðer benzer resimler içinde bu özellik
ayýrtedici
olarak
kullanýlacaktýr.
Bu
sorgulamanýn yapýlabilmesi için verilen bulanýk
küme tanýmýnýn önceden yapýlmýþ olmasý gerekir.
Tanýmlanmýþ olan bulanýk kümeler içinde eðer
böyle bir taným bulunamaz ise hata oluþur.
Bütün nesneler için “sýcak, ýlýk, soðuk, koyu,
açýk, ufak, büyük, orta, yakýn, uzak” gibi
birtakým
bulanýk
taným
kümeleri
oluþturulmalýdýr. Sorgulamada bu kümeler ayýrt
edici özellik olarak aranan nesnelerin içinde
bulunduklarý resimleri belirlemede kullanýlýr.
3.8. Nesneye Dayalý Veri Tabaný
Sistemi
Baðýmsýz
Geliºtirilen programda arama iºlemi ªekil 11’de
verilen “nesne dosyasý” (1), “bulanýk küme
dosyasý” (2) ve “resim dosyasý” (3) dosyalarý
kullanýlarak yapýlmaktadýr.
ªekil 9. Nesnesel iliºki modeli
Bu modele örnek olarak içinde “araba” resmi
olan bir fotoðrafý düþünelim. “araba” burada bir
nesnedir. “kamyon” ile ayný resimde olan
“araba”, “kamyon” nesnesine baðlýdýr yani
“kamyon”’un bir takým özelliklerini de içerir.
“kamyon” da bir “otoban”da gidiyorsa o da
“otoban” nesnesine baðlýdýr ve birbirlerinin
özelliklerini içerirler.
Þekil 10. Baðýmlý nesneler
Nesneadý, numarasý, özellikleri
……………….
1
……………….
Sýnýfadý, üyeleri
………………..
………………..
2
Kod1, kod2, resimadi(sayaç)
……………………………. 3
…………………………….
Þekil 11. Programda kullanýlan dosyalar.
(1),(2) ve (3) no’lu dosyalar üzerinden iºlem
yapýlmaktadýr.
Sorgulama iþlemi için resim
üzerinden nesne adlarý girilmektedir. Nesne
adlarýna “1” nolu dosyadan bakýlarak kod1 ve
kod2 çýkarýlýr. Bu iþlemden sonra “3” nolu
Oðuzhan ÖZTAª
Video Film Üzerinde Sorgulama Algoritmasý
314
dosyadan istenen resimlere ulaþýlýr. Eðer nesne Ýçinde açýk renkte saat ve sivri uçlu çekiç
özellikleri bulanýk ise o zaman “2” nolu bulunan resimlere bakýldýðýnda ise:
dosyadan bu bulanýk sýnýfýn üyeleri bulunur ve
yine “1” nolu dosyada bu üyeleri içeren kayýtlar SELECT Saat, Çekiç
taranýr ve ona göre kod1 ile kod2 oluþturulur.
FROM RESIM
Eðer nesne adý bilinmiyorsa ve sadece özellik
WHERE f_açýk_renk, sivir_uçlu
bilgisi girilmiºse o zaman bu özellik “1” nolu
dosyadan taranýr ve bulunan kayýtlara bakýlarak Þeklinde bir komut dizisi kullanýlabilir. Burada
kod bilgileri oluºturulur. Kodlar oluºturulduktan “f_”
ifadesi
bulanýk
küme
olduðunu
sonra da resim dosyalarýna ulaþýlýr. Ulaþýlan
göstermektedir.
Bu
bulanýk
kümenin
resim dosyalarý bir diziye atanarak sýra ile ekrana elemanlarýna bakýlarak resim dosyasýndaki tüm
getirilir.
kayýtlar bu elemanlara göre taranýr. Bu tarama
sonucunda da istenen resimler elde edilir.
“3” nolu dosyada kod bilgisine göre arama
yapýlýrken bu arama iþlemini hýzlandýrmak ve
3.10. Yapýlan çalýþmanýn güncel
arama alanýný daraltmak için bir index dosyasý uygulamalara katkýsý :
kullanabiliriz.[21-22-23] Bu index dosyasýnýn Standart veri tabaný yazýlýmlarýnda özelliklerin
görünümü Þekil 12’deki gibi olacaktýr.
fuzzy olma durumu göz önüne alýnmamaktadýr.
Þekil 12. Dk deðeri.
Burada 5 bitlik kod bilgisine göre arama yaparýz
her resim için maksimum 10 nesne içereceði
düþünülerek bir indeks dosyasý hazýrlanmýþtýr.
Aranacak
olan
resimlerin
kod
bilgisi
çýkarýldýktan sonra bu indeks dosyasý üzerinden
taranýr. Eðer ayný sýrada kod içeren bir kayýt
bulunursa ilgili resim kayýtlarýna ulaþýlmýþ olur.
3.9. SQL ile sorgulama :
SQL dilindeki SELECT, FROM, WHERE
deyimleri kullanýlarak istenen sorgulamalar
gerçekleºtirilir. Buradaki WHERE komutu
kýsýtlarý belirtir. Bu kýsýtlar içinde özelliklerin
bulanýk(fuzzy) olmasý durumunda kýsýt olarak
belirtilen ifadenin “f_” ile baþlamasý yeterlidir.
Þimdi bazý sorgulamalarý SQL[13],[12] ifadeleri
ile yapalým.
Ýçinde sivri uçlu çekiç ve iþyeri anahtarý
bulunan resimlerin aranýp incelenmesi için þu
komut dizisi gerekir:
SELECT Çekiç, Anahtar
FROM RESIM
WHERE sivir_uçlu, iºyeri
Bu yapýlan çalýþmada SQL sorgulama içinde de
fuzzy kullanýlarak yaygýn veri tabanlarýna
eklenebileceði gösterilmiþtir. Veri tabanlarý
içinde resim türü bilgiler kullanýlmaktadýr fakat
bunlar tek bir resim olarak göz önüne alýnmakta
resim üzerindeki objeler düºünülmemektedir.
Yapýlan çalýþmada bu nokta vurgulanmaya
çalýþýlmýþtýr. Resim üzerindeki nesneler
sorgulama için önemli olduðundan, bu nesnelerin
ayrý ayrý tanýmlanmasý ve veri tabanýna belli bir
düzende iþlenmesi gerekmektedir. Yaygýn
kullanýmlarda kiþi dosyalarýnda þahýs resimleri
ya da satýþ kayýtlarýnda ürün resimleri yer
almaktadýr. Bu resimler her zaman bir bütün
olarak ürün ismine ya da kiºi ismine
baðlanmaktadýr. Sorgulamada ürünün resmi
istendiðinde karþýmýza gelmektedir. Fakat resim
üzerindeki ayrýntýlar ayrý ayrý ele alýnýp
bilgisayar ortamýna aktarýldýðýnda sorgulama
daha gerçekçi ve ayrýntýlý olarak yapýlabilecektir.
Bu tezde özellikle bu kýsým vurgulanmaya
çalýþýlmýþtýr.
Bunun yanýnda mevcut çalýþmalarda gözlenen
hep sorgulamalarýn bilgiden resime doðru
yapýlmasý þeklindedir. Bunun tersinin de
yapýlmasý
gerektiði
vurgulanmaktadýr.
Fotoðraflarda ürünün tek baþýna görülmesi
yanýnda kullaným ortamý içinde görülmesi daha
fazla önem taþýmaktadýr. Yine kiþilerinde
vesikalýk resim yerine çalýþma ortamý içinde
alýnacak fotoðraflarý önem taþýmaktadýr. Bu
fotoðraflar
üzerindeki
bilgilerden
çeþitli
istatistiki sonuçlara da varýlabilir.
Bu sistemin amacý bir film üzerinden nesnesel
sorgulama yapmaktýr. Bu çalýþmada baz alýnan
Oðuzhan ÖZTAª
Video Film Üzerinde Sorgulama Algoritmasý
makalede sadece SQL sorgulamasý yapýlmýþ ve
ilgili kayýtlara ulaþýlmýþtýr. Ben yaptýðým bu tez
çalýþmamda bu sistemi geliþtirip sadece SQL ile
sýnýrlý kalmayýp visual nesne yerleþtirme yöntemi
ile konuma baðlý olarak bir arama yaptým ve
bunun yanýnda hem SQL için hem de bu visual
nesne
yerleºtirme
yöntemi
için
nesne
özelliklerinin bulanýk olarak verilebilmesini
saðladým. Bu da konuya getirdiðim deðiþik bir
yaklaþým.
11.
12.
KAYNAKLAR
13.
1.
Kingsley
C.
Nwosu,
Bhavani
Thuraisingham, March 1997, “Multimedia
Database Systems”, IEEE Multimedia, pp
21
2. P.Bruce Berra, Forouzan Golshani, Rajiv
Mehrotra, Olivia R.Liu Sheng, August
1993, “Multimedia Information Systems”,
IEEE Transactions on Knowledge and Data
Engineering, Vol. 5, No. 4
3. Borko Furth, Spring 1994, “Multimedia
Systems
:
An
Overview”,
IEEE
Multimedia, pp. 47
4. Tsuhan Chen, March 1998, “The Past,
Present, and Future of
Image and
Multidimensional Signal Processing”, IEEE
Signal Processing Magazine, pp 21
5. M.H.O’Docherty
and
C.N.Daskalakis,
1991, “Multimedia Information Systems The Management and Semantic Retrieval of
all Electronik Data Types”, The Computer
Journal, vol. 34, no. 3, pp.225
6. Masao Sakauchi, Spring 1994, “Data
Vision and Image Retrieval”, IEEE
Multimedia, pp. 79
7. Eitetsu Oomoto and Katsumi Tanaka,
August 1993, “OVID : Design and
Implementation
of
a
Video-Object
Database System”, IEEE Transactions on
knowledge and data engineering, vol5,no. 4
8. Thomas Joseph, Alfonso F. Cardenas,
May 1988, “PICQUERY: A High Level
Query Language for Pictorial Database
Management”, IEEE Transactions on
Software Engineering, Vol. 14, No: 5, pp.
630
9. Atsuo
Yoshitaka,
Setsuko
Kishida,
Masahito Hirakawa, Tadao Ichikawa,
Winter
1994,
“Knowledge-Assisted
Content-Based Retrieval for Multimedia
Databases”, IEEE Multimedia, pp. 12
10. Alberto Del Bimbo, Maurizio Campanai,
Paolo Nesi, October 1993, “A Three-
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
315
Dimensional Iconic Environment for Image
Database Querying”, IEEE Transaction on
Software Engineering, Vol. 19, No: 10, pp.
997
Christopher J. Lindblad, David J.
Wetherall,
June
1995,
“ViewStation
Applications : Imp lications for Network
Traffic”, IEEE Journal on Selected Areas in
Communications, pp 768
Dietrich Paulus, 1997, “A framework for
statistical 3-D object recognition”, Pattern
Recognition Letters, 1153-1157
Simon Gibbs, Costas Arapis, March 1998,
“Virtual Studios: An Overview”, IEEE
Multimedia, pp 18
Alberto Del Bimbo, Enrico Vicario,
Spring 1996, “Visual Programming of
Virtual
Worlds
Animation”,
IEEE
Multimedia, pp. 40
Masaki Hayashi, March 1998, “Image
Compositing Based on Virtual Cameras”,
IEEE Multimedia, pp 36
Andrew
Wojdala,
March
1998,
“Challenges of Virtual Set Technology”,
IEEE Multimedia, pp 50
James C. Bezdek, February 1998, “A
Geometric Approach to Edge Detection”,
IEEE Transactions on Fuzzy Systems, Vol
6, No.1, pp 52
John R.Smith and Shih-Fu Chang,
September 1997, “Visually Searching the
Web for Content”, IEEE Multimedia, pp 12
David De Roure, December 1997,
“Distributed
Multimedia
Information
Systems”, IEEE Multimedia, pp 68
Renee J. Miller, December 1997, “Data
Web:Customizable Database Publishing for
the Web”, IEEE Multimedia, pp 14
Öztaþ Oðuzhan, 1992, “Kýsmi Eþleme
Eriþimi Ve Buna Uygun Dosya Yapýlarý”,
Yüksek Lisans Tezi, Ý.T.Ü. Fen Bilimleri
Enstitüsü, Ýstanbul.
John L.Pfaltz, William J. Berman,
September 1980, “Partial-Match Retrieval
Using
Indexed
Descriptor
Files”,
Communications of the ACM, Vol. 23,
Num. 9, pp. 522
David
Hung-Chang
Du,
Suzanne
M.Sharrock, June 1989, “An Efficient File
Structure for Document Retrieval in the
Automated Office Environment”, IEEE
Transactions on Knowledge and Data
Engineering, Vol. 1, No: 2
Özkan Yalçýn, 1992, UNIX iºletim sistemi,
Alfa
Oðuzhan ÖZTAª
Video Film Üzerinde Sorgulama Algoritmasý
316
25. Philip Heller,Simon Roberts, Çeviren:
and Systems for Video Technology, Vol. 6,
Ümit Çelik, 1998, Java 1.1 Uygulama
No: 1, pp. 12
Geliþtirme Kýlavuzu, Alfa
36. Yoshinobu Tonomura, Akihito Akutsu,
26. Neil Bartlett, Alex Leslie, Steve Simkin,
Fall 1994, “Structured Video Computing”,
1996, Java Programming Explorer, Coriolis
IEEE Multimedia, pp. 34
Group Books.
37. Steven Gringeri, Bhumip Khasnabish,
27. William
I.
Grosky,
Spring
1994,
Arianne
Lewis,
March
1998,
“Multimedia Information Systems”, IEEE
“Transmission of MPEG-2 Video Streams
Multimedia, pp. 12
over ATM”, IEEE Multimedia, pp 58
28. Maurice Frank, November 1995, “Future 38. C.J. Date, 1990, Database Systems, Cilt 1,
Database Technologies”, DBMS, pp. 52
Addison-Wesley
29. Rick Kazman, Reem Al -Halimi, William 39. Philip J. Pratt, Joseph J. Adamski, 1987,
Hunt, Marilyn Mantei, Spring 1996,
Database Systems Management and
“Four Paradigms for Indexing Video
Design, Boyd & Fraser
Conferences”, IEEE Multimedia, pp. 63
40. Henry F. Korth, Abraham Silberschatz,
30. Wei-hsiu Ma, Yen-Jen Lee, March 1998,
1991, Database System Concepts
“Video-Based Hypermedia for Education- 41. Donald A.Adjeroh, Kingsley C.Nwosu,
on-Demand”, IEEE Multimedia, pp 72
September 1997, “Multimedia Database
31. Ahmed Karmouch, James Emery, Spring
Management-Requirements and Issues”,
1996, “A Playback Schedule Model for
IEEE Multimedia, , pp 24
Multimedia Documents”, IEEE Multimedia, 42. Paul
Pazandak,
Jaideep
Srivastava,
pp. 50
September 1997, “Evaluating Object
32. Michelle Y.Kim, Winter 1995, “A
DBMSs
for
Multimedia”,
IEEE
Multimedia Information System for Home
Multimedia, pp 34
Health-Care Support”, IEEE Multimedia, 43. Arnold Kaufmann, Madan M. Gupta,
pp. 83
1991, “Introduction to Fuzzy Arithmetic”,
33. Rita Ann Kogler, March 1998, “Virtual
Van Nostrand Reinhold
Set Design”, IEEE Multimedia, pp 92
44. Stanley Y.W.Su, Mingsen Guo, Herman
34. Ýlhami Kul, 1995, Bilgisayarla Ses ve
Lam, October 1993, “Association Algebra:
Müzik Teknolojisi, Sistem
A Mathematical Foundation for Object35. Wei Ding, Bede Liu, February 1996, “Rate
Oriented Databases”, IEEE Transactions on
Control of MPEG Video Coding and
knowledge and data engineering, vol.5,
Recording
by
Rate-Quantization
no. 5
Modeling”, IEEE Transactions on Circuits
Oðuzhan ÖZTAª

Benzer belgeler