İNTERNET`TE ARAMA ÖTESİNE YOLCULUK

Transkript

İNTERNET`TE ARAMA ÖTESİNE YOLCULUK
İNTERNET’TE ARAMA ÖTESİNE YOLCULUK...
Prof.Dr. Zeynel Cebeci
Çukurova Üniversitesi Enformatik Bölümü
01330 Adana
[email protected]
İnternet’teki belgeleri/içeriği insan ve/veya böcek (crawler) ya da örümcek (spider) olarak adlandırılan otomatik robot
yazılımlar (bots) aracılığıyla dizinleyerek kolayca bulunmasını, sorgulanmasını sağlayan arama sistemlerine arama motoru
(search engine) denilmektedir. Arama motorları çeşitli açılardan sınıflandırılabilmektedir:
-
-
-
-
Konusal kapsama alanına göre:
o Yatay motorlar: Her konuda arama yapılmasını sağlayan, her tür belgeyi dizinleyen motorlardır.
Google, Altavista, Yahoo, MSN gibi.
o Dikey motorlar: Müzik, yazılım, elektronik araçlar, eğitim, sağlık vb belirli bir konu üzerinde dizinleme
yapan konu tabanlı motorlardır.
Yersel kapsama alanına göre:
o Küresel motorlar: Tüm dünya genelinde, her dilden içerik dizinleyen motorlardır. Google, Altavista,
MSN gibi.
o Ülkesel (yerel) motorlar: Belirli bir ülke veya bölgeden içerik dizinleyen motorlardır. Arama.com,
Netbul.com gibi Türkçe, suchmaschinen.de, dino.de gibi Almanca vb.
Amaca göre:
o Alış-veriş (shopping),
o Çoklu-ortam (multimedia)
o Haber (news)
o ...
Dizinleme sistemine göre
Vd.
Arama motorları, İnternet kullanıcıları için günde en az birkaç başvurulan sistemlerdir. Herkes şu
veya bu şekilde kullanım amacına bağlı olarak kullanım tercihleri yapsa da motorlar arasında son
zamanlarda en popüler olanı Google’dur. Google www.google.com adresinden erişilen; dizinlediği
sayfa sayısı ve arama hızı bakımından önde gelen küresel ölçekli yatay arama motorlarından biridir. Gerçekten de, şu an için
yaklaşık 4,3 milyar sayfa dizini (dizinleme sırasında arşiv kopyalarının saklanması da dahil), hemen hemen tüm dünya
dillerinde kullanıcı arayüzleri arama olanağı sağlaması ve yine istenilen dilde yaratılan içerikler üzerinde arama olanakları
sağlaması bakımından diğer motorlara göre tartışmasız bir üstünlük sağlamaktadır. Arama yapılan zaman ve terime bağlı
olarak değişmesi beklense de, Google ve Altavista arama motorları üzerinde “e-learning” terimi için aynı anda yapılan basit
test sonuçlarına göre Google’ın bir zamanlar arama motoru denince akla gelen Altavista’dan yaklaşık 4 daha fazla içerik
dizinlemesine ve 4 kat daha fazla çalışma hızına sahip olduğu belirlenmiştir (Google arama işlemini 1.26 saniyede
tamamlayıp 4,080,000 adet sayfa sonucu döndürürken aynı işlemi Altavista 4 saniyede ve 1,103,222 sonuçla; alltheweb
608,384 sonuçla tamamlamıştır). Arama motorlarının rağbet görme veya kullanıcı oranları itibariyle Şubat 2003’te Nielsen
tarafından 5 büyük arama motoru için yapılan bir araştırma sonucuna göre Google %39.4, Yahoo %30.4 ve Microsoft
Network %29.6’lık bir paya sahip olduğu saptanmıştır (Şekil 1, sol). Yine Hitwise Eylül 2003 itibariyle arama motorlarının
paylarının ilk üç için Google, Yahoo ve MSN şeklinde vermiştir (Şekil 1, sağ).
Şekil 1. Arama motorlarının kullanım yüzdeleri ( GG=Google, YH=Yahoo, MSN=MSN, AOL=AOL, AJ=Ask Jeeves)
Arama motorlarının dizinleme kapasitesi, performansı, arama hızı ve kullanıcılara sunmuş olduğu arama ayrıntıları elbette bir
İnternet kullanıcısının zamanını iyi değerlendirmesi, amacına ulaşması, ulaşmak istediği bilgiye en kısa yoldan ulaşabilmesi
için önemli olmasına karşın bu yazıda bu konulara değnilmeyecektir. Bu yazı, son zamanlarda arama motorlarında daha
etkin arama sonuçları elde edilmesine yönelik çalışmaları tanıtmak amacındadır. Başka bir deyişle, aslında bir tür arama olsa
da “aramanın ötesi”nde sayabileceğimiz, ancak birçoğumuzun gözünden kaçan bazı servislerin tanınmasında yarar olabilir.
Örneğin, birçoğumuz İnternet’te belirli terimlerin tanımı veya açıklamasını aramışızdır. Bu durumda, arama motorlarının
aranılan kutusuna aramak istediğimiz terimi girip elde edilen sonuçlar sayfasında binlerce sayfa arasında hangilerinin
gerçekten sadece söz konusu terimin “tanım”ını yaptığını incelemeye koyulup uzun ve yorucu saatler geçirmiş olabiliriz.
Ancak, Google’da aranılan kutusuna define:terim şeklinde giriş yapıp arama yapılırsa, Google sadece girilen terimlerin
tanımlarını görüntüleyecek ve kaybedilen zamanı büyük ölçüde düşürecektir. Örneğin, “university” veya “higher education”
terimlerinin tanımını bulmak istediğinizde aranılan kutusuna “define:university” ya da “define:higher education” girip arama
yapıldığında sadece bu terimlerin farklı Web kaynaklarındaki tanımları görüntülenecektir. Terimlerin, belirli bir konu sözlüğü
veya çevrimiçi kaynaktan alınması da düşünülebilir, ancak bunlarla çok sayıda Web kaynağından alınan Google terim dizini
kadar geniş ve başarılı bir bilgi edinme söz konusu olmayabilir.
Başka bir örnek olarak, bir şehrin haritası veya bir patent araması yapıldığında çok özel aramalar yapılabilir. Google’in geçen
yıl sonlarında hizmete aldığı sayılara duyarlı arama sistemi şimdilik ABD için başarılı bir şekilde hizmete verebilmektedir.
Birçoğumuz İnternet’te arama yaparken eşanlamlı terimlerin sıkıntısını çekmiş olabiliriz. Örneğin, “ucuz iletişim” gibi bir
arama yaptığınızda, “ucuz” sözcüğünün eş anlamlısı veya yakın anlamlısı olan “pahalı olmayan”, “makul fiyat” vb. terimleri;
iletişim için “komünikasyon”, “haberleşme” vb. terimleri de arama işlemine katmayı isteyebilirsiniz. Bu durumda, arama
kutusuna “~ucuz ~iletişim” yazmanız yeterli olacaktır. Bu gerçekten çok değerli kabul edebileciğimiz bir kolaylıktır.
Çizelge 1. Google’da bazı yeni veya az bilinen arama özellikleri
Arama özelliği
define: terim
~terim
* (joker sözcük)
(terim * terim, terim ** terim, terim *terim ** terim
gibi)
Formül
patent: patent no
terim site:site adresi
terim filetype:dosya tipi
soyad,şehir, ülke
Örnek
define:e-learning
~inexpensive (inexpensive, low cost, cheap, affordable gibi
eşanlamlı terimler dahil arama)
laws * pollution (laws of pollution, laws about pollution, laws for
pollution örneklerinde olduğu gibi * bir joker olup kullanıldığı yerde
herhangi bir sözcük yerine geçer)
2^2+2*5-3
patent 45367
araştırma site:www.cukurova.edu.tr
energy saving filetype:ppt
Jones, Newyork, US
Yukarıdaki listede birçoğumuzun çok nadir olarak kullandığı bazı Google servisleri ve arama ayrıntıları yer almaktadır.
Aslında yukarıda listelenenler Google servislerinden bazılarına örnekler olup daha geniş bilgi Google Rehberi’nden
(http://www.googleguide.com) edinilebilir. Arama ayrıntıları bilindiğinde arama için kaybedilen zaman ve gerçekten istenene
ulaşma daha etkin şekilde yapılabilecektir.
Arama motorları bilimsel, sosyal-kültürel araştırma istatistikleri üretmek gibi başka amaçlara da hizmet verebilirler. Örneğin,
www.onfocus.com/googlesmack/down.asp adresinden erişilen Googlesmack’te sözcüklerin Web’te geçiş sayıları tahminleri
elde edilebilir. Bir örnek olarak, Web’te hangi dilin daha yüksek düzeyde etkin olduğunu ya da bilişsel-kültür üstünlüğünü
araştırmaya yönelik bir ön tahmin elde etmek isteyen birileri içinde “China” geçen sayfa sayısı mı yoksa “Japan” mı daha
fazladır? sorusuna bu adresten yanıt bulabilir.
Yaz geliyor... Böcek ve haşareler çoğalmaya başladı ve evinizi ilaçlatmak istiyorsunuz, ama bunu nasıl yapacağınızı
bilmiyorsunuz. http://answers.google.com/answers/ adresinden erişeceğiniz “Google Answers” servisi bu amaçla
kullanılabilir. “Search Google Answers for” yani “Google Yanıtlarında ara” kutusuna “How can I rid my apartment of ants?”
sorusunu girip ara düğmesine bastığınızda karşınızda yanıtları göreceksiniz. Herhangi bir sorunun yanıtı acil ve arama
sonuda bulunamıyorsa, soru aynı serviste sorunun güçlüğü ve aciliyetine göre 2-200 ABD Doları karşılığında sorulabilliyor.
İnanılmaz, ama kimileri “Hollandalılar niçin Kuzey Avrupadaki diğer insanlardan daha uzun oluyor?” şeklinde bir sorunun
yanıtı için 10 dolarlık bir ücrete razı olabiliyor. Bu arada, www.askjeeves.com adresinden erişilen Ask Jeeves’in bu konuda
daha önde olduğunu da belirtmeden geçmek olmaz.
Kiraz, çilek, kayısı... Tamam, yaz meyveleri listesine başladınız, ancak arkasını getiremiyorsunuz. Yaz meyveleri listesinizi
veya kümenizi Google’ın Kümeler (Google Sets) servisi tamamlayabilir. Bunun için http://labs.google.com adresinden
eriştiğiniz “Google Sets” sayfasında verilen kutucuklara “apple”, “ibm”, “microsoft” şeklinde sözcükler girip “Large Set” veya
“Small Set” düğmesine bastığınızda büyük bilişim şirketleri kümesini elde edersiniz.
Dahası da var, http://www.google.com/webalerts adresine erişip Web search kutusuna “Cyprus” girip “how often” kutusunda
“once a day” veya “once a week” seçip “E-mail” kutusuna e-posta adresini girdikten sonra “Create Web alerts” düğmesine
bastığınızda artık Kıbrıs’la ilgili tüm sıcak haberler e-posta adresinize postalanmaya başlayacaktır.
http://labs.google.com/cgi-bin/webquotes adresine ulaşıp “Mustafa Kemal Ataturk” yazdığınızda, her zaman olduğu gibi bu
günlerde de ihtiyaç duyduğumuz, anlamak zorunda olduğumuz eşsiz, değerli özdeyişlerden bazılarını görebilirsiniz.
Anlaşıldığı üzere bu servis, “Web alıntıları” servisidir.
Motorlar arası arama motorları (meta search engines) belki de çok az kullandığımız diğer bir kategoriyi oluştururlar. Örneğin,
www.hotbot.com, www.kartoo.com, www.mamma.com, www.excite.com, www.fazzle.com, www.correctsearch.com,
www.infogrid.com gibi. Bu motorlar, kendi dizinleri üzerinde değil, Google, Altavista, MSN, Lycos, Yahoo vb diğer arama
motorları üzerinde eş zamanlı olarak arama yapar ve sonuçları kaynaklarına göre listeleyerek; aynı anda birçok birincil
motorun (primary search engine, Google, AV, AJ, Yahoo, MSN gibi) dizin veritabanı üzerinde arama kolaylığını sağlarlar.
Ancak, hiçbir meta motorun birincil motorların kendi arama sistemleri kadar arama yapma etkinliğine ulaşmadığını not
etmeniz gerekir.
Adana, 15.04.2004
Prof.Dr. Zeynel Cebeci
[email protected]

Benzer belgeler

Google Search API ile ajax arama

Google Search API ile ajax arama kullanılabilir. “Search Google Answers for” yani “Google Yanıtlarında ara” kutusuna “How can I rid my apartment of ants?” sorusunu girip ara düğmesine bastığınızda karşınızda yanıtları göreceksiniz...

Detaylı

WEB Araştırma Yöntemleri

WEB Araştırma Yöntemleri Arandığı zaman tarif için tavuk, kişniş, kireç içerenleri gösterir

Detaylı

Internet Üzerinde Arama

Internet Üzerinde Arama Değişik zamanlarda tekrar arayın Sadece ilk sonuç sayfaları ile yetinmeyin Yoğunluğun az olduğu saatlerde arama yapın Arama motorlarının özelliklerini iyi kullanın Harfleri doğru yazın Spesifik olu...

Detaylı