Mesin pencari web
Mesin pencari atau Search
engine adalah program komputer yang dirancang untuk melakukan pencarian atas
berkas-berkas yang tersimpan dalam layanan www,
ftp, publikasi milis, ataupun news group dalam sebuah
ataupun sejumlah komputer peladen dalam suatu jaringan. Search engine merupakan perangkat
pencari informasi dari dokumen-dokumen yang tersedia. Hasil pencarian umumnya
ditampilkan dalam bentuk daftar yang seringkali diurutkan menurut tingkat
akurasi ataupun rasio pengunjung atas suatu berkas yang disebut sebagai hits.
Informasi yang menjadi target pencarian bisa terdapat dalam berbagai macam
jenis berkas seperti halaman situs web, gambar,
ataupun jenis-jenis berkas lainnya. Beberapa mesin pencari juga diketahui
melakukan pengumpulan informasi atas data yang tersimpan dalam suatu basisdata ataupun direktori web.
Sebagian besar mesin pencari dijalankan oleh perusahaan
swasta yang menggunakan algoritma kepemilikan dan basisdata tertutup, di antaranya yang paling
populer adalah Google (MSN Search dan Yahoo!). Telah ada beberapa upaya menciptakan mesin pencari dengan sumber terbuka (open source), contohnya
adalah Htdig,
Nutch, Egothor dan OpenFTS.[1]
Saat awal perkembangan internet, Tim Berners-Lee membuat sebuah situs web yang
berisikan daftar situs web yang ada di internet melalui peladen web CERN.
Sejarah yang mencatat sejak tahun 1992 masih ada hingga kini.[2] Dengan semakin banyaknya situs web yang
aktif membuat daftar ini tidak lagi memungkinkan untuk dikelola oleh manusia.
Utilitas pencari yang pertama kali digunakan untuk melakukan pencarian di internet adalah Archie yang berasal dari
kata "archive" tanpa menggunakan huruf "v".[3] Archie dibuat tahun 1990 oleh Alan Emtage, Bill Heelan
dan J. Peter Deutsch, saat itu adalah mahasiswa ilmu komputer Universitas
McGill, Amerika Serikat.
Cara kerja program tersebut adalah mengunduh daftar direktori serta berkas yang
terdapat pada layanan ftp publik (anonim) kemudian memuatnya ke dalam
basisdata yang memungkinkan pencarian.
Mesin pencari lainnya seperti Aliweb,
muncul di 1993 dan masih berjalan hingga saat ini. Salah satu mesin pencari
pertama yang sekarang berkembang menjadi usaha komersial yang cukup besar
adalah Lycos, yang dimulai di Carnegie Mellon
University sebagai proyek riset di tahun 1994.
Segera setelah itu, banyak mesin pencari yang bermunculan
dan bersaing memperebutkan popularitas. Termasuk di antaranya adalah WebCrawler,
Hotbot, Excite, Infoseek, Inktomi, dan AltaVista.
Masing-masing bersaing dengan menambahkan layakan-layanan tambahan seperti yang
dilakukan oleh Yahoo.
Tahun 2002 Yahoo! mengakuisisi Inktomi,
setahun kemudian mengakuisisi AlltheWeb
dan Altavista
kemudian meluncurkan mesin pencari sendiri yang didasarkan pada teknologi
gabungan dari mesin-mesin pencari yang telah diakuisisinya serta memberikan
layanan yang mengutamakan pencarian Web daripada layanan-layanan lainnya.
Di bulan desember 2003, Orase
menerbitkan versi pertama dari teknologi pencari waktu-riilnya. Mesin ini
memiliki banyak fungsi baru dan tingkat unjuk kerja yang jauh lebih baik.
Mesin pencari juga dikenal sebagai target investasi internet yang terjadi pada akhir tahun 1990-an.
Beberapa perusahaan mesin pencari yang masuk ke dalam pasar saham diketahui
mencatat keuntungan besar. Sebagian lagi sama sekali menonaktifkan layanan
mesin pencari, dan hanya memasarkannya pada edisi-edisi enterprise saja,
contoh Northern
Light sebelumnya diketahui merupakan salah satu perintis layanan
mesin pencari di internet.
Buku Osmar R. Zaïane From Resource Discovery to Knowledge Discovery on the
Internet menjelaskan secara rinci sejarah teknologi mesin pencari sebelum munculnya Google.
Mesin-mesin pencari lainnya mencakup a9.com,
AlltheWeb, Ask Jeeves, Clusty, Gigablast, Teoma, Wisenut, GoHook, Kartoo, dan Vivisimo.
Google
Google muncul pada akhir tahun 1997, dimana Google
memasuki pasar yang telah diisi oleh para pesaing lain dalam penyediaan layanan
mesin pencari, seperti Yahoo, Altavista, HotBot, Excite, InfoSeek dan Lycos,
dimana perusahaan-perusahaan tersebut mengklaim sebagian perusahaan yang
bergerak dalam bidang layanan pencarian di internet. Hingga akhirnya Google mampu
menjadi sebagai penyedia mesin pencari yang cukup diperhitungkan di dunia.
Saat tingginya persaingan antar mesin pencari yang ada,
namun mesin pencari lain tidak mampu menghentikan kesuksesan Google. Setelah
Yahoo mampu pada posisi puncak di sekitar tahun 2000, Google mampu menerobos
liga besar tersebut. sehingga Google dipandang sebagai mesin pencari yang utama
seperti yang kita ketahui pada hari ini.
Yahoo
Yahoo raja directori di internet, di samping para pengguna internet melihat DMOZ serta LookSmart berusaha
menurunkan nya dari posisi puncak tersebut. Akhir-akhir ini, telah tumbuh
secara cepat dalam ukurannya, mereka pun sudah memiliki harga sehingga mudah
untuk memasukinya, dengan demikian, mendapatkan sebuah daftar pada direktori
Yahoo memang memiliki nilai yang tinggi.
pada tahun 2001, mesin pencari Google berkembang besar. Keberhasilan ini didasarkan pada
bagian konsep dasar dari link
popularity dan PageRank. Setiap halaman diurutkan berdasarkan seberapa banyak
situs yang terkait, dari sebuah premis bahwa situs yang diinginkan pasti
lebih banyak terhubung daripada yang lain. Rangking situs (The PageRank)dari
sebuah link halaman dan jumlah link dari halaman-halaman tersebut merupakan
masukan bagi Rangking situs yang bersangkutan. Hal ini memungkinkan bagi Google
untuk mengurutkan hasilnya berdasarkan seberapa banyak halaman situs yang
menuju ke halaman yang ditemukannya. User interface Google sangat
disukai oleh pengguna, dan hal ini berkembang ke para pesaingnya.
Manfaat






Cara kerja mesin
pencari
Mesin pencari web bekerja dengan cara menyimpan informasi
tentang banyak halaman web, yang
diambil langsung dari WWW. Halaman-halaman ini diambil dengan web
crawler — browser web otomatis yang mengikuti setiap pranala
yang dilihatnya. Isi setiap halaman lalu dianalisis untuk menentukan cara
indeks-nya (misalnya, kata-kata diambil dari judul, subjudul, atau field
khusus yang disebut meta tag). Data tentang halaman web disimpan
dalam sebuah database indeks untuk digunakan dalam pencarian
selanjutnya. Sebagian mesin pencari, seperti Google, menyimpan seluruh atau sebagian halaman
sumber (yang disebut cache) maupun informasi tentang
halaman web itu sendiri.
Selain halaman
web, Mesin pencari juga menyimpan dan memberikan informasi
hasil pencarian berupa pranala yang merujuk pada file, seperti file audio, file video, gambar, foto dan sebagainya, serta informasi tentang
seseorang, suatu produk, layanan, dan informasi beragam lainnya yang semakin
terus berkembang sesuai dengan perkembangan teknologi informasi.
Ketika seseorang mengunjungi mesin pencari dan memasukkan
query, biasanya dengan memasukkan kata kunci, mesin mencari indeks dan memberikan
daftar halaman web yang paling sesuai dengan kriterianya, biasanya disertai
ringkasan singkat mengenai judul dokumen dan kadang-kadang sebagian teksnya.
Ada jenis mesin pencari lain: mesin pencari real-time,
seperti Orase.
Mesin seperti ini tidak menggunakan indeks. Informasi yang diperlukan mesin
tersebut hanya dikumpulkan jika ada pencarian baru. Jika dibandingkan dengan
sistem berbasis indeks yang digunakan mesin-mesin seperti Google, sistem real-time
ini unggul dalam beberapa hal: informasi selalu mutakhir, (hampir) tak ada
pranala mati, dan lebih sedikit sumber daya sistem yang diperlukan. (Google
menggunakan hampir 100.000 komputer, Orase hanya satu.) Tetapi, ada juga
kelemahannya: pencarian lebih lama rampungnya.
Manfaat mesin pencari bergantung pada relevansi
hasil-hasil yang diberikannya. Meskipun mungkin ada jutaan halaman web yang
mengandung suatu kata atau frasa, sebagian halaman mungkin lebih relevan,
populer, atau autoritatif daripada yang lain. Kebanyakan mesin pencari
menggunakan berbagai metode untuk menentukan peringkat
hasil pencarian agar mampu memberikan hasil "terbaik" lebih dahulu.
Cara mesin menentukan halaman mana yang paling sesuai, dan urutan
halaman-halaman itu diperlihatkan, sangat bervariasi. Metode-metode nya juga
berubah seiring waktu dengan berubahnya penggunaan internet dan berevolusinya
teknik-teknik baru.
Sebagian besar mesin pencari web adalah usaha komersial
yang didukung pemasukan iklan dan karenanya sebagian
menjalankan praktik kontroversial, yaitu membolehkan pengiklan membayar agar
halaman mereka diberi peringkat lebih tinggi dalam hasil pencarian.
Pentingnya mesin
pencari optimasi
Salah satu alasan yang menyebabkan diperlukan mesin
pencari optimasi adalah karena ada banyak World Wide Web Wanderer yang sudah ada, dan akan
terus bertambah di setiap bulannya.
Sebagai Contoh, seseorang mempunyai World Wide Web Wanderer untuk menjual produk
pertanian maka di Indonesia akan ada puluhan atau ratusan Website sejenis.
Sementara itu, jika ingin melihat segmen dunia maka akan lebih banyak lagi
jumlahnya. Untuk itu, dengan menempatkan posisi di tingkat ada dalam hasil
pencarian maka akan membuat website pengguna tersebut ibarat toko strategis
yang terletak di tepi jalan besar. Dengan SEO yang bagus maka kemungkinan
website anda dikunjungi oleh orang lain akan lebih besar.
Dengan Kaidah SEO yang bagus, website menggunakan lebih
jelas atau keluhan sehingga akan lebih diperhatikan oleh mesin pencari. itulah
inti dari SEO, yaitu untuk membuat website anda diperhatikan oleh mesin
pencari.
Pencarian
Proses Pencarian
Melakukan pencarian dokumen yang dimuat pada suatu situs
bisa begitu mudah dan kelihatannya mungkin sulit juga. apalagi mengingat begitu menyebarnya informasi dimana-mana, bahkan
University of Calofornia menyebutkan saat ini telah terdapat lebih dari 50
milyar halaman web di internet, meskipun tidak ada
ada satupun yang benar-benar tahu jumlah persisnya.
kesulitan yang mungkin terjadi adalah karena WWW tersebut
tidak terdata dalam bentuk yang terstandardisasi isinya. tidak sama halnya
dengan katalog yang ada di perpustakaan, yang memiliki standardisasi secara
mendunia berdasarkan subjek dari judul buku, meskipun jumlahnya juga tidak
sedikit.
Dalam pencarian di web, pengguna selalu memperkirakan kata apa yang
di kira-kira terdapat pada halaman yang ingin anda temukan. atau kira-kira apa
subjek yang dipilih oleh seseorang untuk mengelolah halaman situs yang mereka
kelola, topik apa saja kira-kira yang di bahas.
Jika pengguna melakukan apa yang dikenal dengan pencarian
pada halaman web, sebenarnya tidaklah melakukan pencarian. tidak mungkin
melakukan pencarian di WWW secara langsung.
Pada web benar-benar terdiri dari banyak sekali halaman web yang
ingin disimpan dari berbagai server diseluruh dunia. Komputer pengguna tidak langsung melakukan
pencarian kepada seluruh komputer tersebut secara langsung.
Apa yang mungkin pengguna lakukan hanyalah melalui
komputer untuk mengakses satu atau lebih perantara yang disebut dengan alat
bantu pencarian yang ada saat ini. Melakukan pencarian pada alat bantu itu tadi
ke database yang dimiliki. data base tersebut mengkoleksi situs-situs yang
ditemukan dan simpan.
alat bantu pencarian ini menyediakan hasil pencarian
dalam bentuk hypertext link dengan URL menuju halaman lainnya. ketika
anda klik link ini, dan menuju ke alamat tersebut maka dokumen, gambar, suara
dan banyak lagi bentuk lainnya yang ada pada server tersebut disediakan,
sesuai dengan informasi yang terdapat di dalamnya. layanan ini bisa menjangkau
ke manapun di seluruh dunia.
Tidak mungkin seseorang untuk melakukan pencarian ke
seluruh komputer yang terhubung internet ini, atau bahkan alat bantu pencarian
yang mengklaim bahwa melakukannya, tidak benar.
Kategori Alat
Pencari
Saat ini, tiga bentuk dari alat bantu pencarian ini.
Menggunakan strategi yang berbeda untuk memanfaatkan kemampuan potensial dari
masing-masing nya, yaitu
Mesin pencari dan
mesin pencari-meta
Karakteristik:
a.
Menyimpan data
dalam bentuk teks penuh pada halaman yang terpilih,
b.
Pencarian
berdasarkan kata kunci, mereka mencoba mencocokkan dengan tepat kata kunci
tersebut dengan teks yang ada dalam dokumen,
c.
Tidak perlu
dilakukan browsing, dan tidak ada subjek dari kategori,
d.
Database dijaring
dan dikumpulkan oleh spidr, yaitu komputer yang memiliki program robot, dengan
kemampuan seminimal mungkin dari pandangan atau sentuhan manusia,
e.
Ukuran search
engine:dari skala kecil hingga mampu menyimpan sangat banyak (sekitar hingga 20
milyar halaman web).
f.
Meta-search engine
dengan cepat melakukan pencarian ke dalam beberapa data base dari berbagai
search engine dalam satu kali permintaan. hasilnya adalah daftar yang hasilnya
dan penggabungan hasil pencarian dari beberapa mesin pencari yang mereka
libatkan. Contoh : Search engine: Google, Yahoo Search, Ask.com.
Meta-Search : Dogpile, Copernic, dan lainnya.
Subject
Directories
a.
Karakteristik :
b.
Seleksi dari situs
yang ada merupakan seleksi langsung yang dilakukan oleh manusia, kadang kala
para ahli untuk subjek tertentu,
c.
Sering dengan
hati-hati dievaluasi dan menjaga keterbaruan informasi yang mereka miliki,
namun tidak selalu, kadang-kadang tidak, terutama untuk mereka yang telah
memiliki data yang banyak dan bersifat general,
d.
Biasanya dikelola
dalam bentuk subjek dan direktori yang tersusun secara hirarki,
e.
Sering dilengkapi
dengan catatan mengenai deskripsinya ( tidak untuk Yahoo),
f.
Subjek dapat di-browse
subjek dan kategorinya atau melakukan pencarian berdasarkan kata-kata tertentu,
g.
Dokumen yang tidak
penuh teks. pencarian diminta lebih spesifik dibandingkan dengan pencarian
melalui mesin pencari, karena kata kunci tidak bisa dibandingkan dengan isi
dari halaman suatu situs, melainkan hanya pada subjek, kategori-kategori, dan
deskripsi.
h.
Terdapat ribuan
atau bahkan lebih subjek direktori dalam praktek dan kenyataannya apa saja yang
dipikirkan di sana.
Specialized
Databade (Invisible Web)
Karakteristik :
a.
Merupakan web yang menyediakan akses melalui suatu kotak
pencarian ke dalam isi database pada sebuah komputer di suatu tempat,
b.
Dapat saja berubah
berbagai topik, dapat pula juga hal yang komersial, pekerjaan yang spesifik,
pemerintahan, dll
c.
Juga terdiri dari
banyak halaman yang menghasilkan hasil pencarian dari katalog direktori online.
Prinsip Umum Dari
mesin pencari
Sistem kinerja mesin ini ada beberapa hal yang perlu di
perhatikan terutama keterkaitannya dengan masalah arsitekrut dan mekanismenya.
Spider
Merupakan program yang men-download halaman-halaman yang
mereka temukan, mirip dengan browser. Perbedannya adalah bahwa browser
menapilkan secara langsung informasi yang ada (baik tekas, gambar, dll). Untuk
kepentingan manusia yang menggunakannya pada saat itu, sedangkan spider tidak
melakukan untuk menampulkan dalam bentuk yang terlihat seperti itu, karena
kepentingannya adalah untuk mesin, bukan untuk manusia, spider pun dijalankan
oleh mesin secara otomatis. Kepentingannya adalah untuk mengambil halaman-halaman
yang dikunjunginya untuk disimpan kedalam database yang dimiliki oleh search
engine.
Crawler
Merupakan program yang dimiliki search engine untuk
melacak dan menemukan link yang terdapat dari setiap halaman yang ditemuinya.
Tugasnya adalah untuk menentukan spoder harus pergi kemana dan mengevaluasi
link berdasarkan alamat yang ditentukan dari awal. Crawler mengikuti link dan
mencoba menemukan dokumen yang belum dikenal oleh search engine.
Indexer
Komponen ini melakukan aktifitas untuk menguraikan
masing-masing halaman dan meneliti berbagai unsur, seperti teks, headers,
struktur atau fitur dari gaya penulisan, tag HTML
khusus, dll.
Database
Merupakan tempat standar untuk menyimpan data-data dari
halaman yang telah dikunjungi, di-download dan sudah dianalisis. kadang kala
disebut juga dengan index dari suatu search engine.
Result Engine
Mesin yang melakukan penggolongan dan penentuan peringkat
dari hasil pencarian pada search engine. Mesin ini menentukan halaman mana yang
menemui kriteria terbaik dari hasil pencarian berdasarkan permintaan
penggunanya, dan bagaimana bentuk penampulan yang akan ditampilkan.
Proses ini dilaksanakan berdasarkan algoritma perangkingan yang dimiliki oleh search
engine tersebut, mengikuti kaidah perangkingan hakaman yang dipergunakan oleh
mereka adalah hak mereka, para peneliti mempelajari sifat-sifat yang mereka
gunakan, terutama untuk meningkatkan pencarian yang dihasilkan oleh serach
engine tersebut.
Web Server
Merupakan komponen yang melayani permintaan dan
memberikan respon balik dari permintaan tersebut. Web Server ini biasanya
menghasilkan informasi atau dokumen dalam format HTML.
Pada halaman tersebut tersedia layanan untuk mengisikan kata kunci pencarian
yang diinginkan oleh usernya. Web Server ini juga bertanggung jawab dalam
menyampaikan hasil pencarian yang dikirimkan kepada komputer yang meminta
informasi.
Mesin pencari populer
Terdapat ratusan bahkan ribuan mesin pencari yang ada di internet, dan kapasitas mesin tersebut akan
selalu tumbuh dari waktu ke waktu. Dari sebanyak itu, hanya sebagian kecil yang
berpengaruh besar dalam lalulintas untuk pengantar pengunjungnya ke situs
tersebut. untuk itu, harus pintar dalam memilih mereka yang tepat terutama
dalam efisiensi dan efektifitas waktu yang anda miliki dalam mencapai sasaran
yang diinginkan, karena situs yang tidak terlalu populer belum tentu akan
berpengaruh besar terhadap pertumbuhanke situs yang dikelola. Apalagi juka
pendaftaran situs-situs penyedia layanan pencarian tersebut dilakukan satu
persatu, akan membuang waktu. Cara mudahnya, lebih baik menggunakan software pendaftar ke mesin pencari yang banyak beredar di internet, sehingga
proses pendaftaran bisa dilakukan secara otomatis melalui software tersebut.
Berikut ini adalah beberapa mesin pencari:
3.
Open Directory ( http://www.dmoz.com/
)
4.
MSN ( http://www.msn.com/
)
5.
Live ( http://www.live.com
)
6.
Altavista ( http://www.altavista.com
)
7.
AOL ( http://www.aol.com
)
8.
Altheweb ( http://www.althweb.com
)
9.
Baidu ( http://www.baidu.com
)
10. Looksmart ( http://www.looksmart.com )
Solusee
( http://www.solusee.com)
Tidak ada komentar:
Posting Komentar