Bagaimana Mesin Pencari Bekerja?

Mesin pencari pada dasarnya adalah algoritma komputer yang membantu pengguna menemukan informasi spesifik yang mereka cari. Yang berbeda bekerja dengan cara spesifik yang berbeda, tetapi semuanya menggunakan prinsip dasar yang sama.

Mesin pencari internet dirancang untuk membantu pengguna menemukan apa yang mereka cari secara online.

Hal pertama yang harus dilakukan mesin pencari agar berfungsi adalah membuat database lokal, pada dasarnya, Internet. Versi awal hanya mengindeks kata kunci dan judul halaman, tetapi versi kontemporer mengindeks semua teks di setiap halaman, serta banyak data lain tentang hubungan halaman itu dengan halaman lain, dan dalam beberapa kasus semua atau sebagian media tersedia di halaman juga. Mesin pencari perlu mengindeks semua informasi ini sehingga mereka dapat menjalankan pencarian secara efisien, daripada harus berjalan di Internet setiap kali permintaan pencarian dikirim.

Tren terbaru di mesin pencari adalah menjauh dari pencarian berbasis kata kunci dan merangkul pencarian berbasis konsep.

Mesin pencari membuat database ini dengan melakukan penjelajahan Internet secara berkala. Versi awal sering kali mengharuskan halaman dikirimkan kepada mereka untuk merayapinya, tetapi sekarang sebagian besar halaman ditemukan dengan mengikuti tautan dari halaman lain. Apa yang disebut robot atau laba-laba, program komputer yang dibuat untuk mengindeks halaman, berpindah dari halaman ke halaman, merekam semua data di halaman, dan mengikuti setiap tautan ke halaman baru. Mesin pencari yang berbeda menyegarkan indeks mereka pada interval yang berbeda, tergantung pada berapa banyak laba-laba yang terus-menerus mereka jelajahi, dan seberapa cepat laba-laba itu merayapi, dengan beberapa bekerja melalui Internet setiap satu atau dua hari, dan yang lain hanya melakukan penyegaran berkala setiap minggu atau bulan.

Saat laba-laba menelusuri halaman-halaman ini, ia mencatat kata-kata yang ditemukannya di halaman-halaman itu. Itu membuat catatan tentang berapa kali setiap kata muncul, apakah kata-kata itu berbobot dengan cara tertentu, mungkin berdasarkan ukuran, lokasi, atau markup HTML , dan memutuskan seberapa relevan kata-kata tersebut berdasarkan tautan yang masuk ke halaman, dan pada konteks umum halaman.

Mesin pencari kemudian harus menimbang nilai setiap halaman, dan nilai setiap halaman untuk kata-kata yang muncul di dalamnya. Ini adalah bagian yang paling sulit, tetapi juga yang paling penting. Pada tingkat yang paling sederhana, ia dapat dengan mudah melacak setiap kata pada laman, dan mencatat laman tersebut sebagai relevan untuk penelusuran dengan kata kunci tersebut . Namun, ini tidak akan banyak berguna bagi sebagian besar pengguna, karena yang diinginkan adalah halaman yang paling relevan untuk kueri penelusuran mereka. Jadi mesin yang berbeda datang dengan cara yang berbeda untuk bobot pentingnya.

Algoritme yang digunakan berbagai mesin pencari dilindungi dengan baik, untuk mencegah orang secara khusus membuat halaman untuk mendapatkan peringkat yang lebih baik, atau setidaknya untuk membatasi sejauh mana mereka dapat melakukannya. Perbedaan ini adalah mengapa mesin yang berbeda menghasilkan hasil yang berbeda untuk istilah yang sama. Google mungkin menentukan bahwa satu halaman adalah hasil terbaik untuk istilah pencarian, dan Ask mungkin menentukan bahwa halaman yang sama bahkan tidak berada di 50 teratas. Ini semua hanya berdasarkan bagaimana mereka menilai tautan masuk dan keluar, kepadatan kata kunci yang mereka gunakan. menganggap penting, bagaimana mereka menghargai penempatan kata yang berbeda, dan sejumlah faktor yang lebih kecil.

Tren terbaru di mesin pencari, dan kemungkinan masa depan pencarian secara umum, adalah beralih dari pencarian berbasis kata kunci ke pencarian berbasis konsep. Dalam bentuk pencarian baru ini, alih-alih membatasi pencarian pada kata kunci yang dimasukkan oleh pencari, program mencoba mencari tahu apa arti kata kunci tersebut, sehingga dapat menyarankan halaman yang mungkin tidak menyertakan kata yang tepat, namun tetap sesuai dengan topik. Cari. Ini masih merupakan bidang yang berkembang, tetapi sejauh ini tampaknya memiliki banyak potensi untuk membuat penelusuran menjadi lebih relevan, membuat web menjadi tempat yang lebih mudah untuk menemukan apa yang Anda cari.