Google.. Mesin pencari bermata dua…

Penggunaan mesin google tidak hanya dilakukan oleh orang awam.tetapi juga oleh para Hacker untuk mencari informasi tertentu yang dibutuhkannya di belantara World Wide Web (www), termasuk informasi yang sedikit ekstrim. Mutiara yang terpendam di dalam google dan pelayanan istimewa dalam banyak hal yang tidak ditawarkan oleh search angine lainnya menjadi faktor utama sehingga Google menjadi sahabat mereka dalam melakukan aksi-aksinya.
Ini bak pedang bermata dua. Di satu sisi, google menawarkan jasa pencarian informasi yang cepat, tetapi di sisi lain justru paman kita ini menjadi senjata yang cukup handal untuk mengintai data-data privasi anda.

Google juga mesin biasa.Jadi jangan terlalu banyak disalahkan. Kita manusia yang mengaturnya sesuai keinginan kita.Ketidak tepatan pencarian google kemungkinan besar disebabkan oleh kesalahan kita dalam memasukkan keyword (kata kunci).

Sebenarnya terdapat kata-kata kunci (mirip dengan mantera-mantera yang harus dihafal)yang perlu kita ketahui.Query operator (keyword) ini berfungsi untuk membatasi pencarian agar menjadi lebih spesifik, sehingga apa yang sebenarnya kita cari akan secara jelas ditampilkan oleh paman google kita yang tercinta ini. Beberapa query operator ini adalah sebagai berikut:

site:
Fungsinya untuk mebatasi pencarian berdasarkan suatu situs atau domain tertentu.
contoh:
USM site:itb.ac.id

Pencarian akan dibatasi pada topic tentang USM (Ujian Saringan Masuk) pada semua halaman yang tersedia pada domain itb.ac.id (situsnya Institut Teknologi Bandung.

intitle:
Fungsinya untuk membatasi pencarian pada halaman web yang memiliki judul yang mengandung informasi pada topik yang dimaksud.
contoh:

intitle:pengumuman UAN

Akan mencari halaman yang mengandung kata “UAN” sebagai judulnya dengan prioritas utama “pengumuman”.

allintitle:
Fungsinya untuk membatasi pencarian pada situs yang memiliki kata-kata berikut dalam judulnya.
contoh:

allintitle:sekolah cerdas

Akan mencari semua situs yang memiliki judul dokumen sekolah cerdas, ini juga bisa diganti dengan cara intitle:sekolah intitle:cerdas

inurl:
Ialah sintaks perintah untuk membatasi pencarian yang hanya menghasilkan semua URL yang hanya berisi kata kunci informasi yang dimaksudkan.
contoh:

inurl:update McAffe

Pencarian akan menghasilkan semua URL yang hanya mengandung informasi tentang “update McAffe “.

filetype: atau ext:
Ialah sintaks perintah pada Google untuk pencarian data pada internet dengan ekstensi tertentu,misalnya doc untuk word,pdf untuk akrobat reader,ppt untuk presentasi.
Contoh:

Inurl:makalah HAM filetype:doc

Pencarian akan menghasilkan file data dengan ekstensi “.doc” pada semua url yang berisi informasi “makalah” dengan kriteria encarian utama “HAM”. Ini biasa saya lakukan kalau malas bikin makalah karena pencariannya langsung ke pusatnya yaitu “makalah jadi” dengan judul HAM, simple kan..

link:
Fungsinya untuk pembatasan pencarian situs-situs yang memiliki link terhadap situs tertentu
contoh:

link:www.kamugila.com

akan mencari situs-situs yang memiliki links ke http://www.kamugila.com

Berikut ini keyword yang biasa digunakan dalam seni dan teknik hacking.

“Index of /admin”
“Index of /password”
“Index of /mail”
“Index of /” +passwd
“Index of /” +password.txt
“Index of /” +.htaccess
index of ftp +.mdb allinurl:/cgi-bin/ +mailto

administrators.pwd.index
authors.pwd.index
service.pwd.index
filetype:config web
gobal.asax index

allintitle: “index of/admin”
allintitle: “index of/root”
allintitle: sensitive filetype:doc
allintitle: restricted filetype :mail
allintitle: restricted filetype:doc site:gov
inurlasswd filetype:txt
inurl:admin filetype:db
inurl:iisadmin
inurl:”auth_user_file.txt”
inurl:”wwwroot/*.”

top secret site:mil
confidential site:mil

allinurl: winnt/system32/ (get cmd.exe)
allinurl:/bash_history

intitle:”Index of” .sh_history
intitle:”Index of” .bash_history
intitle:”index of” passwd
intitle:”index of” people.lst
intitle:”index of” pwd.db
intitle:”index of” etc/shadow
intitle:”index of” spwd
intitle:”index of” master.passwd
intitle:”index of” htpasswd
intitle:”index of” members OR accounts
intitle:”index of” user_carts OR user_cart

Masih banyak keyword lain yang biasa digunakan, googling saja dengan kata kunci “google hacking”.
Contoh Praktis
Coba gunakan sintaks:

inurl:password filetype:log

Anda akan melihat melalui begitu banyak username dan password yang bertebaran. Beberapa diantara situs tersebut telah saya beritahu, tetapi belum ada konfirmasi balik. Kini tugas anda yang telah membaca artikel ini untuk memberitahukannya. Ingat prinsip kita :

Mengetahui kelemahan bukan untuk melemahkan, tetapi untuk memperkuat dengan melakukan perbaikan.

Solusi

1. Mencegah Google dan search engine lain melakukan pengindexan terhadap situs anda.

2. Mencegah scanning terhadap halaman tertentu.

3. Menghapus Snippet (Potongan-potongan)

4. Menghapus halaman-halaman yang sudah di-Cache Menghapus gambar dari pencarian gambar Google

Penjelasan:

1.Mencegah Google dan search engine lain melakukan pengindexan terhadap situs anda.

Untuk mencegah Google dan search engine lain melakukan pengindexan terhadap situs anda, copy-pastekan script berikut pada text editor anda dan simpan dengan nama robots.txt

Code:
User-Agent: *
Disallow: /

Inilah protokol standar yang diperiksa oleh hampir semua mesin pengindeks web untuk mengecualikan suatu server atau direktori web dari pengindeksan. info lebih lanjut bisa kamu dapatkan di:http://www.robotstxt.org/wc/norobots.html

2.Mencegah scanning terhadap halaman tertentu.

Kalau anda tidak menginginkan semua robot melakukan indexing terhadap website anda, maka anda dapat menyimpan meta tag dibawah ini kedalam program HTML anda:

Code:
<meta name=”ROBOTS” content=”NOINDEX, NOFOLLOW”>

Kalau anda tidak menginginkan robots Google’s meng-index website anda, sehingga anda mau memakai robots lain, pakailah tag dibawah ini:

Code:
<meta name=”GOOGLEBOT” content=”NOINDEX, NOFOLLOW”>

Informasi tambahan mengenai standard meta tag element tersedia disini:
http://www.robotstxt.org/wc/exclusion.html#meta

3.Menghapus Snippet (Potongan-potongan)

Snippet adalah text yang diambil dari halaman website anda dimana semua query di bold. Dari hasil proses ini, pemakai bisa melihat isi dari pencarian (search) yang nongol di webpage anda, sebelum meng-click hasil. Biasanya pemakai akan meng-click didalam hasil pencarian (search result) kalau hasil itu mempunyai snippet.

Kalau anda tidak mau Google mengeluarkan snippet dihalaman anda, pakailah tag dibawah ini:

Code:
<meta name=”GOOGLEBOT” content=”NOSNIPPET”>

Ingat: menghapus snippet juga akan menghapus cache memori halaman.

4.Menghapus halaman-halaman yang sudah di-Cache

Google menyimpan teks dari kebanyakan dokumen-dokumen yang dirangkaknya ke dalam cache. Dengan begini, versi halaman web yand diarsip, atau di-“cache”, dapat diperlihatkan kepada pengunjung-pengunjung situs anda apabila halaman yang sebelumnya tidak tersedia lagi (disebabkan oleh kegagalan sementara dari halaman di jaringan server). Halaman yang di-cache terlihat kepada pengunjung-pengunjung persis seperti waktu Google merangkaknya. Halaman yang di-cache ini juga mencantum pesan (di bagian atas halaman) untuk menunjukkan bahwa halaman ini adalah versi yand di-cache.
Bila anda ingin menghindarkan semua robot dari mengarsip isi situs anda, gunakan meta tag NOARCHIVE. Tempatkan tag ini di bagian > dari halaman-halaman anda sebagai berikut:

Code:
<meta name=”ROBOTS” content=”NOARCHIVE”>

Bila anda ingin memperbolehkan robot-robot pendaftar lain untuk mengarsip isi halaman anda, menghindarkan robot-robot Google saja untuk menyimpan halaman itu, gunakan tag berikut:

Code:
<meta name=”GOOGLEBOT” content=”NOARCHIVE”>

Perhatian: tag ini hanya menghapus kaitan yand di-“cache” di dalam halaman berikut. Google akan terus mengindeks halaman ini dan menampilkan sebagian kecil.

5. Menghapus gambar dari pencarian gambar Google
Tempatkan file robots.txt di direktory root. Misalkan file imagemu beralamatkan http://situsku.com/images/gambarku.jpg maka kamu harus menempatkan file robots.txt di lokasi http://situsku.com/robots.txt tempatkan text berikut pada file robots.txt :

Code:

User-Agent: Googlebot-Image
Disallow: /images/dogs.jpg
Untuk menghapus semua gambar di dalam situs anda dari indeks google, tempatkan text berikut:
User-Agent: Googlebot-Image
Disallow: /

One thought on “Google.. Mesin pencari bermata dua…

  1. Mungkin ini bisa menjadi gambaran kenapa file di fb pun bisa kebaca… Bahkan server yang terproteksipun kalau kita inject dengan script yang sesuai akan terbaca.. dengan catatan security yang dipakai standart.. Kalau agak expert di perlukan tools2 yang lain seperti yang ada di backtrack.. Selamat berselancar di mesin google kang Zefron.. (y)

Tinggalkan Balasan

Isikan data di bawah atau klik salah satu ikon untuk log in:

Logo WordPress.com

You are commenting using your WordPress.com account. Logout / Ubah )

Gambar Twitter

You are commenting using your Twitter account. Logout / Ubah )

Foto Facebook

You are commenting using your Facebook account. Logout / Ubah )

Foto Google+

You are commenting using your Google+ account. Logout / Ubah )

Connecting to %s