Hindari Duplicate Content Karena Indeks Arsip Blog

Sabtu, 07 Januari 2012

Hindari Duplicate Content Karena Indeks Arsip Blog

21.06

konsultan

Blogger sangat rawan dengan berbagai jenis duplicate (duplikasi) yg dapat dipantau melalui Google webmaster tools, yaitu duplicate title, duplicate description, serta duplicate content. Kasus duplikasi ini menyebabkan kerancuan indeks sehingga Google dapat melakukan ban karena suatu halaman dianggap memiliki isi, judul, atau deskripsi sama persis dengan halaman lain. Terlebih lagi apabila duplikasi tersebut dialami oleh lebih dari dua halaman. Penyebab lain duplicate content tentunya adalah copy paste dan publikasi artikel yg sama. Duplikasi berakibat buruk pada SEO blog, indeks suatu halaman akan menurun drastis. Apabila terlalu banyak duplikasi konten, maka ban akan dilakukan pada seluruh halaman. Google pun pernah menjelaskan tentang duplikasi konten yg mempengaruhi pagerank & SERP. Di antara ketiga jenis duplikasi tersebut, saya pernah share cara mengatasi duplicate meta description, yg notabene disebabkan oleh template blogger yg berjenis XML, yaitu deskripsi masing-masing halaman sama karena pengaturan meta deskripsi-nya juga sama. Kali ini, kita akan berfokus pada duplicate content karena halaman arsip blog.

Halaman arsip blogger (yg biasanya dibagi berdasarkan bulan, minggu, serta hari) dapat menyebabkan kasus duplicate content karena arsip tidak memiliki konten sendiri. Isinya merupakan bagian-bagian dari posting yg sebenarnya adalah milik halaman-halaman posting itu sendiri. Sehingga, dalam indeks Google, halaman arsip akan memiliki konten yg sama dengan beberapa posting lain. Dalam deskripsi di hasil indeks, arsip juga demikian. Terkadang, halaman arsip memiliki deskripsi yg sama dengan halaman homepage. Seperti contoh berikut:

deskripsi sama pada indeks halaman blog budihaeruman.blogspot.com

Jika dicari di Google dengan perintah / keyword site:namadomain, Google akan memprioritaskan homepage & arsip pada halaman awalnya, setelah itu baru disusul oleh halaman-halaman posting. Tentunya ini dapat berakibat buruk juga pada prioritas halaman posting yg seharusnya memiliki peringkat lebih tinggi dibanding halaman arsip.

Berangkat dari itu, berarti setidaknya ada dua efek dari indeks halaman arsip Blogger:

1. Duplicate konten (konten yg sama dari dua atau lebih halaman berbeda)

2. Prioritas indeks halaman arsip lebih tinggi dari halaman posting.

Untuk menghindari hal tersebut, hal yg diperlukan adalah menghalangi Google search engine mengindeks halaman arsip.

Cara Menghindari Indeks Search Engine Pada Arsip Blogger

Sebagai cara agar robot crawler tidak mengikuti halaman arsip, cukup digunakan conditional tag, serta menggunakan noindex & noarchive pada meta tag-nya robot. Crawler akan melewatkan setiap halaman arsip.

1. Buka halaman Edit HTML
2. Copy kode berikut & paste / letakkan di bawah <head> (ctrl+F) atau di atas / di bawah meta tag lain.

<b:if cond='data:blog.pageType == "archive"'>
<meta content='noindex,noarchive' name='robots'/>
</b:if>

3. Save template.

Dengan menggunakan kode tersebut, dalam beberapa waktu, halaman archive akan diabaikan oleh crawler search engine. Atau jika tidak sabar, dapat langsung mengajukan penghapusan indeks melalui removal tool di Google Webmaster Tools (site configuration > crawler access > remove url). Duplicate content kemudian dapat diminimalisir. Namun jika sobat tetap ingin halaman arsip menjadi prioritas indeks, tentunya tidak perlu menggunakan cara itu. Pada akhirnya, pilih saja mana yg sobat inginkan dalam mengoptimasikan blog di search engine.

Have a nice Blogging, folks!

mencuri adalah pekerjaan pengecut! © budihaeruman.blogspot.com