Peta Situs XML: Alat yang Paling Disalahpahami di Kotak Alat SEO

Peta Situs XML: Alat yang Paling Disalahpahami di Kotak Alat SEO – Selama bertahun-tahun konsultasi SEO, saya telah melihat banyak klien dengan kesalahpahaman liar tentang peta situs XML. Mereka adalah alat yang ampuh, tentu saja tetapi seperti alat listrik apa pun, sedikit pelatihan dan latar belakang tentang cara kerja semua bit sangat membantu.

Peta Situs XML: Alat yang Paling Disalahpahami di Kotak Alat SEO

sitemappro – Mungkin kesalahpahaman yang paling umum adalah bahwa peta situs XML membantu mengindeks halaman Anda. Hal pertama yang harus kami luruskan adalah ini: Google tidak mengindeks halaman Anda hanya karena Anda memintanya dengan baik.

Baca Juga : Memperbaiki Kesalahan Gagal Membuat Site Map Untuk Situs di SharePoint 2013

Google mengindeks halaman karena (a) mereka menemukannya dan merayapinya, dan (b) mereka menganggap kualitasnya cukup baik untuk layak diindeks. Menunjuk Google ke sebuah halaman dan meminta mereka untuk mengindeksnya tidak terlalu berpengaruh.

Karena itu, penting untuk dicatat bahwa dengan mengirimkan peta situs XML ke Google Search Console, Anda memberi Google petunjuk bahwa Anda menganggap halaman di peta situs XML sebagai halaman arahan pencarian berkualitas baik, layak untuk diindeks. Tapi, itu hanya petunjuk bahwa halaman itu penting… seperti menautkan ke halaman dari menu utama Anda.

Konsistensi

Salah satu kesalahan paling umum yang saya lihat dilakukan klien adalah kurangnya konsistensi dalam pengiriman pesan ke Google tentang halaman tertentu. Jika Anda memblokir halaman di robots.txt dan kemudian memasukkannya ke dalam peta situs XML, Anda sedang menggoda. “Ini, Google… halaman bagus dan menarik yang harus Anda indeks,” kata peta situs Anda. Tapi kemudian robots.txt Anda mengambilnya. Hal yang sama dengan robot meta: Jangan sertakan halaman dalam peta situs XML dan kemudian tetapkan robot meta “noindex,follow.”

Sementara saya membahasnya, izinkan saya mengoceh singkat tentang robot meta: “noindex” berarti jangan mengindeks halaman. “Nofollow” tidak berarti apa-apa tentang halaman itu. Itu berarti “jangan ikuti tautan keluar dari halaman itu,” yaitu lanjutkan dan buang semua tautan itu ke toilet.

Mungkin ada beberapa alasan yang tidak jelas di luar sana untuk menyetel robot meta “noindex, nofollow,” tapi itu di luar jangkauan saya. Jika Anda ingin Google tidak mengindeks halaman, setel robot meta ke “noindex,follow.”

Kualitas situs secara keseluruhan

Tampaknya Google mengukur kualitas situs secara keseluruhan, dan menggunakan metrik di seluruh situs untuk memengaruhi peringkat dan saya tidak berbicara tentang jus tautan di sini. Pikirkan tentang ini dari sudut pandang Google. Katakanlah Anda memiliki satu halaman hebat yang penuh dengan konten luar biasa yang mencentang semua kotak, mulai dari relevansi hingga Panda hingga keterlibatan media sosial.

Jika Google melihat situs Anda sebagai 1.000 halaman konten, yang mana hanya 5–6 halaman yang seperti ini satu halaman hebat nah, jika Google mengirim pengguna ke salah satu halaman hebat itu, seperti apa pengalaman pengguna jika mereka mengklik tautan di halaman itu dan mengunjungi sesuatu yang lain di situs Anda? Kemungkinan besar, mereka akan mendarat di halaman yang menyebalkan. Ini UX yang buruk. Mengapa mereka ingin mengirim pengguna ke situs seperti itu?

Insinyur Google tentu memahami bahwa setiap situs memiliki sejumlah halaman “utilitas” tertentu yang berguna bagi pengguna, tetapi belum tentu halaman tipe konten yang harus menjadi halaman arahan dari pencarian: halaman untuk berbagi konten dengan orang lain, membalas komentar, masuk , mengambil kata sandi yang hilang, dll.

Jika peta situs XML Anda menyertakan semua halaman ini, apa yang Anda komunikasikan ke Google? Kurang lebih Anda tidak tahu apa yang merupakan konten bagus di situs Anda dan apa yang tidak. Inilah gambar yang ingin Anda lukis untuk Google. Ya, kami memiliki situs di sini dengan 1.000 halaman… dan inilah 475 dari 1.000 halaman konten hebat kami. Anda dapat mengabaikan yang lain itu adalah halaman utilitas.

Sekarang, katakanlah Google merayapi 475 halaman tersebut, dan dengan metriknya, memutuskan bahwa 175 di antaranya adalah nilai “A”, 200 adalah “B+”, dan 100 adalah “B” atau “B-“. Itu rata-rata keseluruhan yang cukup bagus, dan mungkin menunjukkan situs yang cukup solid untuk mengirim pengguna.

Bandingkan dengan situs yang mengirimkan semua 1.000 halaman melalui peta situs XML. Sekarang, Google melihat 1.000 halaman yang menurut Anda adalah konten bagus, dan melihat lebih dari 50% adalah halaman “D” atau “F”. Rata-rata, situs Anda sangat payah; Google mungkin tidak ingin mengirim pengguna ke situs seperti itu.

fluff yang tersembunyi

Ingat, Google akan menggunakan apa yang Anda kirim di peta situs XML Anda sebagai petunjuk tentang apa yang mungkin penting di situs Anda.

Tetapi hanya karena itu tidak ada dalam peta situs XML Anda tidak berarti bahwa Google akan mengabaikan halaman tersebut. Anda masih dapat memiliki ribuan halaman dengan konten dan ekuitas tautan yang hampir tidak cukup untuk membuatnya diindeks, tetapi seharusnya tidak demikian.

Penting untuk melakukan sebuah situs: telusuri untuk melihat semua halaman yang diindeks Google dari situs Anda untuk menemukan halaman yang Anda lupakan, dan bersihkan dari “nilai rata-rata” yang akan diberikan Google pada situs Anda dengan menyetel meta robots “noindex,follow” (atau memblokir di robots.txt). Umumnya, halaman terlemah yang masih membuat indeks akan dicantumkan terakhir di situs: pencarian.

Perayapan manajemen bandwidth

Kapan Anda benar-benar ingin menggunakan robots.txt? Mungkin jika Anda mengalami masalah bandwidth perayapan dan Googlebot menghabiskan banyak waktu untuk mengambil halaman utilitas, hanya untuk menemukan robot meta “noindex, follow” di dalamnya dan harus keluar. Jika Anda memiliki begitu banyak sehingga Googlebot tidak dapat membuka halaman penting Anda, Anda mungkin harus memblokirnya melalui robots.txt.

FYI, jika Anda memiliki sekumpulan halaman inti di mana konten berubah secara teratur (seperti blog, produk baru, atau halaman kategori produk) dan Anda memiliki banyak halaman (seperti halaman produk tunggal) yang bagus jika Google mengindeksnya, tetapi tidak dengan mengorbankan tidak merayapi ulang dan mengindeks halaman inti, Anda dapat mengirimkan halaman inti dalam peta situs XML untuk memberi Google petunjuk bahwa Anda menganggapnya lebih penting daripada halaman yang tidak diblokir , tetapi tidak ada di peta situs.

Peta situs XML dinamis

Sekarang Anda berpikir, “Oke, bagus, Michael. Tapi sekarang saya harus menyinkronkan peta situs XML saya secara manual dengan robot meta saya di semua 100.000 halaman saya,” dan itu tidak mungkin terjadi. Tetapi tidak perlu melakukan ini secara manual. Peta situs XML tidak harus berupa file statis. Bahkan, mereka bahkan tidak perlu memiliki ekstensi .XML untuk mengirimkannya di Google Search Console.

Alih-alih, atur logika aturan untuk apakah halaman disertakan dalam peta situs XML atau tidak, dan gunakan logika yang sama di halaman itu sendiri untuk menyetel indeks robot meta atau noindex. Dengan begitu, saat deskripsi produk dari umpan pabrikan diperbarui oleh pabrikan dan berubah dari 42 kata menjadi 215 kata, halaman di situs Anda secara ajaib muncul di peta situs XML dan menyetel robot meta ke “index,follow. “

Saat peta situs ini diambil, alih-alih merender halaman HTML, kode sisi server hanya mengembalikan XML. Yang ini mengulangi satu set catatan dari salah satu tabel database saya dan mengeluarkan catatan untuk setiap catatan yang memenuhi kriteria tertentu.