
Cara Membuat Peta Situs XML Untuk Pemetaan SEO – Berkeliaran di jalan berbatu mungkin terasa luar biasa, tetapi ketika Anda perlu pergi ke tempat tertentu, lebih baik menemukannya di peta dan ikuti tip navigasi. Hal yang sama berlaku untuk robot pencari sebagian besar waktu mereka menjelajahi situs Anda dengan mengikuti tautan secara alami.
Cara Membuat Peta Situs XML Untuk Pemetaan SEO
sitemappro – Masalahnya, perayap mungkin tidak akan pernah menjangkau beberapa laman dengan cara ini: baik karena situs web Anda terlalu besar atau karena laman tidak memiliki tautan yang mengarah ke sana.
Baca Juga : Cara Menemukan dan Mengirimkan Site Map Anda
Itulah mengapa peta situs ada. Untuk memastikan mereka tidak melewatkan halaman penting apa pun, perayap pencarian sesekali melihat peta situs ini membantu mereka menemukan area situs web yang belum pernah mereka kunjungi sebelumnya.
Apa yang kami sebut peta situs
Peta situs adalah file dengan daftar semua halaman situs web yang perlu diketahui oleh perayap dan pengguna. Ini mirip dengan daftar isi buku, kecuali, bagian-bagiannya adalah tautan.
Ada 2 jenis utama peta situs: peta situs HTML dan XML.
Peta situs HTML adalah halaman web yang mencantumkan tautan . Biasanya, ini adalah tautan ke bagian dan halaman terpenting situs web. Berikut adalah beberapa contoh peta situs HTML yang bagus: DHL , Lufthansa , SmartFares . Peta situs HTML dirancang terutama untuk manusia dan bukan robot dan membantu dengan cepat menavigasi seluruh bagian utama situs.
Peta situs XML adalah file XML (misalnya sitemap.xml) yang terletak di folder akar situs web yang menentukan tautan, tanggal modifikasi halaman, dan parameter lain yang penting bagi mesin telusur. Karena semua parameter ditandai dengan tag khusus, file XML terlihat sangat mirip dengan kode HTML situs web:
Peta Situs XML mungkin terlihat tidak menarik, tetapi ada nilai SEO yang bagus di dalamnya. Membuat peta situs membantu perayap mendapatkan tampilan menyeluruh dari situs web Anda, lebih memahami strukturnya, menemukan konten baru dengan cepat, dan banyak lagi.
Dalam posting ini, kita akan membahas daftar manfaat peta situs XML yang dapat dibawa ke situs web, akan berbicara tentang berbagai jenis peta situs, dan akhirnya akan mengetahui cara membuat peta situs yang tepat. Terakhir, ada bonus untuk Anda di akhir posting ini infografis yang menampilkan semua praktik terbaik pemetaan situs.
Apa manfaat memiliki peta situs XML?
Disarankan untuk membuat peta situs jika Anda menjalankan situs web besar atau jika Anda baru memulai proyek baru. Dalam kasus pertama, peta situs XML akan membantu Google menemukan beberapa konten yang berakar dalam. Sementara itu, dengan situs web baru, berkat peta situs, Anda tidak perlu menunggu lama bagi Google untuk mengetahui bahwa konten Anda memang ada. Tetapi bagaimana jika situs web Anda tidak besar atau baru? Haruskah Anda tetap mempertimbangkan untuk memiliki peta situs XML?
Menurut Google , Anda selalu dapat memperoleh manfaat dari menambahkan peta situs ke situs web Anda dan tidak pernah dihukum karena memilikinya. Selain itu, membuat peta situs dapat memberi Anda banyak manfaat nyata lainnya:
- Peta situs XML membantu mesin telusur memahami halaman mana yang ingin Anda indeksdengan menambahkan URL ke file yang Anda tandai kepada Google bahwa halaman tersebut berkualitas. Namun perlu diingat, bahwa Google mungkin juga mengabaikan permintaan Anda—untuk diindeks, halaman harus mematuhi standar kualitas Google.
- Peta situs XML dapat membantu situs web Anda pulih jika halaman webnya terkena pembaruan Google Panda (terutama berguna untuk situs web besar).
Peta Situs membantu Anda mengontrol pengindeksan halaman tertentu di Google Search Console. - Anda dapat memberi tahu Google tentang versi regional halaman Anda dengan mencantumkannya di peta situs Anda bersama dengan atribut hreflang khusus. Ini bukan satu-satunya cara untuk mengatur situs web multibahasa dengan benar, tetapi beberapa webmaster percaya ini adalah cara termudah.
- Peta situs XML adalah penolong hukum Anda dalam mengonfirmasi hak konten Anda karena menyebutkan publikasi halaman dan waktu pembaruan.
Berapa banyak peta situs yang Anda butuhkan?
Sebelum membuat peta situs, Anda perlu memahami berapa banyak peta situs yang Anda butuhkan. Biasanya, satu sudah cukup. Namun, ada beberapa kasus ketika Anda harus membuat beberapa file.
Memisahkan peta situs besar
Mesin pencari hanya akan merayapi peta situs XML dengan ukuran file maksimum 50MB saat tidak dikompresi dan berisi tidak lebih dari 50.000 URL . Google telah memberlakukan batasan seperti itu karena suatu alasan mereka memastikan bahwa server web Anda tidak kelebihan beban saat menyajikan file yang sangat besar.
Jadi, jika Anda memiliki situs web yang besar dan, dengan demikian, file peta situs yang besar, Anda harus memecahnya menjadi beberapa yang lebih kecil. Jika tidak, Anda akan mendapatkan kesalahan ukuran file Peta Situs saat mengirimkan peta situs XML ke Google Search Console.
Beberapa peta situs untuk bagian situs web yang berbeda
Ini juga merupakan praktik yang baik untuk situs web e-niaga untuk mendistribusikan halaman situs web yang termasuk dalam kategori berbeda di beberapa peta situs. Misalnya, Anda dapat membagi halaman produk, halaman kategori, posting blog, dll.
Ini memungkinkan webmaster untuk memperhatikan jika beberapa jenis halaman memiliki masalah pengindeksan. Selain itu, karena halaman produk diperbarui lebih sering daripada yang lain, dengan beberapa peta situs, Anda hanya perlu memperbarui satu peta situs produk alih-alih mengubah peta situs untuk seluruh situs web.
Terakhir, menggunakan file peta situs XML yang lebih kecil untuk bagian situs web yang berbeda juga bagus dari segi teknis. Ukuran file Anda tidak boleh lebih dari 50 MB dan jumlah URL yang terdaftar bisa di bawah 50.000, tetapi semakin banyak halaman yang Anda daftarkan semakin banyak tekanan yang tidak perlu mereka masukkan ke server web Anda.
Hal ini dapat menyebabkan respons atau batas waktu terpotong, dan dengan demikian kesalahan perayapan dapat terjadi. Jadi, dengan menggunakan peta situs yang lebih kecil, Anda dapat mencegah masalah tersebut.
Halaman mana yang harus disertakan dalam peta situs?
Bagian dari kursus kilat pemetaan situs kami ini sangat penting, jadi bacalah dengan cermat! Salah satu kesalahpahaman umum adalah bahwa untuk membantu Google merayapi dan mengindeks situs Anda, Anda harus memasukkan semua halaman situs web Anda ke dalam peta situs XML. Bahkan, itu sebaliknya. Google tidak perlu melihat semua halaman sampah yang mungkin Anda miliki di situs Anda. Anda hanya perlu memberitahunya tentang halaman menarik berkualitas tinggi yang Anda yakini pantas mendapat peringkat tinggi.
Dengan memasukkan beberapa halaman ke dalam peta situs XML Anda, Anda meminta Google untuk fokus pada halaman tersebut. Mungkin atau mungkin tidak mengikuti saran Anda, tapi itu cerita yang berbeda. Sebagai aturan praktis, semua halaman yang Anda tambahkan ke daftar harus 200 halaman OK diisi dengan konten berkualitas tinggi yang melayani pengguna. Itu berarti Anda harus mengecualikan semua halaman yang tidak memenuhi kriteria ini sambil mengingat beberapa pengecualian.
4XX halaman dalam peta situs XML
Kode respons 4XX berarti bahwa halaman yang diminta tidak ada atau memiliki akses terbatas, jadi dalam banyak kasus, Anda tidak ingin menyertakan halaman tersebut ke dalam peta situs Anda.
4xx yang seharusnya tidak ada di peta situs Anda
404 adalah halaman yang dihapus, jadi jika halaman tersebut sengaja dihapus, jauhkan dari peta situs XML Anda. Hal yang sama berlaku untuk halaman 404 lunak yang telah dihapus tetapi masih mengembalikan kode status keberhasilan 200 tingkat. Biasanya itu adalah halaman dengan sedikit atau tanpa konten, dialihkan ke beranda, atau 404 halaman yang diblokir oleh robots.txt. Soft 404 umumnya tidak baik untuk SEO Anda, jadi luangkan waktu untuk memperbaiki masalah ini.
Ingatlah untuk membuat halaman 404 khusus untuk memastikan pengalaman pengguna yang lancar. Kode status 4xx populer lainnya adalah 401—artinya Google “tidak diizinkan” untuk mengakses halaman tersebut. Biasanya, halaman seperti itu ditujukan untuk pengguna yang masuk, dan Anda tidak ingin Google mengindeksnya. Oleh karena itu, Anda tidak memerlukan halaman ini di peta situs Anda.
4xx yang mungkin Anda butuhkan di peta situs Anda
Dalam beberapa kasus, Anda mungkin benar-benar ingin Google merayapi dan mengindeks halaman 401. Misalnya, Anda memiliki halaman yang dilindungi kata sandi yang sedang dikembangkan dan kemudian lupa mencabut batasan saat halaman ditayangkan.
Selain itu, terkadang webmaster membatasi akses ke halaman tertentu untuk melindunginya dari bot atau spammer jahat. Dalam kasus seperti itu, Anda perlu mengaktifkan pencarian DNS untuk memverifikasi bahwa perayap web yang mengakses halaman Anda adalah Googlebot.
3XX halaman dalam peta situs XML
3xx adalah halaman pengalihan , dan Anda mungkin ingin atau tidak menginginkannya di peta situs situs web Anda bergantung pada jenis pengalihan.
3xx yang seharusnya tidak ada di peta situs Anda
Kode respons 301 berarti bahwa halaman telah dialihkan secara permanen ke alamat baru dan halaman asli tidak ada lagi. Oleh karena itu, laman tersebut tidak boleh ada di peta situs XML Anda. Satu-satunya hal yang perlu diingat dalam hal ini adalah menyertakan URL tujuan di peta situs.
3xx yang mungkin Anda butuhkan di peta situs Anda
302 halaman adalah halaman yang dialihkan sementara. Misalnya, pengalihan seperti itu sering digunakan untuk pengujian A/B ini adalah saat sebagian pengguna dikirim ke URL pengujian. Dalam hal ini, Anda ingin menyimpan halaman asli yang diindeks, jadi jelas, itu harus tetap berada di peta situs XML Anda.
Halaman pengujian, di sisi lain, tidak boleh diindeks karena akan menjadi duplikat yang hampir mirip dengan halaman aslinya. Jadi, Anda perlu menandai URL asli sebagai kanonik dan menjauhkan URL uji dari peta situs Anda, sama seperti semua halaman non-kanonik.
5XX halaman dalam peta situs XML
Kode status 5XX berarti ada masalah di server web Anda. Yang paling umum dari kode 5xx adalah kesalahan 503 Layanan Tidak Tersedia yang mengatakan bahwa server sedang down sementara. Ini mungkin terjadi karena server web sedang dalam pemeliharaan atau kelebihan beban.
Jika kesalahan hanya terlihat sekali, tidak ada yang perlu Anda khawatirkan karena mungkin karena pemeliharaan server web terjadwal. Sebaliknya, jika masalah terus berlanjut, Anda harus mencari tahu penyebabnya dan memperbaiki masalah secepatnya jika tidak, Google dapat menyimpulkan bahwa situs web Anda tidak terpelihara dengan baik.
Dengan halaman 5xx, ini bukan tentang menambahkannya ke peta situs Anda atau tidak, tetapi tentang memperbaiki masalah untuk memastikan halaman memiliki kode respons 200 OK.
Halaman yang tidak dapat diindeks
Setiap situs web memiliki sejumlah halaman utilitas yang penting bagi pengguna, tetapi tidak untuk mesin pencari halaman login, halaman yang tersedia saat login, menyortir dan memfilter halaman, dll. Praktik umum adalah memblokir halaman tersebut dengan file robots.txt , sehingga Google tidak dapat mengaksesnya. Atau seseorang dapat membiarkan Google merayapi halaman, tetapi membatasi pengindeksannya dengan arahan khusus ( noindex atau semua ).
Secara alami, semua halaman ini tidak boleh ada di peta situs XML Anda. Jika halaman tidak dapat diindeks, tetapi ditampilkan di peta situs Anda, itu tidak hanya membingungkan Google, tetapi juga membuang anggaran perayapan Anda. Hal yang sama berlaku untuk laman yang diblokir oleh robots.txt Google tidak akan dapat merayapinya.
Ini juga merupakan ide yang baik untuk mengaudit situs Anda untuk memastikan arahan noindex dan file robots.txt digunakan dengan benar, dan Anda tidak secara tidak sengaja memblokir halaman yang salah. Anda dapat dengan mudah menemukan semua halaman tersebut menggunakan alat Audit Situs Web Peringkat SE . Setelah meluncurkan audit, Anda harus membuka bagian Perayapan Laporan Masalah.
Dengan mengklik jumlah halaman masing-masing, Anda akan melihat daftar lengkap URL yang ditandai sebagai noindex atau diblokir oleh robots.txt bersama dengan parameter penting lainnya seperti jumlah tautan internal yang mengarah ke halaman, semua tag meta robot dan tag x-robot, dan judul halaman. Anda juga akan segera melihat apakah halaman tersebut saat ini disertakan dalam peta situs XML Anda.