Hasilkan file sitemap. Tambahkan file sitemap ke Yandex.vebmaster dan konsol pencarian Google (nuansa dan kesalahan)

Awalnya, saya berpikir untuk menulis "post-hari post" yang sederhana dan mudah tentang satu hal yang menarik, yang baru-baru ini saya perhatikan di konsol pencarian Google. Ternyata sekarang di panel Yandex dan Google Webmaster ada kesalahan kesalahan otomatis di peta situs XML. Sebelumnya, diingat, layanan khusus digunakan untuk keperluan seperti itu, tetapi sekarang semuanya menjadi lebih mudah.

Dalam artikel tersebut tidak hanya akan menemukan deskripsi kesalahan yang dapat dilacak, saya juga memutuskan untuk memberi tahu Anda cara menambahkan file sitemap ke Yandex Webmaster dan Google Search Console. Saya tidak akan membuka apa pun di atas mayoritas, tetapi mungkin seseorang melewatkan saat ini + pemula akan berguna. Kandungan:

  • + Tautan yang bermanfaat.
  • (termasuk pencarian kesalahan).

1. Buat Sitemap XML

Jika tidak ada peta situs di proyek web Anda, pastikan untuk membuatnya - ini adalah chip yang sangat berguna dengan (terutama di sumber daya baru). Saya ingin mencatat bahwa dalam hal ini kita berbicara tentang format XML khusus (untuk mesin pencari), dan bukan tentang HTML (pengunjung). Mekanisme kerja tergantung pada mesin yang Anda gunakan, berikut adalah beberapa artikel tentang topik:

  • Membuat (Ulasan Plugin).
  • - Pasangan layanan untuk sumber daya apa pun.
  • (termasuk XML).
  • Cunning Hack Creation Sitemap di blog blogspot.

Sitemap: http: // transission_omena / sitemap.xml

Secara umum, saya menemukan informasi bahwa mesin pencari secara independen tahu cara menemukan peta situs XML jika terletak pada alamat standar, tetapi pada prinsipnya, lebih baik masih mengunggahnya di bilah alat.

2. Tambahkan Peta Situs ke Google (Cari Konsol)

Sebelumnya, panel ini disebut alat webmaster ya, dan itu terlihat sangat berbeda. Sekarang ini adalah alat yang lebih fungsional. Algoritma tindakan adalah sebagai berikut:

  • Terdaftar Di konsol pencarian (jika Anda sudah memiliki akun Google, itu juga akan akses ke sistem);
  • Hubungkan proyek Anda di sana dan konfirmasikan hak.
  • Untuk melakukan tugas menambahkan sitemap XML, buka bagian "Pindai" - file sitemaps.

Halaman ini berisi semua informasi di peta situs Anda + Anda dapat menambahkan baru (2) atau melihat keberadaan kesalahan pada saat ini (3).

Di Google Search Console didukung diinvestasikan sitemap`a - ada hal seperti itu, misalnya, di plugin SEO Yoast. Modul ini menghasilkan alamat: http: //vash_domena/sitemap_index.xml..

Secara teoritis, Anda dapat menambahkan file sitemap ke googe pencarian konsol hanya satu (utama), dan objek yang tersisa secara otomatis mengambil. Pada saat yang sama di halaman panel hanya akan ditampilkan sitemap.xml.Dan ketika Anda mengkliknya, Anda akan pergi ke subbagian.

Ngomong-ngomong, jika Anda mengirim secara terpisah semua file XML (dasar dan sub-ayat), maka jumlah total tautan dikelilingi:

Mungkin, untuk saat ini di konsol tidak ada alat untuk membedakan antara pengulangan atau itu hanya format semacam itu untuk menampilkan jumlah total catatan, atau kesalahan.

Adapun kesalahan di peta situs

Jika ada beberapa masalah dengan Sitemap XML yang ditambahkan, maka di panel Anda akan melihat notasi yang sesuai (ikon tanda seru dan entri dalam kolom "masalah"). Juga, pada halaman file peta situs tertentu juga akan menjadi peringatan.

Dalam kasus tangkapan layar, Anda dapat melihat catatan bahwa beberapa aturan robots.txt tidak memungkinkan indeks beberapa alamat blog. Hal-hal seperti itu perlu diperbaiki, dan setelah mengirim file untuk memeriksa ulang - tombol "Tes".

Dalam proyek lain, saya memiliki situasi yang lebih buruk - Peta situs memberi: (Ini umumnya omong kosong. Dan modul yang diinginkan diaktifkan, dan saya benar-benar yakin bahwa semuanya berfungsi. Saya menemukan masalah hanya setelah ditambahkan sitemap ke panel webmaster ke panel webmaster . Karena itu, prosedur ini penting cukup, dan hanya membutuhkan beberapa menit.

3. Unduh Sitemap di Yandex

Adapun di sini, setelah mendaftar, menambahkan situs dan mengkonfirmasi hak, Anda harus pergi ke bagian "Pengindeksan" - file sitemap.

Halaman ini memiliki kartu pendeteksi otomatis dari robots.txt + Anda dapat menambahkan file Anda. Panel juga mendukung bersarang. Jika ada yang salah, catatan kesalahan akan ditampilkan. Dalam tangkapan layar di atas, masalahnya terkait dengan gambar tag: gambar di, yang Yandex tidak mengerti. Di Wordpres ada modul yang menghilangkan sendi ini, tetapi pada prinsipnya, itu tidak terlalu mempengaruhi apa pun. Saya pribadi meninggalkan segalanya seperti itu.

Sebelum menambahkan sitemap ke yandex.vebmaster, Anda cukup menjalankan pemeriksaan cepat. Alat ini tersedia di bagian "Alat" - Analisis Peta Situs.

TOTAL

Seperti yang saya katakan di atas, saya menyarankan Anda untuk menghabiskan 5-10 menit untuk menambahkan file sitemap ke Yandex dan Google. Jika proyek Anda tidak memiliki tempat, pastikan untuk membuat. Proses ini, serta penggunaan, akan membantu meningkatkan indeksasi sumber daya, dan juga akan memungkinkan Anda menemukan kesalahan yang tidak dapat Anda ketahui. Ada berbagai situasi, misalnya, CMS yang diperbarui dan lupa untuk menghubungkan modul peta situs, atau ia secara mandiri mulai membungkuk - ketika sitemap mulai memberikan 404 kesalahan, itu tidak keren sama sekali.

Pos, tentu saja, lebih untuk pemula, tapi saya harap Anda juga berguna. Jika Anda memiliki sesuatu untuk ditambahkan, tulis di bawah.

Menggunakan file sitemap, Anda dapat memberi tahu Yandex pada struktur situs saat ini, menentukan arahan khusus di Robots.txt atau menambahkan ke Yandex.Vebmaster.

Webmaster memungkinkan Anda untuk:

Unduh Sitemap.

    Pilih situs dari daftar.

    Di lapangan, masukkan URL, di mana file tersebut tersedia. Sebagai contoh, https://example.com/sitemap.xml..

    Klik tombol Tambah.

Setelah menambahkan file dalam antrian untuk diproses. Robot akan memuatnya dalam waktu dua minggu. Setiap file yang ditambahkan, termasuk diinvestasikan dalam file indeks sitemap, diproses oleh robot secara terpisah.

Setelah mengunduh di mana setiap file, Anda akan melihat salah satu status:

Status Deskripsi Catatan
Baik
"Redirect" Hapus redirect dan informasikan robot pembaruan
"Kesalahan" File terbentuk salah Laporkan robot pembaruan
"Tidak diindeks"
Melarang. Laporkan robot pembaruan
Status Deskripsi Catatan
Baik File ini dibentuk dengan benar dan dimuat ke dalam basis data robot

Sebaliknya file menampilkan tanggal beban terakhir.

Halaman runcing akan muncul di hasil pencarian selama dua minggu

"Redirect" Redirect URL yang ditentukan ke alamat lain Hapus redirect dan informasikan robot pembaruan
"Kesalahan" File terbentuk salah Klik tautan kesalahan untuk mencari tahu detailnya. Setelah membuat perubahan pada file, informasikan robot pembaruan
"Tidak diindeks" Saat mengakses sitemap, server mengembalikan kode HTTP selain 200

Periksa apakah file tersedia untuk robot menggunakan alat, menentukan jalur lengkap ke file.

Jika file tidak tersedia, lihat administrator situs atau server tempat ia berada.

Akses file dilarang dalam robots.txt menggunakan arahan laris Izinkan akses ke sitemap dan beri tahu robot pembaruan

Perbarui Sitemap.

Jika Anda mengubah file sitemap ditambahkan ke yandex.vebmaster, tidak perlu untuk menghapusnya dan mengunduh lagi - robot secara teratur memeriksa file untuk memperbarui dan kesalahan.

Untuk mempercepat bypass file, klik ikon. Jika Anda menggunakan file indeks sitemap, Anda dapat menjalankan pemrosesan setiap file yang tercantum di dalamnya. Robot akan mengunduh data dalam waktu tiga hari. Anda dapat menggunakan fungsi hingga 10 kali untuk satu host.

Ketika Anda menghabiskan semua upaya, selanjutnya akan tersedia 30 hari setelah yang pertama. Tanggal pasti ditampilkan di antarmuka webmaster.



Hapus Sitemap.

Di antarmuka Yandex.vebmaster, Anda dapat menghapus file-file yang telah ditambahkan pada halaman situs Peta Situs: Jika direktif dalam file robots.txt, hapus untuk sitemap. Setelah melakukan perubahan, informasi tentang sitemap akan hilang dari basis robot dan Yandex.webmaster selama beberapa minggu.

Pertanyaan dan jawaban

Sitemap ditampilkan dalam layanan sebagai halaman yang dikecualikan dengan status "Format Dokumen Tidak Valid"

Tampilan file sitemap (serta file XML lainnya) karena halaman yang dikecualikan hanya informatif dan tidak mempengaruhi pengindeksan situs atau pemrosesan sitemap.

File sitemap dapat ditampilkan di grup halaman yang dieksekusi, karena robot mencoba mengindeksnya sebagai halaman biasa, sementara file format XML tidak diindeks di mesin pencari Yandex dan tidak terlibat dalam hasil pencarian.

Saat memproses sitemap, kesalahan "Tag Tidak Dikenal"

File sitemap hanya berisi elemen XML tertentu. Jika webmaster mendeteksi elemen lain dalam file (misalnya, indikasi versi seluler atau multibahasa, alamat gambar), kesalahan tag yang tidak diketahui akan muncul di webmaster. Elemen yang tidak didukung diabaikan oleh robot saat memproses sitemap, dan data dari elemen yang didukung diperhitungkan. Oleh karena itu, file sitemap adalah opsional.

Jika isi file akan diubah, Anda akan membutuhkan hingga dua minggu untuk memperbarui informasi di webmaster.

File sitemap dalam status "tidak diindeks"

File sitemap mungkin tidak diindeks karena beberapa alasan:

    Robot mem-bypass file sitemap baru-baru ini dan tidak punya waktu untuk memprosesnya. Tunggu dua minggu. Jika Anda menggunakan file indeks sitemap dengan banyak file, maka pemrosesan mereka dapat memakan waktu lebih dari satu file sitemap.

    Situs ini sebelumnya tidak tersedia untuk robot pengindeksan. Anda harus menunggu kunjungan berikutnya ke situs oleh robot.

    Akses sitemap dilarang dalam file.

Halo, situs web pembaca blog yang terhormat. Saya memutuskan untuk meringkas dalam satu artikel semua yang telah saya tulis tentang peta situs (sitemap xml), yang pertama-tama diperlukan untuk menentukan sistem pencarian halaman-halaman yang harus mereka indeks terutama. Ini sangat penting dan hampir atribut wajib dari setiap proyek web, tetapi banyak dari ini juga tidak tahu atau tidak memberikan peta situs yang sangat penting.

Segera mari kita letakkan semua poin di atas "i" dan cobalah untuk memisahkan dua konsep - peta situs dalam format XML dan dalam format HTML (ada juga interpretasi geografis dari kata ini yang saya tulis tentang artikel "". Opsi kedua adalah daftar biasa dari semua bahan web sumber daya, yang akan tersedia untuk siapa saja yang ingin menekan item menu yang sesuai. Opsi ini juga berguna dan berkontribusi untuk mempercepat dan meningkatkan pengindeksan sumber daya Anda dengan mesin pencari.

Peta situs sitemap dalam format XML - dan saya membutuhkannya

Tetapi alat utama yang ditujukan untuk menentukan langsung mesin pencari dari halaman sumber daya yang perlu diindeks adalah file yang disebut sitemap.xml (ini adalah nama yang paling sering, tetapi dalam gagasan itu bisa disebut seolah-olah itu Tidak penting), yang tidak akan menjadi pengunjung yang terlihat oleh pengunjung.

Ini disusun dengan mempertimbangkan sintaks khusus yang memahami mesin pencari di mana semua halaman akan terdaftar untuk diindeks yang menunjukkan tingkat kepentingannya, tanggal pembaruan terakhir dan perkiraan frekuensi pembaruan.

Ada dua file utama yang harus tersedia dari proyek web apa pun - robots.txt dan sitemap.xml.. Jika proyek Anda tidak memiliki atau mereka tidak diisi dengan benar, maka dengan banyak probabilitas, Anda sangat mengembara sumber daya Anda dan tidak memungkinkannya untuk mengungkapkan seratus persen.

Anda mungkin, tentu saja, mungkin tidak mendengarkan saya (karena saya tidak memiliki otoritas, berdasarkan materi aktual akumulasi kecil), tetapi saya berpikir bahwa dengan spesialis yang memiliki statistik dengan puluhan ribu proyek di bawah tangan, Anda tidak akan memperdebatkan.

Dalam hal ini, saya menemukan diri saya quasper "piano di semak-semak". Langsung sebelum menulis artikel ini, publikasi spesialis dari sistem kemajuan otomatis yang terkenal di bawah nama "tangan" yang tidak biasa (ini adalah analog megaindex, yang saya tulis).

Jelas bahwa siapa pun yang mirip dengan mereka yang tertarik untuk memastikan bahwa proyek pelanggan mereka telah berhasil dipromosikan, tetapi mereka hanya dapat memompa sumber daya pelanggan dengan massa referensi, dan, sayangnya, tidak dapat mempengaruhi konten dan pengaturan teknis situs yang benar.

Oleh karena itu, penelitian yang sangat menarik dan indikatif dilakukan, yang dimaksudkan untuk mengidentifikasi 10 alasan paling populer yang membuatnya sulit untuk mempromosikan proyek dan menyodok data ini secara langsung di ...

Pertama-tama, tentu saja, itu "bukan konten unik" (atau Anda beremagalisasi, atau Anda memiliki esensi tidak berubah). Tetapi di tempat kedua adalah peta situs dalam format XML, dan lebih tepatnya ketidakhadiran atau inkonsistensinya dari format kreasi yang diakui. Nah, di tempat ketiga adalah file robots.txt yang disebutkan sebelumnya (ketidakhadirannya atau penciptaan yang tidak tepat):

Ketika tidak jelas bahwa kartu harus di proyek Anda tentu (jika tidak Kirdyk), itu tidak terdengar begitu meyakinkan, seperti dalam kasus penguatan persetujuan ini, fakta nyata dari penelitian yang agak representatif.

Oke, kami berasumsi bahwa saya meyakinkan Anda dan mari kita lihat bagaimana Anda dapat membuat sitemap (sintaks format), bagaimana cara membuatnya untuk Joomla dan WordPress, serta mari kita lihat bagaimana hal itu dapat membuatnya dengan bantuan generator online khusus (generator ).

Tetapi hanya membuat sitemap tidak cukup untuk percaya diri dalam indeksasi yang tepat dari proyek Anda oleh mesin pencari. Itu masih akan dilakukan sehingga mesin pencari belajar tentang situs peta ini (dalam kasus kami adalah Google dan Yandex). Ini dapat dilakukan dengan dua cara, tetapi kami akan membicarakannya sedikit kemudian (harus setidaknya ada beberapa intrik yang menarik perhatian pembaca).

Mengapa Anda memerlukan situs web peta dan file robots.txt

Pertama-tama mari kita coba untuk membuktikan kebutuhan logis untuk menggunakan file robots.txt yang melarang pengindeksan item-item tertentu dari proyek web Anda dan file situs web peta yang meresepkan indeksasi halaman-halaman tertentu. Untuk melakukan ini, kembali pada tumit sepuluh tahun yang lalu, ketika sebagian besar sumber daya di Internet hanyalah satu set file HTML, di mana teks-teks semua artikel terkandung.

Robot pencarian Google atau Yandex hanya pergi ke proyek HTML seperti itu dan mulai mengindeks semua yang ia datangi, karena hampir di mana-mana berisi konten proyek. Dan apa yang terjadi sekarang, dalam kondisi CMS (sistem manajemen konten)? Sebenarnya, bahkan segera setelah menginstal mesin, robot pencarian sudah akan mendeteksi Anda memiliki beberapa ribu file dan ini terlepas dari kenyataan bahwa Anda belum dapat menerima konten (yah, belum menulis artikel).

Ya, dan secara umum, konten dalam CMS modern biasanya disimpan dalam file, tetapi dalam database bahwa robot pencarian langsung mengindeks, secara alami, tidak akan dapat bekerja dengan pangkalan gratis).

Jelas bahwa saya bergeser ke sini, mencari robot Yandex dan Google akan tetap menemukan konten Anda dan mengindeksnya, tetapi seberapa cepat itu akan terjadi dan seberapa lengkap indeksasinya Proyek Anda adalah pertanyaan yang sangat besar.

Ini justru untuk menyederhanakan dan mempercepat pengindeksan proyek dengan mesin pencari dalam kondisi CMS untuk digunakan dan harus wajib untuk membuat robots.txt dan sitmap.xml. Dengan bantuan file pertama, Anda menyarankan mesin pencari untuk mengindeks file apa yang seharusnya tidak menghabiskan waktu (objek mesin, misalnya), serta menggunakannya, Anda dapat menutup dari pengindeksan dan bagian dari halaman untuk menghilangkan efek duplikasi konten yang melekat pada banyak CMS (baca tentang baca lebih lanjut dalam artikel Artikel Pro).

Dan dengan bantuan file sitemap, Anda dengan jelas dan jelas mengatakan robot Yandex dan Google, yang ada di proyek Anda yang berisi konten sehingga mereka tidak menarik diri di sudut-sudut ekonomi yang digunakan. Jangan lupa bahwa bot memiliki batas tertentu untuk waktu dan jumlah dokumen yang dilihat. Dia takut pada file dan daun mesin Anda, dan konten akan tetap diindeks untuk waktu yang lama. Tentang caranya.

Ingat bagaimana satu karakter berwarna-warni berbicara dalam komedi terkenal: "Anda tidak pergi ke sana, Anda pergi ke sini, dan kemudian ...". Itu adalah fungsi dari karakter ini dan melakukan robots.txt dan situs web peta dengan ekstensi XML untuk mengontrol pergerakan mesin pencari di sepanjang bank proyek web Anda. Jelas bahwa bot dapat dan meledak, tetapi kemungkinan besar mereka akan mematuhi instruksi pelatihan dan resep (dalam peta situs) yang kompeten.

Bersih? Kemudian lanjutkan langsung ke solusi masalah, cara membuat suitemap.xml dengan berbagai cara dan bagaimana melaporkan keberadaannya ke dua paus pencarian di Runet - Google dan Yandex sehingga mereka tidak menertawakan proyek Anda dengan sia-sia, menciptakan Semakin banyak dan muatan tambahan pada hosting server Anda, tetapi ini benar, hal yang sangat kecil, hal utama adalah pengindeksan yang tepat (cepat dan komprehensif).

Tidak seperti Robots.txt, yang Anda harus tulis kemungkinan besar, file peta situs dalam formulir XML biasanya mencoba membuat cara otomatis apa pun. Jelas, karena dengan sejumlah besar halaman pada proyek yang sering diperbarui, kreasi manual dapat menyebabkan kerusakan pada pikiran di webmaster.

Ya itu belum tentu, karena Hampir untuk setiap CMS ada ekstensi, yang akan membuat, dan ketika bahan baru muncul dan membuat kembali file sitemap. Nah, atau Anda selalu dapat menggunakan kartu situs generator online (generator) dalam bentuk solusi yang sudah jadi.

Tapi tetap saja, menurut saya, tidak akan berlebihan untuk membiasakan diri dengan itu (jadi apa yang ada untuk berbicara - yang paling sederhana) sintaksis penciptaan sitemap. Selain itu, pada proyek-proyek kecil dan jarang diperbarui, dimungkinkan untuk mencicipi dan secara manual.

Cara membuat sitemap.xml sendiri di Joomla dan WordPress

Biasanya, arahan "Sitemap" diresepkan pada akhirnya. Cari Robot Ketika Anda secara teratur memasukkan proyek Web Anda, pasti untuk melihat konten robots.txt dan unduh untuk mempelajari kartu Anda. Namun, dengan cara ini dapat mempelajari keberadaannya dari segala macam lobak bahwa situs web peta akan membantu menyiksa konten.

Tetapi ada cara lain untuk langsung mentransfer informasi tentang lokasi mesin pencari peta situs tanpa mediasi robots.txt. Ini dilakukan melalui antarmuka Webmaster Yandex dan Google Toolbar, meskipun Anda dapat menggunakannya. Apakah Anda sudah terbiasa dengan alat mesin pencari ini?

Jika tidak, maka pastikan untuk menambahkan proyek dan masuk, dan masuk, dan kemudian tentukan jalur di tab yang sesuai ke peta situs Anda dalam format XML.

Ini terlihat seperti bentuk penambahan sitemap untuk Yandex Webmaster:

Dan terlihat seperti bentuk serupa untuk meresepkan jalur di Google Toolbar:

Generator Peta Situs Online dan XML Sitemaps Generator

Jika Anda tidak berburu, mencari ekstensi untuk CMS Anda, izinkan Anda untuk secara otomatis membuat situs web peta, Anda dapat menggunakan online dalam hal ini oleh generator online. Di sini, bagaimanapun, ada satu kelemahan dibandingkan dengan penciptaan otomatis peta di CMS itu sendiri - setelah menambahkan materi baru, Anda harus pergi ke layanan online lagi dan membuat kembali file ini, dan kemudian mengunduhnya ke server Anda. .

Mungkin salah satu generator peta situs online paling terkenal adalah generator sitemap. Ini memiliki fungsionalitas yang cukup besar dan memungkinkan Anda untuk menghasilkan situs gratis untuk 1.500 halaman yang cukup banyak.

Generator Sitemap akan memperhitungkan isi file robots.txt Anda sehingga Anda tidak masuk ke peta dilarang untuk mengindeks halaman. Dalam dirinya sendiri, itu tidak menakutkan, untuk larangan robots pada setiap akan memiliki prioritas yang lebih besar, tetapi itu akan menghemat Anda dari informasi yang tidak perlu dalam file peta situs yang dibuat. Untuk membuat peta, Anda hanya perlu menentukan URL halaman utama dan melaporkan email Anda, setelah itu Anda akan dalam antrian untuk generasi:

Ketika antrian datang kepada Anda, Anda akan menerima pemberitahuan surat tentang ini dan klik pada tautan dari surat yang akan dapat mengunduh file yang merupakan generator sitemap untuk Anda. Ini hanya akan dibiarkan membuangnya ke tempat yang tepat di server Anda. Nah, dan prosedur seperti itu Anda harus berulang dari waktu ke waktu untuk mempertahankan relevansi peta situs Anda.

Ada generator online layanan bahasa Inggris serupa, yang dapat Anda temukan di tautan ini - peta situs XML. Ini memiliki batasan 500 halaman, dan jika tidak semuanya hampir sama dengan di atas.

Semoga sukses untukmu! Untuk pertemuan ambigu di situs web halaman blog

Anda mungkin tertarik

Apa alamat URL daripada perbedaan antara tautan absolut dan relatif untuk situs
Apa itu Chmod, hak akses untuk menetapkan file dan folder (777, 755, 666) dan bagaimana melakukannya melalui PHP
Cari Yandex di situs dan toko online
OpenServer adalah server lokal modern dan contoh menggunakan WordPress untuk menginstal pada komputer
Bagaimana saya meningkatkan kehadiran di situs hingga 300 orang sehari?

Dalam buku panduan ini, kami akan mempertimbangkan pertanyaan-pertanyaan berikut:

Apa itu Sitemap?

Ini adalah file yang berisi daftar tautan ke semua halaman situs penting. Artinya, dokumen ini mengirim mesin pencari ke konten utama di situs.

Untuk apa yang Anda butuhkan peta situs

Sitemap diperlukan jika situs memiliki masalah dengan pengindeksan yang disebut:
1) sejumlah besar halaman;
2) Kurangnya referensi (internal atau eksternal) pada halaman;
3) Nestestness dalam situs (struktur membingungkan).

Peta situs HTML vs XML

Sitemaps adalah tipe berikut:

  • Html;

Penjelasan paling sederhana tentang perbedaan antara format ini adalah bahwa kartu XML terutama ditujukan untuk mesin pencari, dan HTML adalah untuk pengguna.

HTML-Card. - Ini hanyalah gambaran umum situs, hanya berisi informasi dan halaman yang perlu Anda lihat pengguna. Jika Anda berada di situs dan cari bagian tertentu, ketika Anda pergi ke Sitemap HTML, Anda dapat dengan mudah menemukannya. Terlepas dari kenyataan bahwa kartu situs jenis ini difokuskan pada pengguna, itu juga dapat membantu peringkat Anda di mesin pencari. Ini adalah salah satu bukti bahwa Anda peduli dengan kenyamanan situs untuk pengguna.

Saat menyusun kartu situs HTML, penting untuk dipertimbangkan:

1. Konten terstruktur.

Peta situs harus jelas dan nyaman untuk persepsi pengguna. Diinginkannya termasuk bagian, kategori, subkategori, dll.

2. Tautan Anchorage.

Protokol Kartu XML. Situs ini dirancang untuk robot pencarian. File XML berisi informasi tentang kapan URL terakhir diperbarui, sejauh hal yang penting dan seberapa sering perubahan terjadi.

Biasanya, sitemap terdiri dari tag XML berikut:

Wajib:
- Menentukan standar protokol dan merangkum file ini.
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://obanracer.ru/id/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Подписаться на рассылку

Карта сайта (Sitemap.xml) – это специальный файл в формате.xml, хранящийся в корневой директории сервера. Это файл с информацией о страницах сайта, которые нужно индексировать. Обычно sitemap создают для Яндекса и Гугла, чтобы оповестить поисковых роботов о страницах, которые нужно внести в индекс. Ещё при помощи сайтмапа осуществляется проверка того, как часто происходят обновления, и индексация каких веб-документов является наиболее важной.

Видео из Вебмастерской Яндекса:

Sitemap.xml составляется с учетом специального синтаксиса, понятного поисковым машинам, где будут перечислены все страницы, подлежащие индексации с указанием степени их важности, даты последнего обновления и примерной частоты обновления.

Есть два основных файла, которые должны иметься у любого web-проекта - robots.txt и sitemap.xml . Если у вашего проекта их нет или они заполнены не правильно, то с большой долей вероятности вы сильно вредите своему ресурсу и не позволяете ему раскрыться на все сто процентов.

Влияет ли файл sitemap.xml на продвижение сайта

Если у вас отсутствует sitemap, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Создание sitemap.xml помогает решить эту проблему.

Sitemap.xml влияет на SEO косвенно: облегчая и ускоряя индексацию страниц.

Карта сайта sitemap в формате HTML

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта - это страница сайта , на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей , нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограничения по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, файл sitemap в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта - это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt - это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Карта сайта XML Sitemap

XML карта сайта - это файл формата xml, вида sitemap.xml , который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта:

  • Sitemap xml - это специальный формат карты сайта , который определяется всеми популярными поисковыми системами, например Google и Яндекс.
  • В xml sitemap можно указать до 50.000 ссылок .
  • В sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Содержимое карты сайта – лишь рекомендация для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Как создать правильный sitemap.xml

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Содержимое файла карты сайта sitemap.xml выглядит:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

Di mana tag yang diperlukan berikut digunakan:

  • - Tag induk, semua URL disimpulkan;
  • - Tag, yang menentukan informasi tentang URL tertentu;
  • https://obanracer.ru/id/ - Tag ini menunjukkan langsung URL.
  • - Tag ini mencakup tanggal perubahan halaman terakhir;
  • - Tag digunakan untuk menentukan seberapa sering halaman berubah: selalu, jam, setiap jam, setiap hari, mingguan, monchly, tahunan, tidak pernah;
  • Menentukan prioritas halaman tertentu, relatif terhadap halaman lain dari situs tersebut dari prioritas 0,1 - rendah, hingga 1 - prioritas tinggi.

ChangeFreq menunjukkan frekuensi perubahan halaman:

  1. Perbarui setiap jam adalah setiap jam;
  2. Selalu - selalu diperbarui;
  3. Mingguan - diperbarui seminggu sekali;
  4. Harian - Pembaruan terjadi setiap hari;
  5. Bulanan - Pembaruan terjadi sebulan sekali;
  6. Tahunan - setahun sekali;
  7. Tidak pernah - tidak diperbarui (lebih baik tidak menggunakan nilai ini).

Laporan Prioritas Mesin pencari tentang tingkat pentingnya halaman, dibandingkan dengan orang lain. Prioritas dapat diatur dari 0,1 (rendah) hingga 1 (tinggi).

File sitemap.xml harus berisi indikasi namespace XML:

Xmlns \u003d "http://www.sitemaps.org/schemas/sitemap/0.9"

Jika file peta situs mencakup lebih dari 50 ribu tautan atau ukuran sitemap.xml melebihi 10 MB, disarankan untuk membagi kartu situs menjadi beberapa file. Dalam hal ini, di peta situs Anda perlu menentukan beberapa tautan ke file kartu yang berbeda.

http://site.ru/sitemaps/sitemap01.xml. 2015-10-18T18: 54: 13 + 04: 00 http://site.ru/sitemaps/sitemap02.xml. 2015-10-18T18: 54: 13 + 04: 00

Di sini sudah terbiasa dengan tag AS dan Serta tag wajib:

  • - Tag induk di mana alamat semua kartu situs disimpulkan;
  • - Tag di mana parameter untuk setiap peta situs.

Cara membuat sitemap.xml

Membuat Peta Situs Proses penting di mana Anda perlu menunjukkan halaman situs mana yang perlu diindeks dan bagaimana cara mengindeksnya dengan lebih baik. Tergantung pada jenis peta situs apa pertanyaan, beragam cara untuk Membuat Peta Situs. Cara membuat peta situs HTML untuk membahas secara terpisah tanpa makna. Pertimbangkan cara membuat kartu peta dalam format file XML. Ada beberapa cara dasar untuk membuat peta situs, tetapi semuanya menggabungkan di mana peta situs dan bagaimana file sitemap ditentukan oleh mesin pencari.

Seperti yang sudah ditulis di atas - file peta situs diposting di root situs. Mesin pencari dapat mendeteksi secara independen file peta situs. Tetapi ada beberapa cara untuk menentukan tautan langsung ke file situs untuk lebih banyak deteksi mesin pencari. Cara termudah untuk menentukan lokasi file peta situs adalah arah langsung referensi atau beberapa tautan ke file kartu situs di webmaster dan Google Webmaster. Di sana Anda bisa periksa peta situs, belanjakan analisis peta situs untuk kebenaran, Korespondensi halaman mana dari peta situs ditemukan oleh mesin pencari dan berapa banyak dari mereka dalam pengindeksan.

Cara kedua untuk menentukan mesin pencari untuk menemukan file peta situs adalah sitemap arche dari file robots.txt.

Sitemap: http://site.ru/sitemap.xml

Dalam Robots.txt Anda dapat menentukan beberapa file sitemap, setelah itu akan ditambahkan secara otomatis ke alat untuk webmaster. Cara menemukan peta situs yang kami lihat, kami sekarang beralih ke cara membuat peta situs.

Cara Utama untuk Membuat Peta Situs

  1. Generasi Peta Situs Pasukan Sistem Manajemen Situs, jika CMS memiliki fitur bawaan yang serupa.
  2. Unduh Peta Situs. Dari layanan online pihak ketiga. Ada banyak generator kartu situs online dengan kemampuan dan keterbatasan yang berbeda. Mungkin salah satu generator peta situs online paling terkenal adalah generator sitemap. Ini memiliki fungsionalitas yang cukup besar dan memungkinkan Anda untuk menghasilkan situs gratis untuk 1.500 halaman yang cukup banyak. Masih ada xml-sitemaps.com memiliki kemampuan untuk mengatur pengaturan peta situs, tetapi memiliki batas pada jumlah tautan di file sitemap.xml dalam 500 buah.
  3. Unduh Generator Peta Situs. Program-program tersebut biasanya dibayar, tetapi Anda dapat secara teratur menghasilkan peta Situs XML untuk satu atau lebih situs. Berikut adalah beberapa contoh program generator yang serupa: Sitemap XML Dynamic Sitemap Generator, Wonderwebare Sitemap Generatior.
  4. Pembuatan otomatis kartu situs sitemap Di Joomla (Jumla), WordPress (WordPress), Bitrix (Bitrix), Modx.
  5. Membuat peta situs secara manual.

Sitemap WordPress.

Buat peta situs untuk WordPress akan menggunakan plugin Google XML Sitemaps. Baginya, Anda dapat membuat banyak pengaturan yang akan menghilangkan bagian dari bahan situs Anda, dan Anda juga dapat menetapkan estimasi frekuensi pembaruan. Selain membuat peta, plugin Google XML Sitemaps, ketika menerbitkan materi baru di blog Anda, memberi tahu banyak mesin pencari tentang hal itu, mengundang mereka untuk dengan cepat melakukan indeksasi.

Anda dapat mengatur path ke sitemap file sendiri di pengaturan plugin dan bahkan dapat memberikan nama selain sitemap.xml klasik.

Sitemap Joomla.

Buat peta situs untuk Joomla menggunakan komponen XMAP.

Periksa sitemap pada tautan BIED

Agar tidak menipu Robot pencarian Sitemap.xml harus dikonfigurasi tanpa kesalahan. Oleh karena itu, setelah setiap pembaruan file, Anda perlu memeriksa sitemap pada tautan yang rusak.

Pergi ke Yandex Webmaster - Bagian "Alat" - "Analisis file sitemap".

Pilih salah satu metode unduhan file:

  • salin teks sitmepa.xml;
  • kirim peta situs URL;
  • muat file XML ke layanan.

Sitemap.xml Periksa di Yandex Webmaster

Analisis Sitemap.xml dari PixelPlus

Jika kesalahan ditemukan (sering terjadi), layanan akan memberi tahu Anda URL mana yang diberikan jawaban yang salah (dihapus, ekstra dan sebagainya).

Sitemap.xml - alat penting

Sitemap adalah salah satu alat penting dari promosi SEO situs tersebut. Tidak masalah bagaimana peta situs akan dibuat. Ini penting - tautan apa yang akan terdaftar di peta situs dan seberapa sering akan diperbarui. Kadang-kadang, di peta situs, semuanya diturunkan dan bahkan tautan yang dilarang dalam robots.txt atau tautan non-kanonik. Pembaruan peta situs terjadi sebulan sekali atau kurang. Sikap ini terhadap peta situs mungkin tidak hanya membuatnya tidak berguna, tetapi lebih buruk - untuk membingungkan robot pencarian, yang secara negatif akan mempengaruhi pengindeksan dan posisi situs dalam pencarian.

Buat peta situs untuk sumber daya Anda. Tetapi hati-hati dan berpikir dengan baik apa yang harus dibongkar di sitemap, dan apa yang tidak.