Generați fișierul sitemap. Adăugați un fișier sitemap la Yandex.vebmaster și Consola de căutare Google (nuanțe și erori)

Inițial, m-am gândit să scriu o simplă și ușoară "post-zi post" despre un lucru interesant, pe care l-am observat recent în consola de căutare Google. Se pare că acum în panourile Yandex și Google Webmaster există o verificare automată de eroare în hărțile site-ului XML. Anterior, este amintit, serviciile speciale au fost folosite în astfel de scopuri, dar acum totul a devenit mult mai ușor.

În articol va găsi nu numai descrierea erorilor care pot fi urmărite, am decis, de asemenea, să vă spun suplimentar cum să adăugați un fișier Sitemap către Yandex Webmaster și la consola de căutare Google. Nu voi deschide nimic peste majoritate, dar poate că cineva a ratat acest moment + Novice va veni la îndemână. Conţinut:

  • + Link-uri utile.
  • (inclusiv căutarea de eroare).

1. Creați sitemap XML

Dacă nu există nici o hartă a site-ului în proiectul dvs. web, asigurați-vă că o faceți - acesta este un cip extrem de util (în special în resurse noi). Vreau să menționez că în acest caz vorbim despre un format XML special (pentru motoarele de căutare) și nu despre HTML (vizitatori). Mecanismul de lucru depinde de motorul pe care îl utilizați, aici sunt câteva articole pe această temă:

  • Face (recenzii plugin).
  • - Cuplu de service pentru orice resurse.
  • (inclusiv XML).
  • Cunning Hack Creation Sitemap în blogul Blogspot.

Sitemap: http: // tranziție_omena / sitemap.xml

În general, am întâlnit informații că motoarele de căutare știu în mod independent cum să găsească o hartă a site-ului XML dacă este localizată la o adresă standard, dar, în principiu, este mai bine să îl încărcați în bara de instrumente.

2. Adăugați sitemap la Google (consola de căutare)

Anterior, acest panou a fost numit instrumente de webmasteri Da, și arăta complet diferit. Acum este un instrument mai funcțional. Algoritmul de acțiune este după cum urmează:

  • Înregistrată În consola de căutare (dacă aveți deja un cont Google, acesta va fi, de asemenea, acces la sistem);
  • Conectați-vă proiectul acolo și confirmați drepturile.
  • Pentru a efectua sarcina de a adăuga Harta site-ului XML, accesați secțiunea "Scan" - Fișierele Sitemaps.

Această pagină conține toate informațiile de pe harta site-ului dvs. + Puteți adăuga noi (2) sau vedeți prezența erorilor în curent (3).

La consola de căutare Google sunt acceptate site-ul investit - există un astfel de lucru, de exemplu, în pluginul de la Yoast SEO. Modulul generează adresa: http: //vash_domena/sitemap_index.xml..

Teoretic, puteți adăuga un fișier sitemap la consola de căutare Googe numai unul (principal), iar obiectele rămase se ridică automat. În același timp, pe pagina panoului va fi afișată numai sitemap.xml.Și când faceți clic pe el, veți merge la subsecțiuni.

Apropo, dacă trimiteți separat toate fișierele XML (de bază și paragrafe), atunci numărul total de linkuri este înconjurat:

Probabil, pentru moment în consola nu există un instrument pentru a distinge între repetări sau este doar un astfel de format pentru afișarea unui număr total de înregistrări sau o glitch.

În ceea ce privește erorile din harta site-ului

Dacă există unele probleme cu XML-ul adăugat al site-ului, apoi în panou veți vedea notația corespunzătoare (pictograma marcajului de exclamare și intrarea în coloana "Probleme"). De asemenea, pe pagina unui anumit fișier de hartă a site-ului va fi, de asemenea, avertismente.

În cazul capturilor de ecran, puteți vedea înregistrarea că unele Robots.txt nu permite indexul unor adrese de blog. Astfel de lucruri trebuie corectate și după trimiterea unui fișier pentru a verifica - butonul "Test".

Într-un alt proiect, am avut o situație de rău - harta site-ului a dat: (aceasta este în general nonsens. Și modulul dorit a fost activat și am fost complet sigur că totul funcționează. Am găsit o problemă numai după adăugarea sitemap-ului la panoul webmaster . Prin urmare, această procedură importantă este destul de suficient și durează doar câteva minute.

3. Descărcați sitemap în Yandex

În ceea ce privește dreptul aici, după înregistrare, adăugând un site și confirmați drepturile, trebuie să mergeți la secțiunea "indexare" - fișiere sitemap.

Pagina are cardul de detectare automată de la robots.txt + puteți adăuga fișierele dvs. Panoul acceptă, de asemenea, cuibărit. Dacă ceva nu a mers prost, va fi afișată o înregistrare de eroare. În ecranul de mai sus, problema este legată de imaginea tagului: imagine în care Yandex nu înțelege. În Wordpres există module care elimină această articulație, dar, în principiu, nu afectează în mod deosebit nimic. Eu personal las totul ca este.

Înainte de a adăuga sitemap la Yandex.vebmaster, puteți executa pur și simplu verificarea rapidă. Acest instrument este disponibil în secțiunea "Instrumente" - analiza sitemap.

TOTAL

După cum am spus mai sus, vă sfătuiesc să petreceți 5-10 minute pentru a adăuga un fișier sitemap la Yandex și Google. Dacă proiectul dvs. nu are loc, asigurați-vă că creați. Acest proces, precum și utilizarea, va contribui la îmbunătățirea indexării resurselor și vă va permite, de asemenea, să găsiți erori pe care nu le puteți cunoaște. Există situații diferite, de exemplu, actualizați CMS și ați uitat să conectați modulul hărții site-ului sau el a început independent la Bullure - când site-ul începe să dea 404 de erori, nu este deloc cool.

Postul, desigur, mai mult pentru începători, dar sper că ați venit la îndemână. Dacă aveți ceva de adăugat, scrieți mai jos.

Folosind fișierul Sitemap, puteți să informați Yandex cu privire la structura actuală a site-ului, specificând o directivă specială în robots.txt sau adăugând la Yandex.vebmaster.

Webmaster vă permite să:

Descărcați sitemap.

    Selectați site-ul din listă.

    În câmp, introduceți adresa URL, pe care este disponibilă fișierul. De exemplu, https://example.com/sitemap.xml..

    Faceți clic pe butonul Adăugați.

După adăugarea unui fișier într-o coadă de prelucrare. Robotul îl va încărca în termen de două săptămâni. Fiecare fișier adăugat, inclusiv investit în fișierul Index Sitemap, este procesat separat de un robot.

După descărcarea opusă fiecărui fișier, veți vedea unul dintre statut:

stare Descriere Notă
O.K
"Redirecţiona" Eliminați redirecționarea și informați robotul de actualizare
"Eroare" Fișierul este format greșit Raportați un robot de reînnoire
"Nu indexate"
Interzice. Raportați un robot de reînnoire
stare Descriere Notă
O.K Fișierul este format corect și încărcat în baza de date a robotului

Opusul fișierului afișează data ultimei încărcături.

Paginile indicate vor apărea în rezultatele căutării timp de două săptămâni

"Redirecţiona" URL specificat redirecționează la o altă adresă Eliminați redirecționarea și informați robotul de actualizare
"Eroare" Fișierul este format greșit Faceți clic pe linkul de eroare pentru a afla detaliile. După efectuarea modificărilor în fișier, informați robotul de actualizare
"Nu indexate" Când accesează sitemap, serverul returnează un alt cod HTTP decât 200

Verificați dacă fișierul este disponibil pentru un robot utilizând instrumentul, specificând calea completă către fișier.

Dacă fișierul nu este disponibil, consultați administratorul site-ului sau serverului pe care este localizat.

Accesul la fișiere este interzis în Robots.txt utilizând Directiva privind interzicerea Permiteți accesul la sitemap și informați robotul de actualizare

Actualizați sitemap

Dacă ați modificat fișierul Sitemap adăugat la Yandex.vebmaster, nu este necesar să îl ștergeți și să descărcați din nou - robotul verifică în mod regulat fișierul pentru a actualiza și erorile.

Pentru a accelera un bypass de fișier, faceți clic pe pictograma. Dacă utilizați fișierul Index Sitemap, puteți rula procesarea fiecărui fișier listat în acesta. Robot va descărca date în termen de trei zile. Puteți utiliza funcția de până la 10 ori pentru o gazdă.

Când cheltuiți toate încercările, următorul va fi disponibil la 30 de zile după primul. Data exactă este afișată în interfața Webmaster.



Ștergeți sitemap

În interfața Yandex.vebmaster, puteți șterge acele fișiere care au fost adăugate pe pagina Sitemap Files: Dacă directiva din fișierul robots.txt, scoateți-l pentru sitemap. După efectuarea modificărilor, informațiile despre sitemap vor dispărea de la baza robotului și Yandex.Webmaster timp de câteva săptămâni.

Intrebari si raspunsuri

Sitemap este afișat în serviciu ca o pagină exclusă cu starea "Formatul de document nevalid"

Afișarea fișierului SITEMAP (precum și alte fișiere XML) ca pagini excluse este numai informativă și nu afectează prelucrarea sau prelucrarea site-ului.

Fișierul Sitemap poate fi afișat în grupul de pagini executate, deoarece robotul a încercat să îl indexeze ca pe o pagină obișnuită, în timp ce fișierele format XML nu sunt indexate în motorul de căutare Yandex și nu sunt implicați în rezultatele căutării.

Când procesați sitemap, o eroare "Tag necunoscut"

Fișierul Sitemap poate conține numai anumite elemente XML. Dacă webmasterul detectează alte elemente din fișier (de exemplu, o indicație a unei versiuni mobile sau multilingve, adresa imaginilor), va apărea o eroare de etichetă necunoscută în webmaster. Elementele neacceptate sunt ignorate de un robot la procesarea sitemap-ului, iar datele din elementele acceptate sunt luate în considerare. Prin urmare, fișierul Sitemap este opțional.

Dacă conținutul fișierului va fi modificat, veți avea nevoie de până la două săptămâni pentru a actualiza informațiile din Webmaster.

Fișierul Sitemap este în starea "nu indexat"

Este posibil ca fișierul sitemap să nu fie indexat din mai multe motive:

    Robotul a ocutat recent fișierul Sitemap și nu a avut timp să-l proceseze. Așteptați două săptămâni. Dacă utilizați fișierul index al sitemap cu mai multe fișiere, atunci procesarea acestora poate dura mai mult decât un fișier sitemap.

    Site-ul a fost anterior indisponibil pentru un robot de indexare. Trebuie să așteptați următoarea vizită la site de robotul.

    Accesul la sitemap este interzis în fișier.

Bună ziua, Stimate site-ul de cititoare blog. Am decis să rezumă într-un singur articol tot ce am scris deja despre harta site-ului (sitemap XML), care este nevoie în primul rând pentru a specifica sistemele de căutare ale acelor pagini pe care ar trebui să le fie în primul rând. Este foarte important și practic atributul obligatoriu al oricărui proiect web, dar multe dintre acestea nu știu sau nu dau harta site-ului de mare importanță.

Imediat, să punem toate punctele peste "i" și să încerc să separam două concepte - hărți site-uri în format XML și în format HTML (există, de asemenea, interpretarea geografică a acestui cuvânt pe care am scris-o despre articolul ""). A doua opțiune este lista obișnuită a tuturor materialelor web ale resursei, care va fi disponibilă oricui dorește să apese la elementul de meniu corespunzător. Această opțiune este, de asemenea, utilă și contribuie la accelerarea și îmbunătățirea indexării resurselor dvs. de către motoarele de căutare.

Harta site-ului Harta site-ului în format XML - și am nevoie de ea

Dar instrumentul principal destinat specificării directă a motoarelor de căutare ale acelor pagini de resurse care va trebui să fie indexate este fișierul numit sitemap.xml (acesta este cel mai frecvent nume, dar în ideea de a se putea numi ca și cum ar fi Nu este important), care nu vor fi vizitatori sunt vizibili vizitatorilor.

Se întocmește ținând cont de sintaxa specială care înțelege motoarele de căutare în care toate paginile vor fi enumerate pentru a fi indexate, indicând gradul de importanță, ultimele date de actualizare și frecvența aproximativă a actualizării.

Există două fișiere principale care ar trebui să fie disponibile din orice proiect web - robots.txt și sitemap.xml.. Dacă proiectul dvs. nu are sau nu sunt completate corect, atunci cu o mulțime de probabilitate, vă rătăciți cu tărie resursa dvs. și nu îi permiteți să dezvăluie o sută la sută.

S-ar putea, bineînțeles, să nu mă ascultați (pentru că nu am autoritate, în virtutea materialului real acumulat), dar cred că cu specialiștii care au statistici cu zeci de mii de proiecte în mână, nu veți avea argumentează.

În acest caz, mi-am găsit cvasperul "pian în tufișuri". În mod direct înainte de a scrie acest articol, publicarea specialiștilor din sistemul binecunoscut de avansare automată sub denumirea neobișnuită "mână" (acesta este un analog al lui Megaindex, pe care l-am scris).

Este clar că cineva similar este interesat să se asigure că proiectele clienților au fost promovate cu succes, dar pot pompa doar resursele clienților cu masa de referință și, din păcate, nu pot afecta conținutul și setarea tehnică corectă a site-urilor.

Prin urmare, a fost efectuat un studiu foarte interesant și orientativ, care intenționa să identifice cele mai populare motive care fac dificilă promovarea proiectelor și de a face aceste date direct în ...

În primul rând, desigur, a fost "un conținut unic" (sau ați îmblătit sau aveți că esența nu se schimbă). Dar, pe locul al doilea, a fost exact harta site-ului în format XML și, mai exact, absența sau inconsecvența formatului recunoscut al creației. Ei bine, în locul al treilea a fost roboturile de fișiere menționate anterior (absența sau creația necorespunzătoare):

Atunci când nu este clar că cardul ar trebui să fie la proiectul dvs. în mod necesar (altfel Kirdyk), nu pare atât de convingător, ca în cazul consolidării acestei aprobări, fapte reale dintr-un studiu mai degrabă reprezentativ.

Bine, presupunem că v-am convins și să vedem cum puteți crea o sitmap (formatat de formatare), cum să o faceți pentru Joomla și WordPress, precum și să vedem cum o poate crea cu ajutorul generatoarelor online speciale (generator ).

Dar creați doar sitemap-ul nu este suficient pentru a fi încrezător în indexarea corectă a proiectului dvs. de către motoarele de căutare. Se va face în continuare astfel încât motoarele de căutare să afle despre acest site foarte hartă (în cazul nostru este Google și Yandex). Acest lucru se poate face în două moduri, dar vom vorbi puțin mai târziu (trebuie să existe cel puțin o intrigă care deține atenția cititorilor).

De ce aveți nevoie de un site de hartă și fișierul robots.txt

Să încercăm mai întâi să fundamenți nevoia logică de a utiliza atât fișierul robots.txt care interzice indexarea anumitor elemente din proiectul dvs. web și fișierul site-ului web care prescrie indexarea anumitor pagini. Pentru a face acest lucru, înapoi pe tocuri acum zece ani, atunci când majoritatea resurselor de pe Internet au fost pur și simplu un set de fișiere HTML, în care textele tuturor articolelor conțin.

Robotul de căutare al Google sau Yandex a mers pur și simplu la un astfel de proiect HTML și a început să indice tot ceea ce vine la mâna lui, deoarece aproape pretutindeni conțineau conținutul proiectului. Și ce se întâmplă acum, în condițiile CMS (sisteme de gestionare a conținutului)? De fapt, chiar imediat după instalarea motorului, robotul de căutare va detecta deja că aveți câteva mii de fișiere și acest lucru este în ciuda faptului că nu puteți fi încă niciun conținut (bine, nu ați scris încă niciun articol).

Da, și, în general, conținutul din CMS modern este de obicei stocat în fișiere, dar în baza de date că robotul de căutare indici direct, în mod natural, nu va putea să lucreze cu bazele gratuite).

Este clar că am schimbat aici, căutarea Robots Yandex și Google va găsi în continuare conținutul dvs. și va indexa, dar cât de repede se va întâmpla și cât de completă va indexa indexarea Proiectul dvs. este o întrebare foarte mare.

Acesta este tocmai pentru simplificarea și accelerarea indexării proiectului de către motoarele de căutare în condițiile CMS de utilizat și ar trebui să fie obligatorii pentru a crea robots.txt și sitmap.xml. Cu ajutorul primului fișier, vă sugerați motoarele de căutare să indexeze ce fișiere nu ar trebui să-și petreacă timpul (de exemplu, obiecte motor), precum și să o utilizați, puteți închide de la indexare și parte a paginilor pentru a elimina efectul duplicării de conținut care inerent în multe CMS (citiți despre el citiți mai mult în articolul Articol Pro).

Și cu ajutorul fișierului Sitemap, vă spun în mod clar și în mod clar roboții lui Yandex și Google, pe care este în proiectul dvs. care conține conținut, astfel încât acestea să nu se tragă în colțurile economiei de fișiere utilizate. Nu uitați că roboții au anumite limite pentru timpul și numărul de documente vizualizate. Se teme de fișierele și frunzele motorului, iar conținutul va rămâne indexat pentru o lungă perioadă de timp. Despre modul în care.

Amintiți-vă cum un caracter colorat a vorbit într-o comedie faimoasă: "Nu mergeți acolo, mergeți aici și apoi ...". Aceasta este funcția acestui caracter și a efectua robots.txt și site-ul web al hărții cu extensia XML pentru a controla mișcările motoarelor de căutare de-a lungul malurilor proiectului dvs. web. Este clar că roboții pot și explodează, dar cel mai probabil vor respecta interzicerea și prescrierea dvs. competentă (în harta site-ului).

Clar? Apoi procedați direct la soluționarea problemei, cum să creați Suitemap.xml în diferite moduri și cum să raportați existența acesteia la două balene de căutare în RUTnet - Google și Yandex, astfel încât să nu râdă de proiectul dvs. atât de mult în zadar, creând Mai mult și încărcarea suplimentară pe serverul dvs. Hosting, dar acest lucru este adevărat, un lucru extrem de minor, principalul lucru este de indexare precis (rapid și cuprinzător).

Spre deosebire de Robots.txt, pe care va trebui să scrieți cel mai probabil, fișierul Harta site-ului din formularul XML este de obicei încercând să creeze orice mod automat. Este clar, deoarece cu un număr mare de pagini dintr-un proiect frecvent actualizat, crearea manuală poate duce la deteriorarea minții la webmaster.

Da nu este neapărat, pentru că Aproape pentru fiecare CMS există o extensie, care va crea și când apar materiale noi și re-creați un fișier sitemap. Ei bine, sau puteți utiliza întotdeauna orice carduri de tip Generator Online (generator) sub forma unei soluții gata făcute.

Dar totuși, mi se pare că nu va fi superfluă să vă familiarizați cu el (deci ce să spuneți - cea mai simplă) sintaxă a creației sitemap-ului. În plus, pe proiecte mici și rareori actualizate, este posibil să o eșantitați și manual.

Cum se creează un sitemap.xml în Joomla și WordPress

De obicei, directiva "Sitemap" este prescrisă la sfârșit. Căutați roboții atunci când introduceți în mod regulat proiectul dvs. web, este sigur că va vizualiza conținutul Robots.txt și descărcați pentru a vă studia cardul. Cu toate acestea, în acest mod poate învăța despre existența de tot felul de ridichi pe care site-ul web al hărții va ajuta la chinul conținutului.

Dar există o altă modalitate de a transfera direct informațiile despre locația motoarelor de căutare a hărții site-ului fără medierea robots.txt. Se face prin interfața Yandex Webmaster și prin bara de instrumente Google, deși puteți utiliza. Sunteți deja familiarizat cu aceste instrumente motoarele de căutare?

Dacă nu, atunci asigurați-vă că adăugați proiectul și în, și apoi specificați calea în filele corespunzătoare pe harta site-ului în format XML.

Acest lucru arată ca o formă de adăugare a site-ului pentru webmasterii Yandex:

Și așa arată ca o formă similară pentru a prescrie calea în bara de instrumente Google:

Generator online de sitemap și generatoare XML Sitemaps

Dacă nu vânați, căutați extensiile pentru CMS, vă permite să creați automat un site web al hărții, puteți utiliza online în acest caz de generatoare online. Aici, însă, există un dezavantaj în comparație cu crearea automată a unei hărți în CMS în sine - după adăugarea de noi materiale, va trebui să mergeți din nou la serviciul online și să re-creați acest fișier, apoi să îl descărcați pe serverul dvs. .

Probabil una dintre cele mai renumite generatoare de hartă a site-ului este un generator de sitemap. Are o funcționalitate destul de mare și vă permite să generați un site gratuit pentru 1.500 de pagini care sunt destul de multe.

Sitemap Generator va lua în considerare conținutul fișierului robots.txt, astfel încât să nu intrați în harta interzisă indexarea paginii. În sine, nu este înfricoșător, că interzicerea în robotse pe orice va avea o prioritate mai mare, dar vă va salva de la informații inutile în fișierul Harta site-ului creat. Pentru a face o hartă, trebuie doar să specificați adresa URL a paginii principale și să raportați e-mailul dvs., după care veți fi într-o coadă de generație:

Când coada vine la dvs., veți primi o notificare de corespondență despre acest lucru și faceți clic pe linkul de la literă va fi capabil să descărcați fișierul pe care sitemap-ul pentru dvs. Acesta va fi lăsat doar să îl aruncați în locul potrivit de pe serverul dvs. Ei bine, și o astfel de procedură trebuie să repetați din când în când pentru a menține relevanța hărții site-ului dvs.

Există un generat de servicii online similare în limba engleză, pe care le puteți găsi pe acest link - XML \u200b\u200bSitemaps. Are o limitare de 500 de pagini și altfel totul este aproape la fel ca în cele de mai sus.

Multă baftă! La întâlnirile ambigue pe site-ul web al blogului

S-ar putea să fiți interesat

Care sunt adresele URL decât diferența dintre legăturile absolute și relative pentru site-ul
Ceea ce este chmod, care accesează drepturile de atribuire a fișierelor și a dosarelor (777, 755, 666) și cum să facă prin PHP
Căutați Yandex pe site și magazin online
OpenServer este un server local modern și un exemplu de utilizare a WordPress pentru a instala pe un computer
Cum am crescut frecvența pe site până la 300 de persoane pe zi?

În acest ghid, vom lua în considerare următoarele întrebări:

Ce este sitemap?

Acesta este un fișier care conține o listă de linkuri către toate paginile importante ale site-ului. Adică, acest document trimite motoarele de căutare la conținutul principal de pe site.

Pentru ceea ce aveți nevoie de o hartă a site-ului

Sitemap este necesar dacă site-ul are probleme cu indexarea numită:
1) un număr mare de pagini;
2) lipsa de referințe (interne sau externe) pe pagini;
3) Nsteditate profundă pe site (structură confuză).

HTML vs Harta site-ului XML

Sitemap-urile sunt următoarele tipuri:

  • HTML;

Cea mai simplă explicație a diferenței dintre aceste formate este că cardul XML este destinat în primul rând pentru motoarele de căutare, iar HTML este destinat utilizatorilor.

HTML-Card. - Aceasta este doar o imagine de ansamblu generală a site-ului, conține numai informații și pagini de care aveți nevoie pentru a vedea utilizatorii. Dacă sunteți pe site și căutați o secțiune specifică, atunci când mergeți la sitemap html, îl puteți găsi cu ușurință. În ciuda faptului că acest tip de carduri de site se concentrează asupra utilizatorului, vă poate ajuta și clasamentul în motoarele de căutare. Aceasta este una dintre dovezile pe care le aveți grijă de confortul site-ului pentru utilizator.

La întocmirea unei cartele HTML a site-ului, este important să luați în considerare:

1. Conținut structurat.

Harta site-ului trebuie să fie clară și convenabilă pentru percepția utilizatorului. Este de dorit ca acesta să includă secțiuni, categorii, subcategorii etc.

2. Link-uri de ancorare.

Protocol Carduri XML. Site-ul este proiectat pentru roboții de căutare. Fișierul XML conține informații despre momentul actualizării URL, cât mai importantă și cât de des apar schimbări.

De obicei, sitemap constă din următoarele etichete XML:

Obligatoriu:
- Determină standardul protocolului și încapsulează acest fișier.
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://obanracer.ru/ro/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Подписаться на рассылку

Карта сайта (Sitemap.xml) – это специальный файл в формате.xml, хранящийся в корневой директории сервера. Это файл с информацией о страницах сайта, которые нужно индексировать. Обычно sitemap создают для Яндекса и Гугла, чтобы оповестить поисковых роботов о страницах, которые нужно внести в индекс. Ещё при помощи сайтмапа осуществляется проверка того, как часто происходят обновления, и индексация каких веб-документов является наиболее важной.

Видео из Вебмастерской Яндекса:

Sitemap.xml составляется с учетом специального синтаксиса, понятного поисковым машинам, где будут перечислены все страницы, подлежащие индексации с указанием степени их важности, даты последнего обновления и примерной частоты обновления.

Есть два основных файла, которые должны иметься у любого web-проекта - robots.txt и sitemap.xml . Если у вашего проекта их нет или они заполнены не правильно, то с большой долей вероятности вы сильно вредите своему ресурсу и не позволяете ему раскрыться на все сто процентов.

Влияет ли файл sitemap.xml на продвижение сайта

Если у вас отсутствует sitemap, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Создание sitemap.xml помогает решить эту проблему.

Sitemap.xml влияет на SEO косвенно: облегчая и ускоряя индексацию страниц.

Карта сайта sitemap в формате HTML

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта - это страница сайта , на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей , нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограничения по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, файл sitemap в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта - это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt - это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Карта сайта XML Sitemap

XML карта сайта - это файл формата xml, вида sitemap.xml , который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта:

  • Sitemap xml - это специальный формат карты сайта , который определяется всеми популярными поисковыми системами, например Google и Яндекс.
  • В xml sitemap можно указать до 50.000 ссылок .
  • В sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Содержимое карты сайта – лишь рекомендация для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Как создать правильный sitemap.xml

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Содержимое файла карты сайта sitemap.xml выглядит:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

În cazul în care se utilizează următoarele etichete necesare:

  • - eticheta părinte, toate adresele URL sunt încheiate;
  • - eticheta, care specifică informații despre o anumită adresă URL;
  • https://obanracer.ru/ro/ - Această etichetă indică direct URL-ul.
  • - această etichetă cuprinde data ultimei schimbări de pagină;
  • - Eticheta este utilizată pentru a specifica cât de des se schimbă pagina: întotdeauna, pe oră, zilnic, săptămânal, monschly, anual, niciodată;
  • Specifică prioritatea unei pagini specifice, față de alte pagini ale site-ului de la 0,1 - prioritate scăzută, până la 1 - prioritate ridicată.

SchimbareFreq indică frecvența de schimbare a paginii:

  1. Actualizarea orară este orară;
  2. Întotdeauna - întotdeauna actualizat;
  3. Săptămânal - actualizat o dată pe săptămână;
  4. Actualizările zilnice apar zilnic;
  5. Actualizările lunare apar o dată pe lună;
  6. Anual - o dată pe an;
  7. Niciodată - nu este actualizat (este mai bine să nu utilizați această valoare).

Rapoartele prioritare Motoarele de căutare cu privire la gradul de importanță a paginii, comparativ cu ceilalți. Prioritatea poate fi setată de la 0,1 (scăzut) la 1 (înălțime).

Fișierul Sitemap.xml trebuie să conțină o indicație a spațiului de nume XML:

Xmlns \u003d "http://www.sitemaps.org/schemas/sitemap/0.9"

Dacă fișierul hărții site-ului include mai mult de 50 de mii de link-uri sau sitemap.xml dimensiune depășește 10 MB, este recomandat să împărțiți cardul site-ului în mai multe fișiere. În acest caz, în harta site-ului trebuie să specificați mai multe linkuri către diferite fișiere de carduri.

http://site.ru/sitemaps/sitemap01.xml. 2015-10-18t18: 54: 13 + 04: 00 http://site.ru/sitemaps/sitemap02.xml. 2015-10-18t18: 54: 13 + 04: 00

Aici sunt deja familiarizate cu etichetele SUA și precum și etichete obligatorii:

  • - eticheta părinte în care se încheie adresele tuturor cardurilor site-ului;
  • - Eticheta în care parametrii sunt pentru fiecare hartă a site-ului.

Cum se creează sitemap.xml

Crearea unei harta site-ului Un proces important în care trebuie să indicați în mod clar ce pagini de site trebuie să fie indexate și cum să le indexați mai bine. În funcție de tipul de hartă a site-ului este o întrebare, diverse modalități de a crea o hartă a site-ului. Cum se creează o hartă a site-ului HTML pentru a discuta separat nici un sens. Luați în considerare modul de efectuare a unei cartele de hartă în formatul fișierului XML. Există mai multe modalități de bază de a crea o hartă a site-ului, dar toate combină în cazul în care harta site-ului este și modul în care fișierul sitemap este determinat de motoarele de căutare.

După cum sa scris deja mai sus - fișierul hărții site-ului postat la rădăcina site-ului. Motoarele de căutare sunt capabile să detecteze independent fișierul hărții site-ului. Dar există mai multe modalități de a specifica o legătură directă cu fișierul (fișierele) site-uri) pentru detectarea mai multor motoare de căutare. Cea mai ușoară modalitate de a specifica locația fișierului hărții site-ului este direcția directă de referință sau mai multe link-uri către fișierele de pe site-ul de pe site-ul webmasterilor și Webmasterii Google. Acolo puteți verificați harta site-ului, petrece analiza hărții site-ului pentru corectitudine, Corespondența căreia paginile de pe harta site-ului sunt găsite de motorul de căutare și câte dintre ele sunt în indexare.

A doua modalitate de a specifica motoarele de căutare pentru a localiza fișierul hărți a site-ului este Directiva Sitemap a fișierului Robots.txt.

Sitemap: http://site.ru/sitemap.xml.

În robots.txt puteți specifica mai multe fișiere sitemap, după care va fi automat adăugat la instrumentele pentru webmasteri. Cum să găsiți o hartă a site-ului pe care am participat-o, acum ne întoarcem la modul de a crea o hartă a site-ului.

Modalități principale de a crea o hartă a site-ului

  1. Generarea hărții site-ului Forțele sistemului de management al site-ului, dacă CMS are o caracteristică similară încorporată.
  2. Descărcați harta site-ului. De la serviciul online de la terți. Există multe generatoare de carduri online cu capabilități și limitări diferite. Probabil una dintre cele mai renumite generatoare de hartă a site-ului este un generator de sitemap. Are o funcționalitate destul de mare și vă permite să generați un site gratuit pentru 1.500 de pagini care sunt destul de multe. Există încă XML-Sitemaps.com are capacitatea de a configura setările hărții site-ului, dar are o limită a numărului de linkuri din fișierul Sitemap.xml în 500 de bucăți.
  3. Descărcați generatorul hărții site-ului. Astfel de programe sunt de obicei plătite, dar puteți genera în mod regulat sitemap XML pentru unul sau mai multe site-uri. Iată câteva exemple de programe similare de generare: Sitemap XML Dynamic Sitemap Generator, WebWebware Sitemap Generatic.
  4. Crearea automată a cardului site-ului sitemap În Joomla (Jumla), WordPress (WordPress), Bitrix (Bitrix), MODX.
  5. Crearea manuală a unei hartă a site-ului.

Sitemap wordpress.

Creați o hartă a site-ului pentru WordPress va utiliza pluginul Google XML Sitemaps. Pentru ea, puteți face o mulțime de setări care vor elimina o parte din materialele site-ului dvs. și puteți seta, de asemenea, o frecvență de actualizare estimată. În plus față de crearea unei hărți, pluginul Google XML Sitemaps, la publicarea de materiale noi pe blogul dvs., notifică numeroase motoare de căutare, invitându-le să efectueze rapid indexarea.

Puteți seta calea către site-ul de fișier în setările pluginului și puteți chiar să-i dați un alt nume decât Sitemap.XML clasic.

Sitemap Joomla.

Creați o hartă a site-ului pentru Joomla utilizând componenta XMAP.

Verificați sitemap pe link-uri BIED

Pentru a nu înșelarea căutării Robot Harta site-ului trebuie să fie configurat fără erori. Prin urmare, după fiecare actualizare a fișierelor, trebuie să verificați site-ul de pe linkurile întrerupte.

Mergeți la Yandex Webmaster - secțiunea "Instrumente" - "Analiza fișierelor sitemap".

Selectați unul dintre metodele de descărcare a fișierelor:

  • copiați textul Sitmepa.xml;
  • trimiteți harta site-ului URL;
  • Încărcați fișierul XML la serviciu.

Sitemap.xml Check in Yandex Webmaster

Analiza sitemap.xml de la pixelplus

Dacă se găsesc erori (se întâmplă adesea), serviciul vă va spune ce adrese URL au un răspuns incorect (șters, extra și așa mai departe).

Sitemap.xml - instrument important

Sitemap este unul dintre instrumentele importante ale SEO-Promotion a site-ului. Nu contează cum va fi creată harta site-ului. Este important - ce linkuri vor fi listate pe harta site-ului și cât de des va fi actualizat. Uneori, pe harta site-ului, totul este descărcat și chiar acele linkuri care sunt interzise în legături robots.txt sau non-canonice. O actualizare a hărții a site-ului are loc o dată pe lună sau mai puțin. Această atitudine față de harta site-ului nu poate face doar inutil, dar mai rău - pentru a confunda robotul de căutare, care va afecta negativ indexarea și pozițiile site-ului în căutare.

Creați o hartă a site-ului pentru resursa dvs. Dar fiți atenți și gândiți-vă bine ce descărcați în sitemap și ce nu este.