Looge saidiplaani fail. Saidiplaani faili lisamine Yandex.Webmasterisse ja Google'i otsingukonsooli (nüansid ja vead)

Algselt mõtlesin kirjutada lihtsa ja lihtsa "nädalavahetuse postituse" ühest huvitavast asjast, mida hiljuti Google'is märkasin. Otsingukonsool. Nüüd selgub, et Yandexi ja Google'i veebihalduri paneelides on see olemas automaatne kontroll vead XML-saidiplaanides. Varem, mäletan, kasutati sellistel eesmärkidel eriteenuseid, kuid nüüd on kõik muutunud palju lihtsamaks.

Artiklist leiate mitte ainult nende abiga jälgitavate vigade kirjelduse, vaid otsustasin lisaks rääkida ka saidiplaanifaili lisamisest Yandex Webmasterisse ja Google'i otsingukonsooli. Ma ei avalda midagi peale suurejoonelise, kuid võib-olla jäi kellelgi see hetk kahe silma vahele + see tuleb algajatele kasuks. Sisu:

  • + kasulikud lingid.
  • (kaasa arvatud vigade otsimine).

1. Looge XML-saidiplaan

Kui teie veebiprojektil pole veel saidikaarti, tehke see kindlasti - see on äärmiselt oluline kasulik funktsioon juures (eriti uutes ressurssides). Tahan märkida, et sisse sel juhul me räägime spetsiaalsest XML-vormingust (otsingumootoritele), mitte HTML-ist (külastajate jaoks). Töömehhanism sõltub teie kasutatavast mootorist, siin on mõned selleteemalised artiklid:

  • Doing (plugina ülevaated).
  • - paar teenust mis tahes ressursside jaoks.
  • (kaasa arvatud kaalutud ja XML).
  • Keeruline häkkimine saidiplaani loomiseks Blogspoti ajaveebis.

Saidiplaan: http://domain_name/sitemap.xml

Üldiselt kohtasin teavet, et otsingumootorid nad saavad iseseisvalt leida XML-saidiplaani, kui see asub standardaadressil, kuid põhimõtteliselt on parem see tööriistaribale laadida.

2. Lisage saidiplaan Google'i (otsingukonsool)

Varem kandis see pesa nime Webmasters Tools ja see nägi välja hoopis teistsugune. Nüüd on see funktsionaalsem tööriist. Toimingute algoritm on järgmine:

  • Registreeri otsingukonsoolis (kui teil on juba Google'i konto, siis on teil ka juurdepääs süsteemile);
  • Ühendage oma projekt seal ja kinnitage õigused.
  • Saidiplaani XML-i lisamise ülesande lõpuleviimiseks minge jaotisse "Indekseerimine" - "Saidiplaani failid".

See leht sisaldab kogu teavet teie saidiplaani kohta + saate lisada uue (2) või vaadata, kas praegustes on vigu (3).

Pesastatud saidiplaanid on toetatud Google'i otsingukonsoolis – selline asi on olemas näiteks Yoast SEO pistikprogrammis. Moodul genereerib aadressi: http://your_domain/sitemap_index.xml.

Teoreetiliselt saate Googe Search Console'i ​​lisada ainult ühe saidiplaani faili (peamise) ja ülejäänud objektid võetakse automaatselt üles. Sel juhul kuvatakse ainult paneeli leht sitemap.xml, ja kui klõpsate sellel, liigute alajaotistesse.

Muide, kui laadite kõik XML-failid (põhi- ja alapunktid) eraldi, lisatakse linkide koguarv:

Tõenäoliselt pole konsoolis siiani ühtegi vahendit, mis korduste vahel vahet teeks, või on see lihtsalt selline formaat kirjete koguarvu kuvamiseks või tõrge.

Seoses saidiplaani vigadega

Kui lisatud saidiplaani XML-iga on probleeme, näete paneelil vastavaid sümboleid (hüüumärgi ikoon ja kirje veerus "Probleemid"). Lisaks on konkreetse saidiplaani faili lehel ka hoiatused.

Ekraanipildil näete kirjet, et mõni faili robots.txt reegel ei luba mõnda ajaveebi aadressi indekseerida. Sellised asjad tuleb parandada ja seejärel saata fail uuesti kontrollimiseks - nupp "Testi".

Ühes teises projektis puutusin kokku hullema olukorraga - saidi kaart andis ära: (See on üldiselt jama. Ja soovitud moodul aktiveeriti ja olin täiesti kindel, et kõik töötab. Leidsin probleemi alles pärast seda, kui lisasin saidiplaani veebihalduri paneelile. Sellepärast seda protseduuri piisavalt oluline ja võtab vaid paar minutit.

3. Laadige saidikaart Yandexi üles

Mis puudutab siin, siis pärast registreerumist, saidi lisamist ja selle õiguste kinnitamist peate minema jaotisesse "Indekseerimine" - "Saidiplaani failid".

Lehel on automaatne kaardituvastus failist Robots.txt + saate oma faile lisada. Paneel toetab ka pesastamist. Kui midagi läks valesti, kuvatakse veateade. Ülaltoodud ekraanipildil on probleemid seotud sildiga image:image in , mida Yandex ei mõista. Wordpresis on moodulid, mis selle lengi kõrvaldavad, kuid põhimõtteliselt ei mõjuta see midagi. Mina isiklikult jätan kõik nii nagu on.

Enne saidiplaani lisamist Yandex.Webmasterisse saate seda lihtsalt kiiresti kontrollida. See tööriist on saadaval jaotises "Tööriistad" - "Saidiplaani analüüs".

Kokku

Nagu ma eespool ütlesin, soovitan teil kulutada 5–10 minutit saidiplaani faili lisamiseks Yandexi ja Google'i. Kui teie projektil seda veel pole, looge see kindlasti. See protsess samuti aitab kasutamine parandada ressursi indekseerimist ja võimaldab teil leida ka vigu, millest te ei pruugi teada. Olukorrad on erinevad, näiteks uuendasid CMS-i ja unustasid saidiplaani mooduli ühendada või hakkas see iseenesest tõrkuma - kui Sitemap hakkab 404 viga andma, pole see üldse lahe.

Postitus on muidugi rohkem algajatele, aga loodan, et sellest oli ka teile kasu. Kui teil on midagi lisada, kirjutage allpool.

Saidiplaani faili kasutades saate Yandexi teavitada saidi praegusest struktuurist, määrates failis robots.txt spetsiaalse direktiivi või lisades selle Yandex.Webmasterisse.

Veebihaldur lubab:

Saidiplaani laadimine

    Valige loendist sait.

    Sisestage väljale URL, kus fail on saadaval. Näiteks, https://example.com/sitemap.xml.

    Klõpsake nuppu Lisa.

Pärast lisamist pannakse fail töötlemise järjekorda. Robot laadib selle alla kahe nädala jooksul. Robot töötleb iga lisatud faili, sealhulgas saidiplaani registrifailile lisatud faili, eraldi.

Pärast üleslaadimist näete iga faili kõrval ühte olekutest:

Olek Kirjeldus Märge
Okei
"Ümbersuunamine" Kustutage ümbersuunamine ja teavitage robotit uuendusest
"Viga" Fail ei ole hästi vormistatud teavitage robotit uuendusest
"Pole indekseeritud"
Keela teavitage robotit uuendusest
Olek Kirjeldus Märge
Okei Fail moodustatakse õigesti ja laaditakse üles roboti andmebaasi

Faili kõrval kuvatakse viimase üleslaadimise kuupäev.

Indekseeritud lehed ilmuvad otsingutulemustes kahe nädala jooksul

"Ümbersuunamine" Määratud URL suunab ümber teisele aadressile Kustutage ümbersuunamine ja teavitage robotit uuendusest
"Viga" Fail ei ole hästi vormistatud Üksikasjade vaatamiseks klõpsake lingil Viga. Pärast failis muudatuste tegemist teavitage robotit uuendusest
"Pole indekseeritud" Saidiplaanile juurdepääsul tagastab server HTTP-koodi, mis ei ole 200

Kontrollige, kas fail on tööriista abil robotile kättesaadav, määrates faili täieliku tee.

Kui fail pole saadaval, võtke ühendust selle saidi või serveri administraatoriga, kus see asub.

Juurdepääs failile on failis robots.txt keelatud käsuga Disallow Lubage juurdepääs saidiplaanile ja paluge robotil värskendada

Saidiplaani värskendus

Kui olete Yandex.Webmasterisse lisatud saidiplaani faili muutnud, ei pea te seda kustutama ja uuesti üles laadima – robot kontrollib regulaarselt faili värskenduste ja vigade suhtes.

Failidest möödaviimise kiirendamiseks klõpsake ikooni. Kui kasutate saidiplaani registrifaili, saate alustada iga selles loetletud faili töötlemist. Robot laadib andmed alla kolme päeva jooksul. Saate funktsiooni ühe hosti jaoks kasutada kuni 10 korda.

Kui olete kõik katsed ära kasutanud, on järgmine saadaval 30 päeva pärast esimest. Täpne kuupäev kuvatakse veebihalduri liideses.



Saidiplaani eemaldamine

Yandex.Webmasteri liideses saate saidiplaanifailide lehele lisatud failid kustutada: Kui failis robots.txt saidiplaanile lisati käsk, kustutage see. Pärast muudatuste tegemist kaob saidiplaani teave mõne nädala jooksul roboti ja Yandex.Webmasteri andmebaasist.

Küsimused ja vastused

Saidikaart kuvatakse teenuses välistatud leheküljena olekuga "Vigane dokumendivorming"

Saidiplaani (nagu ka muude XML-failide) kuvamine välistatud lehtedena on ainult informatiivsel eesmärgil ja see ei mõjuta mingil viisil saidi indekseerimist ega saidiplaani töötlemist.

Saidiplaani faili saab kuvada välistatud lehtede rühmas, kuna robot püüdis seda indekseerida nagu tavalist lehte, samas kui XML-vormingus faile Yandexi otsingumootoris ei indekseerita ja neid ei kaasata otsingutulemustesse.

Saidiplaani töötlemisel ilmnes viga "Tundmatu silt".

Saidiplaani fail võib sisaldada ainult teatud XML-elemente. Kui Webmaster tuvastab failis muid elemente (nt mobiili- või mitmekeelse versiooni märge, piltide aadressid), kuvatakse veebihaldurile tõrketeade Tundmatu silt. Robot ignoreerib saidiplaani töötlemisel toetamata elemente, samal ajal kui toetatud elementide andmeid võetakse arvesse. Seetõttu pole saidiplaani faili vaja muuta.

Kui faili sisu muutub, kulub teabe uuendamiseks Webmasteris kuni kaks nädalat.

Saidiplaani faili olek on "Pole indekseeritud"

Saidiplaani faili ei pruugita indekseerida mitmel põhjusel.

    Robot roomas hiljuti saidiplaani ega ole seda veel töötlenud. Oodake kaks nädalat. Kui kasutate mitme failiga saidiplaani registrifaili, võib nende töötlemine võtta kauem aega kui ühe saidiplaani faili puhul.

    See sait oli varem indekseerimisrobotile ligipääsmatu. Peab ootama järgmist roboti külastust objektile.

    Saidikaardile juurdepääs on failis keelatud

Tere, kallid ajaveebisaidi lugejad. Otsustasin ühes artiklis kokku võtta kõik, mida juba kirjutasin saidiplaani (Sitemap xml) kohta, mis on eelkõige vajalik selleks, et anda otsingumootoritele märku nendest lehtedest, mida nad peaksid esmalt indekseerima. See on iga veebiprojekti väga oluline ja tegelikult kohustuslik atribuut, kuid paljud inimesed kas ei tea seda või ei omista saidikaardile erilist tähtsust.

Tähistame kohe tähega "i" ja proovime eraldada kaks mõistet – saidiplaanid xml-vormingus ja HTML-vormingus (sellele sõnale on olemas ka geograafiline tõlgendus, millest kirjutasin artiklis ""). Teine võimalus on kõigi veebiressursside materjalide tavaline loend, mis on kõigile kättesaadav, klõpsates vastaval menüüelemendil. See valik on samuti kasulik ja aitab kiirendada ja parandada teie ressursi indekseerimist otsingumootorite poolt.

Saidiplaani saidiplaan xml-vormingus – ja ma vajan seda

Kuid peamine tööriist, mis on loodud selleks, et näidata otsingumootoritele otseselt neid ressursi lehti, mida tuleb indekseerida, on fail nimega Sitemap.xml (see on selle kõige levinum nimi, kuid teoreetiliselt võib seda nimetada kuidas iganes soovite, see ei tee seda pole oluline), mis pole teie veebiprojekti külastajatele nähtav.

See on koostatud, võttes arvesse spetsiaalset otsingumootoritele arusaadavat süntaksit, mis loetleb kõik indekseeritavad lehed, näidates ära nende tähtsuse, kuupäeva viimane värskendus ja ligikaudne värskendussagedus.

Igas veebiprojektis peaks olema kaks peamist faili - robots.txt ja sitemap.xml. Kui teie projektil neid pole või need pole õigesti täidetud, kahjustate suure tõenäosusega oma ressurssi suuresti ega lase sellel sada protsenti avaneda.

Muidugi ei pruugi te mind kuulata (sest ma pole autoriteet, suhteliselt väikese kogunenud faktimaterjali tõttu), kuid arvan, et te ei hakka valimatult vaidlema spetsialistidega, kellel on käepärast statistika kümnete tuhandete projektide kohta.

Sel juhul oli mul varuks “klaver põõsastes”. Vahetult enne selle artikli kirjutamist jäi mulle silma tuntud automaatse edutamissüsteemi spetsialistide väljaanne ebahariliku nimega “Käed” (see on MegaIndexi analoog, millest ma kirjutasin).

On selge, et iga nendega sarnane süsteem on huvitatud oma klientide projektide edukast edenemisest, kuid nad saavad ainult klientide ressursse pumbata võrdlusmass, ning kahjuks ei saa need mõjutada saitide sisu ega õiget tehnilist konfiguratsiooni.

Seetõttu viidi läbi väga huvitav ja paljastav uuring, mille eesmärk oli välja selgitada 10 kõige populaarsemat põhjust, mis raskendavad projektide reklaamimist ja nende klientide otsimist...

Esikohal oli muidugi “mitteunikaalne sisu” (kas kopeerisite selle või on teil see olemas, mis sisulist sisu ei muuda). Kuid teisel kohal oli lihtsalt xml-vormingus saidiplaan, õigemini selle puudumine või vastuolu tunnustatud loomisvorminguga. Noh, kolmandal kohal oli varem mainitud fail robots.txt (selle puudumine või vale loomine):

Kui väidate alusetult, et teie projektil peab olema kaart (muidu kirdyk), ei kõla see nii veenvalt, nagu toetaksid seda väidet reaalsed faktid üsna esinduslikust uuringust.

Olgu, oletame, et ma veensin teid ja vaatame, kuidas saate ise saidiplaani (vormingusüntaksi) luua, kuidas seda Joomla ja WordPressi jaoks teha ning samuti vaadata, kuidas saate seda spetsiaalsete seadmete abil luua. võrgugeneraatorid(generaator).

Kuid pelgalt saidiplaani loomisest ei piisa tagamaks, et otsingumootorid teie projekti korralikult indekseerivad. Siiski on vaja tagada, et otsingumootorid saaksid selle saidiplaani kohta teada (meie puhul on need Google ja Yandex). Seda saab teha kahel viisil, kuid sellest räägime veidi hiljem (peab olema vähemalt mingi intriig, mis lugejate tähelepanu köidab).

Miks on üldse vaja saidiplaani ja faili robots.txt

Proovime esmalt põhjendada nii faili robots.txt, mis keelab indekseerida teie veebiprojekti teatud elemente, kui ka saidiplaani faili, mis näeb ette teatud lehtede indekseerimise, kasutamise loogilist vajalikkust. Selleks pöördume tagasi viie või kümne aasta tagusesse aega, mil enamik Internetis leiduvatest ressurssidest oli vaid HTML-failide komplekt, mis sisaldas kõigi artiklite tekste.

Google'i või Yandexi otsingurobot läks lihtsalt sellise HTML-projekti juurde ja hakkas indekseerima kõike, mis kätte sattus, sest peaaegu kõikjal oli projekti sisu. Ja mis toimub praegu, CMS-i (sisuhaldussüsteemide) laialdase kasutuse kontekstis? Tegelikult leiab otsingurobot isegi kohe pärast mootori installimist teist juba mitu tuhat faili ja seda hoolimata asjaolust, et teil ei pruugi ikkagi sisu olla (noh, te pole veel ühtegi artiklit kirjutanud).

Ja üldiselt ei salvestata tänapäevases CMS-is sisu reeglina mitte failidesse, vaid andmebaasi, mida otsingurobot muidugi otse indekseerida ei saa (soovitan teil andmebaasidega töötada tasuta).

On selge, et siin ringi tuhnides leiavad Yandexi ja Google'i otsingurobotid ikkagi teie sisu üles ja indekseerivad selle, kuid siin on näha, kui kiiresti see juhtub ja Kui täielik on indekseerimine? teie projekt on väga suur küsimus.

Just selleks, et lihtsustada ja kiirendada projektide indekseerimist otsingumootorite poolt CMS-i laialdase kasutuse tingimustes, on hädavajalik luua failid robots.txt ja sitemap.xml. Esimese faili abil annate otsingumootori robotitele käsu indekseerida, milliseid faile ei tohiks aega raisata (näiteks mootoriobjektid), samuti saate selle abil sulgeda mõned leheküljed indekseerimisest, et välistada sisu dubleerimise mõju. , mis on omane paljudele CMS-idele (selle kohta lugege). Täpsemalt artiklis teemal).

Ja saidiplaanifaili abil ütlete Yandexi ja Google'i robotitele selgelt ja selgelt, mis täpselt teie projekti sisu sisaldab, et nad ei torkaks asjatult mööda kasutatava mootori failimajanduse nurki. Ärge unustage, et robotitel on teatud piirangud dokumentide vaatamise ajale ja arvule. See rändab läbi teie mootorifailide ja lahkub ning sisu jääb pikaks ajaks indekseerimata. Oh kuidas.

Pidage meeles, kuidas üks värvikas tegelane ütles tuntud komöödias: "Ära mine sinna, mine siia, muidu ...". Just selle tegelase funktsiooni täidavad failid robots.txt ja xml-laiendiga saidikaart, et reguleerida otsingurobotite liikumist teie veebiprojekti nurkades. On selge, et robotid võivad kinni keerata, kuid tõenäoliselt järgivad nad kuulekalt teie hästi kirjutatud keelavaid ja ettekirjutavaid (saidikaardil) juhiseid.

Arusaadav? Seejärel jätkame otse küsimuse lahendamisega, kuidas luua saidi sitemap.xml mitmel viisil ja kuidas teatada selle olemasolust kahele Runeti otsinguvaalale - Google'ile ja Yandexile, et nad ei koperdaks loomise ajal teie projekti asjata. lisakoormus teie serverimajutamisele, kuid see on aga juba väga tühine asi, peamine on indekseerimine (kiire ja põhjalik).

Erinevalt failist robots.txt, mille peate suure tõenäosusega ise kirjutama, üritavad nad reeglina luua saidiplaani faili xml-vormingus automaatselt. See on arusaadav, sest suurel hulgal sageli uuendatava projekti lehekülgi, võib selle käsitsi loomine veebihalduri meelt kahjustada.

Jah, see pole üldse vajalik, sest. peaaegu iga CMS-i jaoks on laiendus, mis võimaldab teil luua ja uute materjalide ilmumisel saidiplaani faili uuesti luua. Noh, või võite alati kasutada valmislahendusena mõnda veebipõhise saidiplaani generaatorit.

Kuid ikkagi tundub mulle, et saidiplaani loomise lihtsa (mis ma saan öelda - kõige lihtsama) süntaksiga tutvumine poleks üleliigne. Lisaks saate väikeste ja harva uuendatavate projektide puhul selle käsitsi visandada.

Kuidas Joomlas ja WordPressis ise Sitemap.xml luua

Tavaliselt kirjutatakse käsk "Saidiplaani" päris lõppu. Järgmine kord, kui otsingurobotid teie veebiprojekti külastavad, vaatavad nad kindlasti faili robots.txt sisu läbi ja laadivad teie kaardi uurimiseks alla. Nii saavad aga selle olemasolust teada kõikvõimalikud redised, mille kaardisait aitab teilt sisu varastada.

Kuid on veel üks viis saidiplaani asukohateabe otse edastamiseks otsingumootoritesse ilma faili robots.txt vahenduseta. Seda tehakse Yandexi veebihalduri liidese ja Google'i tööriistariba kaudu, kuigi saate seda kasutada. Kas olete nende otsingumootori tööriistadega juba tuttav?

Kui ei, lisage oma projekt kindlasti nii kaustadesse kui ka ning seejärel määrake vastavatel vahekaartidel Xml-vormingus saidiplaani tee.

Yandex Webmasteri saidiplaani lisamise vorm näeb välja selline:

Ja selline näeb välja sarnane vorm tee määramiseks Google'i tööriistaribal:

Veebi saidiplaanide generaator ja XML-saidiplaanid

Kui te ei soovi oma CMS-i jaoks otsida laiendusi, mis võimaldavad teil saidikaardi automaatselt luua, saate sel juhul kasutada võrgugeneraatoreid. Siin on aga üks puudus võrreldes kaardi automaatse loomisega CMS-is endas - pärast uute materjalide lisamist peate minema tagasi võrguteenusesse ja looma selle faili uuesti ning seejärel oma serverisse üles laadima. .

Tõenäoliselt üks kuulsamaid veebipõhise saidiplaani generaatoreid on saidiplaani generaator. Sellel on üsna suur funktsionaalsus ja see võimaldab teil tasuta luua saidiplaani 1500 lehekülje jaoks, mis on üsna palju.

Saidiplaani generaator võtab arvesse teie faili robots.txt sisu, nii et leheküljed, mille indekseerimine on keelatud, ei satuks kaardile. See iseenesest pole hirmutav, sest robotite keeld on prioriteetsema tähtsusega, kuid säästab teid tarbetu teabe eest loodud fail saidikaart. Kaardi tegemiseks peate lihtsalt määrama URL-i avaleht ja sisestage oma e-post, misjärel pannakse teid genereerimise järjekorda:

Kui teie kord saabub, saate selle kohta e-kirja ja klõpsates kirjas olevale lingile saate alla laadida faili, mille saidiplaani generaator teile tegi. Jääb vaid see oma serveris õigesse kohta visata. Noh, peate seda protseduuri aeg-ajalt kordama, et teie saidikaart oleks ajakohane.

Sarnane on olemas Ingliskeelne teenus veebigeneraator, mille leiate sellelt lingilt - XML-saidiplaanid. Sellel on piirang 500 lehekülge, aga muidu on kõik peaaegu sama, mis eelpool kirjeldatud.

Edu sulle! Kohtumiseni ajaveebi lehtedel

Võib-olla olete huvitatud

Mis on juhtunud URL-aadress Mis vahe on saidi absoluutsetel ja suhtelistel linkidel?
Mis on Chmod, milliseid õigusi failidele ja kaustadele (777, 755, 666) määrata ja kuidas seda teha PHP kaudu
Yandexi otsing saidil ja veebipoes
OpenServer – kaasaegne kohalik server ja näide selle kasutamisest WordPressi installid arvutis
Kuidas suurendasin veebisaidi liiklust 300 inimeseni päevas?

Selles juhendis käsitleme järgmisi teemasid.

Mis on saidiplaan?

See on fail, mis sisaldab kõigi linkide loendit olulised lehed sait. See tähendab, et see dokument suunab otsingumootorid saidi põhisisu juurde.

Mille jaoks on saidiplaan?

Saidiplaani on vaja, kui saidil on indekseerimisega probleeme, mille põhjuseks on:
1) suur summa lehed;
2) lehtedele viivate (sisemiste või väliste) linkide puudumine;
3) sügav pesitsemine kohas (keeruline struktuur).

HTML vs XML saidikaart

Saidiplaanid on järgmist tüüpi:

  • HTML;

Lihtsaim selgitus nende vormingute erinevusele on see, et XML-kaart on mõeldud peamiselt otsingumootoritele, HTML aga kasutajatele.

HTML kaart- see on vaid üldine ülevaade saidist, sisaldab ainult teavet ja lehti, mida kasutajad peavad nägema. Kui olete saidil ja otsite konkreetset jaotist, leiate HTML-i saidiplaani minnes selle hõlpsalt üles. Kuigi seda tüüpi saidiplaanid on kasutajakesksed, võib see aidata ka teie otsingumootori paremusjärjestust. See on üks tõendeid selle kohta, et teile meeldib saidi mugavus kasutaja jaoks.

HTML-i saidiplaani koostamisel on oluline arvestada:

1. Struktureeritud sisu.

Saidiplaan peaks olema selge ja kasutajasõbralik. Soovitav on, et see sisaldaks jaotisi, kategooriaid, alamkategooriaid jne.

2. Ühendusankrud.

Protokoll XML-kaardid Sait on mõeldud otsingurobotite jaoks. XML-fail sisaldab teavet selle kohta, millal URL-i viimati värskendati, kui oluline see on ja kui sageli muudatusi tehakse.

Tavaliselt koosneb saidiplaan järgmistest XML-märgenditest:

Kohustuslik:
- määrab protokollistandardi ja kapseldab selle faili.
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://obanracer.ru/et/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Подписаться на рассылку

Карта сайта (Sitemap.xml) – это специальный файл в формате.xml, хранящийся в корневой директории сервера. Это файл с информацией о страницах сайта, которые нужно индексировать. Обычно sitemap создают для Яндекса и Гугла, чтобы оповестить поисковых роботов о страницах, которые нужно внести в индекс. Ещё при помощи сайтмапа осуществляется проверка того, как часто происходят обновления, и индексация каких веб-документов является наиболее важной.

Видео из Вебмастерской Яндекса:

Sitemap.xml составляется с учетом специального синтаксиса, понятного поисковым машинам, где будут перечислены все страницы, подлежащие индексации с указанием степени их важности, даты последнего обновления и примерной частоты обновления.

Есть два основных файла, которые должны иметься у любого web-проекта - robots.txt и sitemap.xml . Если у вашего проекта их нет или они заполнены не правильно, то с большой долей вероятности вы сильно вредите своему ресурсу и не позволяете ему раскрыться на все сто процентов.

Влияет ли файл sitemap.xml на продвижение сайта

Если у вас отсутствует sitemap, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Создание sitemap.xml помогает решить эту проблему.

Sitemap.xml влияет на SEO косвенно: облегчая и ускоряя индексацию страниц.

Карта сайта sitemap в формате HTML

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта - это страница сайта , на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей , нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограничения по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, файл sitemap в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта - это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt - это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Карта сайта XML Sitemap

XML карта сайта - это файл формата xml, вида sitemap.xml , который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта:

  • Sitemap xml - это специальный формат карты сайта , который определяется всеми популярными поисковыми системами, например Google и Яндекс.
  • В xml sitemap можно указать до 50.000 ссылок .
  • В sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Содержимое карты сайта – лишь рекомендация для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Как создать правильный sitemap.xml

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Содержимое файла карты сайта sitemap.xml выглядит:

http://site.ru/!} 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

Kui kasutatakse järgmisi nõutavaid silte:

  • - ülemmärgend, see sisaldab kõiki url-aadresse;
  • - silt, mis sisaldab teavet konkreetse url-aadressi kohta;
  • https://obanracer.ru/et/- selles sildis näidatakse otse URL-i.
  • - see silt sisaldab lehe viimase muutmise kuupäeva;
  • - märgendit kasutatakse selleks, et näidata, kui sageli leht muutub: alati, tunnis, päevas, nädalas, kuus, aastas, mitte kunagi;
  • Näitab konkreetse lehe prioriteetsust saidi teiste lehtede suhtes alates 0,1 - madala prioriteediga kuni 1 -ni - kõrge prioriteet.

Changefreq näitab, kui sageli leht muutub:

  1. Tunnipõhine – uuenda iga tunni tagant;
  2. Alati - alati uuendatud;
  3. Iganädalane – uuendatakse kord nädalas;
  4. Iga päev – uuendused toimuvad iga päev;
  5. Igakuine – uuendused toimuvad kord kuus;
  6. Aastas - üks kord aastas;
  7. Mitte kunagi - ei värskenda (sellist väärtust on parem mitte kasutada).

Prioriteet annab otsingumootoritele teada, kui oluline on leht teistega võrreldes. Prioriteediks saab määrata 0,1 (madal) kuni 1 (kõrge).

Fail sitemap.xml peab sisaldama XML-keele nimeruumi viidet:

Xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"

Kui saidiplaani fail sisaldab üle 50 tuhande lingi või sitemap.xml suurus ületab 10 mb, on soovitatav saidikaart mitmeks failiks jagada. Sel juhul peate saidiplaanis määrama mitu linki erinevatele kaardifailidele.

http://site.ru/sitemaps/sitemap01.xml 2015-10-18T18:54:13+04:00 http://site.ru/sitemaps/sitemap02.xml 2015-10-18T18:54:13+04:00

Siin on kasutusel meile juba tuttavad sildid. Ja , samuti vajalikud sildid:

  • - vanemmärgend, mis sisaldab kõigi saidiplaanide aadresse;
  • - silt, mis sisaldab iga saidiplaani parameetreid.

Sitemap.xml loomine

Looge saidikaart oluline protsess, mille käigus on vaja selgelt näidata, millised saidi leheküljed tuleks indekseerida ja kuidas neid kõige paremini indekseerida. Olenevalt sellest, millist tüüpi saidikaardist me räägime, erinevad kuidas luua saidiplaani. Html-saidiplaani loomise üle pole mõtet eraldi arutada. Mõelge, kuidas vormingus kaardikaarti teha xml-fail aga. Saidiplaani loomiseks on mitu põhiviisi, kuid neil kõigil on ühine saidiplaani asukoht ja see, kuidas otsingumootorid saidiplaani määravad.

Nagu eespool juba kirjutatud - saidiplaani fail paigutatakse saidi juure. Otsingumootorid suudavad saidiplaani faili ise üles leida. Kuid on mitmeid viise, kuidas saidiplaanifaili(de)le otse linkida, et otsingumootorid neid kiiremini avastaksid. Lihtsaim viis saidiplaani faili asukoha määramiseks on otse saidiplaanifailide lingi või mitme lingi määramine Yandexi ja Google'i veebihalduri tööriistades. Seal saate kontrollige saidikaarti, kulutada saidi kaardi õigsuse analüüs, mis vastab sellele, milliseid saidiplaani lehti otsingumootor leiab ja kui palju neist indekseeritakse.

Teine viis saidiplaani faili asukoha määramiseks otsingumootoritele on saidiplaani direktiiv failis robots.txt.

Saidiplaan: http://site.ru/sitemap.xml

Failis robots.txt saate määrata mitu saidiplaani faili, misjärel lisatakse see automaatselt veebihalduri tööriistadesse. Vaatasime, kuidas saidiplaani leida, nüüd jätkame saidiplaani loomisega.

Põhilised viisid saidiplaani loomiseks

  1. Saidiplaani loomine saidihaldussüsteem, kui CMS-il on sarnane sisseehitatud võimalus.
  2. Laadige alla saidikaart väljast võrguteenus. Internetis on palju erinevate võimaluste ja piirangutega saidiplaani generaatoreid. Tõenäoliselt üks kuulsamaid veebipõhise saidiplaani generaatoreid on saidiplaani generaator. Sellel on üsna suur funktsionaalsus ja see võimaldab teil tasuta luua saidiplaani 1500 lehekülje jaoks, mis on üsna palju. Samuti on olemas xml-sitemaps.com, millel on võimalus konfigureerida saidiplaani parameetreid, kuid mille limiit on 500 linki failis sitemap.xml.
  3. Laadige alla saidiplaani generaator. Sellised generaatoriprogrammid on tavaliselt tasulised, kuid nende abiga saate regulaarselt genereerida ühe või mitme saidi xml-saidiplaani. Siin on paar näidet sellistest genereerimisprogrammidest: SiteMap XML Dynamic SiteMap Generator, WonderWebWare SiteMap Generator.
  4. Automaatne saidiplaani genereerimine Joomlas (Jumla), WordPressis (Wordpress), Bitrixis (Bitrix), ModX-is.
  5. Saidiplaani käsitsi loomine.

WordPressi saidikaart

Saate luua WordPressi saidiplaani Google XML-i saidiplaanide pistikprogrammi abil. Selle jaoks saate teha palju sätteid, mis võimaldavad teil mõne saidi materjali välistada, ja saate määrata ka eeldatava värskendussageduse. Lisaks kaardi loomisele Google'i pistikprogramm XML-saidiplaanid teavitavad paljusid otsingumootoreid, kui teie ajaveebis avaldatakse uut sisu, kutsudes neid üles seda kiiresti indekseerima.

Saate ise määrata saidiplaani faili tee pistikprogrammi seadetes ja anda sellele isegi klassikalisest sitemap.xml-st erineva nime.

Joomla saidikaart

Saate luua Joomla saidiplaani, kasutades komponenti Xmap.

Kontrollige saidiplaani katkiste linkide suhtes

Et otsingurobotit mitte petta, tuleb sitemap.xml vigadeta konfigureerida. Seetõttu peate pärast iga faili värskendamist kontrollima saidiplaani katkiste linkide suhtes.

Avage Yandex Webmaster - jaotis "Tööriistad" - "Saidiplaani failide analüüs".

Valige üks failide üleslaadimismeetoditest:

  • kopeeri tekst sitmepa.xml;
  • esitage saidiplaani URL;
  • Laadige xml-fail teenusesse.

Sitemap.xml kontrollimine Yandex Webmasteris

Sitemap.xml analüüs PixelPlusi poolt

Kui leitakse vigu (seda juhtub sageli), teatab teenus teile, millised URL-id annavad vale vastuse (eemaldatud, mittevajalikud jne).

Sitemap.xml on oluline tööriist

Saidikaart on veebisaidi reklaamimiseks üks olulisemaid SEO tööriistu. Pole tähtis, kuidas saidikaart luuakse. Tähtis on see, millised lingid saidikaardile lisatakse ja kui sageli seda uuendatakse. Mõnikord laaditakse saidiplaani üles kõik ja isegi need lingid, mis on failis robots.txt keelatud või mittekanoonilised lingid. Saidikaarti uuendatakse kord kuus või harvemini. Selline suhtumine saidikaardile ei muuda selle mitte ainult kasutuks, vaid veelgi hullem - ajab otsingurobotit segadusse, mis mõjutab negatiivselt indekseerimist ja saidi positsioone otsingus.

Looge oma ressursi jaoks saidiplaan. Kuid olge ettevaatlik ja mõelge hoolikalt läbi, mida saidiplaanile üles laadida ja mida mitte.