Gerar arquivo de sitemap. Adicionar um arquivo de sitemap para Yandex.Vebmaster e console de pesquisa do Google (nuances e erros)

Inicialmente, pensei em escrever uma simples e fácil "Post-Day Post" sobre uma coisa interessante, que recentemente notei no console de pesquisa do Google. Acontece agora nos painéis Yandex e Google Webmaster, há uma verificação automática de erros nos mapas do site XML. Anteriormente, é lembrado, serviços especiais foram usados \u200b\u200bpara tais fins, mas agora tudo se tornou muito mais fácil.

No artigo encontrará não apenas a descrição dos erros que podem ser rastreados, também decidi adicionalmente dizer a você como adicionar um arquivo de sitemap ao Yandex Webmaster e ao Google Search Console. Não vou abrir nada sobre a maioria, mas talvez alguém tenha perdido este momento + novato virá a calhar. Contente:

  • + Links úteis.
  • (incluindo pesquisa de erros).

1. Crie o sitemap XML

Se não houver um mapa do site no seu projeto da Web, certifique-se de fazer isso - este é um chip extremamente útil com (especialmente em novos recursos). Eu quero notar que, neste caso, estamos falando de um formato XML especial (para mecanismos de pesquisa) e não sobre HTML (visitantes). O mecanismo de trabalho depende do motor que você usa, aqui estão alguns artigos sobre o tópico:

  • Fazer (plugin comentários).
  • - Casal de serviço para quaisquer recursos.
  • (incluindo xml).
  • Cunning hack criação sitemap no blog do blogspot.

Sitemap: http: // transition_omena / sitemap.xml

Em geral, eu conheci informações que os mecanismos de busca sabem de forma independente como encontrar um mapa do site XML se estiver localizado em um endereço padrão, mas em princípio, é melhor ainda carregá-lo na barra de ferramentas.

2. Adicione o Sitemap ao Google (console de pesquisa)

Anteriormente, este painel foi chamado de ferramentas Webmasters Sim, e parecia completamente diferente. Agora é uma ferramenta mais funcional. O algoritmo de ação é o seguinte:

  • Registrado No console de pesquisa (se você já tiver a Conta do Google, também será acesso ao sistema);
  • Conecte seu projeto e confirme os direitos.
  • Para executar a tarefa de adicionar o SiteMap XML, vá para a seção "Scan" - Sitemaps Arquivos.

Esta página contém todas as informações do seu site Mapa + Você pode adicionar novo (2) ou veja a presença de erros no atual (3).

No Google Search Console é suportado Investido Sitemap`a - existe tal coisa, por exemplo, no plugin Yoast SEO. O módulo gera o endereço: http: //vash_domena/sitemap_index.xml..

Teoricamente, você pode adicionar um arquivo de sitemap ao console de pesquisa Googe apenas um (principal) e os objetos restantes automaticamente pegarem automaticamente. Ao mesmo tempo na página do painel será exibido apenas sitemap.xml.E quando você clica nele, você irá para as subseções.

A propósito, se você enviar separadamente todos os arquivos XML (básicos e parágrafos), o número total de links é cercado:

Provavelmente, por enquanto, no console, não há ferramenta para distinguir entre repetições ou é apenas um formato para exibir um número total de registros, ou uma falha.

Quanto aos erros no mapa do site

Se houver alguns problemas com o sitemap XML adicionado, então no painel você verá a notação correspondente (ícone da marca de exclamação e entrada na coluna "Problemas"). Além disso, na página de um arquivo de mapa específico do site também será avisos.

No caso da captura de tela, você pode ver o registro que algumas regras Robots.txt não permitem indexar alguns endereços de blogs. Essas coisas precisam ser corrigidas e, após enviar um arquivo para verificar novamente - o botão "teste".

Em outro projeto, eu tive uma situação de pior - o mapa do site deu: (isso geralmente é absurdo. E o módulo desejado foi ativado, e eu estava completamente certo de que tudo funciona. Eu encontrei um problema somente após o painel do webmasters . Portanto, este procedimento é importante é o suficiente e leva apenas alguns minutos.

3. Baixar Sitemap em Yandex

Quanto àqui, depois de registrar, adicionar um site e confirmar os direitos, você precisa ir para a seção "Indexing" - SiteMap Arquivos.

A página tem cartão de detecção automática de Robots.txt + você pode adicionar seus arquivos. O painel também suporta aninhamento. Se algo deu errado, um registro de erro será exibido. Na captura de tela acima, o problema está relacionado à imagem da tag: imagem em que Yandex não entende. No WordPres, há módulos que eliminam essa articulação, mas, em princípio, não afetam particularmente nada. Eu pessoalmente deixo tudo como é.

Antes de adicionar o Sitemap a Yandex.Vebmaster, você pode simplesmente executar o cheque rápido. Esta ferramenta está disponível na seção "Ferramentas" - Análise do SiteMap.

TOTAL

Como eu disse acima, aconselho você a gastar 5-10 minutos para adicionar um arquivo de sitemap a Yandex e Google. Se o seu projeto não tiver lugar, certifique-se de criar. Esse processo, bem como o uso, ajudará a melhorar a indexação do recurso e também permitirá que você encontre erros que você não poderia saber. Existem situações diferentes, por exemplo, o CMS atualizado e esqueceu de conectar o módulo do mapa do site, ou ele começou independentemente a bullure - quando o sitemap começa a dar 404 erros, não é legal.

O post, claro, mais para novatos, mas espero que você também tenha acessível. Se você tiver algo para adicionar, escreva abaixo.

Usando o arquivo sitemap, você pode informar Yandex na estrutura atual do site, especificando uma diretiva especial em robots.txt ou adicionando ao yandex.vebmaster.

Webmaster permite que você:

Baixar Sitemap

    Selecione o site na lista.

    No campo, insira o URL, no qual o arquivo está disponível. Por exemplo, https://example.com/sitemap.xml..

    Clique no botão Adicionar.

Depois de adicionar um arquivo em uma fila para processamento. O robô irá carregá-lo dentro de duas semanas. Cada arquivo adicionado, incluindo investido no arquivo de índice do SiteMap, é processado por um robô separadamente.

Depois de baixar em frente a cada arquivo, você verá um dos status:

Status Descrição Observação
OK
"Redirecionar" Remova o redirecionamento e informe o robô de atualização
"Erro" O arquivo é formado errado Relatar um robô de renovação
"Não indexado"
Não permitir. Relatar um robô de renovação
Status Descrição Observação
OK O arquivo é formado corretamente e carregado no banco de dados do robô

Oposto ao arquivo exibe a data da última carga.

Páginas pontiagudas aparecerão nos resultados da pesquisa por duas semanas

"Redirecionar" URL especificado redireciona para outro endereço Remova o redirecionamento e informe o robô de atualização
"Erro" O arquivo é formado errado Clique no link de erro para descobrir os detalhes. Depois de fazer alterações no arquivo, informe o robô de atualização
"Não indexado" Ao acessar o sitemap, o servidor retorna um código HTTP diferente de 200

Verifique se o arquivo está disponível para um robô usando a ferramenta, especificando o caminho completo para o arquivo.

Se o arquivo não estiver disponível, consulte o administrador ou servidor do site no qual ele está localizado.

O acesso ao arquivo é proibido em Robots.txt usando a diretiva não permitir Permitir acesso ao Sitemap e informe o robô de atualização

Atualizar Sitemap

Se você alterou o arquivo sitemap adicionado a Yandex.Vebmaster, não é necessário excluí-lo e download novamente - o robô verifica regularmente o arquivo para atualizar e erros.

Para acelerar um bypass de arquivo, clique no ícone. Se você usar o arquivo de índice do SiteMap, poderá executar o processamento de cada arquivo listado nele. O robô fará o download de dados no prazo de três dias. Você pode usar a função até 10 vezes para um host.

Quando você gasta todas as tentativas, a próxima estará disponível 30 dias após o primeiro. A data exata é exibida na interface Webmaster.



Excluir sitemap

Na interface YANDEX.VEBMASTER, você pode excluir esses arquivos que foram adicionados na página Arquivos do Sitemap: se a diretiva no arquivo robots.txt, remova-a para o Sitemap. Depois de fazer alterações, informações sobre o Sitemap desaparecerão da base do robô e da Yandex.Webmaster por várias semanas.

Perguntas e respostas

O sitemap é exibido no serviço como uma página excluída com o status "Formato de documento inválido"

A exibição do arquivo do sitemap (assim como outros arquivos XML) como páginas excluídas são apenas informativas e não afetam a indexação do site ou o processamento do Sitemap.

O arquivo sitemap pode ser exibido no grupo de páginas executadas, já que o robô tentou indexá-lo como uma página regular, enquanto os arquivos de formato XML não são indexados no mecanismo de pesquisa Yandex e não estão envolvidos nos resultados da pesquisa.

Ao processar o Sitemap, um erro "Tag desconhecido"

O arquivo do sitemap pode conter apenas alguns elementos XML. Se o webmaster detectar outros elementos no arquivo (por exemplo, uma indicação de uma versão móvel ou multilíngue, o endereço das imagens), um erro de tag desconhecido aparecerá no webmaster. Os elementos não suportados são ignorados por um robô ao processar o Sitemap, e os dados dos elementos suportados são levados em consideração. Portanto, o arquivo do sitemap é opcional.

Se o conteúdo do arquivo será alterado, você precisará de até duas semanas para atualizar as informações no webmaster.

O arquivo do sitemap está no status de "não indexado"

O arquivo do sitemap pode não ser indexado por várias razões:

    O robô ignorou o arquivo do sitemap recentemente e não teve tempo para processá-lo. Espere duas semanas. Se você usar o arquivo de índice do SiteMap com vários arquivos, seu processamento pode demorar mais do que um arquivo de sitemap.

    O site estava previamente indisponível para um robô de indexação. Você deve esperar pela próxima visita ao site pelo robô.

    O acesso do sitemap é proibido no arquivo.

Olá, querido site dos leitores do blog. Decidi resumir em um artigo tudo o que já escrevi sobre o mapa do site (Sitemap XML), que antes de tudo é necessário para especificar os sistemas de pesquisa dessas páginas que devem ser principalmente. É muito importante e praticamente o atributo obrigatório de qualquer projeto da Web, mas muitos disso também não sabem ou não fornecem mapa do site de grande importância.

Imediatamente vamos colocar todos os pontos "I" e tentar separar dois conceitos - mapas do site no formato XML e no formato HTML (também há a interpretação geográfica desta palavra que escrevi sobre o artigo ""). A segunda opção é a lista usual de todos os materiais da Web do recurso, que estarão disponíveis para qualquer pessoa que deseja pressionar o item de menu correspondente. Esta opção também é útil e contribui para acelerar e melhorar a indexação do seu recurso por mecanismos de pesquisa.

Mapa do site do Sitemap no formato XML - e eu preciso disso

Mas a ferramenta principal destinada a especificar diretamente os mecanismos de busca dessas páginas de recursos que precisarão ser indexadas é o arquivo chamado sitemap.xml (este é o seu nome mais frequente, mas na ideia de ele pode ser chamado como se fosse Não é importante), que não será os visitantes são visíveis para os visitantes.

Ele é elaborado levando em conta a sintaxe especial que entende os mecanismos de pesquisa em que todas as páginas serão listadas para serem indexadas indicando o grau de importância, as últimas datas de atualização e a frequência aproximada da atualização.

Existem dois arquivos principais que devem estar disponíveis em qualquer projeto da Web - robots.txt e sitemap.xml.. Se o seu projeto não tiver ou eles não estiverem corretamente preenchidos, então com muita probabilidade, você vira fortemente seu recurso e não permite que ele divulgue cem por cento.

Você pode, é claro, pode não me ouvir (pois eu não tenho autoridade, em virtude do pequeno material real acumulado), mas acho que com especialistas que têm estatísticas com dezenas de milhares de projetos, você não argumentar.

Neste caso, encontrei-me o quasper "piano nos arbustos". Diretamente antes de escrever este artigo, a publicação de especialistas do conhecido sistema de avanço automático sob o nome incomum "mão" (este é um analógico do megaindex, que eu escrevi).

É claro que alguém semelhante a eles está interessado em garantir que seus projetos de clientes tenham sido promovidos com sucesso, mas só podem economizar recursos de clientes com massa de referência e, infelizmente, não podem afetar o conteúdo e a configuração técnica correta dos sites.

Portanto, foi realizado um estudo muito interessante e indicativo, que pretendia identificar as 10 razões mais populares que dificultam a promoção de projetos e cutucar esses dados diretamente em ...

Em primeiro lugar, é claro, foi "não único conteúdo" (ou você incorporou, ou você tem que a essência não muda). Mas em segundo lugar foi exatamente o mapa do site no formato XML e, com mais precisão, sua ausência ou inconsistência do formato reconhecido da criação. Bem, em terceiro lugar foi o arquivo anteriormente mencionado Robots.txt (sua ausência ou criação imprópria):

Quando não está claro que o cartão deve estar em seu projeto necessariamente (caso contrário, Kirdyk), ele não parece tão convincentemente, como no caso de reforço dessa aprovação, fatos reais de um estudo bastante representativo.

Ok, assumimos que me convenci e vamos ver como você pode criar um sitemap (sintaxe de formatar), como fazê-lo para o Joomla e WordPress, bem como vamos ver como ele pode criá-lo com a ajuda de geradores on-line especiais (gerador ).

Mas basta criar o Sitemap não é suficiente para ser confiante na indexação adequada do seu projeto por motores de busca. Ainda será feito para que os mecanismos de busca aprendam sobre este site do mapa (no nosso caso, é o Google e Yandex). Isso pode ser feito de duas maneiras, mas falaremos sobre isso um pouco mais tarde (deve haver pelo menos alguma intriga que mantenha a atenção dos leitores).

Por que você precisa de um site de mapa e o arquivo robots.txt

Vamos primeiro tentar substanciar a necessidade lógica de usar o arquivo robots.txt que proíbe a indexação de determinados itens do seu projeto da Web e o arquivo do site do mapa que prescreve a indexação de certas páginas. Para fazer isso, de volta nos saltos há dez anos, quando a maioria dos recursos na Internet era simplesmente um conjunto de arquivos HTML, no qual os textos de todos os artigos contidos.

O robô de pesquisa do Google ou Yandex simplesmente foi para tal projeto HTML e começou a indexar tudo o que ele vem para a mão, porque quase todos os lugares continha o conteúdo do projeto. E o que está acontecendo agora, nas condições do CMS (sistemas de gerenciamento de conteúdo)? Na verdade, mesmo imediatamente depois de instalar o motor, o robô de pesquisa já detectará você ter vários milhares de arquivos e isso é apesar do fato de não ser qualquer conteúdo ainda (bem, você não escreveu nenhum artigo ainda).

Sim, e em geral, o conteúdo no CMS moderno é normalmente armazenado nos arquivos, mas no banco de dados que o robô de pesquisa indexa diretamente, naturalmente, não será capaz de trabalhar com as bases de graça).

É claro que eu me deslocei aqui, procure robôs Yandex e o Google ainda encontrará seu conteúdo e indexará, mas quão rápido isso acontecerá e quão completa será a indexação Seu projeto é uma pergunta muito grande.

Isso é precisamente para simplificar e acelerar a indexação do projeto por mecanismos de pesquisa nas condições do CMS para usar e deve ser obrigatório para criar robots.txt e sitmap.xml. Com a ajuda do primeiro arquivo, você sugere mecanismos de busca para indexar quais arquivos não devem gastar tempo (objetos do motor, por exemplo), além de usá-lo, você pode fechar a indexação e parte das páginas para eliminar o efeito da duplicação de conteúdo que inerente a muitos CMS (leia sobre ele, leia mais no artigo Pro Artigo).

E com a ajuda do arquivo de sitemap, você claramente e diz claramente os robôs de Yandex e Google, que ele está no seu projeto que contém conteúdo para que eles não se puxem nos cantos da economia do arquivo usado. Não se esqueça que os bots têm certos limites para o tempo e o número de documentos visualizados. Ele teme em seus arquivos e folhas do motor, e o conteúdo permanecerá indexado por um longo tempo. Sobre como.

Lembre-se de como um personagem colorido falou em uma famosa comédia: "Você não vai lá, você vai aqui, e depois ...". Essa é a função desse caractere e executa robots.txt e o site do mapa com a extensão XML para controlar os movimentos dos mecanismos de pesquisa ao longo dos bancos do seu projeto da Web. É claro que os bots podem explodir, mas provavelmente eles obedecerão às instruções de proibição e prescrição escritas com competência (no mapa do site).

Claro? Em seguida, prossiga diretamente para a solução da questão, como criar o Suitemap.xml de várias maneiras e como relatar sua existência para duas baleias de pesquisa no Runet - Google e Yandex para que eles não riem tanto em vão, criando Mais e uma carga adicional no seu servidor de hospedagem, mas isso é verdade, uma coisa altamente pequena, a principal coisa é a indexação precisamente (rápida e abrangente).

Ao contrário do robots.txt, que você terá que escrever mais provável, o arquivo do mapa do site no formulário XML geralmente está tentando criar qualquer maneira automática. É claro, porque com um grande número de páginas em um projeto atualizado frequentemente, a criação manual pode levar a danos à mente no webmaster.

Sim, não é necessariamente, porque Quase para cada CMS há uma extensão, que criará, e quando novos materiais aparecerem e recriarem um arquivo de sitemap. Bem, ou você sempre pode usar cartões de site gerador on-line (gerador) sob a forma de uma solução pronta.

Mas ainda assim, parece-me, não será supérfluo familiarizar-se com ele (então o que há para falar - a sintaxe mais simples) da criação do sitemap. Além disso, em projetos pequenos e raramente atualizados, é possível experimentá-lo e manualmente.

Como criar um sitemap.xml você mesmo em Joomla e WordPress

Normalmente, a diretiva "sitemap" é prescrita no final. Pesquise robôs Quando você entra regularmente no seu projeto da Web, é certo visualizar o conteúdo do robots.txt e download para estudar seu cartão. No entanto, dessa maneira pode aprender sobre sua existência de todos os tipos de rabanetes que o site do mapa ajudará a atormentar o conteúdo.

Mas há outra maneira de transferir diretamente informações sobre a localização dos mecanismos de busca do mapa do site sem mediação robots.txt. É feito através da interface Yandex Webmaster e da barra de ferramentas do Google, embora você possa usar. Você já está familiarizado com essas ferramentas do mecanismo de pesquisa?

Se não, então não se esqueça de adicionar seu projeto e entrar e, em seguida, especificar o caminho nas guias correspondentes para o mapa do site no formato XML.

Isso parece uma forma de adicionar sitemap para webmasters yandex:

E assim se parece com um formulário semelhante para prescrever o caminho na barra de ferramentas do Google:

Gerador de sitemap online e XML Sitemaps

Se você não caçar, procure por extensões para o seu CMS, permita que você crie automaticamente um site de mapa, você pode usar on-line nesse caso por geradores on-line. Aqui, no entanto, há uma desvantagem em comparação com a criação automática de um mapa no próprio CMS - depois de adicionar novos materiais, você terá que ir ao serviço on-line novamente e recriar este arquivo e baixá-lo para o seu servidor .

Provavelmente, um dos mais famosos geradores de mapa on-line é um gerador de sitemap. Tem uma funcionalidade bastante grande e permite gerar um site gratuitamente para 1.500 páginas que são bastante.

O sitemap gerador levará em conta o conteúdo do seu arquivo robots.txt para que você não entre no mapa proibido de indexar a página. Em si, não é assustador, pois a proibição do robô em qualquer valor terá uma maior prioridade, mas ele salvará você de informações desnecessárias no arquivo de mapa do site criado. Para fazer um mapa, você só precisa especificar o URL da página principal e relatar seu e-mail, após o qual você estará em uma fila para geração:

Quando a fila chega a você, você receberá uma notificação de email sobre isso e clicar no link da letra poderá baixar o arquivo que o sitemap gerador para você. Só será deixado para jogá-lo no lugar certo no seu servidor. Bem, e tal procedimento que você tem que repetir de vez em quando para manter a relevância do mapa do seu site.

Há um gerador on-line de serviço de inglês semelhante ao Link, que você pode encontrar neste link - Sitemaps XML. Tem uma limitação de 500 páginas, e caso contrário, tudo é quase o mesmo que no acima.

Boa sorte para você! Para reuniões ambíguas no site do blog páginas

Você pode estar interessado

Quais são os endereços de URL do que a diferença entre links absolutos e relativos para o site
O que é chmod, que os direitos de acesso para atribuir arquivos e pastas (777, 755, 666) e como fazer através de PHP
Pesquisar Yandex no site e loja online
O OpenServer é um servidor local moderno e um exemplo de usar o WordPress para instalar em um computador
Como eu aumentei a participação no site até 300 pessoas por dia?

Neste guia, vamos considerar as seguintes perguntas:

O que é o sitemap?

Este é um arquivo que contém uma lista de links para todas as páginas de site importantes. Ou seja, este documento envia mecanismos de pesquisa para o conteúdo principal no site.

Para o que você precisa de um mapa do site

O sitemap é necessário se o site tiver problemas com a indexação que são chamados:
1) um grande número de páginas;
2) Falta de referências (internas ou externas) nas páginas;
3) Nesteria profunda no site (estrutura confusa).

Mapa do site HTML vs XML

Sitemaps são os seguintes tipos:

  • Html;

A explicação mais simples da diferença entre esses formatos é que a placa XML é destinada principalmente para mecanismos de pesquisa e HTML é para usuários.

Html-card - Esta é apenas uma visão geral do site, contém apenas informações e páginas que você precisa ver os usuários. Se você estiver no site e procurar uma seção específica, quando for para o SiteMap HTML, poderá facilmente encontrá-lo. Apesar do fato de que este tipo de cartões de site é focado no usuário, ele também pode ajudar seu ranking nos mecanismos de pesquisa. Esta é uma das evidências que você se preocupa com a conveniência do site para o usuário.

Ao elaborar um cartão de site HTML, é importante considerar:

1. Conteúdo estruturado.

O mapa do site deve ser claro e conveniente para a percepção do usuário. É desejável que inclua seções, categorias, subcategorias, etc.

2. Links de ancoragem.

Protocolo Cartões XML. O site é projetado para robôs de pesquisa. O arquivo XML contém informações sobre quando o URL foi atualizado pela última vez, tanto quanto importante e com que frequência ocorrem mudanças.

Normalmente, o SiteMap consiste nas seguintes tags XML:

Obrigatório:
- Determina o padrão do protocolo e encapsula este arquivo.
– содержит в себе информацию о URL-адресе (является родительским тегом).
https://obanracer.ru/pt/ – содержит абсолютный URL-адрес.

Необязательные:
– указывает дату последнего изменения файла.
– указывает частоту смены файла.
– указывает на значимость документа на сайте. Диапазон значений: от 0,1 до 1,0 (по умолчанию 0,5).

Не устанавливайте для каждого URL-адреса слишком частую смену файла и максимальный приоритет. Если метки частоты и приоритета не отражают реальность, вероятнее всего, поисковые системы будут более склонны игнорировать всю карту XML.

Другие форматы Sitemap

Помимо вышеперечисленных карт сайта, поисковые системы также поддерживают следующие форматы:

Для Google:
— RSS, mRSS и Atom 1.0;
RSS / Atom фиды должны содержать последние обновления вашего сайта. Обычно они небольшие и часто обновляются (что является плюсом).
— Сайты Google.
Для сайтов, созданных на платформе Google Сайты, Sitemap создаётся автоматически, и внести какие-то изменения невозможно.

Для Google и Яндекс:
— текстовый формат (TXT).
Файл должен быть в кодировке UTF-8 и состоять только из URL-адресов.

Требования Google и Яндекса к файлам Sitemap

1. Используйте кодировку UTF-8.
2. Максимальное количество URL – 50 000.
3. Ссылки в сайтмапе должны быть на том же домене, что и файл.

4. Если файл слишком большой, разделите его на несколько и укажите их в файле индекса Sitemap.
5. Ответ сервера при обращении к файлу должен быть 200 ОК.
6. Указывайте только канонические адреса страниц (без GET-параметров и идентификаторов сессий).

1. Максимальный размер – 10 МБ.
2. Поддерживает кириллические URL.

1. Максимальный размер – 50 МБ.
2. Поддерживает только цифры и латинские буквы.

Распространённая ошибка: чтобы уменьшить требования к пропускной способности канала, используют архиватор gzip. Размер сайтмапа должен быть 50 МБ (10 МБ) до сжатия, а не после.

Совет: русские доменные имена можно преобразовать с помощью кодировки Punycode.

Как создать XML Sitemap

1. Чтобы создать карту сайта, в первую очередь нужно определить канонические адреса, которые будут добавлены в файл.

2. Определить, какой формат файла будете использовать.

3. Создать файл можно вручную или, воспользовавшись генератором Sitemap.

Google в своей справке подготовил список онлайн и десктопных, платных и бесплатных генераторов карт сайта. Ознакомиться со всем списком можно, перейдя по ссылке .

Сгенерировать Sitemap проще, чем кажется. Разберём, как сгенерировать сайтмап, на примере деcктопного приложения Majento:

1. Парсим сайт.

2. Переходим в раздел «Сайты» => «Генерировать Sitemap».

3. Сохраняем в нужном нам формате.

4. Карта сайта готова.

Из online-генераторов XML-карты сайта заслуживает внимания XML Sitemap Generator .

Расширенные возможности этого сервера позволяют установить определённые XML-теги, включить/исключить нужные документы.

Исключить ненужные страницы можно и с помощью регулярных выражений.

Google поддерживает расширенный синтаксис для изображений. Для этого вы можете создать отдельную карту сайта для изображений или добавить синтаксис в существующую. Использование расширенного синтаксиса в Sitemap предоставляет поисковой системе дополнительную информацию об изображениях на сайте. Также это может помочь Google обнаружить и проиндексировать изображения, которые он не может найти при сканировании сайта.

Как и в обычной карте сайта, есть обязательные и необязательные XML-теги.

Обязательные:
– аналогично тегу содержит в себе URL изображения и дополнительную информацию.
– URL изображения.

Необязательные:
– подпись к изображению.
– место съёмки фотографии.
– название изображения.
– URL-лицензии изображения.

Ещё один расширенный синтаксис, который поддерживает Google, – XML-карта для видео.

Плюсы добавления XML-тегов для видео:

1) даёт понять Google, какой контент на сайте;
2) даёт возможность предоставить детальное описание к файлу;
3) станет доступным для поиска в Google Видео;
4) в поисковой выдаче будет отображаться заставка видео (может повысить количество переходов из поисковой выдачи).

Карта сайта для видеофайлов состоит из следующих обязательных элементов:

– содержит URL-адрес страницы, на которой размещено видео; если на одной странице размещено более одного видео, не нужно каждый раз создавать тег , достаточно в одном теге несколько раз прописать для каждого видео на странице.
– включает в себя всю информацию о видео.
– URL к миниатюрному изображению (заставке) к видео. Рекомендованные размеры: от 160×90 пикселей до 1920×1080. Форматы изображения: .jpg, .png, or. gif
– заголовок, который должен совпадать с названием страницы, на которой отображается видео.
– описание видео. Должно соответствовать с метаописаниями страницы. Максимальное количество символов – 2048.

Заголовок и описание видео должны быть экранированы или упакованы в блок CDATA.

Со всеми XML-тегами карты сайта для видео можно ознакомиться в справке Google .

Где разместить карту сайта

Распространённые заблуждения о Sitemap

Так как у многих этот файл вызывает трудности и является «тёмным лесом», возникают определённые мифы в отношении карт сайта. Рассмотрим некоторые из них:

– «Включение URL-адреса в файл Sitemap для XML гарантирует, что он будет проиндексирован».
Нет. Важно отметить, что XML-файлы Sitemap – это только рекомендации. Карта сайта XML не гарантирует индексацию поисковыми системами страниц, указанных в файле.

– «Если я удалю URL из XML-карты, он будет удалён из индекса».
Нет. Карта сайта XML не исключает индексацию страниц, не включённых в карту сайта XML.

– «XML-файлы Sitemap трудно создавать и поддерживать»
Нет. Небольшие сайты могут легко создавать и размещать собственные XML-файлы вручную, используя приведённые выше примеры в качестве руководства по форматированию. Для более крупных сайтов и сайтов, которые изменяются чаще, плагины или модули, доступные для большинства CMS, могут автоматизировать обновление XML-файлов.

Заключение

Файл Sitemap – полезный инструмент для передачи поисковым роботам информации о структуре сайта. Используйте это руководство, чтобы понять, как работает карта сайта, как она устроена, как сгенерировать, разместить и проверить файл.

Подписаться на рассылку

Карта сайта (Sitemap.xml) – это специальный файл в формате.xml, хранящийся в корневой директории сервера. Это файл с информацией о страницах сайта, которые нужно индексировать. Обычно sitemap создают для Яндекса и Гугла, чтобы оповестить поисковых роботов о страницах, которые нужно внести в индекс. Ещё при помощи сайтмапа осуществляется проверка того, как часто происходят обновления, и индексация каких веб-документов является наиболее важной.

Видео из Вебмастерской Яндекса:

Sitemap.xml составляется с учетом специального синтаксиса, понятного поисковым машинам, где будут перечислены все страницы, подлежащие индексации с указанием степени их важности, даты последнего обновления и примерной частоты обновления.

Есть два основных файла, которые должны иметься у любого web-проекта - robots.txt и sitemap.xml . Если у вашего проекта их нет или они заполнены не правильно, то с большой долей вероятности вы сильно вредите своему ресурсу и не позволяете ему раскрыться на все сто процентов.

Влияет ли файл sitemap.xml на продвижение сайта

Если у вас отсутствует sitemap, это не означает, что поисковики не станут индексировать ресурс. Поисковые роботы зачастую и без этого неплохо сканируют сайты и включают их в поиск. Но иногда могут возникать сбои, из-за которых порой удается отыскать не все веб-документы. Основными причинами являются:

  1. Разделы сайта, в которые можно попасть, только совершив длинную цепочку переходов;
  2. Динамические URL-адреса.

Создание sitemap.xml помогает решить эту проблему.

Sitemap.xml влияет на SEO косвенно: облегчая и ускоряя индексацию страниц.

Карта сайта sitemap в формате HTML

Карты сайта делятся на 2 основных вида или формата: карта сайта html и карта сайта файл xml. HTML карта сайта - это страница сайта , на которой перечислены ссылки. Обычно это ссылки на самые важные разделы и страницы сайта. HTML карта сайта больше рассчитана на людей , нежели на роботов и помогает быстрее ориентироваться в основных разделах сайта. Для карты сайта в виде html-страницы существуют серьезные ограничения по количеству ссылок на одной странице. Если на странице будет слишком много ссылок, далеко не все ссылки могут быть проиндексированы или вовсе страница карты сайта может быть исключена из поиска за чрезмерное количество ссылок, пусть даже внутренних ссылок.

Для того, чтобы карта сайта html правильно индексировалась и адекватно воспринималась посетителями не стоит размещать на странице более 100 ссылок. Этого более чем достаточно, чтобы разместить на странице все разделы и подразделы, которые не влезли в основное меню.

Обычно, файл sitemap в формате HTML имеет древовидную структуру, где указаны развернутые разделы и подразделы. Излишне громоздкие HTML карты сайта, зачастую оформляются графическими элементами, CSS-стилями и дополняются Java-script. Однако, карта сайта html не имеет большого значения для поисковых систем.

HTML карта сайта - это не есть полноценный sitemap. Как же быть, если на сайте сотни, тысячи, десятки тысяч страниц? Для этого необходимо разместить ссылки на все страницы в карте сайта в формате xml.

Карта сайта sitemap.txt

Еще одним способом оформления карты сайт в виде файла может быть карта сайта в формате txt:

1. http://site.ru/ 2. http://site.ru/page/ 3. http://site.ru/page1/

Все просто. В файле sitemap.txt построчно перечисляются все необходимые ссылки. Карта сайта в формате txt - это «вариант для ленивых». Здесь работает аналогичное sitemap xml ограничение в 50.000 ссылок. Однако, TXT карта сайта лишена возможностей указания даты последнего изменения и приоритета страницы.

Карта сайта XML Sitemap

XML карта сайта - это файл формата xml, вида sitemap.xml , который обычно находится в корне сайта. У карты сайта в формате xml есть множество преимуществ перед html картой сайта:

  • Sitemap xml - это специальный формат карты сайта , который определяется всеми популярными поисковыми системами, например Google и Яндекс.
  • В xml sitemap можно указать до 50.000 ссылок .
  • В sitemap xml можно указать относительный приоритет и частоту обновления страниц.

Содержимое карты сайта – лишь рекомендация для поискового робота. Например, если установить для страницы сайта ежегодную частоту обновления, поисковые роботы все равно будут ходить чаще. А если установить частоту обновления страницы ежечасно, это не значит, что роботы будет индексировать страницу каждый час.

Как создать правильный sitemap.xml

Рассмотрим, как сделать правильную xml-карту. Здесь должны быть соблюдены следующие требования:

  1. Размер файла должен быть не больше 10 мб;
  2. Карта должна содержать не больше 50000 ссылок. В тех случаях, когда ссылок больше, можно создать несколько карт и включить их в главную xml-карту;
  3. Адрес сайтмапа следует прописать в robots.txt;
  4. Также загрузите sitemap в яндекс и гугл (как добавить файл – описано ниже);
  5. Поисковые системы должны иметь доступ к карте. Необходимо использовать специальные теги, которые дают поисковикам понять, что это именно карта, а не что-то другое;
  6. У sitemap должна быть кодировка UTF-8.

Содержимое файла карты сайта sitemap.xml выглядит:

http://site.ru/ 2015-10-18T18:54:13+04:00 always 1.0 http://site.ru/category/ 2015-10-18T18:57:09+04:00 hourly 0.8 http://site.ru/page/ 2015-10-18T18:59:37+04:00 daily 0.6

Onde as seguintes tags necessárias são usadas:

  • - A tag pai, todos os URLs são concluídos;
  • - Tag, que especifica informações sobre um URL específico;
  • https://obanracer.ru/pt/ - Esta tag indica diretamente o URL.
  • - Esta tag engloba a data da última mudança de página;
  • - A tag é usada para especificar com que frequência a página está mudando: sempre, por hora, diariamente, semanalmente, monchly, anualmente, nunca;
  • Especifica a prioridade de uma página específica, em relação a outras páginas do site de 0,1 - baixa prioridade, até 1 - alta prioridade.

Changefreq indica a frequência de alteração da página:

  1. Por hora - a atualização é hora;
  2. Sempre - sempre atualizado;
  3. Semanalmente - atualizado uma vez por semana;
  4. - atualizações ocorrem diariamente;
  5. A atualizações mensais ocorrem uma vez por mês;
  6. Anual - uma vez por ano;
  7. Nunca - não atualizado (é melhor não usar esse valor).

Relatórios prioritários Os motores de busca sobre o grau de importância da página, em comparação com os outros. A prioridade pode ser definida de 0,1 (baixa) a 1 (alta).

O arquivo sitemap.xml deve conter uma indicação do namespace XML:

Xmlns \u003d "http://www.sitemaps.org/schemas/sitemap/0.9"

Se o arquivo de mapa do site incluir mais de 50 mil links ou sitemap.xml tamanho exceder 10 MB, é recomendável dividir o cartão do site em vários arquivos. Neste caso, no mapa do site, você precisa especificar vários links para diferentes arquivos de cartão.

http://site.ru/sitemaps/sitemap01.xml. 2015-10-18T18: 54: 13 + 04: 00 http://site.ru/sitemaps/sitemap02.xml. 2015-10-18T18: 54: 13 + 04: 00

Aqui já estão familiarizados para as tags dos EUA e bem como tags obrigatórias:

  • - a tag pai em que os endereços de todos os cartões de site são concluídos;
  • - A tag na qual os parâmetros são para cada mapa do site.

Como criar sitemap.xml

Criando um mapa do site Um processo importante em que você precisa indicar claramente quais páginas do site precisam ser indexadas e como indexá-las. Dependendo do tipo de mapa do site é uma questão, vários maneiras de criar um mapa do site. Como criar um mapa do site HTML para discutir separadamente nenhum significado. Considere como fazer uma placa de mapa no formato de arquivo XML. Existem várias maneiras básicas de criar um mapa do site, mas todos combinam onde o mapa do site é e como o arquivo do sitemap é determinado pelos mecanismos de pesquisa.

Como já escrito acima - arquivo de mapa do site postado no site raiz. Os mecanismos de pesquisa são capazes de detectar independentemente o arquivo de mapa do site. Mas existem várias maneiras de especificar um link direto para o (s) arquivo (s) site (s) para obter mais detecção de mecanismos de pesquisa. A maneira mais fácil de especificar a localização do arquivo do mapa do site é a direção direta de referência ou vários links para os arquivos do cartão do site nos webmasters e no Google Webmasters. Lá você pode verifique o mapa do site, gastar análise do mapa do site para correção, A correspondência de quais páginas do mapa do site são encontradas pelo mecanismo de busca e quantos deles estão na indexação.

A segunda maneira de especificar os mecanismos de pesquisa para localizar o arquivo do mapa do site é a diretiva do SiteMap do arquivo robots.txt.

Sitemap: http://site.ru/sitemap.xml.

Em robots.txt você pode especificar vários arquivos de sitemap, após o qual ele será automaticamente adicionado às ferramentas para webmasters. Como encontrar um mapa do site que olhamos, agora nos voltamos como criar um mapa do site.

Maneiras principais de criar um mapa do site

  1. Geração de mapa do site Forças do sistema de gerenciamento do site, se o CMS tiver um recurso incorporado similar.
  2. Download do mapa do site De serviço on-line de terceiros. Existem muitos geradores de cartão de site on-line com diferentes capacidades e limitações. Provavelmente, um dos mais famosos geradores de mapa on-line é um gerador de sitemap. Tem uma funcionalidade bastante grande e permite gerar um site gratuitamente para 1.500 páginas que são bastante. Ainda há xml-sitemaps.com tem a capacidade de configurar as configurações do mapa do site, mas tem um limite no número de links no arquivo sitemap.xml em 500 peças.
  3. Download do gerador de mapa do site. Esses programas são geralmente pagos, mas você pode gerar regularmente o Sitemap XML para um ou mais sites. Aqui estão alguns exemplos de programas geradores semelhantes: Sitemap XML Dynamic Sitemap Sitemap, WonderWebware SiteMap Generatior.
  4. Criação automática do cartão do site do Sitemap Em Joomla (Jumla), WordPress (WordPress), Bitrix (Bitrix), MODX.
  5. Criando um mapa do site manualmente.

Sitemap WordPress.

Criar um mapa do site para o WordPress estará usando o plugin do Google XML Sitemaps. Para ela, você pode fazer muitas configurações que eliminarão parte dos materiais do seu site e também poderá definir uma frequência de atualização estimada. Além de criar um mapa, o plugin do Google XML Sitemaps, ao publicar novos materiais no seu blog, notifica muitos mecanismos de pesquisa, convidando-os a conduzir rapidamente a indexação.

Você pode definir o caminho para o sitemap do arquivo você mesmo nas configurações do plug-in e pode até mesmo dar um nome diferente do sitemap.xml clássico.

Sitemap Joomla.

Crie um mapa do site para o Joomla usando o componente XMap.

Verifique o sitemap em links bied

Para não enganar o robô de pesquisa SiteMap.xml deve ser configurado sem erros. Portanto, após cada atualização de arquivo, você precisa verificar o sitemap em links quebrados.

Vá para Yandex Webmaster - Seção "Ferramentas" - "Análise de arquivos do Sitemap".

Selecione um dos métodos de download de arquivos:

  • copiar texto sitmepa.xml;
  • envie o mapa do site de URL;
  • carregue o arquivo XML para o serviço.

SiteMap.xml Check In Yandex Webmaster

Análise sitemap.xml de PixelPlus

Se forem encontrados erros (isso acontecer frequentemente), o serviço lhe dirá quais URLs recebem uma resposta incorreta (excluída, extra e assim por diante).

Sitemap.xml - ferramenta importante

O sitemap é uma das principais ferramentas da promoção de SEO do site. Não importa como o mapa do site será criado. É importante - quais links serão listados no mapa do site e com que frequência será atualizado. Às vezes, no mapa do site, tudo é descarregado e até mesmo esses links que são proibidos em links robots.txt ou não-canônicos. Uma atualização de mapa do site ocorre uma vez por mês ou menos. Essa atitude para o mapa do site pode não ser inútil, mas pior - para confundir o robô de busca, o que afetará negativamente a indexação e as posições do site na busca.

Crie um mapa do site para o seu recurso. Mas tenha cuidado e pense bem o que descarregar no Sitemap, e o que não é.