Experiment: modul în care Yandex și Google iau cuvinte cheie în adrese URL. Limba rusă în URL-uri chirilice

Data publicării: 29.08.2012

Astăzi orice școlar SEO știe că pentru o promovare eficientă a site-ului web este necesar să folosiți CNC, astăzi fiecare student SEO știe, pentru că toți adevărații bloggeri vorbesc despre asta, scriu în cărți și chiar vorbesc despre asta la conferințe SEO ... mergând un pic mai adânc și întrebând „unde este încrederea că motoarele de căutare iau în considerare cuvintele cheie de la adresa URL atunci când se clasează?”, ca răspuns, veți obține ceva de genul „dacă adresa URL este evidențiată cu aldine, atunci motorul de căutare înțelege cuvintele evidențiate , și, prin urmare, le ia în considerare atunci când clasează „... Simțiți o verigă slabă în această teză?

„Înțelege” nu este egal cu „consideră”! Nu trebuie să mergeți departe pentru un exemplu - cuvinte cheie de nume meta. Înțeleg motoarele de căutare semnificația acestei etichete, precum și cuvintele cheie care sunt listate în ea? Incontestabil. Are această etichetă un impact? Din pacate, nu. Poate că același lucru este cazul cuvintelor cheie din CNC?

Experiment

Pentru a nu ghici pe zațul de cafea, am efectuat un mic experiment. Scopul experimentului este de a testa dacă site-ul va fi căutat pentru cuvinte cheie care sunt utilizate în adresa URL, dar care nu sunt pe pagină.

  • Vlad a scris:
    10 noiembrie 2014 la 10:50

    Google are două opțiuni de căutare, toate rezultatele și o potrivire exactă, dacă există o potrivire exactă, clasifică paginile după relevanță și ia în considerare alfabetul chirilic din adresa URL și dacă setările de căutare au toate valorile (care este activat în mod implicit), atunci ce interogare nu introduceți, veți vedea adresele URL chirilice, acest lucru se datorează fie faptului că toată lumea fără excepție folosește transliterarea, fie faptului că, cu setările „toate valorile” Google traduce transliterarea în Chirilic și îl compară cu cererea, dar aceasta este o teorie pe care nu știu cum să o verific.

  • chijkov a scris:
    02 ianuarie 2015 la 17:25

    Bună. Interesat de cercetat, dar întrebarea este, deoarece acum știi ce este mai valoros pentru traducerea sau transliterarea chirilică PS, atunci de ce tu pe site-urile tale, inclusiv acesta, nu folosești o astfel de tehnică?

  • Sergius a scris:
    09 noiembrie 2015 la 22:14

    Experiment grozav. Când aveți chirilică, la ce se leagă? pe o grămadă de personaje de neînțeles sau sau pe site.ru / articole ??
    Dacă link-urile merg către o grămadă de personaje, atunci sunteți epuizat cu promovarea site-ului.

  • Independent

    1. Cumpărați un nume de domeniu chirilic.
    2. Găzduirea comenzilor.
    3. Legați acest nume de domeniu de această găzduire.
    4. Creați un site care conține o pagină „contacte”. Cel mai simplu mod este să creați un director numit „contacte” și un fișier „index.html” în acesta.
    5. Încărcați site-ul creat pe hosting.

    Rețineți că pe gazdă directorul site-ului nu va fi numit „site. рф "și" xn - 80aswg.xn - p1ai "(iar adresa va fi transmisă prin rețea în acest formular): pentru a asigura compatibilitatea cu orice browser, numele de domeniu sunt codificate în https://ru.wikipedia.org/ wiki / Punycode ... Jucați-vă cu codificarea: https: //www.punycoder.com

    Așadar, Sfera de mai jos este greșită: domeniul va fi disponibil oriunde în lume, iar motoarele de căutare îl vor indexa perfect. Andrew 2

    Doar 3.

    din punct de vedere SEO - înlocuirea URL-ului linkului de intrare?

    Andrey Sh. 4

    Sub rezerva modificărilor conținutului și / sau absenței unei redirecționări 301, efectul poate fi fie pozitiv, fie negativ, în funcție de mulți factori, în primul rând al cărui conținut este noua pagină, legăturile interne primite ale donatorului site-ul și linkurile externe de intrare către pagina donatorului.

    Evgeny Yu. 3

    Dacă ați schimbat adresa URL a linkului de intrare, lăsând aceeași ancoră ca înainte, atunci cel mai probabil greutatea linkului care a fost transferată mai devreme nu va fi aceeași ca și din pagina cu noua adresă URL. Acestea. un nou link de intrare va transfera greutatea minimă pe site-ul acceptorului și numai în timp va câștiga „greutate”. Din cauza unor factori, de exemplu: vechimea paginii, cantitatea de trafic către aceasta, numărul de pagini interne ale site-ul care se referă la acesta, ancore de legături interne, numărul de legături externe și tipuri de ancore la această pagină etc. Anton Velichko -1

    Doar 2.

    Ce rost are domeniul chirilic „.рф” dacă există domenii precum „.ru” și „.su”?

    Gent. Regger. 7

    Cred că acesta a fost primul pas pentru a crea internetul nostru unic, extrem de spiritual, cu membrii Sportloto și Komsomol. Rămâne acum să recunoaștem alfabetul latin care ofensează sentimentele unui rus, să separăm Internetul de Occident, în același timp de China cu Aliexpress-ul său și să lăsăm un singur site „în contact”, ei bine, poate, colegii de clasă și site-ul se grăbește să concureze cu primul canal.

    Serghei Rasskazov 7

    Doar 4.

    Cum obțin o bifă?

    Oaspetele 1

    Pentru ca inbox-ul meu să nu fie înfundat cu întrebări despre bifă, scriu imediat cum să îl obțin.
    Nu trebuie sa fie:
    1. Mata
    2. Jocuri / concursuri (%, fapte, lt)
    3. Cerere de abonamente reciproce / întrebări / aprecieri (în răspunsuri).
    Dacă totul este bine cu tine, atunci mergi mai departe
    1. Trebuie să aveți mai mult de 800 de răspunsuri.
    2. Mai mult de 1000 de abonați, cu atât mai mult cu atât mai bine.
    3. Profilul nu este al tău, deoarece nu există fotografii cu tine și / sau acest profil a fost realizat în alte scopuri (postarea de citate din filme, sfaturi despre viață, meme amuzante etc.) Fotografia ta trebuie să fie acolo (2 dacă doreste-ti propriul)
    4. Un profil activ, adică te duci la întrebare în fiecare zi și răspunzi la 5 sau mai multe întrebări în ultimele câteva săptămâni.
    Dacă ai totul.
    5. Urmați linkul http://support.ask.fm/ics/support/ticketnewwizard.asp? Style = classic
    6. Completați câteva rânduri despre dvs.: Numele complet - Numele și prenumele dvs. complet, E-mail - adresa de e-mail; Tipul anchetei - Verificarea contului; deschide încă câteva linii URL profil - link către contul dvs.; Numărul dvs. de adepți - numărul de adepți; Subiect - scrieți „Verificarea contului” (fără ghilimele); * Explicați în detalii (maximum 64.000 de caractere)
    - scriem „Bună ziua! Vreau să primesc o bifă și sunt gata să trec prin procedura de verificare. " (poți spune și despre tine unde ai devenit faimos pentru ceea ce faci, atașează linkuri către conturi, dar aceasta este o dorință).
    7. Apăsați Finish >>>
    Mai departe:
    8. Așteptăm o scrisoare de la Asuka, gata / refuz. Dacă cererea dvs. se potrivește cu bifa, atunci ni se va cere să facem un selfie cu o bucată de hârtie, unde numele dvs. de utilizator și data de astăzi sunt scrise manual, iar dvs. îți poate vedea clar mâna complet că ții bucata de hârtie și fața ta completă (cel mai important) că ești tu.
    Ce să scrii pe o bucată de hârtie? Luați orice bucată de hârtie. Asigurați-vă că includeți @ numele dvs. de utilizator și data la care v-a fost trimisă această scrisoare. Trimiteți la o scrisoare de răspuns. Cu textul „Iată dovezi” (fără ghilimele)
    9. Așteptăm o altă zi o scrisoare. Unde suntem felicitați pentru că am primit o bifă. Și ne bucurăm.
    Am trimis solicitarea pe 14 martie noaptea la 0:41; și în această zi a cerut să se facă un selfie la ora 16:00; Și a doua zi am primit o bifă la 14:01
    Sper că am explicat în detaliu și veți putea obține o bifă, aici am spus cele mai mici detalii.
    Screenhttps: //pp.userapi.com/c836439/v836439430/2b55c/AnlMBXPbPWs.jpg
    Dacă aveți probleme, scrieți-mi pentru ajutor https://vk.com/maksimovde.Oleg 300

    Total 1

    28.03.2018 Timp de citire: 1 minut

    Începând cu 21 decembrie 2017, Google publică fragmente SEO - scurte videoclipuri tutoriale. Mai jos este traducerea următorului fragment SEO.

    Astăzi întrebarea este pusă de John Mueller din Elveția, adică Întrebarea este: pot folosi cuvinte care nu sunt englezești în adresa URL? Pentru proprietarii de site-uri care vizează utilizatori din afara regiunilor de limbă engleză, uneori nu este clar dacă limba locală și caracterele care nu sunt englezești pot fi utilizate în adresele URL.

    Motorul de căutare Google folosește URL-uri în primul rând pentru a ajunge la o bucată de conținut - robotul Google accesează cu crawlere conținutul paginii și îl adaugă la SERP. Atâta timp cât adresele URL sunt valide și unice, nu va exista nicio problemă. Pentru numele de domenii și domeniile de nivel superior, caracterele non-latine sunt codificate folosind convertorul Punycode. Sună puțin ciudat, așa că vă voi da un exemplu: să luăm numele meu de familie Müller (Müller). Există puncte deasupra celei de-a doua litere, deci ca nume de domeniu va arăta diferit după codificare - "müller" -> "xn-mller - kva". Ambele versiuni sunt echivalente Google. Restul adresei URL poate fi codat utilizând sistemul Unicode, UTF-8 pentru caractere non-latine. Indiferent de limbă, păstrați adresa URL ușor pentru utilizatori - evitați spațiile, virgulele și alte caractere. Utilizați liniuțe pentru a separa cuvintele din adresă. Unii oameni preferă să utilizeze un subliniat - și asta este în regulă, dar liniuța este mai ușor de recunoscut. Dacă site-ul dvs. este disponibil în versiuni în mai multe limbi, utilizați limba corespunzătoare în adresa URL pentru paginile de conținut în limba respectivă. Deci, pentru a rezuma, voi spune: puteți utiliza cuvinte care nu sunt în limba engleză în adresele URL, acest lucru ar trebui făcut pentru site-urile care nu sunt în limba engleză.

    Deci, astăzi am vrut să scriu puțin despre utilizarea alfabetului chirilic în CNC. După părerea mea, legăturile în limba rusă ar fi foarte bune dacă nu ar fi ... Există zvonuri că nu sunt disponibile pentru browsere, motoare de căutare și alte sisteme, iar ceva absolut teribil este afișat în bara de adrese a browserului . Aș dori să vă spun despre toate avantajele, dezavantajele, zvonurile și implementarea pe site-uri.

    Deci, un exemplu despre modul în care puteți utiliza limba rusă în adresa URL poate fi văzut chiar în bara de adrese a browserului dvs. Următoarele ar trebui să fie scrise acolo:

    Http: //site/news/2009/09/08/Russian_language_in_URL.html

    Să aruncăm o privire la ceea ce spune specificația oficială HTML 4.01 despre acest lucru:

    B.2.1 Caracterele non-ASCII în valorile atributului URI Deși URI-urile nu conțin valori non-ASCII, autorii le specifică uneori în valorile atributelor care așteaptă URI-uri (adică, definite cu % URI;în DTD). De exemplu, următoarele href valoarea este ilegal: href="http://foo.org/Håkon ">... Recomandăm ca agenții utilizator să adopte următoarea convenție pentru tratarea caracterelor non-ASCII în astfel de cazuri: - Reprezentați fiecare caracter în UTF-8 (a se vedea) ca unul sau mai mulți octeți. - Evitați acești octeți cu mecanismul de scăpare URI (adică, convertind fiecare octet în% HH, unde HH este notația hexazecimală a valorii octetului). Această procedură are ca rezultat un URI legal sintactic (așa cum este definit în secțiunea 2.2 sau secțiunea 2), care este independent de codificarea caracterelor la care documentul HTML care transportă URI ar fi putut fi transcodat.

    Ceea ce înseamnă aproximativ următoarele:

    Deși URL (există o diferență între URL și URI, dar aici nu este important), trebuie să conțină numai caractere latine (ASCII), se întâmplă ca autorii să le introducă în valoarea linkurilor. De exemplu, în exemplul următor, valoarea atributului href este nevalidă: href="http://vasya.ru/Vasya_Pupkin ">... Vă recomandăm ca browserele să facă următoarele: - Înlocuiți fiecare caracter cu codificare urf-8. valori hexazecimale (fiecare octet va fi% HH). Ca urmare, adresa URL va fi corectă din punct de vedere sintactic.

    Rețineți mai ales că link-ul pe care l-am primit (a scăpat) Codificare UTF-8, iar lungimea sa a crescut în consecință. Webmasterii ale căror site-uri folosesc win-1251 ca codificare principală (cum ar fi acest site) trebuie să proceseze numele linkurilor separat, de exemplu, îl puteți traduce în codificarea de care aveți nevoie.

    În IE8, din păcate, limba rusă pură va fi disponibilă numai dacă adresa este introdusă manual acolo. Dar, acesta este IE =).

    În Yandex, limba rusă din adresa URL este perfect înțeleasă și chiar utilizată pentru căutare.


    Google nu dă sens cuvintelor din linkuri, în plus, cuvintele conectate printr-un punct de subliniere sunt considerate una din punctul său de vedere, este mai bine să folosiți un minus (cratimă) pentru separatoare. Acest fapt a fost discutat în mod fierbinte pe xpoint.ru. Cu toate acestea, afișează și linkuri în limba rusă formate corect.

    Acum este timpul pentru un mic interviu, am intervievat colegi pe acest subiect:

    dacă de exemplu linkul este în utf-8?
    Jelu (programator): ei bine, krakozyabra de sus) În general, cred că este rău De mult am vrut să întreb ceva despre optimizare. Cum afectează limba rusă optimizarea în adresa URL?@ (optimizator): nici nu știu ce să răspund, cred că depinde de ceea ce vrei să obții ca rezultat, adică pentru ce este acest link. dar cred că nu va da o mare încredere, iar sensul este transmis de ancoră, cred că limba rusă nu are nicio legătură cu ea. @: Nu știu exact cum se leagă motorul de căutare de linkurile în limba rusă. Ei bine, dacă vorbim în general despre modul în care afectează, sunt înclinat să cred că nu există nicio cale. Relevanța este afectată de textul de pe pagină, dar adresa URL care nu se leagă de acesta. Buna ziua. Ce părere aveți despre utilizarea limbii rusești în adresa URL? ov3r (programator): salut. negativ, chiar dacă se datorează codificărilor diferite Ce părere aveți despre utilizarea limbii rusești în adresa URL? Jaehee (programator): tocmai am descoperit că nenorocita de sapă trunchiază adrese URL mai lungi de 255 de caractere, ceea ce m-a supărat. deoarece am un cod de url pentru> 255 sivoli din limba rusă. s ** și pi *** s. în caz contrar, adresele URL lungi rusești sunt frumoase, plăcute, confortabile, înțelese de toată lumea și își sporesc relevanța. Ce părere aveți despre utilizarea limbii rusești în adresa URL? Dark Lord (programator): shnyaga!

    Comentează articolul, cel puțin câteva cuvinte!

    Comentarii:

      Deci, Yaroslav, pentru a crea o adresă URL în limba rusă, se presupune că aveți deja o implementare a adresei URL în limba engleză, dacă ați scris un site pentru dvs.
      În baza de date, adresa URL este stocată în codificare utf-8 [u], indiferent de codificarea site-ului în sine. Dacă site-ul este codat în 1251, atunci când salvați, convertiți codarea în Utf-8.
      Când afișați un link pe o pagină de blog, trebuie să procesați și partea care conține limba rusă cu funcția php urlencode.
      În consecință, atunci, pentru a găsi știri, analizați adresa URL și căutați partea din ea care conține limba rusă. interogarea sql arată astfel:
      SELECT ... unde ... CONVERT (`caption_latin` USING utf8) = CONVERT ((" ". $ Pname." "USING utf8) ..., unde caption_latin este numele coloanei care conține adresa URL în codificarea utf8.

      Sunt doar un webmaster începător, așa că nu înțeleg ceva. Sincer să fiu, mi s-ar potrivi instrucțiunile „pentru manechine” despre această problemă)))
      cum se stochează codificarea în Utf-8?
      cum se procesează limba rusă cu funcția php?
      ce este analiza URL?
      Îmi pare rău dacă unele întrebări par ridicole, dar doar învăț)
      De asemenea, ar fi frumos să arătăm un exemplu de cod înainte și după (adică ce modificări ale codului trebuie făcute pentru a obține litere rusești în URL), cred că va fi mai ușor pentru începători ca mine să-și dea seama.
      Mulțumesc anticipat.

      Au trecut 2 ani de la publicarea acestui articol. Oamenii folosesc ocazia de a stabili legături chirilice cu putere și principal; Yasha se bucură de acest lucru; sapatorii sunt si ei fericiti; nu cu mult timp în urmă, registratorilor li s-a permis să distribuie domenii IDN; chiar a fost introdusă o zonă chirilică (deși, așa cum am înțeles, dau aliasuri pentru fiecare domeniu din Unicode) ...
      Toate acestea nu pot decât să se bucure.
      Dar nu toată lumea (?) A învățat cum să facă redirecționarea corectă (mă refer la 301). Deoarece anteturile nu acceptă linkuri chirilice. Ceea ce nu fac vânzătorii cu linii înainte de a introduce în antet („Locație:”. AICI);

      Autorul (adică eu) are cu siguranță câteva gânduri. Pregătirea unui link pentru o redirecționare 301 nu diferă deloc de pregătirea unui link pentru html. Am scris deja despre faptul că blogul meu acceptă corectarea automată a linkurilor.
      Din motive de interes, puteți șterge anul, luna sau chiar întreaga dată din bara de adrese. Sau puteți doar să faceți clic. Veți fi redirecționat din nou către acest articol.
      Dacă motorul dvs. stochează date în win-1251, ar trebui să efectuați 2 pași:

      • Convertiți câmpul responsabil pentru legătura CNC la codarea UTF8
      • Afișați acest câmp într-un link folosind urlencode () în PHP. (nu întreaga legătură, ci doar această parte a adresei URL).
      Dacă motorul dvs. stochează totul în utf - ei bine, aveți ideea, nu? =)
    • M-am jucat mult timp cu asta ...

      Și înainte am făcut totul așa cum se spunea în articol: l-am tradus în utf-8, apoi l-am scăpat. Am experimentat în diferite moduri ...
      Dar s-a dovedit că problema a fost că urlencode () tocmai a scăpat de slash.

      Mulțumesc, din cauza articolului, am început să mă ocup din nou de funcție. Înțeles) Iată o funcție php:

      funcție redirectto ($ redirect_link)
      {
      $ redirect_link = iconv ("windows-1251", "utf-8", $ redirect_link);
      $ redirect_link = urlencode ($ redirect_link);
      $ redirect_link = str_replace ("% 2F", "/", $ redirect_link);
      header ("Locație:". $ redirect_link. "");
      }

      Bună ziua. Am o întrebare ... Primele lucruri mai întâi. Vreau să fac ca urna să poată fi în rusă (da, așa am spus-o)).
      De fapt, ce să fac?)
      Utilizatorul încearcă să acceseze adresa host.domen / 2011 / article-1 /
      Cum intercept acest lucru? Prindeți toate cererile trimise la 404? Dar atunci va reveni 404 în loc de 200. Sau faceți o eroare soft 404 cu un cod de returnare 200? (apropo, nu înțeleg cum să fac asta).
      Sau personalizarea .htaccess pentru o redirecționare 301? Dar apoi se va face o redirecționare (paradox, nu?)) ... Și datorită faptului că numele tuturor fișierelor și folderelor de pe gazdă se vor schimba numai în latină url la host.domen / 2011 / statja-1 /(aceasta este adresa corectă a paginii). Dar nu vreau acest lucru) vreau să fie afișat în bara de adrese host.domen / 2011 / article-1 / Folosind ErrorDocument 404, adresa din bara de adrese rămâne exact așa. Asta vă permite să înșelați puțin natura și să folosiți limba rusă pe server, unde nu puteți face acest lucru) În general, aveți idei?

      O să sap în timp ce mod_rewrite

      Acesta este puternicul instrument mod_rewrite. Dar este puțin incomod să lucrezi cu el. Ar fi putut fi mai ușor. Deși, acest lucru pare a se datora complexității sale intrinseci. Sau doar influența „vechii școli”. Totuși, atunci când a fost dezvoltat atunci. Ei bine, nu este vorba, principalul lucru pe care l-am făcut totul) Dar cu mod_rewrite, opțiunea sa dovedit a fi nu atât de flexibilă. Este mai bine să lăsați toate aceste procesări în PHP, colectând cereri incorecte în 404.

      Motorul nostru folosește următoarea regulă pentru mod_rewrite:

      RewriteCond% (REQUEST_FILENAME)! -F
      RewriteRule ^ (. *) $ Index.php? Rewrite_url_query_toget = $ 1

      Puteți utiliza pur și simplu RewriteRule ^ (. *) $ Index.php, dar în acest caz, adresa paginii trebuie preluată din variabila $ _SERVER ["REQUEST_URI"], care nu va fi în întregime adevărată dacă motorul este instalat într-un folder și nu în rădăcină.

      Colectarea paginilor prin procesarea a 404 de cereri nu este pe deplin corectă. În primul rând, este posibil ca starea 404 să fie returnată în mod implicit. În al doilea rând, Apache poate încerca să servească pagina prin protocolul HTTP 1.0 în loc de HTTP 1.1, deoarece pagina 404 trebuie returnată exact prin HTTP 1.0, adică neutilizarea metodei blocate pentru a reveni, ceea ce va duce și la o eroare. Etc.
      Și mod_rewrite este foarte dificil tocmai datorită versatilității sale. Cu un studiu adecvat, puteți face multe lucruri cu el.

      Ei bine, primele două probleme sunt rezolvate prin trimiterea antetului HTTP / 1.1 200 Ok. Dar că acest lucru nu este pe deplin corect, sunt, desigur, de acord) Aceasta este încă o soluție. Nu l-aș atinge dacă totul ar fi „lipit” lin cu mod-rescriere. S-a lipit, dar cumva strâmb. Ei bine, acest mecanism nu poate fi stăpânit timp de o oră. Voi încerca să experimentez comenzile dvs. în mod_rewrite.

      Salutare tuturor! Am văzut o cerere de a comenta cel puțin câteva cuvinte, iar acum am site-uri pe WordPress, acolo această afacere este automatizată în toate postările și paginile folosesc numele în limba rusă, este afișat în toate browserele majore în mod normal. Și este foarte convenabil pentru utilizator.

      Aveți o pagină de eroare interesantă)))))

      Nu te-ai autentificat și bifezi caseta. Comentariul dvs. nu a fost salvat. În cazul în care nu sunteți un bot, iată-l, copiați și încercați din nou:

      Buna!
      De exemplu, linkul dvs. este reflectat codat. După cum am înțeles, de exemplu, în limba rusă, nu pot fi create linkuri? Dacă filtrați utilizatorii în funcție de browsere și generați linkuri în limba rusă pentru toți, cu excepția ie și în transliterare pentru ie, atunci motoarele de căutare vor percepe această pagină ca două. Se pare că totul trebuie făcut în transliterare sau mai există soluții?

      În bara de adrese, introduceți de exemplu: mysite /? Hello
      cod PHP
      $ chpu = $ _SERVER ["REQUEST_URI"];
      echo $ chpu;
      cod PHP
      rezultă așa ceva:% D0% BF% D1% 80% D0% B8% D0% B2% D0% B5% D1% 82
      introduceți acest cod în baza de date și bucurați-vă :)

      Vlad, în nu - pagina va fi afișată codificată doar până la cea de-a 9-a versiune. Aceasta reprezintă mai puțin de 5% din toate browserele.

      Buna, articol foarte interesant, nu stiam mare lucru.
      Cu toate acestea, nu am înțeles cum să rezolv problema afișării caracterelor rusești în URL.
      M-am uitat la „sursa brută” (în Opera este Crl + U) și am văzut că aveți un link, de fapt - UTF-8 după ce a scăpat. Dar când plasați cursorul în bara de stare a browserului, puteți vedea krakozyabry și, după tranziție, se obține textul rusesc, așa cum ar trebui. De îndată ce nu l-am încercat - și cu escape, și fără, și în toate codificările (fără conversie la UTF-8 și cu el). În orice caz, după ce fac clic pe link, primesc caractere evadate = (

      UPD: mi-a dat seama. Se pare că un astfel de truc nu funcționează cu parametrul. Numai cu o parte a căii, dar nu query_string. Mi se pare că merită să completezi această nuanță - altfel nu știi niciodată. Am avut nevoie exact de calea, dar pentru test am ales prostesc parametrul. Apropo, mă întreb ce a cauzat această caracteristică și cine convertește în continuare caractere neevacuate într-o formă scăpată - un browser sau un server web. Ar fi, de asemenea, interesant să înțelegeți ce merge la server atunci când literele rusești sunt vizibile în bara de adrese. Este această înfrumusețare din partea browserului sau chiar dispare fără a scăpa?

      Și da, și cu parametrii, totul nu este atât de simplu - am instalat odată nginx fără Apache, deci se pare că parametrii au rămas în rusă fără înlocuire ... Și se pare că a trebuit chiar să schimb codul PHP pentru a face funcționează (deși baza de date în care aceeași codificare a fost cea de pe serverul dezvoltatorului). rescrierea a funcționat, dar datele au venit „rău”, așa ceva.

      Pe așa-numitele. location.hash - adică totul după rețea are propria specificație. Prin urmare, da, browserul, din păcate, îl ecranează.


    În primul rând, articolul este destinat celor care utilizează sistemul de management al conținutului CMS Joomla! 1.5 deoarece Voi explica toate caracteristicile utilizării adreselor URL chirilice în contextul îmbunătățirii optimizării motoarelor de căutare și a rezultatelor căutării în principalele motoare de căutare pe baza soluțiilor tehnice pe care le întâlnesc la crearea site-urilor și la lucrările ulterioare la promovarea acestora. Cu toate acestea, principiile pe care le-am expus mai jos vor fi relevante pentru toți webmasterii care nu ignoră în practica lor o parte atât de importantă a muncii, cum ar fi pe Internet și optimizarea motorului de căutare a site-ului pentru a îmbunătăți rezultatele căutării în Google, Yandex etc. .

    Toate materialele de mai jos se bazează pe experiența mea practică și vor fi susținute de exemple reale ale muncii mele.

    Asa de...

    Formarea urlurilor chirilice în joomla

    CMS Joomla!, Ca și alte sisteme de gestionare a conținutului, au o mulțime de îmbunătățiri și completări diferite sub formă de componente, module și pluginuri care pot fi responsabile de prezența și implementarea anumitor funcții. Deoarece aici vorbim în principal despre SEO, folosesc o astfel de componentă ca sh404SEF pentru a genera URL-uri chirilice. Sarcina acestei componente este că poate forma adrese URL în chirilică. Însăși procesul de formare a acestor adrese URL este detaliat pe joomlaportal.ru

    Există mai multe componente similare, dar am oprit alegerea mea, deoarece este convenabil să lucrez cu ea și nu am întâmpinat probleme de nerezolvat la utilizarea acestuia. Mai mult decât atât, a trebuit să lucrez împreună cu componenta magazinului online VirtueMart și pot spune că pentru aproape fiecare componentă necesară există posibilitatea utilizării adreselor URL chirilice, indiferent dacă este o componentă a unui magazin online sau a unui sitemap.

    Configurarea adreselor URL chirilice - ceea ce este important de luat în considerare

    Când configurați adresele URL chirilice, este important ca acestea să nu fie foarte lungi din mai multe motive. Când generați un fragment, motorul de căutare trunchiază adrese URL prea lungi, dacă aveți de gând să instalați module de publicitate contextuală pe site-ul dvs., luați în considerare faptul că, cu o adresă URL foarte lungă (mai mult de 30 de caractere), nu veți putea să adăugați modulul Google Adsense la această pagină și urmăriți conversia. Motorul de căutare vede adresa URL chirilică în acest formular,

    dar îl afișează totuși în forma sa alfabetică normală.

    Prin urmare, avantajele și dezavantajele acestor adrese URL vor fi descrise mai jos.

    Avantajele urlelor chirilice

    1 Punând un cuvânt cheie (intrare directă sau nu intrare directă) într-o astfel de adresă URL, veți avea ocazia să afișați articolul mai sus în rezultatele căutării. Desigur, calitatea materialului în sine este foarte importantă (nimeni nu a anulat acest lucru), dar în acest fel aveți ocazia să adăugați o altă cheie - și de ce nu?

    2 Este foarte important ca atunci când formați fragmentul, motorul de căutare să afișeze adresa URL chirilică și să evidențieze cuvintele cheie pentru interogarea de căutare cu caractere aldine, după cum puteți vedea în exemplu.


    Mai mult, articolul din exemplu a apărut imediat după ce a fost indexat în top 10 pentru interogarea „gym kpi”, iar după o scurtă perioadă de timp a devenit primul în rezultatele căutării după ce au apărut primele comentarii.

    3 Factorul psihologic este foarte important, o persoană, care se uită la o adresă URL atât de frumoasă, dacă se potrivește cu obiectul cererii, cu siguranță îi va acorda atenție și va da clic, pentru că va fi imediat sigur că va găsi informațiile de care are nevoie. Este foarte important să țineți cont de acest punct pentru magazinele online, mai ales atunci când există o concurență semnificativă pentru un anumit tip de produs. Și din punct de vedere estetic, adresa URL actuală este incomparabil mai plăcută de privit decât ID-urile sesiunii și alte pictograme diferite care nu înseamnă nimic pentru utilizatorul obișnuit.


    Dezavantaje ale utilizării adreselor URL chirilice

    1 În al doilea paragraf, ne-am amintit de particularitățile utilizării modulului de publicitate contextual de la Google - AdSense și de modul în care motorul de căutare vede adresa URL chirilică, dezavantajul este că există o limită a numărului de caractere din adresa URL atunci când le adăugăm la urmărire conversia.

    2 Un motor de căutare (ca orice alt editor HTML vede o literă chirilică ca o combinație de astfel de caractere, de exemplu, optimizarea motorului de căutare a cuvântului într-un editor HTML arată astfel -% D0% 9F% D0% BE% D0% B8% D1 % 81% D0% BA% D0% BE% D0% B2% D0% B0% D1% 8F_% D0% BE% D0% BF% D1% 82% D0% B8% D0% BC% D0% B8% D0% B7 % D0% B0% D1% 86% D0% B8% D1% 8F. Din acest motiv, dacă doriți să lăsați undeva pe forum un mesaj cu un link care este afișat în bara de adrese a browserului în chirilică, acesta va fi arata asa (vezi prima captura de ecran) ...

    3 Am observat o astfel de caracteristică că, de exemplu, dacă schimbați un hoster sau pur și simplu restaurați un site dintr-o copie de rezervă, atunci după restaurare, trebuie să activați din nou suportul pentru adresele URL chirilice în setările componentei corespunzătoare. Bineînțeles, în astfel de circumstanțe, linkurile pot zbura și apoi vizitatorii vor vedea o pagină de 404 în loc de interogarea dorită, cel puțin până la reindexare. Mai mult, PS nu-i plac în principiu astfel de lucruri, iar vizitatorii (clienții potențiali) sunt puțin probabil să fie încântați de ceea ce văd ...

    4 De asemenea, dacă ați acumulat o mulțime de material (articole, mărfuri într-un magazin online), atunci utilizarea unei astfel de componente va crește constant încărcătura pe baza de date. Acest lucru este plin de faptul că gazdele vor începe să se prăbușească (mai ales gazdele de rahat) și apoi să vadă punctul anterior. În al doilea rând, timpul de încărcare al site-ului va crește inexorabil, iar acest lucru va irita utilizatorii, ca urmare, vor dori să vă viziteze din nou cu mai puțină emoție.

    În urma acestui articol, vreau să spun situația cu proiectele mele în acest moment. Personal, decizia mea, după ce am cântărit toate avantajele și dezavantajele, este că site-urile cu adrese URL chirilice (de regulă, acestea sunt magazine online realizate și promovate de mine) am decis să plec așa cum erau, având în vedere evidența celor de mai sus -descrise „plusuri”. Cu toate acestea, creez site-uri noi fără să folosesc URL-uri chirilice, folosesc mod_rewrite nativ, introduc doar transliterare competentă în latină ca alias de pagină. Din nou, din punctul de vedere al propriei practici, transliterarea competentă a adreselor URL sau ortografia competentă în limba engleză este preluată de PS (cel puțin de Google) ca un cuvânt cheie, ceea ce este o veste bună!

    Câteva note despre cum să configurați componenta sh404SEF

    Odată ce ați luat decizia de a instala această componentă, este important să cunoașteți avantajele acesteia. Deoarece pe site-ul meu vorbim despre SEO, în acest context vom lua în considerare această problemă. Componenta sh404SEF este remarcabilă prin faptul că:

    • creează un număr mare de adrese URL tehnice care se leagă de principal
    • formează astfel nucleul semantic al site-ului din titlurile paginii, care determină tema site-ului
    • Ulterior, PS, după ce a caracterizat subiectul site-ului, ia în considerare interogări de căutare tematice, pentru care creați pagini noi, relevante pentru site-ul dvs.
    • acest lucru ridică site-ul dvs. în rezultatele căutării pentru interogări tematice, deoarece site-ul este relevant și autoritar în ochii motorului de căutare
    • la rândul său, acest lucru economisește semnificativ bugetul link-ului și vă permite să introduceți TOP-urile motoarelor de căutare prin crearea de conținut

    Deci, pentru a configura sh404SEF, asigurați-vă că secțiunea sau categoria de produse apare în bara de url. Dacă secțiunea, categoria și produsul în sine (numele acestora) nu ocupă mult spațiu în browser, le puteți afișa pe toate. Cu toate acestea, acest lucru se aplică numai adreselor URL necirilice, din motivele de mai sus.

    Din aceasta putem concluziona că, dacă componenta sh404SEF este instalată pe site și a fost configurată anterior pentru a genera adrese URL chirilice, atunci nu ar trebui să ștergeți componenta. Este recomandabil să o reconfigurați astfel încât să se formeze url-uri în alfabetul latin. Reindexarea site-ului PS depinde de frecvența vizitelor efectuate de roboții de căutare. Dacă site-ul este actualizat mai des, atunci roboții îl vizitează mai des. În acea perioadă de timp, în timp ce are loc re-indexarea, aveți grijă de aspectul paginii 404, oferiți vizitatorilor acces rapid la pagina principală a site-ului, categoriile necesare și secțiunile de meniu, produse etc.

    Acest articol nu oferă un răspuns neechivoc la întrebarea - să utilizați sau nu urluri chirilice? Cu toate acestea, sper că avantajele și dezavantajele de mai sus ale utilizării acestora vă vor ajuta să luați decizia corectă în această privință.