Koi Code Tablica 8. Koi8-R kodiranje

- Odlazak (@Comradzampolit) 17. avgusta 2017

Kako funkcionira koi8-r?

KOI8-R je osmo-bitna kodna stranica dizajnirana za kodiranje slova ćiriličnih abeceda. Programeri su na takav način postavili simbole ruske abecede da su položaji simbola ćirilice odgovarali svojim fonetskim analozima na engleskoj abecedi na dnu tablice. A ako u tekstu napišete u ovom kodiranju, da biste uklonili osmi malo svakog simbola, tada se dobija tekst sličan latinopisnim slovima.

Takav je mjenjačni kôd korišten u sedamdesetima na računaru serije EU EU, a od sredine osamdesetih počelo je koristiti ga u prvim ruskim verzijama. operativni sistem Unix.

Kodiranje je bilo da je svaki simbol dodijeljen jedinstveni kod: od 00000000 do 11111111., prema tome, osoba je razlikovala simbole na njihovom dizajnu i računaru - prema njihovom kodu.

Je li Chernova kodiranje sada?

Ne. Bila je relevantna za stare osam-bitne računare, sada se Unicode uglavnom koristi u različitim formatima.

Koi8-r kodiranje

Kodiranje ISO 8859-5

ISO 8859-5

Alternativno kodiranje

"Alternativno kodiranje" - Na osnovu kodne stranice CP437, gdje se svi specifični europski simboli u drugom poluvremenu zamjenjuju ćirilicom, ostavljajući pseudografske znakove netaknutom. Slijedom toga, to ne pokvari vrstu programa koristeći tekstualne prozore, a također pruža upotrebu ćiriličnih znakova u njima.

Povijesno je bilo mnogo alternativnih opcija kodiranja, ali sve razlike se odnose samo na regiju 0xF0 - 0xFF (240-255). Konačni standard bio je kodiranje IBM CP866, čija je podrška dodana u MS-DOS verziju 6.22 (sve vrste "samostalnih" pukotina korištene su. Alternativno kodiranje je još uvijek živa i izuzetno popularna u okruženju DOS i OS / 2 . Pored toga, ovo kodiranje se bilježi imena B. sistem podataka Debeo. CP866 se i dalje koristi u konzoli ruskih sistema windows porodica NT.

.Aa.

.C.c.

.D.

.E.e.

.F .f.

A 410.

B 411.

412.

G 413.

D 414.

E 415.

416.

S 417.

I 418.

TH 419.

K 41a.

L 41b.

M 41C.

H 41D.

O 41e.

P 41F.

P 420.

Sa 421.

T 422.

423.

F 424

X 425.

C 426.

H 427.

W 428.

Shch 429.

Kommersant 42a.

42b.

B 42C.

E 42d.

YU 42E.

Ja sam 42f.

SVEDOK JOVANOVIĆ - ODGOVOR:

A 430.

B 431.

432.

G 433.

D 434.

E 435.

2036.

S 437.

i 438.

TH 439.

Do 43a.

L 43b.

m 43c.

H 43d.

O 43E.

P 43F.

░ 2591

▒ 2592

▓ 2593

│ 2502

┤ 2524

╡ 2561

╢ 2562

╖ 2556

╕ 2555

╣ 2563

║ 2551

╗ 2557

╝ 255D.

╜ 255c.

╛ 255b.

┐ 2510

└ 2514

┴ 2534.

┬ 252c.

├ 251c.

─ 2500

┼ 253c.

╞ 255e.

╟ 255F.

╚ 255a.

╔ 2554

╩ 2569

╦ 2566

╠ 2560

═ 2550

╬ 256c.

╧ 2567

╨ 2568

╤ 2564

╥ 2565

╙ 2559

╘ 2558

╒ 2552

╓ 2553

╫ 256b.

╪ 256a.

┘ 2518

┌ 250c.

█ 2588

▄ 2584

▌ 258C.

▐ 2590

▀ 2580

R 440.

od 441.

T 442.

443.

F 444.

X 445.

C 446.

H 447.

SH 448.

Shch 449.

Kommersant 44a.

S 44B.

B 44c.

E4D.

YU 44e.

Ja sam 44f.

E 301.

ё 451.

Є 404.

є 454.

Ї 407.

ї 457.

Ў 40e.

ў 45e.

° B0.

∙ 2219

· B7.

√ 221A.

№ 2116

¤ A4.

■ 25A0.

A0.

Dakle 8859-5 - 8-bitno kodiranje iz serije ISO-8859 za snimanje ćirilice. U Rusiji se gotovo ne koristi. Općenito, ISO 8859-5 nije baš prikladno kodiranje, jer nema mnogo potrebnih znakova, kao što su crtica (-), prigušnica (°), stepeni (°), itd.

.Aa.

.C.c.

.D.

.E.e.

.F .f.

8a.

8b.

8c.

8d.

8e.

8f.

9a.

9b.

9c.

9d.

9e.

9f.

SVEDOK JOVANOVIĆ - ODGOVOR:

A0.

E 301.

402 €.

Ѓ 403.

Є 404.

Ѕ 405.

° 406.

Ї 407.

J 408.

Љ 409.

Nj 40a.

Ć 40b.

Ќ 40c.

Oglas

Ў 40e.

Џ 40f.

A 410.

B 411.

412.

G 413.

D 414.

E 415.

416.

S 417.

I 418.

TH 419.

K 41a.

L 41b.

M 41C.

H 41D.

O 41e.

P 41F.

P 420.

Sa 421.

T 422.

423.

F 424

X 425.

C 426.

H 427.

W 428.

Shch 429.

Kommersant 42a.

42b.

B 42C.

E 42d.

YU 42E.

Ja sam 42f.

A 430.

B 431.

432.

G 433.

D 434.

E 435.

2036.

S 437.

i 438.

TH 439.

Do 43a.

L 43b.

m 43c.

H 43d.

O 43E.

P 43F.

R 440.

od 441.

T 442.

443.

F 444.

X 445.

C 446.

H 447.

SH 448.

Shch 449.

Kommersant 44a.

S 44B.

B 44c.

E4D.

YU 44e.

Ja sam 44f.

№ 2116

ё 451.

452.

ѓ 453.

є 454.

ѕ 455.

І 456.

ї 457.

J 458.

љ 459.

Nj 45A.

Ć 45b.

ќ 45c.

§ A7.

ў 45e.

џ 45f.

KOI-8 (šifra dijeljenja informacija, 8 bita), koi8 - Osam-bitni standard kodiranja simbola u računarskoj nauci. Dizajniran za kodiranje slova ćiriličnih alfabeta. Tu je i sedam-bitna verzija verzije kodiranja - KOI-7. KOI-7 i KOI-8 su opisani u Gost 19768-74 (sada nevažećim).

Koi-8 programeri stavili su simbole ruske abecede na vrhu proširenog ASCII tablice na takav način da položaji ćirilice odgovaraju svojim fonetskim analozima na engleskoj abecedi na dnu tablice. To znači da ako u tekstu napiše u Koi-8 da biste uklonili osmi malo svakog simbola, onda ispada "čitljiv" tekst, iako ga pišu latino simboli. Na primjer, riječi "ruski tekst" pretvorile bi se u "Russkij Tekst". Kao nuspojava, pokazali su se simboli ćirilice koji se mogu organizirati po abecednom redu.

.Aa.

.C.c.

.D.

.E.e.

.F .f.

─ 2500

│ 2502

┌ 250c.

┐ 2510

└ 2514

┘ 2518

├ 251c.

┤ 2524

┬ 252c.

┴ 2534.

┼ 253c.

▀ 2580

▄ 2584

█ 2588

▌ 258C.

▐ 2590

░ 2591

▒ 2592

▓ 2593

⌠ 2320

■ 25A0.

∙ 2219

√ 221A.

≈ 2248

≤ 2264

≥ 2265

A0.

⌡ 2321

° B0.

² b2.

· B7.

÷ F7.

SVEDOK JOVANOVIĆ - ODGOVOR:

═ 2550

║ 2551

╒ 2552

ё 451.

╓ 2553

╔ 2554

╕ 2555

╖ 2556

╗ 2557

╘ 2558

╙ 2559

╚ 255a.

╛ 255b.

╜ 255c.

╝ 255D.

╞ 255e.

╟ 255F.

╠ 2560

╡ 2561

E 301.

╢ 2562

╣ 2563

╤ 2564

╥ 2565

╦ 2566

╧ 2567

╨ 2568

╩ 2569

╪ 256a.

╫ 256b.

╬ 256c.

YU 44e.

A 430.

B 431.

C 446.

D 434.

E 435.

F 444.

G 433.

X 445.

i 438.

TH 439.

Do 43a.

L 43b.

m 43c.

H 43d.

O 43E.

P 43F.

Ja sam 44f.

R 440.

od 441.

T 442.

443.

2036.

432.

B 44c.

S 44B.

S 437.

SH 448.

E4D.

Shch 449.

H 447.

Kommersant 44a.

YU 42E.

A 410.

B 411.

C 426.

D 414.

E 415.

F 424

G 413.

X 425.

I 418.

TH 419.

K 41a.

L 41b.

M 41C.

H 41D.

O 41e.

P 41F.

Ja sam 42f.

P 420.

Sa 421.

T 422.

423.

416.

412.

B 42C.

42b.

S 417.

W 428.

E 42d.

Shch 429.

H 427.

Kommersant 42a.

Kodiranje koi8-u (ukrajinski)

Koi-8 je postao prva ruska standardizovana kodiranja na Internetu.

IETF je odobrio nekoliko RFC-a prema opcijama kodiranja KOI-8:

RFC 1489 - KOI8-R (slova ruske abecede);
RFC 2319 - KOI8-U (slova ukrajinske abecede);
RFC 1345 - ISO-IR-111 (uz grešku u određivanju glavnog raspona).

U gornjim tablicama brojevi su označeni heksadecimalnim kodom slova u Unicodeu.

Koi8-R kodiranje (ruski)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
8.	─ 2500	│ 2502	┌ 250c.	┐ 2510	└ 2514	┘ 2518	├ 251C.	┤ 2524	┬ 252c.	┴ 2534	┼ 253c.	▀ 2580	▄ 2584	█ 2588	▌ 258C.	▐ 2590
9.	░ 2591	▒ 2592	▓ 2593	⌠ 2320	■ 25A0.	∙ 2219	√ 221a.	≈ 2248	≤ 2264	≥ 2265	A0.	⌡ 2321	° B0.	² B2.	· B7.	÷ F7.
SVEDOK JOVANOVIĆ - ODGOVOR:	═ 2550	║ 2551	╒ 2552	e. 451	╓ 2553	╔ 2554	╕ 2555	╖ 2556	╗ 2557	╘ 2558	╙ 2559	╚ 255a.	╛ 255b	╜ 255C.	╝ 255D.	╞ 255e.
B.	╟ 255F.	╠ 2560	╡ 2561	E. 401	╢ 2562	╣ 2563	╤ 2564	╥ 2565	╦ 2566	╧ 2567	╨ 2568	╩ 2569	╪ 256a.	╫ 256b.	╬ 256c.	© A9.
C.	yu 44e.	ali 430	b. 431	c. 446	d. 434	e. 435	f. 444	g. 433	h. 445	i 438	j. 439	do 43a.	l. 43b.	m. 43c.	n. 43d.	o 43e.
D.	p 43f.	ja 44f.	r 440	od 441	t. 442	w. 443	j. 436	u 432	b 44c.	s 44b.	z. 437	sh 448	e. 44d.	sh 449	c. 447	kommersant 44a.
E.	Yu 42e.	Ali 410	B. 411	C. 426	D. 414	E. 415	F. 424	G. 413	H. 425	I 418	J. 419	Do 41a.	L. 41b.	M. 41c.	N. 41d.	O 41e.
F.	P 41f.	Ja 42f.	R 420	Od 421	T. 422	W. 423	J. 416	U 412	B 42c.	S 42b.	Z. 417	Sh 428	E. 42d.	Sh 429	C. 427	Kommersant 42a.

Ostale opcije

Prikazane su samo ne odgovarajuće tablice, jer se sve drugo poklapa.

Kodiranje koi8-u (rusko-ukrajinsko)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
SVEDOK JOVANOVIĆ - ODGOVOR:	═ 2550	║ 2551	╒ 2552	e. 451	є 454	╔ 2554	і 456	ї 457	╗ 2557	╘ 2558	╙ 2559	╚ 255a.	╛ 255b	ґ 491	╝ 255D.	╞ 255e.
B.	╟ 255F.	╠ 2560	╡ 2561	E. 401	Є 404	╣ 2563	І 406	Ї 407	╦ 2566	╧ 2567	╨ 2568	╩ 2569	╪ 256a.	Ґ 490	╬ 256c.	© A9.

Koi8-ru kodiranje (rusko-belorusko-ukrajinsko)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
SVEDOK JOVANOVIĆ - ODGOVOR:	═ 2550	║ 2551	╒ 2552	e. 451	є 454	╔ 2554	і 456	ї 457	╗ 2557	╘ 2558	╙ 2559	╚ 255a.	╛ 255b	ґ 491	ў 45e.	╞ 255e.
B.	╟ 255F.	╠ 2560	╡ 2561	E. 401	Є 404	╣ 2563	І 406	Ї 407	╦ 2566	╧ 2567	╨ 2568	╩ 2569	╪ 256a.	Ґ 490	Ў 40e.	© A9.

Koi8-C kodiranje (centralna Azija)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
8.	ғ 493	җ 497	қ 49b.	ҝ 49d.	ң 4a3.	ү 4AF.	ұ 4b1	ҳ 4B3.	ҷ 4B7.	ҹ 4B9.	һ 4bb.	▀ 2580	ә 4D9.	ӣ 4e3.	ө 4e9.	ӯ 4ef.
9.	Ғ 492	Җ 496	Қ 49a.	Ҝ 49c.	Ң 4a2.	Ү 4ae.	Ұ 4B0.	Ҳ 4B2.	Ҷ 4B6.	Ҹ 4B8.	Һ 4BA.	⌡ 2321	Ә 4D8.	Ӣ 4e2.	Ө 4e8.	Ӯ 4ee.
SVEDOK JOVANOVIĆ - ODGOVOR:	A0.	ђ 452	ѓ 453	E. 451	є 454	ѕ 455	і 456	ї 457	ј 458	љ 459	њ 45a.	ћ 45b.	ќ 45c.	ґ 491	ў 45e.	џ 45f.
B.	№ 2116	Ђ 402	Ѓ 403	E. 401	Є 404	Ѕ 405	І 406	Ї 407	Ј 408	Љ 409	Њ 40a.	Ћ 40b.	Ќ 40c.	Ґ 490	Ў 40e.	Џ 40f.

Koi8-T kodiranje (Tadžik)

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
8.	қ 49b.	ғ 493	‚ 201. godine	Ғ 492	„ 20120.	… 2026	† 2020	‡ 2021		‰ 2030	ҳ 4B3.	‹ 2039	Ҳ 4B2.	ҷ 4B7.	Ҷ 4B6.
9.	Қ 49a.	‘ 2018	’ 2019	“ 201c.	” 201d.	2022	– 2013	- 2014		™ 2122		› 203a.
SVEDOK JOVANOVIĆ - ODGOVOR:		ӯ 4ef.	Ӯ 4ee.	E. 451	¤ A4.	ӣ 4e3.	¦ A6.	§ A7.				« AB	¬ Ac	Oglas	® AE
B.	° B0.	± B1.	² B2.	E. 401		Ӣ 4e2.	¶ B6.	· B7.		№ 2116		» Bb.				© A9.

KOI8-O, kodiranje koi8-s (slavenski, stari pravopis)

0407

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
8.	Ђ 0402	Ѓ 0403	¸ 00B8.	ѓ 0453	„ 20120.	… 2026	† 2020	§ 00A7.	€ 20AC.	¨ 00A8.	Љ 0409	‹ 2039	Њ 040a.	Ќ 040C.	Ћ 040b.	Џ 040f.
9.	ђ 0452	‘ 2018	’ 2019	“ 201c.	” 201d.	2022	– 2013	— 2014	£ 00A3.	· 00B7.	љ 0459	› 203a.	њ 045a.	ќ 045C.	ћ 045b.	џ 045F
SVEDOK JOVANOVIĆ - ODGOVOR:	00A0.	ѵ 0475	ѣ 0463	e. 0451	є 0454	ѕ 0455	і 0456	ї 0457	ј 0458	® 00AE.	™ 2122	« Batina	ѳ 0473	ґ 0491	ў 045E.	´ 00B4.
B.	° 00B0.	Ѵ 0474	Ѣ 0462	E. 0401	Є 0404	Ѕ 0405	І 0406	Ї 0407	Ј 0408	№ 2116	¢ 00A2	» 00BB.	Ѳ 0472	Ґ 0490	Ў 040e.	© 00A9.

ISO-IR-111, KOI8-E kodiranje

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
SVEDOK JOVANOVIĆ - ODGOVOR:	00A0.	ђ 0452	ѓ 0453	e. 0451	є 0454	ѕ 0455	і 0456	ї 0457	ј 0458	љ 0459	њ 045a.	ћ 045b.	ќ 045C.	00ad	ў 045E.	џ 045F
B.	№ 2116	Ђ 0402	Ѓ 0403	E. 0401	Є 0404	Ѕ 0405	І 0406	Ї 0407	Ј 0408	Љ 0409	Њ 040a.	Ћ 040b.	Ќ 040C.	¤ 00A4.	Ў 040e.	Џ 040f.

Koi8-Jedinstveno kodiranje, KOI8-F

Koi8-objedinjeno kodiranje (KOI8-F) predlaže FINGERTIP softver.

	.0	.1	.2	.3	.4	.5	.6	.7	.8	.9	.Aa.	.B	.C.c.	.D.	.E.e.	.F .f.
8.	─ 2500	│ 2502	┌ 250c.	┐ 2510	└ 2514	┘ 2518	├ 251C.	┤ 2524	┬ 252c.	┴ 2534	┼ 253c.	▀ 2580	▄ 2584	█ 2588	▌ 258C.	▐ 2590
9.	░ 2591	‘ 2018	’ 2019	“ 201c.	” 201d.	2022	– 2013	— 2014	© 00A9.	™ 2122	00A0.	» 00BB.	® 00AE.	« Batina	· 00B7.	¤ 00A4.
SVEDOK JOVANOVIĆ - ODGOVOR:	00A0.	ђ 0452	ѓ 0453	e. 0451	є 0454	ѕ 0455	і 0456	ї 0457	ј 0458	љ 0459	њ 045a.	ћ 045b.	ќ 045C.	ґ 0491	ў 045E.	џ 045F
B.	№ 2116	Ђ 0402	Ѓ 0403	E. 0401	Є 0404	Ѕ 0405	І 0406	Ї 0407	Ј 0408	Љ 0409	Њ 040a.	Ћ 040b.	Ќ 040C.	Ґ 0490	Ў 040e.	Џ 040f.

Opcije za nepušače KOI-8

U nekim je zemljama CMEAS kreirali od modifikacija KOI-8 za nacionalne opcije latice. Osnovna ideja bila je ista - s "rezom" osmih bita, tekst bi trebao ostati više ili manje razumljiv.

- Pa, počnite! - Said Doolokh.
"Pa", rekao je Pierre, još uvek se smeška. - Uplašio sam se. Bilo je očito da se slučaj, koji je tako lako počeo, više nije mogao spriječiti da se to događa, već bez obzira na volju ljudi, a trebala je biti učinjena. Denisov se prvi put došao u barijeru i proglasio:
- Budući da je P "Svatstvoni odbio" njima ", da li nije moguće pokrenuti: uzmi puške i prema riječi t" i početi se konvergirati.
"G ..." AZ! Dva! T "i! ..." Denisov je ljutito viknuo i preselio se na stranu. Obojica su otišli na prostoljene staze bliže i bliže, u magli koja se međusobno prepoznaju. Protivnici su imali pravo, izvadivši barijeru, pucaju kad netko želi. Shelkh je bio spor, bez odgajanja pištolja, zavirivši sa svojim svijetlim, sjajnim, plavim očima u lice svog protivnika. Njegova usta, kao i uvijek, imali su osmijeh poput.
- Pa kad želim - mogu pucati! - Said Pierre, sa rečju tri brze korake su napreduju, sukobi iz trotanske šetnice i hodaju celom snegu. Pierre je držao pištolj, protezajući se prema naprijed desna rukaNavodno se plaši kako iz ovog pištolja ne ubijete sebe. On je marljivo posjedovao lijevu ruku, jer je hteo da podrži desnu ruku i znao je da je nemoguće. Prenošenje koraka šest i sići sa staze u snegu, Pierre je pogledao noge, opet pogledao Dolokhov i povlačivši prst, kako je učio, pucao. Ne očekujem tako jak zvuk, Pierre se drhtao sa njegove pucanja, a zatim se nasmiješio svoj dojam i zaustavio se. Dim, posebno debeo iz magle, spriječio ga je da ga vidi u prvom trenutku; Ali još jedan hitac koji je čekao, nije slijedio. Saslušani su samo Dolohovski žurni koraci, a njegova figura izgledala je zbog dima. Jednom rukom držao se iza lijeve strane, drugi je komprimirao izostavljeni pištolj. Lice mu je bilo blijedo. Rostov je pokrenuo gore i nešto mu je rekao.
"Nije ... e ... T", rekao je Solokov kroz zube, "ne, ne preko", a ne čine još neke padne, čineći korake do sablja, pao na snijeg pored nje. Njegova lijeva ruka bila je u krvi, prevlačio je o Sutuku i naslonio je. Lice mu je bilo blijedo, namršteno i drhtanje.
"Napisat ću ..." počeo podijeliti, ali nije mogao odmah reći ... "Molim vas, složio se sa naporom." Pierre, jedva držeći sobove, trčao je do Dolohova i želio da prođe kroz prostor koji razdvaja prepreke, kao što je Shahov viknuo: - na barijeru! - A Pierre, koji je shvatio šta je bilo, zaustavio se na svom sabre. Samo 10 koraka podijelilo ih je. Shelhovhov je spustio glavu do snega, pohlepno ugrizao sneg, opet podigao glavu, oporavio se, pokupio noge i sjeo, tražeći čvrsto težište. On je plijesan hladan snijeg i sisati; Usne su mu drhtale, ali sve se smiješi; Oči su blistale napore i maternica posljednjih prikupljenih snaga. Podigao je pištolj i počeo ciljati.
"Strana, zatvori pištolj", reče Nesvitsky.
- 3ak "ja! - Bez obzira, čak i Denisov povikao na svog protivnika.
Pierre s krotkim osmijehom žaljenja i pokajanja, bespomoćno stavljajući noge i ruke, ravno s širokim grudima stajali su prije Dolokhova i nažalost ga pogledali. Denisov, Rostov i Nesvitsky popeli su se. Istovremeno su čuli snimak i zli krik Dologova.
- By! - Pokazao je Shahov i nemoćni ležati na snegu. Pierre je zgrabio glavu i okrenuo se, otišao u šumu, šetajući u potpunosti u snegu i naglas osudio nepoznate riječi:
- Glupo ... glupo! Smrt ... Lažno ... - Rekao je da puca. Nesvitsky ga je zaustavio i uzeo svoj dom.
Rostov sa Denisovom imao je sreće ranjeni Dolokhov.
Shelukhov, tiho, sa zatvorenim očima, leže u salazu i nije odgovorio na pitanja koja je učinio; Ali, ušli u Moskvu, iznenada se probudio i, s poteškoćama podižući glavu, uzeo Rostov koji je sjedio rukom. Rostov je pogodio potpuno promijenio i neočekivano entuzijastičan izraz lica Dologov-a.
- Pa? Kako se osjećaš? - upita Rostov.
- SPLY! Ali ne i poanta. Moj prijatelju ", rekao je stazom s povremenim glasom, - gdje smo? Znam da smo u Moskvi. Ja nisam ništa, ali ubio sam je, ubijen ... neće je uzeti. Neće se dogoditi ...
- SZO? - upita Rostov.
- Moja majka. Moja majka, moj anđeo, moj divan anđeo, majka, - i Solohov povikao sam, stisnuo je Rostovovu ruku. Kad se smirilo, objasnio je Rostov, koji živi sa majkom, da ako ga majka vidi kako umire, neće ga uzimati. Molio je Rostov da ode na nju i pripremi je.
Rostov je prešao naprijed da ispuni nalog, a on je saznao veliko iznenađenje da je to naučila, ovaj Buyan, Brener Solohov živjela u Moskvi sa starom ženom i grmljenom sestrom i brat.

Pierre je nedavno rijetko vidio svoju ženu sa pogledom na oku. I u Sankt Peterburgu, a u Moskvi, njihova je kuća bila stalno puna gostiju. Sljedeća noć nakon dvoboja, on, kao što je često, nije išao u spavaću sobu, već je ostao u svom ogromnom, očinskom uredu, u samoj u kojem je umrla grofa prosjaka.
Suočio se s kaučem i htio je zaspati, kako bi zaboravio sve što je bilo s njim, ali to nije mogao učiniti. Takva oluja osjećaja, misli, sjećanja su se iznenada podizala u svojoj duši da ne samo ne bi mogao spavati, ali nije mogao sjediti na licu mjesta i morao je skakati iz sofe i hodati po sobi. Predstavljen mu je u početku nakon braka, sa otvorenim ramenima i umornoj, strastvenom izgledu, a odmah pored nje izgledali su se lijepim, bezobraznim i čvrsto ruganim licem Dolokhova, kako je bilo na večeri, i istog lica Dologov, blijedo, drhtanje I pati kako je bilo kad se okrenuo i pao na sneg.
"Šta je bilo? - Pitao je sebe. - Ubio sam ljubavnika, da, ubio ljubavnika svoje žene. Da, bilo je. Iz onoga što? Kako sam došao na ovo? - Zato što si se udala za nju - odgovorila je na unutrašnju glasu.
"Ali šta sam kriv? Pitao. - U činjenici da ste se oženili da je volite, u stvari da ste prevarili sebe i njene, - i on je okupljao taj trenutak nakon večere u princu Vasilla, kada je rekao ove riječi koje se ne mogu nazvati: "je vous Aime ". [Volim te.] Sve iz ovoga! Tada sam se osećao, pomislio sam, tada sam osjetio da to nije ono što nisam imao nikakva prava. Pa izašao. " Sjetio se medenog mjeseca i pocrvenio sjećanjima. Posebno živahne, sjećanja na to kako jedan dan, ubrzo nakon njegovog braka, bio je 12 metara dana, u svilenom kaputu došao je iz spavaće sobe u kancelariju i našao šef šefa menadžera, koji se zamišljeno pitao, Pogledali su Pierreovo lice, na njegovom ogrtaču i malo se nasmiješi, kao da izražavajući ovaj osmijeh poštujući saučešće sreće njegovog principa.
"I koliko puta sam se ponosio na to, bio sam ponosan na njenu veliku ljepotu, njen sekularni takt, pomislio je; Bila je ponosna na kuću u kojoj je uzela cijeli Petersburg, ponosan na svoju nepristupačnost i ljepotu. Pa, na šta sam ponosan?! Tada sam mislio da je nisam razumio. Koliko god često razmišljam o njenom karakteru, rekao sam sebi da sam kriv da je ne razumijem, ne razumijem ovu svečanost, zadovoljstvo i odsustvo bilo kakve ovisnosti i želje, a cijeli utjecaj bio je u toj strašnoj riječi Da je ona depresivna žena: rekla sam da sam strašna riječ, a sve je postalo jasno!
"Anatola je putovala na nju da uzima novac od nje i poljubio je u njenu gola ramena. Nije mu dala novac, ali je dozvolila da se poljubi. Otac, šali se, uzbudi joj ljubomoru; Ona, sa opuštenim osmijehom, rekla je da nije toliko glupa da bi bila ljubomorna: neka to učini da želi, rekla je o meni. Pitao sam je jednom, hoće li oseća znakove trudnoće. Prezirno se nasmijala i rekla da nije budala da želi imati djecu i da ne bi imala djecu od mene. "
Zatim se sjetio nepristojnosti, jasnoće njenih misli i vulgarnost izraza svojstvena uprkos njenom odgoju u najvišem aristokratskom krugu. "Nisam neka vrsta budale ... Pokušaću sebe ... Allez Vous Proccener", rekla je [izlazi,], rekla je. Često gledajući njen uspjeh u očima starih i mladića i žena, Pierre nije mogao razumjeti zašto je nije volio. Da, nikad je nisam volio, rekao sam sebi Pierreu; Znao sam da je ona bila deprodarana žena, ponovio se, ali nije se trudio da to prizna.

Pozdrav, dragi web lokacija za čitati Blog. Danas ćemo razgovarati s vama o tome gdje krakoyarbra dolazi iz i u programe, koje tekstualne kodiranje postoje i koje od njih treba koristiti. Razmotrimo detaljno povijest njihovog razvoja, u rasponu od osnovnog ASCII-ja, kao i njegove proširene verzije CP866, KOI8-R, Windows 1251 i završavajući modernim kodovima Unicode UTF 16 i 8 konzorcijuma.

Netko se ti podaci mogu činiti nepotrebnim, ali znali biste koliko pitanja do mene tačno zabrinute pukotine (ne čitanje niza znakova). Sada ću imati priliku poslati sve na tekst ovog članka i samostalno pretražiti vaše cipele. Pa, pripremite se za apsorpciju informacija i pokušajte pratiti pripovijedanje.

ASCII - Osnovna kodiranja teksta Latiza

Razvoj tekstualnih kodiranja javlja se istovremeno sa formiranjem IT industrije, a za to vrijeme imali su vremena da se podvrgnu dosta promjena. Istorijski, sve je počelo sa prilično štetnim u ruskom izgovoru EbcDića, što je omogućilo kodiranje slova latinske abecede, arapske brojeve i interpunkcijske oznake sa kontrolnim simbolima.

Ali ipak polazna točka za razvoj modernih tekstualnih kodiranja treba smatrati poznatim ASCII. (Američki standardni kod za razmjenu informacija, koji se na ruskom obično izgovara kao "Aski"). Opisuje prvih 128 znakova od najčešće koje koriste korisnike koji govore engleski jezik -, arapski brojevi i interpunkcijski znakovi.

Čak i u ovih 128 znakova opisanih u ASCII-ja, neki servisni simboli srušili su zagrade, rešetke, zvjezdice itd. Zapravo, sami ih možete vidjeti:

Ovih 128 znakova iz početne verzije ASCII-ja postali su standard, a u bilo kojem drugom kodiranju definitivno ćete se susresti i stojite da će biti na takav način.

Ali činjenica je da uz pomoć jednog bajta informacija nije 128, već čak 256 različitih vrijednosti (dva do stepena osam jednaka 256), pa nakon bazna verzija Aski se pojavio niz napredne kodiranje ASCIIPored 128 glavnih znakova, moguće je i kodirati nacionalni simboli kodiranja (na primjer, ruski).

Evo, vjerovatno, vrijedi malo više o brojevnom sustavu koji se koristi u opisu. Prvo, kao što znate sve, računar radi samo brojevima u binarnom sistemu, naime sa nulama i jedinicama ("Boulev algebra", ako je neko držao u Institutu ili u školi). Svako od kojih je dovršen do određene mjere, počevši od nule i u dva u sedmom:

Nije teško shvatiti da su sve moguće kombinacije nula i jedinica u takvom dizajnu mogu biti samo 256. Prevedi broj iz binarnog sustava u decimalu je sasvim jednostavan. Neophodno je jednostavno preklopiti sve stupnjeve dvostrukih iznad onoga što jedan stoji.

U našem primjeru, ispada 1 (2 do stupnja nule) plus 8 (dva do stepena 3), plus 32 (dva puta u petoj mjeri), plus 64 (u šestoj), plus 128 (u sedmom) . Ukupno dobiva 233 u decimalni sistem Bilješka. Kao što vidite, sve je vrlo jednostavno.

Ali ako pogledate tablicu sa ASCII znakovima, vidjet ćete da su predstavljeni u heksadecimalnom kodiranju. Na primjer, "zvjezdica" odgovara Askiju heksadecimalan 2a. Vjerovatno to znate heksadecimalni sistem Brojevi se koriste pored arapskih brojeva, latino pisma iz (znači deset) do F (znači petnaest).

Pa, tako i za transfer binarni brojevi U heksadecimalnom Pribjegavaju sljedećem jednostavnom i vizualnom putu. Svaki bajt informacija razbijen je u dva dijela četiri bita, kao što je prikazano u gornjoj ekranu. Tako U svakoj polovici bajta binarni kod može biti kodiran samo za šesnaest vrijednosti (dva u četvrtoj mjeri), što može biti lako zastupljeno šesterokutnim.

Štaviše, u lijevoj polovini bajta bit će potrebno razmotriti razmjeru iz nule, a ne kao što je prikazano na snimku zaslona. Kao rezultat toga, ne-dobrim računanjem, dobivamo da je broj E9 kodiran u snimku zaslona. Nadam se da ste bili razumljivi tok mog rezonovanja i učvršćivanja ovog Rebusa. Pa, sada ćemo nastaviti, zapravo razgovarati o kodiranju teksta.

Proširene verzije Aska - CP866 i KOI8-R kodiranje sa pseudografom

Dakle, počeli smo govoriti o ASCII, što je bilo kao polazište za razvoj svih modernih kodiranja (Windows 1251, Unicode, UTF 8).

U početku su položili samo 128 znakova latino abecede, arapskih brojeva i nešto drugo, ali u proširenoj verziji bilo je moguće koristiti svih 256 vrijednosti koje se mogu kodirati u jednoj paštetima. Oni. Prilika da se dobi dodaju simbole slova njegovog jezika u Pita.

Ovdje će biti potrebno još jednom ometati da se pojasni - zašto vam treba kodiranje Tekstovi i zašto je tako važno. Znakovi na ekranu vašeg računara formiraju se na osnovu dvije stvari - skupova vektorskih oblika (reprezentacije) svih vrsta znakova (oni su u datotekama CO) i kod koji vam omogućava da izvučete ovaj skup vektorskih oblika ( FONT datoteka), lik je umetnut na pravo mjesto.

Jasno je da su fontovi odgovorni za vektorske oblike, ali operativni sistem i programi koji se koriste u njemu su odgovorni za kodiranje. Oni. Svaki tekst na vašem računaru bit će skup bajtova u svakom od kojih je kodiran jedan pojedinačni simbol ovog teksta.

Program koji prikazuje ovaj tekst na ekranu (urednik teksta, pretraživač itd.), Prilikom raščlanjivanja koda čita kodiranje sljedećeg znaka i pretražuje odgovarajući vektorski oblik u Željena datoteka Font koji je povezan za prikaz ovog tekstualnog dokumenta. Sve je jednostavno i pouzdano.

Dakle, kodirati bilo koji simbol koji nam je potreban (na primjer, iz nacionalnog abecede), moraju se završiti dva uvjeta - vektorski oblik ovog znaka trebao bi biti u korištenom fonta i ovaj simbol može biti kodiran u proširenim ASCII kodićima u jedan bajt . Stoga postoji čitava gomila takvih opcija. Samo za kodiranje simbola ruskog jezika postoji nekoliko sorti proširenih guzica.

Na primjer, u početku se pojavio CP866.U kojem je bilo moguće koristiti simbole ruske abecede i bila je proširena verzija ASCII-ja.

Oni. Njegov gornji dio potpuno se poklopio s osnovnom verzijom ASKI (128 simbola latinskog, brojeva, pa čak i bilo koje labuda), koji je na snimku zaslona, \u200b\u200bali već donji dio CP866 tabele kodiranja imao je navedenu u snimku zaslona Nešto ispod pogleda i omogućilo je kodirati još 128 znakova (ruska slova i bilo koje pseudografsko):

Vidite, u desnom stupcu, brojevi počinju sa 8, jer Brojevi od 0 do 7 odnose se na osnovni dio ASCII (vidi prvi snimka zaslona). Tako Rusko pismo "M" u CP866 imat će Kodeks 9c (na raskrižju odgovarajućih redova sa 9 i stupcem s brojem C u šesterokutnom broju), koji se može napisati u jednoj bajt informacijama, a ako Postoji odgovarajući font s ruskim likovima, ovo pismo bez problema bit će prikazano u tekstu.

Odakle dolazi ta količina pseudograferi u CP866.? Sve je to činjenica da je ovo kodiranje za ruski tekst razvijen u tim jarkoj godina, kada nije postojala takva distribucija grafičkih operativnih sistema kao sada. I u dosu i sličnim tekstualnim operacijama, pseudografski su dozvolili barem nekako diverzificirati dizajn tekstova i stoga obiluje CP866 i svim ostalim redovi iz ispuštanja proširenih verzija Aska.

CP866 Distribuirala IBM kompaniju, ali osim toga, razvijen je niz kodiranja za simbole ruskog jezika, na primjer, isti tip (produženi ASCII) može se pripisati Koi8-r.:

Načelo njegovog rada ostao je isti kao i CP866 opisano kasnije - svaki tekst teksta kodira jedan jedan bajt. Snimka zaslona prikazuje drugu polovinu koi8-R tabele, jer Prvo poluvrijeme u potpunosti je u skladu sa bazom ASUS, koji je prikazan na prvom snimku zaslona u ovom članku.

Među značajkama kodiranja KOI8-R, može se primijetiti da ruska slova u njenom tablici nisu po abecednom redu, poput ove, na primjer, izrađena u CP866.

Ako pogledate prvo snimke zaslona (osnovni dio, koji ulazi u sve proširene kodiranje), tada primijetite da se u koi8-R, ruska slova nalaze u istim tablicama tablice kao slova latinske abecede iz prvog dijela stol. To je učinjeno radi praktičnosti prelaska iz ruskih simbola na latino odbacivši samo jedan bit (dva u sedmog stepena ili 128).

Windows 1251 - Moderna verzija ASCII i zašto kreketi izađu

Daljnji razvoj tekstualnih kodiranja bio je zbog činjenice da su grafički operativni sustavi i potreba za korištenjem pseudografike u njima dobila popularnost. Kao rezultat toga, cijela grupa nastala, koja je u njihovoj suštini, još uvijek bila napredna verzija Aski-a (jedan tekst teksta kodiran je samo jednom bajkom informacija), ali bez upotrebe pseudografskih znakova.

Tretirali su takozvani ANSI kodiranje, koji je razvio Američki institut za standardizaciju. Naziv ćirilice i dalje je korišteno u nacrtavanju opcije uz podršku ruskog jezika. Primjer takvog primjera.

Bilo je povoljno razlikovalo od prethodno korištenog CP866 i KOI8-R u tome što je mjesto likova pseudograđa u njemu uzeo nedostajuće simbole ruske tipografije (opadajućeg znaka), kao i simbole koji se koriste u bliskoj slavićem Jezici (ukrajinski, bjeloruski, itd.):

Zbog ovog obilja kodiranja ruskog jezika, proizvođača fontova i proizvođača softver Stalno je izlazio glavobolju, a sa vama, dragi čitatelji, često su dobili one najozlučnije krakoyabryKad se zbrka uči sa verzijom koja se koristi u tekstu.

Vrlo često su izašli prilikom slanja i primanja poruka e-mailŠto je uzrokovalo stvaranje vrlo složenih transkodirnih tablica, koje u stvari nisu mogle riješiti ovaj problem u korijenu, a često su korisnici za prepisku korišteni za izbjegavanje zloglavnih krakozyabs-a kada se koriste ruske kodiranje takvog CP866, KOI8-R ili Windows 1251.

U suštini, Krakozyabry, prenoseći se, umjesto ruskog teksta, bili su rezultat nepravilna upotreba Kodiranje ovog jezikašto nije odgovaralo onoj u kojem je kodiran tekstualna poruka U početku.

Pretpostavimo da li su simboli kodirani sa CP866, pokušajte da se prikazuju pomoću tablice Windows 1251 kodne tablice, a zatim su ove najviše napukle (besmisleni skup znakova) i izvucite, u potpunosti zamenite tekst poruke.

Slična se situacija vrlo često pojavljuje na forumima ili blogovima, kada se tekst s ruskim znakovima greškom ne sprema u to kodiranje koje se koristi na zadanoj web stranici ili ne u tome tekst uređivačŠto dodaje kodu Sebestin nije vidljiv golim okom.

Na kraju, takva situacija s mnogim kodiranjem i stalno puze dizalice, mnogo umorni, bili su preduvjeti za stvaranje novih univerzalnih varijacija, što bi zamijenilo sve postojeće i riješeno na korijen problema sa pojavom ne čitljivi tekstovi. Pored toga, došlo je do problema sa jezicima sličnih Kineza, gdje su simboli jezika bili mnogo više od 256.

Unicode (Unicode) - Univerzalni kodovi UTF 8, 16 i 32

Te tisuće znakova jezičke grupe jugoistočne Azije nisu mogle biti opisane u jednoj podacima o paperu koji su dodijeljeni za kodiranje znakova u naprednim ASCII verzijama. Kao rezultat toga, stvoren je konzorcijum koji se zove Unicode (Unicode - Unicode Konzorcij) U suradnji mnogih IT lidera industrije (oni koji proizvode softver koji kodiraju željezo koje stvara fontove) koji su zainteresirani za pojavu kodiranja univerzalnog teksta.

Prva varijacija koja je objavljena pod pokroviteljstvom konzorcijuma Unicode bila je UTF 32.. Neigitalna cifra u ime kodiranja znači broj bitova koji se koriste za kodiranje jednog simbola. 32 bita su 4 bajta informacija koje će biti potrebne za kodiranje jednog jedinstvenog znaka u novom univerzalnom UTF kodiranju.

Kao rezultat toga, ista datoteka s tekstom kodiranim u proširenoj verziji ASCII i UTF-32 Will u potonjem slučaju imat će veličinu (težiti) četiri puta više. Loše je, ali sada imamo priliku kodirati broj znakova jednakim dva do trideset sekundi s pomoći UTF-a ( milijarde likovakoja će pokriti svaku stvarne vrijednosti sa kolosalnom marginom).

Ali mnoge zemlje sa jezicima Evropske grupe imaju tako ogroman broj znakova koji će uopšte koristiti u kodiranju i međutim, nije bilo potrebe kada koriste UTF-32, nisu dobili četverostruko povećanje U težini tekstualnih dokumenata, kao i rezultat, povećanje internetskih podataka i količina pohranjenih podataka. Ovo je puno, a niko nije mogao priuštiti takav otpad.

Kao rezultat razvoja Unicode pojavio se UTF-16što se pokazalo tako uspješno koje je podrazumevano usvojeno kao osnovni prostor za sve znakove koje koristimo. Koristi dva bajta za kodiranje jednog znaka. Da vidimo kako ova stvar izgleda.

U operativnom sistemu Windows možete proći duž staze "Start" - "Programi" - "Standard" - "Service" - "Tabela karaktera". Kao rezultat toga, tablica se otvara sa vektorskim oblicima svih instaliranih u vašim fontovima. Ako odaberete u " Dodatni parametri»Skup znakova Unicode, možete vidjeti za svaki font odvojeno cijeli raspon znakova koji su u njemu uključeni.

Usput, kliknite na bilo koji od njih, možete ga vidjeti dva Šifra u UTF-16 formatuSastoji se od četiri heksadecimalne cifre:

Koliko likova se može kodirati u UTF-16 koristeći 16 bita? 65 536 (dva do šesnaest), a ovaj broj je uzet za osnovni prostor u Unicodeu. Pored toga, postoje načini za kodiranje s njom i oko dva miliona znakova, ali ograničeno na prošireni prostor u milion tekstualnih simbola.

Ali čak ni ova uspješna verzija kodiranja Unicode nije donijela puno zadovoljstva onima koji su napisali, na primjer, programima samo na engleskom jeziku, jer nakon prelaska iz proširene verzije ASCII-a u UTF-16, težina dokumenata porasla je dva puta (jedan bajt po jednom simbolu u ASKI i dva bajta na istom simbolu u UTF-16).

To je upravo da bi se svima zadovoljili svima i sve u konzorcijumu Unicode odlučeno je da se smisli kodiranje varijabilne dužine. Zvao se UTF-8. Uprkos osam u naslovu, zaista ima promjenjivu dužinu, I.E. Svaki se tekst teksta može kodirati u niz jedan do šest bajtova.

U praksi, UTF-8 koristi samo raspon od jedne do četiri bajta, jer nema ništa teoretski moguće da bi bilo čemu podnese na četiri bajta Kodeksa. Svi latinični znakovi su kodirani u jednom bajtu, kao i u starom dobru ASCII.

Ono što je napomenuto, u slučaju kodiranja samo latiničnih, čak i tih programa koji ne razumiju unicode i dalje će pročitati što je kodirano u UTF-8. Oni. Osnovni dio Aska jednostavno je prešao na ovo sa konzorcijuma Unicode.

Ćirilični znakovi u UTF-8 kodiraju se u dva bajta i, na primjer, gruzijski - u tri bajta. Konzorcijum Unicode nakon stvaranja UTF-a 16 i 8 odlučio je glavni problem - sada imamo u fontovima se nalazi jedno kodni prostor. A sada njihovi proizvođači ostaju samo na osnovu njihovih snaga i mogućnosti da ga ispune vektorskim oblicima tekstualnih simbola. Sada u setovima.

U donjoj tabeli simbola može se vidjeti da različiti fontovi podržavaju različit broj znakova. Neki simboli Unicode fontova mogu vagati vrlo dobro. Ali sada se ne razlikuju činjenicom da su stvoreni za različite kodiranje, ali činjenicom da je proizvođač fonta napunio ili nije ispunio jedinstveni kodni prostor za kraj ili druge vektorske oblike na kraju.

Krakoyabry umjesto ruskih slova - kako popraviti

Sada vidimo kako se tekst Crakozyabe pojavljuje umjesto teksta ili, drugim riječima, kako je odabrano ispravno kodiranje za ruski tekst. Zapravo, postavljen je u programu u kojem kreirate ili uređujete isti tekst ili kôd koristeći fragmente teksta.

Za uređivanje i stvaranje tekstualne datoteke Lično koristim vrlo dobro, po mom mišljenju ,. Međutim, može istaknuti sintaksu još dobre stotine programskih jezika i markiranja, a također ima mogućnost širenja sa dodacima. Pročitati detaljan pregled Ovaj divan program prema vezu.

U gornjem izborniku Notepad ++ postoji "kodiranje" stavka, gde ćete imati mogućnost pretvorbe postojeće opcije na jedan koji se koristi na vašoj zadanoj lokaciji:

U slučaju mjesta na Joomli 1.5 i iznad, kao i u slučaju bloga na WordPress-u, trebali biste odabrati opciju kako biste izbjegli izgled Krakoyara UTF 8 bez bom. Šta je prefiks Bom?

Činjenica je da je kada je razvijena kodiranje ETF-16, iz nekog razloga odlučio da to pričvrsti kao sposobnost zabilježi kodeks simbola, kako u direktnom nizu (na primjer, 0A15) i natrag (150a) . I kako bi programi razumjeli koji redoslijed čitanje kodova i izmišljen Bom. (Byte Narudžba oznaka ili, drugim riječima, potpisom), koja je izražena u dodavanju tri dodatna bajta na samog početka dokumenata.

U kodiranju UTF-8 nije bilo BOM-a u Konzorcijumu Unicode i zato dodavanje potpisa (ove najozloglašene dodatne tri bajta do početka dokumenta) Neki programi jednostavno sprečavaju čitanje koda. Stoga, uvijek, prilikom spremanja datoteka u UTF, morate odabrati opciju bez BOM-a (bez potpisa). Dakle, vi ste unaprijed mustraza sami od kreketa.

Ono što je napomenuto, neki programi u sustavu Windows ne znaju kako to učiniti (ne moći uštedjeti tekst u UTF-8 bez BOM-a), na primjer, istim notorisnim prozorima za notebook. Spremne dokument u UTF-8, ali još uvijek dodaje potpis na njegov početak (tri dodatna bajta). Štaviše, ovi bajti će uvijek biti isti - pročitajte kod u direktnom nizu. Ali na serverima, zbog ovih malih stvari, može doći do problema - krekeli će izaći.

Stoga, ni u kojem slučaju ne koristite uobičajene notebook prozore Za uređivanje dokumenata vaše web stranice, ako ne želite izgled Krakoyarbre. Smatram najnovijom i najlakšem opcijom za već spomenutu editoru Notepad ++, koji praktično nema nedostatke i sastoji se od jedne od prednosti.

U notepad ++ Kada odaberete kodiranje, imat ćete mogućnost pretvorbe teksta na UCS-2 kodiranje, što je vrlo blizu standarda Unicode u suštini. Takođe u nepunjaču se može kodirati u ANSI, I.E. U vezi s ruskim jezikom, ovo će nam već opisati samo iznad Windows 1251. Odakle dolaze ove informacije?

Napisana je u registru vaše operate windows sistemi - Što kodiranje za odabir u slučaju ANSI-a, što birati u slučaju OEM-a (za ruski jezik bit će CP866). Ako instalirate još jedan zadani jezik na računaru, tada će se ovi kodići zamijeniti sličnim ANSI ili OEM pražnji za isti jezik.

Nakon vas u notepad ++, sačuvajte dokument u kodiranju koje vam je potreban ili otvorite dokument s web mjesta na uređivanje, a zatim u donjem desnom uglu uređivača možete vidjeti njegovo ime:

Da biste izbjegli KrakoyarbrovPored gore opisanih akcija, bit će korisno registrirati u svom zaglavlju izvornog koda svih stranica podataka o lokaciji o ovom kodiranju kako bi se poslužitelj ili lokalni domaćin ne pojavljuje.

Općenito, na svim jezicima hiperteksta označavanja osim HTML-a koristi se poseban XML oglas koji određuje kodiranje teksta.

Prije nego što započnete rastavljanje koda, pretraživač će saznati koja se verzija koristi i kako tačno trebate interpretirati kodove znakova ovog jezika. Ali ono što je napomenuto, u slučaju da sačuvate dokument u zadanom Unicodeu, ova XML deklaracija može se izostaviti (kodiranje će se smatrati UTF-8, ako nema BOM-a ili UTF-16 ako postoji BOM).

U slučaju dokumenta hTML jezik Da biste odredili korištene kodiranje meta elementkoja je propisana između oznake za otvaranje i zatvaranje:

... ...

Ovaj unos je sasvim drugačiji od prihvaćenih B, ali u potpunosti je u skladu s novo uvedenim standardom HTML 5, a to će biti apsolutno pravilno shvaćeno bilo tko se koristio ovaj trenutak Preglednici.

U teoriji meta elementu sa naznakom kodiranja HTML dokument Bolje da se stavi Što je više moguće u zaglavlju pristaništaTako da u vrijeme sastanka u tekstu prvog znaka nije iz osnovnog ANSI-ja (što uvijek čita uvijek uvijek i u bilo kojoj varijaciji) pretraživač mora imati informacije o tome kako tumačiti kodove ovih likova.

Sretno ti! Na dvosmislene sastanke na web stranici blogova

Možda će vas zanimati

Šta URL adreseKoja je razlika između apsolutnih i relativnih veza za web mjesto
Openserver - moderan lokalni poslužitelj i primjer njegove upotrebe za wordPress instalacije na računaru
Što je Chmod, koji pristupa pravima za dodjeljivanje datoteka i mapa (777, 755, 666) i kako učiniti putem PHP-a
Pretražite Yandex na licu mjesta i internetsku trgovinu