Koi koda tabula 8. Koi8-r kodēšana

- Izbraukšana (@comradzampolit) 2017. gada 17. augusts

Kā darbojas koi8-r?

Koi8-R ir astoņu bitu kodu lapa, kas paredzēta, lai kodētu kirilicisko alfabētu burtus. Izstrādātāji novietoja krievu alfabēta simbolus tā, lai kirilica simbolu pozīcijas atbilstu fonētiskajiem analogiem angļu alfabētā tabulas apakšā. Un, ja šajā kodē rakstītajā tekstā, lai noņemtu katra simbola astoto bitu, tad tiek iegūts teksts, kas ir līdzīgs latīņu burtiem.

Šāds apmaiņas kods tika izmantots septiņdesmitajos ES sērijas datoros, un no astoņdesmito gadu vidū tā sāka to izmantot pirmajās rusificētajās versijās. operētājsistēma Unix.

Kodēšana bija tāds, ka katram simbolam tika piešķirts unikāls kods: no 00000000 līdz 11111111. Tādējādi persona, kas atšķir simbolus par to dizainu un datoru - saskaņā ar to kodu.

Vai Černova kodē tagad?

Ne. Tas bija svarīgi veciem astoņu bitu datoriem, tagad Unicode galvenokārt tiek izmantots dažādos formātos.

Koi8-r kodēšana

ISO 8859-5 kodēšana

ISO 8859-5

Alternatīva kodēšana

"Alternatīva kodēšana" - Pamatojoties uz CP437 kodu lapu, kurā visi konkrētie Eiropas simboli otrajā pusē tiek aizstāti ar kirilicu, atstājot pseidogrāfiskos rakstzīmes neskarts. Līdz ar to tas nesabojā programmu tipu, izmantojot teksta logus, kā arī nodrošina kirilicu rakstzīmju izmantošanu.

Vēsturiski bija daudz alternatīvu kodējumu iespēju, bet visas atšķirības attiecas tikai uz 0xF0 - 0xFF reģionu (240-255). Galīgais standarts bija IBM CP866 kodējums, kuru atbalsts tika pievienots MS-DOS versijai 6.22 (visu veidu "pašdarināti" plaisas tika izmantotas. Alternatīva kodēšana joprojām ir dzīva un ļoti populāra DOS un OS / 2 vidē . Turklāt šis kodējums tiek ierakstīts B. failu sistēma Tauki. CP866 joprojām izmanto rusificētu sistēmu konsolē windows ģimene Nt.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.
8. 410. B 411. 412. G 413. D 414. E 415 416. S 417. Un 418. 419. Līdz 41a. L 41b. M 41c. H 41d. O 41e. P 41F.
9. R 420 Ar 421. T 422. 423. F 424 X 425. C 426. H 427. W 428. Schch 429. Kommersant 42a. 42b. B 42C. E 42D. Yu 42e. Es esmu 42F.
A. 430. B 431. 432. gadā. G 433. D 434. E 435. 2036. S 437. un 438. 439. Līdz 43a. L 43b. m 43c. H 43D. Aptuveni 43E. P 43f.
B. ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 ╝ 255D. ╜ 255c. ╛ 255b. ┐ 2510
C. └ 2514 ┴ 2534. ┬ 252c. ├ 251c. ─ 2500 ┼ 253c. ╞ 255E. ╟ 255F. ╚ 255a. ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 ╬ 256c. ╧ 2567
D. ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 ╫ 256b. ╪ 256a. ┘ 2518 ┌ 250c. █ 2588 ▄ 2584 ▌ 258c. ▐ 2590 ▀ 2580
E. R 440. no 441. T 442. 443. F 444. x 445. C 446. H 447. sh 448. Schch 449. Kommersant 44a. S 44b. B 44c. E4d. Yu 44e. Es esmu 44F.
F. E 301. ё 451. Є 404. є 454. 407. 457. Ў 40e. ў 45e. ° B0. ∙ 2219 · B7. √ 221a. № 2116 ¤ A4. ■ 25A0. A0.

SO 8859-5 - 8 bitu kodēšana no ISO-8859 sērijas, lai ierakstītu kirilicu. Krievijā gandrīz netiek izmantots. Kopumā ISO 8859-5 nav ļoti ērts kodējums, jo tai nav daudz nepieciešamo rakstzīmju, piemēram, domuzīme (-), choke-koku ("), grādiem (°) utt.



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.
8. 80 81 82 83 84 85 86 87 88 89 8a. 8b. 8c. 8d. 8e. 8f.
9. 90 91 92 93 94 95 96 97 98 99 9a. 9b. 9c. 9d. 9e. 9f.
A. A0. E 301. 402 €. Ѓ 403. Є 404. Ѕ 405. ³ 406. 407. Ј 408. Љ 409. Њ 40a Ћ 40b. Ќ 40c. Reklāma Ў 40e. Џ 40f.
B. 410. B 411. 412. G 413. D 414. E 415 416. S 417. Un 418. 419. Līdz 41a. L 41b. M 41c. H 41d. O 41e. P 41F.
C. R 420 Ar 421. T 422. 423. F 424 X 425. C 426. H 427. W 428. Schch 429. Kommersant 42a. 42b. B 42C. E 42D. Yu 42e. Es esmu 42F.
D. 430. B 431. 432. gadā. G 433. D 434. E 435. 2036. S 437. un 438. 439. Līdz 43a. L 43b. m 43c. H 43D. Aptuveni 43E. P 43f.
E. R 440. no 441. T 442. 443. F 444. x 445. C 446. H 447. sh 448. Schch 449. Kommersant 44a. S 44b. B 44c. E4d. Yu 44e. Es esmu 44F.
F. № 2116 ё 451. 452. ѓ 453. є 454. ѕ 455. І 456. 457. ј 458. љ 459. њ 45a. ћ 45b. ќ 45c. § A7. ў 45e. џ 45f.

Koi-8 (informācijas koplietošanas kods, 8 biti), koi8 - astoņu bitu simbolu kodēšanas standarts datorzinātnēs. Paredzēts kirilicisko alfabētu burtu kodēšanai. Ir arī septiņu bitu versija kodēšanas versijas - Koi-7. Koi-7 un KOI-8 ir aprakstīti GOST 19768-74 (tagad nederīgi).

Koi-8 izstrādātāji ievietoja krievu alfabēta simbolus paplašinātā ASCII tabulas augšpusē tādā veidā, ka kirilicisko rakstzīmju pozīcijas atbilst to fonētiskajiem analogiem angļu alfabētā tabulas apakšā. Tas nozīmē, ka, ja tekstā rakstīts Koi-8, lai noņemtu astoto bitu katra simbola, tad izrādās "lasāms" teksts, lai gan to raksta latīņu simboli. Piemēram, vārdi "krievu teksts" pārvēršas par "Russkij tekstu". Kā blakus efektu kirilica simboli izrādījās sakārtoti alfabētiskā secībā.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.
8. ─ 2500 │ 2502 ┌ 250c. ┐ 2510 └ 2514 ┘ 2518 ├ 251c. ┤ 2524 ┬ 252c. ┴ 2534. ┼ 253c. ▀ 2580 ▄ 2584 █ 2588 ▌ 258c. ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25A0. ∙ 2219 √ 221a. ≈ 2248 ≤ 2264 ≥ 2265 A0. ⌡ 2321 ° B0. ² B2. · B7. ÷ F7.
A. ═ 2550 ║ 2551 ╒ 2552 ё 451. ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 ╚ 255a. ╛ 255b. ╜ 255c. ╝ 255D. ╞ 255E.
B. ╟ 255F. ╠ 2560 ╡ 2561 E 301. ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256a. ╫ 256b. ╬ 256c. © A9.
C. Yu 44e. 430. B 431. C 446. D 434. E 435. F 444. G 433. x 445. un 438. 439. Līdz 43a. L 43b. m 43c. H 43D. Aptuveni 43E.
D. P 43f. Es esmu 44F. R 440. no 441. T 442. 443. 2036. 432. gadā. B 44c. S 44b. S 437. sh 448. E4d. Schch 449. H 447. Kommersant 44a.
E. Yu 42e. 410. B 411. C 426. D 414. E 415 F 424 G 413. X 425. Un 418. 419. Līdz 41a. L 41b. M 41c. H 41d. O 41e.
F. P 41F. Es esmu 42F. R 420 Ar 421. T 422. 423. 416. 412. B 42C. 42b. S 417. W 428. E 42D. Schch 429. H 427. Kommersant 42a.

Koi8-u kodējums (ukraiņu)

Koi-8 kļuva par pirmo Krievijas standartizēto kodējumu internetā.

IETF apstiprināja vairākus RFC saskaņā ar KOI-8 kodēšanas opcijām:

  • RFC 1489 - KOI8-R (krievu alfabēta burti);
  • RFC 2319 - KOI8-U (Ukrainas alfabēta burti);
  • RFC 1345 - ISO-IR-111 (ar kļūdu, nosakot galveno diapazonu).

Iepriekš minētajās tabulās numurus apzīmē ar Unicode vēstules heksadecimālo kodu.

Koi8-r kodēšana (krievu)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.

8.

2500

2502

250c.

2510

2514

2518

251c.

2524

252c.

2534

253c.

2580

2584

2588

258c.

2590

9.

2591

2592

2593

2320

25A0.

2219

221a.

2248

2264

2265

A0.

2321
°
B0.
²
B2.
·
B7.
÷
F7.

A.

2550

2551

2552
e.
451

2553

2554

2555

2556

2557

2558

2559

255a.

255b

255c.

255D.

255E.

B.

255f.

2560

2561
E.
401

2562

2563

2564

2565

2566

2567

2568

2569

256a.

256b.

256c.
©
A9.

C.
yu
44E.
bet
430
b.
431
c.
446
d.
434
e.
435
f.
444
g.
433
h.
445
un
438
j.
439
uz
43a.
l.
43b.
m.
43c.
n.
43d.
par
43E.

D.
p
43f.
es
44f.
r
440
no
441
t.
442
w.
443
j.
436
iebildums
432
b
44c.
s
44b.
z.
437
siet
448
e.
44d.
siet
449
c.
447
kommersants
44a.

E.
Yu
42E.
Bet
410
B.
411
C.
426
D.
414
E.
415
F.
424
G.
413
H.
425
UN
418
J.
419
Uz
41a.
L.
41b.
M.
41c.
N.
41d.
Par
41E.

F.
P
41f.
Es
42f.
R
420
No
421
T.
422
W.
423
J.
416
Iebildums
412
B
42c.
S
42b.
Z.
417
Siet
428
E.
42d.
Siet
429
C.
427
Kommersants
42a.

Citas iespējas

Tiek parādītas tikai neatbilstošas \u200b\u200btabulas līnijas, jo viss pārējais sakrīt.

KOI8-U kodējums (krievu-ukraiņu)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.

A.

2550

2551

2552
e.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255a.

255b
ґ
491

255D.

255E.

B.

255f.

2560

2561
E.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256a.
Ґ
490

256c.
©
A9.

Koi8-ru kodēšana (krievu-baltkrievu-ukraiņu)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.

A.

2550

2551

2552
e.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255a.

255b
ґ
491
ў
45e.

255E.

B.

255f.

2560

2561
E.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256a.
Ґ
490
Ў
40e.
©
A9.

Koi8-C Encoding (Vidusāzija)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.
8. ғ
493
җ
497
қ
49b.
ҝ
49d.
ң
4a3.
ү
4af.
ұ
4b1
ҳ
4b3.
ҷ
4b7.
ҹ
4b9.
һ
4bb.

2580
ә
4d9.
ӣ
4e3.
ө
4e9.
ӯ
4ef.
9. Ғ
492
Җ
496
Қ
49a.
Ҝ
49c.
Ң
4a2
Ү
4Ae.
Ұ
4b0.
Ҳ
4b2.
Ҷ
4b6.
Ҹ
4b8.
Һ
4ba.

2321
Ә
4d8.
Ӣ
4E2.
Ө
4E8.
Ӯ
4ee.
A.
A0.
ђ
452
ѓ
453
E.
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45a.
ћ
45b.
ќ
45c.
ґ
491
ў
45e.
џ
45f.
B.
2116
Ђ
402
Ѓ
403
E.
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40a.
Ћ
40b.
Ќ
40c.
Ґ
490
Ў
40e.
Џ
40f.

KOI8-T kodējums (Tadžik)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.
8. қ
49b.
ғ
493

201a.
Ғ
492

201E.

2026

2020

2021

2030
ҳ
4b3.

2039
Ҳ
4b2.
ҷ
4b7.
Ҷ
4b6.
9. Қ
49a.

2018

2019

201C.

201D.

2022

2013
-
2014

2122

203a.
A. ӯ
4ef.
Ӯ
4ee.
E.
451
¤
A4.
ӣ
4e3.
¦
A6.
§
A7.
«
Ab
¬
Maiņstrāvas
­
Reklāma
®
Ae
B. °
B0.
±
B1.
²
B2.
E.
401
Ӣ
4E2.

B6.
·
B7.

2116
»
Bb.
©
A9.

KOI8-O, KOI8-S kodējums (slāvu, vecā pareizrakstība)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.

8.
Ђ
0402
Ѓ
0403
¸
00b8.
ѓ
0453

201E.

2026

2020
§
00A7.

20ac.
¨
00A8.
Љ
0409

2039
Њ
040a.
Ќ
040C.
Ћ
040b.
Џ
040F.

9.
ђ
0452

2018

2019

201C.

201D.

2022

2013

2014
£
00A3.
·
00b7.
љ
0459

203a.
њ
045a.
ќ
045c.
ћ
045b
џ
045f

A.

00A0.
ѵ
0475
ѣ
0463
e.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00Ae.

2122
«
00ab
ѳ
0473
ґ
0491
ў
045E.
´
00b4.

B.
°
00b0.
Ѵ
0474
Ѣ
0462
E.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00A2.
»
00bb.
Ѳ
0472
Ґ
0490
Ў
040e.
©
00A9.

ISO-IR-111, KOI8-E kodējums

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.

A.

00A0.
ђ
0452
ѓ
0453
e.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045a.
ћ
045b
ќ
045c.
­
00AD.
ў
045E.
џ
045f

B.

2116
Ђ
0402
Ѓ
0403
E.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a.
Ћ
040b.
Ќ
040C.
¤
00A4.
Ў
040e.
Џ
040F.

KOI8-UNIFED CODING, KOI8-F

Koi8-vienotu kodējumu (Koi8-F) ierosina FINGERTIP programmatūra.

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. B .C.c. .D. .E.e. .F .f.

8.

2500

2502

250c.

2510

2514

2518

251c.

2524

252c.

2534

253c.

2580

2584

2588

258c.

2590

9.

2591

2018

2019

201C.

201D.

2022

2013

2014
©
00A9.

2122

00A0.
»
00bb.
®
00Ae.
«
00ab
·
00b7.
¤
00A4.

A.

00A0.
ђ
0452
ѓ
0453
e.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045a.
ћ
045b
ќ
045c.
ґ
0491
ў
045E.
џ
045f

B.

2116
Ђ
0402
Ѓ
0403
E.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a.
Ћ
040b.
Ќ
040C.
Ґ
0490
Ў
040e.
Џ
040F.

Nesmēķētāju iespējas Koi-8

Dažās valstīs CMEA izveidoja Koi-8 modifikācijas nacionālajām latītes iespējām. Pamatideja bija tāda pati - ar astoto bitu "griezumu" tekstam jāpaliek vairāk vai mazāk saprotams.

- Nu, sāciet! - teica Doolokh.
"Nu," sacīja Pierre, joprojām smaida. - Es baidījos. Bija acīmredzams, ka lieta, kas sākās tik viegli, vairs nevarētu novērst, ka tas notiek, jau neatkarīgi no cilvēku gribas, un būtu bijis jādara. Denisov vispirms nāca uz barjeru un pasludināja:
- Tā kā P "Svatstniki atteicās uz" viņiem ", vai nav iespējams sākt: veikt ieročus un saskaņā ar vārdu t" un sāk saplūst.
"G ..." AZ! Divi! T "un! ..." Denisov kliedza dusmīgi un pārcēlās uz sāniem. Abi devās uz trotted ceļiem tuvāk un tuvāk, jo migla atzīst viens otru. Pretiniekiem bija tiesības, izņemot barjeru, atvašu, kad kāds vēlas. Shelokh bija lēns, nepaaugstinot lielgabalu, peering ar savu spilgtu, spīdīgu, zilo acu acis pretinieka sejā. Viņa mute, kā vienmēr, bija smaids.
- Tātad, kad es gribu - es varu uzņemt! - teica Pierre, ar vārdu trīs ātrās darbības devās uz priekšu, konfrontācija no trotāna celiņa un pastaigas pa visu sniegu. Pierre turēja ieroci, stiepjas uz priekšu labā rokaAcīmredzot baidās, kā no šī pistola nav nogalināt sevi. Viņš rūpīgi turēja savu kreiso roku, jo viņš gribēja atbalstīt viņas labo roku, un viņš zināja, ka tas bija neiespējami. Pasākumi Six un izkāpšana no dziesmas sniegā, Pierre paskatījās uz viņa kājām, atkal paskatījās Dolokhov atkal un velkot savu pirkstu, kā viņš tika mācīts, nošāva. Es negaidīju tik spēcīgu skaņu, Pierre sheddered no viņa kadra, tad pasmaidīja sevi viņa iespaidu un apstājās. Dūmi, īpaši biezs no miglas, neļāva viņam redzēt viņu pirmajā brīdī; Bet vēl viens nošāva viņš gaidīja, neievēroja. Tikai Dolohov steidzās soļi tika uzklausīti, un viņa skaitlis šķita dūmu dēļ. Ar vienu roku viņš aizturēja kreisās puses, otrs saspiests izlaists pistole. Viņa seja bija bāla. Rostova skrēja un kaut kas viņam teica.
"Tas nav ... e ... t" Solokovs teica caur saviem zobiem, "nē, ne vairāk," un padarot dažas vairāk krītot, veicot soļus uz saber, nokrita uz sniega pie viņas. Viņa kreisā roka bija asinīs, viņš viņai pārspēja par Sutuku un noliecās viņu. Viņa seja bija gaiša, draudzīga un drebēta.
"Es rakstīšu ..." sāka dalīties, bet viņš nevarēja tūlīt teikt ... "Lūdzu, viņš piekrita piepūles." Pierre, tikko turot zobus, skrēja uz Dolohov, un gribēja iet caur telpu, kas atdala barjeras, kā Shahov kliedza: - uz barjeru! - un Pierre, kurš saprata, kas bija jautājums, viņš apstājās viņa saber. Tikai 10 soļi dalījās. Shelokhovs krita galvu uz sniegu, mantkārīgi sakāja sniegu, atkal pacēla galvu, atguva, paņēma kājas un apsēdās, meklējot cietu smaguma centru. Viņš ir pelējums auksts sniegs un sūkāt to; Viņa lūpas drebēja, bet viss smaida; Acis mirdzēja ar piepūli un pēdējo apkopoto spēku dzemdību. Viņš pacēla ieroci un sāka mērķi.
"Side, slēgt ieroci," teica Nesvitsky.
- 3ak "Me! - Neatkarojot, pat Denisov kliedza pretinieku.
Pierre ar lēnām smaidu nožēlu un grēku nožēlošanu, bezpalīdzīgi liekot kājas un rokas, taisni ar viņas platajām krūtīm stāvēja pirms Dolokhov un diemžēl paskatījās uz viņu. Denisovs, Rostovs un Nesvitsky uzkāpa. Tajā pašā laikā viņi dzirdēja Dvadova šāvienu un ļauno saucienu.
- By! - Shahov un bezspēcīgi nolieciet uz sniega sejas. Pierre satvēra galvu, un, pagriežot atpakaļ, devās uz mežu, staigājot pilnībā sniega un skaļi notiesāti nezināmiem vārdiem:
- stulba ... stulba! Nāve ... False ... - Viņš teica, ka tas šaušana. Nesvitsky viņu apturēja un paņēma mājās.
Rostova ar Denisov bija paveicies ar ievainoto Dolokhovu.
Shellokhov, klusi, ar aizvērtām acīm, gulēja kamanā un neatbildēja uz jautājumiem, ko viņš darīja; Bet, noslēdzot Maskavā, viņš pēkšņi pamodās un ar grūtībām pacelot galvu, paņēma Rostovu, kurš sēdēja ar roku. Rostova pārsteidza pilnīgi mainījies un negaidīti entuziasma izteiksme no dolkopova.
- Nu? Kā tu jūties? - Jautāja Rostovs.
- Splly! Bet ne punkts. Mans draugs, "sacīja Shard balss uz periodisku balsi, - kur mēs esam? Mēs esam Maskavā, es zinu. Es neesmu nekas, bet es viņu nogalināju, nogalināja ... viņa to nedarīs. Viņa nenotiks ...
- PVO? - Jautāja Rostovs.
- Mana māte. Mana māte, mans eņģelis, mans burvīgais eņģelis, māte, - un solohovu es raudāju, saspiežot Rostova roku. Kad viņš nomierināja nedaudz, viņš paskaidroja Rostovu, kas dzīvo kopā ar māti, ka, ja māte redz viņu mirst, viņa to nedarīs. Viņš lūdza Rostovu doties uz viņu un sagatavot viņu.
Rostova devās uz priekšu, lai izpildītu pasūtījumu, un viņš iemācījās lielu pārsteigumu, ka viņa ir iemācījusies, ka šī buyan, Brener Solohov dzīvoja Maskavā ar veco sievieti un Humpbed māsu, un bija visvairāk maigākais dēls un brālis.

Pierre nesen reti redzēja savu sievu ar acīm uz acīm. Un Sanktpēterburgā un Maskavā viņu māja bija pastāvīgi pilns ar viesiem. Nākamajā naktī pēc duelis viņš, kā viņš bieži darīja, neiet uz guļamistabu, bet palika savā milzīgajā, tēvu birojā, tajā pašā laikā, kurā tika nomira.
Viņš saskārās ar dīvānu un vēlējās aizmigt, lai aizmirst visu, kas bija ar viņu, bet viņš to nevarēja darīt. Šāda vētra jūtas, domas, atmiņas pēkšņi pieauga viņa dvēselē, ka viņš ne tikai nevarēja gulēt, bet nevarēja sēdēt vēl un bija lēkt no dīvāna un staigāt pa istabu. Viņam tika iesniegts pirmajā pēc laulībām, ar atvērtiem pleciem un nogurušiem, kaislīgiem izskatiem un tūlīt blakus viņai šķita skaista, brazen un stingri izsmiekls Dolokhova, kā tas bija vakariņās, un tas pats sejas dologov, bāla, trīce Un ciešanas, kā tas bija tad, kad viņš pagriezās un nokrita uz sniega.
"Kas bija tur? - Viņš jautāja sev. - Es nogalināju mīļāko, jā, nogalināja viņa sievas mīļāko. Jā, tas bija. No kā? Kā es nāku pie tā? - Jo jūs viņu precējusies, - atbildēja uz iekšējo balsi.
"Bet ko es esmu vainīgs? Viņš jautāja. - tas, ka jūs precējies nevis, mīlot viņu, jo jūs maldinājāt sevi un viņu, - un viņš tika apvienots šo brīdi pēc vakariņām Prinča Vasilā, kad viņš teica šos vārdus, kurus nevarēja saukt: "Je Vous AIME ". [Es tevi mīlu.] Viss no šī! Tad es jutu, viņš domāja, es jutu, ka tas nebija tas, kas man nebija tiesības uz to. Tik iznāca. " Viņš atcerējās medusmēnesi un nosarka ar atmiņām. It īpaši dzīva, atmiņas par to, kā kādu dienu, neilgi pēc viņa laulības, viņš bija 12 metru dienas, zīda mētelis nāca no guļamistabas uz biroju, un konstatēja galvu vadītāja vadītāja, kurš pārdomājuši brīnījās, Paskatījās Pierre sejā, viņa peldmētelis un nedaudz pasmaidīja, it kā izteiktu šo smaidu cieņu cieņu par viņa principa laimi.
"Un cik reizes es biju lepns par to, es biju lepns par savu lielisko skaistumu, viņas laicīgo taktiku, viņš domāja; Tas bija lepns par māju, kurā viņa paņēma visu Petersburg, lepojas ar tās nepieejamību un skaistumu. Tātad, ko es esmu lepns?! Tad es domāju, ka es viņu nesapratu. Tik bieži, domājot par savu raksturu, es teicu, ka es biju vainīgs, ka es nesaprotu viņu, es nesaprotu šo arvien sughment, apmierinātību un jebkādas atkarības un vēlmes, un visa ietekme bija šajā briesmīgajā vārdā ka viņa ir slavas sieviete: teica, ka es esmu briesmīgs vārds, un viss kļuva skaidrs!
"Anatole devās uz viņu, lai ņemtu naudu no viņas un noskūpstīja viņu viņas tukšos pleciem. Viņa nedod viņam naudu, bet ļāva sevi noskūpstīt. Tēvs, jokot, satraukti viņas greizsirdība; Viņa, ar atvieglotu smaidu, teica, ka viņa nav tik stulba, lai būtu greizsirdīgs: lai viņš to darītu, viņa gribēja, viņa teica par mani. Es jautāju viņu vienu reizi, vai viņa jūtas grūtniecības pazīmes. Viņa smējās nicīgi un teica, ka viņa nav muļķis vēlas, lai būtu bērni, un ka viņai nebūtu bērnu no manis. "
Tad viņš atcerējās rupjību, viņas domu skaidrību un izteiksmju vulgaritāti, kas raksturīga viņai, neskatoties uz viņu audzināšanu augstākajā aristokrātiskajā lokā. "Es neesmu sava veida muļķis ... es mēģināšu sevi ... Allez Vous promeneris," [izkļūt,] viņa teica. Bieži vien, skatoties uz viņas panākumiem veco un jauno vīriešu un sieviešu acīs, Pierre nevarēja saprast, kāpēc viņš viņu nemīl. Jā, es nekad neesmu viņu mīlējis, es teicu sev Pierre; Es zināju, ka viņa bija nežēlīga sieviete, viņš atkārtoja sevi, bet neuztraucās to atzīt.

Sveiki, dārgie emuāra lasītāju tīmekļa vietne. Šodien mēs runāsim ar jums par to, kur Krakoyarbra nāk no un programmās, kuras teksta kodējumi pastāv un kas no tiem jāizmanto. Apsludināsim detalizēti vēsturi to attīstību, sākot no pamata ASCII, kā arī tās paplašinātās versijas CP866, Koi8-R, Windows 1251 un beidzot ar moderniem kodiem Unicode UTF 16 un 8 konsorcijs.

Kāds šī informācija var šķist nevajadzīga, bet jūs zināt, cik daudz jautājumi nāk pie manis tieši ieinteresēja plaisas (neizlasot rakstzīmju kopu). Tagad man būs iespēja nosūtīt ikvienam šā panta tekstam un patstāvīgi meklēt savus sēkliniekus. Nu, gatavojieties absorbēt informāciju un mēģiniet uzraudzīt stāstījumu.

ASCII - pamata latiza teksta kodējums

Teksta kodējumu attīstība notiek vienlaicīgi, veidojot IT nozari, un šajā laikā viņiem bija laiks, lai izietu diezgan dažas izmaiņas. Vēsturiski tas viss sākās ar diezgan kaitīgu krievu EBCDIC izrunu, kas ļāva kodēt latīņu alfabēta burtus, arābu numurus un pieturzīmes ar kontroles simboliem.

Bet joprojām ir jāuzskata par mūsdienu teksta kodējumu attīstības sākumpunktu ASCII. (Amerikāņu standarta kods informācijas apmaiņai, kas krievu valodā parasti izrunā kā "asi"). Tā apraksta pirmās 128 rakstzīmes no visbiežāk izmantotajām angļu valodā runājošiem lietotājiem, arābu skaitļiem un pieturzīmēm.

Pat šajās 128 rakstzīmēs aprakstītas ASCII, daži servisa simboli tika saspiesti ar kronšteiniem, režģiem, zvaigznītēm utt. Patiesībā, jūs pats var redzēt tos:

Šie 128 rakstzīmes no sākotnējās versijas ASCII ir kļuvušas par standartu, un jebkurā citā kodējumu jūs noteikti tikties un nostiprināsies, ka tie būs tādā veidā.

Bet fakts ir tāds, ka ar vienu baitu informāciju, tas nav 128, bet tik daudz kā 256 dažādas vērtības (divi līdz grādu astoņiem vienāds 256), tāpēc pēc bāzes versija Aski parādījās vairākas advanced Encodings ASCIIPapildus 128 galvenajām zīmēm, bija iespējams kodēt arī valsts kodēšanas simbolus (piemēram, krievu).

Šeit, iespējams, nedaudz vairāk par numuru sistēmu, kas tiek izmantota aprakstā. Pirmkārt, kā jūs zināt visu, dators darbojas tikai ar cipariem binārā sistēmā, proti, ar nulles un vienībām ("Boulev Algebra", ja kāds notika institūtā vai skolā). Katrs no tiem ir nolēma līdz līmenim, sākot ar nulli, un uz divdesmitajā septītajā:

Nav grūti saprast, ka visas iespējamās nulles un vienību kombinācijas šādā dizainā var būt tikai 256. Tulkot numuru no binārās sistēmas decimāldaļā ir diezgan vienkārša. Nepieciešams vienkārši salocīt visus jaunākos rezultātus virs tā, ka viens stāv.

Mūsu piemērā izrādās 1 (2 līdz nulles pakāpei) plus 8 (divi līdz grādi 3), kā arī 32 (divreiz piektajā pakāpē), kā arī 64 (sestajā daļā), plus 128 (septītajā valstī) . Kopā saņem 233 decimālā sistēma Piezīme. Kā redzat, viss ir ļoti vienkāršs.

Bet, ja paskatās uz galdu ar ASCII rakstzīmēm, jūs redzēsiet, ka tie ir parādīti heksadecimālā kodējumā. Piemēram, "Asterisk" atbilst Aski heksadecimāls 2a. Iespējams, jūs to zināt heksadecimālā sistēma Numuri tiek izmantoti papildus arābu numuriem, latīņu burtiem no A (nozīmē desmit) līdz f (nozīmē piecpadsmit).

Labi, tāpēc par pārskaitījums binārie numuri Heksadecimālajā Izmantot nākamo vienkāršo un vizuālo ceļu. Katrs informācijas baits ir sadalīts divās daļās četru bitu, kā parādīts iepriekš minētajā ekrānā. Tā Katrā pusē baitu bināro kodu var kodēt tikai sešpadsmit vērtībām (divas ceturtās pakāpes), ko var viegli pārstāvēt heksadecimāls.

Turklāt baita kreisajā pusē būs nepieciešams atkārtoti apsvērt no nulles, nevis kā redzams ekrānuzņēmumā. Tā rezultātā, ne-labs skaitļošanas, mēs saņemam, ka numurs E9 ir kodēts ekrānuzņēmumā. Es ceru, ka mana pamatojuma gaita un šīs rebusa sacietēšana jums bija saprotams. Nu, tagad mēs turpināsim, patiesībā runās par teksta kodējumu.

Paplašinātas Aski - CP866 un Koi8-R kodēšana ar pseidogrāfu

Tātad, mēs sākām runāt par ASCII, kas bija kā sākumpunkts visu moderno kodējumu attīstībai (Windows 1251, Unicode, UTF 8).

Sākotnēji tas tika likts tikai 128 pazīmes latīņu alfabēta, arābu skaitu un kaut kas cits tur, bet paplašinātajā versijā bija iespējams izmantot visas 256 vērtības, kuras var kodēt vienā informācijā par informāciju. Tiem. Iespēja pievienot mēles burtu simbolus askai.

Šeit būs nepieciešams, lai atkal būtu apjucis, lai noskaidrotu - kāpēc jums ir nepieciešams kodējums Teksti un kāpēc tas ir tik svarīgi. Datora ekrāna rakstzīmes veidojas, pamatojoties uz divām lietām - visu veidu rakstzīmju veidlapu (pārstāvniecību) kopas (tie ir faili CO) un kodu, kas ļauj izvilkt šo vektora formu komplektu ( Fonta fails) Tas ir raksturs, kas jāievieto pareizajā vietā.

Ir skaidrs, ka fonti ir atbildīgi par vektoru veidlapām, bet operētājsistēmā un programmās, ko tās izmanto, ir atbildīgas par kodējumu. Tiem. Jebkurš jūsu datora teksts būs baitu kopums katrā no kuriem viens šā teksta simbols ir kodēts.

Programma, kas parsē kodu, tiek parādīts šis teksts ekrānā (teksta redaktors, pārlūks utt.), Lasa nākamās zīmes kodējumu un meklēšanu atbilstošajam vektora veidlapai vēlamo failu Fonts, kas ir savienots, lai parādītu šo teksta dokumentu. Viss ir vienkāršs un trīts.

Tātad, lai šifrētu jebkuru simbolu, kas mums ir nepieciešams (piemēram, no valsts alfabēta), ir jāpabeidz divi nosacījumi - šīs zīmes vektora forma jābūt izmantotā fonta, un šo simbolu var kodēt paplašinātajos ASCII kodējumos vienā baitā vienā baitā . Tāpēc ir visa šādu iespēju ķekars. Tikai krievu valodas simbolu kodēšanai ir vairākas paplašināto ēzeļu šķirnes.

Piemēram, sākotnēji parādījās CP866.Tādā veidā bija iespējams izmantot krievu alfabēta simbolus, un tā bija paplašināta ASCII versija.

Tiem. Tās augšējā daļa pilnībā sakrita ar aski pamata versiju (128 latīņu, skaitļu simboli un pat jebkurš labuda), kas ir pārstāvēta uz ekrānuzņēmuma nedaudz augstāk, bet jau apakšējā daļa no CP866 kodēšanas tabulas bija norādīts ekrānuzņēmumā nedaudz zem skatījuma un ļāva kodēt vēl 128 zīmes (krievu burtus un jebkuru pseidogrāfisko):

Skatiet labajā slejā, skaitļi sākas ar 8, jo Numuri no 0 līdz 7 attiecas uz ASCII bāzes daļu (skatiet pirmo ekrānuzņēmumu). Tā CP866 krievu vēstulē "M" būs kods 9C (tas atrodas atbilstošo rindu krustojumā ar 9 un kolonnu ar numuru C ar heksadecimālo numuru sistēmu), ko var rakstīt vienā baitu informāciju, un, ja Ir piemērots fonts ar krievu rakstzīmēm, šī vēstule bez problēmām tiks parādīta tekstā.

No kurienes nāk šis daudzums pseudogrāfi CP866.? Tas ir viss fakts, ka šis kodējums krievu tekstam tika izstrādāta šajos spilgtajos gados, kad šādas grafisko operētājsistēmu izplatīšana kā tagad. Un Doss un līdzīgas teksta operācijas, pseidogrāfiskais atļauts vismaz kaut kādā veidā dažādot tekstu dizainu, un tāpēc tas ir saistīts ar CP866 un visām tās pārējām rindām, izplūstot paplašinātās Aska versijas.

CP866 izplatīts IBM uzņēmums, bet turklāt vairāki kodējumi tika izstrādāti par simboliem krievu valodas, piemēram, tas pats veids (paplašināto ASCII) var attiecināt uz Koi8-r.:

Savā darba princips saglabājās tāds pats kā CP866, kas aprakstīts vēlāk - katrs teksta simbols tiek kodēts ar vienu baitu. Ekrānuzņēmums parāda KOI8-R tabulas otro pusi, jo Pirmā puse ir pilnībā saskanīga ar Base Asus, kas tiek parādīts pirmajā ekrānuzņēmumā šajā rakstā.

Starp iezīmēm Koi8-R kodējumu, var atzīmēt, ka krievu burti tabulā nav alfabētiskā secībā, piemēram, tas, piemēram, izgatavots CP866.

Ja paskatās uz pirmo ekrānuzņēmumu (bāzes daļa, kas ievada visus paplašinātos kodējumus), pēc tam ievērojiet, ka Koi8-R, krievu burti atrodas tajā pašā tabulā no galda kā burtiem latīņu alfabēta no pirmās daļas galds. Tas tika darīts, lai ērti pāriet no krievu simboliem uz latīņu, izmetot tikai vienu bitu (divi septītajā grādā vai 128).

Windows 1251 - moderna ASCII versija un kāpēc Crackels izkļūt

Teksta kodējumu turpmāka attīstība bija saistīts ar to, ka grafiskās operētājsistēmas un nepieciešamība izmantot pseidographics tajās bija popularitāte. Rezultātā radās visa grupa, kas pēc savas būtības vēl bija progresīvas Aski versijas (viens teksts simbols ir kodēts tikai ar vienu informāciju par informāciju), bet neizmantojot pseidogrāfiskos rakstzīmes.

Viņi izturējās pret tā saukto ANSI kodēšanu, ko izstrādāja Amerikas Standartizācijas institūts. Kirilica nosaukums joprojām tika izmantots Statanting par iespēju ar krievu valodas atbalstu. Šāda piemēra piemērs.

Tas bija labvēlīgi atšķiras no iepriekš izmantotajiem CP866 un Koi8-R, jo vieta rakstzīmju pseidogrāfijas tajā bija pazuduši simbolus krievu tipogrāfijas (samazinājuma zīme), kā arī simboli, kas izmantoti tuvu Krievijas slāvu Valodas (ukraiņu, baltkrievu uc):

Sakarā ar šo krievu valodas kodu, fontu un ražotāju ražotāju kodoliem programmatūra Viņš pastāvīgi radās galvassāpes, un ar jums, dārgie lasītāji, bieži ieguva tos, kas ir visvairāk pazīstami krakoyabryKad neskaidrības tika mācīta ar tekstā izmantoto versiju.

Ļoti bieži viņi izkāpa, nosūtot un saņemot ziņojumus e-pasta ziņojumsKas radīja ļoti sarežģītu pārkodēšanas tabulu izveidi, kas faktiski nevar atrisināt šo problēmu saknē, un bieži vien lietotāji sarakstei tika izmantoti, lai izvairītos no pazīstams krakozyabs, lietojot krievu kodējumus šādā CP866, KOI8-R vai Windows 1251.

Būtībā, Krakozyabry, nododot nevis krievu tekstu, bija rezultāts nepareiza lietošana Kodēšana no šīs valodaskas neatbilst tam, kurā tas tika kodēts īsziņa Sākotnēji.

Pieņemsim, ja simboli kodēti ar CP866, mēģiniet parādīt, izmantojot Windows 1251 kodu tabulu, tad šie visvairāk krekinga (bezjēdzīgas rakstzīmes) un izkļūt, pilnībā aizstājot ziņojuma tekstu.

Līdzīga situācija ir ļoti bieži sastopama, forumos vai blogos, kad kļūdas teksts ar krievu rakstzīmēm netiek saglabāts šajā kodējumā, kas tiek izmantots noklusējuma vietnē, vai ne tajā teksta redaktorskas papildina kodu Sebestin nav redzams neapbruņotu aci.

Galu galā, šāda situācija ar daudziem kodējumiem un pastāvīgi pārmeklējot cranebrams, daudz noguris, bija priekšnoteikumi, lai radītu jaunu universālu variāciju, kas būtu nomainījis visu esošo un atrisināt, visbeidzot, saknes problēmas ar neatlaidību ne lasāmi teksti. Turklāt bija līdzīgu ķīniešu valodas, kurās valodas simboli bija daudz vairāk nekā 256.

Unicode (Unicode) - Universālie kodi UTF 8, 16 un 32

Šos tūkstošos Dienvidaustrumu Āzijas valodas grupas pazīmju nevarēja aprakstīt vienā Papes informācijā, kas tika piešķirta, lai kodētu rakstzīmes uzlabotas ASCII versijās. Tā rezultātā tika izveidots konsorcijs Unicode (Unicode - Unicode konsorcijs) sadarbībā ar daudziem IT līderiem nozarē (tie, kas ražo programmatūru, kas kodē dzelzs, kas rada fontus), kuri bija ieinteresēti izskatu universālā teksta kodējumu.

Pirmā variācija, kas publicēta UNICODE konsorcija aizgādībā bija UTF 32.. Cipars nosaukumā kodēšanas nozīmē bitu skaitu, ko izmanto, lai kodētu vienu simbolu. 32 biti ir 4 baiti informācijas, kas būs nepieciešama, lai šifrētu vienu zīmi jaunajā Universal UTF kodējumā.

Tā rezultātā, tas pats fails ar tekstu kodēts paplašinātajā ASCII versijā un UTF-32 būs pēdējā gadījumā būs lielums (sver) četras reizes vairāk. Tas ir slikti, bet tagad mums ir iespēja šifrēt zīmju skaitu, kas vienāda ar diviem līdz trīsdesmit otrās grādiem ar palīdzību UTF ( miljardi rakstzīmjukas aptvers jebkuru reālu vērtību ar milzīgu rezervi).

Taču daudzām valstīm ar Eiropas grupas valodām ir tik milzīgs skaits pazīmju, kas var izmantot kodējumu vispār, un nebija vajadzības, tomēr, lietojot UTF-32, viņi nesaņēma četru laika pieaugumu Ar teksta dokumentu, un kā rezultātā, palielināt interneta satiksmes un apjoma glabāto datu. Tas ir daudz, un neviens nevarētu atļauties šādus atkritumus.

Parādījās Unicode attīstības rezultātā UTF-16kas izrādījās tik veiksmīgs, kas tika pieņemts pēc noklusējuma kā pamata telpa visām izmantotajām rakstzīmēm. Tas izmanto divus baitus, lai kodētu vienu zīmi. Let's redzēt, kā šī lieta izskatās.

Windows operētājsistēmā jūs varat iet pa ceļu "Start" - "programmas" - "Standard" - "Service" - "Rakstzīmju tabula". Tā rezultātā tabula tiek atvērta ar visu jūsu fontos uzstādīto vektoru formas. Ja izvēlaties " Papildu parametri»Unicode zīmju kopums, jūs varat redzēt katram fontam atsevišķi visu tajā iekļauto rakstzīmju klāstu.

Starp citu, noklikšķinot uz jebkura no tām, jūs varat to redzēt divus kods UTF-16 formātāsastāv no četriem heksadecimāliem cipariem:

Cik rakstzīmes var kodēt UTF-16, izmantojot 16 bitus? 65 536 (divi līdz sešpadsmit), un šis numurs tika pieņemts par pamata telpu Unicode. Turklāt ir veidi, kā kodēt ar to un aptuveni divus miljonus rakstzīmju, bet tikai līdz paplašinātajai telpai miljonā teksta simbolu.

Bet pat šī veiksmīgā Unicode kodēšanas versija nesniedza lielu gandarījumu ar tiem, kas rakstīja, piemēram, programmas tikai angļu valodā, jo pēc tam, kad tie ir pārieti no paplašinātās ASCII versijas uz UTF-16, dokumentu svars divreiz palielinājās (viens baits uz vienu simbolu Aski un divos baitos vienā un tajā pašā simbolā UTF-16).

Tas ir tieši, lai apmierinātu visus, un visi Unicode konsorcijā tika nolemts nākt klajā ar kodēšanas mainīgais garums. Viņa tika saukta par UTF-8. Neskatoties uz astoņiem nosaukumā, tas tiešām ir mainīgs garums, t.i. Katru teksta simbolu var kodēt uz vienu līdz sešiem baitiem secībā.

Praksē UTF-8 izmanto tikai diapazonu no viena līdz četriem baitiem, jo \u200b\u200bnekas nav pat teorētiski iespējams iesniegt kaut ko četru baitu koda. Visas latīņu zīmes tiek kodētas vienā baitā, kā arī vecajā labajā ASCII.

Kas ir ievērības cienīgs, ja kodēšanas tikai latīņu valodā, pat tās programmas, kas nesaprot Unicode joprojām lasīt to, kas ir kodēta UTF-8. Tiem. Askura pamata daļa vienkārši pārgāja uz to no Unicode konsorcija.

Kirilicas zīmes UTF-8 tiek kodētas divos baitos, un, piemēram, Gruzijas - trīs baitos. Unicode konsorcijs pēc UTF 16 un 8 izveides nolēma galveno problēmu - tagad mums ir fontā ir viena koda telpa. Un tagad viņu ražotāji paliek tikai, pamatojoties uz viņu spēkiem un iespējām aizpildīt to ar teksta simbolu vektora formām. Tagad komplektos pat.

Zemāk redzamajā tabulā redzams, ka dažādi fonti atbalsta atšķirīgu rakstzīmju skaitu. Daži Unicode fontu simboli var svērt ļoti labi. Bet tagad viņi netiek atšķirti ar to, ka tie ir izveidoti dažādiem kodējumiem, bet fakts, ka fonta ražotājs piepildīja vai nav piepildīta vienotā koda telpu ar tiem vai citiem vektoriem, lai beigtu.

Krakoyabry, nevis krievu burti - kā noteikt

Tagad redzēsim, kā teksta vietā parādās crakozyabe teksts vai, citiem vārdiem sakot, kā pareizā kodēšana ir izvēlēta krievu tekstam. Patiesībā tas ir iestatīts programmā, kurā izveidojat vai rediģējat šo pašu tekstu vai kodu, izmantojot teksta fragmentus.

Lai rediģētu un izveidotu teksta faili Manuprāt, es varu izmantot ļoti labu ,. Tomēr tas var izcelt sintaksi joprojām ir labs simtiem programmēšanas valodu un atzīmes, kā arī spēj paplašināt ar spraudņiem. Nolasīt detalizēts pārskats Šī brīnišķīgā programma atbilstoši saitei.

Notepad ++ top izvēlnē ir "kodēšana", kur jums būs iespēja pārvērst esošo iespēju, kas tiek izmantots jūsu noklusējuma vietnē:

Attiecībā uz vietni Joomla 1.5 un augstāk, kā arī, ja blogā WordPress, jums vajadzētu izvēlēties iespēju, lai izvairītos no izskatu Krakoyar 8 8 bez bom. Kas ir BOM prefikss?

Fakts ir tāds, ka tad, kad tika izstrādāts ETF-16 kodējums, kāda iemesla dēļ nolēma nostiprināt šādu lietu kā iespēju ierakstīt simbolu kodu gan tiešā secībā (piemēram, 0A15), gan pretējā secībā (150a) . Un, lai programmas, lai saprastu, kura secība lasīšanas kodi, un tika izgudrots Bom. (BYTE pasūtījuma zīme vai, citiem vārdiem sakot, paraksts), kas tika izteikts, pievienojot trīs papildu baitus uz dokumentu sākumu.

UTF-8 kodējumā nebija BOM Unicode konsorcijs un tādējādi pievienojot parakstu (šie visvairāk pazīstami papildu trīs baiti uz dokumenta sākumu) dažas programmas vienkārši novērš koda lasīšanu. Tāpēc mēs vienmēr, saglabājot failus UTF, jums ir jāizvēlas iespēja bez BOM (bez paraksta). Tātad jūs esat iepriekš mūpu sevi no krekinga.

Kas ir ievērības cienīgs, dažas programmas Windows nezina, kā to izdarīt (nespēt saglabāt tekstu UTF-8 bez BOM), piemēram, tiem pašiem bēdīgi piezīmjdatoru logiem. Tas saglabā dokumentu UTF-8, bet joprojām pievieno parakstu tās sākumā (trīs papildu baiti). Turklāt šie baiti vienmēr būs vienādi - izlasiet kodu tiešā secībā. Bet uz serveriem, jo \u200b\u200bšīs maz lietas var būt problēma - crackels izkļūt.

Tāpēc nekādā gadījumā nelietojiet parastos piezīmjdatora logus Lai rediģētu jūsu vietnes dokumentus, ja nevēlaties izskatu Krakoyarbra. Es uzskatu jaunāko un vienkāršāko iespēju jau minētajam Notepad ++ redaktoram, kas praktiski nav trūkumu un sastāv no vienas no priekšrocībām.

Notepad ++ Izvēloties kodējumu, jums būs iespēja konvertēt tekstu uz UCS-2 kodējumu, kas ir ļoti tuvu Unicode standartam būtībā. Arī ne tipa var kodēt ANSI, I.E. Atsaucoties uz krievu valodu, tas jau aprakstīs mūs tieši virs Windows 1251. Kur šī informācija nāk no?

Viņa ir uzrakstīta jūsu darbības telpas reģistrā windows sistēmas - Kas kodē izvēlēties ANSI gadījumā, ko izvēlēties OEM gadījumā (krievu valodā tas būs CP866). Ja datorā instalējat citu noklusējuma valodu, tad šie kodējumi tiks aizstāti ar līdzīgiem ANSI vai OEM izlādes par to pašu valodu.

Pēc tam, kad jūs Notepad ++, saglabājiet dokumentu kodējot jums ir nepieciešams vai atveriet dokumentu no vietnes, lai rediģētu, tad apakšējā labajā stūrī redaktoru jūs varat redzēt tā nosaukumu:

Lai izvairītos no KrakoyarbbrovPapildus iepriekš aprakstītajām darbībām būs lietderīgi reģistrēties visās vietnes lapu informācijas avota koda galvenē.

Kopumā visās hiperteksta marķējuma valodās tiek izmantota īpaša XML reklāma, kurā norādīta teksta kodēšana.

Pirms sākat izjaukt kodu, pārlūkprogramma uzzinās, kura versija tiek izmantota un kā tieši jums ir jāinterpretē šīs valodas rakstzīmju kodeksi. Bet tas ir ievērības cienīgs, ja jūs saglabājat dokumentu noklusējuma Unicode, šo XML deklarāciju var izlaist (kodējums tiks uzskatīts par UTF-8, ja nav BOM vai UTF-16, ja ir BOM).

Dokumenta gadījumā html valoda Lai norādītu izmantoto kodējumu meta elementskas ir parakstīts starp atvēršanas un aizvēršanas galvas tagu:

... ...

Šis ieraksts ir diezgan atšķirīgs no pieņemtajiem B, bet pilnībā atbilst jaunizveidotajiem lēnām ar HTML 5 standartu, un tas būs pilnīgi pareizi saprotams ikviens, ko izmanto Šis brīdis pārlūkprogrammas.

Teorētiski, meta elements ar norādi par kodējumu HTML dokuments Labāk likt pēc iespējas augstāk doka galvenēLai tikšanās laikā pirmās zīmes tekstā nav no ANSI pamata (kas vienmēr lasa vienmēr un jebkurā variācijās) pārlūkprogrammai jau ir jāsniedz informācija par to, kā interpretēt šo rakstzīmju kodeksus.

Veiksmi tev! Uz neskaidrām sanāksmēm bloga lapu tīmekļa vietnē

Jums var būt ieinteresēts

Kas URL adresesKāda ir atšķirība starp absolūtajām un relatīvajām vietnes saitēm
Openererver - moderns vietējais serveris un tā izmantošanas piemērs wordPress iekārtas datorā
Kas ir chmod, kas piekļuves tiesības piešķirt failus un mapes (777, 755, 666) un kā to darīt, izmantojot PHP
Meklēt Yandex uz vietas un interneta veikalā