KOI կոդ Աղյուսակ 8. KOI8-R կոդավորում

- Մեկնում (@comradzampolit) 2017-ի օգոստոսի 17-ին

Ինչպես է աշխատում koi8-r- ը:

Koi8-r- ը ութ բիթանոց կոդ է, որը նախատեսված է Cyrillic այբուբենի տառերը կոդավորելու համար: Մշակողները նման ձեւով տեղադրել են ռուս այբուբենի խորհրդանիշները, որ սեղանի ներքեւի մասում գտնվող Կիրիլիչի խորհրդանիշների դիրքերը համապատասխանում են անգլերենի այբուբենի իրենց հնչյունական անալոգներին: Եվ եթե այս կոդավորման մեջ գրված տեքստում յուրաքանչյուր խորհրդանիշի ութերորդը հեռացնելու համար ստացվում է լատինական տառերի նման տեքստը:

Նման փոխանակման ծածկագիրն օգտագործվել է ԵՄ ԵՄ ԵՄ սերիայի համակարգիչների յոթենցիայում, իսկ ութսունականների կեսից այն սկսեց օգտագործել այն առաջին ռուսաստանյան տարբերակներում: օպերացիոն համակարգ Unix.

Կոդավորումը այն էր, որ յուրահատուկ ծածկագիր է նշանակվել յուրաքանչյուր խորհրդանիշի. 00000000-ից 11111111. Այսպիսով, մարդը նշում է խորհրդանիշները իրենց դիզայնի վրա եւ համակարգչում:

Արդյոք Չերնովան այժմ կոդավորում է:

Ոչ. Այն տեղին էր հին ութ-բիթանոց համակարգիչների համար, այժմ Unicode- ը հիմնականում օգտագործվում է տարբեր ձեւաչափերով:

Koi8-r կոդավորում

ISO 8859-5 կոդավորում

ISO 8859-5

Այլընտրանքային կոդավորում

«Այլընտրանքային կոդավորում» - Հիմնվելով CP437 կոդի էջի վրա, որտեղ երկրորդ խաղակեսում եվրոպական բոլոր հատուկ խորհրդանիշները փոխարինվում են կիրիլով, թողնելով կեղծ բառերի անձեռնմխելի: Հետեւաբար, սա չի փչացնում տեքստի պատուհանների օգտագործմամբ ծրագրերի տեսակը եւ նաեւ դրանց մեջ օգտագործում է կիրիլական կերպարների օգտագործումը:

Պատմականորեն կոդավորման այլընտրանքային տարբերակներ կային, բայց բոլոր տարբերությունները վերաբերում են միայն 0xf0 - 0xff տարածաշրջանի (240-255): Վերջնական ստանդարտը IBM CP866 կոդավորմամբ, որի աջակցությունը ավելացվել է MS-DOS տարբերակին 6.22 տարբերակին (օգտագործվել են բոլոր տեսակի «ինքնուրույն» ճաքերը: Այլընտրանքային կոդավորումը դեռ կենդանի է եւ չափազանց տարածված է DOS- ում եւ OS / 2 միջավայրում . Բացի այդ, այս կոդավորումը ձայնագրված է B. Ֆայլային համակարգ Ճարպ. CP866- ը դեռ օգտագործվում է Russified Systems- ի վահանակում windows ընտանիք Նիստ

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F
8. Ա 410: B 411: 412-ին: G 413: D 414: E 415 416: S 417: Եւ 418: 419-րդ: Դեպի 41 ա: L 41B: Մ 41c: H 41D: O 41e: P 41f.
9. R 420: 421-ով: T 422: 423: F 424 X 425: C 426: H 427: W 428: 429: Կոմերսանտ 42 ա: 42 բ. B 42C: E 42D: Yu 42e: Ես 42f եմ:
Ա Ա 430: Բ 431: 432-ին: g 433. Դ 434: E 435: 2036: S 437: եւ 438: 439-րդ: Դեպի 43 ա: L 43B: մ 43c: H 43D: Մոտ 43e: p 43f.
Բ ░ 2591 ▒ 2592 ▓ 2593 │ 2502 ┤ 2524 ╡ 2561 ╢ 2562 ╖ 2556 ╕ 2555 ╣ 2563 ║ 2551 ╗ 2557 255D: ╜ 255C: 255B. ┐ 2510
Գ. └ 2514 2534: ┬ 252C: 251C: ─ 2500 ┼ 253C: 255e: 255F: 255 ա: ╔ 2554 ╩ 2569 ╦ 2566 ╠ 2560 ═ 2550 256C: ╧ 2567
Գցել ╨ 2568 ╤ 2564 ╥ 2565 ╙ 2559 ╘ 2558 ╒ 2552 ╓ 2553 256B. ╪ 256a. ┘ 2518 250c: █ 2588 ▄ 2584 258C: ▐ 2590 ▀ 2580
Ե. P 440: 441-ից: T 442: 443-ին: F 444: x 445: C 446: H 447: sh 448: 449: Կոմերսանտ 44 ա: S 44B: B 44c: E4D: Yu 44e: Ես 44f եմ:
Զ. E 301: 451: 404: 454: Ї 407: ї 457: 40e: ў 45e: ° B0. ∙ 2219 · B7. √ 221A: № 2116 ¤ A4. ■ 25a0. A0.

Այսպիսով, 8859-5 - ISO-8859 շարքից 8-բիթանոց կոդավորում `կիրիլականի ձայնագրման համար: Ռուսաստանում գրեթե չի օգտագործվում: Ընդհանուր առմամբ, ISO 8859-5- ը շատ հարմար կոդավորող չէ, քանի որ այն չունի անհրաժեշտ նիշերից շատերը, ինչպիսիք են պոչը (-), խեղդում (""), աստիճաններ (°) եւ այլն:



.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F
8. 80 81 82 83 84 85 86 87 88 89 8 ա. 8 բ. 8C: 8D. 8e: 8F:
9. 90 91 92 93 94 95 96 97 98 99 9 ա. 9 բ. 9C: 9D. 9E 9F
Ա A0. E 301: 402 €: 403: 404: 405 տարեկան: 406: Ї 407: 408: 409: Њ 40 ա: 40b. 40C: ՀԱՅՏԱՐԱՐՈՒԹՅՈՒՆ 40e: 40F:
Բ Ա 410: B 411: 412-ին: G 413: D 414: E 415 416: S 417: Եւ 418: 419-րդ: Դեպի 41 ա: L 41B: Մ 41c: H 41D: O 41e: P 41f.
Գ. R 420: 421-ով: T 422: 423: F 424 X 425: C 426: H 427: W 428: 429: Կոմերսանտ 42 ա: 42 բ. B 42C: E 42D: Yu 42e: Ես 42f եմ:
Գցել Ա 430: Բ 431: 432-ին: g 433. Դ 434: E 435: 2036: S 437: եւ 438: 439-րդ: Դեպի 43 ա: L 43B: մ 43c: H 43D: Մոտ 43e: p 43f.
Ե. P 440: 441-ից: T 442: 443-ին: F 444: x 445: C 446: H 447: sh 448: 449: Կոմերսանտ 44 ա: S 44B: B 44c: E4D: Yu 44e: Ես 44f եմ:
Զ. № 2116 451: 452: 453: 454: 455: 456: ї 457: 458: 459: 45 ա: 45b. 45C: § A7. ў 45e: 45f.

KOI-8 (Տեղեկատվության փոխանակման կոդ, 8 բիթ), KOI8 - համակարգչային գիտության մեջ ութ բիթանոց խորհրդանիշ կոդավորող ստանդարտ: Նախատեսված է Cyrillic այբուբենի տառերի կոդավորման համար: Կոդավորող տարբերակի յոթ-բիթանոց տարբերակ կա `Koi-7: Koi-7- ը եւ Koi-8- ը նկարագրվում են ԳՕՍՏ 19768-74 (այժմ, անվավեր):

KOI-8 մշակողները տեղադրեցին ռուսերեն այբուբենի խորհրդանիշները ընդլայնված ASCII աղյուսակի վերեւում, այնպես, որ սայրի այբուբենի ներքեւում գտնվող կիրիլյան կերպարների դիրքերը համապատասխանի իրենց հնչյունական անալոգներին: Սա նշանակում է, որ եթե Koi-8- ում գրված տեքստում յուրաքանչյուր խորհրդանիշի ութերորդը հեռացնելու համար, ապա այն ստացվում է «ընթեռնելի» տեքստ, չնայած այն գրված է լատինական խորհրդանիշներով: Օրինակ, «ռուսերեն տեքստ» բառերը կվերածվեին «Russkij Tekst» - ը: Որպես կողմնակի ազդեցություն, Կիրիլիչի խորհրդանիշները պարզվել են, որ կազմակերպվում են այբբենական կարգով:

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F
8. ─ 2500 │ 2502 250c: ┐ 2510 └ 2514 ┘ 2518 251C: ┤ 2524 ┬ 252C: 2534: ┼ 253C: ▀ 2580 ▄ 2584 █ 2588 258C: ▐ 2590
9. ░ 2591 ▒ 2592 ▓ 2593 ⌠ 2320 ■ 25a0. ∙ 2219 √ 221A: ≈ 2248 ≤ 2264 ≥ 2265 A0. ⌡ 2321 ° B0. B2. · B7. F7.
Ա ═ 2550 ║ 2551 ╒ 2552 451: ╓ 2553 ╔ 2554 ╕ 2555 ╖ 2556 ╗ 2557 ╘ 2558 ╙ 2559 255 ա: 255B. ╜ 255C: 255D: 255e:
Բ 255F: ╠ 2560 ╡ 2561 E 301: ╢ 2562 ╣ 2563 ╤ 2564 ╥ 2565 ╦ 2566 ╧ 2567 ╨ 2568 ╩ 2569 ╪ 256a. 256B. 256C: © A9.
Գ. Yu 44e: Ա 430: Բ 431: C 446: Դ 434: E 435: F 444: g 433. x 445: եւ 438: 439-րդ: Դեպի 43 ա: L 43B: մ 43c: H 43D: Մոտ 43e:
Գցել p 43f. Ես 44f եմ: P 440: 441-ից: T 442: 443-ին: 2036: 432-ին: B 44c: S 44B: S 437: sh 448: E4D: 449: H 447: Կոմերսանտ 44 ա:
Ե. Yu 42e: Ա 410: B 411: C 426: D 414: E 415 F 424 G 413: X 425: Եւ 418: 419-րդ: Դեպի 41 ա: L 41B: Մ 41c: H 41D: O 41e:
Զ. P 41f. Ես 42f եմ: R 420: 421-ով: T 422: 423: 416: 412-ին: B 42C: 42 բ. S 417: W 428: E 42D: 429: H 427: Կոմերսանտ 42 ա:

KOI8-U կոդավորում (ուկրաիներեն)

Koi-8- ը դարձավ ինտերնետի առաջին ռուսական ստանդարտ կոդավորումը:

Ietf- ը հաստատեց մի քանի RFCS ըստ Koi-8 կոդավորման ընտրանքների.

  • RFC 1489 - KOI8-R (ռուսական այբուբենի տառերը);
  • RFC 2319 - KOI8-U (ուկրաինական այբուբենի տառերը);
  • RFC 1345 - ISO-IR-111 (հիմնական միջակայքը որոշելու սխալով):

Վերոնշյալ աղյուսակներում թվերը նշվում են Unicode- ի նամակի վեցանկյուն կոդով:

KOI8-R կոդավորումը (ռուսերեն)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F

8.

2500

2502

250C:

2510

2514

2518

251C:

2524

252C:

2534

253C:

2580

2584

2588

258C:

2590

9.

2591

2592

2593

2320

25a0:

2219

221a:

2248

2264

2265

A0.

2321
°
B0.
²
B2.
·
B7.
÷
F7.

Ա

2550

2551

2552
Ե.
451

2553

2554

2555

2556

2557

2558

2559

255 ա:

255B:

255C:

255D:

255E:

Բ

255F:

2560

2561
Ե.
401

2562

2563

2564

2565

2566

2567

2568

2569

256a:

256B:

256C:
©
Ա 9:

Գ.
Յու
44e:
բայց
430
Բ
431
Գ.
446
Գցել
434
Ե.
435
Զ.
444
Գամասեղ
433
Հ.
445
մի քանազոր
438
Ամբ.
439
դեպի
43 ա:
Լ.
43 բ.
Տղամարդ
43C:
Ն.
43D:
մասին
43E:

Գցել
Իմաստ
43f:
Ես
44F:
Ժլատ
440
դեպի
441
Շոշափել
442
Կ.
443
Ամբ.
436
մեջ
432
բոց
44C:
աղաղակոց
44 բ.
Զ.
437
ժլատ
448
Ե.
44D:
ժլատ
449
Գ.
447
Կոմսատեր
44 ա:

Ե.
Յու
42E:
Բայց
410
Բ
411
Գ.
426
Գցել
414
Ե.
415
Զ.
424
Գամասեղ
413
Հ.
425
Մի քանազոր
418
Ամբ.
419
Դեպի
41 ա:
Լ.
41 բ.
Տղամարդ
41C:
Ն.
41D:
ՄԱՍԻՆ
41e:

Զ.
Իմաստ
41f:
Ես
42F:
Ժլատ
420
Դեպի
421
Շոշափել
422
Կ.
423
Ամբ.
416
Մեջ
412
Բոց
42C:
Աղաղակոց
42 բ.
Զ.
417
Ժլատ
428
Ե.
42D:
Ժլատ
429
Գ.
427
Կոմսատեր
42 ա:

Այլ ընտրանքներ

Պատկերված են միայն սեղանի գծերը համապատասխանող, քանի որ մնացած ամեն ինչ համընկնում է:

KOI8-U կոդավորում (ռուս-ուկրաինական)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F

Ա

2550

2551

2552
Ե.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255 ա:

255B:
ґ
491

255D:

255E:

Բ

255F:

2560

2561
Ե.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256a:
Ґ
490

256C:
©
Ա 9:

Koi8-ru կոդավորում (ռուսերեն-բելառուսկո-ուկրաիներեն)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F

Ա

2550

2551

2552
Ե.
451
є
454

2554
і
456
ї
457

2557

2558

2559

255 ա:

255B:
ґ
491
ў
45E:

255E:

Բ

255F:

2560

2561
Ե.
401
Є
404

2563
І
406
Ї
407

2566

2567

2568

2569

256a:
Ґ
490
Ў
40e:
©
Ա 9:

KOI8-C կոդավորումը (Կենտրոնական Ասիա)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F
8. ғ
493
җ
497
қ
49 բ.
ҝ
49D:
ң
4a3.
ү
4af:
ұ
4B1
ҳ
4B3:
ҷ
4B7:
ҹ
4B9:
һ
4BB:

2580
ә
4D9:
ӣ
4E3:
ө
4E9:
ӯ
4EF.
9. Ғ
492
Җ
496
Қ
49 ա:
Ҝ
49C:
Ң
4A2
Ү
4 հատ
Ұ
4B0:
Ҳ
4B2.
Ҷ
4B6.
Ҹ
4B8:
Һ
4BA:

2321
Ә
4D8:
Ӣ
4E2.
Ө
4E8:
Ӯ
4ee
Ա
A0.
ђ
452
ѓ
453
Ե.
451
є
454
ѕ
455
і
456
ї
457
ј
458
љ
459
њ
45 ա:
ћ
45 բ.
ќ
45C:
ґ
491
ў
45E:
џ
45F:
Բ
2116
Ђ
402
Ѓ
403
Ե.
401
Є
404
Ѕ
405
І
406
Ї
407
Ј
408
Љ
409
Њ
40 ա:
Ћ
40 բ.
Ќ
40C:
Ґ
490
Ў
40e:
Џ
40F:

KOI8-T կոդավորում (տաջիկ)

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F
8. қ
49 բ.
ғ
493

201A:
Ғ
492

201E:

2026

2020

2021

2030
ҳ
4B3:

2039
Ҳ
4B2.
ҷ
4B7:
Ҷ
4B6.
9. Қ
49 ա:

2018

2019

201C:

201-րդ:

2022

2013
-
2014

2122

203 ա:
Ա ӯ
4EF.
Ӯ
4ee
Ե.
451
¤
Ա 4:
ӣ
4E3:
¦
A6.
§
Ա 7:
«
Աբ
¬
Սուտ
­
ՀԱՅՏԱՐԱՐՈՒԹՅՈՒՆ
®
Ա
Բ °
B0.
±
B1.
²
B2.
Ե.
401
Ӣ
4E2.

B6.
·
B7.

2116
»
BB.
©
Ա 9:

KOI8-O, KOI8-S կոդավորում (սլավոնական, հին ուղղագրություն)

0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F

8.
Ђ
0402
Ѓ
0403
¸
00B8:
ѓ
0453

201E:

2026

2020
§
00a7.

20ac:
¨
00a8:
Љ
0409

2039
Њ
040a:
Ќ
040c:
Ћ
040B:
Џ
040F:

9.
ђ
0452

2018

2019

201C:

201-րդ:

2022

2013

2014
£
00a3.
·
00B7:
љ
0459

203 ա:
њ
045a:
ќ
045C:
ћ
045B:
џ
045F

Ա

00a0:
ѵ
0475
ѣ
0463
Ե.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
®
00ae:

2122
«
00ab
ѳ
0473
ґ
0491
ў
045e:
´
00B4:

Բ
°
00B0:
Ѵ
0474
Ѣ
0462
Ե.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408

2116
¢
00a2
»
00bb:
Ѳ
0472
Ґ
0490
Ў
040E:
©
00a9:

ISO-IR-111, KOI8-E կոդավորում

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F

Ա

00a0:
ђ
0452
ѓ
0453
Ե.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045a:
ћ
045B:
ќ
045C:
­
00AD:
ў
045e:
џ
045F

Բ

2116
Ђ
0402
Ѓ
0403
Ե.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a:
Ћ
040B:
Ќ
040c:
¤
00a4:
Ў
040E:
Џ
040F:

KOI8- ի միասնական կոդավորում, KOI8-F

KOI8- ի միասնական կոդավորումը (KOI8-F) առաջարկվում է FingerTip ծրագրային ապահովում:

.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A.a. .B .C.c. .Դ. .E.e. .F

8.

2500

2502

250C:

2510

2514

2518

251C:

2524

252C:

2534

253C:

2580

2584

2588

258C:

2590

9.

2591

2018

2019

201C:

201-րդ:

2022

2013

2014
©
00a9:

2122

00a0:
»
00bb:
®
00ae:
«
00ab
·
00B7:
¤
00a4:

Ա

00a0:
ђ
0452
ѓ
0453
Ե.
0451
є
0454
ѕ
0455
і
0456
ї
0457
ј
0458
љ
0459
њ
045a:
ћ
045B:
ќ
045C:
ґ
0491
ў
045e:
џ
045F

Բ

2116
Ђ
0402
Ѓ
0403
Ե.
0401
Є
0404
Ѕ
0405
І
0406
Ї
0407
Ј
0408
Љ
0409
Њ
040a:
Ћ
040B:
Ќ
040c:
Ґ
0490
Ў
040E:
Џ
040F:

Չծխող ընտրանքներ KOI-8

Որոշ երկրներում CMEAS- ը ստեղծվել են KOI-8 փոփոխություններով `լատիս ազգային տարբերակների համար: Հիմնական գաղափարը նույնն էր `ութերորդի« կտրվածքը »հետ, տեքստը պետք է մնա քիչ թե շատ հասկանալի:

- Դե, սկսեք: - ասաց Դոլոխը:
- Դե, - ասաց Պիեռը, դեռ ժպտում է: - Ես վախեցա: Ակնհայտ էր, որ այն գործը, որը սկսվեց այնքան հեշտությամբ, այլեւս չէր կարող խանգարել, որ շարունակվում էր, անկախ մարդկանց կամքից, եւ պետք է արվեր: Դենիսովն առաջին հերթին առաջ եկավ պատնեշին եւ հռչակեց.
- Քանի որ p "Svatstniki- ն հրաժարվեց« նրանցից », հնարավոր չէ սկսել. Զենք վերցնել եւ ըստ T բառի, սկսում է համընկնել:
"G ..." AZ! Երկու! T "եւ! ..." Դենիսովը զայրացած բղավեց եւ տեղափոխվեց կողք: Երկուսն էլ գնացին տրորված ուղիներ ավելի մոտ եւ ավելի մոտ, մառախուղում միմյանց ճանաչելով: Հակառակորդներն ունեին իրավունք, դուրս գալով պատնեշին, կրակել, երբ ինչ-որ մեկը ցանկանում է: Սելոխը դանդաղ էր, առանց զենքը բարձրացնելու, իր հակառակորդի երեսին նայելով իր պայծառ, փայլուն, կապույտ աչքերով: Նրա բերանը, ինչպես միշտ, նման էր ժպիտ:
- Այսպիսով, երբ ուզում եմ. Կարող եմ կրակել: - ասաց Պիեռը, բառով երեք արագ քայլեր առաջ գնացին, տրոտանի քայլուղուց դիմակայություն եւ քայլում ամբողջ ձյան վրա: Պիեռը զենք պահեց, ձգվելով առաջ Աջ ձեռքԸստ երեւույթին, վախենալով, թե ինչպես են այս ատրճանակը ինքներդ ձեզ չի սպանում: Նա ջանասիրաբար տիրեց ձախ ձեռքը, քանի որ ուզում էր աջակցել իր աջ ձեռքը, եւ նա գիտեր, որ դա անհնար է: Անցնելով քայլերը վեց եւ ձյունից դուրս գալով, Պիեռը նայեց ոտքերը, նորից նայեց Դելոխովին, եւ մատը քաշեց, կրակեց: Ես նման ուժեղ ձայն չեմ ակնկալում, Պիեռը ցնցվեց իր կրակոցից, այնուհետեւ ժպտաց իր տպավորությունը եւ կանգ առավ: Ծխը, հատկապես մառախուղից խիտ, խանգարեց նրան առաջին պահին տեսնել նրան. Բայց նա սպասում էր մեկ այլ կրակոց, չհետեւեց: Լսվեցին միայն Դոլոհովի շտապ քայլերը, եւ նրա գործիչը, կարծես, ծխի պատճառով: Մի կողմից նա պահում էր ձախ կողմում, մյուսը սեղմում էր բաց թողնված ատրճանակը: Նրա դեմքը գունատ էր: Ռոստովը վազեց եւ ինչ-որ բան ասաց նրան:
«Դա չէ ... ե ... տ», - ասաց Սոլոկովը, «Ոչ, ոչ թե ավարտված» եւ մի քանի անգամ ընկնելով, սաբեր քայլեր կատարելով, նրա կողքին ընկավ ձյան վրա: Նրա ձախ ձեռքը արյան մեջ էր, նա շրջանցում էր նրան Սութուկի մասին եւ հենվեց նրան: Նրա դեմքը գունատ էր, տապակել եւ դողալ:
«Ես կգրեմ ...» - սկսեց կիսել, բայց նա անմիջապես չէր կարող ասել ... «Խնդրում եմ, նա համաձայնեց ջանքերի հետ»: Պիեռը, հազիվ թե սթափեցրեց, վազեց դեպի Դոլոհով եւ ուզում էր անցնել խոչընդոտները տարանջատող տարածքը, ինչպես Շահովը բղավեց. - Եվ Պիեռ, ովքեր հասկացան, թե որն էր գործը, նա կանգ առավ նրա սաբերի մոտ: Միայն 10 քայլ կիսվեց նրանց: Շելոխովը գլուխը ցած նետեց ձյունը, ագահորեն կծում էր ձյունը, նորից գլուխը բարձրացրեց, վերականգնվել, վերցրեց ոտքերը եւ նստեց ծանրության ամուր կենտրոն: Նա բորբոս է Սառը ձյուն եւ ծծել այն. Նրա շրթունքները դողում էին, բայց ամեն ինչ ժպտում է. Աչքերը փայլում էին ջանքերով եւ վերջին հավաքած ուժերի արգանդից: Նա զենքը բարձրացրեց եւ սկսեց նպատակ դնել:
«Կողք, փակիր զենքը», - ասաց Նեսվիցկին:
- 3ak »Me! - Առանց դիմակայելու, նույնիսկ Դենիսովը բղավեց իր հակառակորդին:
Պիեռի հեզով ափսոսանքի եւ ապաշխարության ժպիտով, անօգնականորեն դնելով ոտքերը եւ ձեռքերը, ուղիղ նրա լայն կրծքերով կանգնած էր Դոլոխովի առաջ եւ տխուր նայեց նրան: Դենիսովը, Ռոստովը եւ Նեսվիցկին բարձրացան: Միեւնույն ժամանակ, նրանք լսեցին Դոլլովի կրակոցներն ու չար աղաղակը:
- - Բղավեց Շահովը եւ անզորորեն պառկեց ձյան դեմքին: Պիեռը գլուխը բռնեց եւ ետ կանգնելով, գնաց անտառ, ամբողջությամբ քայլելով ձյան մեջ եւ բարձրաձայն դատապարտվեց անհայտ խոսքեր.
- Հիմար ... հիմար: Մահ ... Կեղծ ... - Նա ասաց, որ կրակ է կրակում: Նեսվիցկին կանգնեցրեց նրան եւ տարավ իր տունը:
Դենիսովի հետ Ռոստովը բախտավոր էր վիրավոր դոլարով:
Սելոխովը, լուռ, փակ աչքերով, պառկեց սահնակով եւ չպատասխանեց իր արած հարցերին. Բայց մտնելով Մոսկվա, նա հանկարծ արթնացավ եւ գլուխը բարձրացնելու դժվարությամբ, վերցրեց Ռոստովին, ով նստած էր ձեռքով: Ռոստովը հարվածեց Դոլչովի դեմքի դեմքի լիովին փոխված եւ անսպասելի խանդավառ արտահայտությանը:
- Դե Ինչպես ես քեզ զգում? - հարցրեց Ռոստովին:
- Sply! Բայց ոչ կետը: Իմ ընկերը », - ասաց Շարդը ձայնը ընդմիջվող ձայնին, - որտեղ ենք մենք: Մենք գիտեմ Մոսկվայում: Ես ոչինչ չեմ, բայց սպանեցի նրան, սպանեց ... նա չի վերցնի այն: Նա չի պատահի ...
- ԱՀԿ? - հարցրեց Ռոստովին:
- Իմ մայրիկը. Մայրս, իմ հրեշտակը, իմ պաշտելի հրեշտակը, մայրը, եւ Սոլոհովը ես աղաղակեցի, սեղմելով Ռոստովի ձեռքը: Երբ նա ինչ-որ չափով հանդարտվեց, նա բացատրեց Ռոստովը, որն ապրում է իր մոր հետ, որ եթե մայրը նրան մեռնի, չի վերցնի: Նա աղաչեց Ռոստովին գնալ իր մոտ եւ պատրաստել նրան:
Ռոստովը առաջ գնաց կարգը կատարելու համար, եւ նա սովորեց մեծ անակնկալ մատուցել, որ նա իմացել է, որ այս Բուրյանը, Սոլոհովի հարձգում, ծեր կին եւ եղբայր եւ եղբայր էր:

Վերջերս Պիեռը հազվադեպ էր տեսել իր կնոջը աչքի վրա: Իսկ Սանկտ Պետերբուրգում, իսկ Մոսկվայում, նրանց տունը անընդհատ լի էր հյուրերով: Հաջորդ գիշեր մենամարտից հետո նա, ինչպես նա հաճախ էր անում, չէր գնում ննջասենյակ, բայց մնաց իր հսկայական, հայրական գրասենյակում, որի մեջ մնում էր մուրացքի հաշիվը:
Նա դիմակայել է բազմոցին եւ ցանկանում էր քնել, որպեսզի մոռանան նրա հետ եղած ամեն ինչ, բայց նա չկարողացավ դա անել: Նման փոթորիկ, մտքեր, հիշողություններ, հանկարծ իր հոգում աճեցին, որ ոչ միայն չէր կարող քնել, բայց չէր կարող տեղում նստել եւ արագ քայլերով շրջել սենյակից: Դա նրան ներկայացվեց ամուսնությունից հետո, բաց ուսերով եւ հոգնած, կրքոտ տեսքով եւ նրա կողքին, թվաց գեղեցիկ, անպիտան, եւ դահիճը, դողալ Եվ տառապում էր, թե ինչպես էր այն շրջվել եւ ընկավ ձյան վրա:
«Ինչ կար: - Նա հարցրեց իրեն: - Ես սպանեցի սիրահարին, այո, սպանեցի կնոջ սիրահարին: Այո, դա եղել է. Ինչից Ինչպես եկա դրան: - Որովհետեւ դու ամուսնացար նրա հետ, - պատասխանեց ներքին ձայնը:
«Բայց ինչ եմ ես մեղավոր: Նա հարցրեց. - Այն փաստը, որ դուք ամուսնացաք, ոչ թե նրան սիրելով, այն փաստով, որ դուք խաբեցիք ինքներդ ձեզ եւ նրան, եւ նա այս պահին տարել է արքայազն Վասիլայում, երբ նա ասաց. «Je vous AIME »: [Ես սիրում եմ քեզ.] Ամեն ինչ այսից: Ես այնուհետեւ զգացի, նա մտածեց, ես զգացի, որ այն չէ, որ ես դրա իրավունք չունեի: Դուրս եկավ »: Նա հիշեց մեղրամիսը եւ կարմրեց հիշողություններով: Հատկապես աշխույժ, այն հիշողությունները, թե ինչպես մի օր, նրա ամուսնությունից կարճ ժամանակ անց, նա օրվա 12 մետր է, մետաքսե վերարկուով եկավ գրասենյակ, եւ գտավ մենեջերի ղեկավարի գլուխը, որը մտածված էր, Նայեց Պիեռի դեմքին, իր լողազգեստի վրա եւ թեթեւակի ժպտաց, ասես արտահայտելով այս ժպիտը, հարգալից համակրանք իր սկզբունքի երջանկության համակրանքը:
«Եվ քանի անգամ ես հպարտանում էի դրանով, ես հպարտ էի նրա մեծ գեղեցկությամբ, նրա աշխարհիկ մարտավարությամբ, կարծում էր նա. Հպարտացավ այն տանով, որում նա վերցրեց ամբողջ Պետերբուրգը, հպարտացավ իր անհասանելիությամբ եւ գեղեցկությամբ: Ուրեմն ինչով եմ հպարտանում: Ես հետո մտածեցի, որ չեմ հասկանում նրան: Ինչպես հաճախ, մտածելով իր բնավորության մասին, ես ինքս ինձ ասացի, որ ես պետք է մեղավոր լինեմ, որ ես նրան չեմ հասկանում, որեւէ կախվածության եւ ցանկության մեջ եղած ամբողջ ազդեցությունն էր Որ նա խեղված կին է. Նա ասաց, որ ես սարսափելի խոսք եմ, եւ ամեն ինչ պարզ դարձավ:
«Անատոլը ճանապարհորդեց նրան, որպեսզի փող վերցնի իրենից եւ համբուրեց նրան մերկ ուսերին: Նա նրան փող չի տվել, բայց թույլ տվեց համբուրվել իրեն: Հայրը, կատակելով, ոգեւորեց իր խանդը. Նա, հանգիստ ժպիտով, ասաց, որ նա այդքան հիմար չէ, որ նախանձվի. Թող նա անի, որ նա ուզում է, նա ասաց իմ մասին: Ես նրան մի անգամ հարցրեցի, արդյոք նա հղիության նշաններ է զգում: Նա արհամարհանքով ծիծաղեց եւ ասաց, որ հիմար չէ, որ ցանկանում է երեխաներ ունենալ, եւ որ նա ինձանից երեխաներ չի ունենա »:
Այնուհետեւ նա հիշեց կոպիտությունը, նրա մտքերի հստակությունը եւ իրեն բնորոշ արտահայտությունների գռեհիկությունը, չնայած ամենաբարձր արիստոկրատական \u200b\u200bշրջանի դաստիարակությանը: «Ես մի տեսակ հիմար չեմ ... Ես կփորձեմ ինքս ինձ ... Allez Vous Promener» - ը, - ասաց նա: Հաճախ, նայելով նրա հաջողություններին հին եւ երիտասարդ տղամարդկանց եւ կանանց աչքում, Պիեռը չէր կարողանում հասկանալ, թե ինչու չի սիրում նրան: Այո, ես երբեք չեմ սիրել նրան, ես ինքս ինձ ասացի Պիեռ. Ես գիտեի, որ նա խեղված կին է, նա կրկնեց իրեն, բայց չի անհանգստացել ընդունել այն:

Բարեւ, հարգելի բլոգ ընթերցողների կայք: Այսօր մենք ձեզ հետ կխոսենք այն մասին, թե որտեղից է գալիս Կրակոյարբրան եւ ծրագրերով, որոնք առկա են տեքստային կոդավորումներ, եւ դրանցից որ մեկը պետք է օգտագործվի: Եկեք մանրամասն քննարկենք դրանց զարգացման պատմությունը, սկսած հիմնական ASCII- ից, ինչպես նաեւ CP866, KOI866, Windows 1251- ի իր ընդլայնված տարբերակները եւ ավարտվում են Unicode UTF 16 եւ 8 կոնսորցիումի ժամանակակից կոդերով:

Ինչ-որ մեկը այս տեղեկատվությունը կարող է թվալ անտեղի, բայց դուք կիմանաք, թե որքան հարցեր են ինձ համար, ճշգրիտ վերաբերմունքը (մի շարք կերպարներ չկարդալով): Այժմ ես հնարավորություն կունենամ բոլորին ուղարկել սույն հոդվածի տեքստը եւ ինքնուրույն որոնել ձեր կոշիկները: Դե, պատրաստվեք կլանել տեղեկատվությունը եւ փորձել վերահսկել պատմությունը:

ASCII - լատիզա հիմնական տեքստի կոդավորում

Տեքստի կոդավորումների զարգացումը տեղի է ունենում միաժամանակ ՏՏ արդյունաբերության ձեւավորմամբ, եւ այս ընթացքում նրանք ժամանակ ունեին անցնելու բավականին փոփոխություններ: Պատմականորեն, ամեն ինչ սկսվեց EBCDIC- ի ռուսերեն արտասանության բավականին վնասակարությամբ, ինչը հնարավորություն տվեց կոդավորել լատինական այբուբենի, արաբական համարների եւ կետադրական նշանների տառերը կառավարման խորհրդանիշներով:

Բայց դեռ ժամանակակից տեքստային կոդավորման զարգացման ելակետը պետք է համարվի հայտնի ASCII. (Տեղեկատվության փոխանակման ամերիկյան ստանդարտ ծածկագիր, որը ռուսերեն սովորաբար արտասանվում է որպես «Աս Ասկի»): Այն նկարագրում է անգլերենախոս օգտագործողների կողմից առավել հաճախ օգտագործվող առաջին 128 նիշը `արաբական համարներ եւ կետադրական նշաններ:

Նույնիսկ ASCII- ում նկարագրված այս 128 նիշերում որոշ ծառայության խորհրդանիշներ մանրացված էին փակագծերով, ցանցերով, աստղանիշներով եւ այլն: Իրականում դուք ինքներդ կարող եք տեսնել դրանք.

Հենց այս 128 նիշ է ASCII- ի սկզբնական տարբերակից դարձել են ստանդարտը, եւ ցանկացած այլ կոդավորմամբ, դուք անպայման կհանդիպեք եւ կկատարեք, որ դրանք նման ձեւով կլինեն:

Բայց փաստն այն է, որ մեկ բայթի օգնությամբ տեղեկատվության օգնությամբ այն 128 է, բայց 256 տարբեր արժեքներ (երկու աստիճանի 8-ը հավասար է 256) Բազային տարբերակ Aski- ն հայտնվեց մի շարք Ընդլայնված կոդավորումներ ASCIIԲացի 128 հիմնական նշաններից, հնարավոր էր նաեւ կոդավորել կոդավորման ազգային խորհրդանիշները (օրինակ, ռուսերեն):

Այստեղ, հավանաբար, արժե մի փոքր ավելին իմանալ նկարագրության մեջ օգտագործվող համարի համակարգի մասին: Նախ, ինչպես գիտեք ամեն ինչ, համակարգիչը աշխատում է միայն երկուական համակարգի համարներով թվերով, մասնավորապես զրո եւ միավորների հետ («Բուլեւ հանրահաշիվ», եթե ինստիտուտում կամ դպրոցում անցկացված է): Դրանցից յուրաքանչյուրը մի աստիճանի է, սկսած զրոյից եւ յոթերորդի երկվորյակներին.

Դժվար չէ հասկանալ, որ Զրոնոսի եւ ստորաբաժանումների բոլոր հնարավոր համադրությունները նման դիզայնում կարող են լինել միայն 256: Թվարկեք թվերը տասնորդական համակարգից: Անհրաժեշտ է պարզապես վերեւում գտնվող երկվորյակների բոլոր աստիճաններ ծալել:

Մեր օրինակում ստացվում է 1 (2-ից մինչեւ զրոյական) գումարած 8 (երկուսը `3), գումարած 32 (երկու անգամ հինգերորդ աստիճանում), գումարած 64 (յոթերորդում) , Ընդհանուրը ստանում է 233 տասնորդական համակարգ Նշում. Ինչպես տեսնում եք, ամեն ինչ շատ պարզ է:

Բայց եթե սեղանին նայեք ASCII նիշերով, կտեսնեք, որ դրանք ներկայացված են Hexadecimal կոդավորմամբ: Օրինակ, «աստղանիշը» համապատասխանում է ASKI- ին hexadecimal 2 ա. Հավանաբար դա գիտեք hexadecimal համակարգ Համարներն օգտագործվում են արաբական համարներից բացի, լատինական տառերը A (նշանակում է տասը) մինչեւ F (նշանակում է տասնհինգ):

Դե, այսպես Տեղափոխել Երկուական համարներ Hexadecimal- ում Դիմեք հաջորդ պարզ եւ տեսողական ձեւին: Տեղեկատվության յուրաքանչյուր բայթը բաժանվում է չորս բիթի երկու մասի, ինչպես ցույց է տրված վերեւում գտնվող սքրինշոթում: Այսպես Բայթի յուրաքանչյուր կեսում երկուական ծածկագիրը կարող է կոդավորվել միայն տասնվեց արժեքների համար (չորրորդ աստիճանի երկուսը), որոնք կարելի է հեշտությամբ ներկայացնել Հեքսադեկիմալով:

Ավելին, բայթի ձախ կեսին անհրաժեշտ կլինի նորից հաշվի առնել չափը զրոյից, եւ ոչ, ինչպես ցույց է տրված էկրանի նկարում: Արդյունքում, ոչ լավ հաշվարկներով, մենք ստանում ենք այն, որ E9 համարը կոդավորված է սքրինշոթում: Հուսով եմ, որ հասկանալի էիք իմ պատճառաբանության եւ այս ռեբուսի ամրապնդման ընթացքը: Դե, հիմա մենք կշարունակենք, իրականում կխոսենք տեքստի կոդավորման մասին:

ASKI - CP866 եւ KOI8-R կոդավորմամբ `կեղծագրով

Այսպիսով, մենք սկսեցինք խոսել ASCII- ի մասին, որը նման էր բոլոր ժամանակակից կոդավորման զարգացման մեկնարկային կետի (Windows 1251, Unicode, UTF 8):

Սկզբնապես, այն դրվեց լատինական այբուբենի, արաբական համարների եւ այլ բաների ընդամենը 128 նշան, բայց ընդլայնված վարկածում հնարավոր էր օգտագործել բոլոր 256 արժեքները, որոնք կարելի է կոդավորվել մեկ պիտատ տեղեկատվության մեջ: Նրանք: Հնարավորություն է ավելացնել իր լեզվի նամակների խորհրդանիշները դեպի Ասա:

Այստեղ անհրաժեշտ կլինի եւս մեկ անգամ շեղվել `պարզաբանել. Ինչու է անհրաժեշտ կոդավորումը Տեքստեր եւ ինչու է դա այդքան կարեւոր: Ձեր համակարգչի էկրանին կերպարները ձեւավորվում են երկու բաների հիման վրա `բոլոր տեսակի կերպարների վեկտորային ձեւերի (ներկայացուցչություններ) (դրանք ֆայլերում) եւ կոդով, որոնք թույլ են տալիս հանել վեկտորի ձեւերի այս հավաքածուն ( Տառատեսակի ֆայլ) Դա կերպարն է, որը պետք է տեղադրվի ճիշտ տեղում:

Հասկանալի է, որ տառատեսակները պատասխանատու են վեկտորի ձեւերի համար, բայց դրանում օգտագործվող գործառնական համակարգը եւ ծրագրերը պատասխանատու են կոդավորման համար: Նրանք: Ձեր համակարգչի ցանկացած տեքստ կլինի մի շարք բայթ, որոնցից յուրաքանչյուրում այս տեքստի մեկ խորհրդանիշ կոդավորված է:

Ծրագիրը, որը ցուցադրում է այս տեքստը էկրանին (տեքստի խմբագիր, զննարկիչ եւ այլն), ծածկագիրը վերլուծելիս կարդում է հաջորդ նշանի կոդավորումը եւ որոնում համապատասխան վեկտորի ձեւը Ցանկալի ֆայլը Տառատեսակը, որը միացված է այս տեքստային փաստաթուղթը ցուցադրելու համար: Ամեն ինչ պարզ է եւ տոտ:

Այսպիսով, մեր անհրաժեշտ խորհրդանիշը կոդավորելու համար (օրինակ, ազգային այբուբենից) պետք է ավարտվեն երկու պայմաններ. Այս նշանի վեկտորի ձեւը պետք է լինի օգտագործված տառատեսակի մեջ, եւ այս խորհրդանիշը կարող է կոդավորված ASCII- ի ընդլայնված կոդավորումներում , Հետեւաբար, նման տարբերակների մի ամբողջ փունջ կա: Միայն ռուսաց լեզվի խորհրդանիշների կոդավորման համար կան ընդլայնված էշերի մի քանի տեսակներ:

Օրինակ, սկզբում հայտնվեց CP866:Որում հնարավոր եղավ օգտագործել ռուսական այբուբենի խորհրդանիշները, եւ դա ASCII- ի ընդլայնված տարբերակն էր:

Նրանք: Դրա վերին մասը ամբողջովին համընկավ ASKI- ի հիմնական տարբերակի հետ (128 լատիներեն, թվեր եւ նույնիսկ ցանկացած լաբուդիա), որը պատկերված է նկարների վրա մի փոքր ավելի բարձր, բայց կարոտի մեջ նշված է CP866 կոդավորման սեղանի ստորին մասը Տեսանկյունից մի փոքր ցածր եւ թույլատրվում է կոդավորել եւս 128 նշան (ռուսական տառեր եւ ցանկացած կեղծագրային).

Տեսեք, ճիշտ սյունակում համարները սկսվում են 8-ով, քանի որ 0-ից 7-ի համարները վերաբերում են ASCII բազային մասի (տես առաջին սքրինշոթը): Այսպես CP866- ում ռուսական «M» տառը կկազմի 9C կոդ (այն 9-ով համապատասխան տողերի խաչմերուկում է, իսկ սյունակը `հեքսադեկիմալ թվով համակարգով), եւ եթե Ռուսական կերպարների հետ հարմար տառատեսակ կա, առանց խնդիրների այս նամակը կցուցադրվի տեքստում:

Որտեղից է եկել այս քանակը Կեղծագրիչները CP866- ում:? Այն փաստն է, որ ռուս տեքստի համար այս կոդավորումը մշակվել է այդ պայծառ տարիներին, երբ այժմ գրաֆիկական օպերացիոն համակարգերի նման բաշխում չի եղել: Եվ DOSS- ում եւ նմանատիպ տեքստային գործողություններ, համահունչ թույլատրված է գոնե ինչ-որ կերպ դիվերսիֆիկացնել տեքստերի դիզայնը, ուստի այն շատ է CP866- ի եւ բոլոր մյուս շարքերով, ASHA- ի երկարացված վարկածների արտանետումից:

CP866- ը բաշխեց IBM ընկերությունը, բայց բացի այդ, ռուսաց լեզվի խորհրդանիշների համար մշակվել են մի շարք կոդավորումներ, օրինակ, նույն տիպը (ընդլայնված ASCII) կարող է վերագրվել Koi8-r.:

Նրա աշխատանքի սկզբունքը մնաց նույնը, ինչ ավելի ուշ նկարագրված CP866 - Յուրաքանչյուր տեքստի խորհրդանիշ կոդավորված է մեկ բայթով: Պատկերները ցույց են տալիս KOI8-R աղյուսակի երկրորդ կեսը, քանի որ Առաջին խաղակեսը լիովին համահունչ է Asus- ի բազային, որը ցուցադրվում է այս հոդվածում առաջին սքրինշոթի վրա:

KOI8-R կոդավորման առանձնահատկությունների շարքում կարելի է նշել, որ իր սեղանի ռուսական տառերը այբբենական կարգով չեն, օրինակ, օրինակ, CP866- ում:

Եթե \u200b\u200bնայում եք հենց առաջին սքրինշոթին (բազային մասը, որը մտնում է բոլոր ընդլայնված կոդավորումը), ապա նկատեք, որ Koi8-R- ում ռուսական տառերը գտնվում են սեղանի նույն սեղաններում, քանի որ առաջին մասից լատինական այբուբենի տառերը տեղակայված են սեղանը. Դա արվել է ռուսական խորհրդանիշներից լատիներենից անցնելու հարմարության համար `հրաժարվելով միայն մեկ բիտ (յոթերորդ աստիճանի կամ 128-ով):

Windows 1251 - ASCII- ի ժամանակակից տարբերակ եւ ինչու են կոտրվում

Տեքստի կոդավորումների հետագա զարգացումը պայմանավորված է նրանով, որ գրաֆիկական օպերացիոն համակարգերը եւ դրանցում կեղծագրգրաֆիկ օգտագործելու անհրաժեշտությունը մեծ ժողովրդականություն են վայելում: Արդյունքում, մի ամբողջ խումբ առաջացավ, որը, ըստ էության, դեռ Aski- ի առաջադեմ տարբերակներն էին (մեկ տեքստային խորհրդանիշ կոդավորված է տեղեկատվության միայն մեկ սխալմամբ), բայց առանց կեղծագրային կերպարներ օգտագործելու:

Նրանք վերաբերվում էին այսպես կոչված ANSI կոդավորմանը, որոնք մշակվել են Ամերիկյան ստանդարտացման ինստիտուտի կողմից: Կիրիլիչի անունը դեռեւս օգտագործվում էր ռիսկի մեջ `ռուսաց լեզվի աջակցությամբ տարբերակով: Նման օրինակու օրինակ:

Դա բարենպաստորեն տարբերվում էր նախկինում օգտագործված CP866- ից եւ Koi8-R- ից, որ դրանում կեղծագրային կերպարների նիշերի տեղը գրավեց ռուսական տպագրության անհայտ կորած խորհրդանիշները (նվազող նշանը), ինչպես նաեւ ռուսական սլավոնականի մոտակայքում օգտագործվող խորհրդանիշները Լեզուներ (ուկրաինական, բելառուսերեն եւ այլն):

Ռուսաց լեզվի կոդավորումների, տառատեսակների եւ արտադրողների արտադրողների այս առատության պատճառով ծրագիր Նա անընդհատ գլխացավ է առաջացել, եւ ձեզ հետ, սիրելի ընթերցողներ, հաճախ նրանք ստացել են ամենախորը ԿրակոյաբրԵրբ խառնաշփոթը դասավանդվում էր տեքստում օգտագործված տարբերակով:

Շատ հաճախ նրանք դուրս են եկել հաղորդագրություններ ուղարկելիս եւ ստանալիս էլեկտրոնային փոստԻնչը առաջացրեց շատ բարդ տրանսկրոհման սեղանների ստեղծում, որոնք, ըստ էության, չկարողացան լուծել այս խնդիրը արմատում, եւ հաճախ նամակագրության համար օգտագործողները օգտագործվել են տխրահռչակ Կրակոզաբներ խուսափելու համար, երբ օգտագործվում են նման CP866, Koi8-R կամ Windows 1251- ի ռուսական կոդավորումը:

Ըստ էության, Կրակոզունաբրը, որը փոխանցում է ռուս տեքստի փոխարեն, արդյունքն էր Սխալ օգտագործումը Ծածկագիր այս լեզվիցորը չի համապատասխանում այն \u200b\u200bմեկին, որում կոդավորված է տեքստային հաղորդագրություն Սկզբում:

Ենթադրենք, եթե CP866- ով կոդավորված խորհրդանիշները փորձեք ցուցադրել Windows 1251 ծածկագրի աղյուսակը, ապա այս առավել ճեղքված (անիմաստ կերպարներից) եւ դուրս գալ, ամբողջությամբ փոխարինելով հաղորդագրության տեքստը:

Նմանատիպ իրավիճակ է տեղի ունենում, ֆորումներում կամ բլոգերում, երբ սխալմամբ ռուսական կերպարների տեքստը չի պահպանվում այն \u200b\u200bկոդավորմամբ, որը օգտագործվում է լռելյայն կայքում, թե ոչ Տեքստի խմբագիրորը ավելացնում է կոդին, որը տեսանելի չէ անզեն աչքով:

Ի վերջո, շատ իրավիճակ, բազմաթիվ կոդավորմամբ եւ անընդհատ սողացող կռունկներով, շատ հոգնած էր, նախադրյալներ կային նոր համընդհանուր տատանումներ ստեղծելու համար, որոնք վերջապես կփոխարինեին բոլորի առջեւ դրված խնդիրների արմատին ընթեռնելի տեքստեր: Բացի այդ, նման չինացիների լեզուների խնդիր կար, որտեղ լեզվի խորհրդանիշները շատ ավելին էին, քան 256:

Unicode (Unicode) - Universal Codes UTF 8, 16 եւ 32

Հարավարեւելյան Ասիայի լեզվական խմբի այս հազարավոր նշաններ չէին կարող նկարագրել մեկ PATE տեղեկատվության մեջ, որը հատկացվել է ASCII- ի առաջադեմ տարբերակներում կոդավորող կերպարների համար: Արդյունքում ստեղծվել է կոնսորցիում Unicode (Unicode - Unicode Consortium) արդյունաբերության բազմաթիվ առաջնորդների համագործակցության մեջ (նրանք, ովքեր արտադրում են ծրագրակազմ, որոնք ծածկում են երկաթը, որոնք ստեղծում են տառատեսակներ), որոնք հետաքրքրված էին ունիվերսալ տեքստի կոդավորմամբ:

Unicode կոնսորցիումի հովանու ներքո հրապարակված առաջին տատանումն էր UTF 32:, Կոդավորման անունով թվանշանը նշանակում է բիթերի քանակը, որն օգտագործվում է մեկ խորհրդանիշ կոդակայելու համար: 32 բայթը 4 բայթ տեղեկատվություն է, որը անհրաժեշտ կլինի մեկ մեկ նշան կոդ կոդավորելու համար նոր ունիվերսալ UTF կոդավորման մեջ:

Արդյունքում, վերջին դեպքում ASCII- ի եւ UTF-32- ի երկարատեւ տարբերակում կոդավորված տեքստի նույն ֆայլը կունենա չափի (կշռում) չորս անգամ ավելին: Դա վատ է, բայց այժմ մենք հնարավորություն ունենք կոդավորել երկու-երեսուն երկրորդ աստիճանի հավասար թվերի քանակը `UTF- ի օգնությամբ ( միլիարդավոր կերպարներորը կներառի ցանկացած իրական արժեք `կոլոզայի լուսանցքով):

Բայց եվրոպական խմբի լեզուներով շատ երկրներ ունեն այդպիսի հսկայական թվով նշաններ, որոնք օգտագործվում են կոդավորման մեջ ընդհանրապես օգտագործելու համար, եւ անհրաժեշտություն չկար, սակայն UTF-32- ն օգտագործելիս նրանք չորս անգամ աճ չեն ստացել Տեքստի փաստաթղթերի քաշի եւ արդյունքում, ինտերնետային երթեւեկության եւ ծավալի պահված տվյալների ավելացում: Սա շատ է, եւ ոչ ոք չէր կարող թույլ տալ այդպիսի թափոններ:

Հայտնվել է Unicode- ի զարգացման արդյունքում UTF-16:Որն է պարզվել այնքան հաջող, որն ընդունվել է լռելյայն որպես հիմնական տարածք բոլոր այն կերպարների համար, որոնք մենք օգտագործում ենք: Մեկ նշանը կոդավորելու համար այն օգտագործում է երկու բայթ: Տեսնենք, թե ինչպես է նման բանը:

Windows օպերացիոն համակարգում դուք կարող եք անցնել «Սկսել» - «Ծրագրեր» - «Ստանդարտ» - «Ծառայություն». «Նիշերի սեղան»: Արդյունքում, սեղան բացվում է ձեր տառատեսակների մեջ տեղադրված բոլորի վեկտոր ձեւերով: Եթե \u200b\u200bընտրեք » Լրացուցիչ պարամետրեր»Unicode նշանների մի շարք, յուրաքանչյուր տառատեսակի համար կարող եք առանձին տեսնել դրա մեջ ներառված նիշերի ամբողջ տեսականին:

Ի դեպ, կտտացնելով դրանցից որեւէ մեկի վրա, դուք կարող եք դա տեսնել երկկողմանի Կոդ UTF-16 ձեւաչափովբաղկացած է չորս վեցանկյուն թվերից.

Քանի նիշ կարելի է կոդավորվել UTF-16- ում `օգտագործելով 16 բիթ: 65 536 (երկու-տասնհինգ), եւ այս թիվը վերցվել է Unicode- ի հիմնական տարածության համար: Բացի այդ, դրա հետ կոդավորելու եղանակներ կան եւ մոտ երկու միլիոն նիշ, բայց սահմանափակվում են ընդլայնված տարածքով մեկ միլիոն տեքստային խորհրդանիշներով:

Բայց նույնիսկ Unicode- ի կոդավորման այս հաջողակ տարբերակը մեծ գոհունակություն չբերեց նրանց, ովքեր գրել են, օրինակ, ծրագրերը միայն անգլերեն լեզվով, քանի որ ASCII- ի ETF-16- ին անցում կատարվել է (Մեկ բայթ մեկով մեկ հարցում հարցով եւ երկու բայթ նույն խորհրդանիշում UTF-16- ում):

Դա հենց այն է, որ բոլորին բավարարելը, եւ Unicode Consortium- ում որոշվել է գալ Կոդավորելով փոփոխական երկարությունը, Նրան անվանում էին UTF-8: Չնայած վերնագրի ութին, այն իսկապես ունի փոփոխական երկարություն, այսինքն: Յուրաքանչյուր տեքստային խորհրդանիշ կարելի է կոդավորվել մեկից վեց բայթի հաջորդականության մեջ:

Գործնականում UTF-8- ը օգտագործում է միայն մեկից չորս բայթ, քանի որ նույնիսկ տեսականորեն հնարավոր չէ որեւէ բան ներկայացնել օրենսգրքի չորս բայթ: Լատինական բոլոր նշանները կոդավորված են մեկ բայթով, ինչպես նաեւ հին լավ ASCII- ում:

Հատկանշական է, որ միայն լատիներեն կոդավորելու դեպքում նույնիսկ այն ծրագրերը, որոնք չեն հասկանում Unicode- ը, դեռ կկարդան այն, ինչ կոդավորված է UTF-8- ում: Նրանք: ASKA- ի հիմնական մասը դա պարզապես անցավ Unicode Consortium- ից:

UTF-8- ում Cyrillic նշանները կոդավորված են երկու բայթ, եւ, օրինակ, վրացերեն, երեք բայթ: Unicode կոնսորցիում UTF 16 եւ 8-ի ստեղծումից հետո որոշվել է հիմնական խնդիրը. Այժմ մենք ունենք Տառատեսներում կա մեկ ծածկագրի տարածք, Եվ այժմ նրանց արտադրողները մնում են միայն իրենց ուժերի հիման վրա եւ տեքստի խորհրդանիշների վեկտորային ձեւերով լրացնելու հնարավորությունների հիման վրա: Հիմա նույնիսկ սահմաններում:

Ստորեւ բերված խորհրդանիշի աղյուսակում կարելի է տեսնել, որ տարբեր տառատեսակներ աջակցում են տարբեր թվերի: Unicode տառատեսակների որոշ խորհրդանիշներ կարող են շատ լավ կշռել: Բայց հիմա նրանք առանձնանում են այն փաստով, որ դրանք ստեղծվում են տարբեր կոդավորման համար, բայց այն փաստով, որ տառատեսակի արտադրողը լրացրել կամ վերջ տալով այդ կամ այլ վեկտորի ձեւերի մեկ ծածկագիրը:

Կրակոյաբրը ռուսական տառերի փոխարեն. Ինչպես շտկել

Հիմա տեսնենք, թե ինչպես է հաղորդվում crakozyabe տեքստը տեքստի փոխարեն կամ, այլ կերպ ասած, ինչպես է ճիշտ կոդավորումը ընտրվում ռուսերեն տեքստի համար: Իրականում այն \u200b\u200bսահմանված է այն ծրագրի մեջ, որում ստեղծում կամ խմբագրում եք այս նույն տեքստը կամ կոդը, օգտագործելով տեքստի բեկորներ:

Խմբագրել եւ ստեղծել Տեքստային ֆայլեր Անձամբ ես շատ լավ օգտագործում եմ, իմ կարծիքով: Այնուամենայնիվ, այն կարող է կարեւորել շարահյուսությունը դեռ լավ հարյուրավոր ծրագրավորման լեզուներ եւ նշագրման, ինչպես նաեւ հնարավորություն ունի ընդլայնել plugins- ը: Կարդալ Մանրամասն ակնարկ Այս հիանալի ծրագիրը `ըստ հղման:

Notepad ++ լավագույն ընտրացանկում կա «կոդավորող» կետ, որտեղ հնարավորություն կունենաք գոյություն ունեցող տարբերակը վերափոխելու ձեր ստանդարտ կայքում.

Joomla 1,5 եւ ավելի կայքի դեպքում, ինչպես նաեւ WordPress- ի բլոգի դեպքում, դուք պետք է ընտրեք տարբերակը `Կրակոյարի տեսքը խուսափելու համար UTF 8 առանց BOM- ի, Որն է BOM- ի նախածանցը:

Փաստն այն է, որ երբ մշակվել է ETF-16 կոդավորումը, ինչ-ինչ պատճառներով որոշվել է դրանով այդպիսի բան ամրացնել, որքան խորհրդանիշի ծածկագիր ձայնագրելու հնարավորություն (օրինակ, 0A15) եւ հակառակ հաջորդականությամբ (օրինակ, 0A15) , Եւ որպեսզի ծրագրերը հասկանան, թե որ հաջորդականության ընթերցանության կոդերը եւ հորինվել է Բոմ. (Byte կարգի նշանը կամ, այլ կերպ ասած, ստորագրությամբ), որն արտահայտվում էր փաստաթղթերի հենց սկզբում երեք լրացուցիչ բայթ ավելացնելով:

UTF-8 կոդավորման մեջ Unicode կոնսորցիումում չկային BUM եւ, հետեւաբար, ստորագրությունն ավելացնելով (այս ամենահայտնի լրացուցիչ երեք բայթը փաստաթղթի սկզբում) Որոշ ծրագրեր պարզապես կանխում են կոդը կարդալը: Հետեւաբար, մենք միշտ, ֆայլերը պահելու ժամանակ, դուք պետք է ընտրեք տարբերակ առանց BOM- ի (առանց ստորագրության): Այսպիսով, դուք նախապես եք Ինքներդ ձեզ կոտրիչից.

Հատկանշական է, Windows- ում որոշ ծրագրեր չգիտեն, թե ինչպես դա անել (մի կարողանան տեքստը պահպանել UTF-8- ում `առանց BOM- ի), օրինակ, նույն տխրահռչակ նոթբուքի պատուհանները: Այն պահպանում է փաստաթուղթը UTF-8- ում, բայց դեռ ստորագրությունը է ավելացնում իր սկզբին (երեք լրացուցիչ բայթ): Ավելին, այս բայթերը միշտ կլինեն նույնը `կարդացեք ծածկագիրը ուղղակի հաջորդականությամբ: Բայց սերվերների վրա, այս փոքրիկ բաների պատճառով, կարող է խնդիր լինել. Crackels- ը դուրս կգա:

Հետեւաբար, ոչ մի դեպքում Մի օգտագործեք սովորական նոթբուքի պատուհանները Ձեր կայքի փաստաթղթերը խմբագրելու համար, եթե չեք ցանկանում Կրակոյարբրա տեսքը: Ես համարում եմ արդեն իսկ նշված Notepad ++ խմբագրի վերջին եւ ամենահեշտ տարբերակը, որը գործնականում չունի թերություններ եւ բաղկացած է առավելություններից մեկից:

Նոթատետր ++ ում կոդավորումը ընտրելիս հնարավորություն կունենաք տեքստը փոխակերպել UCS-2 կոդավորմանը, ինչը ըստ էության շատ մոտ է UNICODE ստանդարտին: Նաեւ ոչ տիպի կարելի է կոդավորվել Անսիում, Ես: Հղումով ռուսերեն լեզվին, սա արդեն նկարագրվելու է ԱՄՆ-ի կողմից `Windows 1251- ից: Որտեղ է գալիս այս տեղեկատվությունը:

Նա ուղղագրվում է ձեր գործող սենյակի գրանցամատյանում windows համակարգեր - Ինչ կոդավորումը ընտրելու համար Ansi- ի դեպքում, ինչ ընտրել OEM- ի դեպքում (ռուսերենի համար դա կլինի CP866): Եթե \u200b\u200bձեր համակարգչում տեղադրեք մեկ այլ լռելյայն լեզու, ապա այդ կոդավորումը կփոխարինվի նույն լեզվով ANSI կամ OEM լիցքաթափման նման:

Ձեզանից հետո Notepad ++ ում, Փաստաթուղթը պահեք ձեզ անհրաժեշտ կոդավորմամբ կամ բացեք փաստաթուղթ կայքից `խմբագրելու համար, ապա խմբագրի ստորին աջ անկյունում կարող եք տեսնել նրա անունը.

Կրակոյարբրովից խուսափելու համարՎերոնշյալ գործողություններից բացի, օգտակար կլինի գրանցվել իր վերնագրում կայքի տեղեկատուի աղբյուրի կոդերի բոլոր էջերի բոլոր էջերի բոլոր էջերի վերնագրով `սերվերի կամ տեղական հյուրընկալողի համար:

Ընդհանուր առմամբ, HTML- ից բացի, հիպերտեքստի նշման բոլոր լեզուներով օգտագործվում է հատուկ XML գովազդ, որը սահմանում է տեքստի կոդավորումը:

Նախքան ծածկագիրը ապամոնտաժելը սկսելը, զննարկիչը կիմանա, թե որ տարբերակն է օգտագործվում եւ որքանով է անհրաժեշտ այս լեզվի կերպարների կոդերը մեկնաբանելու համար: Բայց ուշագրավ է, եթե փաստաթուղթը լռելյայն չկատարեք, այս XML հռչակագիրը կարող է բացակայել (կոդավորումը համարվելու է UTF-8, եթե կա BOM կամ UTF-16):

Փաստաթղթի դեպքում hTML լեզու Օգտագործված կոդավորումը նշելու համար meta Elementորը նախատեսված է բացման եւ փակման գլխի պիտակի միջեւ:

... ...

Այս գրառումը բոլորովին այլ է ընդունված B- ից, բայց լիովին համապատասխանում է HTML 5 ստանդարտի կողմից դանդաղորեն նոր ներկայացվածին, եւ այն բացարձակապես ճիշտ կհասկանա այս պահին Բրաուզերներ

Տեսականորեն, մետա տարրը կոդավորման նշանով HTML փաստաթուղթ Ավելի լավ է դնել Որքան հնարավոր է բարձր նավահանգստի գլխումԱյսպիսով, առաջին նշանի տեքստում հանդիպման պահին ոչ թե հիմնական Ansi- ն է (որը միշտ կարդում է միշտ եւ ցանկացած տատանում) զննարկիչը պետք է ունենա տեղեկություններ, թե ինչպես կարելի է տեղեկություններ ունենալ այս կերպարների կոդերը:

Հաջողություն քեզ! Բլոգի էջերի կայքում երկիմաստ հանդիպումներ

Ձեզ կարող է հետաքրքրվել

Ինչ URL հասցեներՈրն է տարբերությունը կայքի համար բացարձակ եւ հարաբերական հղումների միջեւ
Openserver - ժամանակակից Տեղական սերվեր եւ դրա օգտագործման օրինակ wordPress կայանքներ համակարգչում
Ինչ է Chmod- ը, որը մուտք է գործում ֆայլեր եւ պանակներ նշանակելու իրավունք (777, 755, 666) եւ ինչպես անել php- ի միջոցով
Որոնել Yandex կայքում եւ առցանց խանութում